Ich habe mich nur gefragt, wie GeoIP-Dienste neben der Überprüfung der WHOIS-Informationen zur IP-Adresse auch Daten über den geografischen Standort von IPs sammeln. Zum Beispiel bin ich auf diese Website gestoßen, auf der steht, dass sich IP 74.207.244.221 in Fremont, Kalifornien, befindet: https://ipinfo.io/74.207.244.221
Aber ich kann diese Informationen auf dieser IP-Whois-Information nicht finden. ipinfo.io gibt an, dass:
Ursprünglich verwendete unsere API MaxMind-Daten, aber wir waren sehr damit beschäftigt, unsere eigenen Geolokalisierungsdaten zu erstellen. Wir haben große Fortschritte erzielt und verwenden jetzt unsere eigenen Daten, um etwa die Hälfte aller Anfragen zu bearbeiten. Wir greifen jedoch immer noch auf MaxMind-Daten zurück
Und das hat mich interessiert, wie Dienste wie ipinfo.io und MaxMind GeoIP-Daten sammeln.
Ich bin der Gründer von IPinfo , daher kann ich definitiv einige Details dazu anbieten! Es gibt keine einzige Methode oder eine einzige Datenquelle, um unsere eigene Geolokalisierungsdatenbank (oder einen unserer anderen Datensätze wie IP an Unternehmen oder IP an Netzbetreiber) zu erstellen. Es ist eine Mischung aus einer Reihe verschiedener Datensätze, Datenverarbeitungstechniken und Lehren, die wir seit einigen Jahren daraus ziehen!
Einige Datenquellen und Techniken, die nicht oft erwähnt werden, umfassen:
Direkte Feeds von ISPs. Unser Service bearbeitet täglich rund 500 Millionen API-Anfragen und wird auf vielen beliebten hochkarätigen Websites verwendet. Daher werden ISPs dazu angeregt, uns genaue und aktuelle Geolokalisierungsdaten zur Verfügung zu stellen, damit ihre Kunden eine großartige Erfahrung im Web erhalten. Wir arbeiten ständig direkt mit immer mehr ISPs zusammen.
GPS-Standortdaten. Mit GPS auf Mobilgeräten können präzise Standortinformationen erfasst werden. Sie können dies mit der IP-Adresse und einigen Rückschlüssen auf die Netzwerktopologie koppeln, um den Standort für IP-Bereiche mit nur wenigen Messungen zu ermitteln.
Vom Benutzer eingereichte Korrekturen. Wenn der Standort falsch ist (oder er nach einer Änderung nicht aktualisiert wurde), erhalten wir häufig schnell Feedback von Benutzern und können den Standort manuell korrigieren oder unseren Algorithmus optimieren, um sicherzustellen, dass er beim nächsten Durchlauf von korrekt positioniert ist unsere Datenverarbeitungspipeline.
Für unseren IP-to-Company-Datensatz kratzen wir jeden Monat jeden einzelnen Domain-Namen und verweisen auf die Daten, die wir dort extrahieren, mit IP-Besitzinformationen, Rwhois-Datensätzen und vielem mehr. Wir verwenden dann auch die Domain-Scraping-Daten, um zu zeigen, welche Domains auf welchen IP-Adressen gehostet werden, und in unserem IP-Typ-Klassifikator zusammen mit vielen anderen Datenquellen, um die Wahrscheinlichkeit zu bestimmen, dass eine IP-Adresse hauptsächlich als ISP für Privathaushalte verwendet wird. Geschäfts- oder Hosting-Anbieter. Wir analysieren auch die Link - Struktur der Seiten, und einige dieser Daten zeigen host.io .
quelle