Die Google Web Search-API ist veraltet und wurde durch die benutzerdefinierte Such-API ersetzt (siehe http://code.google.com/apis/websearch/ ).
Ich wollte das gesamte Web durchsuchen, aber es sieht so aus, als ob mit der neuen API nur benutzerdefinierte Websites durchsucht werden können.
Gibt es eine Möglichkeit, das gesamte Web programmgesteuert zu durchsuchen? Ich konnte die alte API mit JSON aus einem Java-Programm abfragen.
Antworten:
Sie könnten sie einfach wie ein Browser durchschicken und dann das HTML analysieren, das habe ich immer getan, auch für Dinge wie Youtube.
quelle
Ja, die benutzerdefinierte Suche von Google hat jetzt die alte Such-API ersetzt. Sie können jedoch weiterhin die benutzerdefinierte Suche von Google verwenden, um das gesamte Web zu durchsuchen , obwohl die Schritte im Setup der benutzerdefinierten Suche nicht ersichtlich sind.
So erstellen Sie eine benutzerdefinierte Google-Suchmaschine, die das gesamte Web durchsucht:
Jetzt durchsucht Ihre benutzerdefinierte Suchmaschine das gesamte Web.
Preisgestaltung
Quelle: https://developers.google.com/custom-search/json-api/v1/overview#Pricing
quelle
Die benutzerdefinierte Google-Suche (wie in den am besten bewerteten Antworten empfohlen) funktioniert gut, ist jedoch im Vergleich zu den Mitbewerbern (unten) oder anderen Google-APIs sehr teuer. Es hat eine kleine kostenlose Stufe (100 Anfragen / Tag) und einen sehr hohen Preis von 5 USD pro 1000 Anfragen.
Sie bieten die Möglichkeit, ein Upgrade auf Site Search durchzuführen, das etwas bessere Preise bietet. Dies ist jedoch für die Suche nach einer Site (Ihrer eigenen) gedacht. Es handelt sich also wirklich um etwas ganz anderes - nicht um ein Upgrade.
Die Hauptalternativen scheinen zu sein:
Bing Search API
https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44 Mit
einer kostenlosen Stufe von 5000q / Monat und Preisen ab 5 Abfragen pro Penny und ohne festes Limit.
UPDATE: Ende 2016 wurde diese API zugunsten des Azure-Gegenstücks "Cognitive Services Bing Search API" heruntergefahren:
https://azure.microsoft.com/en-us/services/cognitive-services/search/
Hier finden Sie eine Preisübersicht, die bei 1.000 Transaktionen bei 3 USD / m beginnt. Wenn ich nichts vermisse, ist es ziemlich teuer.
Yahoo BOSS Search API
UPDATE: Wurde am 31. März 2016 eingestellt. Http://developer.yahoo.com/boss/search/
Mit Preisen ab etwa 12 Abfragen / Cent für die gesamte Websuche.
Und einige, von denen ich noch nie gehört habe:
http://www.gigablast.com/searchfeed.html
http://www.faroo.com/hp/api/api.html
http://www.commoncrawl.org/
http://www.entireweb.com/search_api/implementation/
[eingestellt - wie unten angegeben]
Einige davon werden in diesem SO-Beitrag ein wenig diskutiert .
[wurde wegen Nicht-Themas geschlossen und ist jetzt weg]
quelle
Hier ist eine Option am unteren Rand der Systemsteuerung für die benutzerdefinierte Suche: "Zu durchsuchende Websites" . Sie können "Das gesamte Web durchsuchen , aber die enthaltenen Websites hervorheben" auswählen.
quelle
Faroo hat eine kostenlose Web Search API
quelle
Ich bin gerade auf Common Crawl gestoßen.
http://www.commoncrawl.org/
Könnte die Antwort sein, nach der wir alle suchen !!
quelle
Über den Dokumenten befindet sich ein Hinweis :
Die Abschreibungsrichtlinie besagt, dass die API 3 Jahre lang ausgeführt wird. Wenn Sie also bereits eine Anwendung haben, die die alte API verwendet, müssen Sie sich noch nicht beeilen, um Änderungen vorzunehmen. Wenn Sie eine neue Anwendung schreiben, verwenden Sie die API für die benutzerdefinierte Suche . In meiner Antwort hier erfahren Sie, wie dies in Python funktioniert, aber die Idee ist für jede Sprache gleich.
quelle
Es gibt eine kostenlose Java-API namens JFreeWebSearch, die das bereits erwähnte Faroo verwendet: http://www.ke.tu-darmstadt.de/resources/jfreewebsearch
quelle
Sie können "überall" benutzerdefinierte Suchmaschinen direkt von der Google Custom Search-Startseite ( http://www.google.com/cse/ ) erstellen . Sie sollten beim Hinzufügen einer neuen Engine einfach auf "Erweitert" klicken. Dort können Sie den Site-Typ Schema.org angeben. ' Thing ' ist der allgemeinste Typ, der das gesamte Web abdeckt.
quelle
Gigablast bietet eine günstige Web-Such-API: http://www.gigablast.com/searchfeed.html
quelle