Welche Alternativen gibt es jetzt, da die Google-Websuch-API veraltet ist? [geschlossen]

322

Die Google Web Search-API ist veraltet und wurde durch die benutzerdefinierte Such-API ersetzt (siehe http://code.google.com/apis/websearch/ ).

Ich wollte das gesamte Web durchsuchen, aber es sieht so aus, als ob mit der neuen API nur benutzerdefinierte Websites durchsucht werden können.

Gibt es eine Möglichkeit, das gesamte Web programmgesteuert zu durchsuchen? Ich konnte die alte API mit JSON aus einem Java-Programm abfragen.

Dan
quelle
3
OK, ich habe viel recherchiert und es sieht so aus, als ob die einzige Lösung Yahoo Boss ist
Dan
Die benutzerdefinierte Such-API ist nicht das, wonach die meisten Leute suchen: - / Geben Sie searchapi.io einen Blick!
Stan Smulders
Ich habe POCs mit verschiedenen Such-APIs erstellt, die viele Funktionen bieten und in Bruchteilen von Minuten sehr einfach zu implementieren sind. Swiftype ( swiftype.com ), Cludo ( cludo.com/de ), Algolia ( algolia.com/doc ) sind die APIs, die ich ebenfalls implementiert und getestet habe. Ich könnte auch eine detaillierte Antwort geben, aber diese Frage ist geschlossen.
Ashish Kumar
2
Die beste Lösung ist die Verwendung eines Drittanbieter-Dienstes wie SerpApi
Hartator

Antworten:

32

Sie könnten sie einfach wie ein Browser durchschicken und dann das HTML analysieren, das habe ich immer getan, auch für Dinge wie Youtube.

Zimm3r
quelle
64
Mir wurde gesagt, dass Googles Nutzungsbedingungen das Spinnen verbieten ...
Steven A. Lowe
52
Aus den Nutzungsbedingungen : "Sie erklären sich ausdrücklich damit einverstanden, nicht auf automatisierte Weise (einschließlich der Verwendung von Skripten oder Webcrawlern) auf einen der Dienste zuzugreifen (oder zu versuchen, darauf zuzugreifen) ..."
ændrük
18
"Mit einem Dienstleister gegen die Nutzungsbedingungen verstoßen" ist niemals ein guter Rat. Das Parsen von Webseiten ist etwas, das ohne Vorwarnung von einem Tag zum nächsten bricht. Dies ist ein schrecklicher Rat - das ist der Grund, warum es eher Downvotes als Upvotes gab.
WhyNotHugo
143
Ja, es verstößt gegen die Nutzungsbedingungen, aber ich persönlich würde mir darüber keine Sorgen machen. Google kann ein bisschen kratzen, schließlich haben sie ein Vermögen damit gemacht, die Websites anderer Leute zu kratzen.
Jimbo2087
106
Kommt schon Leute. Sei nicht so naiv. Google kann diesen ToS nicht erzwingen. Um einen ToS zu verletzen, müssen Sie ihm zuerst zustimmen (schriftlich oder durch Klicken auf eine Schaltfläche wie "Ja, ich akzeptiere die Bedingungen"). Denken Sie darüber nach: Ich habe einen ToS auf meine Webseite gesetzt, den jede Person, die diese Seite besucht, mir 10000 US-Dollar geben muss. Kann ich diese Nutzungsbedingungen meinen Besuchern aufzwingen? Müssen die mich sofort mögen.
Migrate2Lazarus siehe mein Profil
480

Ja, die benutzerdefinierte Suche von Google hat jetzt die alte Such-API ersetzt. Sie können jedoch weiterhin die benutzerdefinierte Suche von Google verwenden, um das gesamte Web zu durchsuchen , obwohl die Schritte im Setup der benutzerdefinierten Suche nicht ersichtlich sind.

So erstellen Sie eine benutzerdefinierte Google-Suchmaschine, die das gesamte Web durchsucht:

  1. Klicken Sie auf der Startseite der benutzerdefinierten Google-Suche ( http://www.google.com/cse/ ) auf Benutzerdefinierte Suchmaschine erstellen.
  2. Geben Sie einen Namen und eine Beschreibung für Ihre Suchmaschine ein.
  3. Geben Sie unter Suchmaschine definieren im Feld Zu suchende Websites mindestens eine gültige URL ein (Geben Sie zunächst einfach www.anyurl.com ein, um diesen Bildschirm zu verlassen. Mehr dazu später).
  4. Wählen Sie die gewünschte CSE-Edition aus, akzeptieren Sie die Nutzungsbedingungen und klicken Sie auf Weiter. Wählen Sie die gewünschte Layoutoption aus und klicken Sie dann auf Weiter.
  5. Klicken Sie auf einen der Links im Abschnitt Nächste Schritte, um zu Ihrer Systemsteuerung zu navigieren.
  6. Klicken Sie im linken Menü unter Systemsteuerung auf Grundlagen.
  7. Wählen Sie im Abschnitt Sucheinstellungen die Option Das gesamte Web durchsuchen aus, betonen Sie jedoch die enthaltenen Websites.
  8. Klicken Sie auf Änderungen speichern.
  9. Klicken Sie im linken Menü unter Systemsteuerung auf Websites.
  10. Löschen Sie die Site, die Sie während der Ersteinrichtung eingegeben haben.

Jetzt durchsucht Ihre benutzerdefinierte Suchmaschine das gesamte Web.

Preisgestaltung

  • Mit der benutzerdefinierten Google-Suche erhalten Sie 100 Anfragen pro Tag kostenlos.
  • Danach zahlen Sie 5 US-Dollar pro 1000 Anfragen.
  • Es gibt maximal 10.000 Anfragen pro Tag.

Quelle: https://developers.google.com/custom-search/json-api/v1/overview#Pricing


  • Die Suchqualität ist viel geringer als bei der normalen Google-Suche (keine Synonyme, "Intelligenz" usw.)
  • Es scheint, dass Google sogar plant, diesen Dienst vollständig zu schließen.
Bangkokian
quelle
26
Danke dafür. Hoffentlich ist dies ein gültiges Verfahren und keine Lücke, die darauf wartet, von Google geschlossen zu werden!
Mazatec
9
Vielen Dank! Dies ist möglicherweise die einzige Antwort im Internet, die meine Frage beantwortet hat. Es ist umwerfend, warum Google die direkte API-Unterstützung für seinen Kerndienst beenden würde.
Spamguy
7
aber wie benutzt man es mit json?
Nawara
61
WARNUNG: Wir haben die Entwicklung mit der kostenlosen Version durchgeführt. Um jedoch auf die kostenpflichtige Version zu aktualisieren (um mehr als 100 Suchvorgänge durchzuführen), müssen Sie bei Google die Option "Durchsuchen des gesamten Webs, aber Hervorheben der enthaltenen Websites"
Bryan Larsen,
5
"Am 1. April 2017 wird Google den Verkauf der Google Site Search einstellen. Alle neuen Käufe und Verlängerungen müssen vor diesem Datum erfolgen. Das Produkt wird bis zum 1. April 2018 vollständig heruntergefahren."
Gajus
55

Die benutzerdefinierte Google-Suche (wie in den am besten bewerteten Antworten empfohlen) funktioniert gut, ist jedoch im Vergleich zu den Mitbewerbern (unten) oder anderen Google-APIs sehr teuer. Es hat eine kleine kostenlose Stufe (100 Anfragen / Tag) und einen sehr hohen Preis von 5 USD pro 1000 Anfragen.

Sie bieten die Möglichkeit, ein Upgrade auf Site Search durchzuführen, das etwas bessere Preise bietet. Dies ist jedoch für die Suche nach einer Site (Ihrer eigenen) gedacht. Es handelt sich also wirklich um etwas ganz anderes - nicht um ein Upgrade.

Die Hauptalternativen scheinen zu sein:

Bing Search API
https://datamarket.azure.com/dataset/5BA839F1-12CE-4CCE-BF57-A49D98D29A44 Mit
einer kostenlosen Stufe von 5000q / Monat und Preisen ab 5 Abfragen pro Penny und ohne festes Limit.

UPDATE: Ende 2016 wurde diese API zugunsten des Azure-Gegenstücks "Cognitive Services Bing Search API" heruntergefahren:
https://azure.microsoft.com/en-us/services/cognitive-services/search/

Hier finden Sie eine Preisübersicht, die bei 1.000 Transaktionen bei 3 USD / m beginnt. Wenn ich nichts vermisse, ist es ziemlich teuer.

Yahoo BOSS Search API
UPDATE: Wurde am 31. März 2016 eingestellt. Http://developer.yahoo.com/boss/search/
Mit Preisen ab etwa 12 Abfragen / Cent für die gesamte Websuche.

Und einige, von denen ich noch nie gehört habe:

http://www.gigablast.com/searchfeed.html

http://www.faroo.com/hp/api/api.html

http://www.commoncrawl.org/

http://www.entireweb.com/search_api/implementation/
[eingestellt - wie unten angegeben]

Einige davon werden in diesem SO-Beitrag ein wenig diskutiert .
[wurde wegen Nicht-Themas geschlossen und ist jetzt weg]

Tom
quelle
2
Bing Search API Version 5 ermöglicht jetzt bis zu 1.000 Transaktionen pro Monat über alle Bing Search-APIs (Web, Bilder, Video, Nachrichtensuche) - microsoft.com/cognitive-services/en-us/pricing . Ich habe einige Beispiele zusammengestellt - mvark.blogspot.in/2016/06/…
mvark
Wholeeweb.com hat den Service eingestellt, wie hier zu sehen. Wholeeweb.com/services
Wessam El Mahdy
Am 15. Dezember 2016 wird die Bing Web Search-API unter Cognitive Services von Azure Marketplace ( azure.microsoft.com/en-us/services/cognitive-services/search ) verschoben , für die für ein Abonnement eine Überprüfung von Telefon und Kreditkarte erforderlich ist (sogar) eine freie).
Gilad Mayani
Über die Bing-API: "DataMarket und Data Services werden eingestellt und nehmen nach dem 31.12.2016 keine neuen Bestellungen mehr an. Bestehende Abonnements werden ab dem 31.03.2017 eingestellt und gekündigt. Wenden Sie sich an Ihren Diensteanbieter, um Optionen zu erhalten möchte den Dienst fortsetzen. "
Dmitri Zaitsev
Vielen Dank für den Hinweis auf die Änderung - ich habe die Antwort entsprechend aktualisiert.
Tom
27

Hier ist eine Option am unteren Rand der Systemsteuerung für die benutzerdefinierte Suche: "Zu durchsuchende Websites" . Sie können "Das gesamte Web durchsuchen , aber die enthaltenen Websites hervorheben" auswählen.

Benutzerdefinierte Suchsteuerung - Zu durchsuchende Websites

Yishu Fang
quelle
1
funktioniert es noch bei dir
Dejell
Ja, es funktioniert immer noch.
5
Google zwingt Sie, diese Option zu deaktivieren, wenn Sie ein Upgrade auf bezahlte Suche durchführen. Und kostenlos hat ein Limit von 100 Suchanfragen.
Bryan Larsen
1
@Yishu, Warum heißt es auf der Seite https://support.google.com/customsearch/answer/141877?hl=de " Sie können die Google Site Search nicht für die Suche im gesamten Web konfigurieren "?
Pacerier
@ Pacerier, ich habe keine Ahnung davon. Vielleicht hat sich die Politik geändert?
Yishu Fang
14

Faroo hat eine kostenlose Web Search API

Jack
quelle
Ihre Ergebnisse sind begrenzt, aber ein guter Ausgangspunkt.
afro360
@ Jack, noch nie davon gehört. Woher bekommen sie ihre Suchergebnisse?
Pacerier
7
Ein möglicher Deal Breaker für Faroo ist, dass Ihr API-Schlüssel auf die IP-Adresse beschränkt ist, die Sie bei der Registrierung angegeben haben.
Nicht gefangene Ausnahme
6
Sind diese Leute noch einsatzbereit? Ich habe API-Schlüssel angefordert und nichts gehört.
Paul Whelan
5

Ich bin gerade auf Common Crawl gestoßen.

http://www.commoncrawl.org/

Könnte die Antwort sein, nach der wir alle suchen !!

Dan
quelle
3
Es hat einen begrenzten Index, der ungefähr einmal im Jahr aktualisiert wird. Und es ist schließlich ziemlich teuer, da Sie sich an Amazon S3 anschließen müssen.
Guillaume Lebourgeois
@ GuillaumeLebourgeois, teuer? Ich denke nicht, dass das stimmt. Es ist eine gemeinnützige Organisation. Die gesamten 102 TB Daten können kostenlos heruntergeladen werden.
Pacerier
Die Kosten fallen für die Verbindung zu AWS an, auf die Sie zugreifen können. Wenn Sie ein Student sind, haben Sie Anspruch auf die kostenlose Stufe, es können jedoch noch Transferkosten usw.; und wenn Sie nicht in der kostenlosen Stufe sind, fallen laufende Kosten an.
Tripleee
Es sieht so aus, als ob das gemeinsame Crawlen jetzt monatlich aktualisiert wird
Jack Tuck
4

Über den Dokumenten befindet sich ein Hinweis :

Hinweis: Die Google Web Search-API ist seit dem 1. November 2010 offiziell veraltet. Sie funktioniert weiterhin gemäß unserer Verfallsrichtlinie , aber die Anzahl der Anfragen, die Sie pro Tag stellen können, ist begrenzt. Wir empfehlen Ihnen daher, auf die neue benutzerdefinierte Such-API umzusteigen .

Die Abschreibungsrichtlinie besagt, dass die API 3 Jahre lang ausgeführt wird. Wenn Sie also bereits eine Anwendung haben, die die alte API verwendet, müssen Sie sich noch nicht beeilen, um Änderungen vorzunehmen. Wenn Sie eine neue Anwendung schreiben, verwenden Sie die API für die benutzerdefinierte Suche . In meiner Antwort hier erfahren Sie, wie dies in Python funktioniert, aber die Idee ist für jede Sprache gleich.

Moinudin
quelle
8
Und es ist nicht kostenlos ... "$ 5 pro 1000 Anfragen" ... sehr viel nicht kostenlos!
UpTheCreek
1
Diese Antwort ist jetzt veraltet, da die drei Jahre abgelaufen sind und der 29.09.2014 vergangen ist.
Nanofarad
CustomeSearchAPI ist nicht auf allen Websites - es ist für die Benutzer-Websites
Dejell
1

Sie können "überall" benutzerdefinierte Suchmaschinen direkt von der Google Custom Search-Startseite ( http://www.google.com/cse/ ) erstellen . Sie sollten beim Hinzufügen einer neuen Engine einfach auf "Erweitert" klicken. Dort können Sie den Site-Typ Schema.org angeben. ' Thing ' ist der allgemeinste Typ, der das gesamte Web abdeckt.

testlnord
quelle
Ich habe es nicht verstanden. Funktioniert es für dich?
Dejell