Was ist die ideale selbst gehostete Suchmaschine? [geschlossen]

11

Ich habe eine interne (Intranet-) Site, die aus mehreren Blogs und Foren, Hunderten von statischen Seiten, vielen PDF-Dateien und mehreren anderen Dokumenttypen besteht. Es wurde in den letzten Jahren lose zusammengeklebt und jetzt ist es meine Aufgabe, es zu pflegen.

Ich suche eine Suchmaschine, die ich so ideal hosten kann:

  1. Ermöglicht das direkte Durchsuchen der Blog- / Forum-Datenbanken, wenn die zu durchsuchenden Datenbankinformationen und Tabellen angegeben werden.

  2. Behandelt die meisten Textdokumente (PDF / DOC / ODF)

  3. Ist Open Source oder ermöglicht den Zugriff auf den einmal gekauften Quellcode

Es ist mir egal, in welcher Sprache oder Plattform es geschrieben ist. Normalerweise würde ich nur die Google-Website-Suche verwenden, aber das ist keine Option für ein Intranet.

Tim Post
quelle

Antworten:

2

Ich habe Sphider schon einmal benutzt und war ziemlich beeindruckt.

Darryl Hein
quelle
2

SearchBlox, das auf Lucene basiert, kann möglicherweise Ihre Anforderungen erfüllen. Es ist kostenlos und wird mit einem Crawler geliefert.

matt wilkie
quelle
Kostenlos für 25k URLs, was für ein Intranet nicht viel ist
cweiske
@cweiske Check out Ambar, es basiert auf ElasticSearch und ist kostenlos. github.com/RD17/ambar
Ilya P
0

Normalerweise würde ich nur die Google-Website-Suche verwenden, aber das ist keine Option für ein Intranet.

Es gibt tatsächlich die Google Search Appliance, die der Google-Website-Suche nach Intranets entspricht. Dies ist jedoch kein Open Source (Google Site-Suche auch nicht, falls Sie es nicht bemerkt haben.)


quelle
Ich habe es angeschaut. Ich möchte wirklich etwas, wo ich Zugriff auf den Code haben kann. Es ist auch ein wenig schwer in der Budgetabteilung.
Tim Post
Neben der Google Search Appliance gibt es ein ähnliches Produkt von "Thunderstone", das wettbewerbsfähig ist. Ich habe beide in der Vergangenheit verwendet. Während es für Sie möglicherweise nicht funktioniert, dachte ich, ich würde für andere posten, die über die Frage stolpern.
digit1001