Wenn ich auf ein neues Webcomic oder Blog stoße, das mir wirklich gefällt, abonniere ich dessen RSS / Atom-Feed, damit ich neue Inhalte sehen kann. Wenn es großartig genug ist, möchte ich auch die Archive lesen, um alle alten Inhalte nachzuholen. Das Abonnieren ist einfach. Das Lesen der Archive ist einfach, wenn ich alles in einer Sitzung erledigen kann. sonst ist es schwer.
Google Reader ist eine großartige Möglichkeit, die Archive einer Website zu lesen, mit der Ausnahme, dass der Lese- / ungelesene Status erst nach einigen Wochen erfasst wird. Gibt es etwas Ähnliches, mit dem ich den gesamten Verlauf eines RSS-Feeds durchsuchen, nachverfolgen kann, welche Beiträge ich gelesen habe, und auf einfache Weise zum nächsten ungelesenen Beitrag gelangen kann? (Wichtig ist auch die Möglichkeit, einen Beitrag wieder als "ungelesen" zu markieren, da ich einen längeren Beitrag möglicherweise nicht immer in einer Sitzung lesen kann.)
Mir ist bewusst, dass der eigentliche RSS-Feed zu einem bestimmten Zeitpunkt nur die letzten zehn oder zwanzig Beiträge enthält, und das ist eigentlich Teil dieser Frage. Um wirklich nützlich zu sein, müsste eine Webapp zum Lesen des Archivs in etwas wie Google Reader eingebunden werden, das (wahrscheinlich) den RSS-Feed bereits seit Ewigkeiten beobachtet und daher alle Beiträge kennt, die jemals veröffentlicht wurden stoßen Sie darauf - oder haben Sie eine andere Möglichkeit, die Archive der Site zu durchsuchen oder auf andere Weise etwas über ihre Geschichte zu erfahren.
quelle
Antworten:
Möglicherweise können Sie dies mit einer Verknüpfung mit der Way Back-Maschine erreichen, wenn die Syndizierung als tatsächliche XML-Dateien auf der Site gespeichert wurde. Wenn es dynamisch aus einer Datenbank generiert worden wäre (wie es die meisten modernen CMS tun werden), müsste Ihre Lösung in der Tat seit Ewigkeiten abgehört haben. Wenn die Website nicht besonders beliebt ist oder in Suchlisten nicht gut angezeigt wird, kann es für solche automatisierten Crawler schwierig sein, sie zu finden.
Angenommen, Site Builder passen die Archiv- oder Speicherarchitekturen in den von ihnen verwendeten CMS nicht an, könnten Sie möglicherweise eine Anwendung schreiben, um den Inhalt der Site zu crawlen und zu verarbeiten. Sie müssten wahrscheinlich für jedes CMS eines erstellen, und ich kann sehen, dass die Verarbeitung eine ganze Weile dauert. Wahrscheinlich keine realistische Option zu diesem Zeitpunkt.
Derzeit denke ich, dass Sie wahrscheinlich die Website durchsuchen müssen.
Bei einigen Feed-Readern mit integrierten Browsern können Sie Seiten markieren und zur Liste eines Feeds hinzufügen. Ich bin mir ziemlich sicher, dass Sie einen Skriptlink erstellen können, der zur Lesezeichenleiste Ihres Browsers hinzugefügt wird, um auch eine zufällige Webseite in Google Reader zu markieren. Und es gibt auch die Delicious.com-Route. Selbst wenn Sie eine Website manuell durchsuchen müssen, können Sie die Beiträge speichern, die Ihnen wirklich gefallen.
quelle