Gibt es eine Möglichkeit, die automatisch generierten YouTube-Transkriptionen herunterzuladen, ohne das Video herunterzuladen?
Ich möchte die TED-Vorträge überprüfen, habe aber eine begrenzte Bandbreite und möchte die automatisierten Transkripte (möglicherweise auch als Untertitel oder Untertitel bezeichnet) exportieren.
Antworten:
Verwenden Sie die Funktion "Network Inspector" des Skript-Debuggers Ihres Browsers und suchen Sie nach der Aktivierung der transkribierten Untertitel nach einer zweiten Anforderung für die Timed-Text- Seite. Kopieren Sie dann alle Anforderungen in die Adressleiste, um sie im nativen YouTube-XML-Format herunterzuladen.
Um die SRT-Version zu erhalten, führen Sie diesen Code in der Debugger-Konsole für diese XML-Seite aus:
Auch hier ist eine Bookmarklet-Version des Skripts:
quelle
Es gibt verschiedene Möglichkeiten, Untertitel aus einem YouTube-Video zu extrahieren :
Durch Angabe der Sprache und der Video-ID in dieser generischen URL erhalten
http://www.youtube.com/api/timedtext?lang={LANG}&v={VIDEOID}
Sie eine.xml
Datei mit den Untertiteln in der gewünschten Sprache für ein ausgewähltes Video.Um die Tags in dieser Datei loszuwerden und nur das Nur-Text-Transkript zu haben, müssen Sie Folgendes tun:
Alternativ gibt es ein Open-Source-Tool namens Google2SRT , das alle verfügbaren Subs von einem YouTube-Video mit einem Klick herunterlädt und in ein
.srt
Format konvertiert, damit es in Media Playern wie dem VLC Media Player verwendet werden kann.Update: Ted.com stellt jetzt auf seiner Website Abschriften der Vorträge zur Verfügung.
quelle
http://video.google.com/timedtext?lang=english&v=b11AXknrsEI
aber es funktioniert nicht. Es hilft auch nicht, Entwickler-Tools aufzurufen. Es gibt Unmengen von Ressourcen und keine von ihnen sagt Timed-Text.english
zuen
undeng
aber es tut die gleiche Sache.Ich denke, dieses Userscript sollte für Sie funktionieren:
http://userscripts.org/scripts/show/50003/
quelle
Google2SRT 0.6 unterstützt YouTube ASR: http://sourceforge.net/projects/google2srt/
quelle
Wenn es sich um Ihr eigenes Video handelt, können Sie die Untertitel aus dem Videomanager herunterladen. Gehe zu:
Video Manager >> Bearbeiten (auf das gewünschte Video) >> Untertitel >> (Klicken Sie auf den Track, den Sie herunterladen möchten) >> Aktionen (Dropdown-Box)
Zum Zeitpunkt des Schreibens sind drei Dateitypen verfügbar:
Diese haben unterschiedliche Verwendungszwecke in unterschiedlichen Anwendungen, sind sich jedoch sehr ähnlich. SRT ist wahrscheinlich die häufigste.
Andernfalls besteht die beste Methode (einzige Methode) darin, die XML-Datei von den Entwicklertools abzurufen, wenn es sich nicht um Ihr Video handelt.
Navigieren Sie in diesem Beispiel mit Google Chrome zum Video und führen Sie die folgenden Schritte aus:
timedtext?
plus eine Reihe von Variablen. Der zweite ist in der Regel der, den Sie wollen. Es beginnt so:<transcript> <text start="4.14" dur="3.049">my name is doctor john rush</text> <text start="7.189" dur="3.731">I'm the CEO and president</text>
Diese XML-Datei ist nützlich, wenn Sie das Transkript in einer Webseite verwenden möchten. Davon abgesehen können Sie es meines Erachtens nicht so verwenden, wie Sie es mit einer SRT-Datei tun würden. Wenn Sie sich mit Programmieren auskennen, können Sie problemlos ein Programm schreiben, das es in SRT konvertiert. Ich habe mein eigenes C # -Programm geschrieben, das die Daten für einen anderen Zweck extrahiert, und es hat weniger als zwei Stunden gedauert.
quelle