Ruft den Titel aller URLs in einer Liste ab

0

Ich habe eine riesige Liste von URLs und möchte den Titel aller URLs erhalten.

Ist es möglich? (ohne jeden einzelnen von ihnen manuell aufsuchen zu müssen)

Ich benutze Windows 8

laggingreflex
quelle
2
Wenn Sie title sagen, meinen Sie damit das Metadatenattribut "title" aus dem HTML der Zielseite?
CLockeWork

Antworten:

2

Naja ... normalerweise würde ich das mit Linux machen, aber hier ist eine kleine Batchdatei, die Sie in Windows verwenden können: ( sites.txtwürde Ihre URLs enthalten)

sites.bat

@echo off
if exist titles.txt (del titles.txt)
for /f "tokens=*" %%a in (sites.txt) do (
  echo Checking %%a
  echo|set /p=%%a ;>> titles.txt
  wget --quiet -O - "%%a" 2> nul | sed -n -e "s!.*<title>\(.*\)</title>.*!\1!p" >> titles.txt
)
type titles.txt

Ergebnis wird in titles.txt(mit URL ;davor für den einfachen Import in eine Tabelle)

Sie brauchen wgetund sedfür Windows.

Sie finden sie hier:

wget für Windows
sed für Windows

Hinweis: Mit diesem einfachen sedBefehl wird der Titel extrahiert. Dies kann schief gehen, wenn ein titleTag auch im Hauptteil vorhanden ist (oder keinen Titel hat). Wenn das der Fall ist können Sie komplexere Kontrollen finden hier .

Rik
quelle