CentOS
Gibt es eine einfache Möglichkeit, spezielle HTML-Entitäten aus einem Datenstrom zu konvertieren? Ich übergebe Daten an ein Bash-Skript und manchmal enthalten diese Daten spezielle Entitäten. Zum Beispiel:
"Test" & amp; test $ test! test @ # $% ^ & amp; * *
Ich bin mir nicht sicher, warum einige Zeichen gut angezeigt werden und andere nicht, aber leider habe ich keine Kontrolle über die eingehenden Daten.
Ich denke, ich könnte SED hier verwenden, aber das scheint umständlich und möglicherweise anfällig für Fehlalarme zu sein. Gibt es einen Linux-Befehl, an den ich weiterleiten kann und der sich auf das Dekodieren dieser Art von Daten spezialisiert hat?
recode scheint in Standardpaket-Repositorys der wichtigsten GNU / Linux-Distributionen verfügbar zu sein. Zum Beispiel, um HTML-Entitäten in UTF-8 zu dekodieren:
quelle
Mit Python 3:
quelle
Nimmt Textdatei von stdin:
Es braucht wahrscheinlich bash> = Version 4
quelle