Als «text-processing» getaggte Fragen

9
Wie ist ksh93 so schnell?

Daher tendiere ich im Allgemeinen dazu, nach sedTextverarbeitung zu suchen - insbesondere nach großen Dateien - und vermeide es normalerweise, solche Dinge in der Shell selbst zu tun. Ich denke jedoch, dass sich das ändern kann. Ich stöberte herum man kshund bemerkte Folgendes: <#pattern Seeks...

9
Mische zwei parallele Textdateien

Ich habe zwei satzausgerichtete parallele Korpora (Textdateien) mit ungefähr 50 Millionen Wörtern. (aus dem Europarl-Korpus -> Parallelübersetzung von Rechtsdokumenten). Ich möchte jetzt die Zeilen der beiden Dateien mischen, aber beide auf die gleiche Weise. Ich wollte das mit gshuf (ich bin...

9
Umgang mit 3 Dateien mit awk

Betrachten Sie folgende Dateien: file1:: boo,8,1024 foo,7,2048 file2:: foo,0,24,154 noo,0,10,561 file3:: 24,154,7,1024,0 Was ich brauche, ist zu Datei1 zu gehen und zu überprüfen, ob $2==7; wenn sie wahr sind , nehmen $1, $2und $3von File1 ; jetzt muss ich vergleichen, ob $1von Datei1 gleich $1von...

9
Wie gruppiere ich Zeilen in einer Datei nach zwei?

Ich habe eine Textdatei wie diese: a b c d e f g Wie kann ich diese Zeilen gruppieren, um eine Ausgabe wie folgt zu erhalten: a-b b-c c-d d-e e-f f-g Ich muss das in Shell machen (sh, csh, bash). Ich habe folgendes gefunden: cat file | xargs -n2 aber das letzte Element der ersten Gruppe wird nicht...

9
Wie ersetze ich einen mehrzeiligen Code durch sed?

Ich habe eine große Datei mit Sonderzeichen. Dort gibt es einen mehrzeiligen Code, den ich ersetzen möchte sed. Dies: text = "\ ------ ------\n\n\ This message was automatically generated by email software\n\ The delivery of your message has not been affected.\n\n\ ------ ------\n\n" Muss sich in...

9
Grep word in einer Datei und kopiere die Datei

Ich habe eine Sammlung von Dateien (* .zip, * .txt, * .tar.gz, * .doc, ... usw.). Diese Dateien befinden sich in einem Pfad. Ich möchte alle Dateien (* .txt) finden und dann nur die Textdateien kopieren, die bestimmte Wörter enthalten (z. B. LINUX / UNIX). Ich habe folgendes ausgeführt: find ....