Ich habe eine CSV-Datei, die so aussieht:
ID, term, functional category
GO:0008166,viral replication,P,
GO:0008167,sigma virus replication,P,
GO:0008168,GO:0004480,methyltransferase activity,F,
GO:0008169,C-methyltransferase activity,F,
Ich muss nur verwenden notepad++
, um IDs in ihre eigene Zeile zu verschieben und das, was sich in derselben Zeile befand, nach unten zu kopieren. Im Idealfall würde die endgültige Ausgabe folgendermaßen aussehen:
ID, term, functional category
GO:0008166,viral replication,P,
GO:0008167,sigma virus replication,P,
GO:0008168,,methyltransferase activity,F,
GO:0004480,methyltransferase activity,F,
GO:0008169,C-methyltransferase activity,F,
Ich habe versucht, die Funktion zum Ersetzen zu verwenden, indem ich mithilfe von: Instanzen von IDs direkt nebeneinander gefunden (\w+:\d+),(\w+:\d+),(.*),[A-Z]
und durch ersetzt habe $1,$3,$4\r$2,$3,$4
.
Jedes Mal, wenn ich versuche, diese Instanzen zu "finden", notepad++
wird die gesamte Liste hervorgehoben und der Befehl funktioniert nicht.
Ich bin nicht sehr erfahren damit, also wenn mir jemand helfen kann, würde ich es schätzen! Vielen Dank!
Originaldatei: http://www.geneontology.org/doc/GO.terms_alt_ids
Ich habe den Header entfernt und ihn in einen CSV umgewandelt, indem ich alle Tabulatoren durch ein Komma ersetzt habe.
$
an das Ende des Find-Abschnitts an, damit es bei EoL endet (was es bei meinen Tests getan hat, aber offensichtlich echte Tests> kleine Beispieldaten!)(GO:[\d]+),(GO:[\d]+)(.*)$
. Sie können^
der Vollständigkeit^(GO:[\d]+),(GO:[\d]+)(.*)$