Gibt es eine einfache Möglichkeit, die Anzahl der Zeilen in einer Textdatei programmgesteuert zu bestimmen?
quelle
Gibt es eine einfache Möglichkeit, die Anzahl der Zeilen in einer Textdatei programmgesteuert zu bestimmen?
Ernsthaft verspätete Bearbeitung: Wenn Sie .NET 4.0 oder höher verwenden
Die File
Klasse hat eine neue ReadLines
Methode, die Zeilen träge auflistet, anstatt sie alle gierig in ein Array wie zu lesen ReadAllLines
. Jetzt können Sie sowohl Effizienz als auch Prägnanz erreichen mit:
var lineCount = File.ReadLines(@"C:\file.txt").Count();
Ursprüngliche Antwort
Wenn Sie sich nicht zu sehr um Effizienz kümmern, können Sie einfach schreiben:
var lineCount = File.ReadAllLines(@"C:\file.txt").Length;
Für eine effizientere Methode könnten Sie Folgendes tun:
var lineCount = 0;
using (var reader = File.OpenText(@"C:\file.txt"))
{
while (reader.ReadLine() != null)
{
lineCount++;
}
}
Bearbeiten: Als Antwort auf Fragen zur Effizienz
Der Grund, warum ich sagte, dass der zweite effizienter war, war die Speichernutzung, nicht unbedingt die Geschwindigkeit. Der erste lädt den gesamten Inhalt der Datei in ein Array, was bedeutet, dass mindestens so viel Speicher wie die Größe der Datei zugewiesen werden muss. Die zweite Schleife führt jeweils nur eine Zeile durch, sodass nie mehr als eine Zeile Speicherplatz gleichzeitig zugewiesen werden muss. Dies ist für kleine Dateien nicht so wichtig, aber für größere Dateien kann es ein Problem sein (wenn Sie versuchen, die Anzahl der Zeilen in einer 4-GB-Datei auf einem 32-Bit-System zu ermitteln, wo beispielsweise einfach nicht genug vorhanden ist Adressraum im Benutzermodus, um ein so großes Array zuzuweisen).
In Bezug auf die Geschwindigkeit würde ich nicht erwarten, dass viel drin ist. Es ist möglich, dass ReadAllLines einige interne Optimierungen aufweist, andererseits muss möglicherweise ein großer Teil des Speichers zugewiesen werden. Ich würde vermuten, dass ReadAllLines für kleine Dateien schneller, für große Dateien jedoch erheblich langsamer ist. Die einzige Möglichkeit, dies festzustellen, besteht darin, es mit einer Stoppuhr oder einem Code-Profiler zu messen.
ReadLines().Count()
Sieusing System.Linq
Ihren Includes ein hinzufügen . Es schien ziemlich unintuitiv zu sein, diesen Zusatz zu verlangen, deshalb erwähne ich ihn. Wenn Sie Visual Studio verwenden, wird dieser Zusatz wahrscheinlich automatisch für Sie ausgeführt.Das einfachste:
quelle
Dies würde weniger Speicher verbrauchen, aber wahrscheinlich länger dauern
quelle
Wenn mit einfach eine Codezeile gemeint ist, die leicht zu entschlüsseln, aber zufällig ineffizient ist?
Das ist wahrscheinlich der schnellste Weg, um zu wissen, wie viele Zeilen.
Sie können dies auch tun (je nachdem, ob Sie es einpuffern)
Es gibt viele andere Möglichkeiten, aber eine der oben genannten ist wahrscheinlich die, mit der Sie gehen werden.
quelle
Sie können es schnell einlesen und einen Zähler erhöhen. Verwenden Sie einfach eine Schleife, um ihn zu erhöhen, und tun Sie nichts mit dem Text.
quelle
Das Einlesen einer Datei an und für sich dauert einige Zeit. Das Sammeln des Ergebnisses durch Müll ist ein weiteres Problem, da Sie die gesamte Datei lesen, um nur die Zeilenumbruchzeichen zu zählen.
Irgendwann muss jemand die Zeichen in der Datei lesen, unabhängig davon, ob dies das Framework ist oder ob es Ihr Code ist. Dies bedeutet, dass Sie die Datei öffnen und in den Speicher einlesen müssen, wenn die Datei groß ist. Dies ist möglicherweise ein Problem, da der Speicher durch Müll gesammelt werden muss.
Nima Ara hat eine nette Analyse gemacht, die Sie in Betracht ziehen könnten
Hier ist die vorgeschlagene Lösung, da sie 4 Zeichen gleichzeitig liest, das Zeilenvorschubzeichen zählt und dieselbe Speicheradresse für den nächsten Zeichenvergleich erneut verwendet.
Oben sehen Sie, dass eine Zeile auch vom zugrunde liegenden Framework zeichenweise gelesen wird, da Sie alle Zeichen lesen müssen, um den Zeilenvorschub zu sehen.
Wenn Sie es als erledigt in Bay Nima profilieren, werden Sie feststellen, dass dies eine ziemlich schnelle und effiziente Methode ist.
quelle
Zählen Sie die Wagenrückläufe / Zeilenvorschübe. Ich glaube an Unicode sind sie immer noch 0x000D bzw. 0x000A. Auf diese Weise können Sie so effizient oder ineffizient sein, wie Sie möchten, und entscheiden, ob Sie mit beiden Charakteren umgehen müssen oder nicht
quelle
Eine praktikable Option, die ich persönlich verwendet habe, wäre das Hinzufügen eines eigenen Headers zur ersten Zeile der Datei. Ich habe dies für ein benutzerdefiniertes Modellformat für mein Spiel getan. Grundsätzlich habe ich ein Tool, das meine OBJ-Dateien optimiert, den nicht benötigten Mist beseitigt, sie in ein besseres Layout konvertiert und dann die Gesamtzahl der Linien, Flächen, Normalen, Scheitelpunkte und Textur-UVs aufschreibt die allererste Zeile. Diese Daten werden dann von verschiedenen Array-Puffern verwendet, wenn das Modell geladen wird.
Dies ist auch nützlich, da Sie die Datei nur einmal durchlaufen müssen, um sie zu laden, anstatt einmal, um die Zeilen zu zählen und die Daten erneut in Ihre erstellten Puffer einzulesen.
quelle
quelle
Sie können die ausführbare Datei " wc .exe" (im Lieferumfang von UnixUtils enthalten und muss nicht installiert werden) als externen Prozess ausführen. Es unterstützt verschiedene Zeilenzählmethoden (wie Unix vs Mac vs Windows).
quelle