Lesen einer einfachen Textdatei in Java

933

Es scheint verschiedene Möglichkeiten zu geben, Daten von Dateien in Java zu lesen und zu schreiben.

Ich möchte ASCII-Daten aus einer Datei lesen. Was sind die möglichen Wege und ihre Unterschiede?

Tim der Zauberer
quelle
24
Ich bin auch nicht damit einverstanden, als "nicht konstruktiv" zu schließen. Glücklicherweise könnte dies durchaus als Duplikat geschlossen werden . Gute Antworten zB in Wie erstelle ich einen String aus dem Inhalt einer Datei? , Was ist der einfachste Weg, eine Datei in String einzulesen? , Was sind die einfachsten Klassen zum Lesen von Dateien?
Jonik
Ohne Schleifen: {{{Scanner sc = neuer Scanner (Datei "UTF-8"); sc.useDelimiter ("$ ^"); // Regex passt zu nichts String text = sc.next (); sc.close (); }}}
Aivar
3
Es ist so interessant, dass es in Python nichts
Besseres
2
Dies ist der einfachste Weg, dies zu tun: mkyong.com/java/…
Dellasavia

Antworten:

567

ASCII ist eine TEXT-Datei, die Sie Readerszum Lesen verwenden würden. Java unterstützt auch das Lesen aus einer Binärdatei mit InputStreams. Wenn die gelesenen Dateien sehr groß sind, sollten Sie a BufferedReaderüber a verwenden FileReader, um die Leseleistung zu verbessern.

Lesen Sie diesen Artikel über die Verwendung von aReader

Ich würde Ihnen auch empfehlen, dieses wunderbare (und dennoch kostenlose) Buch namens Thinking In Java herunterzuladen und zu lesen

In Java 7 :

new String(Files.readAllBytes(...))

(docs) oder

Files.readAllLines(...)

(docs)

In Java 8 :

Files.lines(..).forEach(...)

(docs)

Aravind Yarram
quelle
14
Die Auswahl eines Readers hängt wirklich davon ab, wofür Sie den Inhalt der Datei benötigen. Wenn die Datei klein ist (ish) und Sie alles benötigen, ist es schneller (von uns bewertet: 1.8-2x), einfach einen FileReader zu verwenden und alles zu lesen (oder zumindest ausreichend große Blöcke). Wenn Sie es Zeile für Zeile verarbeiten, wählen Sie den BufferedReader.
Vlad
3
Wird die Zeilenreihenfolge bei Verwendung von "Files.lines (..). ForEach (...)" beibehalten? Mein Verständnis ist, dass die Reihenfolge nach dieser Operation willkürlich sein wird.
Daniil Shevelev
39
Files.lines(…).forEach(…)behält die Reihenfolge der Zeilen nicht bei, wird jedoch parallel ausgeführt, @Dash. Wenn die Bestellung wichtig ist, können Sie verwenden Files.lines(…).forEachOrdered(…), wodurch die Bestellung erhalten bleiben soll (wurde jedoch nicht überprüft).
Palec
2
@Palec das ist interessant, aber können Sie aus den Dokumenten zitieren, in denen steht, dass Files.lines(...).forEach(...)parallel ausgeführt wird? Ich dachte, dies sei nur dann der Fall, wenn Sie den Stream explizit parallel verwenden Files.lines(...).parallel().forEach(...).
Klitos Kyriacou
3
Meine ursprüngliche Formulierung ist nicht kugelsicher, @KlitosKyriacou. Der Punkt ist, dass forEachkeine Bestellung garantiert wird und der Grund eine einfache Parallelisierung ist. Wenn die Ordnung erhalten bleiben soll, verwenden Sie forEachOrdered.
Palec
687

Meine Lieblingsmethode zum Lesen einer kleinen Datei ist die Verwendung eines BufferedReader und eines StringBuilder. Es ist sehr einfach und auf den Punkt gebracht (obwohl nicht besonders effektiv, aber für die meisten Fälle gut genug):

BufferedReader br = new BufferedReader(new FileReader("file.txt"));
try {
    StringBuilder sb = new StringBuilder();
    String line = br.readLine();

    while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
    }
    String everything = sb.toString();
} finally {
    br.close();
}

Einige haben darauf hingewiesen, dass Sie nach Java 7 die Funktionen zum Ausprobieren von Ressourcen (dh zum automatischen Schließen) verwenden sollten:

try(BufferedReader br = new BufferedReader(new FileReader("file.txt"))) {
    StringBuilder sb = new StringBuilder();
    String line = br.readLine();

    while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
    }
    String everything = sb.toString();
}

Wenn ich solche Zeichenfolgen lese, möchte ich normalerweise sowieso eine Zeichenfolgenbehandlung pro Zeile durchführen, also gehe ich zu dieser Implementierung.

Wenn ich jedoch nur eine Datei in einen String einlesen möchte, verwende ich immer Apache Commons IO mit der Klasse IOUtils.toString (). Die Quelle können Sie hier einsehen:

http://www.docjar.com/html/api/org/apache/commons/io/IOUtils.java.html

FileInputStream inputStream = new FileInputStream("foo.txt");
try {
    String everything = IOUtils.toString(inputStream);
} finally {
    inputStream.close();
}

Und noch einfacher mit Java 7:

try(FileInputStream inputStream = new FileInputStream("foo.txt")) {     
    String everything = IOUtils.toString(inputStream);
    // do something with everything string
}
Knubo
quelle
6
Ich habe eine kleine Anpassung vorgenommen, um das Hinzufügen einer neuen Zeile (\ n) zu beenden, wenn die letzte Zeile erreicht ist. code while (Zeile! = null) {sb.append (Zeile); line = br.readLine (); // Neue Zeile nur hinzufügen, wenn curline NICHT die letzte Zeile ist .. if (line! = Null) {sb.append ("\ n"); }}code
Ramon Fincken
2
Ähnlich wie bei Apache Common IO ist IOUtils # toString () sun.misc.IOUtils # readFully (), das in den Sun / Oracle-JREs enthalten ist.
gb96
3
Rufen Sie für die Leistung immer sb.append ('\ n') vor sb.append ("\ n") auf, da ein
Zeichen
2
FileReader kann FileNotFoundException auslösen und BufferedRead kann IOException auslösen, sodass Sie sie abfangen müssen.
Kamaci
4
Es ist nicht erforderlich, die Leser direkt zu verwenden, und es sind auch keine ioutils erforderlich. In java7 sind Methoden zum Lesen einer gesamten Datei / aller Zeilen integriert: Siehe docs.oracle.com/javase/7/docs/api/java/nio/file/… und docs.oracle.com/javase/7/docs/api / java / nio / file /…
kritzikratzi
142

Am einfachsten ist es, die ScannerKlasse in Java und das FileReader-Objekt zu verwenden. Einfaches Beispiel:

Scanner in = new Scanner(new FileReader("filename.txt"));

Scanner Es gibt verschiedene Methoden zum Einlesen von Zeichenfolgen, Zahlen usw. Weitere Informationen hierzu finden Sie auf der Java-Dokumentationsseite.

Zum Beispiel den gesamten Inhalt in ein String:

StringBuilder sb = new StringBuilder();
while(in.hasNext()) {
    sb.append(in.next());
}
in.close();
outString = sb.toString();

Wenn Sie eine bestimmte Codierung benötigen, können Sie diese anstelle von FileReader:

new InputStreamReader(new FileInputStream(fileUtf8), StandardCharsets.UTF_8)
Jesus Ramos
quelle
28
while (in.hasNext ()) {System.out.println (in.next ()); }
Gene Bo
16
@Hissain Aber viel einfacher zu bedienen alsBufferedReader
Jesus Ramos
3
Muss es mit versuchen Catch
Rahal Kanishka
@ JesusRamos Nicht wirklich, warum denkst du so? Was ist einfacher als while ((line = br.readLine()) != null) { sb.append(line); }?
Marquis von Lorne
83

Hier ist eine einfache Lösung:

String content;

content = new String(Files.readAllBytes(Paths.get("sample.txt")));
Nery Jr.
quelle
2
@Nery Jr, elegant und einfach
Mahmoud Saleh
1
Das Beste und Einfachste.
Dary
57

Hier ist eine andere Möglichkeit, ohne externe Bibliotheken zu verwenden:

import java.io.File;
import java.io.FileReader;
import java.io.IOException;

public String readFile(String filename)
{
    String content = null;
    File file = new File(filename); // For example, foo.txt
    FileReader reader = null;
    try {
        reader = new FileReader(file);
        char[] chars = new char[(int) file.length()];
        reader.read(chars);
        content = new String(chars);
        reader.close();
    } catch (IOException e) {
        e.printStackTrace();
    } finally {
        if(reader != null){
            reader.close();
        }
    }
    return content;
}
Schmutzig
quelle
10
oder verwenden Sie "try-with-resources" try (FileReader reader = neuer FileReader (Datei))
Hernán Eche
3
Ich habe die Datei file.length () bemerkt. Wie gut funktioniert das mit utf-16-Dateien?
Wayne
5
Diese Technik setzt voraus, dass read () den Puffer füllt; dass die Anzahl der Zeichen der Anzahl der Bytes entspricht; dass die Anzahl der Bytes in den Speicher passt; und dass die Anzahl der Bytes in eine ganze Zahl passt. -1
Marquis von Lorne
1
@ HermesTrismegistus Ich habe vier Gründe angegeben, warum es falsch ist. StefanReich stimmt mir zu Recht zu.
Marquis von Lorne
34

Ich musste die verschiedenen Wege vergleichen. Ich werde meine Ergebnisse kommentieren, aber kurz gesagt, der schnellste Weg ist, einen einfachen alten BufferedInputStream über einen FileInputStream zu verwenden. Wenn viele Dateien gelesen werden müssen, reduzieren drei Threads die Gesamtausführungszeit auf ungefähr die Hälfte. Wenn Sie jedoch mehr Threads hinzufügen, wird die Leistung schrittweise beeinträchtigt, bis die Fertigstellung mit zwanzig Threads dreimal länger dauert als mit nur einem Thread.

Die Annahme ist, dass Sie eine Datei lesen und mit ihrem Inhalt etwas Sinnvolles tun müssen. In den Beispielen werden hier Zeilen aus einem Protokoll gelesen und diejenigen gezählt, die Werte enthalten, die einen bestimmten Schwellenwert überschreiten. Ich gehe also davon aus, dass der Einzeiler Java 8Files.lines(Paths.get("/path/to/file.txt")).map(line -> line.split(";")) keine Option ist.

Ich habe auf Java 1.8, Windows 7 und sowohl SSD- als auch HDD-Laufwerken getestet.

Ich habe sechs verschiedene Implementierungen geschrieben:

rawParse : Verwenden Sie BufferedInputStream über einen FileInputStream und schneiden Sie dann die byteweisen Zeilen aus. Dies übertraf jeden anderen Single-Thread-Ansatz, kann jedoch für Nicht-ASCII-Dateien sehr unpraktisch sein.

lineReaderParse : Verwenden Sie einen BufferedReader über einem FileReader, lesen Sie Zeile für Zeile, teilen Sie Zeilen, indem Sie String.split () aufrufen. Dies ist ungefähr 20% langsamer als rawParse.

lineReaderParseParallel : Dies ist dasselbe wie lineReaderParse, verwendet jedoch mehrere Threads. Dies ist in allen Fällen die schnellste Option insgesamt.

nioFilesParse : Verwenden Sie java.nio.files.Files.lines ()

nioAsyncParse : Verwenden Sie einen AsynchronousFileChannel mit einem Completion-Handler und einem Thread-Pool.

nioMemoryMappedParse : Verwenden Sie eine Speicherzuordnungsdatei. Dies ist wirklich eine schlechte Idee, da die Ausführungszeiten mindestens dreimal länger sind als bei jeder anderen Implementierung.

Dies sind die durchschnittlichen Zeiten für das Lesen von 204 Dateien mit jeweils 4 MB auf einem Quad-Core i7- und SSD-Laufwerk. Die Dateien werden im laufenden Betrieb generiert, um ein Zwischenspeichern der Festplatte zu vermeiden.

rawParse                11.10 sec
lineReaderParse         13.86 sec
lineReaderParseParallel  6.00 sec
nioFilesParse           13.52 sec
nioAsyncParse           16.06 sec
nioMemoryMappedParse    37.68 sec

Ich fand einen kleineren Unterschied als erwartet zwischen der Ausführung auf einer SSD oder einem Festplattenlaufwerk, da die SSD ungefähr 15% schneller ist. Dies kann daran liegen, dass die Dateien auf einer nicht fragmentierten Festplatte generiert und nacheinander gelesen werden. Daher kann das sich drehende Laufwerk fast wie eine SSD funktionieren.

Ich war von der geringen Leistung der nioAsyncParse-Implementierung überrascht. Entweder habe ich etwas falsch implementiert oder die Multi-Thread-Implementierung mit NIO und einem Completion-Handler führt die gleiche (oder sogar schlechtere) Leistung aus wie eine Single-Thread-Implementierung mit der java.io-API. Darüber hinaus ist die asynchrone Analyse mit einem CompletionHandler in Codezeilen viel länger und schwierig korrekt zu implementieren als eine direkte Implementierung in alten Streams.

Jetzt die sechs Implementierungen, gefolgt von einer Klasse, die sie alle enthält, sowie einer parametrierbaren main () -Methode, mit der mit der Anzahl der Dateien, der Dateigröße und dem Grad der Parallelität gespielt werden kann. Beachten Sie, dass die Größe der Dateien plus plus 20% variiert. Dies dient dazu, Auswirkungen zu vermeiden, da alle Dateien genau dieselbe Größe haben.

rawParse

public void rawParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    overrunCount = 0;
    final int dl = (int) ';';
    StringBuffer lineBuffer = new StringBuffer(1024);
    for (int f=0; f<numberOfFiles; f++) {
        File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        FileInputStream fin = new FileInputStream(fl);
        BufferedInputStream bin = new BufferedInputStream(fin);
        int character;
        while((character=bin.read())!=-1) {
            if (character==dl) {

                // Here is where something is done with each line
                doSomethingWithRawLine(lineBuffer.toString());
                lineBuffer.setLength(0);
            }
            else {
                lineBuffer.append((char) character);
            }
        }
        bin.close();
        fin.close();
    }
}

public final void doSomethingWithRawLine(String line) throws ParseException {
    // What to do for each line
    int fieldNumber = 0;
    final int len = line.length();
    StringBuffer fieldBuffer = new StringBuffer(256);
    for (int charPos=0; charPos<len; charPos++) {
        char c = line.charAt(charPos);
        if (c==DL0) {
            String fieldValue = fieldBuffer.toString();
            if (fieldValue.length()>0) {
                switch (fieldNumber) {
                    case 0:
                        Date dt = fmt.parse(fieldValue);
                        fieldNumber++;
                        break;
                    case 1:
                        double d = Double.parseDouble(fieldValue);
                        fieldNumber++;
                        break;
                    case 2:
                        int t = Integer.parseInt(fieldValue);
                        fieldNumber++;
                        break;
                    case 3:
                        if (fieldValue.equals("overrun"))
                            overrunCount++;
                        break;
                }
            }
            fieldBuffer.setLength(0);
        }
        else {
            fieldBuffer.append(c);
        }
    }
}

lineReaderParse

public void lineReaderParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    String line;
    for (int f=0; f<numberOfFiles; f++) {
        File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        FileReader frd = new FileReader(fl);
        BufferedReader brd = new BufferedReader(frd);

        while ((line=brd.readLine())!=null)
            doSomethingWithLine(line);
        brd.close();
        frd.close();
    }
}

public final void doSomethingWithLine(String line) throws ParseException {
    // Example of what to do for each line
    String[] fields = line.split(";");
    Date dt = fmt.parse(fields[0]);
    double d = Double.parseDouble(fields[1]);
    int t = Integer.parseInt(fields[2]);
    if (fields[3].equals("overrun"))
        overrunCount++;
}

lineReaderParseParallel

public void lineReaderParseParallel(final String targetDir, final int numberOfFiles, final int degreeOfParalelism) throws IOException, ParseException, InterruptedException {
    Thread[] pool = new Thread[degreeOfParalelism];
    int batchSize = numberOfFiles / degreeOfParalelism;
    for (int b=0; b<degreeOfParalelism; b++) {
        pool[b] = new LineReaderParseThread(targetDir, b*batchSize, b*batchSize+b*batchSize);
        pool[b].start();
    }
    for (int b=0; b<degreeOfParalelism; b++)
        pool[b].join();
}

class LineReaderParseThread extends Thread {

    private String targetDir;
    private int fileFrom;
    private int fileTo;
    private DateFormat fmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
    private int overrunCounter = 0;

    public LineReaderParseThread(String targetDir, int fileFrom, int fileTo) {
        this.targetDir = targetDir;
        this.fileFrom = fileFrom;
        this.fileTo = fileTo;
    }

    private void doSomethingWithTheLine(String line) throws ParseException {
        String[] fields = line.split(DL);
        Date dt = fmt.parse(fields[0]);
        double d = Double.parseDouble(fields[1]);
        int t = Integer.parseInt(fields[2]);
        if (fields[3].equals("overrun"))
            overrunCounter++;
    }

    @Override
    public void run() {
        String line;
        for (int f=fileFrom; f<fileTo; f++) {
            File fl = new File(targetDir+filenamePreffix+String.valueOf(f)+".txt");
            try {
            FileReader frd = new FileReader(fl);
            BufferedReader brd = new BufferedReader(frd);
            while ((line=brd.readLine())!=null) {
                doSomethingWithTheLine(line);
            }
            brd.close();
            frd.close();
            } catch (IOException | ParseException ioe) { }
        }
    }
}

nioFilesParse

public void nioFilesParse(final String targetDir, final int numberOfFiles) throws IOException, ParseException {
    for (int f=0; f<numberOfFiles; f++) {
        Path ph = Paths.get(targetDir+filenamePreffix+String.valueOf(f)+".txt");
        Consumer<String> action = new LineConsumer();
        Stream<String> lines = Files.lines(ph);
        lines.forEach(action);
        lines.close();
    }
}


class LineConsumer implements Consumer<String> {

    @Override
    public void accept(String line) {

        // What to do for each line
        String[] fields = line.split(DL);
        if (fields.length>1) {
            try {
                Date dt = fmt.parse(fields[0]);
            }
            catch (ParseException e) {
            }
            double d = Double.parseDouble(fields[1]);
            int t = Integer.parseInt(fields[2]);
            if (fields[3].equals("overrun"))
                overrunCount++;
        }
    }
}

nioAsyncParse

public void nioAsyncParse(final String targetDir, final int numberOfFiles, final int numberOfThreads, final int bufferSize) throws IOException, ParseException, InterruptedException {
    ScheduledThreadPoolExecutor pool = new ScheduledThreadPoolExecutor(numberOfThreads);
    ConcurrentLinkedQueue<ByteBuffer> byteBuffers = new ConcurrentLinkedQueue<ByteBuffer>();

    for (int b=0; b<numberOfThreads; b++)
        byteBuffers.add(ByteBuffer.allocate(bufferSize));

    for (int f=0; f<numberOfFiles; f++) {
        consumerThreads.acquire();
        String fileName = targetDir+filenamePreffix+String.valueOf(f)+".txt";
        AsynchronousFileChannel channel = AsynchronousFileChannel.open(Paths.get(fileName), EnumSet.of(StandardOpenOption.READ), pool);
        BufferConsumer consumer = new BufferConsumer(byteBuffers, fileName, bufferSize);
        channel.read(consumer.buffer(), 0l, channel, consumer);
    }
    consumerThreads.acquire(numberOfThreads);
}


class BufferConsumer implements CompletionHandler<Integer, AsynchronousFileChannel> {

        private ConcurrentLinkedQueue<ByteBuffer> buffers;
        private ByteBuffer bytes;
        private String file;
        private StringBuffer chars;
        private int limit;
        private long position;
        private DateFormat frmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");

        public BufferConsumer(ConcurrentLinkedQueue<ByteBuffer> byteBuffers, String fileName, int bufferSize) {
            buffers = byteBuffers;
            bytes = buffers.poll();
            if (bytes==null)
                bytes = ByteBuffer.allocate(bufferSize);

            file = fileName;
            chars = new StringBuffer(bufferSize);
            frmt = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss");
            limit = bufferSize;
            position = 0l;
        }

        public ByteBuffer buffer() {
            return bytes;
        }

        @Override
        public synchronized void completed(Integer result, AsynchronousFileChannel channel) {

            if (result!=-1) {
                bytes.flip();
                final int len = bytes.limit();
                int i = 0;
                try {
                    for (i = 0; i < len; i++) {
                        byte by = bytes.get();
                        if (by=='\n') {
                            // ***
                            // The code used to process the line goes here
                            chars.setLength(0);
                        }
                        else {
                                chars.append((char) by);
                        }
                    }
                }
                catch (Exception x) {
                    System.out.println(
                        "Caught exception " + x.getClass().getName() + " " + x.getMessage() +
                        " i=" + String.valueOf(i) + ", limit=" + String.valueOf(len) +
                        ", position="+String.valueOf(position));
                }

                if (len==limit) {
                    bytes.clear();
                    position += len;
                    channel.read(bytes, position, channel, this);
                }
                else {
                    try {
                        channel.close();
                    }
                    catch (IOException e) {
                    }
                    consumerThreads.release();
                    bytes.clear();
                    buffers.add(bytes);
                }
            }
            else {
                try {
                    channel.close();
                }
                catch (IOException e) {
                }
                consumerThreads.release();
                bytes.clear();
                buffers.add(bytes);
            }
        }

        @Override
        public void failed(Throwable e, AsynchronousFileChannel channel) {
        }
};

VOLLSTÄNDIG LAUFBARE UMSETZUNG ALLER FÄLLE

https://github.com/sergiomt/javaiobenchmark/blob/master/FileReadBenchmark.java

Serg M Ten
quelle
24

Hier sind die drei funktionierenden und getesteten Methoden:

Verwenden von BufferedReader

package io;
import java.io.*;
public class ReadFromFile2 {
    public static void main(String[] args)throws Exception {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        BufferedReader br = new BufferedReader(new FileReader(file));
        String st;
        while((st=br.readLine()) != null){
            System.out.println(st);
        }
    }
}

Verwenden von Scanner

package io;

import java.io.File;
import java.util.Scanner;

public class ReadFromFileUsingScanner {
    public static void main(String[] args) throws Exception {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        Scanner sc = new Scanner(file);
        while(sc.hasNextLine()){
            System.out.println(sc.nextLine());
        }
    }
}

Verwenden von FileReader

package io;
import java.io.*;
public class ReadingFromFile {

    public static void main(String[] args) throws Exception {
        FileReader fr = new FileReader("C:\\Users\\pankaj\\Desktop\\test.java");
        int i;
        while ((i=fr.read()) != -1){
            System.out.print((char) i);
        }
    }
}

Lesen Sie die gesamte Datei ohne Schleife mit der ScannerKlasse

package io;

import java.io.File;
import java.io.FileNotFoundException;
import java.util.Scanner;

public class ReadingEntireFileWithoutLoop {

    public static void main(String[] args) throws FileNotFoundException {
        File file = new File("C:\\Users\\pankaj\\Desktop\\test.java");
        Scanner sc = new Scanner(file);
        sc.useDelimiter("\\Z");
        System.out.println(sc.next());
    }
}
Pankaj
quelle
1
Wie kann ein Pfad angegeben werden, wenn die Ordner im Projekt vorhanden sind?
Kavipriya
2
Was ist mit java.nio.file.Files? Wir können jetzt nur verwenden readAllLines, readAllBytesund lines.
Claude Martin
21

Die darin enthaltenen Methoden org.apache.commons.io.FileUtilskönnen auch sehr praktisch sein, z.

/**
 * Reads the contents of a file line by line to a List
 * of Strings using the default encoding for the VM.
 */
static List readLines(File file)
Claude
quelle
Wenn Sie Guava (eine modernere, aktiv gewartete Bibliothek) bevorzugen , verfügt die Datei " Files" über ähnliche Dienstprogramme . Einfache Beispiele in dieser Antwort .
Jonik
1
Oder Sie verwenden einfach die integrierte Methode, um alle Zeilen
abzurufen
Link auf Apache Commons scheint tot zu sein.
Kebs
17

Was möchten Sie mit dem Text machen? Ist die Datei klein genug, um in den Speicher zu passen? Ich würde versuchen, den einfachsten Weg zu finden, um die Datei für Ihre Bedürfnisse zu handhaben. Die FileUtils-Bibliothek ist dafür sehr gut geeignet.

for(String line: FileUtils.readLines("my-text-file"))
    System.out.println(line);
Peter Lawrey
quelle
2
Es ist auch in Java 7 integriert: docs.oracle.com/javase/7/docs/api/java/nio/file/…
kritzikratzi
@ PeterLawrey bedeutet wahrscheinlich org.apache.commons.io.FileUtils. Der Google-Link kann den Inhalt im Laufe der Zeit ändern, da sich die am weitesten verbreitete Bedeutung ändert. Dies entspricht jedoch seiner Abfrage und sieht korrekt aus.
Palec
2
Leider gibt es heutzutage keine readLines(String)und readLines(File)wird zugunsten von veraltet readLines(File, Charset). Die Codierung kann auch als Zeichenfolge angegeben werden.
Palec
12

Ich habe 15 Möglichkeiten zum Lesen einer Datei in Java dokumentiert und sie dann mit verschiedenen Dateigrößen auf Geschwindigkeit getestet - von 1 KB bis 1 GB. Hier sind die drei wichtigsten Möglichkeiten, dies zu tun:

  1. java.nio.file.Files.readAllBytes()

    Getestet für Java 7, 8 und 9.

    import java.io.File;
    import java.io.IOException;
    import java.nio.file.Files;
    
    public class ReadFile_Files_ReadAllBytes {
      public static void main(String [] pArgs) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        File file = new File(fileName);
    
        byte [] fileBytes = Files.readAllBytes(file.toPath());
        char singleChar;
        for(byte b : fileBytes) {
          singleChar = (char) b;
          System.out.print(singleChar);
        }
      }
    }
  2. java.io.BufferedReader.readLine()

    Getestet für Java 7, 8, 9.

    import java.io.BufferedReader;
    import java.io.FileReader;
    import java.io.IOException;
    
    public class ReadFile_BufferedReader_ReadLine {
      public static void main(String [] args) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        FileReader fileReader = new FileReader(fileName);
    
        try (BufferedReader bufferedReader = new BufferedReader(fileReader)) {
          String line;
          while((line = bufferedReader.readLine()) != null) {
            System.out.println(line);
          }
        }
      }
    }
  3. java.nio.file.Files.lines()

    Dies wurde getestet, um in Java 8 und 9 zu funktionieren, funktioniert jedoch aufgrund der Lambda-Ausdrucksanforderung nicht in Java 7.

    import java.io.File;
    import java.io.IOException;
    import java.nio.file.Files;
    import java.util.stream.Stream;
    
    public class ReadFile_Files_Lines {
      public static void main(String[] pArgs) throws IOException {
        String fileName = "c:\\temp\\sample-10KB.txt";
        File file = new File(fileName);
    
        try (Stream linesStream = Files.lines(file.toPath())) {
          linesStream.forEach(line -> {
            System.out.println(line);
          });
        }
      }
    }
Gomisha
quelle
9

Im Folgenden finden Sie einen Einzeiler, wie Sie dies auf Java 8-Weise tun können. Angenommen, die text.txtDatei befindet sich im Stammverzeichnis des Projektverzeichnisses der Eclipse.

Files.lines(Paths.get("text.txt")).collect(Collectors.toList());
Zeus
quelle
7

Verwenden von BufferedReader:

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;

BufferedReader br;
try {
    br = new BufferedReader(new FileReader("/fileToRead.txt"));
    try {
        String x;
        while ( (x = br.readLine()) != null ) {
            // Printing out each line in the file
            System.out.println(x);
        }
    }
    catch (IOException e) {
        e.printStackTrace();
    }
}
catch (FileNotFoundException e) {
    System.out.println(e);
    e.printStackTrace();
}
Neo
quelle
7

Dies ist im Grunde genau das Gleiche wie die Antwort von Jesus Ramos, außer dass File anstelle von FileReader plus Iteration verwendet wird, um den Inhalt der Datei zu durchlaufen.

Scanner in = new Scanner(new File("filename.txt"));

while (in.hasNext()) { // Iterates each line in the file
    String line = in.nextLine();
    // Do something with line
}

in.close(); // Don't forget to close resource leaks

... wirft FileNotFoundException

ThisClark
quelle
3
File vs FileReader: Bei einem FileReader muss die Datei vorhanden sein und die Betriebssystemberechtigungen müssen den Zugriff ermöglichen. Mit einer Datei ist es möglich, diese Berechtigungen zu testen oder zu überprüfen, ob es sich bei der Datei um ein Verzeichnis handelt. Die Datei hat nützliche Funktionen: isFile (), isDirectory (), listFiles (), canExecute (), canRead (), canWrite (), existiert (), mkdir (), delete (). File.createTempFile () schreibt in das temporäre Standardverzeichnis des Systems. Diese Methode gibt ein Dateiobjekt zurück, das zum Öffnen von FileOutputStream-Objekten usw. verwendet werden kann. Quelle
ThisClark
7

Die gepufferten Stream-Klassen sind in der Praxis viel leistungsfähiger, so dass die NIO.2-API Methoden enthält, die diese Stream-Klassen speziell zurückgeben, teilweise um Sie zu ermutigen, immer gepufferte Streams in Ihrer Anwendung zu verwenden.

Hier ist ein Beispiel:

Path path = Paths.get("/myfolder/myfile.ext");
try (BufferedReader reader = Files.newBufferedReader(path)) {
    // Read from the stream
    String currentLine = null;
    while ((currentLine = reader.readLine()) != null)
        //do your code here
} catch (IOException e) {
    // Handle file I/O exception...
}

Sie können diesen Code ersetzen

BufferedReader reader = Files.newBufferedReader(path);

mit

BufferedReader br = new BufferedReader(new FileReader("/myfolder/myfile.ext"));

Ich empfehle diesen Artikel, um die Hauptanwendungen von Java NIO und IO zu lernen.

Imar
quelle
6

Wahrscheinlich nicht so schnell wie bei gepufferten E / A, aber ziemlich knapp:

    String content;
    try (Scanner scanner = new Scanner(textFile).useDelimiter("\\Z")) {
        content = scanner.next();
    }

Das \ZMuster gibt an, Scannerdass das Trennzeichen EOF ist.

David Soroko
quelle
1
Eine sehr verwandte, bereits existierende Antwort stammt von Jesus Ramos.
Palec
1
if(scanner.hasNext()) content = scanner.next();
Richtig
1
Dies schlägt für mich unter Android 4.4 fehl. Es werden nur 1024 Bytes gelesen. YMMV.
Roger Keays
3

Ich sehe es noch nicht in den anderen Antworten erwähnt. Wenn "Best" jedoch Geschwindigkeit bedeutet, bietet die neue Java-E / A (NIO) möglicherweise die schnellste Leistung, ist jedoch für Lernende nicht immer am einfachsten herauszufinden.

http://download.oracle.com/javase/tutorial/essential/io/file.html

jzd
quelle
Sie sollten angegeben haben, wie es gemacht wird und keinen Link geben, dem Sie folgen sollen
Orar
3

Der einfachste Weg, Daten aus einer Datei in Java zu lesen, besteht darin, die Datei- Klasse zum Lesen der Datei und die Scanner- Klasse zum Lesen des Inhalts der Datei zu verwenden.

public static void main(String args[])throws Exception
{
   File f = new File("input.txt");
   takeInputIn2DArray(f);
}

public static void takeInputIn2DArray(File f) throws Exception
{
    Scanner s = new Scanner(f);
    int a[][] = new int[20][20];
    for(int i=0; i<20; i++)
    {
        for(int j=0; j<20; j++)
        {
            a[i][j] = s.nextInt();
        }
    }
}

PS: Vergiss nicht, java.util zu importieren. *; damit der Scanner funktioniert.

anadir47
quelle
2

Guave bietet hierfür einen Einzeiler:

import com.google.common.base.Charsets;
import com.google.common.io.Files;

String contents = Files.toString(filePath, Charsets.UTF_8);
rahul mehra
quelle
2

Dies ist möglicherweise nicht die genaue Antwort auf die Frage. Es ist nur eine andere Möglichkeit, eine Datei zu lesen, bei der Sie den Pfad zu Ihrer Datei in Ihrem Java-Code nicht explizit angeben und ihn stattdessen als Befehlszeilenargument lesen.

Mit dem folgenden Code:

import java.io.BufferedReader;
import java.io.InputStreamReader;
import java.io.IOException;

public class InputReader{

    public static void main(String[] args)throws IOException{
        BufferedReader br = new BufferedReader(new InputStreamReader(System.in));
        String s="";
        while((s=br.readLine())!=null){
            System.out.println(s);
        }
    }
}

Führen Sie es einfach aus mit:

java InputReader < input.txt

Dies würde den Inhalt der lesen input.txt und auf Ihrer Konsole drucken.

Sie können auch festlegen, dass Sie System.out.println()über die Befehlszeile wie folgt in eine bestimmte Datei schreiben:

java InputReader < input.txt > output.txt

Dies würde lesen input.txtund schreiben output.txt.

Stollen Sie A. Pillai
quelle
2

Sie können readAllLines und die joinMethode verwenden, um den gesamten Dateiinhalt in einer Zeile abzurufen :

String str = String.join("\n",Files.readAllLines(Paths.get("e:\\text.txt")));

Standardmäßig wird die UTF-8-Codierung verwendet, mit der ASCII-Daten korrekt gelesen werden.

Sie können auch readAllBytes verwenden:

String str = new String(Files.readAllBytes(Paths.get("e:\\text.txt")), StandardCharsets.UTF_8);

Ich denke, readAllBytes ist schneller und präziser, weil es keine neue Zeile durch ersetzt \nund auch keine neue Zeile sein kann \r\n. Es hängt von Ihren Bedürfnissen ab, welches geeignet ist.

Mostafa Vatanpour
quelle
1

Verwenden Sie für JSF-basierte Maven-Webanwendungen einfach ClassLoader und den ResourcesOrdner, um eine beliebige Datei einzulesen:

  1. Legen Sie eine beliebige Datei, die Sie lesen möchten, in den Ordner Ressourcen.
  2. Fügen Sie die Apache Commons IO-Abhängigkeit in Ihr POM ein:

    <dependency>
        <groupId>org.apache.commons</groupId>
        <artifactId>commons-io</artifactId>
        <version>1.3.2</version>
    </dependency>
  3. Verwenden Sie den folgenden Code, um ihn zu lesen (z. B. liest er eine .json-Datei ein):

    String metadata = null;
    FileInputStream inputStream;
    try {
    
        ClassLoader loader = Thread.currentThread().getContextClassLoader();
        inputStream = (FileInputStream) loader
                .getResourceAsStream("/metadata.json");
        metadata = IOUtils.toString(inputStream);
        inputStream.close();
    }
    catch (FileNotFoundException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }
    return metadata;

Sie können dies auch für Textdateien, Eigenschaftendateien, XSD- Schemas usw. tun .

Fuzzy-Analyse
quelle
Sie können dies nicht für "jede gewünschte Datei" verwenden. Sie können es nur für Ressourcen verwenden, die in die JAR- oder WAR-Datei gepackt wurden.
Marquis von Lorne
1

Kakteen geben Ihnen einen deklarativen Einzeiler :

new TextOf(new File("a.txt")).asString();
yegor256
quelle
0

Verwenden Sie Java Kiss, wenn es um die Einfachheit der Struktur geht:

import static kiss.API.*;

class App {
  void run() {
    String line;
    try (Close in = inOpen("file.dat")) {
      while ((line = readLine()) != null) {
        println(line);
      }
    }
  }
}
Warren MacEvoy
quelle
0
import java.util.stream.Stream;
import java.nio.file.*;
import java.io.*;

class ReadFile {

 public static void main(String[] args) {

    String filename = "Test.txt";

    try(Stream<String> stream = Files.lines(Paths.get(filename))) {

          stream.forEach(System.out:: println);

    } catch (IOException e) {

        e.printStackTrace();
    }

 }

 }

Verwenden Sie einfach Java 8 Stream.

Archit Bhadauria
quelle
0
try {
  File f = new File("filename.txt");
  Scanner r = new Scanner(f);  
  while (r.hasNextLine()) {
    String data = r.nextLine();
    JOptionPane.showMessageDialog(data);
  }
  r.close();
} catch (FileNotFoundException ex) {
  JOptionPane.showMessageDialog("Error occurred");
  ex.printStackTrace();
}
Fridjato Teil Fridjat
quelle
0

Die intuitivste Methode wird in Java 11 eingeführt Files.readString

import java.io.*;
import java.nio.file.Files;
import java.nio.file.Paths;

public class App {
    public static void main(String args[]) throws IOException {
        String content = Files.readString(Paths.get("D:\\sandbox\\mvn\\my-app\\my-app.iml"));
        System.out.print(content);
    }
}

PHP hat diesen Luxus von vor Jahrzehnten! ☺

PHPst
quelle
-3

Dieser von mir programmierte Code ist für sehr große Dateien viel schneller:

public String readDoc(File f) {
    String text = "";
    int read, N = 1024 * 1024;
    char[] buffer = new char[N];

    try {
        FileReader fr = new FileReader(f);
        BufferedReader br = new BufferedReader(fr);

        while(true) {
            read = br.read(buffer, 0, N);
            text += new String(buffer, 0, read);

            if(read < N) {
                break;
            }
        }
    } catch(Exception ex) {
        ex.printStackTrace();
    }

    return text;
}
Juan Carlos Kuri Pinto
quelle
10
Viel schneller, ich bezweifle es, wenn Sie einfache String-Verkettung anstelle eines StringBuilder verwenden ...
PhiLho
6
Ich denke, der Hauptgeschwindigkeitsgewinn ergibt sich aus dem Einlesen von 1 MB (1024 * 1024) Blöcken. Sie können dies jedoch auch einfach tun, indem Sie 1024 * 1024 als zweites Argument an den BufferedReader-Konstruktor übergeben.
gb96
3
Ich glaube nicht, dass dies überhaupt getestet wird. Wenn Sie +=auf diese Weise verwenden, erhalten Sie eine quadratische (!) Komplexität für eine Aufgabe, die linear komplex sein sollte. Dadurch wird nach Dateien über einige MB gecrawlt. Um dies zu umgehen, sollten Sie entweder die Textblöcke in einer Liste <string> aufbewahren oder den oben genannten Stringbuilder verwenden.
kritzikratzi
5
Viel schneller als was? Es ist mit Sicherheit nicht schneller als das Anhängen an einen StringBuffer. -1
Marquis von Lorne
1
@ gb96 Ich dachte dasselbe über Puffergrößen, aber das detaillierte Experiment in dieser Frage ergab überraschende Ergebnisse in einem ähnlichen Kontext: Ein 16-KB-Puffer war konsistent und merklich schneller.
Chiastic-Sicherheit
-3
String fileName = 'yourFileFullNameWithPath';
File file = new File(fileName); // Creates a new file object for your file
FileReader fr = new FileReader(file);// Creates a Reader that you can use to read the contents of a file read your file
BufferedReader br = new BufferedReader(fr); //Reads text from a character-input stream, buffering characters so as to provide for the efficient reading of characters, arrays, and lines.

Der obige Satz von Zeilen kann in eine einzelne Zeile geschrieben werden als:

BufferedReader br = new BufferedReader(new FileReader("file.txt")); // Optional

Hinzufügen zum String Builder (Wenn Ihre Datei sehr groß ist, wird empfohlen, den String Builder zu verwenden, andernfalls verwenden Sie ein normales String-Objekt.)

try {
        StringBuilder sb = new StringBuilder();
        String line = br.readLine();

        while (line != null) {
        sb.append(line);
        sb.append(System.lineSeparator());
        line = br.readLine();
        }
        String everything = sb.toString();
        } finally {
        br.close();
    }
Vaibhav Rai
quelle