Ich kenne du -sh
in gängigen Linux-Dateisystemen. Aber wie geht das mit HDFS?
hadoop
command-line
directory
hdfs
Cheng
quelle
quelle
hadoop fs -du -s -h /path/to/dir
Zeigt die Größe eines Verzeichnisses in lesbarer Form an.quelle
hdfs -du -s -h /path/to/dir
dies besser geeignet.Der Befehl kann bis zu Apache Hadoop 3.0.0 auf Matt D und andere Antworten ausgedehnt werden
Das du gibt drei Spalten mit dem folgenden Format zurück:
Beispielbefehl:
Exit Code: Gibt bei Erfolg 0 und bei Fehler -1 zurück.
Quelle: Apache doc
quelle
Damit erhalten Sie Größe in GB
quelle
Beim Versuch, die Summe einer bestimmten Gruppe von Dateien in einem Verzeichnis zu berechnen,
-s
funktioniert die Option nicht (in Hadoop 2.7.1). Beispielsweise:Verzeichnisaufbau:
Angenommen, jede Datei ist 1 KB groß. Sie können das gesamte Verzeichnis zusammenfassen mit:
Wenn ich jedoch die Summe aller Dateien mit "count" möchte, ist der Befehl nicht ausreichend.
Um dies zu umgehen, leite ich die Ausgabe normalerweise durch awk.
quelle
Um die Größe des Verzeichnisses zu ermitteln, kann hdfs dfs -du -s -h / $ yourDirectoryName verwendet werden. Mit hdfs dfsadmin -report kann ein schneller Speicherbericht auf Clusterebene angezeigt werden.
quelle
% des verwendeten Speicherplatzes im Hadoop-Cluster
sudo -u hdfs hadoop fs –df
Kapazität unter einem bestimmten Ordner:
sudo -u hdfs hadoop fs -du -h /user
quelle
hadoop fs -du -h /user
(ich musste es nicht benutzensudo
)sudo
wird nicht benötigt und sollte sparsam eingesetzt werden.Hadoop Version 2.3.33:
quelle
hdfs dfs -count <dir>
Infos von der Manpage:
quelle
Befehl sollte sein
hadoop fs -du -s -h \dirPath
-du [-s] [-h] ...: Zeigt den Speicherplatz in Byte an, der von den Dateien verwendet wird, die dem angegebenen Dateimuster entsprechen.
-s : Anstatt die Größe jeder einzelnen Datei anzuzeigen, die dem
Muster entspricht, wird die Gesamtgröße (Zusammenfassung) angezeigt.
-h : Formatiert die Größe von Dateien auf lesbare Weise und nicht in Anzahl von Bytes. (Ex MB / GB / TB usw.)
Beachten Sie, dass auch ohne die Option -s Größenzusammenfassungen nur eine Ebene tief in einem Verzeichnis angezeigt werden.
Die Ausgabe erfolgt im Namen der Formulargröße (vollständiger Pfad).
quelle