Als «hive» getaggte Fragen

87
Parkett gegen ORC gegen ORC mit Snappy

Ich führe einige Tests mit den mit Hive verfügbaren Speicherformaten durch und verwende Parkett und ORC als Hauptoptionen. Ich habe ORC einmal mit Standardkomprimierung und einmal mit Snappy aufgenommen. Ich habe viele Dokumente gelesen, in denen angegeben ist, dass Parkett im Vergleich zu ORC...

84
Unterschied zwischen INNER JOIN und LEFT SEMI JOIN

Was ist der Unterschied zwischen einem INNER JOINund LEFT SEMI JOIN? Warum erhalte ich im folgenden Szenario zwei unterschiedliche Ergebnisse? Die INNER JOINErgebnismenge ist viel größer. Kann jemand erklären? Ich versuche, die Namen zu bekommen, die table_1nur in erscheinen table_2. SELECT name...

74
Python In-Memory-Zip-Bibliothek

Gibt es eine Python-Bibliothek, mit der Zip-Archive im Speicher bearbeitet werden können, ohne dass tatsächliche Festplattendateien verwendet werden müssen? In der ZipFile-Bibliothek können Sie das Archiv nicht aktualisieren. Die einzige Möglichkeit scheint darin zu bestehen, es in ein Verzeichnis...

8
Wie kann ich hive bitten, detailliertere Fehler anzugeben?

Wenn ich starte hive, wird der folgende Fehler angezeigt [hadoop@a74f90aecdad tmp]$ hive SLF4J: Class path contains multiple SLF4J bindings. SLF4J: Found binding in [jar:file:/hive/lib/log4j-slf4j-impl-2.10.0.jar!/org/slf4j/impl/StaticLoggerBinder.class] SLF4J: Found binding in