Als «hadoop» getaggte Fragen

Hadoop ist eine Open-Source-Lösung für die Bereitstellung eines verteilten / replizierten Dateisystems, eines Systems zur Kartenreduzierung in Produktionsqualität, und verfügt über eine Reihe ergänzender Ergänzungen wie Hive, Pig und HBase, um mehr aus einem Hadoop-basierten Cluster herauszuholen.

28
Was ist Hadoop und wofür wird es angewendet? [geschlossen]

Ich lese seit einiger Zeit gerne ServerFault und bin auf einige Themen in Hadoop gestoßen. Ich hatte ein wenig Probleme herauszufinden, was es aus globaler Sicht macht. Meine Frage ist also ganz einfach: Was ist Hadoop? Was tut es ? Was wird es verwendet ? Warum tritt es in den Arsch? Bearbeiten:...

9
Beste Wahl für die NTP-Client-Konfiguration

Mal sehen, ob jemand ein bisschen Licht auf dieses Thema werfen kann. Ich mache in den nächsten Tagen eine Serverinstallation. Mein Client möchte einen Hortonworks HDP mit 2 Servern als Master-Server und 5 Worker-Servern bereitstellen. Eine der Anforderungen für alle ist die NTP-Aktivierung. Aber...

7
Ist es möglich, 20 TB Daten mit MySQL zu verwalten?

Ich arbeite in einem Projekt und meine Aufgabe ist es, ein Datenbanksystem aufzubauen, um ungefähr 60.000.000.000 Dateneinträge zu verwalten. Der Hintergrund des Projekts ist, dass ich für eine große Anzahl von Nachrichten, die jede Sekunde von etwa 30.000 RFID-Lesegeräten gelesen werden,...

7
Hadoop HDFS Backup & DR Strategie

Wir bereiten die Implementierung unseres ersten Hadoop-Clusters vor. Als solches beginnen wir klein mit einem Vier-Knoten-Setup. (1 Hauptknoten und 3 Arbeitsknoten) Jeder Knoten verfügt über 6 TB Speicher. (6 x 1 TB Festplatten) Wir haben uns für ein SuperMicro 4-Knoten-Gehäuse entschieden, sodass...