Ich habe mir kürzlich ein großartiges Computerphile-Video über Passwörter angesehen, in dem Mike Pound damit prahlt, dass sein Supercomputer 4 Grafikkarten hat (um genau zu sein Titan X).
Als Liebhaber der numerischen Simulation träume ich davon, einen Desktop ausschließlich für die Simulationsarbeit zu bauen. Warum misst Mike Pound die Rechenleistung seines Computers an den Grafikkarten und nicht an den Prozessoren? Wenn ich einen Computer baue, welchen Gegenstand sollte ich mehr interessieren?
Antworten:
Offensichtlich schätzt Mike Pound die Rechenleistung der Grafikkarten höher als die Rechenleistung der CPUs.
Warum? Eine Grafikkarte besteht im Wesentlichen aus VIELEN vereinfachten Prozessoren, die alle parallel laufen. Für einige Simulationsarbeiten kann ein Großteil der Berechnung auf den Tausenden von in den Grafikkarten verfügbaren Kernen problemlos parallelisiert und verarbeitet werden, wodurch die Gesamtverarbeitungszeit verkürzt wird.
Welchen Gegenstand sollte ich mehr interessieren? Es hängt wirklich von der Workload ab, die Sie interessiert, und wie diese Workload für die Verwendung auf einer Grafikkarte parallelisiert werden kann / kann. Wenn Ihre Arbeitslast eine peinlich parallele Folge einfacher Berechnungen ist und die Software so entwickelt wurde, dass sie die verfügbaren Grafikkarten nutzt, haben mehr Grafikkarten eine weitaus größere Auswirkung auf die Leistung als mehr CPUs (Dollar für Dollar).
quelle
Besuchen Sie https://developer.nvidia.com/cuda-zone (und google cuda nvidia für weitere Informationen). Die Cuda-Architektur und High-End-Grafikkarten sind für Desktop-Supercomputer weit verbreitet. Normalerweise können Sie eine Mehrfach-Tflop-Box für weniger als 10.000 US-Dollar mit handelsüblichen Whitebox-Komponenten zusammenstellen.
So...
... Cuda ist mit Abstand das beste Spiel der Stadt für dich. Versuchen Sie es vielleicht noch einmal unter /scicomp// oder auf einer anderen Stackexchange-Website, die direkter mit solchen Dingen zu tun hat.
(Übrigens, ich gehe davon aus, dass Sie mit der Idee, dass es sich hier um massiv parallele Programmierung handelt, einverstanden sind. Daher müssen Sie sich möglicherweise mit diesem Paradigma für das Algorithmus-Design vertraut machen.)
quelle
Aus praktischer Sicht sollten Sie dem Motherboard und der CPU angesichts der relativen Schwierigkeit des Upgrades im Vergleich zur GPU wahrscheinlich einiges Aufmerksamkeit schenken. Nach dem Kauf ist eine schreckliche Zeit, um festzustellen, dass Sie nicht genug Platz für vier GPUs oder einen schnell genug arbeitenden Prozessor haben, um sie alle zu beschäftigen.
Sie sollten sich auch bewusst sein, dass die GPU-Leistung am häufigsten in FLOPs mit einfacher Genauigkeit angegeben wird und bei doppelter Genauigkeit erheblich abnimmt. Wenn Sie die zusätzliche Präzision in Ihren Simulationen benötigen, werden Sie deutlich unter der angegebenen Geschwindigkeit enden.
Auf zu den Software-Engineering-Rennen
Unter dem Gesichtspunkt der Software gibt es zwei Hauptprobleme: den Von Neumann-Engpass und das Programmiermodell. Die CPU hat einen recht guten Zugriff auf den Hauptspeicher, die GPU verfügt über viel schnelleren Arbeitsspeicher. Es ist nicht unbekannt, dass das Verschieben von Daten in und aus der GPU einen Geschwindigkeitsgewinn vollständig zunichte macht. Im Allgemeinen ist die CPU ein Gewinner bei moderaten Berechnungen für große Datenmengen, während die GPU bei umfangreichen Berechnungen für kleinere Datenmengen eine herausragende Rolle spielt. All dies bringt uns zum Programmiermodell.
Auf hoher Ebene ist das Problem die altehrwürdige MIMD / SIMD-Debatte. Multiple-Instruction / Multiple-Data-Systeme waren die großen Gewinner im allgemeinen und kommerziellen Computing. In diesem Modell, das den SMP enthält, führen mehrere Prozessoren jeweils ihren eigenen individuellen Befehlsstrom aus. Es ist das Computeräquivalent einer französischen Küche, in der Sie eine kleine Anzahl erfahrener Köche anweisen, relativ komplizierte Aufgaben zu erledigen.
Single-Instruction / Multiple-Data-Systeme ähneln dagegen eher einem riesigen Raum voller Angestellter, die an ihre Schreibtische gekettet sind und den Anweisungen eines Master-Controllers folgen. "Alle ADDIEREN die Zeilen 3 und 5!" Es wurde in seiner reinen Form in der ILLIAC und einigen "Mini-Super" -Systemen verwendet, ging aber auf dem Markt verloren. Aktuelle GPUs sind eng verwandt, flexibler, haben aber die gleiche allgemeine Philosophie.
Es kurz zusammenfassen:
quelle