Die Frage ist, was meinst du mit Flops? Wenn Sie sich nur darum kümmern, wie viele der einfachsten Gleitkommaoperationen pro Takt ausgeführt werden, ist dies wahrscheinlich das Dreifache Ihrer Taktrate, aber das ist ungefähr so bedeutungslos wie Bogomips. Einige Gleitkommaoperationen benötigen viel Zeit (für den Anfang: Teilen), Addieren und Multiplizieren sind in der Regel schnell (eine pro fp-Einheit pro Takt). Das nächste Problem ist die Speicherleistung. Es gibt einen Grund, warum der letzte klassische CRAY 31 Speicherbänke hatte. Letztendlich ist die CPU-Leistung davon abhängig, wie schnell Sie lesen und in den Speicher schreiben können. In welchen Cache-Level passt Ihr Problem? Linpack war einst ein echter Benchmark, jetzt passt es in den Cache (L2, wenn nicht L1) und ist eher ein rein theoretischer CPU-Benchmark. Und natürlich können Ihre SSE-Einheiten (usw.) auch die Gleitkomma-Leistung verbessern.
Welche Distribution läufst du?
Dies sah nach einem guten Hinweis aus: http://linuxtoolkit.blogspot.com/2009/04/intel-optimized-linpack-benchmark-for.html
http://onemansjourneyintolinux.blogspot.com/2008/12/show-us-yer-flops.html
http://www.phoronix-test-suite.com/ ist möglicherweise eine einfachere Möglichkeit, einen Flops-Benchmark zu installieren.
Trotzdem frage ich mich, warum es dich interessiert, wofür du es verwendest? Wenn Sie nur eine bedeutungslose Zahl haben möchten, ist Ihr Systembogomip in dmesg immer noch genau richtig.
anscheinend gibt es ein "sysbench" -Benchmark-Paket und einen Befehl:
sudo apt-get install sysbench
(oderbrew install sysbench
OS X)führe es so aus:
sysbench --test=cpu --cpu-max-prime=20000 --num-threads=2 run
Ausgabe für Vergleiche:
Ref: http://www.midwesternmac.com/blogs/jeff-geerling/2013-vps-benchmarks-linode
quelle
Für Parkschätzungen:
Raspberry Pi 2 : 299,93 * 10 ^ 6 FLOPS ( Quelle )
Raspberry Pi 3: 462.07 * 10 ^ 6 FLOPS ( Quelle )
Linpack
cd benchmarks_2017/linux/mkl/benchmarks/linpack
./runme_xeon64
Auf einem Thinkpad T460p ( Intel i7-6700HQ CPU ) gibt es:
quelle
Ein Benchmark, der traditionell zur Messung von FLOPS verwendet wurde, ist Linpack. Ein weiterer gängiger FLOPS-Benchmark ist Whetstone.
Lesen Sie weiter: Der Wikipedia-Eintrag "FLOPS" , Whetstone-Eintrag , Linpack-Eintrag
quelle
Ich kann den sofort einsatzbereiten Linpack-Build von Intel nur empfehlen: http://software.intel.com/en-us/articles/intel-math-kernel-library-linpack-download/
quelle
Wie Sie bereits erwähnt haben, haben wir die HPCC-Suite verwendet . Das Einrichten und Einstellen ist etwas aufwändig, aber in unserem Fall war der Punkt nicht per se prahlerisch, sondern Teil der Akzeptanzkriterien für den Cluster. Einige Leistungsvergleiche sind meiner Meinung nach unerlässlich, um sicherzustellen, dass die Hardware wie angekündigt funktioniert, alles richtig verkabelt ist usw.
Wenn Sie nur eine theoretische Spitzen-FLOPS-Zahl wünschen, ist diese einfach. Lesen Sie einfach einen Artikel über die CPU (z. B. auf realworldtech.com oder ähnlichem), um Informationen darüber zu erhalten, wie viele DP-FLOPS ein CPU-Kern pro Taktzyklus ausführen kann (bei aktuellen x86-CPUs sind das in der Regel 4). Dann ist der Gesamtpeak FLOPS gerade
Anzahl der Kerne * FLOPS / Zyklus * Frequenz
Dann sollten Sie für einen Cluster mit IB-Netzwerk in der Lage sein, ungefähr 80% der Spitzen-FLOPS auf HPL zu erreichen (was übrigens einer der Benchmarks in HPCC ist).
quelle