Ubuntu Linux friert beim Laden mit mehreren Kernen vollständig ein

1

Ich habe ein Problem mit dem Einfrieren meines Computers, das ich nicht lösen konnte. Die Systemspezifikationen lauten wie folgt:

  • AMD FX6300
  • ASRock 970 Extreme3 ​​R2.0
  • 2x Kingston KHX1600C9D3 / 4GX
  • BeQuiet Straight Power 500W

Ich verwende Ubuntu 18.04 LTS. Sobald ich Aufgaben starte, die sowohl CPU- als auch RAM-intensiv sind, friert das gesamte System ein. Ich kann den Fehler leicht reproduzieren, indem ich einen OpenFOAM-Simulationsjob im Parallelmodus starte.

Normalerweise wird der Computer über SSH gesteuert. Sobald ich die Aufgabe starte, wird das System innerhalb von Sekunden, höchstens Minuten, unkontrollierbar. Außerdem werden Ping-Anforderungen von anderen Computern nicht mehr zurückgegeben, sobald das Einfrieren erfolgt. Zu Testzwecken habe ich das System mit einer GPU ausgestattet und festgestellt, dass ich keinen Absturz erleide, sondern ein komplettes System einfriert - der Bildschirm friert nur ein und ich kann keine Befehle über Tastatur oder Maus eingeben.

In Bezug auf die Fehlerbehebung habe ich bereits versucht:

  • Ausführen von Memtest - & gt; 4 läuft ohne Probleme
  • Testen Sie die RAM-Sticks einzeln in verschiedenen Steckplätzen
  • Kühlpaste erneut auf die CPU auftragen
  • GPU trennen

Syslog und Faillog haben auch nichts aufgedeckt.

Irgendwelche Ideen zur weiteren Fehlerbehebung?

Nascor
quelle
1
Überwachen / protokollieren Sie die Temperaturen? Entlüftungsöffnungen & amp; Fans sind alle sauber & amp; Arbeiten? Könnte man versuchen, die maximale CPU-Frequenz zu Testzwecken zu drosseln (wenn cpufreq-utils unterstützt werden, gibt es wahrscheinlich auch ein ähnliches Dienstprogramm)?
Xen2050
Die CPU-Temperaturen schienen in Ordnung zu sein (maximal bei ~ 60 ° C in prime95) Vor repasting) - die CPU-Drosselung klingt vernünftig, das probiere ich mal aus, danke!
Nascor
Stellen Sie die maximale CPU-Taktfrequenz auf 2,5 GHz ein und es kam bereits nach wenigen Sekunden zu einem Einfrieren von OpenFOAM auf drei Kernen. Daher scheinen weder Frequenz noch Temperatur einen Einfluss zu haben (ich bezweifle stark, dass nach 10 Sekunden Laufzeit höhere Temperaturen als ~ 20 ° C auftreten).
Nascor
Das ist ein Problem ... Ich würde einen anderen Kernel & amp versuchen; Verteilung, eine Live-ISO (USB / DVD) ist einfach zu machen & amp; auf dem Live-System installieren (wenn genügend RAM vorhanden ist) & amp; Prüfung. Vielleicht ein neueres / älteres Ubuntu oder Debian oder eine andere "Familie" wie opensuse, fedora usw. Die nächste Idee wäre die Stromversorgung
Xen2050