- Hauptplatine: GA-B85M-DS3H-A
- CPU: Core i5 4430
- RAM: PNY XLR8 DDR3 32 GB (4 x 8 GB) 1600 MHz (MD32768K4D3-1600-X9)
- Netzteil: EVGA 500 W1 80+
Das Problem
Wenn alle 32 GB RAM installiert sind, fällt MemTest86 + 6.2 durchgehend aus. Der Fehler tritt immer während des ersten Durchlaufs auf, und die Fehler steigen schnell zu den Millionen von Fehlern an. Der Versuch, Windows auszuführen, führt zu zufälligen Neustarts und Abbruchfehlern (wie bei RAM-Fehlern zu erwarten).
Was ich versucht habe
- Testen Sie ein einzelnes 8-GB-PNY-Modul in Sockel DIMM1. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie ein einzelnes 8-GB-PNY-Modul in Sockel DIMM2. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie ein einzelnes 8-GB-PNY-Modul in Sockel DIMM3. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie ein einzelnes 8-GB-PNY-Modul in Sockel DIMM4. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie alle vier 8-GB-PNY-DIMMs einzeln im Sockel DIMM1. Alle Module absolvieren erfolgreich 4 Durchgänge von MemTest.
- Testen Sie zwei 8-GB-PNY-Module in den Sockeln DIMM1 und DIMM2. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie zwei 8-GB-PNY-Module in den Sockeln DIMM3 und DIMM4. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Testen Sie das Motherboard mit vier 2-GB-DIMMs in allen Sockeln. Schließt 4 Durchgänge von MemTest erfolgreich ab.
- Tauschen Sie die Reihenfolge der PNY-DIMMs in den Sockeln aus. Keine Änderung - MemTest-Fehler treten weiterhin auf.
- Erhöhen Sie die RAM-Spannung der Hauptplatine von 1,5 V auf 1,65 V. Keine Änderung - MemTest-Fehler treten weiterhin auf.
- Spielen Sie mit verschiedenen Kombinationen der manuellen RAM-Einstellungen im Setup-Dienstprogramm - Aktivieren / Deaktivieren des XMP-Profils, Festlegen der Voreinstellung "Erhöhte Stabilität" usw. Keine Änderung, MemTest-Fehler treten weiterhin auf.
Ich denke, ich kann schlechtes RAM und schlechte RAM-Sockel sicher ausschließen. Die MemTest-Tests schlagen nur fehl, wenn alle vier 8-GB-Module gleichzeitig installiert sind.
Ich habe die Spannungen gemessen, die vom Netzteil kommen, und alles dort scheint stabil zu sein, auch wenn alle vier Sticks installiert sind.
Während ich dies schreibe, habe ich eine letzte Möglichkeit ausprobiert, die RAM-Geschwindigkeit im BIOS manuell auf 1066 MHz zu reduzieren. Bisher hat MemTest einen Durchgang absolviert und ist im zweiten fehlerfrei. (Alle oben genannten Tests wurden mit der nativen RAM-Geschwindigkeit von 1600 MHz durchgeführt.) Dadurch kann ich das System zwar mit etwas langsameren RAM-Geschwindigkeiten verwenden, dies scheint jedoch keine dauerhafte Lösung zu sein.
Wenn MemTest-Fehler auftreten, treten sie immer genau an der gleichen Position auf dem 64-Bit-Adressbus auf:
Bit Error Mask: 00000000FF000000
Außerdem treten NIEMALS Fehler unterhalb der 4-GB-Grenze auf. Mit anderen Worten, alle Fehler treten im Adressraum zwischen 4 GB und 32 GB auf.
Ich gehe davon aus, dass dies ein seltsames Interaktions- oder Timing-Problem mit der CPU und dem RAM sowie dem Motherboard ist, da die Fehler sehr konsistent sind, nur in einer bestimmten Konfiguration auftreten und durch Verlangsamung des RAM gemildert zu werden scheinen treten nur oberhalb der 4GB Barriere auf. Meine Frage ist: Ist es wahrscheinlicher, dass meine CPU oder mein Motherboard der Schuldige ist?
Ich hatte vor, diesen Computer auf einen Core i7-4790K zu aktualisieren. Wenn also die CPU der wahrscheinliche Schuldige ist (ich weiß, dass der Speichercontroller in diesen neueren Modellen auf der CPU ist), funktioniert dies gut, da ich ein Upgrade plane es trotzdem, aber ich frage mich, ob es eine Chance gibt, dass das Motherboard selbst auch Teil des Problems sein könnte. dh ich möchte nicht das Geld für die i7-CPU ausgeben, nur um genau das gleiche Problem zu haben und herauszufinden, dass ich auch das Motherboard ersetzen muss ...
Rat?
BEARBEITEN: Die langsamere RAM-Geschwindigkeit erzeugte immer noch Fehler, aber nur, wenn der Test den dritten Durchgang erreichte. Ich habe den Test mit nur einer aktiven CPU neu gestartet, um eine Interaktion auf der CPU selbst zu testen.
quelle
Antworten:
Dies hört sich nicht so an, als ob eine Komponente defekt wäre, sondern Sie verwenden eine inkompatible Kombination.
Wenn mehrere Sockel auf demselben Speicherbus belegt sind, erhöht sich die Kapazität auf jeder Datenleitung und die Anstiegszeit wird verlangsamt. Dies kann dazu führen, dass Übergänge zu spät eintreffen und falsch erkannt werden. Dieses Phänomen ist den Elektrotechnikern als "Fan-Out" bekannt.
Dies ist weiter kompliziert aufgrund des internen Fan-Outs eines Speichermoduls. Die Anzahl und Topologie der DRAM-Geräte auf dem Modul, die als "Rang" bezeichnet werden, haben Einfluss darauf, wie viele Module Sie erfolgreich parallel anschließen können.
Server-Motherboards, die viele Speichersockel unterstützen, erfordern tatsächlich gepufferten Speicher, bei dem ein kaskadierendes Netzwerk von Puffern verwendet wird, um den Fan-Out (und damit die Kapazität) zu begrenzen, der von jedem einzelnen erkannt wird. Es gibt eine Verzögerung, die durch die Puffer selbst verursacht wird, die sich jedoch nur logarithmisch mit der Anzahl der Ladevorgänge erhöht, während sich die Speicherkapazität ohne Puffer linear erhöht.
Wikipedia diskutiert dies: https://en.wikipedia.org/wiki/Memory_rank
Einige Motherboard-Handbücher nennen solche Dinge. Für andere können Sie die Informationen aus den RAM-Kompatibilitätslisten ableiten. Das ASUS Z170-A-Motherboard zeigt beispielsweise, dass Dual Rank (im Handbuch als DS = Double Sided bezeichnet) nur in zwei Steckplätzen gleichzeitig auf diesem Board verwendet werden kann, anstatt dass vier Single Rank-DIMMs gleichzeitig verwendet werden können .
quelle
Das klingt nach einem Problem im integrierten Speichercontroller des Prozessors .
In modernen Systemen spielen Motherboards für die Speicherverwaltung eigentlich keine Rolle mehr, als nur einen Pfad zwischen den Speichermodulen und dem Prozessor bereitzustellen. Der Speicher ist direkt mit dem Prozessor verbunden, um die Latenz zu minimieren. Die " Northbridge ", die in älteren Systemen den Speicher mit dem Prozessor verbindet, ist jetzt Teil des Prozessors. (Die Firmware oder der PCH steuern möglicherweise, wie der Prozessor den RAM ausführt, aber es ist nicht sinnvoll, Bitfehler in der von Ihnen beschriebenen Art zu verursachen, da dies letztendlich in der Verantwortung des Prozessors liegt.) Der Verdacht, dass in einer solchen Situation ein fehlerhafter IMC vorliegt.
Tatsächlich wäre ich sehr überrascht, wenn die Hauptplatine oder die Systemfirmware für die aufgetretenen Probleme verantwortlich sind.
quelle
Ich sehe einige schlechte Bewertungen für das BIOS auf diesem Motherboard. Ich würde zunächst nach einem BIOS-Update suchen. Sparen Sie niemals auf dem Motherboard.
quelle
Möglicherweise ist auch der Arbeitsspeicher fehlerhaft, obwohl dies nicht der Fall zu sein scheint. Ich hatte kürzlich ein Problem mit meinem Heimserver, bei dem es zu einem tödlichen Missgeschick mit Eistee kam ...
Ich habe den gesamten Prozess durchlaufen, bei dem jedes Teil einzeln ausgetauscht wurde (2 CPUs, Mobo, Netzteil und 2 Bänke mit 16 GB (2x8 GB) RAM), und alles wurde gut getestet, als ich nur eine einzelne Bank RAM mit einer einzelnen CPU verwendet habe (mit Ausnahme von 1 CPU, die Toast war).
Es war egal, welche Konfiguration ich verwendete, es funktionierte immer, wenn ich eine einzelne CPU und eine RAM-Bank hatte (egal ob es 16 GB oder 32 GB RAM waren), aber als ich die zweite CPU einbaute und den RAM auf 16 GB aufteilte Pro Bank konnte der Server nicht gestartet werden.
Erst als ich eine RAM-Bank komplett ausgetauscht habe, hat sie endlich richtig gebootet und funktioniert und ist es seitdem geblieben.
tl; dr : Wie @moab in seinem Kommentar feststellte, können Sie dies erst mit Sicherheit feststellen, wenn Sie jede Komponente in einem kompatiblen System testen
quelle