Ich habe hier ein Notebook, von dem ich vermute, dass es ein fehlerhaftes Speichermodul hat. Ich habe daher Memtest86 + heruntergeladen und laufen lassen.
Beachten Sie, dass der Screenshot nicht mein eigentlicher Screenshot ist, sondern von memtest86 + bereitgestellt wird
Wie interpretiere ich die Zahlen auf dem Bildschirm? Ich habe es ungefähr vier Stunden laufen lassen und jetzt bin ich in Pass 7.
Vor allem, was macht
- die Testnummer
- die Anzahl der Fehler
- die Anzahl der ECC-Fehler
zeigen? Was sind vernünftige Werte für Speicherfehler? Wann sollte ich in Betracht ziehen, den Speicher zu ersetzen?
memory
memtest86+
slhck
quelle
quelle
Antworten:
TL; DR
Die wichtigste Zahl zuerst: Die Fehleranzahl für einen fehlerfreien Speicher sollte 0 sein . Jede Zahl über 0 kann auf beschädigte / fehlerhafte Sektoren hinweisen.
Bildschirmerklärung
Daten / Testerklärung
MemTest führt eine Reihe von Tests durch, schreibt spezifische Muster in jeden Sektor des Speichers und ruft ihn ab. Wenn sich die abgerufenen Daten von den ursprünglich gespeicherten Daten unterscheiden, registriert MemTest einen Fehler und erhöht die Fehleranzahl um eins. Fehler sind normalerweise Anzeichen für fehlerhafte RAM-Streifen.
Da der Speicher nicht nur ein Notizblock ist, der Informationen enthält, sondern über erweiterte Funktionen wie das Zwischenspeichern verfügt, werden verschiedene Tests durchgeführt. Dies ist, was das
Test #
anzeigt. MemTest führt eine Reihe verschiedener Tests durch, um festzustellen, ob Fehler auftreten.Einige (vereinfachte) Testbeispiele:
Eine ausführlichere Beschreibung aller Tests finden Sie unter: https://www.memtest86.com/technical.htm#detailed
Da fehlerhafte Sektoren manchmal funktionieren und ein anderes Mal nicht funktionieren, empfehle ich, MemTest einige Durchgänge ausführen zu lassen. Ein voller Durchgang ist eine abgeschlossene Testreihe, die bestanden wurde. (Die obigen Testreihen 1-11) Je mehr Durchgänge Sie fehlerfrei erhalten, desto genauer ist Ihr MemTest-Lauf. Ich laufe normalerweise ungefähr 5 Pässe, um sicher zu sein.
Die Fehleranzahl für einen fehlerfreien Speicher sollte 0 sein. Jede Zahl über 0 kann auf beschädigte / fehlerhafte Sektoren hinweisen.
Die ECC-Fehleranzahl sollte nur berücksichtigt werden, wenn auf gesetzt
ECC
istoff
. ECC steht für Error-Correcting Code Memory und ist ein Mechanismus zum Erkennen und Korrigieren falscher Bits in einem Speicherzustand. Dies kann leicht mit den Paritätsprüfungen verglichen werden, die auf RAID- oder optischen Datenträgern durchgeführt wurden. Diese Technologie ist ziemlich teuer und wird wahrscheinlich nur in Server-Setups anzutreffen sein. Die ECC-Zählung zählt, wie viele Fehler durch den ECC-Mechanismus des Speichers korrigiert wurden. ECC sollte nicht für einen fehlerfreien RAM aufgerufen werden müssen, daher kann eine ECC-Fehleranzahl über 0 auch auf einen fehlerhaften Speicher hinweisen.Fehlererklärung
Beispiel für Memtest, bei dem Fehler aufgetreten sind. Es zeigt, welcher Sektor / welche Adresse ausgefallen ist.
Die erste Spalte ( Tst ) zeigt, welcher Test fehlgeschlagen ist, die Nummer entspricht der Testnummer aus der oben bereits genannten Liste. Die zweite Spalte ( Pass ) zeigt , wenn dieser Test wurde bestanden. Im Fall des Beispiels besteht Test 7 nicht.
Die dritte Spalte ( Failing Address ) zeigt genau, welcher Teil des Speichers fehlerhaft ist. Ein solcher Teil hat eine Adresse, ähnlich einer IP-Adresse, die für diesen Datenspeicher eindeutig ist. Es wird angezeigt, welche Adresse fehlgeschlagen ist und wie groß der Datenblock ist. (0,8 MB im Beispiel)
Die vierte ( gute ) und fünfte ( schlechte ) Spalte zeigen die geschriebenen und die abgerufenen Daten an. Beide Spalten sollten im nicht fehlerhaften Speicher (offensichtlich) gleich sein.
Die sechste Spalte ( Err-Bits ) zeigt die Position der exakten fehlgeschlagenen Bits.
Die siebte Spalte ( Count ) zeigt die Anzahl von aufeinanderfolgenden Fehlern mit derselben Adresse und andernfalls Bits.
Schließlich zeigt die letzte Spalte sieben ( Chan ) den Kanal (wenn mehrere Kanäle im System verwendet werden), in dem sich der Speicherstreifen befindet.
Wenn es Fehler findet
Wenn MemTest Fehler entdeckt, finden Sie in dieser Super-User-Frage und ihrer akzeptierten Antwort die beste Methode, um festzustellen, welches Modul fehlerhaft ist :
quelle
000c34e98dc - 3124.9MB
. Warum so ein großer Brocken? Ich habe 2x1Gb- und 2x2Gb-Module in meinem PC. Wie finde ich denjenigen, der Fehler verursacht?Anzahl der Fehler
Wenn beim Durchlaufen der Tests der Speicher für einen der Tests ausfällt, wird die Anzahl der Fehler erhöht. Wenn ich mich richtig erinnere, zählt es die Anzahl der Adressen, die den Test nicht bestanden haben.
Anzahl der ECC-Fehler
ECC-Speicher ist eine spezielle Art von Speicherchip, mit dem verhindert wird, dass Daten beschädigt werden. Ihre
ECC Errs
Spalte zählt, wie viele Probleme von ECC behoben wurden.(ECC ist langsam und teuer und hauptsächlich für unternehmenskritische Systeme gedacht, bei denen kein RAM-Austausch erforderlich ist.)
Testnummer
Memtest führt verschiedene Arten von Tests für Ihr Gedächtnis durch, die auf der Memtest86- Website beschrieben werden. Nur so eine kurze, einfache englische Übersetzung:
Test 0: Gehender Adressentest
Memtest schreibt
00000001
in den ersten Speicherort,00000010
in den nächsten usw. und wiederholt dieses Muster alle 8 Bytes. Dann liest es den Speicher und stellt sicher, dass sich der Wert nicht ändert. ( Quelle )Test 1 & 2: Eigene Adresse Adressentest
Memtest schreibt jeden Speicherort mit einer eigenen Adresse und überprüft, ob sich der Wert nicht geändert hat.
Test 1 ist sequentiell und Test 2 ist parallel (dh verwendet Parallelität).
Test 3 & 4 Moving Inversions Test
Im Wesentlichen lädt dieser Test 0s in den Speicher und dann
Das Ziel hier ist, zu versuchen, jedes Bit und seine benachbarten Bits "jede mögliche Kombination von 0en und 1en" zu testen.
Test 3 verwendet keine Parallelität, während Test 4 dies tut.
Test 5: Inversionen verschieben, 8-Bit-Pat
Dies führt die Moving-Inversions-Methode erneut aus, diesmal jedoch mit der laufenden 1 von Test 0 in 8-Bit-Blöcken.
Test 6: Inversionen verschieben, Zufallsmuster
Memtest verwendet Zufallszahlen anstelle aller Nullen oder laufenden Einsen.
Test 7: Blockbewegung
Das macht Spaß. Es lädt Muster in den Speicher, verschiebt sie in Blöcken von 4 MB und überprüft sie.
Test 8: Moving Inversion, 32-Bit-Pat
Entspricht Test 5, verwendet jedoch stattdessen 32-Bit-Blöcke. Dieser lädt tatsächlich jeden möglichen 32-Bit-Wert an jedem Ort.
Test 9: Zufallszahlen
Dieser lädt Pseudo-Zufallszahlen in den Speicher und überprüft. Das Coole am Pseudozufallszahlengenerator ist, dass er nicht sehr zufällig ist (wenn Sie jemals
printf("%d", rand());
ein C-Programm ohne Seeding ausgeführt und die ach so zufällige Zahl 41 erhalten haben, wissen Sie, was ich meine). Dies wird überprüft, indem die Zufallszahlensämaschine zurückgesetzt und der Generator erneut gestartet wird.Test 10: Modulo-X
Alle 20 Stellen schreibt es ein Muster (alle 0en oder alle 1en) und schreibt das Komplement an allen anderen Stellen und überprüft es dann.
Test 11: Bit-Fade-Test
Dieser lädt den RAM mit allen Einsen (und erneut mit allen Nullen), wartet 5 Minuten und prüft, ob sich einer der Werte ändert.
quelle
Testnummer: Die Nummer des spezifischen Tests, den memtest derzeit ausführt. Da sind viele von denen.
Anzahl der Fehler: Die Anzahl der aufgetretenen Speicherfehler
ECC-Fehler: Anzahl der vom ECC korrigierten Fehler. Ihr Chipsatz / Speicher verfügt nicht über ECC, daher spielt diese Nummer keine Rolle.
Wenn Ihr Speicher eine Anzahl von Fehlern über 0 aufweist, möchten Sie ihn ersetzen.
BEARBEITEN: Die Tests sind die verschiedenen Muster, die memtest in den Speicher schreibt. Es schreibt verschiedene Muster in den Speicher und liest sie zurück, um auf Fehler zu prüfen, und es verwendet verschiedene Muster, um in der Lage zu sein, alle Zustände aller Bits zu testen.
Die Anzahl gibt an, wie oft das in memtest zurückgelesene Ergebnis nicht dem entspricht, was es in den Speicher geschrieben hat. Dies bedeutet, dass ein Fehler im getesteten Speicherblock vorliegt.
ECC ist eine in Speicherchips für Server und Workstations integrierte Fehlerkorrekturtechnologie. Die meisten Dekstops unterstützen keine Speichermodule mit integriertem ECC. Fast alle Server / Workstations unterstützen dies und erfordern dies normalerweise. Die Anzahl der von ECC korrigierten Fehler entspricht der Anzahl der Fehler, die der ECC-Chip erfolgreich behoben hat.
quelle