Mir wurde gesagt, dass ich einen Fehler mit Memtest86 + akzeptieren soll

52

Kaufte im August einen neuen Computer mit 4x4 GB RAM. Hatte Probleme mit dem RAM. Sie haben mir vier neue Sticks geschickt, die auch Fehler verursachten. Ausgewählte vier Stöcke (von den acht, die ich jetzt hatte), die keine Fehler erzeugten. Entdeckt zufällig einen neuen RAM-Fehler letzte Woche (diesmal kein BSOD). Kontaktiert die Firma. Ihnen zufolge gab es Probleme mit einem schlechten Bestand im letzten Sommer, sodass ich zwei getestete 8-GB-Sticks an mich geschickt bekam. Ich habe Memtest86 + über das Wochenende ausgeführt. Nach 20 Stunden habe ich eine Fehlermeldung erhalten (siehe beiliegendes Foto). Der Test läuft nun seit 37 Stunden, aber bisher nur dieser eine Fehler. Ich habe die Firma kontaktiert, bei der ich den Computer gekauft habe. Sie schrieben zurück:

Ich würde mir keine Sorgen machen, ob einer versagt.

Wir hatten hier ähnliche Situationen, in denen es viele Male passiert, dann aber einmal versagt. Wir denken, es ist ein Problem mit memtest, nachdem der gesamte Speicher fehlerhaft ist oder es nicht so ist, dass Sie ihn nicht wirklich ein paarmal passieren lassen können.

Bitte vertrauen Sie mir und fahren Sie mit der Erinnerung fort, die wir Ihnen gesendet haben. Wenn Ihre Probleme weiterhin bestehen, werden wir versuchen, sie erneut zu ersetzen.

Ich erfahre aus anderen Forenbeiträgen, dass viele Leute keinen einzigen Fehler akzeptieren. Was könnte dieser einzelne Fehler bedeuten, ein fehlerhafter RAM oder ein Fehler im MEMTEST-Programm (oder anderen)?

Update: Aus den folgenden hilfreichen Kommentaren schließe ich, dass ein gelegentlicher (und seltener) "zufälliger" Fehler auftreten und akzeptabel sein könnte, aber wiederholte Fehler an derselben Adresse würden auf eine Fehlfunktion hinweisen. Memtest ist jetzt 45 Stunden gelaufen und ich habe immer noch nur einen Fehler. Zur Information aller werde ich den Test fortsetzen. In weniger als zwei Tagen gehe ich für einen Monat weg. Ich werde höchstwahrscheinlich Memtest laufen lassen. Da ich keine USV besitze, besteht die Gefahr, dass ein Stromausfall das Experiment ruiniert. Der Computer ist ein Desktop, also kann ich ihn nicht mitnehmen (was ihn seltsamerweise mehr kosmischen Strahlen ausgesetzt hätte, als ich fliegen werde;)).

Memtest

DustByte
quelle
+1; Persönlich finde ich eine großartige Frage, es tut mir leid, dass ich bei einer Antwort nicht anders kann. Ich habe Ihre Frage leicht aktualisiert, um sicherzustellen, dass sie nicht vom Thema abweicht!
Dave
19
Ich persönlich würde nicht einen schwitzen, und nur einen, Ausfall ... nicht fehlerkorrigierenden RAM kann gelegentlich ein Problem haben, es ist nicht perfekt. Wenn Sie dies im selben Adressbereich duplizieren können , stimmt etwas nicht.
Shinrai
Es ist ziemlich einfach. Der Fehler, den Sie gemeldet haben, bedeutet, dass Ihr Speicher an der angegebenen Adresse nicht den korrekten Wert enthält
Ramhound
4
Sind Sie sicher, dass dies nicht Ihr Computer ist, der Ihren RAM beschädigt?
Sanny Sin
5
Stimmen Sie mit @Shinrai überein - wenn es bei normalem RAM keine gelegentlichen Störungen gäbe, gäbe es keinen Markt für die Fehlerkorrektur von RAM . Wiederholte Fehler an derselben Adresse sind eine andere Sache, die auf eine fehlerhafte Speicherzelle hinweisen würde.
jg-faustus

Antworten:

41

Direkt vom Memtest86-Autor. Ich würde sie dazu drängen, es zu ersetzen. Es sollte wirklich überhaupt keine Fehler geben.

Wenn Sie eine relativ kleine Anzahl fehlerhafter Adressen und nur ein oder zwei fehlerhafte Bits haben, können Sie sicher sein, dass die Fehler gültig sind. Auch zeitweise auftretende Fehler sind ausnahmslos gültig. Häufig fragen Speicheranbieter, ob Memtest86 ihren jeweiligen Speichertyp oder einen Chipsatz unterstützt. Memtest86 funktioniert mit allen Speichertypen und allen Chipsätzen.

Alle gültigen Speicherfehler sollten korrigiert werden. Es ist möglich, dass ein bestimmter Fehler im normalen Betrieb niemals auftritt. Der Betrieb mit wenig Arbeitsspeicher ist jedoch riskant und kann zu Datenverlust und sogar zur Beschädigung der Festplatte führen. Auch wenn keine offensichtlichen Anzeichen für Probleme vorliegen, können Sie nicht davon ausgehen, dass Ihr System nicht betroffen ist. Manchmal können zeitweise auftretende Fehler Probleme verursachen, die lange nicht mehr auftreten. Sie können sicher sein, dass Murphy Sie benachrichtigt, wenn Sie über einen Speicherfehler informiert sind und diesen ignorieren.

BroScience
quelle
4
Sie haben den Teil ausgelassen, in dem eine enge Definition von "gültig" impliziert wird: "Wir werden oft nach der Zuverlässigkeit der von Mestest86 gemeldeten Fehler gefragt. In den allermeisten Fällen sind die vom Test gemeldeten Fehler gültig. Es gibt einige Systeme, die dazu führen Memtest86 ist verwirrt über die Größe des Speichers und versucht, nicht vorhandenen Speicher zu testen. Dies führt dazu, dass eine große Anzahl aufeinanderfolgender Adressen als fehlerhaft gemeldet wird und im Allgemeinen viele Bits fehlerhaft sind. "
Horatio
3
Er meint gültig wie in "intermittierende Fehler sind echte Fehler, kein Artefakt von Memtest". Dies muss jedoch nicht unbedingt zu einem fehlerhaften Arbeitsspeicher führen. Es treten gelegentlich RAM-Fehler auf, deshalb gibt es so etwas wie fehlerkorrigierenden RAM . Google hat es auf seinen Servern gemessen: "Bei einem durchschnittlichen DIMM treten fast 4000 korrigierbare Fehler pro Jahr auf" . Siehe auch ZDNet
jg-faustus
28

Es sieht so aus, als würde an dieser Adresse nur ein einziges Bit beschädigt (dh nicht auf logisch 1 gesetzt, wenn dies erwartet wird). Wenn Sie den Fehler reproduzieren können, ist das RAM fehlerhaft. Sogar ein reproduzierbarer 1-Bit-Fehler ist immer noch ein Fehler und kann Probleme bei der Verwendung des Computers verursachen.

Ein ordnungsgemäß funktionierender Arbeitsspeicher sollte, wie von einem Computer erwartet, * niemals ** fehlerhaft sein (und aus diesem Grund stürzen sie ab, wenn Sie über einen schlechten Arbeitsspeicher verfügen; Sie können einen Computer mit schlechtem Arbeitsspeicher nicht zuverlässig ausführen, da der Computer möglicherweise fehlerhaft ausgeführt wird Anweisungen oder fehlerhafte Daten bereitstellen / speichern ).


* Über einen ausreichend langen Zeitraum ist es möglich, dass DRAM-Bits durch externe Quellen wie Hintergrundstrahlung verfälscht werden. Das Ereignis ist normalerweise so selten, dass die meisten Computer Memtest wochenlang fehlerfrei ausführen . Siehe auch die Stapelüberlauf-Frage " Kosmische Strahlung: Wie groß ist die Wahrscheinlichkeit, dass sie ein Programm beeinflusst? ".

Durchbruch
quelle
Bisher keine Fehler mehr. Der Test läuft noch. An dieser Stelle ist es vielleicht nur hypothetisch zu fragen: "Was ist, wenn dies der einzige einzelne Fehler ist, den ich bekomme, nachdem ich den Test eine Woche lang ausgeführt habe?"
DustByte
6
@DustByte dann würde ich davon ausgehen, dass es in Ordnung ist. Es wäre nur von Belang, wenn derselbe Fehler an derselben Speicherstelle auftreten würde, was auf eine fehlerhafte DRAM-Zelle hindeuten würde. Viele Dinge können die Fehlerrate des Arbeitsspeichers verändern, einschließlich Hintergrundstrahlung (z. B. von Stürmen mit kosmischen Strahlen oder anderen Strahlungsquellen).
Durchbruch
5
In einem Fall hat Fermilab 2,5 "Single Event Upsets" pro Tag auf mehreren Maschinen mit zusammen 160 Gbit gemessen. Sie führten dies auf die Hintergrundstrahlung zurück. In diesem Fall ist die Höhe von Bedeutung: Boulder Colorado wird dies öfter sehen als in Death Valley
Horatio
Die Stack - Überlauf Frage ist wirklich aufschlussreich war - ich habe die Rate des Fehlers nicht erkennen , durch kosmische Strahlung war sehr , dass hoch.
Shinrai,