Wie viele Pässe sind mit Memtest genug?

52

Mein Computer hängt sich heute bei mehreren Gelegenheiten und unter verschiedenen Betriebssystemen nach dem Zufallsprinzip auf und ich muss die Reset-Taste drücken. Ich vermute, dass es ein Gedächtnisproblem sein könnte und tat ein memtestmit memtest86 .

Es ging durch zwei Durchgänge ohne Fehler. Ist das genug, oder muss ich über Nacht durchlaufen, bis ich einen Fehler sehe?

Was ist, wenn es sich um ein Motherboard- oder CPU-Problem handelt? Woher weiß ich, ohne ein neues Motherboard zu bekommen?

Systemspezifikationen:

  • Speicher: 2,0 GB
  • Prozessor Pentium (R) Dual-Core-CPU E5300 bei 2,60 GHz x 2
  • Hauptplatine: ASUS P5KPL-AM EPU
Fragenüberlauf
quelle
Sie haben das wahrscheinlich schon herausgefunden, aber schauen Sie sich das nächste Mal das Kernel-Protokoll unter Linux an, nachdem es hängt. Das gibt Ihnen eine Vorstellung davon, was los ist.
Scottkosty
@CarComp: Bitte posten Sie die fehlgeschlagenen memtest Ergebnisse.
Harrymc

Antworten:

25

Testen kann nicht das Fehlen von Bugs beweisen, nur deren Vorhandensein

Memtest eignet sich hervorragend zum Auffinden von Fehlern im RAM. Die Rate, mit der Fehler gefunden werden, ist notwendigerweise umgekehrt proportional zu der Störung des RAM. Je mehr kaputt es ist, desto schneller findet es Fehler.

In 90% der Fälle, wenn der RAM ein Problem hat, wird memtest es innerhalb von 10 Sekunden finden, in 99% der Fälle wird ein Durchgang ausreichen, um das Problem zu finden. Je länger es dauert, um das Problem zu finden, desto subtiler ist es und desto unwahrscheinlicher ist es, dass ein Problem mit Ihrem PC auftritt (Sie sollten jedoch immer noch einen neuen RAM erhalten, wenn Sie nur einen Fehler erhalten).

Da Ihr Computer ziemlich häufig abstürzt und Sie einige Durchgänge ausgeführt haben, ist dies wahrscheinlich nicht Ihr RAM. Als nächstes sollten Sie Ihre Festplatte und dann die CPU mit einem Tool wie Ultimate Boot CD oder Hiren's testen. (Die meisten modernen BIOS haben auch eine eingebaute HDD-Testfunktion)

David
quelle
2
Ich empfehle, die RAMs und den Sockel zu reinigen und sie zuerst erneut zu testen (Isopropylalkohol verwenden; positive Erfahrungen mit Desinfektionsspray als Ersatz gemacht; letzteres jedoch nicht direkt auf RAM sprühen - nur auf das Tuch, da es nur dienen soll als Resolvens und hinterlässt eventuell Rückstände, wenn es in zu hohen Mengen verwendet wird)
SDwarfs
3
Also, wenn jemand mindestens einen Fehler bekommt - er wirft seinen RAM raus, geht und kauft einen neuen? Bist du sicher?
Tarasovych
1
@ Tarasovych: Es kommt darauf an, wie wichtig Ihnen die Systemstabilität ist. An den PCs, die ich bei der Arbeit unterhalte, würde ich genau das tun (den gesamten Arbeitsspeicher rauswerfen und einen neuen kaufen), weil (1) Arbeitsspeicher billig und (2) Zeit für Softwareentwickler teuer ist. Tatsächlich könnte es sich als günstiger herausstellen, den gesamten PC wegzuwerfen und einen neuen zu kaufen, als aufgrund unzuverlässiger PCs an Produktivität / Arbeit zu verlieren.
Heinzi
@Heinzi werfen Sie einen Blick auf den RAM-Preis heute und vor einem Jahr ... Aber vielleicht gibt es in Ihrem Gebietsschema billigen RAM. Aber ich stimme zu, dass ein guter RAM ohne Fehler für die Entwicklung notwendig ist. Niemand mag RAM-Fehler / BSODs beim Codieren)
Tarasovych
1
Übertakten kann ebenfalls zu diesen Fehlern führen. Das bedeutet jedoch nicht, dass Sie den RAM-Speicher entfernen, nur das Übertakten reduzieren oder die Spannung im sicheren Bereich erhöhen sollten.
M.kazem Akhgary
21

Ich habe memtest ausgeführt und 6 fehlerfreie Durchgänge mit mehr als 4 Fehlern pro Durchgang gesehen. Normalerweise führe ich nur 3-4 Durchläufe aus, aber es ist durchaus möglich, Fehler zu übersehen, indem ich nur ein paar Durchläufe mache. Ich würde mir vorstellen, dass einige Fehler nur dann auftreten, wenn sich die Speichermodule erwärmen, was Probleme mit dem Speicher verursacht, der mit hoher Spannung betrieben wird.

Jeff
quelle
wenn es sich um ein wärmeproblem handelt, wäre prime95 nicht ein besserer testvektor, um viel mehr wärme im system zu erzeugen?
Jeff Atwood
@ JeffAtwood Kein Experte hier, aber prime95 würde nicht unbedingt auf RAM-Fehler hinweisen, oder?
Hele
Führen Sie zum Testen auf wärmebedingte Fehler eine Instanz von memtest pro CPU-Kern aus. Wählen Sie Ihr Leistungsprofil unter Energieverwaltung aus. Stellen Sie Laptops nicht auf Kühlständer. Memtest 24 Stunden laufen lassen. Wenn keine Fehler vorliegen, haben Sie keine Probleme mit dem RAM.
user986363
12

Bei der Arbeit ließen wir die Maschinen normalerweise über Nacht laufen, aber um ehrlich zu sein, jedes Mal, wenn ich in memtest ein Speicherproblem feststellen konnte, war es innerhalb von Sekunden nach dem Start.

Ich habe noch nie gesehen, dass eine Maschine 1 vollen Durchgang ausgeführt hat, um auf einer der folgenden durchzufallen. (Nicht, dass es unbedingt unmöglich wäre, nur um zu zeigen, dass es selten ist.)

Früher habe ich in einem Computergeschäft gearbeitet, in dem wir mehr oder weniger täglich angefangen haben, Memtests auf neuen Maschinen durchzuführen.

Ohne genügend Informationen, um wirklich zu sagen, würde ich immer noch vermuten, dass Ihr Problem eher eine Überhitzung oder ein Problem mit dem Fahrer ist.

Da Sie mehr als ein Betriebssystem ausprobiert haben, ist der Treiberteil unwahrscheinlich. Es sei denn, Sie haben zum Beispiel nur verschiedene Windows-Versionen ausprobiert, die denselben Treiber verwenden.

azzid
quelle
3
Ich habe tatsächlich Fehler ab Durchgang 3 gesehen. Ich gehe davon aus, dass dies mit dem Aufwärmen des Arbeitsspeichers, der CPU und / oder des Speichercontrollers zusammenhängt. Alle meine Probleme dieser Art betrafen entweder eine unsachgemäße Verbindung des RAM mit dem Sockel, den Sockel mit der Hauptplatine oder Ablagerungen auf dem RAM (als ich den RAM herausnahm, den RAM + Sockelstecker säuberte und den RAM zurücklegte, in dem sich schließlich das Problem löste) Problem).
SDwarfs
PS: Ich schlage mindestens 3 Durchgänge vor. Während über Nacht mit ~ 5-8 Pässen ist zuverlässiger.
SDwarfs
1
Bei einem dritten Durchgang sind Fehler aufgetreten, glaube ich aufgrund von Hitze.
Benallansmith
1
Ich habe nach 2-3 Stunden memtest86 + ein Problem festgestellt. Der gleiche Speicher für 30 Minuten war "ok".
i486
12

http://hcidesign.com/memtest/manual.html

100% Deckung bedeutet einen vollständigen Durchgang zum Testen Ihres Gedächtnisses. Im Allgemeinen ist es besser, mehrere Durchgänge durchzuführen. Hier sind drei typische Testlängen, die Sie verwenden könnten:

  1. Test bis zu 100% Deckung (ein schneller Test, um sicherzustellen, dass Ihr RAM vernünftig funktioniert)
  2. Test für 1 Stunde (dies fängt alles außer zeitweise auftretenden Fehlern ab)
  3. Test über Nacht (empfohlen; Ihr Computer führt nachts sowieso keine weiteren Tests durch. Warum sollten Sie nicht absolut sicher sein, dass Ihr RAM gut ist?)
yaccz
quelle
7

Ich habe gesehen, wie RAM die ersten 6 Durchläufe von memtest bestanden hat und nachfolgende Durchläufe fehlgeschlagen sind. Wenn ein Linux-Betriebssystem mit diesem RAM ausgeführt wird, kommt es nach 6-8 Stunden zu einem Absturz. Anderer RAM auf demselben Motherboard lief einwandfrei, so dass der fehlerhafte RAM anscheinend temperaturempfindlich war.

Wenn ich ein RAM-Problem vermute (z. B. Dell-Computer mit Diagnoseanzeigen), führe ich für 8 bis 16 Stunden Memtest auf jeweils einem RAM-Modul im ersten Steckplatz aus. Wenn dies der Fall ist, sind sowohl der Steckplatz als auch das RAM-Modul in Ordnung, und ich kann diesen Steckplatz (sicherer) zum Testen anderer RAM-Module verwenden.

user254993
quelle
Sind Sie sicher, dass Memtest86 RAM-Slots testet? Mir war nicht bewusst, dass es so war.
Hashim
6

Meine Erfahrung mit memtest86 + unterscheidet sich ein wenig von den meisten Leuten hier. memtest86 hat mir im Laufe der Jahre sehr geholfen, aber leider erkennt es manchmal keine Fehler.

Obwohl memtest die meiste Zeit funktioniert, ist es mir ein paar Mal misslungen. Das erste Mal konnte es keine Fehler erkennen. Ich hatte einen PC mit 1x 4GB DDR3, der mir BSODs im Zusammenhang mit dem Speicher gab. Ich habe einen ganzen Tag lang memtest ausgeführt, wir sprechen über mehr als 15 Durchgänge, aber keine Fehler. Ich habe es dann auf einem ganz anderen Rechner getestet, gleiche Sache, keine Fehler. Das Betriebssystem war völlig instabil, aber bei memtest gab es keine Fehler. Ich habe dann eine andere Software namens "PC-Check" von Eurosoft verwendet, die memtest sehr ähnlich ist, aber andere Algorithmen verwendet. Es ist auch bootfähig, benötigt kein Betriebssystem. Fehler wurden in weniger als 5 Minuten erkannt. Ich konnte das Modul dann an Corsair RMA senden und mir einen Ersatz besorgen.

Memtest ist also sehr gut, aber nicht immer genug. Momentan benutze ich memtest und PC-check, um den Speicher zu überprüfen. Wenn memtest keine Fehler erkennt, wird der PC dies mit Sicherheit tun und umgekehrt. Und glauben Sie mir, es passiert öfter als man denkt.


quelle
4

MemTest86 versucht, einen vollständigen Test des RAM durchzuführen. Dabei ist es auch ein guter Allround-Test geworden, da einige Tests auch den Speichercontroller des Motherboards und die CPU betreffen.

Der Arbeitsspeicher ist so stark gestiegen, dass ein Mobiltelefon heute möglicherweise mehr Arbeitsspeicher enthält als ein Mainframe vor 20 Jahren. Die Tests haben sich mit der Entwicklung von MemTest86 und dem RAM vervielfacht. Obwohl der RAM schneller geworden ist, sind die Tests immer noch zeitaufwändig, gemessen in Stunden oder sogar Tagen.

Nun zu den schlechten Nachrichten : Ich habe mindestens zwei seriöse Quellen gefunden, Zehn Foren und Wiki , die den gleichen Rat geben. Ich zitiere aus zehn Foren:

MemTest86 + muss mindestens 8 Durchläufe lang ausgeführt werden, um annähernd schlüssig zu sein. Andernfalls wird keine vollständige Analyse des Arbeitsspeichers durchgeführt.

Wenn Sie von einem Zehn-Foren-Mitglied aufgefordert werden, MemTest86 + auszuführen, stellen Sie sicher, dass Sie die vollständigen 8 Durchgänge ausführen, um schlüssige Ergebnisse zu erzielen. Wenn Sie weniger als 8 Durchgänge ausführen, werden Sie aufgefordert, ihn erneut auszuführen.

Ich möchte darauf hinweisen, dass MemTest86 zwei Versionen hat, die Free und die Pro-Version, wobei die Pro-Version mehrere Tests mehr hat als die Free-Version und die Konfigurationsoptionen. Möglicherweise sehen Sie die Unterschiede im Artikel Funktionsvergleich .

Weitere Informationen zur optimalen Anzahl von Durchläufen finden Sie im Artikel MemTest86 Technische Informationen in der Beschreibung der MemTest86-Konfigurationsdatei mt86.cfg, die nur in der Pro-Version verfügbar ist:

PASS1FULL

Gibt an, ob beim ersten Durchgang der vollständige oder der reduzierte Test ausgeführt werden soll. Standardmäßig wird beim ersten Durchgang ein reduzierter Test (dh weniger Iterationen) durchgeführt, um die offensichtlichsten Fehler so schnell wie möglich zu erkennen.

Fazit 1 : Der erste Durchgang ist kürzer und schneller und dient hauptsächlich der Erkennung schwerwiegender Fehler. Die Tatsache, dass der erste Durchgang fehlerfrei verlaufen ist, ist ermutigend, aber Benutzer der kostenlosen Version müssen auf den zweiten Durchgang warten, um die vollständige Bandbreite der Tests zu erhalten.

Die größte Anzahl von Pässen, die ich gefunden habe, war in diesem Test:

Test 7 [Inversionen verschieben, 32-Bit-Muster]

Dies ist eine Variation des Moving-Inversions-Algorithmus, der das Datenmuster für jede aufeinanderfolgende Adresse um ein Bit nach links verschiebt. Die Startbitposition wird bei jedem Durchgang nach links verschoben. Um alle möglichen Datenmuster zu nutzen, sind 32 Durchgänge erforderlich . Dieser Test ist sehr effektiv bei der Erkennung datenempfindlicher Fehler, aber die Ausführungszeit ist lang.

Fazit 2 : Test 7 benötigt 32 Durchgänge, um vollständig zu sein. Dies ist die Obergrenze für die Anzahl der Durchgänge, die für einen wirklich umfassenden Test erforderlich sind.

Ich stelle auch fest, dass viele der Tests ein zufälliges Muster verwenden, mit einem anderen Muster für jeden Durchgang, was bedeutet, dass jeder Durchgang anders ist. In absurden Höhen können wir den Schluss ziehen, dass es keine Obergrenze für die Anzahl der Durchgänge gibt, die für ein absolut schlüssiges Ergebnis erforderlich sind.

Meine Meinung

Was die Anzahl der Pässe betrifft, sollte man meiner Meinung nach so viele Pässe fahren, wie man Zeit zum Warten hat. Die Untergrenze scheint zwei Durchgänge zu sein, da nur der zweite ein vollständiger Test sein wird. Aber die Frage "wie viel ist genug" hat keine wirkliche Antwort. Ich stelle erneut fest, dass für die beiden oben genannten technischen Referenzen mindestens 8 Durchläufe erforderlich sind, um ein gutes und schlüssiges Ergebnis zu erzielen (möglicherweise, damit Test 7 unter anderem ein ganzes 8-Bit-Byte ausführt).

Andererseits sollten von MemTest86 festgestellte Fehler sehr ernst genommen werden. Da hier die Frage nach der akzeptablen Anzahl von Fehlern gestellt wurde, ist meine Antwort, dass selbst ein Fehler zu viel und nicht akzeptabel ist.

Harrymc
quelle
Ihre Antwort vermittelt Einsichten, die über die anderen hinausgehen.
CarComp
1

Ich mache einen Durchgang, um festzustellen, ob offensichtliche Fehler vorliegen.

Wenn ein Fehler auftritt, werden keine weiteren Ausweise benötigt.

Wenn das Problem mit dem Computer seltsam ist, lasse ich ihn für ~ 10 Stunden über Nacht oder über den Tag gehen, nur um sicherzugehen.

Robert Niestroj
quelle
1

Normalerweise führe ich memtest JEDES MAL aus, wenn ich die CPU, den Speicher oder merkwürdige Probleme ändere. Grund ist - memtest testet nicht nur den Speicher. In drei weiteren wichtigen Fällen tritt ein Fehler auf:

1) Wenn Probleme aufgrund einer Überhitzung der CPU oder des Speichers auftreten. Normalerweise lädt memtest die CPU für einige der Tests zu fast 100%.

2) wenn die CPU nicht richtig auf den Speicher zugreifen kann. Die meisten Tests lesen und schreiben an allen Stellen des Speichers.

3) wenn es Probleme mit der Stromversorgung gibt. Eine schwache Stromversorgung oder schlechte Kondensatoren verursachen zu viele Spitzen, die zufällige Bits ausgleichen.

Wenn ich mindestens einen einzelnen roten Fehler sehe, beginne ich zu suchen, was entfernt / behoben werden soll, bevor ich die Hardware benutze.

Nikolai
quelle
1
Dies sind zwar nützliche Informationen, sie beantworten jedoch nicht die ursprüngliche Frage.
Blm
0

Angesichts der Tatsache, dass es nach einem Durchgang angezeigt wird Pass complete, no errors, press Esc to exit, habe ich immer angenommen, dass dies ausreicht.

Bildbeschreibung hier eingeben

Der Hochstapler
quelle
6
Äh, wenn das wirklich der Fall ist, würde memtest dann nicht automatisch nach einem Durchgang anhalten, anstatt uns zu erlauben, für immer weiter zu testen?
Fragenüberlauf
@QuestionOverflow: Ich weiß es nicht, oder?
Der Hochstapler