So erzwingen Sie einen ECC-Fehler [geschlossen]

10

Ich suche nach einer Möglichkeit, einen ECC-Fehler in einem DRAM-DIMM zu erzwingen, um Code zu testen, der mit der Wiederherstellung nach diesen Fehlern verbunden ist. Ich glaube, Intel stellt eine Testvorrichtung für mehrere tausend Dollar her, aber ich suche etwas billigeres.

Ich habe versucht, einen an das DIMM angeschlossenen Beta-Emitter (Strontium 90, 0.01uCi) zu kaufen, um einen "Bit-Flip" in der Hardware zu erzwingen. Nach zwei Wochen werden keine ECC-Fehler gemeldet.

Mein nächster Schritt ist, entweder einen stärkeren Emitter zu kaufen ... oder zu sehen, ob jemand anderes dies auf andere Weise gelöst hat.

Frage : Hat jemand einen Weg gefunden, ECC-Fehler in einem DIMM zu Testzwecken zu erzwingen (außer ein ausgefallenes DIMM zu finden und dieses zu verwenden? Dies war unsere alte Technik, bis das DIMM den Geist vollständig aufgab).

Albiglan
quelle
1
Du wirst etwas Stärkeres brauchen. Kommen Sie zu Fermilab und sehen Sie, was sie haben. :)
Michael Hampton
4
Ich stimme dafür, diese Frage als nicht zum Thema gehörend zu schließen, da dies keine Frage der Systemadministration ist. Es ist für die Migration auf eine andere SE-Site geeignet, obwohl ich nicht ganz sicher bin, welche geeignet wäre.
Kasperd
2
Helfen diese Beispiele für Fehlerinjektionen ? Oder benötigen Sie echte Hardwarefehler?
Ckujau
1
Wäre es möglich, ECC-Fehler mit einer Art Virtualisierungsschicht zu simulieren? Nur ein Gedanke
Molomby
2
@ Molomby würde es. Die Fehlerinjektion für virtuelle Maschinen ist eine Forschungsdisziplin in CS. Im Laufe der Jahre wurden einige anständige Arbeiten veröffentlicht.
The-Wabbit

Antworten:

1

Das Problem wurde behoben, indem Drähte zu einem einzelnen DIMM hinzugefügt (für den normalen Gebrauch zerstört) und zufällige ECC-Fehler mit dem DIMM generiert wurden, mit denen wir das System testen konnten.

Albiglan
quelle