Was kann dazu führen, dass PCIe-Grafikkarten beim Booten zufällig ausfallen?

1

Ich habe ein System, das mich derzeit verrückt macht, und ich hoffe, dass jemand hier auf StackExchange auf etwas hinweisen kann, das ich falsch mache.

Der Computer ist selbst gebaut und besteht aus:

  • CPU: Intel Core i7 4790K (auf Lager bei 4 GHz)
  • MB: Gigabyte GA-Z97X-Gaming G1 WIFI-BK
  • Arbeitsspeicher: G.skill Trident X F3-2400C10Q-32GTX (8 GB x 4-Kit)
  • GFX: 2x Gigabyte GV-N980G1 GAMING-4GD GTX 980 (SLI)
  • PWR: Corsair HX1000i
  • Betriebssystem: Windows 8.1 Pro

Jedes Mal, wenn ich die Maschine einschalte, ist es ein Münzwurf, ob die Grafikkarten online gehen oder nicht. Wenn ich Glück habe, schalten sich die Karten ein und ich erhalte ein Anzeigesignal (über den DP-Ausgang) an meinen Hauptmonitor. In diesem Fall scheint der Computer bis zum Aus- und Wiedereinschalten ordnungsgemäß zu funktionieren, obwohl seine Leistung deutlich unter der für die Hardware erwarteten Leistung liegt (3DMark Fire Strike Extreme-Punktzahl von ca. 8000 im Vergleich zu der von Futuremark angegebenen 10100 für ein Referenzsystem mit identischer CPU und Grafikkarten).

Wenn ich Pech habe, wird der Computer gestartet und das Video mit der integrierten Intel-Grafik (die ich an einen zweiten Monitor weitergeleitet habe) online geschaltet. Der Geräte-Manager erkennt die NVIDIA-Karten überhaupt nicht. Sie werden nicht als "unbekanntes Gerät" angezeigt, sie werden nicht als "fehlgeschlagener Start" angezeigt - sie fehlen nur vollständig.

Nach dem üblichen Verfahren für diese Art von Situationen habe ich das Motherboard, die Karten, das Netzteil und alle Stromanschlüsse entfernt und wieder eingesetzt. Ich habe überprüft, ob es keine losen Leiter gibt, die möglicherweise Kurzschlüsse verursachen könnten. Ich habe die CPU- und GPU-Temperaturen überprüft, um sicherzustellen, dass sie unter Last gut innerhalb der thermischen Grenzen laufen (ca. 65 ° C für GPUs und 55 ° C für CPU).

Ich bin völlig verblüfft. Anregungen (egal wie offensichtlich) wären sehr dankbar.

Aktualisierte:

Auf Wunsch von Journeyman Geek in den Kommentaren habe ich Tests auf dem Computer durchgeführt, wobei jede Grafikkarte einzeln installiert war. Dies scheint das Problem zu lösen: Ich habe das System mit jeder Karte ungefähr ein Dutzend Mal gebootet und es ist noch nicht fehlgeschlagen. Darüber hinaus bestätigt 3DMark, dass die Karten für diese Hardwarekonfiguration mit einer einzelnen GPU eine durchschnittliche Leistung aufweisen.

Daher scheint dieses Problem speziell auf die Verwendung der beiden Karten in einer SLI-Konfiguration zurückzuführen zu sein.

Ich mache derzeit einige weitere Tests mit den beiden Karten in einer anderen PCIe-Steckplatzkonfiguration (1 & 2 statt 1 & 3), um festzustellen, ob möglicherweise ein fehlerhafter Steckplatz auf dem Board vorhanden ist.

Update 2:

Die Konfiguration von Steckplatz 1 und 2 funktionierte einwandfrei und führte bei 3DMark Fire Strike Extreme ein Benchmarking von 9600 durch. (Niedrig, aber das wird bei zwei Karten mit doppelter Breite nebeneinander erwartet. Sie werden sich gegenseitig überhitzen und thermisch drosseln, ohne dass ein Hochleistungs-Flüssigkeits- oder Phasenwechselsystem vorhanden ist.)

Nach einigen Tests in dieser Konfiguration habe ich die Karten wieder in 1 & 3 eingelegt. Jetzt funktioniert alles korrekt über ein weiteres Dutzend Stiefel. System setzt jetzt 10800 auf FSE.

Ich kann für mein ganzes Leben nicht herausfinden, was dieses Mal möglicherweise anders ist als das halbe Dutzend Mal, wenn ich die Karten zuvor noch einmal eingesetzt habe. Läuft diese Konfiguration noch ein paar Tage und schließt meine Frage als "durch Goblins verursacht" aus, wenn ich den Fehlerzustand nicht erneut reproduzieren kann.

Dan Story
quelle
Ich würde mich fragen, ob Sie genug Strom haben, aber ich würde davon ausgehen, dass eine hochwertige 1KW-Versorgung ausreichen sollte. Funktioniert eine einzelne Karte zuverlässig? Sie sprechen auch speziell über Grafikkarten, es gibt noch andere PCIe-Karten :)
Journeyman Geek
Theoretisch beträgt die maximale TDP der GPUs jeweils 165 W und die CPU 88 W. (Ich habe es in der Frage nicht erwähnt, aber es gibt eine SSD und zwei HHDDs im System sowie einen Blu-ray-Brenner, von denen keiner viel Strom verbrauchen sollte.) In jedem vernünftigen Fall sollte ein 1-kW-Netzteil immens sein die Leistungsanforderungen des Systems überschreiten, selbst wenn angenommen wurde, dass es mit einem Wirkungsgrad von 60% arbeitet.
Dan Story
Ja, ich habe vielleicht noch ein paar Theorien, aber mit einer einzigen Grafikkarte zu testen, ist der Anfang. Du solltest wahrscheinlich genug Kraft für das haben, was du tust, was das ein bisschen neugieriger macht.
Geselle Geek
@JourneymanGeek Aktualisierte Frage mit Ergebnissen von Einzelkartentests.
Dan Story
Nun, ich bin verblüfft. Ich bin versucht, eine Antwort zu schreiben, aber ich habe keine Ahnung, warum es jetzt funktioniert. Ich denke, irgendwo war etwas los und der Einzelkartentest hat sichergestellt, dass du es richtig gemacht hast;)
Geselle Geek

Antworten:

0

Sie haben definitiv einen leistungsfähigen Spielecomputer, aber ich würde immer noch vermuten, dass das Netzteil zuerst die empfohlene Leistung auf den 12-V-Schienen erreicht oder übertrifft.

Sie haben Windows 8.1 erwähnt. Ich würde also sagen, sehen Sie in Ihren Protokollen nach, ob Sie weitere Informationen darüber erhalten, warum Ihre Treiber nicht angezeigt werden.

Ich bin mit zwei 980 im Januar auf dieses Problem gestoßen, habe mich aber nicht weiter darum gekümmert, weil ich auf ein ASUS-Motherboard und ein älteres Thermaltake-Netzteil aufgerüstet habe und das Problem behoben ist.

ClaireW
quelle