Ich suche nach Hinweisen, Tipps und Antworten, wie ich bei der Fehlerbehebung anfangen kann, wenn:
- Das Problem tritt nur sporadisch auf
- Das Problem könnte buchstäblich überall liegen - Betriebssystem; freie Quellensoftware; meine eigenen Softwareentwicklungen; gekaufte Software; Krümel auf der Tastatur; die spezielle Kombination von Software, die ich gerade verwende; Maxwells Dämon; Die kleinen blauen Männer, die die Maschine steuern, sind in den Streik getreten. usw.
- Ich habe nur in einigen Bereichen Erfahrung, die potenzielle Kandidaten für die Ursache des Problems sind.
Das spezifische Problem, das ich habe, wird im Folgenden als Beispiel aufgeführt, aber ich suche keine Antworten auf mein aktuelles Problem, sondern eher, wo und wie ich anfangen soll, solche Probleme anzugehen.
Ich habe zurzeit ein Problem mit meiner neuen Maschine. In einigen Fällen ist die Maschine gerade eingefroren. Sie dürfen keine Tastenanschläge, Mausklicks oder andere Aktionen außer dem Ein- / Ausschalter akzeptieren. Ich habe immer nur im Internet gestöbert. Ich habe einige (<= 6 andere Anwendungen) ausgeführt. Keine dieser Anwendungen ist von Bedeutung. und repräsentieren eine Mischung aus kommerziellen Programmen und Open-Source-Programmen, die typischerweise von Unix irgendeiner Art migriert wurden.
Mein Computer ist ein Windows 7 I7 Quad-Core-Laptop.
BEARBEITEN:
Obwohl ich angegeben habe, dass die eigentliche Problembeschreibung nur ein Beispiel ist, konzentrieren sich einige Kommentare auf die Lösung dieses Problems. Da es sich nur um ein Beispiel handelt, sind die angegebenen Informationen leider korrekt, aber nicht vollständig. Um zu vermeiden, dass die Leute ihre Zeit damit verschwenden, aus der Ferne zu versuchen, das eigentliche Problem zu lösen, gebe ich einige andere Informationen zu meinem Setup. Wie ich ursprünglich sagte, suche ich keine Antworten auf dieses spezielle Problem.
Meine Maschine ist ein leistungsstarker Laptop. ist meine Hauptmaschine; wird für Entwicklung und technisches Schreiben, Kommunikation - E-Mail, Web, FTP usw. sowie für die Fotobearbeitung und -indexierung verwendet. Eine strenge und umfassende Reihe von Hardwaretestprogrammen, einschließlich CPU-Tests, Tests für mehrere Speicher und Tests für alle anderen Komponenten, werden mindestens monatlich darauf ausgeführt. Mindestens monatlich wird auch ein vollständiger Virenscan durchgeführt. ein vollständiger Spyware-Scan; eine Datenträgerbereinigung; und eine Defragmentierung.
Die Festplatte enthält ungefähr 3 * 10 ^ 6 Dateien. Die Festplattennutzung beträgt 300 GB, wobei 150 GB frei bleiben. Speicher ist 8 GB. Während sich der Computer leicht erwärmen kann, wenn ich eine vollständige Palette der wichtigsten Entwicklungstools verwende, ist das Problem nur dann aufgetreten, wenn ich den Computer sehr leicht verwende - Webbrowsing plus Textpad plus Graphviz plus eine Firebird-Datenbank plus einen leichten Datenbankbrowser (Flame Robin) ). Unter diesen Umständen ist auch der Lüfter nicht leicht warm. Ich habe in dem Zeitraum, in dem ich auf das Problem gestoßen bin, keine Änderungen an Software, Betriebssystem oder Hardware vorgenommen. Es wurde eine Reihe von automatischen Updates durchgeführt - hauptsächlich, aber nicht ausschließlich, von Microsoft, Adobe und Lenovo.
Dieser Hintergrund bringt (wie ich hoffe) meine Gründe in Zusammenhang, diese Frage so zu stellen, wie ich es getan habe. Ich werde jetzt damit beginnen, die verschiedenen in den Antworten erwähnten Protokolle zu untersuchen, um zu versuchen, das Untersuchungsfeld einzugrenzen. Und ich werde eine der Eigenschaften ausprobieren, die in den Antworten vorgeschlagen wurden, die ich bisher erhalten habe - Geduld - in meiner Untersuchung.
Antworten:
Holen Sie sich eine bessere Vorstellung.
Ohne ausreichende Feldinformationen werden Sie keinen Kampf gewinnen.
Beschreiben Sie Ihr Problem ausführlich, damit Sie eine gute Vorstellung davon haben, wer weiß, dass es nur einmal vorkommt.
Verfolgen Sie in der Vergangenheit, was vor und zusammen mit dem Problem passiert ist, sowohl Sie als auch Ihren Computer.
Denken Sie an die möglichen Ursachen, weil es manchmal etwas ist, das nicht offensichtlich ist.
Wenn Sie keine Ahnung haben, was gerade passiert, erhalten Sie weitere Informationen. Dies kann von Ereignissen über SysInternals-Tools , Leistungsanalyse und Debugging bis hin zu anderen Tools in Ihrem Fachwissen reichen .
Testen Sie Ihre Annahmen , um sicherzustellen, dass Ihre Gedanken die Ursache nicht herausfiltern.
Teilen und erobern.
Denn so besiegt das Militär seinen Gegner, auch wenn er zahlenmäßig unterlegen ist.
Beseitigen Sie die möglichen Ursachen, da Sie sonst Probleme haben, das Problem im Auge zu behalten. Auf diese Weise kommen Sie der eigentlichen Ursache des Problems immer näher und können das Problem viel einfacher lösen.
Trennen und entfernen Sie beispielsweise mit Hardware alle Komponenten, die Sie zur Behebung Ihres Problems nicht benötigen. Auf diese Weise können Sie möglicherweise die Komponente trennen, die das Problem verursacht. Und dann geht es wieder darum, die Hälfte der Komponenten einzufügen, zu überprüfen, ob sie erneut auftreten, und das Teilen zu wiederholen, bis Sie die fehlerhafte Komponente haben ...
Wenn etwas auf einem anderen Computer getestet wird, ist dies auch ein guter Vorteil, um das Problem zu lösen.
Bei Software hilft es beispielsweise, den Computer im abgesicherten Modus neu zu starten und die Starteinträge zu deaktivieren. Dies gilt auch für das Aktivieren / Deaktivieren von Einstellungen, das Ausprobieren der Standardkonfiguration usw.
Lassen Sie es uns auf die Probe stellen.
Das ist eine richtige Beschreibung für sich, sie kommt auch nicht nur einmal vor .
Sie wissen, was zusammen mit dem Problem passiert ist
, haben aber noch nicht an Dinge gedacht, die Sie oder Ihr Computer vor dem Problem getan haben .
Ich kann das nicht sagen, aber Sie, Ihr Ereignisprotokoll und kürzlich geänderte Dateien / Ordner könnten es sagen.
Mögliche Ursache ist wahrscheinlich die CPU , weil es die Komponente ist, die die Dinge verarbeitet.
Genauer gesagt kann dies ein Prozess, ein Treiber oder ein Hardwarefehler sein (möglicherweise Temperaturprobleme?).
Ich weiß, es ist CPU, aber ich weiß nicht was. Ereignisse zeigen dies nicht, der Process Explorer würde bei DPC hängen .
Also lasse ich im nächsten Schritt die Trace-Analyse laufen, die ich schließe, nachdem der Hang aufgetreten ist.
Ich schaue in die Spur und sehe, dass Treiber X das Problem verursacht !
Es werden keine wirklichen Annahmen getroffen. Die CPU-Annahme wird von unserem Divide & Conquer-Ansatz behandelt ...
Also, hier beginne ich zu teilen, um das Problem zu überwinden, ich höre auf, sobald es gelöst ist:
Problem mit der aktuellen Treiberversion?
Aktualisieren Sie den Treiber auf die neueste Version.
Problem mit den neuesten Versionen des Treibers?
Holen Sie sich eine neue Spur. Aktualisieren Sie den Treiber auf eine ältere Version, die von der ursprünglichen Version abweicht.
Problem mit dem Gerät? Konfigurationsproblem in der Registry?
Holen Sie sich eine neue Spur. Installieren und / oder deaktivieren Sie das Gerät, falls möglich.
Problem ist zufällig, heizt sich der Prozessor auf?
Überprüfen Sie die Prozessortemperatur und ersetzen Sie gegebenenfalls den Lüfter.
Problem ist nicht der Prozessor, gibt es andere Hardware- und Softwareeinflüsse?
Entfernen Sie die Hardware und deaktivieren Sie die Software, um den Einfluss Dritter zu verringern.
Problem ist nicht in einem abnehmbaren Teil, es sollte ersetzt werden.
Im schlimmsten Fall, wenn alles andere fehlschlägt, müssen Sie einen Ersatz suchen.
Wenn wir neue Spuren erhalten und Hardware entfernen, erhalten wir mehr Informationen, sodass wir wissen, wo wir als Nächstes suchen müssen.
quelle
Gute Protokolle und Intuition - wirklich.
quelle
C:\Windows\*.log
,C:\Windows\Logs
,C:\Windows\inf\*.log
und auchPerformance Monitor > Data Collector Sets > (Startup) Event Trace Sessions
. @JRobert, +1, um zu erklären, wie man eine Idee detaillierter bekommt ...Normalerweise beginne ich mit den Ereignisprotokollen und allen Protokollen, die ein Programm selbst erstellen kann. Programme erstellen manchmal ein Protokoll im Programmordner.
Nachdem Sie die Uhrzeit ermittelt haben, durchsuchen Sie die Protokolle nach Ereignissen. Natürlich können Windows-Protokolle Stop-Fehler enthalten, die leicht zu identifizieren sind.
Überprüfen Sie alle Treiber und vergewissern Sie sich, dass sie aktuell sind.
Geduld wird in großen Dosen gefordert sein.
quelle
Zusätzlich zu all den guten Ratschlägen, die bereits gegeben wurden, lohnt sich häufig ein ordnungsgemäßer Speichertest des Computers, wenn Protokolldateien nicht viel zu erledigen sind. Ein fehlerhafter Speicher kann alle möglichen seltsamen zeitweiligen Einfrierungen und Abstürze verursachen. Der eingebaute Speichertest ähnelt viel eher einer Speicheranzahl. Es ist äußerst selten, dass der Einschalttest einen Speicherfehler erkennt.
Google für Windows Memory Diagnostic und brennen Sie es auf eine CD. Es ist alt, aber es ist einer der besseren Gedächtnistests und es ist kostenlos.
quelle