Linux-Kernel-Crash-Dump-Analyse: Richtlinien

7

Hinweis:

  • 2.6+ Kernel
  • Oder älter 2.4

Frage:

  • Generisches vorgeschlagen Richtlinien in Bezug auf die Linux - Kernel - Crash - Dump - Analyse
    • Erforderliche Fähigkeiten, dh Kernel-Kompilierungsfähigkeiten usw.

Vorschläge:

Aaron
quelle
Ähm ... soll dies ein Vorschlag sein, wie eine Crash-Dump-Analyse durchgeführt werden soll? Das Format ist zwar gut strukturiert, aber auf den ersten Blick nicht sehr klar. Etwas anders geschrieben, würde es fast so klingen, als würden Sie eine Checkliste für die Qualifikationsanforderungen für eine Position zusammenstellen, die Sie besetzen werden ...
Avery Payne
@Avery: Es tut mir leid, wenn das Format meiner Frage nicht kohärent strukturiert ist. Eigentlich bin ich nur am Lernen interessiert ...
Aaron
Ich würde mich über Hinweise freuen ...
Aaron

Antworten:

6

Für die grundlegende Crash-Dump-Analyse sind keine besonderen Fähigkeiten erforderlich. Wenn Sie den Anweisungen folgen und einen Speicherauszug mit Absturz öffnen können, können Sie einige grundlegende Diagnosen durchführen, ohne den Kernel genau zu kennen. Für alles, was über die Grundlagen hinausgeht, müssen Sie jedoch wissen, wie man Code mit gdb debuggt, gute Kenntnisse über die Kernelstruktur und den Code entwickeln und lernen, wie x86 und x86_64 tatsächlich funktionieren. Es gibt viele Ressourcen, nach denen Sie googeln können, um dabei zu helfen. RedHat führt auch einen Kernel-Interna-Kurs durch, der sich lohnt (wenn jemand anderes bezahlt).

Sobald Sie den Speicherauszug geöffnet haben, können Sie einige grundlegende Überprüfungen durchführen, mit denen Sie eine große Anzahl von Speicherauszügen diagnostizieren können. Wenn Sie den Speicherauszug öffnen, sollten Sie einige grundlegende Informationen erhalten, einschließlich der Last zum Zeitpunkt des Absturzes - immer ein nützlicher Zeiger. Wenn Sie in das Ringpufferprotokoll schauen, erhalten Sie eine Spur des Absturzes. Wenn Sie Informationen von hier abrufen und googeln, wird häufig angezeigt, dass es sich um ein bekanntes Problem mit einem Fix handelt. Ein weiterer Ort, an dem Sie nachsehen müssen, ist der freie Speicher. Wenn Sie nur eine Handvoll kleiner Seiten haben, wissen Sie, warum der Absturz / Hang aufgetreten ist.

Dies ist ein ziemlich großes Thema. Ich bin noch nie auf wirklich gute Ressourcen vom Typ Tutorial gestoßen, bei denen Beispiel-Crash-Dumps durchgesehen werden müssen, angefangen bei einfach zu diagnostizierenden Problemen, die zu viel tieferen Ursachen führen. Vielleicht wäre das ein würdiges Projekt.

Schmiere
quelle
1

Hier ist ein Hinweis, der zutreffen kann:

Kdump / Kexec Howto

Julien
quelle