ProCurve CPU nach dem Neustart einige Minuten lang zu 100%

9

Ich habe Firmware-Upgrades in HP Switches durchgeführt. Zwei verschiedene Modelle wurden aktualisiert:

  • ProCurve Switch 5406zl Intelligent Edge (J8697A): Upgrade von K.15.06.0008 auf K.15.12.0012
  • HP 2520-24G-PoE-Switch (J9299A): Upgrade von J.14.54 auf J.15.09.0021

Beim Überprüfen jedes Schalters direkt nach dem Booten des neuen Images habe ich Folgendes festgestellt:

  1. Switches luden das neue Firmware-Image fehlerfrei und die Konnektivität wurde wiederhergestellt, sobald der Switch hochgefahren wurde. Zu diesem Zeitpunkt war die CPU-Auslastung gering (unter 10%).
  2. Wenige Sekunden später stieg die CPU-Auslastung auf 100% und blieb einige Minuten dort. Ich konnte zu diesem Zeitpunkt kein Problem feststellen, außer dass CLI über SSH etwas träge ist: normale Konnektivität, keine Protokollnachrichten ...
  3. Nach fünf bis zehn Minuten bei 100% war die CPU ohne Änderung von meiner Seite wieder normal.

Beide Modelle hatten dieses Verhalten. Ich habe eine Einheit jedes Modells auf das vorherige Firmware-Image zurückgesetzt, und sie haben sich genauso verhalten.

Obwohl diese CPU-Spitze direkt nach dem Booten kein Problem verursachte, frage ich mich, ob normales Netzwerkverhalten die Ursache für diese Spitze sein könnte, aber ich denke nicht. Ich habe folgende Aspekte berücksichtigt:

  1. Unmittelbar nach dem Start startet STP, generiert BPDUs und wechselt alle Ports im Switch durch die Zustände Bloking, Listening, Learning und Forwarding. Selbst mit 802.1D dauert dieser Vorgang mit Standard-Timern jedoch nicht länger als 1 Minute. Außerdem habe ich die Switches über SSH überprüft, sodass alle STP-Berechnungen bereits durchgeführt wurden, als ich eine Verbindung zum Switch herstellen konnte.

  2. Unmittelbar nach dem Start ist die MAC-Adresstabelle leer und für die Weiterleitung der ersten Frames ist eine Übertragung erforderlich. Ich bezweifle jedoch, dass diese Übertragung bei einem 24-Port-Switch 100% CPU und noch viel weniger 5 Minuten dauern würde.

  3. Alle Switches, die als L2-Geräte fungieren, haben keine L3-Funktionalität aktiviert, daher verwerfe ich Routing und andere L3-Prozesse.

Vermisse ich etwas "Normales" im Netzwerkbetrieb, das diese CPU-Auslastung für 5 Minuten nach dem Neustart erklären kann, während die Konnektivität erhalten bleibt? Vielleicht ist es eine Art Hintergrundprozess, den der Switch direkt nach dem Neustart ausführt?

Daniel Yuste Aroca
quelle

Antworten:

8

Dies dauerte im Google: HP Netzwerkportal weniger als 2 Sekunden

HP ProCurve 5400zl Switch-Serie - Hohe CPU-Auslastung (99-100%) nach dem Start

Unmittelbar nach dem Start des Switches wird eine hohe (99-100%) CPU-Auslastung beobachtet. Lösung

Wenn der Switch gestartet wird, besteht eine der Initialisierungsaufgaben in der Erstellung von Verschlüsselungsschlüsseln. Wenn die Schlüssel im Voraus erstellt werden, bedeutet dies, dass später, wenn eine Funktion wie SSL oder SSH, die die Schlüssel verwendet, konfiguriert oder verwendet wird, die Verfügbarkeit nur minimal verzögert wird. Diese Aufgabe dauert einige Sekunden, bevor sie hochgefahren wird. Dies hängt vom Switch-Modell, der geladenen Konfiguration und der Softwareversion ab. Obwohl die Aufgabe bis zu 100% der CPU belegt, wird sie mit einer sehr niedrigen Priorität ausgeführt. Wenn daher eine andere Aufgabe gestartet wird, für die CPU-Zyklen erforderlich sind, wird diese Aufgabe mit niedriger Priorität zurückgesetzt. Wenn diese Initialisierungs- / Schlüsselgenerierungsaufgabe nicht durch Aufgaben mit höherer Priorität unterbrochen wird, dauert der Abschluss etwa 10 Minuten. Wenn die CPU mit anderen Aufgaben beschäftigt ist, wird die Abschlusszeit verlängert.

Verwenden Sie die unten dokumentierten Befehle, um zu überprüfen, ob die angezeigte erhöhte CPU tatsächlich der hier beschriebenen entspricht und keine andere Fehlerbehebung erfordert.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

Die Ausgabe sieht wie folgt aus.

Switch # Task-Monitor CPU Switch # Show Uptime 0000: 00: 01: 42.36 Switch # Show CPU

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services
Ron Trunk
quelle
Ich bin damit einverstanden, dass dies das Problem zu beschreiben scheint, das ich erlebt habe. Aber dann kommt mir eine neue Frage in den Sinn. Wie gesagt, ich habe die Switches über eine SSH-Verbindung überprüft. Wenn SSH-Schlüssel wenige Sekunden nach dem Anmelden generiert werden: Wie kann ich die SSH-Sitzung starten, bevor die Schlüssel bereit sind?
Daniel Yuste Aroca
2
Aus Procurve Access Security Guide: Wenn Sie ein Host-Schlüsselpaar auf dem Switch generieren, legt der Switch das Schlüsselpaar im Flash-Speicher ab (und nicht in der Datei running-config). Außerdem behält der Switch das Schlüsselpaar über Neustarts hinweg bei, einschließlich Aus- und Wiedereinschalten. Durch Entfernen (Nullstellen) des öffentlichen / privaten Schlüsselpaars des Switch wird der Switch nicht in der Lage, den SSH-Betrieb zu aktivieren, und IP-SSH auf dem Switch wird automatisch deaktiviert.
Daniel Yuste Aroca