Immer noch Angst: Der Hostadapter bricht Anforderungsfehler ab, nachdem er die empfohlenen Schritte befolgt hat

9

Ich habe die berüchtigte Angst: Der Hostadapter bricht den Anforderungsfehler mit meinem neuen Adaptec RAID-Controller unter hoher E / A ab. Ich habe mehrere Foren gelesen, sogar Adaptecs , in denen das Beheben des Werts / sys / block / sdX / device / timeout auf 45 das Problem behebt. Ich verwende jedoch Ubuntu Server 12.04, der diesen Wert standardmäßig bereits bei 45 hat. Ich habe auch den nächsten Vorschlag ausprobiert, nämlich das BIOS meines Mobos auf den neuesten Stand zu bringen, was ich auch getan habe.

Ich bin mir nicht sicher, ob jemand anders auf diesen Fehler "aacraid: Host Adapter Abort Request" gestoßen ist, bevor er diese Schritte ausgeführt hat.

Folgendes sehe ich in meinem Syslog:

kernel: [ 5493.523282] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523309] aacraid: Host adapter abort request (4,0,0,0)
Jan  6 20:29:15 server kernel: [ 5493.523375] aacraid: Host adapter reset request. SCSI hang ?

Hier ist mein Name -a

Linux server 3.2.0-29-generic #46-Ubuntu SMP Fri Jul 27 17:03:23 UTC 2012 x86_64 x86_64 x86_64 GNU/Linux

Vielen Dank an alle,

Jim

Jim
quelle

Antworten:

1

Falls Sie dies noch nicht gelöst haben, habe ich kürzlich mit demselben Problem gerungen, das schnell zu einem Array führte, das einige Minuten lang alle 5 Minuten hängt, wenn die E / A zunimmt. Ubuntu verwendet standardmäßig den CFQ-Scheduler, der für Hardware-RAID nicht optimal ist. Schalten Sie den Scheduler auf noop mit:

echo noop > /sys/block/<blockdevice>/queue/scheduler

Persönlich bin ich mit dem alten Kernel festgefahren, aber mir wurde gesagt, dass auch ein Upgrade auf den neuesten aacraid-Treiber das Problem beheben sollte - kann das aber nicht überprüfen. Aber trotzdem zu noop wechseln. Da sysfs nicht permanent ist, möchten Sie möglicherweise den Scheduler festlegen /etc/rc.localoder den elevator=Boot-Parameter verwenden.

Ich würde auf andere Kernel-Parameter achten, und die Einstellungen unter Ubuntu sind vernünftige Standardeinstellungen für die meisten gängigen Hardwarekomponenten, aber die meisten Server benötigen besondere Aufmerksamkeit, unabhängig davon, in welcher Distribution Sie sich befinden.

Kev
quelle
1

Wenn Ihr Adaptec RAID-Controller über eine eigene Firmware / ein eigenes BIOS verfügt, müssen Sie diese möglicherweise aktualisieren. Wir hatten Probleme während hoher E / A-Vorgänge und bekamen auch "Angst: Host-Adapter-Abbruchanforderung" und sahen eine Firmware-Version, die neuer als unsere aktuelle war und lautete: "Es wurde ein Problem behoben, bei dem die Firmware bei hoher E / A-Belastung hängen bleiben konnte." http://download.adaptec.com/pdfs/readme/relnotes_arc_fw-b18937_asm-18837.pdf .

In den obigen Versionshinweisen sind die folgenden Adaptec-Modelle aufgeführt: 2045, 2405, 2405Q, 2805, 5085, 5405, 5405Z, 5445, 5445Z, 5805, 5805Q, 5805Z, 5805ZQ, 51245, 51645, 52445).

Wir haben auch Protokollzeilen wie:

sd 0:0:0:0: timing out command, waited 360s

und

Result: hostbyte=DID_OK driverbyte=DRIVER_TIMEOUT,SUGGEST_OK

Bei der Online-Suche nach anderen Personen mit einem ähnlichen Problem haben wir eine andere Kartenreihe gefunden, bei der die folgenden Probleme durch die Firmware behoben wurden, die relevant sein könnten:

Die beiden oben genannten gelten für die Adaptec-Modelle 7805, 7805Q, 78165, 71605E, 71605, 71605Q, 71685, 72405, 8805, 8885, 8885Q und 81605ZQ.

sa289
quelle
Ich denke, mein Controller würde hängen bleiben, wenn ich das arcconfBefehlszeilenprogramm zum Abfragen des Status des Arrays als Teil unserer regulären Nagios-Überwachungsskripte verwenden würde. Wie aus den Firmware-Hinweisen hervorgeht, arcconfkann der Controller bei Verwendung hängen bleiben.
Stefan Lasiewski