Wie kann man den Festplattenstatus hinter dem Dell PERC H710 Raid Controller mit CentOS 6 überwachen?

26

Ich habe einen Dell-Server, CentOS 6auf dem eine PERC H710Raid Controller-Karte mit Raid 5-Setup ausgeführt wird, und ich möchte den Festplattenausfall / Arbeitsstatus hinter dem Raid Controller überwachen.

Dann sollte ich in der Lage sein, ein Bash-Skript zu verwenden, um den Festplattenstatus zu überwachen und Alarm-E-Mails zu senden, wenn etwas schief geht.

Das LSI MegaRAID SASBefehlstool (Über LSI MegaRAID SAS Linux Tools) für CentOS / Red Hat / Linux unterstützt PERC H710 smartctlNICHT und unterstützt es auch NICHT.

Basierend auf der Dell-Website wird CentOSdies für diesen Server nicht unterstützt ( NX3200 PowerVault) und ich konnte kein Linux-Programm zur Überwachung der Festplatte herunterladen.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Weiß jemand, wie man den Festplattenstatus hinter einem Hardware-Raid auf dem Dell PERC H710 mit CentOS 6 überwacht?

Xianlin
quelle

Antworten:

26

SMART ist nicht das letzte Wort in der Festplatten- oder Speicherüberwachung !! Es ist eine Komponente, aber moderne RAID-Controller verwenden es zusammen mit anderen Methoden, um den Zustand von Laufwerken und Arrays zu bestimmen.

Ich gehe davon aus, dass dies ein PERC-Controller in einem Dell PowerEdge-Server ist.

Der normale Linux-freundliche Ansatz für die Zustandsüberwachung von Dell-Hardware ist die Installation der Dell OMSA-Agenten für Linux über Yum ( http://linux.dell.com/wiki/index.php/Repository/OMSA#Yum_setup)

yum install srvadmin-allinstalliert die gesamte Agenten-Suite. Nach der Installation können Sie den omreportBefehl verwenden, um Informationen zu Ihrem Array abzurufen.

Beispiele:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1
ewwhite
quelle
7
Dadurch werden zusätzliche Komponenten wie Webserver / SSL auf meinen Linux-Rechnern installiert, aber anscheinend habe ich keine andere Wahl! Ich hasse es, meinem Server unnötige Pakete hinzuzufügen.
Xianlin
2
Achten Sie auf mögliche Speicherverluste in einem dieser OMSA-Programme. Es passierte mir langsam im Laufe von 3-4 Wochen dann boomte überhaupt kein Speicher mehr für Linux.
Mittwoch,
1
Ja, das Leck befindet sich in dsm_sa_snmpd (also starte ich 'killall -9 dsm_sa_snmpd', behoben).
MarkusN
5
Die PERC 7xx- und 8xx-Controller sind nur LSI Megaraid-Controller, und das LSI MegaCLI-Tool funktioniert einwandfrei, wenn Sie Ihr System nicht mit Dell-Bibliotheken und allen anderen Diensten und / oder Kernel-Modulen belasten möchten, die derzeit gelöscht werden. Es gibt viele MegaCLI-Spickzettel, Nagios-Überwachungsskripte und Tipps zur Leistungsoptimierung für die LSI-Binärdatei. Das ist natürlich nur meine persönliche Präferenz und Meinung. Ich bin ein Minimalist.
Aaron
@ Xianlin, das ist nicht ganz richtig. Ja, es wird eine Menge Müll installieren, aber siehe meine Antwort. Ich wollte keine unnötigen Pakete hinzufügen, also fand ich nur die heraus, die ich für die Speicherung benötigte.
Mike S
25

Sie können den SMART-Status der Festplatten mit dem Befehl smartctl und seinem -dArgument anzeigen . So sehen Sie beispielsweise die erste Festplatte im Array:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Dies ist unter Scientific Linux 6 (einem anderen RHEL6-basierten Betriebssystem) mit smartmontools-5.43-1.el6.x86_64 möglich.

Jonathan Barber
quelle
-d megaraid,0war genug in smartctl 6.6der Befehlszeile. In der DEVICESCANZeichenfolge /etc/smartd.confbenötigt-d removable
Stuart Cardall
9

Die akzeptierte Antwort empfiehlt die Kühnheit, die ist yum install srvadmin-all. Blecch. Hier erfahren Sie, wie Sie das Problem ein wenig lindern (und trotzdem lindern. Auf der HP-Plattform können Sie viel schlanker werden. Aber ich schweife ab ...) Damit meine ich, dass Sie nur die Komponenten installieren, die für die Speicherverwaltung auf Ihrem Computer erforderlich sind .

Übrigens liegt die direkte Antwort auf die Frage des Benutzers in dem Punkt "Physische Festplatten auf vdisk 0 anzeigen" in der folgenden Liste.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Hinzufügen zu root's .bashrc:

export PATH=$PATH:/opt/dell/srvadmin/bin

Genießen:

RAID-Befehle

  • Alle physischen Festplatten auf Controller 0 anzeigen

    $ omreport storage pdisk controller=0
    
  • Alle logischen Datenträger auf Controller 0 anzeigen

    $ omreport storage vdisk controller=0
    
  • Zeige alle physischen Festplatten auf vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Rekonfiguriere eine vdisk so, dass sie raid1 von raid0 ist ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Erstellen Sie eine virtuelle Festplatte auf einer neuen Festplatte:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Mehr Info

Übrigens, da dies nichts anderes als eine LSI MegaCLI-Karte der Marke Dell ist, finden Sie die Antwort von Han Solo möglicherweise noch besser! Ich muss es allerdings noch probieren.

Die Süße

Hier ist ein Beispiel für die Ausgabe von omreport, die durch grep für ein köstliches Datenbündel geleitet wird:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D
Mike S
quelle
@slm Bezüglich deiner Bearbeitung - geht das wirklich ohne root? Ich habe derzeit kein omreport / omconfig vor mir, aber ich bin nicht sicher, ob ein Benutzer einfach eine vdisk erstellen kann. Das '$' in der Befehlszeile impliziert einen normalen Benutzer, nicht root.
Mike S
Ja, ich habe dies neulich getan, als ich mit einem Dell 730 all die cmds gehandelt habe, mit Ausnahme derjenigen 2, die "create" machen, erforderten kein root, ich werde es reparieren.
Slm
6

Ich hatte auch Mühe, es in CentOS zum Laufen zu bringen und fand hier ein Arbeitspaket http://mirror.ndchost.com/software/lsi/

genannt " MegaCli-8.07.10-1.noarch.rpm "

Die Befehlsreferenz http://hwraid.le-vert.net/wiki/LSIMegaRAIDSAS

Ich hoffe, es hilft.

Han Solo
quelle
1
Ich würde absolut zustimmen, benutze / opt / megacli / MegaCli64 -PDList -aALL | grep -i Firmware und es wird Ihnen sagen, ob die physischen Festplatten in Ordnung sind. (Der Befehl stammt von erikimh.com/megacli-cheatsheet. Sehen Sie, ob ich den falschen verwendet habe.) Grundsätzlich leistet die Raid-Pflege einen großartigen Beitrag zur Überwachung der Festplatten. Behalten Sie also stets den Überblick über die Betriebszustände der Festplatten.
Einige Linux-Nerd
3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:
user311347
quelle
8
Bitte lesen Sie Wie schreibe ich eine gute Antwort? in unserer Hilfe und überarbeiten Sie dann die Antwort. Ihr Befehl kann technisch eine Lösung sein, die auch schon in den anderen, viel älteren Antworten erwähnt wurde und einige Erklärungen sind willkommen. Danke im Voraus.
HBruijn,
1
Bei der anderen Antwort wurde "sat + megaraid" verwendet, was bei mir nicht funktionierte. (Richtig, ich kannte den Befehl smartctl nicht gut und wusste nicht, wie ich den Befehl ändern sollte, damit er funktioniert.) Diese Antwort führte mich auf den richtigen Weg, und er funktioniert für mich.
Yongwei Wu
1

Der perccliBefehl kann Ihnen auch viele Laufwerksinformationen anzeigen, wenn Sie ihn freundlich fragen:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Dies muss für jeden Gehäuseschlitz wiederholt werden, oder zumindest habe ich keine Möglichkeit gefunden, alles auf einmal mit einem einzigen perccliBefehl zu drucken .

Es ist auch einfach zu installieren im Vergleich zu anderen, umfassenderen Optionen:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliist KEINE umfassende Überwachungssuite wie Dell OMSA, aber es hört sich so an, als wollten viele Leute nichts Umfassendes und benötigen stattdessen ein anständiges, einfaches Tool.

Steve Bonds
quelle
-1

Hallo, ich habe eine ähnliche Dell PERC / LSI-Karte und musste den RAID-Status überprüfen. LSI hat ein Hilfsprogramm namens sas2ircu, das ich sehr nützlich fand. Es gibt auch eine Version für Windows und Linux.

mike_coreit
quelle