Wie kann ich verhindern, dass Dell R730xd-Lüfter auf Hochtouren laufen, wenn eine Broadcom / QLogic NetXtreme 57711-PCI-Karte hinzugefügt wird?

8

Ich habe ein Paar Broadcom NetXtreme 57711 10GbE-Karten. Ich habe einen in einen Dell R710 gesteckt. es bootet mit der Karte gut, das Betriebssystem (CentOS 7) erkennt es und alles scheint gut zu sein. Wenn ich jedoch die andere Karte in ein R730xd (ebenfalls mit CentOS) stecke, passiert etwas Unerwartetes: Die Lüfter des R730xd schalten auf hohe Geschwindigkeit, sobald das System das Betriebssystem startet, und laufen kontinuierlich mit hoher Geschwindigkeit, egal was gerade passiert . Die Lüfter laufen bei der Interaktion mit dem Lifecycle Controller oder den BIOS-Bildschirmen nicht mit voller Geschwindigkeit. Sie drehen sich erst mit voller Geschwindigkeit, wenn der Computer das Betriebssystem startet und bevor das Betriebssystem gestartet wird. Es scheint also keine Funktion des Betriebssystems zu sein.

Ich habe die Firmware des R730xd auf die neuesten verfügbaren Versionen aktualisiert, versucht, die CPU-Leistungsprofile im BIOS festzulegen, und ich habe versucht, das thermische Profil im iDRAC festzulegen, aber nichts scheint das Verhalten zu ändern. Das System wechselt immer in den Vollbetriebsmodus. Beim Googeln wird mindestens eine andere Person auf ein ähnliches Lüfterverhalten beim Hinzufügen einer PCI-Karte zu einem R730xd gestoßen (obwohl unklar ist, ob es sich um dieselbe Karte handelt - es scheint nicht so zu sein).

Was mache ich falsch? Noch wichtiger ist, kann dieses Verhalten geändert werden, damit die Lüfter nicht mit voller Geschwindigkeit stecken bleiben?

mhucka
quelle
1
Ich würde Dell anrufen und ein Support-Ticket öffnen. Die 13. Generation war ... schrecklich, besonders auf der Softwareseite. Außerdem würde ich sicherstellen, dass Ihr iDrac am 2.15.10.10 und das BIOS mindestens 1.3.6
Zypher
Stellen Sie sicher, dass der Gehäusedeckel ordnungsgemäß befestigt ist. Wenn der Sensor glaubt, dass das Gehäuse offen ist, laufen die Lüfter mit voller Geschwindigkeit.
Bad Dos
@BadDos Guter Vorschlag, aber wenn ich die Karte herausnehme, passiert das Verhalten nicht. Ich lege die Karte wieder ein und es passiert. Ich habe das wiederholt, also bin ich mir ziemlich sicher, dass es nicht der Deckel ist. (Aber ich wünschte, es wäre so einfach ...)
Mhucka
@Zypher Ich habe gerade die Versionen überprüft: idrac ist 2.15.10.10, bios ist 1.3.6, aber (und dies kann ein Hinweis sein) die Broadcomm / QLogic-Karte wird nicht in der Firmware-Update-Liste angezeigt. Keine der beiden BCM57711-Karten, die ich im R730xd gezeigt habe, aber beide erscheinen im R710. Es scheint also, dass der R730xd den BCM57711 nicht erkennt. Ich denke, es wird nicht unterstützt?
Mhucka
@ Zypher Du hast zu schnell geantwortet :-). Ich habe den vorherigen Kommentar gelöscht und mit den richtigen Maschinennummern aktualisiert. Entschuldigen Sie die Verwirrung!
Mhucka

Antworten:

3

Nach dem Chat in den Kommentaren habe ich also wahrscheinlich schlechte Nachrichten.

Dell-Hardware, die mit einem Server als konfiguriertem Element geliefert wird - welches IIRC diese Broadcoms wo -, ist zwischen den Generationen fast nie vergleichbar. Dell tendiert dazu, benutzerdefinierte Firmware zu verwenden, die sich in all ihre Managementsysteme einfügt.

Kurz gesagt, der Teil ist wahrscheinlich nicht vergleichbar, wird nicht unterstützt und verursacht seltsame Probleme wie das, was Sie sehen.

Hinweis: Dies gilt nicht für Teile, die über den Zubehörkatalog verkauft werden, sowie für Teile, die im Rahmen eines Dell Server Builds geliefert werden.

Zypher
quelle
Ich hoffte wirklich, dass es eine andere Lösung dafür geben würde. Es scheint nicht , wie BCM57711 das sind die alten. Ich weiß, dass es an Dell liegt, zu entscheiden, zu welchem ​​Zeitpunkt ein bestimmtes Produkt für veraltet / inkompatibel gehalten wird, aber dies ist meiner Meinung nach im Vergleich zu anderen Dingen ein ziemlich kurzer Zyklus. Ich denke, die einzige Lösung besteht darin, ein neueres Modell des BCM57711 zu erhalten, das mit dem R730xd kompatibel ist, aber sie sind teuer (auch gebrauchte), und mein Forschungsstipendium kann es sich nicht leisten. Schade. Auf jeden Fall vielen Dank für Ihre Zeit bei der Lösung der Ursache dieses Problems.
Mhucka
@mhucka FWIW Sie brauchen keine 10-g-Karte der Marke Dell. Finden Sie einfach eine, die Sie sich leisten können, und legen Sie sie dort ein. Ich stimme auch zu, dass diese Inkompatibilitäten dumm sind.
Zypher
@Zephyr Das wäre toll, aber ... gibt es eine Möglichkeit zu wissen, ob eine bestimmte Karte kompatibel ist? Oder meinen Sie eine der Optionen, die als Optionen für den R730xd aufgeführt sind ( dell.com/us/business/p/poweredge-r730xd/pd )?
Mhucka
2
Jede PCI-E-Karte sollte funktionieren. Der Unterschied zu Dell-Karten besteht darin, dass sie über eine Firmware verfügen, die mit ihrer Verwaltungssoftware interagiert. Dies führt zu Inkompatibilitäten zwischen den Generationen. Wir haben 10G-Karten der Marke Intel mit großem Erfolg über mehrere Generationen hinweg verwendet.
Zypher
@Zypher Sie sagen also im Grunde, dass Dell-Karten denen von Drittanbietern unterlegen sind? ;-)
ivan_pozdeev
9

Nachdem ich mir die Haare auf dem neu angekommenen schönen R730xd mit 16 3,5-Zoll-Festplattensteckplätzen herausgerissen habe, die Lüfter mit 15.000 U / min drehen, wenn sich die Intel X520-DA2 10G-Karte in einem beliebigen PCI-Steckplatz befindet, habe ich die folgende Lösung für CentOS 6.7 gefunden, um Lüfter im Jet-Modus in den Ruhezustand zu versetzen: Obwohl es sich um Brute Force handelt, kann der Temperaturfühler der 10G-Karte nicht berücksichtigt werden. Dies kann zu einem Burnout der Karte aufgrund von Überhitzung führen. Ich halte dies jedoch für unwahrscheinlich. Wahrscheinlich gibt es eine Möglichkeit, die thermischen Messwerte des X520 zu überwachen.

** Beschreibung: Die standardmäßige automatische Kühlreaktion auf dem PowerEdge 13G-Server für PCIe-Karten von Drittanbietern bietet einen Luftstrom, der auf den branchenüblichen Kartenanforderungen basiert. Unser thermischer Algorithmus zielt auf die Abgabe von maximal 55 ° C Einlassluft an die PCIe-Kartenregion basierend auf diesem Industriestandard ab.

Für einige Karten, die möglicherweise keine zusätzliche Kühlung über der Basislinie benötigen (z. B. solche mit eigenem Lüfter), hat Dell einen OEM-IPMI-basierten Befehl aktiviert, um diese Standard-Lüfterantwort auf die neue PCIe-Karte zu deaktivieren.

Um Abhilfe zu schaffen:

1. Installieren Sie die IPMI-Tools:

yum install OpenIPMI OpenIPMI-tools
chkconfig ipmi on  # << optional for the task
service ipmi start  # << optional for the task

2. Fragen Sie die auf PCIe-Karten basierende Standard-Systemlüfterantwort von Dell ab:

ipmitool raw 0x30 0xce 0x01 0x16 0x05 0x00 0x00 0x00

# response like below means Disabled
16 05 00 00 00 05 00 01 00 00

# response like below means Enabled
16 05 00 00 00 05 00 00 00 00

3. Schaltet die Standard-Kühlreaktionslogik der PCIe-Karte eines Drittanbieters aus oder setzt sie auf Deaktiviert:

ipmitool raw 0x30 0xce 0x00 0x16 0x05 0x00 0x00 0x00 0x05 0x00 0x01 0x00 0x00 

4. Düsen einschalten oder PCIe-Karte der Drittanbieter-Standard-Kühlreaktionslogik auf Aktiviert setzen:

ipmitool raw 0x30 0xce 0x00 0x16 0x05 0x00 0x00 0x00 0x05 0x00 0x00 0x00 0x00 

Referenzen: Windows-Dienstprogramm ( Link ) Spiceworks-Beitrag für Windows und GPU-Karten von Drittanbietern, der dazu führt, dass Gen13 Dell Fans dreht ( Link )

Weitere Ergebnisse: Das X520-2-Firmware-Paket von Dell ( hier ) erkennt keine neuen In-Box -Produkte von Amazon im Wert von 188 US-Dollar gegenüber 586 US-Dollar von Dell

kuz8
quelle
1
Vielen Dank, ich wurde fast von meinem verrückten Geräusch des DELL T630 getötet, und diese Befehle haben mir nur das Leben gerettet!
Windoze
1
Beeindruckend. Ich habe genau diese Konfiguration mit genau diesem Problem. Ich kann nicht glauben, dass es die X520-Karte war, die das Problem verursacht hat. Ich danke dir sehr.
Zymhan