"Zink Whisker" Probleme?

8

Guten Morgen;

In unserem Rechenzentrum sind zeitweise Stromversorgungsausfälle aufgetreten, die vorläufig auf "Zink-Whisker" zurückgeführt wurden. Ich fange gerade an, über sie zu lesen (ich habe gerade den Begriff gegoogelt und angefangen, Dinge auszuwählen), und ich interessiere mich für andere Erfahrungen mit ihnen und alle Aufräum- und Wiederherstellungserfahrungen. Vielen Dank!

Schwindel
quelle
Ich habe ein Update versprochen (... vor zwei Jahren ... Entschuldigung), und die Mikroskopuntersuchung ergab Zink-Whisker an einigen Teilen eines ausgefallenen Netzteils. Anschließend haben wir das Rechenzentrum geschlossen, das eher einem großen Serverraum ähnelte, anstatt es zu renovieren. Nochmals vielen Dank an alle, die ihren Einblick angeboten haben.
Dizzle

Antworten:

4

Fragen Sie nach ROHS-Leiterplatten oder nach Zinkbeschichtungen von Doppelböden und Rack-Geräten?

Nicht, dass es viel ausmacht ... da sie dünner als ein menschliches Haar sind, sollten sie im Allgemeinen abbrennen, bevor sie zu einem echten Problem werden. Sie sind auch groß genug, um selbst von den bescheidensten Luftfiltern aufgefangen zu werden.

Innerhalb von Netzteilen sollten sie im Allgemeinen abbrennen, bevor sie zu einem echten Problem werden. Konforme Beschichtungen helfen. Sie stellen in erster Linie nur eine Signalisierungsgefahr in empfindlicheren Logikschaltungen dar, die keine konformen Beschichtungen aufweisen (nicht viele davon).

Höchstwahrscheinlich greift nur ein Anbieter nach Strohhalmen, um die schlechte Auswahl der Qualität für den OEM des Netzteils zu erklären. Es wäre schön, wenn Sie Namen und Modellnummern nennen könnten. Das könnte mehr (und hilfreichere) Antworten bringen.

kmarsh
quelle
Danke kmarsh; Unser Problem betraf hauptsächlich Netzteile für Sun-Geräte (V480-Server, 3310 SCSI-Arrays), Apple-Server (Xserves der 1. Generation) und Dell-Server (PE 2650, 2850, 650, 1850). Wir haben bisher über einen Zeitraum von einem Jahr 37 verloren (die meisten von ihnen sind in zwei größeren Fällen gescheitert), aber die Fehlerbehebung durch unsere Elektriker ist in eine Sackgasse geraten. Und zur Verdeutlichung frage ich nach der Doppelbodenversion des Problems. Wir waren kurz davor, dies unserem bevorzugten Netzteilanbieter zuzuschreiben, aber als es sich auf andere Geräte ausbreitete, mussten wir uns anderswo umsehen.
Dizzle
Interessant. Es gibt auch Stromanomalien und Erdungsprobleme ... diese sind schwer zu debuggen, wenn sie im Moment nicht auftreten.
kmarsh
Eine Sache, die etwas konsistent ist (vielleicht in etwa 30% der Fälle), wenn die Bodenplatten entfernt und ersetzt werden, liegt ein entsprechender Stromversorgungsfehler vor. Ich denke fast, dass das Anbringen der letzten Bodenplatte den Boden etwas "abdichtet", aber die Luft unter dem Boden zu einem Fluchtpunkt drückt, der zufällig der Raum ohne Platte unter unseren betroffenen Gestellen ist? Nur fassen und raten ... unser nächster Schritt ist die Untersuchung der Netzteile unter einem Mikroskop. Sie haben erwähnt, dass sie abgebrannt werden sollten; Also denke ich, warum manche und nicht andere. Vielleicht werde ich sehen, welche temporären Anzeigeoptionen ich habe.
Schwindel
+1 zum "Abbrennen" -Kommentar - In jedem Stromkreis, der echten Strom führt (wie bei einem Netzteil), erwarte ich, dass Whisker fast sofort verdampfen. Meines Wissens nach sind sie eher ein
Problem in
@Dizzle - Interessant, dass das Problem mit dem Entfernen von Bodenplatten zu korrelieren scheint; Welche Art von Arbeit wird ausgeführt, während der Boden geöffnet ist? Wenn jemand Strom berührt (z. B. in einem Schlangenbus), kann dies zu elektrischen Fehlern führen, die Ihre Stromversorgung stören.
voretaq7
1

Ich hatte noch nie einen Fehler, den ich Zink / Zinn-Whiskern zuschreiben konnte, obwohl mein Probensatz nicht riesig ist und ich nie wirklich einen Ausschlag von Stromversorgungsfehlern hatte, wie Sie es beschreiben, der mich auf die Suche nach etwas bringen würde eine Grundursache.

Ich würde mich mit konventionelleren Problemen befassen (schlechte Kondensatoren in der Stromversorgung oder eine vorübergehende elektrische Fehlerrate, die ziemlich hoch ist, zumal Sie sagen, dass Sie zwei "große Vorkommen" von Netzteilausfällen hatten), obwohl es so klingt, als hätten Sie dies bereits getan.


Meine kurze Liste für den Fall, dass sie von Ihrer / der Ihres Elektrikers abweicht:

Elektrisch: Schlecht stabilisierte Stromversorgung aufgrund einer wackeligen USV oder PDU / CDU, Erdschluss usw. Wenn sich Ihre "großen Vorkommen" in Bereichen befanden, die von denselben Stromverteilungsgeräten versorgt werden, wird dies wahrscheinlicher.

Umwelt: Temperatur & Luftfeuchtigkeit; Überprüfen Sie die Einlass- / Auslasstemperatur Ihres Geräts (insbesondere, wenn die Fehler im selben physischen Bereich des Rechenzentrums auftreten: Möglicherweise stellen Sie ein Problem mit dem Luftstrom / der Kühlung fest, das dazu führt, dass Ihr Gerät heiß läuft).

QC für Geräte / Hersteller: Überprüfen Sie die toten Netzteile auf prall gefüllte / durchgebrannte Kondensatoren, insbesondere wenn die Fehler in Einheiten auftreten, die ungefähr zur gleichen Zeit gekauft wurden. Stellen Sie sicher, dass Sie die Netzteile nicht zu stark drücken (viele Festplatten und stromhungrige CPUs erfordern möglicherweise ein größeres Netzteil).

voretaq7
quelle
Ja, Sie haben jeden Punkt getroffen, den unsere Elektriker getroffen haben. Die AC / Luftbefeuchter-Einheit wurde erneut überprüft. Der erste größere Vorfall beschädigte tatsächlich die USV (eine freistehende 16-kVA-Einheit) und eine neue USV wurde aufgrund des Alters / der Reparaturkosten der alten Einheit installiert. Danach ereigneten sich jedoch weitere Vorfälle (nichts Ungewöhnliches in den USV- oder PDU-Protokollen) ; PDUs sind auch brandneu); Einige der ausgefallenen Netzteile wurden von den Elektrikern aufgebrochen und mit neuen verglichen.
Dizzle
Da alle offensichtlichen Dinge getroffen wurden, sind Whisker (oder andere schwebende leitende Bits) definitiv in Grenzen - Es wäre sehr interessant, wenn Sie diese Fehler endgültig auf Whisker zurückführen können.
voretaq7
An diesem Punkt warten wir nur auf die Mikroskopuntersuchung, die hoffentlich in der nächsten Woche stattfinden wird, aber wir haben gerade beschlossen, den Raum vorerst etwas unter Quarantäne zu stellen und zu planen, die Dinge in alternative Rechenzentren zu verlagern. Ich habe gehört, dass die Wiederherstellung davon das Reinigen (und möglicherweise Ersetzen) der Bodenplatten und das Abwischen von allem anderen im Raum beinhaltet. Wenn ich eine konkrete Diagnose bekomme, werde ich diese definitiv aktualisieren. Nochmals vielen Dank für Ihre Zeit.
Dizzle