Wichtige Dinge, nach denen Sie in einem Rechenzentrum suchen sollten

34

Ich versuche, eine einfache Checkliste zu erstellen, um die Qualität eines Rechenzentrums zu bestimmen. Wo und wonach soll ich suchen und wie kann ich feststellen, ob die Eigentümer dies sagen (z. B. "Unsere USV hält das Rechenzentrum 100 Tage lang in Betrieb, ohne macht ") ist wahr oder nicht? Was sind typische Anzeichen oder gute oder schlechte Rechenzentren?

AX1
quelle

Antworten:

43

Hier ist eine Liste von Fragen, die ich mir beim letzten Einkauf im Rechenzentrum gestellt habe:

  • Erläutern Sie, was Sprinkler für unsere Geräte benötigen.
  • Was werden entfernte Hände tun wollen? Zum Beispiel Festplatten installieren, Bänder drehen ...
  • Sind Ihre entfernten Hände 24/7/365 erreichbar, durchschnittliche Wartezeit, bis sie den Käfig erreichen, nachdem Sie ein Ticket eingereicht haben (Wie werden Tickets eingegeben?)?
  • Sind Sie in mehreren Gittern?
  • Haben Sie eine erhöhte Bodenkühlung?
  • Wie viele Rechenzentren betreiben Sie neben diesem?
  • Wie lange kann das Rechenzentrum mit Backup-Strom betrieben werden?
  • Können wir Geräte direkt an das Rechenzentrum liefern lassen?
  • Gibt es eine Anlieferungsstation und kostenlose Parkplätze in der Nähe?
  • Müssen wir einen Lieferanten, der zum Rechenzentrum kommt, begleiten?
  • Welche Umgebungstemperatur und Luftfeuchtigkeit wird eingehalten?
  • Wie viele ISP-Optionen gibt es?
  • Hat einer Ihrer Kunden in der Geschichte des Rechenzentrums jemals für längere Zeit Strom verloren?
  • Wie lange ist dieses Rechenzentrum in Betrieb?
  • Welche Zugangskontrollen sind sowohl für den Boden als auch für die Ausrüstung vorhanden?

Wenn Sie mehrere besuchen und diese Fragen zwischen dem Preis, Ihren Besuchsimpressionen und deren Antworten stellen, ist wahrscheinlich klar, welche Sie möchten. Stellen Sie sicher, dass Sie sie immer besuchen und besuchen Sie eine gute Menge von ihnen.

Kyle Brandt
quelle
2
Gut gemacht. +1 an Sie.
gWaldo
3
Ich würde auch nach Zugangskontrollen sowohl zum Boden als auch zu Ihrer Ausrüstung fragen.
Scott Pack
Tolle Liste !! Ich würde hinzufügen: "Besitzen Sie das Gebäude?" Auch wenn sie Sprinkler haben, gehen Sie weg!
JakeRobinson
@JakeRobinson Sprinkler werden von der Brandschutzrichtlinie auch in Rechenzentren vielerorts benötigt. Wenn Sie Sprinkler sehen, fragen Sie, ob sie Trockenrohrsprinkler sind .
sysadmin1138
3
@JakeRobinson Der neue DC, in den ich 2003 gezogen bin, hatte sowohl FM200 als auch Sprinkler. Die Feuerwehrleute waren sehr fest davon überzeugt, dass es Sprinkler geben musste. Wenn die FM200 das Feuer löschen kann, großartig. Wenn dies jedoch nicht der Fall ist (der UPS-Ausbruch verletzt den FM200-Staudamm, sodass O2 nach einer Müllkippe eindringen kann), wird das Gebäude durch viel Wasser geschont. Das richtige Trockenrohrsystem bedeutet, dass der Gleichstrom nicht überflutet wird, wenn ein Sprinklerkopf angestoßen wird.
sysadmin1138
6

Kyle hat es ziemlich gut abgedeckt, aber hier sind ein paar Punkte:

Die physische Sicherheit ist enorm. Es sollte fast ein Akt des Kongresses dauern (Parlament, hier langsam voranschreitende bürokratische Institution einfügen), um hineinzukommen.

Es sollte eine Halon-Feuerunterdrückung haben, keine Sprinkler. Server sollten nicht feucht sein. (Lokale Brandbekämpfungsvorschriften können außer Kraft gesetzt werden ...)

Finden Sie heraus, welche Serveranbieter sie bevorzugen. Sofern es sich nicht um einen bestimmten Grund handelt (z. B. das Betreiben eines Google-ähnlichen Rechenzentrums), sollten es sich um Nameserver handeln. (Dell, HP, IBM, Sun, Apple usw.) Wenn dort "White-Box" oder eine Marke steht, die Sie nicht kennen, führen Sie das Programm aus. Beachten Sie, dass es einige seriöse Serverhersteller der unteren Ebene gibt, die seriös sind (z. B. System76). "Benutzerdefiniert" bedeutet jedoch, dass sie die Dinge selbst zusammenstellen. Großartig für Ihr Zuhause, aber schlecht für Ihr Rechenzentrum. (Dies beinhaltet nicht den Kauf eines HP Proliant DL580 und die Installation von Dingen wie Speicheroptionskits oder Laufwerkkäfigen.)

Welche Eigentumsoptionen stehen zur Verfügung? Kaufen Sie durch sie? Direkt kaufen und dort ablegen? Leasing? VMs?

gWaldo
quelle
4
Stimmen Sie der Brandbekämpfung zu, obwohl für "Halon" "Halon / FM200 / Argonit / Inergen / anderes Löschgas hier" zu
lesen ist
11
Sprinkler sind tatsächlich an vielen Stellen durch Brandschutzvorschriften vorgeschrieben . Das habe ich 2003 bei einem DC-Build herausgefunden, bei dem ich mitgewirkt habe. Es sollte nur ausgelöst werden, wenn der FM200 die Wärmequelle nicht löscht. Es sollte sich um eine Trockenrohr- Sprinkleranlage handeln, die das Inertgas unterstützt.
sysadmin1138
2

Hervorragend wie immer Kyle, ein paar Dinge, die ich aus Erfahrung gelernt habe:

  • Fragen Sie, ob es Generatoren zur Sicherung der USV gibt. Wenn ja, wurden die Generatoren wie oft getestet?

  • Welche physischen Schlösser und Kontrollen sind vorhanden, um zu verhindern, dass Elektriker den Strom abschalten?

  • Welche Haftung / Versicherung haben sie?

  • Wie gehen sie mit Situationen um, in denen sie ihre SLA nicht einhalten?

  • Wie oft haben sie keine SLA getroffen?

  • Wie viel Strom liefern sie für jedes Rack / Käfig / usw.? (Wird die Stromversorgung eingeschränkt sein und Sie benötigen ein anderes Rack / einen anderen Käfig nur für die zusätzliche Stromversorgung?)

  • Fragen Sie nach Referenzen, in Ihrer Branche wäre das gut.

Lustige Geschichten, die damals nicht lustig waren:

  1. In Vancouver gab es ein Feuer in einem unterirdischen Elektrofach, 4 Blocks von meinem DC entfernt. Das Feuer löschte den Strom für einen Radius von 10 Blöcken. Die USV ließ die Lichter an, bis der Generatorsatz online ging. Gen-Set blieb ungefähr eine Stunde online, bevor es überhitzte. USVs konnten das Licht für weitere 30 Minuten anhalten, nachdem der Generator eine Sicherheitsabschaltung durchgeführt hatte. Gen-Set gehörte zum Gebäude, IIRC der DC konnte ihnen die Schuld geben und wusch sich die Hände.

  2. Ein Elektriker hat die Stromversorgung für ein paar Reihen von Racks im DC unterbrochen, weil die Schalttafel ein bisschen heruntergefallen ist und alle Unterbrecher aufgestoßen hat. Ich habe auch gehört, dass ein Elektriker in einem anderen DC an einer USV arbeitet, diese nicht in den Bypass-Modus versetzt und den gesamten DC ausschaltet.

Clint
quelle
Ist es in solchen Fällen ratsam, eine Rack-USV zu haben, oder spielt es keine Rolle, dass die Verbindung normalerweise sowieso unterbrochen wird?
AX1
Es wäre schön gewesen ... Unser DC sagte, wir dürften keine USV in unseren Racks haben, sie gaben uns einen Grund, aber ich erinnere mich nicht, was es war.
Clint
Vielleicht wärme? Ich habe nicht viel Erfahrung mit Rack-UPS, aber Consumer-UPS heizen sich immer auf.
AX1
4
@ AX1: UPSs in einer Verkettung durcheinander. Sie erwarten bestimmte Eigenschaften im Strom, und andere USVs können diese herausfiltern. Das Netzwerk wird wahrscheinlich ausfallen, sobald der DC die Stromversorgung verliert. Selbst wenn Ihre Server in Betrieb sind, wird dies nicht der Fall sein.
Quinnr
Könnte ein Brandcode sein, wenn das EPA getroffen wird, erwarten die Feuerwehrleute, dass es keinen Strom unter Spannung gibt.
Sean Reifschneider
1
  • Ich würde sagen, dass wahrscheinlich ein Drittel eines Rechenzentrums die technischen Werbebuchungen sind (Haben Sie {VESDA, Betankungsverträge, durch UPS abgedeckte Kältemaschinen, mehrere Stromnetze, verschiedene Fasereingänge)?

  • Ein weiteres Drittel ist, wie sie damit umgehen, wenn die Dinge nicht richtig laufen. Schlucken sie ihren Stolz, untersuchen das Versagen und überlegen, was zu tun ist, um sicherzustellen, dass es nicht wieder vorkommt? Oder machen sie einfach weiter, was vorher nicht funktioniert hat?

  • Und das andere Drittel ist das Personal. Sind sie intelligent, einfach zu handhaben und drehen sich nicht jeden Monat um?

Aber noch wichtiger: Haben sie den Platz, den Sie brauchen? Ein Ort, an den wir uns beinahe begeben hätten, innerhalb von 2 Jahren haben wir mehr Platz in Anspruch genommen, als sie zur Verfügung hatten.

Sean Reifschneider
quelle
1

Ich arbeite in einem kleinen Rechenzentrum im Silicon Valley. Ich bin der Sysadmin auf der Managed-Server-Seite des Geschäfts.

Schlechte Zeichen:

  • Fehlende redundante Überwachung und Alarmierung für Strom, Temperatur und Luftfeuchtigkeit
  • Fehlende Überwachung für Netzwerkgeräte, Colos, Server und andere Geräte
  • Wirrwarr und keine Kabelbinder oder andere Kabelführung verwenden, um saubere, organisierte Racks zu halten

Gute Zeichen: - Dieselgenerator vor Ort mit automatischem Failover - Backup-Chiller und Air-Handler mit automatischem Failover - Viel Bandbreite auf den wichtigsten Carrier-Backbones (AT & T, XO Comm) - Redundante Netzwerkanbieter - Redundante Core-Router, Firewalls, Load Balancer und Switches - Laufen Speicherüberprüfung und Hardwarediagnose vor der Bereitstellung von Servern

Nameserver sind in Ordnung, aber wenn sie alt sind und schon ein paar Mal in der Nähe waren, sollten Sie sicherstellen, dass sie die Hardwarediagnose bestehen, bevor Sie sie verwenden.

Ein gutes Rechenzentrum sollte seinen Kunden eine Website bieten, auf der sie den Bandbreitenverbrauch und die Verfügbarkeit überwachen können. Sie sollten auch alle Fragen beantworten. Fragen Sie sie nach Marke und Modell ihrer USV. Bitten Sie sie, die aktuelle Last der USV zu ermitteln. Mit diesen Informationen können Sie überprüfen, wie lange es ohne Strom auskommt.

Aber ehrlich gesagt sollte die USV nicht Ihr Anliegen sein. Eine USV bietet nur eine kurze Betriebszeit (ca. 30 Minuten). Eine viel bessere Sorge ist, wenn der DC einen Backup-Generator hat. Es lohnt sich auch zu fragen, in welchem ​​Netz sich der DC befindet. In Bezug auf Brownouts und Blackouts werden verschiedenen Rastern unterschiedliche Prioritäten zugewiesen. Erraten Sie, was? Krankenhäuser und Feuerwachen haben hohe Priorität (Strom wird nie unterbrochen). Befindet sich das Rechenzentrum im selben Netz, ist seine zuverlässige Stromversorgung garantiert.

Fragen Sie sie, wie viel Strom pro Rack zur Verfügung steht. Wo ich arbeite, versorgen wir jedes Rack mit 3 x 25 Ampere Stromkreisen. Ein typischer 1u-Server verbraucht 1-3 Ampere.

80skeys
quelle
Die, zu der ich in Versuchung bin, hat 40 Ampere pro Rack. Ist das zu niedrig Es ist fast die Hälfte von dem, was Sie sagen (75 Ampere).
AX1
1
@ AX1, 40A bei 110 V ist 4400 W; bei 230V ist es 9200W. Es sei denn, es handelt sich um eine hohe Dichte (Twin / Twin ^ 2 / Blade) oder HPC / GPU, das ist VIEL.
Mircea Chirea