Server- und Netzwerk-Dashboard

9

Wir haben ein Network Operations Center mit einem Dutzend großer Breitbild-Displays, die uns verschiedene Leistungsdiagramme, Alarme für Server- und Netzwerkgeräte sowie Statusseiten anzeigen. Viele der Seiten waren offensichtlich nicht für die Anzeige auf einem statischen Display konzipiert. Hat jemand ein ähnliches Setup, bei dem er ein bestimmtes Tool oder Paket gefunden hat, das sich durch die Anzeige von Daten auszeichnet? Ich denke, dass ein bisschen benutzerdefinierte Programmierung und vielleicht etwas, das Text scrollen, Zifferblätter, blinkende Lichter und so weiter kann, das produzieren würde, wonach ich suche, aber ich weiß nicht, wo ich anfangen soll. Wenn jemand irgendwelche Vor- oder Nachteile oder Erfolge mit bestimmten Produkten hat, wäre das eine große Hilfe.

UPDATE : Es scheint, dass ich nach einem Tool zur Erstellung von Dashboards suche.

Joseph
quelle
Woher stammen die meisten Daten? Ich gehe davon aus, dass Sie verschiedene Überwachungs- / Alarmierungswerkzeuge verwenden. Ich würde wetten, dass die meisten von ihnen Zusatzanwendungen für die Visualisierung haben.
WerkkreW
Unsere Hauptdatenquellen sind SPECTRUM und Nagios.
Joseph

Antworten:

3

Computer können Daten viel besser analysieren als ich. Ich persönlich bevorzuge Systeme wie OpsView , die Situationen verarbeiten und eine facettenreiche Oberfläche bieten. Überwachungsstatistiken werden nach abnormalen Bedingungen gefiltert, und einzelne Warnungen werden an Administratoren gesendet, die für das System verantwortlich sind. Es gibt ein allgemeines Gesundheits-Dashboard, das vom Helpdesk und vom Management angezeigt werden kann und einen Eindruck davon vermittelt, wie schlimm ein Ausfall ist und ob jemand, der ihn beheben kann, noch daran arbeitet. Sie drehen es auf der großen Leinwand als etwas, das Sie auf einen Blick sehen können, und nicht als etwas, das Sie den ganzen Tag anstarren. Scrollender Text und blinkende Lichter sind nicht die Art und Weise, wie Angestellte mit Ihren Überwachungssystemen kommunizieren sollten.

Conrad Albrecht-Buehler hat einen Google Techtalk ("Making Monitoring Suck Less") , in dem die Vorzüge und Mängel des aktuellen Dashboard-UI-Designs erörtert und einige Verbesserungen vorgeschlagen werden. Ich weiß nicht, ob er Code oder sogar seine These veröffentlicht hat. Die allgemeine Idee ist einfach:

  • Sie definieren Situationsüberwachung als Erfassung einer Reihe von Signalen über einen Zustand. Laden, freier Speicherplatz, Netzwerkverkehr oder sogar übergeordnete Dinge wie Forenbeiträge pro Stunde.
  • Dann definieren Sie eine Beachtungsfunktion, die das breite Eingangssignal von 0 auf 1 abbildet, wobei 0 "ignorieren" und 1 "zomg!" Ist. In Bezug auf Nagios ersetzt er den WARNING-Status durch eine WARNING-Ganzzahl.
  • Schließlich definieren Sie einen Aggregator, um diese WARNING-Signale zusammenzufassen und zu priorisieren.

In Bezug auf bestimmte Tools, die Sie zum Schreiben Ihres eigenen Überwachungssystems verwenden würden, verfügen Nagios-Skripte über eine anständige Oberfläche (wahrscheinlich würden Sie hier ein HEED-Mapping einkleben, wenn Sie möchten). Das Speichern von Signalen kann mit rrdtool und erfolgen Sie können daraus Diagramme erstellen , und es gibt eine Django-App namens Graphite , die rrd-Datenbanken rendert. Es gibt auch Nagvis :

NagVis ist ein Visualisierungs-Addon für das bekannte Netzwerkmanagementsystem Nagios.

NagVis kann zur Visualisierung von Nagios-Daten verwendet werden, z. B. zur Anzeige von IT-Prozessen wie einem Mailsystem oder einer Netzwerkinfrastruktur.

jldugger
quelle
5

Was ich getan habe, ist, dass ich so viel davon in einen Webbrowser bekomme, wie ich kann. Dann benutze ich Firefox, IE-TAB und Tab Mix Plus, um die Daten anzuzeigen.

Mit Tab Mix Plus können Sie die Registerkarten nach einem Zeitplan automatisch aktualisieren und drehen.

Mit IE-Tab können Sie IE-Fenster in den Registerkarten anzeigen, sodass TMP die automatische Drehung und Aktualisierung durchführen kann.

Dann können Sie alle gewünschten MRTG-, CATI-, NAGIOS-, What'sUp Gold- und Wireless-Monitore anzeigen, die sich automatisch drehen, automatisch aktualisieren und glänzend sind ... :)

Wir haben einen Entwickler, der WPF-Apps zum Spaß erstellt. Wenn ich also glänzend sein möchte, erstellt er diese für mich.

Thomas Denton
quelle
nett. danke für die idee. Ich habe eine Weile darüber nachgedacht, wie das geht
MikeJ
4

Wir hatten zu viele Displays und nicht genug nützliche Informationen, also haben wir total geschummelt. Wir haben einen interessanten LCARS-basierten Bildschirmschoner gefunden (sieht aus wie die Displays von Star Trek) und ihn auf einem der inaktiven Displays ausgeführt. Das war derjenige, den die Chefs am meisten beobachteten.

Tim Howland
quelle
3
Jep. Der größte Bedarf an der großen Leinwand scheint darin zu liegen, dass die Chefs einen Schauplatz wollen. Ich erinnere mich an einen Job, bei dem wir einige gefälschte, aber gut aussehende Do-Nothing-Displays aufgestellt haben. Unser echtes Statussystem war die Hintergrundfarbe. Grün für nominelle Operationen; gelb, wenn wir Probs hätten, die mindestens eine Person auf Regieebene zur Kenntnis nehmen würden; rot, wenn es 3 oder mehr Regisseure verärgern würde. Offensichtlich schwarz für einen Ausfall aller Systeme. Ha-hah.
Quux
1

Ich habe meine eigene Nagios-Visualisierung geschrieben, nachdem ich herausgefunden hatte, dass keine der leicht zu findenden Versionen Hunderte von Hosts mit Zehntausenden von Überprüfungen verarbeiten kann. (Um den Code freizugeben, brauche ich ein paar Leute, die ihn außerhalb meiner Umgebung ausprobieren möchten, damit ich die Chefs überzeugen kann.)

Selbst die wenigen, die möglicherweise nicht kaputt gehen, erforderten eine manuelle Konfiguration, für die unser Nagios-Konfigurationsgenerator nicht pervers sein konnte.

Meine Visualisierungen werden unter OS X und Linux verwendet. Seltsamerweise ist Opera der einzige OS X-Browser mit einem funktionierenden Vollbildmodus, weder Safari (und dazu gehört auch das Webkit) noch FireFox.

Ein paar allgemeine Tipps:

  • Große Schriftarten bis hin zur Automatisierung von Layouts, damit sie größer werden, wenn weniger angezeigt werden
  • Verwenden Sie die Sortierung, damit die größten Probleme zuerst auftreten
  • Verwenden Sie aus Gründen der Zuverlässigkeit die META-Aktualisierung und nicht Javascript
  • Geben Sie Ihr Bestes, um die erforderliche Wartung zu minimieren. Lassen Sie sich besser vor einem System warnen, das noch nicht in Produktion ist, und stellen Sie ein Jahr lang fest, dass es den Displays nie hinzugefügt wurde
  • SVG kann wunderbar sein, obwohl sie im Laufe der Zeit beschädigt zu werden scheinen (wir verwenden eine einfache Grafik eines Zustands als zusätzlichen visuellen Hinweis).
LapTop006
quelle
0

Ich kenne keine vorhandenen Pakete, aber wenn Sie mit dem Codieren zufrieden sind und Ihr NOC Windows-basiert ist, könnten Sie an den von / n angekündigten PowerShellToys interessiert sein. Es gibt einen Beitrag im PowerShell-Blog , der weitere Informationen und Links zu jedem PowerShellToy enthält. Mein erster Gedanke, als ich davon hörte, war, dass sie ideal für die Erstellung eines Dashboards zur Überwachung von Servern und so weiter sind.

Alastairs
quelle
Während die Systeme, auf denen die Anzeigen ausgeführt werden, Windows-basiert sind, stammen die Daten hauptsächlich von Linux-basierten Systemen. Ich bin mir nicht sicher, ob das helfen würde. Die Idee eines Dashboards ist genau das, wonach ich suche.
Joseph
0

Wir verwenden die BAC-Tools von Mercury (jetzt HP) für unsere Dashboards. Ich kann Zähler, Warnungen usw. aus so vielen Quellen entnehmen, ihre Statistiken knacken und diese Statistiken auf verschiedene Weise in ein Dashboard einfügen. Ich warne Sie jedoch, dass dies eine High-End-Lösung ist - sehr teuer.

Chopper3
quelle