Überwachen und Protokollieren der Hardwaretemperaturen und -last des Servers

15

Ich suche nach einer Möglichkeit, die Temperaturen und die Auslastung meiner Serverhardware zu protokollieren und zu überwachen (wie bei CPU oder RAM). Wie könnte ich das machen?

Ziel ist es:

  • Stellen Sie sicher, dass sich die Hardware nicht erwärmt
  • Identifizieren Sie, was aufgerüstet werden sollte und was zu viel ist (wie zum Beispiel, um zu lernen, dass man nicht so eine gute CPU bekommt).

Ok, ich kann eines der Applets in der Taskleiste verwenden, aber wie sieht es mit der Protokollierung aus ?

Jiew Meng
quelle

Antworten:

18

Wenn Sie etwas wollen, das nicht von einem Desktop abhängt :

Schauen Sie sich lm-Sensoren an Installieren Sie lm-Sensoren . Aus der Beschreibung:

Lm-sensors ist ein Paket zur Überwachung des Hardwarezustands für Linux. Es erlaubt
Sie können auf Informationen zu Temperatur, Spannung und Lüftergeschwindigkeit zugreifen 
Sensoren. Es funktioniert mit den meisten neueren Systemen.

Dieses Paket enthält Programme, mit denen Sie Daten einrichten und lesen können
lm-sensoren.

Von ihrer Projektseite (2016 bearbeiten: Projekt ist tot. Unser eigenes Wiki hat einige Informationen ):

  • Unbeaufsichtigte automatische Überwachung von High-End-Servern, Routern oder anderen unternehmenskritischen Maschinen. Erstellen Sie ganz einfach einen Cron-Job, um den Status Ihrer Hardware abzufragen und Ihnen im Falle eines Problems eine E-Mail zu senden, bevor es kritisch wird. Auf diese Weise können Sie innerhalb von Sekunden benachrichtigt werden, wenn eine kritische Komponente wie ein Netzteil, ein Lüfter oder ein anderer Kühlmechanismus ausfällt, oder sogar feststellen, ob das Gehäuse geöffnet wurde.
  • Eingebettete Systeme unter Linux. Diese können dieses Paket zur Überwachung von Spannungen, Temperaturen, Lüfterdrehzahlen usw. mit handelsüblichen Komponenten und einer Reihe von Busschnittstellen (z. B. ISA, SMBus, I2C oder SPI) verwenden.
  • Allgemeiner Datenerfassung. Messen Sie einfach verschiedene Arten von Daten (Drehzahlen, Spannungen, Temperaturen usw.) mit billigen Standardteilen. Sehr nützlich für die Systemautomatisierung (zu Hause, in der Werkstatt, in der Wetterstation, wie Sie es nennen).

lm-sensors hat einen Daemon namens sensord, der RRDtool für 'Datenerfassungs- und Grafiksystem für Zeitreihendaten' verwendet. Es enthält also Grafiken wie diese, die über einen Webserver angezeigt werden können:

im1

(entnommen aus der lm-sensors Projektseite).

Um den Sensord-Daemon zu installieren, müssen Sie wahrscheinlich das Sensord-Paket installieren.

Beispiel aus meinem Notizbuch:

im2

Die Konfigurationsdatei dafür befindet sich unter /etc/sensors3.conf

lm-sensorsist eine Art Basis für jede Temperaturmessung. Desktop-Elemente beziehen ihre Informationen höchstwahrscheinlich aus diesem Paket. Ein Beispiel Wenn Sie etwas wollen, das von einem Desktop abhängt

psensor.

  • Motherboard- und CPU-Sensoren ( Installation von lm-Sensoren erforderlich ).
  • NVidia-GPUs
  • Festplattenlaufwerke (hddtemp muss installiert sein).
  • Lüfterdrehzahl (wieder müssen lm-Sensoren installiert sein).

Installation durch Hinzufügen eines PPA:
sudo add-apt-repository ppa:jfi/ppa
sudo apt-get update && sudo apt-get install psensor

(Oneiric wird psensor enthalten haben)

(altes) Beispiel von ubuntugeek.com : im6

Rinzwind
quelle
Sieht nach einer tollen Antwort aus. Scheint, als wären Bilder und Links kaputt. : - /
user121330
Das Bild ist nur das Symbol für das Installations ;-) Siehe meta.askubuntu.com/a/1853/15811 was zu tun ist (jeder kann es sich ändern hostmar.co/software-small oder hostmar.co/software-large ). Aber das Projekt selbst ist tot .... schade: * (
Rinzwind
5

Wenn Programme wie Cacti zu umfangreich sind, gibt es ein Skript, das sich nur tagsüber in eine Textdatei protokolliert - führen Sie es mit crontab aus. Dafür muss das lm-sensors Programm installiert sein.

#!/bin/bash
_now=$(date +"%Y_%m_%d")
_file="temp_log_$_now.txt"
(date; sensors; echo '-----------') | cat >> "/var/log/temperatures/$_file"
Darius.V
quelle
4

Für die Protokollierung von CPU / RAM / Temperaturen / Verkehr auf einem Server empfahl ich Cacti . Es wird als 'vollständiges Frontend für RRDtool ' beworben und kann über mehrere Datenquellen wie lm-Sensoren, SNMP oder sogar benutzerdefinierte Skripte verfügen. Die Daten werden in RRD gespeichert und zur Erstellung von Tages-, Wochen-, Monats- und Jahresdiagrammen verwendet.

Weitere Informationen, Screenshots und Links zu Live-Beispielseiten finden Sie auf der Cacti-Website . Es kann schwierig sein, das erste Mal einzurichten, aber es lohnt sich am Ende.

Drgrog
quelle
2
Das Erfordernis der Installation von MySQL schränkt seine Anwendungsfälle ein
Scott Stensland
3

Ich verwende zenoss , um ungefähr 70 Unix- und Windows-Server in meinem Büro zu überwachen. Wir überwachen auch alle Netzwerkgeräte und sogar einen Thermostat im Serverraum. Das meiste davon erfolgt über SNMP. (Wir verwenden jedoch einige benutzerdefinierte Skripts, um die Leistung einiger Anwendungen zu überwachen.)

Die meisten Server (wie Dell und HP) verfügen über interne Temperatursensoren, die Sie mit SNMP abfragen können. Sie können auch Prozesse, CPU-Auslastung, Netzwerkdurchsatz usw. überwachen. Ich erhalte Warnungen, wenn Server offline gehen oder zu viel CPU verwenden oder kritische Prozesse ausfallen.

Im Ernst, ich kann nicht genug drängen, um Dinge wie Zenoss , Hyperic und Nagios zu betrachten ! Die kostenlosen Versionen können mehrere Systeme überwachen, sie können jedoch auch nur ein System überwachen. Sie helfen bei der Fehlerbehebung und ermitteln, was ein Server um 2 Uhr morgens tat, als ein Problem auftrat.

Brian
quelle
1

Überprüfen Sie diesen Link: https://launchpad.net/indicator-sysmonitor

im1

(von OMG Ubuntu )

Installation:

sudo add-apt-repository ppa:alexeftimie/ppa
sudo apt-get update && sudo apt-get install indicator-sysmonitor

Anmerkung: funktioniert nur in Natty / 11.04

George
quelle
das ist vielleicht eine sehr blöde frage aber wie installiere ich das? Ich versuchte sudo add-apt-repository 'deb http://ppa.launchpad.net/alexeftimie/ppa/ubuntu natty main'& sudo apt-get install indicator-sysmonitordannUnable to locate package indicator-sysmonitor
Jiew Meng
@jiewmeng Ich bearbeitete in einem Bild und Installationsmethode
Rinzwind
1

Ich habe pandora fms verwendet, um ungefähr 40 Server und 100 Computersysteme in meinem Unternehmen sowie deren Webseite zu überwachen. Möglicherweise ist es hilfreich, einen Software-Agenten auf Ihrem Server zu installieren und lokale Module so einzurichten, dass sie überwachen, was Sie benötigen. Wenn Sie es hier ausprobieren möchten, können Sie die Webseite von pandora: Panndora FMS Unified Monitoring Tool besuchen

Grüße

Ivo Yordanov

ivo_yordanov
quelle
1

Überprüfen Sie das Paket Munin , es kann fast alles überwachen.

https://help.ubuntu.com/lts/serverguide/munin.html https://wiki.ubuntuusers.de/munin

sudo apt-get install apache2
sudo apt-get install munin-node`
sudo systemctl enable munin-node
sudo a2enconf munin

Überprüfen Sie die Zugriffsberechtigung in /etc/apache2/conf-enabled/munin.conf wie folgt:

<Directory /var/cache/munin/www>
    Require all granted
    AllowOverride None
    Order Allow,Deny
    Allow from all
    Options None
</Directory>

<Location /munin-cgi/munin-cgi-graph>
    Require all granted
    <IfModule mod_fcgid.c>
        SetHandler fcgid-script
    </IfModule>
    <IfModule !mod_fcgid.c>
        SetHandler cgi-script
    </IfModule>
</Location>

Starte apache2 neu:

sudo apache2ctl restart

Feuern Sie Ihren Browser an: http: // localhost / munin - viel Spaß.

Weitere Optionen finden Sie in / etc / munin.

Thomas
quelle