Was ist eine regelmäßige Wartung, die Sie auf Ihrem Linux-Server durchführen müssen?

7

Ich habe einen Server, auf dem nur wenige Websites gehostet werden. Ich habe seit etwa zwei Monaten keine Wartung mehr durchgeführt, außer ein paar Protokolle anzusehen und sie zu komprimieren.

Sie fragen sich nur, welche regelmäßigen Wartungsarbeiten Sie an Ihrem Linux-Server durchführen müssen? Gibt es Skripte, mit denen Sie die Wartung durchführen können?

Max Thomson
quelle
2
Meine Überwachungstools sind der "regelmäßigen Wartung" am nächsten, die normalerweise wichtig ist. Und alles, was sie tun, ist zu überwachen.
Ignacio Vazquez-Abrams

Antworten:

10

Das Wichtigste ist, dass Ihr Server überwacht wird, damit Sie jederzeit wissen, was auf dem Server vor sich geht. Es ist wichtig, die Festplattennutzung, die CPU-Auslastung, die Auslastung, die Speichernutzung, den Datenverkehr usw. im Auge zu behalten. Es gibt viele Open Source-Tools, die Ihnen bei dieser Aufgabe helfen können. Dies hilft Ihnen auch bei der Planung zukünftiger Upgrades.

Auf der anderen Seite müssen Sie regelmäßige und automatische Sicherungen durchführen, und es ist sehr wichtig, Ihre Sicherungen von Zeit zu Zeit zu testen, um sicherzustellen, dass sie funktionieren.

Es ist auch wichtig, nach Updates zu suchen, insbesondere nach Sicherheitsupdates, und diese bei Bedarf zu installieren.

Alles, was automatisch erledigt werden kann, sollte automatisch erfolgen. Vergessen Sie jedoch nicht, Ihre Protokolle von Zeit zu Zeit zu überprüfen.

Hoffe das hilft!

Marco Ramos
quelle
3
+1 für Paket- / Sicherheitsupdates.
EEAA
+1 für Updates. Machen Sie es wie Microsoft - geben Sie jeden Monat eine bestimmte Zeit für Upgrades ein. Suchen Sie nach wichtigen Pof-Bands, aber am Ende des Tages habe ich jeden Monat ein Wochenende (Sonntag, mein Wartungsintervall), um sicherzustellen, dass ich keine veralteten Sachen habe.
TomTom
3

Hier gibt es zwei nützliche Werkzeugklassen:

  1. Mit Überwachungstools wie Nagios können Sie die Nutzung und andere Statistiken verfolgen.
  2. Mit Konfigurationsmanagement-Tools wie Puppet und Chef können Sie Aussagen über den erwarteten Status eines Systems treffen (welche Pakete sollten installiert sein, wie der Inhalt von Dateien sein sollte usw.) und dann regelmäßig ausführen, um sicherzustellen, dass das System konform ist.
Rein Henrichs
quelle
3

Patchen Sie Ihr Betriebssystem, um die neuesten Bugfixes und Sicherheitsupdates zu erhalten. Dies ist der wichtigste Schritt, den Sie unternehmen können. Darüber hinaus muss eine Überwachung vorhanden sein, um den Status Ihres Systems im Laufe der Zeit zu ermitteln. Ich muss dem obigen Punkt nicht zustimmen, dass Überwachung keine Wartung ist. Sie müssen ein grundlegendes Verständnis Ihres Systems und seiner Funktionsweise erhalten, um zu sehen, wann Dinge nicht funktionieren oder überhaupt gewartet werden müssen. Der einzige Weg, dies wirklich zu tun, besteht darin, alles grafisch darzustellen. Wir verwenden dafür eine Kombination aus Nagios, Kakteen und Ganglien.

In Bezug auf Skripte haben Sie das Komprimieren von Protokollen erwähnt. Schauen Sie sich also logrotate an. Es gibt auch Logwatch.

dmourati
quelle
1
Die meisten Linux-basierten Systeme, die anständig gesichert sind, müssen nicht so oft gepatcht / aktualisiert werden. Solange Apache / PHP oder was auch immer öffentlich zugänglich ist, über Sicherheitsprobleme auf dem Laufenden ist, sollte es ihm gut gehen. Betriebszeit in Jahren ist in der Linux-Welt keine Seltenheit. Es ist nicht üblich, Ihren Server jeden Monat am Patch-Dienstag neu zu starten, das ist Windows.
Brian
3

Die vorherigen zu dieser Frage sind alle würdige Antworten, aber sie sind alle durch groß angelegtes Denken gefärbt. Wenn Sie nur einen einzigen Host haben und Websites bereitstellen, deren Ausfall Kätzchen nicht sofort tötet, sollten Sie etwas kleiner denken. Ich würde folgendes vorschlagen:

Verwenden Sie Logwatch oder ein ähnliches System, das Ihre Protokolle zusammenfasst und Ihnen eine Zusammenfassung sendet. Lesen Sie die Zusammenfassung mindestens jeden zweiten Tag. Verwenden Sie ein Tool, das Ihre Weblogs (z. B. analog) zu einer lesbaren Zusammenfassung zusammenfasst. Wenn Sie etwas ehrgeiziger sein möchten, verwenden Sie einen Cloud-Dienst, um Ihre Websites zu überwachen.

Das Wesentliche bei der Systemwartung bleibt jedoch dasselbe: Beenden Sie jedes Problem, das tot auftritt, damit es nie wieder auftreten kann . Dies ist ein wichtiger Punkt, da dies bedeutet, dass keine "regelmäßige" Wartung erfolgen sollte.

Nun zum größeren Maßstab:

Zu den ersten Problemen, die Sie beim Skalieren haben, gehört, dass etwas kaputt geht und Sie es nicht wissen. Dies darf nie wieder vorkommen. Dann erhalten Sie eine umfassende Überwachungslösung. Nachdem das Problem auf einem Host aufgetreten ist, möchten Sie verhindern, dass es auf einem anderen Host auftritt. Dann erhalten Sie ein Konfigurationsmanagementsystem.

Aber Sie dürfen an dieser Stelle nicht selbstgefällig sein. Ihre ganze Anstrengung sollte in dauerhafte Lösungen fließen.

Bittrance
quelle
+1, um zu verhindern, dass Probleme erneut auftreten.
Marco Ramos
1

Die Wartung erfolgt durch Überwachung. Wenn Sie einen Computer haben, der dem Zugriff von außen ausgesetzt ist, müssen Sie über einige Überprüfungswerkzeuge verfügen: rkhunter, chkrootkit sind Grundlagen für täglich versendete E-Mails. Smartd muss die Festplatten überprüfen und E-Mails senden, falls etwas schief geht IDS + Integritätsprüfer und viele andere. Natürlich wird angenommen, dass das System bereits gehärtet ist (zumindest mit der standardmäßigen SElinux-Richtlinie). Dies ist ideal, um die Leistung mit Nagios, Zabbix und anderen zu überwachen ungewöhnliche Ereignisse und den Status der Maschine im Auge behalten)

Adrian Sevcenco
quelle
1
Wartung! = Überwachung. Während die Überwachung ein entscheidender Bestandteil jeder Art von Systemadministration ist, hat das OP nicht danach gefragt.
EEAA
1
Ich bin nicht einverstanden :) Wartung IST Überwachung .. Wartung ist die Handlung, die nach den Informationen kommt (durch Überwachung gegeben). An dieser Stelle werde ich hinzufügen (etwas, von dem ich dachte, dass es bekannt ist), dass automatisierte Skripte, die von der Überwachung verwendet werden, Teil der Überwachung und nicht der Wartung sind. Mit diesen Ideen bedeutet dies, dass die Wartung nur durch menschliche Faktoren durchgeführt wird. In diesem Sinne werde ich wiederholen: Bei guter Überwachung ist keine Wartung erforderlich. Ein guter Profi muss nur den E-Mail-Benachrichtigungen folgen ... MÖGLICHERWEISE, um selbst in Protokollen
nachzuschauen
Überwachung ist sehr viel Wartung. Wir haben Systeme, bei denen die Hauptursache für Probleme darin besteht, dass der Speicherplatz knapp wird. (Datenbanken mögen das nicht so sehr) Wir müssen sie im Auge behalten und Warnungen auslösen, wenn sie zu 85% voll sind. Dann können wir eine weitere Festplatte hinzufügen und die Datenträgergruppen erweitern.
Brian
1

Marcos hat einen schönen Lebenslauf mit den wichtigsten Punkten der WARTUNG erstellt: Überwachung, Backups und Updates.

Ich muss (durch Kommentare von Leuten) diese Überwachung wiederholen! = Wartung.

Ich möchte hinzufügen: Bereinigungen alter Benutzer, alte Cron-Aufgaben usw. Erneuerungen von Passwörtern. Entwicklung der Systemkonfiguration (mit Blick auf den Überwachungsverlauf) (und dies schließt die Entwicklung der Überwachung und Sicherungen ein) mit den Änderungen der Lebensdauer des Servers. Sicherheitsprüfungen . Benutzerdefinierte Berichte (dh detaillierte Nutzung von Diensten, freigegebenen Ressourcen, Sicherheitsberichten). Und...

Stellen Sie Backups nach dem Zufallsprinzip wieder her (ohne dass dies erforderlich ist). Fügen Sie auch immer eine Kopie des MBR (Master Boot Record) bei, wenn Sie kein automatisiertes Bereitstellungssystem verwenden, um den gesamten Server wiederherzustellen.

Ich habe gesehen, dass Firewalls 500 Tage Betriebszeit überleben (ja, das ist eine schlechte Wartung, da es ungefähr 10/15 Kernel-Upgrades pro Jahr gibt, so dass große Betriebszeiten einem anfälligen Kernel entsprechen ), ohne dass eine menschliche Wartung erforderlich ist . Es ist nur eine gute Konfiguration für Partitionen, Syslog und keine größeren Konfigurationsänderungen.

Sie fragen nach Skripten . Vielleicht gibt es generische vorgefertigte Skripte, aber es geht mehr um DIY (Do It Yourself). Also zuerst Sie lernen oder lesen , wie das System funktioniert (dies schließt Distro spezifische Reames, Manpages, Richtlinien und Kompilierungsoptionen), dann yo denken , wie Ihr System verhalten soll, und dann Sie schreiben benutzerdefinierte Skripts (cron, benutzerdefinierte Befehle, usw.) Verwalten Sie die Kombination aus Betriebssystem + gewünschtem Verhalten / Ergebnissen / Berichten / Änderungsmanagement / Rollbacks / Reaktionen / etc.

Auch erhältlich generische Werkzeuge (monit, nagios, Kakteen, zabbix, usw.) kann erweitert mit scripting Fähigkeiten und verfügbar Dritten Plugins .

Beispiel: Müssen Sie nur wissen, ob die Partition voll ist, oder müssen Sie auch die Festplattentemperatur, die freien Inodes, die Rechte an Dateien und Ordnern, die Prüfsummen, den SMART-Status, fehlerhafte Sektoren, Dateisystemprüfungen und den geschätzten Lebenszyklus von steuern physische Hardware?

Neben den Backups sollten das Überwachungssystem und die Anpassungen nach Möglichkeit validiert werden, um Fehler, Angriffe usw. zu simulieren.

Benutzerdefinierte Skripte sind besser, wenn Sie sie überprüfen und Fehler auf einem Vorproduktionsserver, einer Umgebung, einem Verzeichnis, einer Datenbank usw. beseitigen können.

Giftbit
quelle
1
Normalerweise verwenden Sie das Detail und die Anpassung Ihrer Wartungsdefinition, um mit den Fehlern umzugehen, die Sie in Ihrem Gesicht gesehen haben. Als Junior-Systemadministrator war ich mit einem RRD-Diagramm des Speicherplatzes zufrieden, bis ich mein erstes Festplattenproblem hatte oder bis ich mein erstes Inode-Problem hatte oder bis ich mein erstes Problem mit "zu vielen Dateien" usw. hatte. .
poisonbit