Ich habe einen Server, auf dem nur wenige Websites gehostet werden. Ich habe seit etwa zwei Monaten keine Wartung mehr durchgeführt, außer ein paar Protokolle anzusehen und sie zu komprimieren.
Sie fragen sich nur, welche regelmäßigen Wartungsarbeiten Sie an Ihrem Linux-Server durchführen müssen? Gibt es Skripte, mit denen Sie die Wartung durchführen können?
linux
unix
maintenance
Max Thomson
quelle
quelle
Antworten:
Das Wichtigste ist, dass Ihr Server überwacht wird, damit Sie jederzeit wissen, was auf dem Server vor sich geht. Es ist wichtig, die Festplattennutzung, die CPU-Auslastung, die Auslastung, die Speichernutzung, den Datenverkehr usw. im Auge zu behalten. Es gibt viele Open Source-Tools, die Ihnen bei dieser Aufgabe helfen können. Dies hilft Ihnen auch bei der Planung zukünftiger Upgrades.
Auf der anderen Seite müssen Sie regelmäßige und automatische Sicherungen durchführen, und es ist sehr wichtig, Ihre Sicherungen von Zeit zu Zeit zu testen, um sicherzustellen, dass sie funktionieren.
Es ist auch wichtig, nach Updates zu suchen, insbesondere nach Sicherheitsupdates, und diese bei Bedarf zu installieren.
Alles, was automatisch erledigt werden kann, sollte automatisch erfolgen. Vergessen Sie jedoch nicht, Ihre Protokolle von Zeit zu Zeit zu überprüfen.
Hoffe das hilft!
quelle
Hier gibt es zwei nützliche Werkzeugklassen:
quelle
Patchen Sie Ihr Betriebssystem, um die neuesten Bugfixes und Sicherheitsupdates zu erhalten. Dies ist der wichtigste Schritt, den Sie unternehmen können. Darüber hinaus muss eine Überwachung vorhanden sein, um den Status Ihres Systems im Laufe der Zeit zu ermitteln. Ich muss dem obigen Punkt nicht zustimmen, dass Überwachung keine Wartung ist. Sie müssen ein grundlegendes Verständnis Ihres Systems und seiner Funktionsweise erhalten, um zu sehen, wann Dinge nicht funktionieren oder überhaupt gewartet werden müssen. Der einzige Weg, dies wirklich zu tun, besteht darin, alles grafisch darzustellen. Wir verwenden dafür eine Kombination aus Nagios, Kakteen und Ganglien.
In Bezug auf Skripte haben Sie das Komprimieren von Protokollen erwähnt. Schauen Sie sich also logrotate an. Es gibt auch Logwatch.
quelle
Die vorherigen zu dieser Frage sind alle würdige Antworten, aber sie sind alle durch groß angelegtes Denken gefärbt. Wenn Sie nur einen einzigen Host haben und Websites bereitstellen, deren Ausfall Kätzchen nicht sofort tötet, sollten Sie etwas kleiner denken. Ich würde folgendes vorschlagen:
Verwenden Sie Logwatch oder ein ähnliches System, das Ihre Protokolle zusammenfasst und Ihnen eine Zusammenfassung sendet. Lesen Sie die Zusammenfassung mindestens jeden zweiten Tag. Verwenden Sie ein Tool, das Ihre Weblogs (z. B. analog) zu einer lesbaren Zusammenfassung zusammenfasst. Wenn Sie etwas ehrgeiziger sein möchten, verwenden Sie einen Cloud-Dienst, um Ihre Websites zu überwachen.
Das Wesentliche bei der Systemwartung bleibt jedoch dasselbe: Beenden Sie jedes Problem, das tot auftritt, damit es nie wieder auftreten kann . Dies ist ein wichtiger Punkt, da dies bedeutet, dass keine "regelmäßige" Wartung erfolgen sollte.
Nun zum größeren Maßstab:
Zu den ersten Problemen, die Sie beim Skalieren haben, gehört, dass etwas kaputt geht und Sie es nicht wissen. Dies darf nie wieder vorkommen. Dann erhalten Sie eine umfassende Überwachungslösung. Nachdem das Problem auf einem Host aufgetreten ist, möchten Sie verhindern, dass es auf einem anderen Host auftritt. Dann erhalten Sie ein Konfigurationsmanagementsystem.
Aber Sie dürfen an dieser Stelle nicht selbstgefällig sein. Ihre ganze Anstrengung sollte in dauerhafte Lösungen fließen.
quelle
Die Wartung erfolgt durch Überwachung. Wenn Sie einen Computer haben, der dem Zugriff von außen ausgesetzt ist, müssen Sie über einige Überprüfungswerkzeuge verfügen: rkhunter, chkrootkit sind Grundlagen für täglich versendete E-Mails. Smartd muss die Festplatten überprüfen und E-Mails senden, falls etwas schief geht IDS + Integritätsprüfer und viele andere. Natürlich wird angenommen, dass das System bereits gehärtet ist (zumindest mit der standardmäßigen SElinux-Richtlinie). Dies ist ideal, um die Leistung mit Nagios, Zabbix und anderen zu überwachen ungewöhnliche Ereignisse und den Status der Maschine im Auge behalten)
quelle
Marcos hat einen schönen Lebenslauf mit den wichtigsten Punkten der WARTUNG erstellt: Überwachung, Backups und Updates.
Ich muss (durch Kommentare von Leuten) diese Überwachung wiederholen! = Wartung.
Ich möchte hinzufügen: Bereinigungen alter Benutzer, alte Cron-Aufgaben usw. Erneuerungen von Passwörtern. Entwicklung der Systemkonfiguration (mit Blick auf den Überwachungsverlauf) (und dies schließt die Entwicklung der Überwachung und Sicherungen ein) mit den Änderungen der Lebensdauer des Servers. Sicherheitsprüfungen . Benutzerdefinierte Berichte (dh detaillierte Nutzung von Diensten, freigegebenen Ressourcen, Sicherheitsberichten). Und...
Stellen Sie Backups nach dem Zufallsprinzip wieder her (ohne dass dies erforderlich ist). Fügen Sie auch immer eine Kopie des MBR (Master Boot Record) bei, wenn Sie kein automatisiertes Bereitstellungssystem verwenden, um den gesamten Server wiederherzustellen.
Ich habe gesehen, dass Firewalls 500 Tage Betriebszeit überleben (ja, das ist eine schlechte Wartung, da es ungefähr 10/15 Kernel-Upgrades pro Jahr gibt, so dass große Betriebszeiten einem anfälligen Kernel entsprechen ), ohne dass eine menschliche Wartung erforderlich ist . Es ist nur eine gute Konfiguration für Partitionen, Syslog und keine größeren Konfigurationsänderungen.
Sie fragen nach Skripten . Vielleicht gibt es generische vorgefertigte Skripte, aber es geht mehr um DIY (Do It Yourself). Also zuerst Sie lernen oder lesen , wie das System funktioniert (dies schließt Distro spezifische Reames, Manpages, Richtlinien und Kompilierungsoptionen), dann yo denken , wie Ihr System verhalten soll, und dann Sie schreiben benutzerdefinierte Skripts (cron, benutzerdefinierte Befehle, usw.) Verwalten Sie die Kombination aus Betriebssystem + gewünschtem Verhalten / Ergebnissen / Berichten / Änderungsmanagement / Rollbacks / Reaktionen / etc.
Auch erhältlich generische Werkzeuge (monit, nagios, Kakteen, zabbix, usw.) kann erweitert mit scripting Fähigkeiten und verfügbar Dritten Plugins .
Beispiel: Müssen Sie nur wissen, ob die Partition voll ist, oder müssen Sie auch die Festplattentemperatur, die freien Inodes, die Rechte an Dateien und Ordnern, die Prüfsummen, den SMART-Status, fehlerhafte Sektoren, Dateisystemprüfungen und den geschätzten Lebenszyklus von steuern physische Hardware?
Neben den Backups sollten das Überwachungssystem und die Anpassungen nach Möglichkeit validiert werden, um Fehler, Angriffe usw. zu simulieren.
Benutzerdefinierte Skripte sind besser, wenn Sie sie überprüfen und Fehler auf einem Vorproduktionsserver, einer Umgebung, einem Verzeichnis, einer Datenbank usw. beseitigen können.
quelle