15.3. Nagios#

Mit UCS 5.0 wurde die Unterstützung für die Nagios Serverkomponente eingestellt. Die Systeme können jedoch weiterhin über NRPE überwacht werden.

15.3.1. Installation#

Neben den Standard-Plugins, die mit der Installation des Pakets univention-nagios-client mitgebracht werden, können zusätzliche Plugins über folgende Pakete nachinstalliert werden:

  • univention-nagios-raid Überwachung des Software-RAID-Status

  • univention-nagios-smart Prüfung des S.M.A.R.T.-Status von Festplatten

  • univention-nagios-opsi Prüfung der Softwareverteilung OPSI

Einige der Pakete werden bei der Installation der entsprechenden Dienste automatisch mit eingerichtet. Wird beispielsweise der UCS AD Connector eingerichtet, bringt dieser das Überwachungsplugin univention-nagios-ad-connector mit.

15.3.2. Vorkonfigurierte Nagios-Prüfungen#

Während der Installation werden automatisch grundlegende Nagios-Prüfungen für die UCS-Systeme der Domäne eingerichtet.

Tab. 15.6 Vorkonfigurierte Nagios-Prüfungen#

Nagios-Dienst

Beschreibung

UNIVENTION_PING

Testet die Erreichbarkeit des überwachten UCS-Systems mit dem Kommando ping. In der Standardeinstellung wird der Fehlerzustand erreicht, wenn die Antwortzeit 50 ms oder 100 ms überschreitet oder Paketverluste von 20% oder 40% auftreten.

UNIVENTION_DISK_ROOT

Überwacht den Füllstand der /-Partition. Unterschreitet der verbleibende freie Platz in der Standardeinstellung 25% oder 10% wird der Fehlerzustand gesetzt.

UNIVENTION_DNS

Testet die Funktion des lokalen DNS-Servers und die Erreichbarkeit der öffentlichen DNS-Server durch die Abfrage des Rechnernamens www.univention.de. Ist für die UCS-Domäne kein DNS-Forwarder definiert, schlägt diese Abfrage fehl. In diesem Fall kann www.univention.de z.B. gegen den FQDN des Primary Directory Node ersetzt werden, um die Funktion der Namensauflösung zu testen.

UNIVENTION_LDAP

Überwacht den auf Directory Nodes laufenden LDAP-Server.

UNIVENTION_LOAD

Überwacht die Systemlast.

UNIVENTION_NTP

Fragt auf dem überwachten UCS-System die Uhrzeit beim NTP-Dienst ab. Tritt eine Abweichung von mehr als 60 oder 120 Sekunden auf, wird der Fehlerzustand erreicht.

UNIVENTION_SMTP

Testet den Mailserver.

UNIVENTION_SSL

Testet die verbleibende Gültigkeitsdauer der UCS-SSL-Zertifikate. Dieses Plugin ist nur für Primary Directory Node und Backup Directory Nodes geeignet.

UNIVENTION_SWAP

Überwacht die Auslastung der Swap-Partition. Unterschreitet der verbleibende freie Platz den Schwellwert (in der Standardeinstellung 40% oder 20%), wird der Fehlerzustand gesetzt.

UNIVENTION_REPLICATION

Überwacht den Status der LDAP-Replikation, erkennt das Vorhandensein einer failed.ldif-Datei sowie den Stillstand der Replikation und warnt vor zu großen Differenzen der Transaktions-IDs.

UNIVENTION_NSCD

Testet die Verfügbarkeit des Name Server Cache Dienstes (NSCD). Läuft kein NSCD-Prozess wird ein CRITICAL-Event ausgelöst, läuft mehr als ein Prozess, wird ein WARNING-Event ausgelöst.

UNIVENTION_WINBIND

Testet die Verfügbarkeit des Winbind-Dienstes. Läuft kein Prozess, wird ein CRITICAL-Event ausgelöst.

UNIVENTION_SMBD

Testet die Verfügbarkeit des Samba-Dienstes. Läuft kein Prozess, wird ein CRITICAL-Event ausgelöst.

UNIVENTION_NMBD

Testet die Verfügbarkeit des NMBD-Dienstes, der in Samba für den NetBIOS-Dienst zuständig ist. Läuft kein Prozess, wird ein CRITICAL-Event ausgelöst.

UNIVENTION_JOINSTATUS

Prüft den Join-Status eines Systems. Ist ein System noch nicht Mitglied der Domäne, wird ein CRITICAL-Event ausgelöst, sind nicht-aufgerufene Join-Skripte vorhanden, wird ein WARNING-Event zurückgeliefert.

UNIVENTION_KPASSWDD

Prüft die Verfügbarkeit des Kerberos-Passwort-Dienstes (nur verfügbar auf Primary/Backup Directory Node). Läuft weniger oder mehr als ein Prozess, wird ein CRITICAL-Event ausgelöst.

UNIVENTION_CUPS

Überwacht den CUPS-Druckdienst. Läuft cupsd-Prozess oder ist die Weboberfläche auf Port 631 nicht erreichbar, wird der Status CRITICAL zurückgegeben.

UNIVENTION_SQUID

Überwacht den Proxy Squid. Läuft kein Squid-Prozess oder der Squid-Proxy ist nicht erreichbar, wird der Status CRITICAL zurückgegeben.

Die folgenden Nagios-Dienste sind nur auf dem jeweiligen Nagios Client verfügbar, sobald zusätzliche Pakete installiert wurden (siehe Installation):

Tab. 15.7 Zusätzliche Nagios Checks#

Nagios-Dienst

Beschreibung

UNIVENTION_OPSI

Überwacht den OPSI-Daemon. Läuft kein OPSI-Prozess oder die OPSI-Weboberfläche ist nicht erreichbar, wird der Status CRITICAL zurückgegeben.

UNIVENTION_SMART_SDA

Prüft den S.M.A.R.T.-Status der Festplatte /dev/sda. Für die Festplatten sdb, sdc und sdd existieren entsprechende Nagios-Dienste.

UNIVENTION_RAID

Prüft den Status des Software-RAIDs über /proc/mdadm und gibt einen CRITICAL Alarm zurück, sofern eine Festplatte des RAID-Verbunds ausgefallen ist, oder einen WARNING Alarm zurück, wenn der Recovery-Vorgang läuft.

UNIVENTION_ADCONNECTOR

Prüft den Status des Active Directory Connectors:

  • Läuft kein Connector-Prozess, wird der Status CRITICAL zurückgegeben.

  • Existiert mehr als ein Prozess pro Connector-Instanz gibt es eine WARNING.

  • Treten Rejects auf, gibt es eine WARNING.

  • Kann der AD-Server nicht erreicht werden, tritt ein CRITICAL-Zustand ein.

Das Plugin kann auch in Multi-Connector-Instanzen verwendet werden. Dabei muss der Name der Instanz als Parameter übergeben werden.