Mit Nagios Festplatten "Gesundheit" überwachen

Heutige Festplatten kommen von Haus aus mit Diagnoseeinrichtung daher. Leider werden die nur selten genutzt und dann ärgert man sich dass die Platte kaputt geht.  Nutzt man die Diagnosemöglichkeiten zum Beispiel mit smartmontools kann man die Vorwarnzeit deutlich verlängern und hat somit Zeit, ein Backup zu machen. Für  Nagios gibt es ein Plugin das diesen Dienst "anzapft" Check SMART status und auf die Service Übersicht bringt und den Nagios Warnungsmechanismus integriert. Hier meine persönliche Doku:

Die Datei downloaden und auf den Nagios Sever kopieren. (Ich halte alle meine "nicht Standard Plugins" in einem anderen Ordner)


cp check_smart /opt/c/nagios
cd /opt/c/nagios
chown nagios:nagios check_smart

Check_smart braucht root rechte: also Sudo

vi /etc/sudoers
nagios ALL=(ALL) NOPASSWD:/opt/c/nagios/check_smart

Erstmal unter der User nagios auf der Kommandozeile testen. Dann in

/etc/nagios/checkcommands.cfg

define command{
        command_name    check_smart
        command_line    sudo /opt/c/nagios/check_smart -i $ARG1$ -d $ARG2$
        }

und in
/etc/nagios/services.cfg für die verschiedenen Platten den Service definieren.

define service{
       use                             generic-service-important
       host_name                       mail
      service_description             SMARTD-SDC
       normal_check_interval          360
      check_command                   check_smart!scsi!/dev/sdc
                                         }
define service{
       use                             generic-service-important
       host_name                       mail
       service_description             SMARTD-HDA
       normal_check_interval          360
       check_command                   check_smart!ata!/dev/hda
       }

nagio-smartd.gif