1200 Check_MK Installationen in einer Nacht2012, Februar![]() Das zentrale Dashboard Installationen mit über 1200 eigenständigen Nagios-Servern sind sicher nicht alltäglich. Solche Umgebungen zu verwalten ist in der Regel mehr als ein Fulltime-Job. Auch die weiteren Zahlen dieser Nagios-Projektes sind beeindruckend: EDEKA Minden-Hannover in KürzeEDEKA Minden-Hannover ist mit einem Umsatz von 6,9 Milliarden Euro in 2011, 32.000 Mitarbeitern und etwa 1.600 Einzelhandelsstandorten die größte der bundesweit sieben EDEKA-Regionalgesellschaften. Das Geschäftsgebiet erstreckt sich von der holländischen bis an die polnische Grenze. Es umfasst einen Teil von Ostwestfalen, fast ganz Niedersachsen sowie die Bundesländer Bremen, Saxony-Anhalt, Berlin und Brandenburg. Die AusgangssituationBei EDEKA Minden-Hannover wurde nach einer kostengünstigen, flexiblen und zeitgemäßen Lösung für das Monitoring der Märkte und einiger zentraler Systeme gesucht. Schnell war die Open Source Software Nagios im Gespräch. Wie auch in vielen anderen Unternehmen wurde Nagios erst einmal per Hand installiert und nach und nach durch Addons wie NSCA, NagVis etc. ergänzt. Nach kurzer Zeit wurde jedoch klar, dass so ein klassisch aufgesetztes Nagios schnell an seine Grenzen stößt. Ein problematischer Punkt war die starke Netzwerklast durch viele einzelne Checks. Außerdem stellte sich heraus, dass man selbst mit grafischen Konfigurationstools wie NConf an die Grenzen des verkraftbaren Verwaltungsaufwandes stößt. Mit der Zeit machten sich auch Performanceengpässe auf dem zentralen Nagios-Server bemerkbar. Der erste Kontakt mit der Mathias Kettner GmbH kam über das Nagios-Addon Check_MK zustande. In einem dreitägigen Workshop wurden gemeinsam Ideen und Konzepte für ein modernes, agiles monitoring entwickelt. Die wichtigsten AnforderungenBei diesem Projekt war die Herausforderung nicht nur der große Umfang, sondern auch die speziellen Anforderungen, die sich aus dem Umfeld des Einzelhandels ergeben.
Die LösungDie umgesetzte Lösung setzt auf die aktuelle Version 1.1.13 von Check_MK. In jedem Markt existiert eine Nagios Installation auf Basis der Open Monitoring Distribution (OMD) und Check_MK. Die Verwendung von OMD sorgt für eine einfache und standardisierte Installation der Monitoring-Server. So kann zur Verteilung der Installation und Konfigurationen auf bereits vorhandene Tools gesetzt werden. Die Nagios-Instanz im Markt ist dafür zuständig, alle lokalen Systeme und die zentralen Dienste aus Sicht des Marktes zu überwachen. Außerdem kann auf Basis der erfassten Daten ein Dashboard zur Darstellung des lokalen Status erstellt werden. Check_MK verwendet zur Abfrage der Daten einen eigenen Agenten, der nicht konfiguriert werden muss. So ist der Rollout auf die große Menge der zu überwachenden Systeme problemlos möglich. Mit der Inventur-Funktion von Check_MK wird automatisch ermittelt, was auf einem System überwacht werden kann. Die Schwellwerte werden über flexible Regeln auf dem zentralen Server konfiguriert. Das lokale Netzwerk des Marktes wird regelmäßig automatisiert nach neuen Komponenten gescannt. Dabei wird auf das Standardwerkzeug nmap gesetzt. Sobald ein neues System gefunden wird, werden mit Hilfe der automatischen Inventur von Check_MK die zu überwachenden Services der Systeme ermittelt. Dieser Prozess findet komplett automatisiert ohne manuellen Eingriff statt. Der Aufwand für die Verwaltung des Monitorings in den Märkten wird so minimiert. ![]() Ausschnitt der Markt Aggregation Der Zustand aller Systeme eines Marktes wird in einem Gesamtzustand zusammengefasst. Diese Aggregation wird mit Hilfe von Check_MK Business Intelligence (BI) realisiert. Bei der Aggregation werden allgemein formulierte Regelwerke auf die jeweils im Markt vorhandenen Systeme angewendet. Das Regelwerk besteht aus 26 verschiedenen Regeln. So wird der große Aufwand einer expliziten Konfiguration vermieden. In der zentralen Instanz wird der Summenstatus jedes Marktes abgefragt. Um dies zu realisieren, wird der JSON basierte Webservice von Check_MK verwendet. Die zentrale Instanz fragt den Status der Markt-Aggregation minütlich ab. So ist sichergestellt, dass die Informationen in der Zentrale den aktuellen Zustand im Markt widerspiegeln. Um den Status der gesamten Umgebung übersichtlich darzustellen, wird in Check_MK Multisite ein Dashboard erstellt, das als Übersichtseite an zwei 55 Zoll TFT Monitoren dauerhaft angezeigt wird. Auf diesem Dashboard finden sich einzelne Ansichten (Dashlets), die u.a. die Märkte mit Verbindungsproblemen und Host- oder Serviceprobleme in eigenen Listen anzeigen. Im Rahmen des Projektes wird NagVis um die Geomap Funktionalität erweitert. Dabei erstellt NagVis anhand der GPS-Koordinaten aller Standorte und frei verfügbarem Kartenmaterial von Openstreetmap eine Landkarte und positioniert die Standorte auf dieser Karte. ![]() Die neue Geomap Funktion von NagVis RolloutDas zentrale Nagios System wurde in einem dreitägigen Workshop konzeptioniert und aufgebaut. Nach einer Kennenlernphase und Austausch von Informationen war die Grundinstallation der zentralen Nagios Instanz dank OMD in einem Tag erledigt. In diesem Schritt wurden auch einige neue Check_MK Checks entwickelt (wie z.B das Monitoring von Bintec Routern), die in die offizielle Version von Check_MK eingeflossen sind. Nach einigen Wochen Konzeption und Entwicklung der Anbindung der Märkte wurde der große Rollout auf alle Märkte in einem weiteren viertägigen Vor-Ort-Termin an den ersten beiden Tagen vorbereitet und gegen Ende des zweiten Tages gestartet. Innerhalb von sechs Stunden wurden insgesamt 1200 Nagios Systeme aufgesetzt. Das sind drei neue Installationen pro Minute! Nach der Installation in den Märkten wurden alle Systeme am dritten Tag in die zentrale Instanz eingebunden. Im gleichen Zug wurde die Geomap mit den Informationen aus den Märkten in Betrieb genommen. FazitMit geringem Aufwand wurde in partnerschaftlicher Zusammenarbeit eine passende Lösung für EDEKA entwickelt und erfolgreich implementiert. Das gesamte Projekt wurde auf Basis von lizenzkostenfreier Software entwickelt. Gleichzeitig wurde Wissen vermittelt und das Know-How des Kunden im Bereich Monitoring weiter ausgebaut. Die Akteure
|
|||||||||||||||||||||||||