Und wir kündigen an, wenn wir was planen zu machen. Gute N8 Mit freundlichen Grüßen Haiko Gerdes - Geschäftsführer - ___________________________________________________________________________ TraSo GmbH Georg-Schumann-Str. 294 D-04159 / Leipzig Tel.: +49 341 355 740 10 // Fax: +49 341 355 740 - 11 Mobil: +49 172 610 2849 Internet: http://traso.de E-Mail: h.gerdes@traso.de ___________________________________________________________________________ Geschäftsführer: Haiko Gerdes Handelsregister: Amtsgericht Leipzig, HRB 21850 -----Ursprüngliche Nachricht----- Von: team [mailto:team-bounces@lists.traso.de] Im Auftrag von Tilo Werner Gesendet: Mittwoch, 24. Juni 2015 00:28 An: team@lists.traso.de Betreff: Re: [Team] Entwarnung Mongo Hallo, hier schreibt der Übeltäter... Ich habe heute das Collectd Plugin für unsere MongoDB-Server per Chef automatisiert. Dass ist weniger Aufwand als gedacht bzw. als in der Vergangenheit hätte gemacht werden müssen. Nun ist mir aber dabei der Fehler unterlaufen das Paket python-pymongo (welches für das Collectd-MongoDB-Plugin notwendig ist) auf *alle* Systeme zu installieren, sprich auch auf jene, die das gar nicht brauchen. Aus Gründen habe ich das rückgängig gemacht. Also Deinstallation wenn der Rechner nichts mit MongoDB zu tun hat. Es ist aber so, dass der Nagios-Server (monitor02.luan.xres.de) direkt, und ohne den Umweg über die eigentlichen MongoDB-Nodes, den Status selbiger abfragt. Dort braucht es dann das Paket... Und dann ca. 80 Tacken verbrannt. Was lernen wir daraus: 1. Ich werde nicht bzw. nie fertig die Abhängigkeiten unseres Systems zu verstehen und diese zu beachten. 2. Wir werden einen Chef-Testserver haben. 3. Wir werden Eskalationen im Nagios einbauen. 4. Wir werden nicht mehr direkt alle benachrichtigen, sondern nur uns Admins, Haiko und den Bereitschaftsdiensthabenden -> erste Eskalationsstufe 5. Wir werden Dienstabhängikeiten haben, d.h. wenn z.B. der "mongo connect check" fehl schlägt, alle anderen Benachrichtigungen ruhig sind. Ich habe das nun insoweit korrigiert, als dass das python-pymongo Paket auf dem Rechner monitor02.luan.xres.de obligatorisch ist. In dem Sinne, Tilo tldr; Fehler werden gemacht, aber nur aus dem Grund daraus zu lernen. Am 23.06.2015 um 22:01 schrieb Thomas Koelzow:
Das mongo ist nicht kaputt, es ist nur das pymongo Paket, welches gerade fehlt. Ohne das Paket, können die Checks vom Nagios nicht ausgeführt werden, was dann zu diesem riesigen Fehlalarm führt.
-- -+-+-+---+++-+-+--+-+--++ - Systemadministration - ~`~`~`~`~^~`~`~`~`~^~`~`~ inet- https://www.traso.de chat- t.werner@jabber.traso.de _pgp- 0x0D643AB5 TraSo GmbH G.-Schumann-Str. 294 04159 Leipzig _______________________________________________ Geschäftsführer: Haiko Gerdes Handelsregister: Amtsgericht Leipzig (HRB 21850)