Hallo, nachdem sich die Situation heute Vormittag beruhigt hatte, haben wir nun wieder das Problem, es ist auch so, dass unsere Kunden Störungen melden. Ich organisiere mir gerade Zugang zum Rechenzentrum (eig. 24h vorher), ich werde um 18:30 Uhr durch den Wachschutz eingelassen. Bis dahin versuche ich das Problem/Informationen vor Ort zuklären. Möglichweise ist ein Switch im RZ am Sterben. lg, Tilo Am 21.04.12 00:19, schrieb Tilo Werner:
Hallo ATEM,
seid ca. 21:00 Uhr kam und kommt es zu vermehrten Meldungen, dass unsere Systeme (XRES) "DOWN" sind bzw. zeitnah die Meldung, dass sie sehr wohl "UP" sind.
Nach langen Recherchen kann ich sagen, ich weiß nicht hundertprozentig woran es liegt.
Ich habe lange mit einem Techniker der HL-Kommm gesprochen, dieser kann einen Ausfall auf deren Seite ausschließen.
Ich kann das für unsere Seite nicht.
Die Fehler beziehen sich auf Systeme, die im "alten" Rechenzentrum (RZ) stehen, womit zumindest auszuschließen ist, dass es sich um ein Problem der Internetverbindung in der Georg-Schumann-Straße handelt. Was mir der Techniker auch bestätigte, es gibt keinerlei Probleme mit Technik, die die HL-Komm für uns stellt.
Man muss dazu wissen, dass die Überwachung (Nagios) der Systeme im RZ über einen VPN-Tunnel aus der Firma heraus erfolgt.
Als mögliche Fehlerquellen betrachte ich zur Zeit ein Problem mit der VPN-Verbindung, wobei ich bisher nicht weiß auf welcher Seite der Verbindung (Firma oder RZ).
Auszuschließen sind nach meinem jetzigen Kenntnisstand die RZ-Anbindung ansich und der Internetanschluß der Firma über die der VPN-Tunnel kommuniziert.
Ich werde morgen in der Firma sein, um das Problem weiter einzugrenzen. (Ich freue mich schon auf den Freizeitausgleich).
Die betroffenen Systeme sind laut Aussage von Tobias grundsätzlich erreichbar. Ich kann nicht klar sagen, ob wir buchbar sind oder nicht. Hier fehlt neben der systemischen Überwachung (Switche, Hardware, Betriebssystem) ebenfalls eine klare Verifizierung der Funktionalität von XRES - Stichwort Dummy-Anfragen, die im Fehlerfall Meldung machen.
Ich möchte hiermit außerdem bekräftigen, dass wir als Administration eine klare Regelung für solche Fälle brauchen. Auch eine die sich darüber hinaus um die abzuarbeitenden Problemlösungen (Redundanz, Überwachung, VPN-Anbindung, dafür notwendige Hardware etc.pp.) erstreckt.
Grüße, Tilo
PS: Wenn du bis hier runter gekommen bist und alles gelesen und verstanden hast - Glückwunsch! Wenn nicht dann einfach deine Frage auf die Liste schicken.
PPS: Dank http://www.youtube.com/watch?v=6GggY4TEYbk werde ich die nächsten 5 Stunde keine Gedanken mehr daran verschwenden ... und werde in Glücksvorstellungen schweben "What's going on?" ;-)
-- Tilo Werner - Systemadministration - activate communication systems GmbH G.-Schumann-Str. 294 04159 Leipzig email: t.werner@activate.de Geschäftsführer: Markus Hartwig Handelsregister: Amtsgericht Leipzig (HRB 21850)