Hallo an alle,
hier mal ein schriftlicher Zwischenstand zur aktuellen FER-Problematik
(ich streue es, weil schon viele beteiligt waren und aktuell noch sind:
- Der service01 von FER ist seit ca. 10 Uhr unter erhöhter Last es
begann bei einem Load von 35, inzwischen ist er dauerhaft zwischen 50
und 65.
- Die Anfragen und Buchungszahlen liegen ca. 20-30% hinter dem Normwert
- Die Verteilung der Anfragen ist nicht verändert zu sonst, es ist keine
gezielter Angriff auszumachen.
- Weder Stadis Gateways, TBM XML, TT noch XPACK Schnittstelle zeigen ein
abnormales Verhalten wie erhöhte Fehlermenge, erhöhte Logs oder
Ähnliches. Lediglich die Antwortzeiten sind (bei dem Load verständlich)
stark erhöht, etwa 20-30 Sekunden in der Spitze.
- die Anzahl der Apache Prozesse ist am Maximum von 128. Daher auch der
hohe Load. Die Kiste blockiert sich also selbst.
- Datenbank, Cacheserver und angeschlossene Systeme laufen normal und
sind in keiner Weise auffällig.
- Das Abschalten der Logs wie bei JT vor einer Weile (JT-875) hat nichts
gebracht
- Das Collectd funktioniert seit Dienstag nicht mehr. Insofern haben wir
kein Monitoring aus dieser Quelle
Der Server ist also nicht weg, aber sehr langsam. Es gibt Anfragen und
auch Buchungen, vermutlich aber auch viele Timeouts auf Seiten der
anfragenden Systeme. Nach wie vor ist unklar, was genau das Problem ist.
Soviel von meiner Seite.
René
--
René Lange
- Leiter Entwicklung -
activate communication systems GmbH
G.-Schumann-Str. 294
04159 Leipzig
telefon: (+49) 0 341 90987 507
email: r.lange(a)activate.de
Geschäftsführer: Markus Hartwig, Rainer Jansen
Handelsregister: Amtsgericht Leipzig (HRB 21850)