Hallo liebe Kollegen, Lolek hatte ein Hauptspeicherproblem und dadurch u.a. den Prozess weggeschossen, welcher die virtuelle Maschine "rabbit01" darstellt. Dieses spontane Todesurtail fand wiederum die Mnesia-Datenbank in der virtuellen Maschine sehr fatal, denn diese konnte den im Hauptspeicher vorhandenen Zustand nicht auf Platte schreiben, bevor die Maschine getötet wurde. Ich hab also die defekte Datenbank beseite geschoben, den Cluster Status von rabbit02 resettet. Anschließend wurden beide Knoten neu gestartet und wieder neu zum Cluster zusammen geführt. Ich hoffe alle notwendigen Maßnahmen noch rekonstruiert zu haben: Die aif2-csv-worker wurden neu gestartet, die mongodb.worker haben die Queue HBD_AIF2 eröffnet und den Routing Key "temp_action" habe ich zum exchange "dummy" hinzugefügt. Dem Hasen stehen jetzt nur noch 1.5 statt 3GB zu Verfügung. Da die JavaVM sich jedweden Speicher einverleibt, den man ihr anbiete, so muss entweder ein LXC-Konten weichen, die JVMs weniger Speicher allozieren dürfen oder Rabbit01 von lolek runter, aber das können wir ja morgen besprechen. 18 LXC-Container*2GB +6Kunden*1,2GB(hbd01) +1,5GB (rabbit01) + Betriebssystem des Wirtes sind zu viel für 48GB Speicher Nächtliche Grüße Tobias -- Tobias Stein - Systemadministration - activate communication systems GmbH G.-Schumann-Str. 294 04159 Leipzig Tel.: +49 341 90 98 7 508 email: t.stein@activate.de Geschäftsführer: Markus Hartwig, Rainer Jansen Handelsregister: Amtsgericht Leipzig (HRB 21850)
Hallo Tobias, Danke für Info. Wieviel braucht denn BS? Lieber reduzieren und Server nicht ganz auslasten, dafür aber stabil. LG Haiko Von meinem iPhone gesendet Am 11.02.2013 um 01:30 schrieb Tobias Stein <t.stein@activate.de>:
Hallo liebe Kollegen,
Lolek hatte ein Hauptspeicherproblem und dadurch u.a. den Prozess weggeschossen, welcher die virtuelle Maschine "rabbit01" darstellt. Dieses spontane Todesurtail fand wiederum die Mnesia-Datenbank in der virtuellen Maschine sehr fatal, denn diese konnte den im Hauptspeicher vorhandenen Zustand nicht auf Platte schreiben, bevor die Maschine getötet wurde.
Ich hab also die defekte Datenbank beseite geschoben, den Cluster Status von rabbit02 resettet. Anschließend wurden beide Knoten neu gestartet und wieder neu zum Cluster zusammen geführt.
Ich hoffe alle notwendigen Maßnahmen noch rekonstruiert zu haben: Die aif2-csv-worker wurden neu gestartet, die mongodb.worker haben die Queue HBD_AIF2 eröffnet und den Routing Key "temp_action" habe ich zum exchange "dummy" hinzugefügt.
Dem Hasen stehen jetzt nur noch 1.5 statt 3GB zu Verfügung. Da die JavaVM sich jedweden Speicher einverleibt, den man ihr anbiete, so muss entweder ein LXC-Konten weichen, die JVMs weniger Speicher allozieren dürfen oder Rabbit01 von lolek runter, aber das können wir ja morgen besprechen. 18 LXC-Container*2GB +6Kunden*1,2GB(hbd01) +1,5GB (rabbit01) + Betriebssystem des Wirtes sind zu viel für 48GB Speicher
Nächtliche Grüße Tobias
--
Tobias Stein - Systemadministration -
activate communication systems GmbH G.-Schumann-Str. 294 04159 Leipzig
Tel.: +49 341 90 98 7 508 email: t.stein@activate.de
Geschäftsführer: Markus Hartwig, Rainer Jansen Handelsregister: Amtsgericht Leipzig (HRB 21850) _______________________________________________ team mailing list team@lists.activate.de https://lists.activate.de/listinfo/team
participants (2)
-
Haiko Gerdes -
Tobias Stein