Hallo zusammen, am Mittwoch und Donnerstag früh werden Arbeiten an der Stromversorgung unserer Server durchgeführt, bei denen das Risiko besteht komplette Racks ausfallen. Hintergrund: wir benötigen sehr viel Strom und der vom Betreiber geplante Umschaltvorgang kann eine Stromspitze erzeugen welche die Sicherung fliegen läßt. Das Ganze findet zwei Mal statt: Mittwoch, 22.01.2025: 00:00 - 06:00 Donnerstag, 23.01.2025: 00:00 - 06:00 Das Risiko Wenn ein oder beide Racks ausfallen, starten die Server neu. Wir können dort dann alle Systeme neu starten, bei denen das nicht automatisch funktioniert hat. Das betraf beim letzten Mal vor 4 Jahren ca. 10% der Anlage. Die Wiederherstellung kritischer Systeme hat bis in den Vormittag hinein gedauert. Fallen die Hauptswitche aus, muß vor Ort im Rechenzentrum agiert werden. Unsere Vorbereitung Wir drosseln in beiden Nächten den Boost Modus der Server. Damit wird die Leistung bei ca. 60% gekappt Wir verbrauchen weniger Strom Importe, Exporte werden langsamer laufen Wir schalten alle Server ab, welche produktiv nachts nicht benötigt werden. Wir reduzieren den booking core, in dem die Alt-Server offline genommen werden. Aktuell ist der booking core nach den Umzügen auf neue Hardware um einiges größer ausgelegt als nötig. Charlyn hat im letzten Jahr sehr viel Arbeit in das Freiräumen von 18 Servern gesteckt, die bereits abgeschaltet wurden. Im Gegenzug wurde allerdings auch neue angeschafft und im Resultat haben und nutzen wir mehr Rechenleistung, brauchen aber immer noch viel Strom. Unsere Kunden werden informiert Viele Grüße, Gunnar Hello everyone, On Wednesday and Thursday morning, maintenance work will be carried out on the power supply of our servers, during which there is a risk that entire racks may fail. Background: we require a significant amount of power, and the switching process planned by the operator may generate a power surge that could trip the circuit breaker. This will occur twice: Wednesday, 22.01.2025: 00:00 - 06:00 Thursday, 23.01.2025: 00:00 - 06:00 The Risk If one or both racks fail, the servers will restart. We can then manually restart all systems that did not automatically reboot successfully. During the last incident four years ago, about 10% of the systems were affected. The restoration of critical systems extended into the morning. If the main switches fail, on-site intervention at the data center will be necessary. Our Preparation We will throttle the boost mode of the servers on both nights to cap performance at approximately 60%. This will reduce our power consumption. Imports and exports will run more slowly. We will shut down all servers that are not needed for productive operations overnight. We will reduce the booking core by taking offline legacy servers. Currently, after migrations to new hardware, the booking core is significantly larger than necessary. Charlyn has invested a lot of effort over the past year in clearing out 18 servers that have already been shut down. However, new hardware has also been acquired, resulting in increased computing power usage while still requiring substantial power. Our customers will be informed accordingly. -- Mit freundlichen Grüßen Gunnar Mann - Leitung Systemadministration | Head of System Administration - ________________________________________________________ TraSo GmbH Nonnenstraße 42 D-04229 Leipzig Tel.: +49 341 355 740 76 Fax: +49 341 355 740 21 E-Mail: g.mann@traso.de <mailto:g.mann@traso.de> <https://www.traso.de/> <https://www.facebook.com/TraSoGmbH> <https://www.xing.com/companies/trasogmbh> <https://www.kununu.com/de/traso1> ________________________________________________________ Geschäftsführer: Haiko Gerdes Handelsregister: Amtsgericht Leipzig, HRB 21850
participants (1)
-
Gunnar Mann