Das Rechenzentrum auf dem Zentralcampus ist nach einem Totalausfall der Kältetechnik wieder in Betrieb

Nach einem Ausfall der Kälteerzeugung im Verfügungsgebäude 1C auf dem Zentralcampus waren die zentralen Dienste der IT-Infrastruktur am Mittag des 28. Oktober 2014 wieder verfügbar.

Am Dienstagmorgen war die Fehlerursache gefunden: Durch Absinken der Außentemperatur auf unter zwei Grad (was in der Nacht zu Freitag erstmalig eintrat), wurde ein witterungsbedingt bisher nicht im Zusammenspiel aller Komponenten getestetes Betriebs-Szenario mit Nutzung der Außenluft für die Kühlung in Gang gesetzt. In der Steuerung dieses Szenarios lag ein Fehler vor, der in Folge zu einem Abschalten der Kälteversorgung führte. Dieser Fehler konnte behoben und damit auch der Betrieb des Rechenzentrums wieder aufgenommen werden.

 

Zuvor war in der Nacht zum vergangenen Freitag, den 24. Oktober 2014 die Kälteerzeugung des Verfügungsgebäudes 1C auf dem Zentralcampus durch einen Störfall komplett ausgefallen. Obwohl die Kälteanlagen manuell wieder in Betrieb genommen wurden, konnte die Ursache für den Ausfall bis Freitagmittag durch die verantwortlichen Firmen und Fachplaner nicht ermittelt werden. Zudem gab es einen erneuten Ausfall der Systeme. Im Rahmen einer sorgfältigen Risiko- und Folgenabschätzung haben die Verantwortlichen des Rechenzentrums und Gebäudemanagements gemeinsam mit dem Präsidenten der BTU die Entscheidung getroffen, das Rechenzentrum kontrolliert herunterzufahren. Dieser Schritt war notwendig, um bei einem erneuten Störfall während des Wochenendes mögliche Schäden an der Rechentechnik in Millionenhöhe abzuwenden. In dieser Situation und zu diesem Zeitpunkt konnte leider keine genügend lange Vorwarnzeit für die Information aller Nutzer eingehalten werden.

 

Ende September 2014 war das Rechenzentrum der Universität mit dem größten Teil seiner Servertechnik und das Institut für Informatik in das neue Verfügungsgebäude eingezogen. Dieser Umzug konnte durch gute Vorbereitung und mit hohem Einsatz der Mitarbeiterinnen und Mitarbeiter im laufenden Betrieb ohne nennenswerte Ausfälle durchgeführt werden. Seit Anfang Oktober liefen alle Server-Systeme stabil im neuen Gebäude.

 

Die Kolleginnen und Kollegen des Rechenzentrums und der Gebäudetechnik unternehmen alle Anstrengungen, um eine zuverlässige IT-Infrastruktur zur Verfügung zu stellen. In dem komplexen System eines neuen Gebäudes und unter neuen Betriebsbedingungen konnte der Fehler leider nicht verhindert werden.