Die folgende Stellungnahme wurde soeben an alle betroffenen Kunden versandt:

Sehr geehrte Damen und Herren,

hiermit möchten wir Sie über die Störung am Standort First Colo am heutigen Abend informieren. Um 20:29 Uhr bemerkte unser Monitoring, dass alle Server am besagten Standort offline waren. Eine umgehende Prüfung durch unsere Techniker ergab keine Probleme auf unserer Seite, sodass wir die Bereitschaft des Rechenzentrums kontaktierten. Bereits sechs Minuten später konnten wir im Monitoring sehen, dass der Großteil unserer Infrastruktur wieder erreichbar war. Wir informierten die Bereitschaft des Rechenzentrums darüber, dass weiterhin Teile unserer Infrastruktur bzw. spezifische IPs nicht erreichbar waren, und erhielten - leider erst um 21:10 Uhr - die Rückmeldung, dass es trotz mehrfach redundanter Stromversorgung unserer Server zu einer Stromunterbrechung von fünf Sekunden gekommen war. Aufgrund des kurzen Stromausfalls rebooteten einige Router und Core- sowie Rackswitche, was die eigentliche Downtime von sechs Minuten verursachte. Leider war uns bis zur besagten Rückmeldung aus dem Rechenzentrum nicht klar, dass es einen Stromausfall gegeben hatte, weshalb wir bei den Servern, die im Monitoring noch als offline gemeldet wurden, von einer Netzwerkstörung ausgingen. Erst nach der Information über den Stromausfall nahmen wir weitere Untersuchungen auf unserer Seite vor. Hierbei stellten wir fest, dass die Redundanz der Stromversorgung in fast allen Fällen durchaus gegriffen hatte, lediglich bei zwei vServer-Hostsystemen - vnode15 und vnode20 - war es zu einem Reboot gekommen, trotzdessen auch diese Server eigentlich redundant (über zwei Stromphasen) angebunden sind. Alle anderen Systeme liefen durchgehend und waren nur netzwerkseitig kurzzeitig nicht erreichbar. Auf vnode15 starteten die VMs automatisch und fehlerfrei, sodass diese nach weiteren drei Minuten wieder erreichbar waren. Lediglich auf vnode20 mussten wir diese händisch starten, was aufgrund der beschriebenen Umstände leider erst kurz nach 21:10 Uhr erfolgte und daher auf diesem Node für eine vergleichsweise lange Störung von 45 Minuten verursachte. Dies bitten wir zu entschuldigen - da der Node selbst unmittelbar wieder online war, konnten wir zu diesem Zeitpunkt im Monitoring schlicht noch keinen Zusammenhang erkennen. Wir werden dahingehend in Kürze einen weiteren Check in unserem Monitoring implementieren, welcher einen Alarm ausgibt, falls das geprüfte System kürzlich neugestartet wurde.

Wir bitten die Unannehmlichkeiten zu entschuldigen und werden Sie erneut informieren, sobald uns eine abschließende Stellungnahme von First Colo über den (partiellen) Stromausfall vorliegt. Sofern Sie aktuell noch ein Problem mit Ihrem Server haben, melden Sie sich bitte umgehend unter hi@php-friends.de.

Mit freundlichen Grüßen
Ihr Team der PHP-Friends GmbH

PHP-Friends GmbH . Ruhrorter Straße 55a . 46049 Oberhausen

Telefon +49 201 857 938 01
Telefax +49 201 857 938 00

https://php-friends.de

Amtsgericht Duisburg, HRB 28335
USt-IdNr.: DE 301 459 640
Geschäftsführer: Marvin Strauch, Tim Schneider

Reply · Report Post