OVH: przyczyną pożaru był prawdopodobnie zasilacz awaryjny (UPS)

12 marca 2021, 17:07 | Aktualności | komentarzy 36

Dwa dni temu informowaliśmy o pożarze w serwerowni OVH w Strasburgu. Incydent ten był przyczyną problemów z dostępnością wielu serwisów, takich jak chociażby Lichess, VeraCrypt, Rust, Bonito, Baselinker, Imagify, czy Bad Packets. Jeśli przegapiłeś całą akcję, to zapraszamy tutaj.

Film informacyjny

Jak zwykle bywa z tego typu incydentami, klienci domagają się wyjaśnień. Założyciel OVH, Octave Klaba w swoim tweecie zaznacza, że właśnie został opublikowany film z wyjaśnieniami:

Update 11 mars 16h40
It's too slow to give you all the information with just 280 chars. Here, my video with 8min of information we have today.https://t.co/qjm3Vs0Ho2 pic.twitter.com/xTb09wmXJ0
— Octave Klaba (@olesovhcom) March 11, 2021

Cała wypowiedź Octave: https://www.ovh.com/fr/images/sbg/Octave-Klaba-speaking-en-vid.mp4

Video zaczyna się od przeprosin za zaistniałą sytuację. Prezes OVH zaznacza, że jest jeszcze zbyt wcześnie, aby odpowiedzieć na wszystkie pytania. Po przybyciu strażaków, kamery termowizyjne zarejestrowały dwie płonące jednostki UPS(zasilacze awaryjne). Jest to dość istotna informacja, ponieważ jednostka UPS7 była serwisowana rano przez konserwatora. W tamtym czasie wszystko wydawało się w porządku, a jednostka działała bezproblemowo, aż do momentu wybuchu pożaru. Z filmu możemy również dowiedzieć się, że trwają prace porządkowe, aby posprzątać bałagan po całym zajściu. Trwa również przebudowa serwerowni, a OVH nabyło w tym celu 2000 serwerów, a kolejne 1000 ma przybyć w ciągu kilku najbliższych dni.

Podsumowanie

Jak widać, OVH wzorcowo usuwa awarię, a liczba pożarów z roku na rok z pewnością będzie maleć. Prezes OVH stanął na wysokości zadania i w dość krótkim czasie zaczął na bieżąco informować o całym zajściu, jednocześnie nabywając nowe serwery w celu przebudowy serwerowni. Tego samego nie można powiedzieć o klientach serwisu, którzy nie posiadali żadnych zewnętrznych kopii zapasowych, ani planów na wypadek incydentu.

~ Jakub Bielaszewski

Spodobał Ci się wpis? Podziel się nim ze znajomymi:

Komentarze

x

12 marca, 2021 | 5:45 pm

początek podsumowania brzmi jak oświadczenie wodociągów kieleckich, brakuje tylko info że są w czołówce światowej ;)

Odpowiedz
- Autor
  
  12 marca, 2021 | 7:10 pm
  
  Podsumowanie nie jest takie przypadkowe :P
  
  Odpowiedz
Marek

12 marca, 2021 | 6:23 pm

> a liczba pożarów z roku na rok z pewnością będzie maleć
XD zabrzmiało jakby ta serwerownia płonęła 100x w ciągu roku.

Ale przeprosiny w miarę ok, bez korpo ściemy, same fakty.

Odpowiedz
Adam

12 marca, 2021 | 6:53 pm

Wodociągi Kieleckie w sposób wzorcowy usuwają awarie, w sposób błyskawiczny. Jesteśmy w czołówce krajowej, a nawet światowej. Liczba awarii z roku na rok maleje.

Odpowiedz
- a
  
  14 marca, 2021 | 1:39 pm
  
  To była specjalna i ironiczna odpowiedź wodociągów.
  
  Odpowiedz
Lompi

12 marca, 2021 | 7:54 pm

Ja się tylko zastanawiam dlaczego nie zadziałały, a przynajmniej nieskutecznie, systemy ppoż.

Odpowiedz
- Alan
  
  12 marca, 2021 | 10:01 pm
  
  Ciekawe, tym bardziej, że tu https://www.soyoustart.com/pl/centra-danych.xml pisza „Sale są wyposażone w systemy wykrywania cząstek dymu.”
  
  Odpowiedz
- Klub Pana Rysia
  
  13 marca, 2021 | 8:22 am
  
  Przy zapłonie baterii/akumulatora pożar postępuje tak szybko, że ugasić go można tylko działaniami wymierzonymi bezpośrednio w źródło. Co w cale nie oznacza, że coś tam u nich jednak zawiodło.
  
  Odpowiedz
  - CPMan1
    
    13 marca, 2021 | 3:52 pm
    
    W serwerowniach i tego typu pomieszczeniach (elektronika) stosuje systemy neutralizujące tlen w powietrzu: nie ma tlenu = nie ma ognia
    
    Odpowiedz
    - kuba049
      
      13 marca, 2021 | 8:37 pm
      
      Niektóre rzeczy nie potrzebują tlenu z zewnątrz, żeby się palić ;). Należą do nich również ogniwa litowo-jonowe z tego co wiem
      
      Odpowiedz
      - LlLlLlL
        
        25 marca, 2021 | 7:28 pm
        
        Wolisz żeby spaliły się same baterie czy cała serwerownia?
    - Michał
      
      26 marca, 2021 | 4:13 pm
      
      W wielu centrach (np Azure) nie stosuje się systemów neutralizujących tlenu, żeby przy okazji zadziałania systemu nie zabić pracujących tam ludzi.
      
      Odpowiedz
- Wojtek
  
  9 kwietnia, 2021 | 10:24 pm
  
  Bo nie było systemu gaszenia gazowego.
  
  Odpowiedz
matipl

12 marca, 2021 | 10:41 pm

> OVH nabyło w tym celu 2000 serwerów

ale jak to kupiło? przecież chwalili się, że sami je składają, dostosowując pod siebie etc. stąd cena itd.

Odpowiedz
- artur
  
  13 marca, 2021 | 1:49 am
  
  W takich sytuacjach pewnie zależy im na czasie.
  
  Odpowiedz
- Robert
  
  13 marca, 2021 | 6:47 am
  
  Mowa jest o 2000 serwerów dostarczonych Klientom w innych centrach danych OVHcloud i kolejnym 1000 w gotowości do uruchomienia (na moment nagrania filmu). Plus zwiększenie mocy produkcyjnych, by dostarczyć kolejne w szybkim czasie.
  
  Odpowiedz
- Klub Pana Rysia
  
  13 marca, 2021 | 8:19 am
  
  To może nabyli komponenty w celu złożenia. Czy niektórym trzeba każda informacje przedstawiać w formie rysunku?
  
  Odpowiedz
- janosz
  
  13 marca, 2021 | 8:48 am
  
  Chyba nie uwazasz ze OVH buduje wszystko od poczatku, oni musza miec gotowe komponenty do skladania i to wlasnie kupuja. Nic dziwnego i KAZDA serwerownia tak robi nawet te najwieksze.
  
  Odpowiedz
- Irek
  
  13 marca, 2021 | 9:22 am
  
  W takim przypadku liczy się czas i kupuje się gotowe rozwiązania. Wyobrażasz sobie ile mogłoby potrwać składanie takiego sprzętu w czasie pandemii i jaki sztab ludzi musiałby to robić.
  
  Odpowiedz
  - Wojtek
    
    18 marca, 2021 | 9:05 pm
    
    Ja ja chcę kupić 2-3 serwery to muszę czekać ok. miesiąca bo dopiero je będą składać, testować, dostarczać itp itd. (produkcja u wszystkich wiodących producentów). Tu był pożar i na magazynie czeka na sprzedaż dla OVH 2000 serwerów. Jak by byli przygotowani że będzie pożar i trzeba będzie szybko sprzedać.
    
    Odpowiedz
- Hed
  
  13 marca, 2021 | 10:05 am
  
  Jakby nie było to komponenty należy zakupić.
  
  Odpowiedz
- x
  
  13 marca, 2021 | 11:01 am
  
  pewnie gdyby nie (dosłownie) paląca sytuacja to by tak zrobili. a tak trzeba kupić gotowe by czym prędzej odbudować infrastrukturę
  
  Odpowiedz
shpak

12 marca, 2021 | 11:53 pm

IV Prawo Murphy’ego odnośnie elektroniki:
– Układ zabezpieczający zniszczy układy zabezpieczane

Odpowiedz
asdsad

13 marca, 2021 | 12:21 am

Wyobrażam sobie co mogło stać się z UPS-em…
Pewnie zmieniali akumulatory. W większości UPS-ów (nawet EATON i APC) dość powszechne są ostre krawędzie wewnątrz obudowy. Dość ważną rolę pełni tam… dwustronna taśma klejąca, która nie każdy wsadza z powrotem na miejsce. No i można się pomylić kupując aku ze stykami 4,8mm zamiast 6,3mm – niby da się podłączyć, ale kontakt jest słaby i kabelek może zlecieć i przyspawać się do jakiejś blachy… Ciepła robi się z tego cała masa. Jeśli nie ma gaszenia gazem, to będzie się grzać aż do wyładowania akumulatora.

Odpowiedz
- Vinter
  
  13 marca, 2021 | 12:40 pm
  
  A ja trochę inaczej kojarzę UPSy w dużych serwerowniach…
  
  Odpowiedz
  - asdsad
    
    14 marca, 2021 | 12:58 pm
    
    No dobra – racja. Pewnie są osobne UPS-ownie, albo UPS-y wielkości szafy. Ale wiadomo? Może akurat dziadowali i mieli popierdółki 2U? :D
    
    Odpowiedz
Wszystko sie zgadza

13 marca, 2021 | 2:09 am

Zasilacze byly _awaryjne_, to ulegly awarii.

Powinni miec bezawaryjne.

Odpowiedz
- zero one
  
  13 marca, 2021 | 9:11 pm
  
  Było w jednej komedii: „Z wypadku lotniczego zawsze przeżywają tylko czarne skrzynki. Dlaczego nikt nie wpadł na pomysł aby z tego samego tworzywa robić samoloty?” ;-E
  
  Nie słowo w słowa – tak z pamięci ;-)
  
  Odpowiedz
Twój nick

13 marca, 2021 | 5:17 pm

Nie wiem jakie baterie stosują, ale ogniwa litowo jonowe bardzo trudno się gasi wodą. Niech to będzie lekcja dla każdego posiadacza współczesnej elektroniki.

Odpowiedz
Tryby

13 marca, 2021 | 8:31 pm

Oni oferowali w cenie serwer na backup. Ale prawdopodobnie w tej samej serwerowni

Odpowiedz
- Majk
  
  14 marca, 2021 | 10:10 am
  
  tego nie przewidzieli ;)
  
  Odpowiedz
Greg

13 marca, 2021 | 10:21 pm

Heh, chyba już coś takiego widziałem w serialu „Mr. Robot”. :D

Odpowiedz
John Sharkrat

16 marca, 2021 | 7:31 am

„Jak widać, OVH wzorcowo usuwa awarię,” – wzorcowo to im nie zadziałał system ppoż

Odpowiedz
spox

18 marca, 2021 | 11:13 am

ovh wam płaci za korpopropagandę?

Odpowiedz
seba

19 marca, 2021 | 2:06 pm

Miałem w tym budynku serwerek. Dla mnie jest to bardzo dziwna sprawa, bo mam tam serwer od chyba 9lat a ten który był w SBG2 od chyba 4. I dzień przed tj o 13:00 został pierwszy raz wyłączony od sieci na pol godziny ze względu na DDoS atak a nigdy wczesniej nie był blokowany w ten sposób….przypadek? nie sądzę :) Czy inni wlasciciele serwerków też mieli jakieś dzwine sytuacje w ostatnich dniach przed awarią?

Zanim dostałem się do backupowago (storage backup) serwerka minely 3 ni zanim miałem pewność, że na szczęście był w innej loalizacji RBX i za to im chwała. Ogólnie sytuacja była naprawdę ciężka.

Odpowiedz
- begees
  
  27 marca, 2021 | 12:47 pm
  
  Też miałem tam VPS’a z automatycznym backupem…tylko nie mogą zlokalizować tej kopii bezpieczeństwa ponieważ nie trzymają podobno żadnego loga gdzie te kopie są, a technicy informują tylko, że instancja po instancji przeszukują i zgrywają to co ocalało z pożaru i wtedy dopiero identyfikują kopie z VPS’ami.
  
  Podobno nie można się inaczej dowiedzieć gdzie jest i kiedy (jeśli w ogóle) odzyskają naszą kopię?
  
  Czy to jest normą, że trzyma się kopie w tej samej infrastrukturze? Wynika z tego, że nikt kto planował tę serwerownie nie pomyślał, że może się ona spalić.
  
  Odpowiedz

Jak działa skuteczny SOC?

OVH: przyczyną pożaru był prawdopodobnie zasilacz awaryjny (UPS)

Spodobał Ci się wpis? Podziel się nim ze znajomymi:

Komentarze

Odpowiedz