Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.


07.06.2022

Red Hat Enterprise Linux 9

Red Hat zaprezentował system operacyjny Red Hat Enterprise Linux 9 (RHEL 9)...
07.06.2022

Technologiczna piaskownica

Koalicja partnerów KIR, IBM, Chmura Krajowa, PKO Bank Polski, Urząd Komisji Nadzoru...
07.06.2022

Sztuczna inteligencja w...

OVHcloud wprowadziło na rynek AI Notebooks – najnowszy element w ofercie usług...
07.06.2022

Spójna ochrona brzegu sieci

Fortinet zaprezentował FortiOS 7.2 – najnowszą wersję swojego flagowego systemu...
07.06.2022

Zarządzanie transferem

Firma Progress wypuściła nową wersję oprogramowania do zarządzania transferem plików...
07.06.2022

Notebook ekstremalny

Panasonic przedstawił 14-calowy Toughbook 40, notebook do pracy w ekstremalnych...
07.06.2022

Zestaw startowy dla robotyki

Firma AMD przedstawiła najnowszy produkt w portfolio adaptacyjnych modułów SOM...
07.06.2022

Precyzja kadrowania

Najnowsze rozwiązania klasy pro firmy Poly mają sprostać zmieniającym się potrzebom...
07.06.2022

Serwer klasy korporacyjnej

QNAP zaprezentował nowy model serwera NAS, TS-h1886XU-RP R2, który działa na systemie...

System zasilania – kluczowy element centrum danych

Data publikacji: 07-06-2022 Autor: Sebastian Jary

Działy utrzymania ruchu dysponują nowoczesnymi systemami, które wspierają procesy zarządzania obiektem data center oraz monitorują dystrybucję zasilania. Systemy te nie są jednak w stanie całkowicie wyeliminować ryzyka przestoju. Awarie w systemach zasilania nadal występują, a ich konsekwencje są większe niż kiedykolwiek.

 

W 2020 r. Uptime Institute opublikował raport („Publicly Reported Outages 2018–19”) opisujący przyczyny przestojów data center. Dowiadujemy się z niego, że aż 25% wszystkich awarii było związanych z systemem energetycznym – komponentami instalacji dystrybucji zasilania. Natomiast z raportu dostarczonego przez Rittal w 2007 r., jednego z czołowych producentów bezpiecznych komór serwerowych, wynikało, że system energetyczny jest źródłem większości pożarów w obiektach data center. Prawie 80% pożarów było inicjowanych w miejscach, gdzie sprzęt IT nie występował. Miejscem, gdzie bardzo często dochodziło do pożaru, były pomieszczenia ruchu elektrycznego, np. pomieszczenia z bateriami systemu UPS.


W marcu 2021 r. mogliśmy zobaczyć, jak wielkim zagrożeniem jest pożar na przykładzie serwerowni OVHcloud – data center SBG2 w Strasburgu we Francji. W tym przypadku pożar wybuchł (podobnie jak opisuje to raport Rittala z 2007 r.) w pomieszczeniu z systemem UPS służącym do bezprzerwowego podtrzymywania zasilania w czasie występowania zaników napięcia w sieci miejskiej. Pożar zniszczył obiekt SBG2 i część sąsiedniego SBG1, a dwa pozostałe zostały odcięte od zasilania na kilka dni. Według firmy Netcraft, która od 1994 r. świadczy usługi w zakresie bezpieczeństwa internetowego, incydent spowodował wyłączenie 3,6 mln witryn internetowych.


Przedstawione raporty ukazują, jak istotnym elementem data center jest system energetyczny. Należy mieć na uwadze, że przywrócenie sprawności urządzeń i komponentów energetycznych, które uległy awarii, jest statystycznie bardziej czasochłonne niż np. wymiana uszkodzonego switcha lub przywrócenie poprzedniej wersji konfiguracji urządzenia ICT. Awarie w obszarze zasilania mogą uniemożliwić funkcjonowanie serwerowni przez kilka do kilkunastu dni (np. wymiana uszkodzonego transformatora lub odbudowa po pożarze głównej rozdzielnicy elektrycznej).


> Urządzenia i komponenty


Aby mieć pełną kontrolę nad eksploatowanym systemem energetycznym, należy kontrolować stan kluczowych urządzeń i komponentów elektrycznych. W pierwszej kolejności trzeba skupić się na zobrazowaniu pobieranej mocy przez obiekt data center i urządzenia wchodzące w skład ścieżki dystrybucji zasilania.


W celu realizacji tego zadania należy zaimplementować system oraz urządzenia umożliwiające monitorowanie każdego kluczowego komponentu infrastruktury energetycznej, tj. transformatora, agregatu prądotwórczego, zasilacza UPS, rozdzielnicy elektrycznej oraz listwy zasilającej w szafie rack. Tylko takie podejście daje nam możliwość zarządzania pojemnością centrum przetwarzania danych w czasie rzeczywistym oraz pozwala określić efektywność energetyczną obiektu.


Na rys. 1 przedstawiono najważniejsze komponenty wchodzące w skład infrastruktury zasilającej komorę IT. Wdrożenie monitorowania listew zasilających z opcją pomiaru każdego gniazda zasilającego zapobiega przeciążeniom prądowym w obszarze szaf rack oraz pozwala znacznie lepiej zarządzać wykorzystaniem cennej przestrzeni wewnątrz szaf. Prezentowanie w czasie rzeczywistym danych o poborze prądu przez każde gniazdo na listwie zasilającej daje operatorom data center unikalną możliwość wdrożenia zaawansowanych mechanizmów wirtualizacji.


Na rynku dostępne są modele listew zasilających umożliwiające zdalne wyłączanie nieużywanych gniazd zasilających. Tę funkcjonalność można wykorzystać w celu zabezpieczenia listwy przed nieautoryzowanym podłączeniem dodatkowego urządzenia, które mogłoby doprowadzić do przeciążenia listwy i w konsekwencji wyłączenia zasilania całej szafy rack.


Zautomatyzowane zbieranie danych z systemów energetycznych ma na celu umożliwienie analizy pod kątem zarządzania pojemnością w ramach każdego krytycznego komponentu oraz umożliwienie szybkiego postawienia diagnozy w sytuacji zagrożenia ciągłości działania obiektu.


> Szkolenia i „stress testy”


Wdrożenie profesjonalnego systemu monitorowania infrastruktury data center nie może zwalniać pracowników działu utrzymania ruchu z cyklicznych szkoleń z obsługi i konserwacji urządzeń oraz aparatów elektrycznych. Aby zminimalizować ryzyko pochodzące od czynnika ludzkiego, należy cyklicznie przeprowadzać symulowane „stress testy” dla obsługi obiektu.


Przykładem jednego z bardzo przydatnych ćwiczeń jest sprawdzanie reakcji operatora data center na niezadziałanie automatycznego systemu SZR (system samoczynnego załączenia rezerwy). Z założenia system SZR powinien automatycznie przełączać zasilanie centrum przetwarzania danych pomiędzy zasilaniem miejskim a agregatem prądotwórczym w przypadku zaniku zasilania miejskiego powyżej kilkudziesięciu sekund. Jeżeli z jakiejkolwiek przyczyny nie zadziała automatyczne przełączenie zasilania obiektu na agregat prądotwórczy, to urządzenia ICT będą zasilane tylko przez okres autonomii systemu UPS (przeważnie od 5 do 10 min). Po tym czasie urządzenia w komorze IT zostaną wyłączone. Ten czas (od 5 do 10 minut) jest krytyczny i należy go optymalnie wykorzystać w celu realizacji ręcznego przełączenia zasilania. Działając w stresie i pod wielką presją czasu (niekiedy w nocy), operator data center musi wykazać się biegłą znajomością awaryjnej procedury przełączenia zasilania. Po wszystkich ćwiczeniach należy się zastanowić, czy procedura reagowania na zdarzenie krytyczne może zostać udoskonalona.

 

[...]

 

Autor jest ekspertem ds. utrzymania i rozwoju infrastruktury data center w największej skandynawskiej instytucji finansowej. Od 13 lat zajmuje się problematyką budowy, utrzymania i efektywnego zarządzania centrami przetwarzania danych. Posiada międzynarodowe certyfikaty branżowe: CDCS, CDFOM oraz DCPRO-Cooling Professional.

Artykuł pochodzi z miesięcznika: IT Professional

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"