Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.
Data publikacji: 04-11-2022 | Autor: | Marcin Jurczyk |
Aby skutecznie przeciwdziałać niepożądanym wydarzeniom w szeroko rozumianej infrastrukturze IT, warto wykorzystywać specjalne narzędzia do monitoringu środowiska. Sprawdzamy możliwości jednego z najpopularniejszych rozwiązań na rynku.
O programowań do monitorowania stanu pracy poszczególnych komponentów zarządzanego środowiska jest mnóstwo. W zależności od tego, co zamierzamy monitorować i jakie są preferencje konkretnego zespołu odpowiedzialnego za wybraną część infrastruktury, liczba narzędzi służących do monitoringu w każdej organizacji może się różnić. Zupełnie inny zestaw narzędzi będzie wykorzystywany przez zespół utrzymania sieci w porównaniu z potrzebami administratorów konkretnych rodzin systemów operacyjnych, rozwiązań do wirtualizacji czy w końcu z wymaganiami deweloperów.
Dotychczas testowaliśmy wiele narzędzi przeznaczonych za każdym razem dla nieco innego grona odbiorców. Niektóre produkty świetnie sprawdzały się w homogenicznych środowiskach opartych na rozwiązaniach Microsoftu, jeszcze inne były szyte na miarę pod kątem szerokiego spektrum urządzeń stricte sieciowych. Na rynku dostępne są także rozwiązania, które przynajmniej w teorii powinny pokryć zapotrzebowanie niemal każdej z wyżej wspomnianych grup, oferując monitoring niemalże dowolnego komponentu środowiska IT wpiętego do sieci. Takim właśnie produktem jest Datadog – platforma do monitoringu i analizy danych, działająca w modelu Software-as-a-Service (SaaS), pozycjonowana jako lider w kategorii Application Performance Monitoring and Observability (Gartner).
> Architektura
Datadog to oprogramowanie działające w modelu SaaS, czyli interfejs zarządzania wraz z elementami konfiguracyjnymi udostępniany jest wszystkim użytkownikom podłączonym do internetu za pośrednictwem przeglądarki. Również całe przetwarzanie danych odbywa się po stronie dostawcy rozwiązania. Wśród dostępnych materiałów producenta znaleźć można informacje, że pod maską Datadoga, mamy do czynienia z platformą hostowaną w środowisku multi-cloud, bazującą na technologii Kubernetes. Istotną informacją jest też fakt, iż komunikacja z monitorowanym środowiskiem opiera się na aplikacji agenta instalowanej na wszystkich komponentach infrastruktury, które mamy zamiar kontrolować. Producent wspiera najpopularniejsze platformy systemowe, z uwzględnieniem Windowsa, Mac OS X, zróżnicowanych edycji Linuksa (Debian, Amazon Linux, CentOS/Red Hat, Fedora, SUSE, CoreOS) czy chociażby AIX-a.
Poza tradycyjnymi hostami dostępne są również odpowiednie wersje agenta na platformy kontenerowe: Docker, Kubernetes czy OpenShift. W przypadku Dockera mamy do czynienia z osobnym kontenerem z wbudowanym agentem. Dostępne są obrazy dla architektury x86_64 oraz arm64. Implementacja agenta dla orkiestratorów może odbyć się na trzy sposoby – z wykorzystaniem Datadog Operatora, Helma i DaemonSetu, w zależności od preferencji użytkownika. Datadog wspiera także inne ścieżki dystrybucji agenta, z uwzględnieniem najpopularniejszych projektów, jak chociażby Chef, Puppet, Ansible, SaltStack czy Chocolatey. Odpowiedni agent dostępny jest także dla Cloud Foundry oraz Heroku.
Możliwości integracji Datadoga z innymi produktami wykraczają znacznie poza zbieranie informacji systemowych z wymienionych powyżej platform. Z poziomu webGUI można wybrać z ponad 500 gotowych do użycia integracji z najpopularniejszymi, jak również tymi mniej znanymi produktami zewnętrznymi. Integracje da się interpretować jako wtyczki do Datadoga pozwalające obsługiwać dane zbierane ze zróżnicowanych systemów źródłowych. Po stronie monitorowanych obiektów taka integracja może sprowadzać się do edycji kilku linii w plikach YAML na poziomie już zainstalowanej aplikacji agenta. Może też wymagać doinstalowania dodatkowych bibliotek czy też zwykłego skonfigurowania komunikacji z wykorzystaniem interfejsów API. Klucz API to także unikalny identyfikator organizacji, dla której implementujemy system monitoringu na podstawie Datadoga. Należy go podać podczas instalacji każdej aplikacji agenta czy innej integracji.
> Możliwości
Datadog pozwala na monitorowanie praktycznie wszystkich komponentów wpiętych do sieci, zarówno tych czysto infrastrukturalnych, jak również aplikacji hostowanych na tej infrastrukturze i to bez względu na to, czy jest to tradycyjne centrum przetwarzania danych, czy też są to usługi działające w chmurze publicznej.
INFRASTRUKTURA
Aby ułatwić zrozumienie zakresu funkcjonalnego, producent skategoryzował obszary, w których Datadog może okazać się przydatny. Pierwszą i pewnie dla sporej grupy użytkowników najważniejszą grupą jest monitoring infrastruktury. Mowa tu o zbieraniu informacji bezpośrednio z poziomu agentów instalowanych na fizycznych lub wirtualnych węzłach sieciowych w celu analizy interesujących metryk. Przekroczenie z góry zdefiniowanych parametrów brzegowych może wyzwolić alert, a odpowiednie powiadomienie zostanie wysłane do wybranej grupy odbiorców. Jest to najpopularniejszy scenariusz dla systemów monitoringu, szczególnie z punktu widzenia administratora systemów.
Dostępność, wydajność oraz wykorzystanie zasobów to podstawowe elementy, na które należy zwracać uwagę. Oczywiście, aby ułatwić codzienne obowiązki, użytkownik panelu zarządzania może skonfigurować odpowiednie pulpity (dashboards), tak aby wyświetlały najistotniejsze parametry. Fizyczna lokalizacja monitorowanych zasobów nie ma żadnego znaczenia, dopóki mają one swobodną możliwość komunikacji internetowej. W ten sposób można kontrolować zarówno zasoby w ramach tradycyjnych centrów przetwarzania danych, jak i środowiska chmury publicznej, prywatnej czy też hybrydowej z poziomu pojedynczej konsoli zarządzania. Wspierane są także wszystkie typy zasobów, począwszy od tradycyjnych instancji fizycznych, poprzez środowiska wirtualne, po skonteneryzowane. Dedykowane wtyczki do integracji pozwalają na pobieranie danych bezpośrednio z poziomu popularnych hypervisorów czy orkiestratorów. Metryki wydajności mogą być prezentowane w formie wykresów graficznych, dla których łatwo analizować zmiany na osi czasu. Domyślnie do wyboru są wykresy punktowe oraz wykresy w funkcji czasu. Monitorowane zasoby da się grupować na podstawie tagów, dzięki czemu łatwiej zarządzać prezentowanymi informacjami.
Monitoring infrastruktury to także możliwość analizy zdarzeń na poziomie usług typu serverless, zarówno pod kątem liczby wywołań określonych funkcji, opóźnień, jak i nieudanych uruchomień. Poza wsparciem dla AWS Lambda, która jest najlepiej udokumentowana, wspierane są także Azure App Service czy Google Cloud Run. Na liście integracji znaleźć można więcej pozycji związanych z popularnymi usługami serverless, ze szczególnym naciskiem na portfolio AWS.
Monitoring infrastruktury to nie tylko zbieranie danych z poziomu popularnych systemów operacyjnych, na których uruchomiono aplikacje agenta. Datadog oferuje także Network Performance Monitoring, pozwalając śledzić ruch sieciowy pomiędzy usługami, hostami czy kontenerami. Dane te można także agregować, pozwalając na łatwe śledzenie wszystkich połączeń związanych z konkretną aplikacją czy komunikację end-to-end. Oczywiście w zależności od monitorowanych węzłów sieciowych z wykorzystaniem agenta wykorzystywane są różne mechanizmy, jak chociażby eBPF dla platformy Linux, sterowniki sprzętowe dla Windowsów czy Istio dla kontenerów. Monitoring sieci pozwala analizować ruch pod względem ilości retransmisji, opóźnienia czy ilości danych. Datadog tworzy też automatycznie mapy połączeń sieciowych, a także umożliwia szybką weryfikację działania usług DNS z poziomu monitorowanych hostów.
Monitoring sieci to nie tylko zbieranie danych z urządzeń, dla których istnieje odpowiednia wersja aplikacji agenta. Urządzenia sieciowe, jak chociażby przełączniki, routery, firewalle czy load balancery, zazwyczaj nie pozwalają na instalację dodatkowych programów. Datadog pozwala także na wykorzystanie protokołu SNMP, aby uzupełnić zakres wspieranych urządzeń końcowych. Metryki pobierane są w tym przypadku z poziomu agenta instalowanego na hoście, którego rolą jest integracja za pośrednictwem protokołu SNMP. Od lipca bieżącego roku wspierane są także trapy SNMP dla ponad 12 tys. obiektów MIB (agent v7.37+).
[...]
Autor pracuje jako architekt IT w firmie Kyndryl. Zajmuje się infrastrukturą sieciowo-serwerową, wirtualizacją infrastruktury i pamięcią masową.
Artykuł pochodzi z miesięcznika: IT Professional
Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.
Transmisje online zapewnia: StreamOnline