Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



10.06.2019

Inteligentne zarządzanie...

W dniach 11, 12 i 13 czerwca – odpowiednio – w Gdańsku, w Warszawie i w Katowicach,...
27.05.2019

Rozwiązania na platformie GCP

Citrix SD-WAN i Citrix ADC
27.05.2019

Chmura hybrydowa

Dell Technologies Cloud
27.05.2019

Uproszczona komunikacja

Cisco Webex
24.05.2019

Konferencja IT Manager of...

W dniach 12–14 czerwca w Sopocie odbędzie się konferencja IT Manager of Tomorrow 2019. To...
24.05.2019

Ochrona sieci

Fortinet FortiOS 6.2
24.05.2019

Mniejsza złożoność

Rittal VX25 Ri4Power
24.05.2019

All-in-one NAS

QNAP TDS-16489U R2
24.05.2019

Układy SoC

AMD Ryzen Embedded R1000

Python, wizualizacja danych. Heatmapy w bibliotekach Seaborn

Data publikacji: 20-12-2018 Autor: Grzegorz Kubera

W kolejnej części cyklu tworzymy heatmapy, czyli mapy cieplne, z wykorzystaniem bibliotek Seaborn dostępnych dla języka Python. Omawiamy dwa rodzaje map oraz sposób konwertowania zestawów danych na macierze, co jest niezbędne do tego typu wizualizacji danych.

 

Następnie sprawdzamy jeszcze dane z drugiej tabeli. Wpisujemy:

flights.head()

Dostępne powinny być następujące dane:
 



Zestaw danych z napiwkami znamy już z wcześniejszej części kursu, natomiast drugi zestaw z przelotami został zaimportowany po raz pierwszy. Jest to zestaw danych pokazujący liczbę pasażerów (passengers), którzy odbyli lot samolotem w danym miesiącu (month) i roku (year).

Rozpoczynamy przygotowanie heatmapy, czyli rodzaju wizualizacji danych, w której liczby prezentowane są za pomocą kolorów na tzw. mapie cieplnej. Każdy element tabeli (macierzy z danymi) przybiera postać kolorowego kształtu (kwadratu, koła, kształtu nieregularnego czy piksela), którego kolor odpowiada określonej wartości.

> TWORZENIE MAP CIEPLNYCH

Aby heatmapa działała poprawnie, dane należy przygotować w formie macierzy. Najkrócej mówiąc, chodzi o to, aby nazwa indeksu i nazwa kolumny pasowały do siebie w taki sposób, że wartości komórek faktycznie wskazują na element, który odnosi się do obu tych nazw. Zobrazujemy to na przykładzie, używając zestawu danych tips, gdzie mamy zmienną total_bill, a tuż pod nią w komórce wartość 16,99 dolara. Wiersz znajdujący się obok – z wartością 0 – nie jest jednak zmienną. Teraz aby przygotować dane w formie macierzy, potrzebujemy zmiennych zarówno w kolumnach, jak i wierszach. Jest kilka sposobów na przygotowanie takiej macierzy danych. Pierwszym, jaki poznamy, jest korelacja danych. Wpisujemy komendę:

tips.corr()

Uzyskujemy efekt:

Jak widać, teraz zarówno kolumna, jak i nazwa indeksu mają zmienną o tej samej nazwie i wskazują pasującą do siebie komórkę. To właśnie forma matrycowa – macierz. Aby wywołać heatmapę, musimy opierać się właśnie na tak przygotowanych danych. Przygotowaną macierz możemy zapisać, wpisując:

 

tc = tips.corr()

Teraz można wywołać już pierwszą mapę cieplną. W tym celu wprowadzamy polecenie:

sns.heatmap(tc)

Mapa cieplna będzie wyglądać, jak pokazano na rys. 1. Jak widać, mamy tutaj wartości pokolorowane na podstawie skali gradientowej. Jeśli porównamy heatmapę do danych z tabeli tc, szybko zrozumiemy sposób prezentowania danych. Heatmapa tworzy odpowiednią skalę i obrazuje ją kolorami, a następnie prezentuje dane w postaci kolorowych kwadratów, przez co łatwo jest dostrzec wszelkie korelacje.

 

[...]

 

Założyciel firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 12-letnim doświadczeniem i autor książek nt. start-upów i przedsiębiorczości. 

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"