Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



22.03.2019

Pożegnanie z systemem Windows...

System operacyjny Windows 7 wciąż cieszy się dużą popularnością wśród użytkowników...
22.03.2019

Segmentacja sieci

Fortinet FortiGate 3600E, 3400E, 600E i 400E
22.03.2019

Monitoring IP

TP-Link TL-SL1218MP
22.03.2019

Efektywność energetyczna

UPS Eaton 93E
21.02.2019

Wdrażanie projektów AI

Infrastruktura OVH
21.02.2019

Certyfikacja kluczy

HEUTHES-CAK
21.02.2019

Kopie zapasowe

Veeam Availability for AWS
21.02.2019

Dysk SSD Samsung 970 EVO Plus

Dysk SSD Samsung 970 EVO Plus
21.02.2019

Szyfrowane USB

Kingston IronKey D300 Serialized

Python, wizualizacja danych. Heatmapy w bibliotekach Seaborn

Data publikacji: 20-12-2018 Autor: Grzegorz Kubera

W kolejnej części cyklu tworzymy heatmapy, czyli mapy cieplne, z wykorzystaniem bibliotek Seaborn dostępnych dla języka Python. Omawiamy dwa rodzaje map oraz sposób konwertowania zestawów danych na macierze, co jest niezbędne do tego typu wizualizacji danych.

 

Następnie sprawdzamy jeszcze dane z drugiej tabeli. Wpisujemy:

flights.head()

Dostępne powinny być następujące dane:
 



Zestaw danych z napiwkami znamy już z wcześniejszej części kursu, natomiast drugi zestaw z przelotami został zaimportowany po raz pierwszy. Jest to zestaw danych pokazujący liczbę pasażerów (passengers), którzy odbyli lot samolotem w danym miesiącu (month) i roku (year).

Rozpoczynamy przygotowanie heatmapy, czyli rodzaju wizualizacji danych, w której liczby prezentowane są za pomocą kolorów na tzw. mapie cieplnej. Każdy element tabeli (macierzy z danymi) przybiera postać kolorowego kształtu (kwadratu, koła, kształtu nieregularnego czy piksela), którego kolor odpowiada określonej wartości.

> TWORZENIE MAP CIEPLNYCH

Aby heatmapa działała poprawnie, dane należy przygotować w formie macierzy. Najkrócej mówiąc, chodzi o to, aby nazwa indeksu i nazwa kolumny pasowały do siebie w taki sposób, że wartości komórek faktycznie wskazują na element, który odnosi się do obu tych nazw. Zobrazujemy to na przykładzie, używając zestawu danych tips, gdzie mamy zmienną total_bill, a tuż pod nią w komórce wartość 16,99 dolara. Wiersz znajdujący się obok – z wartością 0 – nie jest jednak zmienną. Teraz aby przygotować dane w formie macierzy, potrzebujemy zmiennych zarówno w kolumnach, jak i wierszach. Jest kilka sposobów na przygotowanie takiej macierzy danych. Pierwszym, jaki poznamy, jest korelacja danych. Wpisujemy komendę:

tips.corr()

Uzyskujemy efekt:

Jak widać, teraz zarówno kolumna, jak i nazwa indeksu mają zmienną o tej samej nazwie i wskazują pasującą do siebie komórkę. To właśnie forma matrycowa – macierz. Aby wywołać heatmapę, musimy opierać się właśnie na tak przygotowanych danych. Przygotowaną macierz możemy zapisać, wpisując:

 

tc = tips.corr()

Teraz można wywołać już pierwszą mapę cieplną. W tym celu wprowadzamy polecenie:

sns.heatmap(tc)

Mapa cieplna będzie wyglądać, jak pokazano na rys. 1. Jak widać, mamy tutaj wartości pokolorowane na podstawie skali gradientowej. Jeśli porównamy heatmapę do danych z tabeli tc, szybko zrozumiemy sposób prezentowania danych. Heatmapa tworzy odpowiednią skalę i obrazuje ją kolorami, a następnie prezentuje dane w postaci kolorowych kwadratów, przez co łatwo jest dostrzec wszelkie korelacje.

 

[...]

 

Założyciel firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 12-letnim doświadczeniem i autor książek nt. start-upów i przedsiębiorczości. 

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"