Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.


31.12.2020

Cykl webinarów

weinnovators.club
30.12.2020

Integracja z Teams

Veeam Backup
30.12.2020

Namierzanie zagrożeń

Flowmon Networks i Fortinet
30.12.2020

Wsparcie dla przedsiębiorstw

VMware Cloud on AWS
29.12.2020

Nowe NAS-y Thunderbolt 3

QNAP QuTS TVS-h1288X i TVS-h1688X
29.12.2020

Modele kompaktowe

VPL-PHZ60 i VPL-PHZ50
28.12.2020

Dedykowane przemysłowi

Seria TJ
28.12.2020

Nowa generacja

Router QHora-301W

Python, wizualizacja danych. Heatmapy w bibliotekach Seaborn

Data publikacji: 20-12-2018 Autor: Grzegorz Kubera

W kolejnej części cyklu tworzymy heatmapy, czyli mapy cieplne, z wykorzystaniem bibliotek Seaborn dostępnych dla języka Python. Omawiamy dwa rodzaje map oraz sposób konwertowania zestawów danych na macierze, co jest niezbędne do tego typu wizualizacji danych.

 

Następnie sprawdzamy jeszcze dane z drugiej tabeli. Wpisujemy:

flights.head()

Dostępne powinny być następujące dane:
 



Zestaw danych z napiwkami znamy już z wcześniejszej części kursu, natomiast drugi zestaw z przelotami został zaimportowany po raz pierwszy. Jest to zestaw danych pokazujący liczbę pasażerów (passengers), którzy odbyli lot samolotem w danym miesiącu (month) i roku (year).

Rozpoczynamy przygotowanie heatmapy, czyli rodzaju wizualizacji danych, w której liczby prezentowane są za pomocą kolorów na tzw. mapie cieplnej. Każdy element tabeli (macierzy z danymi) przybiera postać kolorowego kształtu (kwadratu, koła, kształtu nieregularnego czy piksela), którego kolor odpowiada określonej wartości.

> TWORZENIE MAP CIEPLNYCH

Aby heatmapa działała poprawnie, dane należy przygotować w formie macierzy. Najkrócej mówiąc, chodzi o to, aby nazwa indeksu i nazwa kolumny pasowały do siebie w taki sposób, że wartości komórek faktycznie wskazują na element, który odnosi się do obu tych nazw. Zobrazujemy to na przykładzie, używając zestawu danych tips, gdzie mamy zmienną total_bill, a tuż pod nią w komórce wartość 16,99 dolara. Wiersz znajdujący się obok – z wartością 0 – nie jest jednak zmienną. Teraz aby przygotować dane w formie macierzy, potrzebujemy zmiennych zarówno w kolumnach, jak i wierszach. Jest kilka sposobów na przygotowanie takiej macierzy danych. Pierwszym, jaki poznamy, jest korelacja danych. Wpisujemy komendę:

tips.corr()

Uzyskujemy efekt:

Jak widać, teraz zarówno kolumna, jak i nazwa indeksu mają zmienną o tej samej nazwie i wskazują pasującą do siebie komórkę. To właśnie forma matrycowa – macierz. Aby wywołać heatmapę, musimy opierać się właśnie na tak przygotowanych danych. Przygotowaną macierz możemy zapisać, wpisując:

 

tc = tips.corr()

Teraz można wywołać już pierwszą mapę cieplną. W tym celu wprowadzamy polecenie:

sns.heatmap(tc)

Mapa cieplna będzie wyglądać, jak pokazano na rys. 1. Jak widać, mamy tutaj wartości pokolorowane na podstawie skali gradientowej. Jeśli porównamy heatmapę do danych z tabeli tc, szybko zrozumiemy sposób prezentowania danych. Heatmapa tworzy odpowiednią skalę i obrazuje ją kolorami, a następnie prezentuje dane w postaci kolorowych kwadratów, przez co łatwo jest dostrzec wszelkie korelacje.

 

[...]

 

Założyciel firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 12-letnim doświadczeniem i autor książek nt. start-upów i przedsiębiorczości. 

Artykuł pochodzi z miesięcznika: IT Professional

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"