Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.
Data publikacji: 20-12-2018 | Autor: | Grzegorz Kubera |
W kolejnej części cyklu tworzymy heatmapy, czyli mapy cieplne, z wykorzystaniem bibliotek Seaborn dostępnych dla języka Python. Omawiamy dwa rodzaje map oraz sposób konwertowania zestawów danych na macierze, co jest niezbędne do tego typu wizualizacji danych.
Następnie sprawdzamy jeszcze dane z drugiej tabeli. Wpisujemy:
flights.head()
Dostępne powinny być następujące dane:
Zestaw danych z napiwkami znamy już z wcześniejszej części kursu, natomiast drugi zestaw z przelotami został zaimportowany po raz pierwszy. Jest to zestaw danych pokazujący liczbę pasażerów (passengers), którzy odbyli lot samolotem w danym miesiącu (month) i roku (year).
Rozpoczynamy przygotowanie heatmapy, czyli rodzaju wizualizacji danych, w której liczby prezentowane są za pomocą kolorów na tzw. mapie cieplnej. Każdy element tabeli (macierzy z danymi) przybiera postać kolorowego kształtu (kwadratu, koła, kształtu nieregularnego czy piksela), którego kolor odpowiada określonej wartości.
> TWORZENIE MAP CIEPLNYCH
Aby heatmapa działała poprawnie, dane należy przygotować w formie macierzy. Najkrócej mówiąc, chodzi o to, aby nazwa indeksu i nazwa kolumny pasowały do siebie w taki sposób, że wartości komórek faktycznie wskazują na element, który odnosi się do obu tych nazw. Zobrazujemy to na przykładzie, używając zestawu danych tips, gdzie mamy zmienną total_bill, a tuż pod nią w komórce wartość 16,99 dolara. Wiersz znajdujący się obok – z wartością 0 – nie jest jednak zmienną. Teraz aby przygotować dane w formie macierzy, potrzebujemy zmiennych zarówno w kolumnach, jak i wierszach. Jest kilka sposobów na przygotowanie takiej macierzy danych. Pierwszym, jaki poznamy, jest korelacja danych. Wpisujemy komendę:
tips.corr()
Uzyskujemy efekt:
Jak widać, teraz zarówno kolumna, jak i nazwa indeksu mają zmienną o tej samej nazwie i wskazują pasującą do siebie komórkę. To właśnie forma matrycowa – macierz. Aby wywołać heatmapę, musimy opierać się właśnie na tak przygotowanych danych. Przygotowaną macierz możemy zapisać, wpisując:
tc = tips.corr()
Teraz można wywołać już pierwszą mapę cieplną. W tym celu wprowadzamy polecenie:
sns.heatmap(tc)
Mapa cieplna będzie wyglądać, jak pokazano na rys. 1. Jak widać, mamy tutaj wartości pokolorowane na podstawie skali gradientowej. Jeśli porównamy heatmapę do danych z tabeli tc, szybko zrozumiemy sposób prezentowania danych. Heatmapa tworzy odpowiednią skalę i obrazuje ją kolorami, a następnie prezentuje dane w postaci kolorowych kwadratów, przez co łatwo jest dostrzec wszelkie korelacje.
[...]
Założyciel firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 12-letnim doświadczeniem i autor książek nt. start-upów i przedsiębiorczości.
Artykuł pochodzi z miesięcznika: IT Professional
Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.
Transmisje online zapewnia: StreamOnline