Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



10.06.2019

Inteligentne zarządzanie...

W dniach 11, 12 i 13 czerwca – odpowiednio – w Gdańsku, w Warszawie i w Katowicach,...
27.05.2019

Rozwiązania na platformie GCP

Citrix SD-WAN i Citrix ADC
27.05.2019

Chmura hybrydowa

Dell Technologies Cloud
27.05.2019

Uproszczona komunikacja

Cisco Webex
24.05.2019

Konferencja IT Manager of...

W dniach 12–14 czerwca w Sopocie odbędzie się konferencja IT Manager of Tomorrow 2019. To...
24.05.2019

Ochrona sieci

Fortinet FortiOS 6.2
24.05.2019

Mniejsza złożoność

Rittal VX25 Ri4Power
24.05.2019

All-in-one NAS

QNAP TDS-16489U R2
24.05.2019

Układy SoC

AMD Ryzen Embedded R1000

Python, wizualizacja danych – możliwości bibliotek Seaborn

Data publikacji: 26-11-2018 Autor: Grzegorz Kubera

W tej części kursu omawiamy kolejne możliwości bibliotek Seaborn, pozwalające w łatwy sposób wizualizować nawet skomplikowane zbiory danych. Uczymy się rysować między innymi wykresy pudełkowe i skrzypcowe.

 

Kontynuujemy poznawanie bibliotek Seaborn. Zaczynamy od przygotowania środowiska pracy. W systemie Windows na pasku zadań wpisujemy Anaconda Prompt i uruchamiamy wiersz poleceń. Następnie podajemy komendę:


conda install seaborn
conda install numpy
conda install matplotlib


Wszystkie komendy należy zatwierdzić i po kolei zainstalować biblioteki NumPy, Matplotlib i Seaborn. Jeśli zostały zainstalowane wcześniej, nie musimy robić tego ponownie. Możliwe, że wyświetli się komunikat o nowszej wersji Anacondy. W tym wypadku warto zainstalować aktualizację, wpisując polecenie:


conda update -n base conda


Po instalacji uruchamiamy Jupytera, wpisując:


jupyter notebook


Następnie otwieramy notatnik w Pythonie 3 i wpisujemy komendy:


import seaborn as sns
%matplotlib inline
sns.set(color_codes=True)
tips = sns.load_dataset('tips')
tips.head()

 

Komendy te odpowiednio oznaczają, że:

 

  • zaimportowaliśmy biblioteki Seaborn i chcąc z nich korzystać, będziemy podawać funkcje zaczynające się od polecenia sns;
  • będziemy wyświetlać wizualizacje bezpośrednio w notatniku Jupyter;
  • aktywowaliśmy style graficzne z Seaborn, które są atrakcyjniejsze i nowocześniejsze niż domyślne, zapewniane przez Jupytera;
  • załadowaliśmy zestaw danych z napiwkami (tips), który jest domyślnie wgrany w bibliotekach Seaborn;
  • wywołaliśmy dane z zestawu danych w formie tabeli.

 

Po wpisaniu ostatniej z komend zobaczymy tabelę z danymi:


Teraz poznamy popularny rodzaj wykresu, który pokazuje zależność między zmienną numeryczną a kategorią. Jest to wykres barplot.


> WYKRESY BARPLOT I BOXPLOT


Polecenie barplot pozwala np. wyświetlać średni wzrost kilku osób, jeśli dysponujemy informacjami o wzroście każdej osoby. Tu warto dodać, że wykresy barplot są często mylone z histogramami, które nie wyświetlają danych z kategorii (np. z podziałem na płeć), lecz tylko zmienne numeryczne. Wpisujemy:


sns.barplot(x='sex',y='total_bill',data=tips)

 

Otrzymany wynik będzie wyglądać jak na rys. 1.

 

Jest to wykres, który domyślnie pokazuje, jakie rachunki (total_bill) zapłacili mężczyźni (Male), a jakie kobiety (Female). Podajemy kategorię sex, aby uzyskać rozkład danych dla płci. Z naszego zbioru danych wynika, że rachunki mężczyzn były wyższe, i jest to wyraźnie widoczne na wykresie.

 

Teraz możemy dodać estymację, aby oszacować, czy mężczyźni mają zwykle wyższe rachunki niż kobiety. W praktyce mogłoby przecież być tak, że mężczyźni na ogół płacili niższe rachunki, ale jeden z nich złożył bardzo duże zamówienie i to sprawiło, że znacznie podniosła się średnia. Funkcja estymacji określi na podstawie wszystkich danych (wszystkich mężczyzn), czy są jakieś odchylenia.

[...]

Założyciel i dyr. generalny firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"