Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



20.07.2020

Baramundi

Pomoc w czasie pandemii.
20.07.2020

Stop infekcjom

CloudGuard
17.07.2020

Analiza zagrożeń

Kaspersky Threat Attribution Engine
17.07.2020

Strażnik danych

QGD-1602P
16.07.2020

Dysk przemysłowy

Transcend MTE352T
16.07.2020

Połączenie sił

Fugaku
16.07.2020

Brama bezpieczeństwa

Check Point 1570R
23.06.2020

PLNOG Online

PLNOG Online
23.06.2020

Nowe zagrożenie

Ramsay

Jak zostać mistrzem danych. Python – biblioteki NumPy i Pandas

Data publikacji: 20-03-2018 Autor: Grzegorz Kubera

W tej części kursu kontynuujemy naukę bibliotek Pandas w Pythonie. Tym razem pokażemy, jak wykorzystywać zaznaczanie warunkowe, pracować z wielowarstwowym indeksem, a także jak grupować i uzupełniać brakujące dane.

Po przyswojeniu informacji zawartych w tej części kursu będziemy potrafili przeprowadzać już całkiem sporo operacji na danych, wykorzystując biblioteki NumPy i Pandas. Zaczynamy od zaznaczania warunkowego. Uruchamiamy wiersz poleceń Anaconda Prompt z menu Start w Windows i wpisujemy komendy:


conda install numpy
conda install pandas
jupyter notebook

 

Jeśli biblioteki NumPy i Pandas zostały wcześniej zainstalowane, nie trzeba tego procesu przeprowadzać ponownie – wystarczy włączyć Jupytera. Możliwe, że wyświetli się komunikat o dostępności nowszej wersji Anacondy, w takim wypadku warto zainstalować aktualizację, wpisując polecenie:

conda update -n base conda

 

Po uruchomieniu Jupytera otwieramy notatnik w Pythonie 3, a następnie wpisujemy komendy:


import numpy as np import pandas as pd


Pierwszym zadaniem, jakie zrealizujemy w tej części kursu, będzie stworzenie obiektu DataFrame, na którym przećwiczymy zaznaczanie warunkowe (conditional selection). Aby stworzyć DataFrame, wpisujemy kolejno:

 

raw_data = {‚imię’: [‚Jacek’, ‚Monika’, np.nan, np.nan, np.nan],
‚miejsce zamieszkania’: [‚Wrocław’, ‚Wrocław’, ‚Warszawa’, ‚Kraków’, ‚Kraków’],
‚wiek’: [42, 52, 36, 24, 70]}
df = pd.DataFrame(raw_data, columns = [‚imię’, ‚miejsce zamieszkania’, ‚wiek’])

 

Teraz, po wpisaniu df, powinniśmy zobaczyć taki obiekt:

 

 

 

 

 

 

 

 

 

 

 

 

Po przygotowaniu obiektu do ćwiczeń możemy rozpocząć naukę zaznaczania warunkowego. W Pandas do zaznaczania wybranych treści wykorzystujemy zmienne logiczne. Załóżmy, że chcemy wydobyć z DataFrame informacje o ludziach w wieku powyżej 40. roku życia oraz o osobach zamieszkałych w Krakowie. W tym celu tworzymy polecenia:

 

Kraków = df[‚miejsce zamieszkania’]
== „Kraków”
Wiek = df[‚wiek’] > 40

 

Teraz po wpisaniu Kraków wyświetlone zostaną informacje w postaci Series:


0 False
1 False
2 False
3 True
4 True
Name: miejsce zamieszkania, dtype: bool

 

a po wpisaniu Wiek następujące:


0 True
1 True
2 False
3 False
4 True
Name: wiek, dtype: bool

 

Widać w formie zero-jedynkowej, które z wierszy spełniają przyjęte kryteria. Można również wyświetlić te same informacje w formie DataFrame. Przykładowo aby wyświetlić Wiek, wpisujemy:

df[Wiek]


[...]

 

Założyciel i dyr. generalny firmy doradczo--technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"