Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



23.06.2020

PLNOG Online

PLNOG Online
23.06.2020

Nowe zagrożenie

Ramsay
23.06.2020

Chmurowe kopie

Veeam Backup dla Microsoft Azure
19.06.2020

Nowości w kontenerach

Red Hat OpenShift 4.4
19.06.2020

Analityka bezpieczeństwa

FortiAI
19.06.2020

UPS dla obliczeń edge

Schneider APC Smart-UPS
16.06.2020

Przemysłowe SD

Nowe karty Transcend
16.06.2020

Storage dla SMB

QNAP TS-451DeU
16.06.2020

Pamięć masowa

Dell EMC PowerStore

Python, wizualizacja danych

Data publikacji: 25-07-2018 Autor: Grzegorz Kubera
Pandas może odczytywać różne...

W kolejnej części kursu opisujemy metody odczytywania i zapisywania danych z różnych źródeł, w tym z plików CSV i XLS. Po przyswojeniu tej wiedzy zyskamy podstawowe umiejętności dotyczące pracy z danymi i będziemy mogli przejść do kolejnego etapu – wizualizacji danych.

Uruchamiamy wiersz poleceń Anaconda Prompt z menu Start w Windows i wpisujemy komendy: 

 
conda install numpy
conda install pandas
jupyter notebook
 
Jeśli wcześniej zostały zainstalowane biblioteki NumPy i Pandas, nie ma konieczności instalowania ich ponownie – wystarczy włączyć Jupytera. Możliwe, że wyświetli się komunikat o nowszej wersji Anacondy. W tym wypadku warto zainstalować aktualizację, wpisując polecenie:
 
conda update -n base conda
 
Po uruchomieniu Jupytera otwieramy notatnik w Pythonie 3, a następnie wpisujemy komendę:
 
import pandas as pd
 
Środowisko pracy jest przygotowane – możemy rozpocząć naukę nowych funkcji.
 
> ZAPIS I ODCZYT PLIKÓW EXCELA I CSV
 
Praca na danych to praca z różnymi ich źródłami. Biblioteki Pandas pozwalają na odczyt danych z różnych źródeł, jak również na ich późniejszy zapis. W tej części kursu zajmujemy się czterema popularnymi źródłami – plikami CSV, XLS, HTML oraz SQL. Aby móc pracować na plikach HTML oraz bazach SQL, trzeba zainstalować dodatkowe biblioteki. W tym celu w wierszu poleceń wpisujemy poniższe komendy i po kolei instalujemy:
 
conda install sqlalchemy
conda install lxml
conda install html5lib
conda install BeautifulSoup4
 
Każdą z bibliotek instalujemy, zatwierdzając wybór klawiszem y (yes). Następnie uruchamiamy Jupytera i importujemy biblioteki Pandas, wpisując:
 
import pandas as pd
 
Po instalacji możemy przejść do odczytania i zapisywania plików z danymi za pośrednictwem Pandas. Ważna informacja – wszystkie pliki, które chcemy odczytywać w Pandas, powinny znaleźć się w tym samym miejscu co aplikacja Jupyter Notebook. Dzięki temu będziemy mogli je łatwo wywoływać w Jupyterze, wystarczy podać nazwę i rozszerzenie. W przypadku gdy nie umieścimy plików w tym samym katalogu, konieczne będzie wprowadzanie pełnej ścieżki lokalizacji z dysku komputera. Aby uzyskać informację o lokalizacji Jupytera, wystarczy wpisać komendę pwd, która wyświetli dokładną lokalizację, np. C:\\Users\\Grzegorz\\. Aby zrealizować tę część kursu, trzeba umieścić pliki Przyklad i Przyklad_Excel w katalogu, gdzie zainstalowaliśmy Jupytera. 
 
Zacznijmy od odczytania pliku CSV – w naszym przypadku plik ma nazwę Przyklad. Aby odczytać jego zawartość, wpisujemy:
 
pd.read_csv(‚Przyklad’)
 
[...]
 
Założyciel i dyr. generalny firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"