Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



31.08.2020

Konferencja PIKE 2020 „Nowy...

Polska Izba Komunikacji Elektronicznej wraz z Polską Fundacją Wspierania Rozwoju...
31.08.2020

Sprawna migracja

Oracle Cloud VMware Solution
31.08.2020

Aktywne cybergangi

Grupa Lazarus
31.08.2020

Coraz groźniej

Ransomware
31.08.2020

Analityka w chmurze

SAS Viya 4
31.08.2020

Fujitsu

Fujitsu zaprezentowało odświeżone portfolio biurowych komputerów stacjonarnych Esprimo...
31.08.2020

Monitory dla biura

EIZO FlexScan
27.08.2020

ABBYY FineReader Server –...

Obecna sytuacja na świecie spowodowała, że musieliśmy się odnaleźć w nowych realiach...
27.08.2020

E-commerce ratuje gospodarkę

W tym roku rodzimy handel elektroniczny odnotowuje najwyższy – od kilkunastu lat –...

Python, wizualizacja danych

Data publikacji: 25-07-2018 Autor: Grzegorz Kubera
Pandas może odczytywać różne...

W kolejnej części kursu opisujemy metody odczytywania i zapisywania danych z różnych źródeł, w tym z plików CSV i XLS. Po przyswojeniu tej wiedzy zyskamy podstawowe umiejętności dotyczące pracy z danymi i będziemy mogli przejść do kolejnego etapu – wizualizacji danych.

Uruchamiamy wiersz poleceń Anaconda Prompt z menu Start w Windows i wpisujemy komendy: 

 
conda install numpy
conda install pandas
jupyter notebook
 
Jeśli wcześniej zostały zainstalowane biblioteki NumPy i Pandas, nie ma konieczności instalowania ich ponownie – wystarczy włączyć Jupytera. Możliwe, że wyświetli się komunikat o nowszej wersji Anacondy. W tym wypadku warto zainstalować aktualizację, wpisując polecenie:
 
conda update -n base conda
 
Po uruchomieniu Jupytera otwieramy notatnik w Pythonie 3, a następnie wpisujemy komendę:
 
import pandas as pd
 
Środowisko pracy jest przygotowane – możemy rozpocząć naukę nowych funkcji.
 
> ZAPIS I ODCZYT PLIKÓW EXCELA I CSV
 
Praca na danych to praca z różnymi ich źródłami. Biblioteki Pandas pozwalają na odczyt danych z różnych źródeł, jak również na ich późniejszy zapis. W tej części kursu zajmujemy się czterema popularnymi źródłami – plikami CSV, XLS, HTML oraz SQL. Aby móc pracować na plikach HTML oraz bazach SQL, trzeba zainstalować dodatkowe biblioteki. W tym celu w wierszu poleceń wpisujemy poniższe komendy i po kolei instalujemy:
 
conda install sqlalchemy
conda install lxml
conda install html5lib
conda install BeautifulSoup4
 
Każdą z bibliotek instalujemy, zatwierdzając wybór klawiszem y (yes). Następnie uruchamiamy Jupytera i importujemy biblioteki Pandas, wpisując:
 
import pandas as pd
 
Po instalacji możemy przejść do odczytania i zapisywania plików z danymi za pośrednictwem Pandas. Ważna informacja – wszystkie pliki, które chcemy odczytywać w Pandas, powinny znaleźć się w tym samym miejscu co aplikacja Jupyter Notebook. Dzięki temu będziemy mogli je łatwo wywoływać w Jupyterze, wystarczy podać nazwę i rozszerzenie. W przypadku gdy nie umieścimy plików w tym samym katalogu, konieczne będzie wprowadzanie pełnej ścieżki lokalizacji z dysku komputera. Aby uzyskać informację o lokalizacji Jupytera, wystarczy wpisać komendę pwd, która wyświetli dokładną lokalizację, np. C:\\Users\\Grzegorz\\. Aby zrealizować tę część kursu, trzeba umieścić pliki Przyklad i Przyklad_Excel w katalogu, gdzie zainstalowaliśmy Jupytera. 
 
Zacznijmy od odczytania pliku CSV – w naszym przypadku plik ma nazwę Przyklad. Aby odczytać jego zawartość, wpisujemy:
 
pd.read_csv(‚Przyklad’)
 
[...]
 
Założyciel i dyr. generalny firmy doradczo-technologicznej, pełnił funkcję redaktora naczelnego w magazynach i serwisach informacyjnych z branży ICT. Dziennikarz z ponad 10-letnim doświadczeniem i autor książki nt. tworzenia start-upów

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"