Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



20.07.2020

Baramundi

Pomoc w czasie pandemii.
20.07.2020

Stop infekcjom

CloudGuard
17.07.2020

Analiza zagrożeń

Kaspersky Threat Attribution Engine
17.07.2020

Strażnik danych

QGD-1602P
16.07.2020

Dysk przemysłowy

Transcend MTE352T
16.07.2020

Połączenie sił

Fugaku
16.07.2020

Brama bezpieczeństwa

Check Point 1570R
23.06.2020

PLNOG Online

PLNOG Online
23.06.2020

Nowe zagrożenie

Ramsay

Microsoft R Open / R Server

Data publikacji: 30-09-2016 Autor: Marcin Szeliga
Rys. 1. R był jedynym...
Rys. 2. Popularność języka R...
Rys. 3. Ilości ścieków...
Rys. 4. Funkcja window...
Rys. 5. Dzięki...
Rys. 6. Anomalie mogą...
Rys. 7. Górny wykres pokazuje...
Rys. 8. Standardowe edytory...

W cyklu artykułów prezentujemy język R – standard zaawansowanej analizy danych. Dziś przedstawiamy historię powstania, możliwości, opis bibliotek, oraz jego najnowszą implementację Microsoft R Open / R Server.

Tak jak XIX wiek był wiekiem pary i elektryczności, tak wiek XXI jest czasem zaawansowanej analityki i sztucznej inteligencji. W połowie roku 2016 na rynku debiutowały firmy oferujące takie rozwiązania jak eKsięgowość (księgowość prowadzona przez sztuczną inteligencję) czy eLekarz (inteligentny program, który potrafi samodzielnie zdiagnozować typowe choroby). W tym samym czasie systemy proaktywnego zarządzania najróżniejszymi urządzeniami (od wind, poprzez sieci elektryczne i wodociągowe, po samoloty), czyli systemy, które na podstawie zbieranych przez nie danych potrafiły przewidzieć zbliżające się awarie i zapobiegać im, były coraz powszechniej używane.

Gromadzenie cyfrowanych danych w dużych ilościach i przez długi, potencjalnie nieskończony czas nie stanowi już żadnego problemu. Do niedawna jednak wydobycie ukrytych w tych danych informacji, analiza predykcyjna i uczenie maszynowe wymagały wiedzy i narzędzi dostępnych nielicznej grupie specjalistów. Język R zmienił tę sytuację – przedstawiamy jego możliwości.

> Open R

R to nie tylko język statystycznej analizy danych, ale również wyjątkowo szybko rozwijający się, ogólnoświatowy projekt open source, w ramach którego dziesiątki tysięcy osób, w tym prestiżowe uniwersytety, znane osoby świata nauki i eksperci z poszczególnych dziedzin dzielą się swoimi gotowymi do użycia bibliotekami.

W 2015 roku R zajął szóste miejsce na liście najpopularniejszych języków programowania – najwyższe wśród języków specjalistycznych (rys. 1).

Jak to możliwe, że opracowany w latach 90. w Nowej Zelandii język statystycznej analizy danych stał się światową sensacją? Pytanie to jest tym ciekawsze, że R jest oparty na opracowanym w laboratorium firmy Bell Ricka Beckera, Johna Chambersa i Allana Wilksa, języku S, który nigdy nie zyskał większej popularności.

W dużym stopniu zawdzięcza to ogólnodostępnym bibliotekom zawierającym nie tylko implementacje najnowocześ­niejszych algorytmów uczenia maszynowego, ale również funkcje rozwiązujące konkretne zadania (rys. 2).

Dziś R jest standardem zaawansowanej analizy danych. Ale R to więcej niż język, darmowe narzędzia i gotowe do użycia biblioteki. R to również społeczność, dzięki której zaawansowana analiza danych stała się ogólnodostępna. R jest językiem stworzonym przez statystyków i dla statystyków, z myślą o wsparciu całego procesu analizy, od statystycznej oceny danych, poprzez ich przygotowanie, po zbudowanie modeli uczenia maszynowego i ocenę ich dokładności. R pozwala również łatwo i szybko wizualizować dane, nie tylko w celu ich oceny, ale również prezentacji szerokiemu gronu odbiorców.

Próbę możliwości platformy R pokazuje poniższy przykład, którego celem jest analiza szeregów czasowych. Danymi źródłowymi są dane z przepompowni ścieków uzupełnione o dane na temat opadów deszczu i poziomu wód gruntowych. Celem analizy jest uzupełnienie brakujących danych, ocena zależności pomiędzy seriami (np. wpływu deszczu na ilość przepompowywanych ścieków), wykrycie anomalii (nietypowych obserwacji) oraz przewidzenie z tygodniowym wyprzedzeniem ilości przepompowywanych ścieków.

Eksperyment został przeprowadzony przy użyciu wersji 3.3 języka R (aktualną wersję można pobrać ze strony cran.r-project.org) i darmowej wersji graficznego edytora R Studio (rstudio.com).

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

prenumerata Numer niedostępny Spis treści

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"