Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



18.04.2018

Dla biznesu

Monitory AOC 6x
13.04.2018

Ochrona sieci przemysłowych

Stormshield SNi40
09.04.2018

Disaster recovery

Veeam Availability Orchestrator
05.04.2018

Pamięci masowe i SDS

IBM Spectrum Storage
27.03.2018

Wydajna podstawa

Asus RS700-E9, Asus WS C621E SAGE
22.03.2018

Seria dla profesjonalistów

Toshiba E-Generation
21.03.2018

Odzyskiwanie plików - nowa...

Zachowanie bezpieczeństwa plików jest dla wielu przedsiębiorców priorytetem. Z myślą o...
19.03.2018

Superszybkie SSD

Samsung SZ985 Z-SSD
15.03.2018

EPYC w serwerach

Dell EMC PowerEdge

Przewidywanie przyszłości – analiza szeregów czasowych

Data publikacji: 11-01-2016 Autor: Marcin Szeliga
Rys. 2. Oryginalna seria...
Rys. 3. Działanie funkcji...
Rys. 4. Predykcje liczby...

„Wiedza jest potęgą” zauważył w XVI wieku Francis Bacon, filozof i twórca nowożytnej, opartej na eksperymentach metody naukowej. Dziś to predykcja, czyli zdolność przewidywania przyszłych zdarzeń jest potęgą – pozwala nie tylko zarabiać pieniądze, ale również zapobiegać katastrofom i ratować ludzkie życie. Celem artykułu jest przedstawienie najpopularniejszego algorytmu predykcyjnego ARIMA i metod właściwego, pozwalającego uzyskać dokładne i wiarygodne predykcje przygotowania danych źródłowych.

Zadaniem modeli predykcyjnych, niezależnie od zastosowanego w nich algorytmu, jest uzupełnianie brakujących danych, czyli odpowiadanie na zapytania predykcyjne. W tym celu uczy się (trenuje) modele przy użyciu danych historycznych, licząc, że użyty w nich algorytm data mining znajdzie w tych danych zależności pozwalające mu uzupełnić brakujące dane o nowych przypadkach. Na przykład model zbudowany z wykorzystaniem drzew decyzyjnych może klasyfikować nowe transakcje jako próby oszustwa lub transakcje legalne, na podstawie cech charakteryzujących wcześniejsze próby oszustw oraz cech charakterystycznych dla legalnych transakcji. W tym sensie wszystkie modele predykcyjne dotyczą przyszłości, bo inaczej nie miałyby one żadnego znaczenia praktycznego.


Ukrytym założeniem wszystkich modeli predykcyjnych jest przekonanie, że na podstawie historii można przewidywać przyszłość, czyli że wykryte w historycznych danych wzorce będą miały zastosowanie do przyszłych przypadków. Jednak zdecydowana większość algorytmów data mining nie uwzględnia w żaden sposób kolejności, w jakiej zachodziły zdarzenia. Wyjątkiem od tej reguły są modele prognozujące, takie jak przedstawione w artykule modele szeregów czasowych.


Ponieważ środowisko Azure Machine Learning nie zawiera predefiniowanych modeli prognozujących, tworzyć je należy w języku R, korzystając z modułów R Script. Dlatego ten artykuł zawiera wyłącznie skrypty R, które można również uruchomić lokalnie, np. w konsoli R Studio.

> SERIE DANYCH

Dane dla modeli prognozujących muszą mieć postać serii danych, czyli muszą zawierać pojedyncze wartości ciągłe uporządkowane według klucza czasu. Takie dane można załadować za pomocą funkcji scan(). Przykładem serii danych są dostępne pod adresem http://robjhyndman.com/tsdldata/misc/kings.dat informacje opisujące wiek, w którym zmarli kolejni królowie Anglii. Po załadowaniu dane te wyglądają następująco:


> kings <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)
> #pierwsze 3 wiersze zawierają nagłówek
> kings
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48
59 86 55 68 51 33 49 67 77 81 67 71 81 68 70 77 56

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"