Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



28.03.2017

Flash na błysk

NetApp AFF A700s
24.03.2017

MASTERS OF SECURITY II w...

20 kwietnia w Ożarowie Mazowieckim odbędzie się konferencja ITewolucja: MASTERS OF...
24.03.2017

Terabitowy firewall

FortiGate 3980E
22.03.2017

LED-owa premiera

Ricoh SP C352DN
21.03.2017

PLNOG18

Ponad 800 uczestników, 4 ścieżki, 55 wykładów, panele dyskusyjne, prezentacje w Community...
18.03.2017

Lekkie 2w1

Asus Transformer Mini
14.03.2017

Monitoring i diagnostyka SQL...

Spotlight on SQL Server Enterprise Edition
10.03.2017

Bezpieczne dane

Acronis True Image 2017 New Generation
06.03.2017

Wyspecjalizowany OS

KasperskyOS

Przewidywanie przyszłości – analiza szeregów czasowych

Data publikacji: 11-01-2016 Autor: Marcin Szeliga
Rys. 2. Oryginalna seria...
Rys. 3. Działanie funkcji...
Rys. 4. Predykcje liczby...

„Wiedza jest potęgą” zauważył w XVI wieku Francis Bacon, filozof i twórca nowożytnej, opartej na eksperymentach metody naukowej. Dziś to predykcja, czyli zdolność przewidywania przyszłych zdarzeń jest potęgą – pozwala nie tylko zarabiać pieniądze, ale również zapobiegać katastrofom i ratować ludzkie życie. Celem artykułu jest przedstawienie najpopularniejszego algorytmu predykcyjnego ARIMA i metod właściwego, pozwalającego uzyskać dokładne i wiarygodne predykcje przygotowania danych źródłowych.

Zadaniem modeli predykcyjnych, niezależnie od zastosowanego w nich algorytmu, jest uzupełnianie brakujących danych, czyli odpowiadanie na zapytania predykcyjne. W tym celu uczy się (trenuje) modele przy użyciu danych historycznych, licząc, że użyty w nich algorytm data mining znajdzie w tych danych zależności pozwalające mu uzupełnić brakujące dane o nowych przypadkach. Na przykład model zbudowany z wykorzystaniem drzew decyzyjnych może klasyfikować nowe transakcje jako próby oszustwa lub transakcje legalne, na podstawie cech charakteryzujących wcześniejsze próby oszustw oraz cech charakterystycznych dla legalnych transakcji. W tym sensie wszystkie modele predykcyjne dotyczą przyszłości, bo inaczej nie miałyby one żadnego znaczenia praktycznego.


Ukrytym założeniem wszystkich modeli predykcyjnych jest przekonanie, że na podstawie historii można przewidywać przyszłość, czyli że wykryte w historycznych danych wzorce będą miały zastosowanie do przyszłych przypadków. Jednak zdecydowana większość algorytmów data mining nie uwzględnia w żaden sposób kolejności, w jakiej zachodziły zdarzenia. Wyjątkiem od tej reguły są modele prognozujące, takie jak przedstawione w artykule modele szeregów czasowych.


Ponieważ środowisko Azure Machine Learning nie zawiera predefiniowanych modeli prognozujących, tworzyć je należy w języku R, korzystając z modułów R Script. Dlatego ten artykuł zawiera wyłącznie skrypty R, które można również uruchomić lokalnie, np. w konsoli R Studio.

> SERIE DANYCH

Dane dla modeli prognozujących muszą mieć postać serii danych, czyli muszą zawierać pojedyncze wartości ciągłe uporządkowane według klucza czasu. Takie dane można załadować za pomocą funkcji scan(). Przykładem serii danych są dostępne pod adresem http://robjhyndman.com/tsdldata/misc/kings.dat informacje opisujące wiek, w którym zmarli kolejni królowie Anglii. Po załadowaniu dane te wyglądają następująco:


> kings <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)
> #pierwsze 3 wiersze zawierają nagłówek
> kings
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48
59 86 55 68 51 33 49 67 77 81 67 71 81 68 70 77 56

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"