Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



30.09.2016

WLAN zintegrowany

Fortinet FortiAP-U
30.09.2016

Szybki backup i przywracanie

Barracuda Backup 6.3
30.09.2016

Zaawansowane Business...

DomData InForum BI Studio
16.09.2016

ITewolucja w Katowicach

ITewolucja: MASTERS OF SECURITY już 20 października w Katowicach
05.09.2016

EMC Forum odpowie na pytanie,...

EMC organizuje konferencję poświęconą przetwarzaniu w chmurze i nowoczesnym technologiom...
02.09.2016

Veracomp dzieli się wiedzą –...

Znamy coraz więcej szczegółów na temat kolejnych spotkań w ramach projektu „Veracomp...
31.08.2016

Wielofunkcyjne A3

Samsung A3 MultiXpress X3280/ K3300
29.08.2016

Z koncentryka na Ethernet

Konwertery Panasonic
25.08.2016

Coraz wydajniejsze

QNAP TVS-x82 / TVS-x82T

Przewidywanie przyszłości – analiza szeregów czasowych

Data publikacji: 11-01-2016 Autor: Marcin Szeliga
Rys. 2. Oryginalna seria...
Rys. 3. Działanie funkcji...
Rys. 4. Predykcje liczby...

„Wiedza jest potęgą” zauważył w XVI wieku Francis Bacon, filozof i twórca nowożytnej, opartej na eksperymentach metody naukowej. Dziś to predykcja, czyli zdolność przewidywania przyszłych zdarzeń jest potęgą – pozwala nie tylko zarabiać pieniądze, ale również zapobiegać katastrofom i ratować ludzkie życie. Celem artykułu jest przedstawienie najpopularniejszego algorytmu predykcyjnego ARIMA i metod właściwego, pozwalającego uzyskać dokładne i wiarygodne predykcje przygotowania danych źródłowych.

Zadaniem modeli predykcyjnych, niezależnie od zastosowanego w nich algorytmu, jest uzupełnianie brakujących danych, czyli odpowiadanie na zapytania predykcyjne. W tym celu uczy się (trenuje) modele przy użyciu danych historycznych, licząc, że użyty w nich algorytm data mining znajdzie w tych danych zależności pozwalające mu uzupełnić brakujące dane o nowych przypadkach. Na przykład model zbudowany z wykorzystaniem drzew decyzyjnych może klasyfikować nowe transakcje jako próby oszustwa lub transakcje legalne, na podstawie cech charakteryzujących wcześniejsze próby oszustw oraz cech charakterystycznych dla legalnych transakcji. W tym sensie wszystkie modele predykcyjne dotyczą przyszłości, bo inaczej nie miałyby one żadnego znaczenia praktycznego.


Ukrytym założeniem wszystkich modeli predykcyjnych jest przekonanie, że na podstawie historii można przewidywać przyszłość, czyli że wykryte w historycznych danych wzorce będą miały zastosowanie do przyszłych przypadków. Jednak zdecydowana większość algorytmów data mining nie uwzględnia w żaden sposób kolejności, w jakiej zachodziły zdarzenia. Wyjątkiem od tej reguły są modele prognozujące, takie jak przedstawione w artykule modele szeregów czasowych.


Ponieważ środowisko Azure Machine Learning nie zawiera predefiniowanych modeli prognozujących, tworzyć je należy w języku R, korzystając z modułów R Script. Dlatego ten artykuł zawiera wyłącznie skrypty R, które można również uruchomić lokalnie, np. w konsoli R Studio.

> SERIE DANYCH

Dane dla modeli prognozujących muszą mieć postać serii danych, czyli muszą zawierać pojedyncze wartości ciągłe uporządkowane według klucza czasu. Takie dane można załadować za pomocą funkcji scan(). Przykładem serii danych są dostępne pod adresem http://robjhyndman.com/tsdldata/misc/kings.dat informacje opisujące wiek, w którym zmarli kolejni królowie Anglii. Po załadowaniu dane te wyglądają następująco:


> kings <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)
> #pierwsze 3 wiersze zawierają nagłówek
> kings
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48
59 86 55 68 51 33 49 67 77 81 67 71 81 68 70 77 56

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"