Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



24.05.2016

Notebooki biznesowe

Asuspro B8230UA
20.05.2016

Serwery do big data

QNAP TDS-16489U
17.05.2016

Neo nowość

OKI Pro6410
13.05.2016

Do chmury i nie tylko

Intel Xeon E5-2600 v4
10.05.2016

Lenovo zapowiada produkcję...

Wieloletni partner Lenovo, Flex, rozpocznie produkcję latem 2016 r.
10.05.2016

Usuwanie skutków awarii

Veeam Availability Orchestrator
09.05.2016

ITewolucja w Warszawie

W Warszawie odbyła się Konferencja z cyklu ITewolucja, której głównym tematem było...
06.05.2016

Ochrona serwerów i danych

Kaspersky Security for Windows Server
05.05.2016

Szybko i skutecznie – backup...

Każda firma powinna posiadać system backupu. Dobrze działający system pozwala osiągnąć...

Przewidywanie przyszłości – analiza szeregów czasowych

Data publikacji: 11-01-2016 Autor: Marcin Szeliga
Rys. 2. Oryginalna seria...
Rys. 3. Działanie funkcji...
Rys. 4. Predykcje liczby...

„Wiedza jest potęgą” zauważył w XVI wieku Francis Bacon, filozof i twórca nowożytnej, opartej na eksperymentach metody naukowej. Dziś to predykcja, czyli zdolność przewidywania przyszłych zdarzeń jest potęgą – pozwala nie tylko zarabiać pieniądze, ale również zapobiegać katastrofom i ratować ludzkie życie. Celem artykułu jest przedstawienie najpopularniejszego algorytmu predykcyjnego ARIMA i metod właściwego, pozwalającego uzyskać dokładne i wiarygodne predykcje przygotowania danych źródłowych.

Zadaniem modeli predykcyjnych, niezależnie od zastosowanego w nich algorytmu, jest uzupełnianie brakujących danych, czyli odpowiadanie na zapytania predykcyjne. W tym celu uczy się (trenuje) modele przy użyciu danych historycznych, licząc, że użyty w nich algorytm data mining znajdzie w tych danych zależności pozwalające mu uzupełnić brakujące dane o nowych przypadkach. Na przykład model zbudowany z wykorzystaniem drzew decyzyjnych może klasyfikować nowe transakcje jako próby oszustwa lub transakcje legalne, na podstawie cech charakteryzujących wcześniejsze próby oszustw oraz cech charakterystycznych dla legalnych transakcji. W tym sensie wszystkie modele predykcyjne dotyczą przyszłości, bo inaczej nie miałyby one żadnego znaczenia praktycznego.


Ukrytym założeniem wszystkich modeli predykcyjnych jest przekonanie, że na podstawie historii można przewidywać przyszłość, czyli że wykryte w historycznych danych wzorce będą miały zastosowanie do przyszłych przypadków. Jednak zdecydowana większość algorytmów data mining nie uwzględnia w żaden sposób kolejności, w jakiej zachodziły zdarzenia. Wyjątkiem od tej reguły są modele prognozujące, takie jak przedstawione w artykule modele szeregów czasowych.


Ponieważ środowisko Azure Machine Learning nie zawiera predefiniowanych modeli prognozujących, tworzyć je należy w języku R, korzystając z modułów R Script. Dlatego ten artykuł zawiera wyłącznie skrypty R, które można również uruchomić lokalnie, np. w konsoli R Studio.

> SERIE DANYCH

Dane dla modeli prognozujących muszą mieć postać serii danych, czyli muszą zawierać pojedyncze wartości ciągłe uporządkowane według klucza czasu. Takie dane można załadować za pomocą funkcji scan(). Przykładem serii danych są dostępne pod adresem http://robjhyndman.com/tsdldata/misc/kings.dat informacje opisujące wiek, w którym zmarli kolejni królowie Anglii. Po załadowaniu dane te wyglądają następująco:


> kings <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)
> #pierwsze 3 wiersze zawierają nagłówek
> kings
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48
59 86 55 68 51 33 49 67 77 81 67 71 81 68 70 77 56

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"