Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



22.08.2017

Przemysłowy SSD

Transcend SSD430K
17.08.2017

24 porty i PoE

NETGEAR GS724TPv2
11.08.2017

Z helem

WD Red / Red Pro
08.08.2017

Kontener jako usługa

SUSE CaaS Platform
03.08.2017

Natywna obsługa kontenerów

Red Hat OpenShift Online
28.07.2017

Luksusowa hybryda

HP Spectre x2
25.07.2017

Nowy napęd SSD

KC1000 NVMe PCIe
21.07.2017

Rekord świata

Lenovo x3950 X6
18.07.2017

Brightness Intellgence Plus

BenQ EW2770QZ

Przewidywanie przyszłości – analiza szeregów czasowych

Data publikacji: 11-01-2016 Autor: Marcin Szeliga
Rys. 2. Oryginalna seria...
Rys. 3. Działanie funkcji...
Rys. 4. Predykcje liczby...

„Wiedza jest potęgą” zauważył w XVI wieku Francis Bacon, filozof i twórca nowożytnej, opartej na eksperymentach metody naukowej. Dziś to predykcja, czyli zdolność przewidywania przyszłych zdarzeń jest potęgą – pozwala nie tylko zarabiać pieniądze, ale również zapobiegać katastrofom i ratować ludzkie życie. Celem artykułu jest przedstawienie najpopularniejszego algorytmu predykcyjnego ARIMA i metod właściwego, pozwalającego uzyskać dokładne i wiarygodne predykcje przygotowania danych źródłowych.

Zadaniem modeli predykcyjnych, niezależnie od zastosowanego w nich algorytmu, jest uzupełnianie brakujących danych, czyli odpowiadanie na zapytania predykcyjne. W tym celu uczy się (trenuje) modele przy użyciu danych historycznych, licząc, że użyty w nich algorytm data mining znajdzie w tych danych zależności pozwalające mu uzupełnić brakujące dane o nowych przypadkach. Na przykład model zbudowany z wykorzystaniem drzew decyzyjnych może klasyfikować nowe transakcje jako próby oszustwa lub transakcje legalne, na podstawie cech charakteryzujących wcześniejsze próby oszustw oraz cech charakterystycznych dla legalnych transakcji. W tym sensie wszystkie modele predykcyjne dotyczą przyszłości, bo inaczej nie miałyby one żadnego znaczenia praktycznego.


Ukrytym założeniem wszystkich modeli predykcyjnych jest przekonanie, że na podstawie historii można przewidywać przyszłość, czyli że wykryte w historycznych danych wzorce będą miały zastosowanie do przyszłych przypadków. Jednak zdecydowana większość algorytmów data mining nie uwzględnia w żaden sposób kolejności, w jakiej zachodziły zdarzenia. Wyjątkiem od tej reguły są modele prognozujące, takie jak przedstawione w artykule modele szeregów czasowych.


Ponieważ środowisko Azure Machine Learning nie zawiera predefiniowanych modeli prognozujących, tworzyć je należy w języku R, korzystając z modułów R Script. Dlatego ten artykuł zawiera wyłącznie skrypty R, które można również uruchomić lokalnie, np. w konsoli R Studio.

> SERIE DANYCH

Dane dla modeli prognozujących muszą mieć postać serii danych, czyli muszą zawierać pojedyncze wartości ciągłe uporządkowane według klucza czasu. Takie dane można załadować za pomocą funkcji scan(). Przykładem serii danych są dostępne pod adresem http://robjhyndman.com/tsdldata/misc/kings.dat informacje opisujące wiek, w którym zmarli kolejni królowie Anglii. Po załadowaniu dane te wyglądają następująco:


> kings <- scan("http://robjhyndman.com/tsdldata/misc/kings.dat",skip=3)
> #pierwsze 3 wiersze zawierają nagłówek
> kings
[1] 60 43 67 50 56 42 50 65 68 43 65 34 47 34 49 41 13 35 53 56 16 43 69 59 48
59 86 55 68 51 33 49 67 77 81 67 71 81 68 70 77 56

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"