Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



08.06.2016

Inauguracja spotkań...

W dniach 20-21.06.2016r., w Krakowie odbędzie się pierwsze spotkanie technologiczne w...
27.05.2016

Wydrukowana tożsamość

FARGO DTC5500LMX
24.05.2016

Notebooki biznesowe

Asuspro B8230UA
20.05.2016

Serwery do big data

QNAP TDS-16489U
17.05.2016

Neo nowość

OKI Pro6410
13.05.2016

Do chmury i nie tylko

Intel Xeon E5-2600 v4
10.05.2016

Lenovo zapowiada produkcję...

Wieloletni partner Lenovo, Flex, rozpocznie produkcję latem 2016 r.
10.05.2016

Usuwanie skutków awarii

Veeam Availability Orchestrator
09.05.2016

ITewolucja w Warszawie

W Warszawie odbyła się Konferencja z cyklu ITewolucja, której głównym tematem było...

Wybrane algorytmy uczenia maszynowego

Data publikacji: 02-03-2015 Autor: Marcin Szeliga
Drzewa decyzyjne można sobie...
Maszyny wektorów nośnych...
Grupowanie metodą k-średnich...

W trzecim i ostatnim artykule z serii poświęconej usłudze Azure ML przedstawione zostały wybrane algorytmy uczenia maszynowego, takie jak drzewa decyzyjne czy sieci neuronowe. Dodatkowo opisane zostały w nim sposoby korzystania z gotowych, opublikowanych jako usługi WWW modeli.

Dla uproszczenia i ułatwienia przeprowadzenia samodzielnych eksperymentów we wszystkich przykładach użyty został ten sam zbiór danych treningowych – predefiniowany zbiór Adult Census Income. Ponadto przygotowanie danych treningowych zostało ograniczone do wyeliminowania z tego zbioru kolumn education-num i fnlwgt.

Dostępne w ramach usługi Azure ML algorytmy zostały podzielone na trzy kategorie: algorytmy klasyfikujące, szacujące oraz grupujące. Podział ten odpowiada klasycznym technikom uczenia maszynowego:

 

  • celem klasyfikacji jest przypisanie przypadków do jednej ze zdefiniowanych klas – np. ocena klientów pod kątem ich ryzyka kredytowego i przypisanie ich do grup klientów niskiego, średniego lub wysokiego ryzyka;
  • szacowanie (regresja) jest podobną do klasyfikacji techniką eksploracji danych, ale w jej przypadku przewidywane wartości są ciągłe, a nie dyskretne, i nie muszą należeć do określonego zbioru. W praktyce szacowanie jest często wykorzystywane do klasyfikacji – zamiast przypisywać przypadki do poszczególnych klas (np. klasyfikować potencjalnych kredytobiorców jako ryzykownych lub godnych zaufania), ocenia się stopień ryzyka (w skali od 0 do 100%) udzielenia im pożyczki;
  • grupowanie (klastrowanie) polega na podzieleniu różnorodnych przypadków na określoną liczbę jednorodnych grup i w przeciwieństwie do wcześniej przedstawionych technik eksploracji danych jest techniką nienadzorowaną, co oznacza, że żadna zmienna nie występuje po prawej stronie równania (nie ma tzw. zmiennej objaśnianej).

 

Ponieważ usługa Azure ML nie umożliwia odczytania zawartości przetrenowanych modeli (np. zbudowanych drzew decyzyjnych czy znalezionych formuł regresji), jej zastosowania są wyłącznie predykcyjne (gotowe modele są używane do klasyfikacji, szacowania bądź grupowania danych), a nie deskrypcyjne (usługa ta nie może być stosowana do wyjaśniania ukrytych w danych treningowych zależności).

> Klasyfikacja

Klasyfikacja polega na uzupełnieniu nieznanej wartości zmiennej objaśnianej (wyjściowej) na podstawie zależności pomiędzy tą zmienną a zmiennymi wejściowymi (objaśniającymi) znalezionymi przez algorytm w danych treningowych. Zmienna ta musi być zmienną dyskretną, a więc będzie przyjmowała jedną ze zdefiniowanych (występujących w danych treningowych) wartości (używając terminologii uczenia maszynowego, mówi się, że wartość zmiennej będzie należała do jednej z predefiniowanych klas). W zależności od liczby możliwych wartości tej zmiennej algorytmy klasyfikacji zostały podzielone na dwie grupy:

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"