Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



22.06.2018

Monitor z USB-C

AOC I1601FWUX
19.06.2018

Konwertowalny mikrus

HP EliteBook x360 1030 G3
15.06.2018

Druga generacja

AMD Ryzen
12.06.2018

Przejście na SDI

SUSE OpenStack Cloud 8
08.06.2018

Chmurowy firewall

Barracuda WAF-as-a-Service
05.06.2018

Kopie środowisk hybrydowych

NetVault Backup 12.0
01.06.2018

Zgodność z rodo

baramundi Management Suite 2018
28.05.2018

Dotyk dla monitorów

Nakładki interaktywne Sony
24.05.2018

Do obsługi konferencji

HP Elite Slice G2

Wybrane algorytmy uczenia maszynowego

Data publikacji: 02-03-2015 Autor: Marcin Szeliga
Drzewa decyzyjne można sobie...
Maszyny wektorów nośnych...
Grupowanie metodą k-średnich...

W trzecim i ostatnim artykule z serii poświęconej usłudze Azure ML przedstawione zostały wybrane algorytmy uczenia maszynowego, takie jak drzewa decyzyjne czy sieci neuronowe. Dodatkowo opisane zostały w nim sposoby korzystania z gotowych, opublikowanych jako usługi WWW modeli.

Dla uproszczenia i ułatwienia przeprowadzenia samodzielnych eksperymentów we wszystkich przykładach użyty został ten sam zbiór danych treningowych – predefiniowany zbiór Adult Census Income. Ponadto przygotowanie danych treningowych zostało ograniczone do wyeliminowania z tego zbioru kolumn education-num i fnlwgt.

Dostępne w ramach usługi Azure ML algorytmy zostały podzielone na trzy kategorie: algorytmy klasyfikujące, szacujące oraz grupujące. Podział ten odpowiada klasycznym technikom uczenia maszynowego:

 

  • celem klasyfikacji jest przypisanie przypadków do jednej ze zdefiniowanych klas – np. ocena klientów pod kątem ich ryzyka kredytowego i przypisanie ich do grup klientów niskiego, średniego lub wysokiego ryzyka;
  • szacowanie (regresja) jest podobną do klasyfikacji techniką eksploracji danych, ale w jej przypadku przewidywane wartości są ciągłe, a nie dyskretne, i nie muszą należeć do określonego zbioru. W praktyce szacowanie jest często wykorzystywane do klasyfikacji – zamiast przypisywać przypadki do poszczególnych klas (np. klasyfikować potencjalnych kredytobiorców jako ryzykownych lub godnych zaufania), ocenia się stopień ryzyka (w skali od 0 do 100%) udzielenia im pożyczki;
  • grupowanie (klastrowanie) polega na podzieleniu różnorodnych przypadków na określoną liczbę jednorodnych grup i w przeciwieństwie do wcześniej przedstawionych technik eksploracji danych jest techniką nienadzorowaną, co oznacza, że żadna zmienna nie występuje po prawej stronie równania (nie ma tzw. zmiennej objaśnianej).

 

Ponieważ usługa Azure ML nie umożliwia odczytania zawartości przetrenowanych modeli (np. zbudowanych drzew decyzyjnych czy znalezionych formuł regresji), jej zastosowania są wyłącznie predykcyjne (gotowe modele są używane do klasyfikacji, szacowania bądź grupowania danych), a nie deskrypcyjne (usługa ta nie może być stosowana do wyjaśniania ukrytych w danych treningowych zależności).

> Klasyfikacja

Klasyfikacja polega na uzupełnieniu nieznanej wartości zmiennej objaśnianej (wyjściowej) na podstawie zależności pomiędzy tą zmienną a zmiennymi wejściowymi (objaśniającymi) znalezionymi przez algorytm w danych treningowych. Zmienna ta musi być zmienną dyskretną, a więc będzie przyjmowała jedną ze zdefiniowanych (występujących w danych treningowych) wartości (używając terminologii uczenia maszynowego, mówi się, że wartość zmiennej będzie należała do jednej z predefiniowanych klas). W zależności od liczby możliwych wartości tej zmiennej algorytmy klasyfikacji zostały podzielone na dwie grupy:

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"