Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



17.10.2017

Ultrapanorama

Philips 492P8
13.10.2017

Druk w bieli

Oki Pro8342WT
11.10.2017

PolCAAT’ 2017 już w...

30 listopada 2017 r. w warszawskim hotelu Marriott odbędzie się XIII edycja konferencji...
10.10.2017

Pełna ochrona

Kaspersky Total Security 2018, Internet Security 2018
06.10.2017

Przeprowadzka do chmury

Oracle Exadata Cloud
03.10.2017

Automatyzacja...

Red Hat Ansible
02.10.2017

Bezpieczeństwo danych zaczyna...

Aby zapewnić bezpieczeństwo danych, w tym informacji poufnych o klientach i pracownikach,...
27.09.2017

Dotykowe 75 cali

BenQ RP750K
22.09.2017

Wydajne CPU

AMD Ryzen Threadripper

Wybrane algorytmy uczenia maszynowego

Data publikacji: 02-03-2015 Autor: Marcin Szeliga
Drzewa decyzyjne można sobie...
Maszyny wektorów nośnych...
Grupowanie metodą k-średnich...

W trzecim i ostatnim artykule z serii poświęconej usłudze Azure ML przedstawione zostały wybrane algorytmy uczenia maszynowego, takie jak drzewa decyzyjne czy sieci neuronowe. Dodatkowo opisane zostały w nim sposoby korzystania z gotowych, opublikowanych jako usługi WWW modeli.

Dla uproszczenia i ułatwienia przeprowadzenia samodzielnych eksperymentów we wszystkich przykładach użyty został ten sam zbiór danych treningowych – predefiniowany zbiór Adult Census Income. Ponadto przygotowanie danych treningowych zostało ograniczone do wyeliminowania z tego zbioru kolumn education-num i fnlwgt.

Dostępne w ramach usługi Azure ML algorytmy zostały podzielone na trzy kategorie: algorytmy klasyfikujące, szacujące oraz grupujące. Podział ten odpowiada klasycznym technikom uczenia maszynowego:

 

  • celem klasyfikacji jest przypisanie przypadków do jednej ze zdefiniowanych klas – np. ocena klientów pod kątem ich ryzyka kredytowego i przypisanie ich do grup klientów niskiego, średniego lub wysokiego ryzyka;
  • szacowanie (regresja) jest podobną do klasyfikacji techniką eksploracji danych, ale w jej przypadku przewidywane wartości są ciągłe, a nie dyskretne, i nie muszą należeć do określonego zbioru. W praktyce szacowanie jest często wykorzystywane do klasyfikacji – zamiast przypisywać przypadki do poszczególnych klas (np. klasyfikować potencjalnych kredytobiorców jako ryzykownych lub godnych zaufania), ocenia się stopień ryzyka (w skali od 0 do 100%) udzielenia im pożyczki;
  • grupowanie (klastrowanie) polega na podzieleniu różnorodnych przypadków na określoną liczbę jednorodnych grup i w przeciwieństwie do wcześniej przedstawionych technik eksploracji danych jest techniką nienadzorowaną, co oznacza, że żadna zmienna nie występuje po prawej stronie równania (nie ma tzw. zmiennej objaśnianej).

 

Ponieważ usługa Azure ML nie umożliwia odczytania zawartości przetrenowanych modeli (np. zbudowanych drzew decyzyjnych czy znalezionych formuł regresji), jej zastosowania są wyłącznie predykcyjne (gotowe modele są używane do klasyfikacji, szacowania bądź grupowania danych), a nie deskrypcyjne (usługa ta nie może być stosowana do wyjaśniania ukrytych w danych treningowych zależności).

> Klasyfikacja

Klasyfikacja polega na uzupełnieniu nieznanej wartości zmiennej objaśnianej (wyjściowej) na podstawie zależności pomiędzy tą zmienną a zmiennymi wejściowymi (objaśniającymi) znalezionymi przez algorytm w danych treningowych. Zmienna ta musi być zmienną dyskretną, a więc będzie przyjmowała jedną ze zdefiniowanych (występujących w danych treningowych) wartości (używając terminologii uczenia maszynowego, mówi się, że wartość zmiennej będzie należała do jednej z predefiniowanych klas). W zależności od liczby możliwych wartości tej zmiennej algorytmy klasyfikacji zostały podzielone na dwie grupy:

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"