Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



11.12.2017

Dla biznesu

BenQ MH760
07.12.2017

Pamięć masowa SDS

SUSE Enterprise Storage 5
05.12.2017

Bezpieczna platforma

Red Hat OpenStack Platform 12
30.11.2017

ITewolucja w bezpieczeństwie....

9 listopada w katowickim hotelu Novotel odbyła się kolejna odsłona konferencji z cyklu...
28.11.2017

Smukle i elegancko

HP Spectre 13 i x360
23.11.2017

Z IEEE 802.3bz

Przełączniki Netgear
21.11.2017

4K z USB-C

EIZO FlexScan EV2785
16.11.2017

Wielofunkcyjne MFP

Canon imageRUNNER ADVANCE C256i, C356i oraz C356P
14.11.2017

Fabryka Przyszłości w drodze...

W dniach 25 i 26 października we Wrocławiu odbyła się czwarta edycja konferencji...

R Open / R Server

Data publikacji: 03-11-2016 Autor: Marcin Szeliga
Rys. 2. Lokalizację MRS można...
Rys. 3. Czas uczenia tego...
Rys. 4. Skrócenie czasu...
Rys. 5. Parametr histType...

W pierwszej części artykułu przedstawiliśmy Open R – najpopularniejszy i najszybciej rozwijający się język zaawansowanej analizy danych, który dzięki tysiącom ogólnodostępnych bibliotek upraszcza i skraca czas eksperymentów data science. Pora na szczegółowy opis platformy, ze szczególnym uwzględnieniem biblioteki ScaleR i formatu danych XDF.

Jak wspomnieliśmy w poprzednim odcinku, Microsoft opracował, na podstawie produktu przejętej w maju 2015 firmy Revolution Analytics, ogólnie dostępną wieloplatformową wersję języka R, o nazwie Microsoft R Open (MRO), wzbogaconą m.in. o możliwość „zamrożenia” używanych w projektach wersji bibliotek, równoległego wykonywania niektórych operacji matematycznych i integrację z usługami Azure. Obie otwarte wersje języka R mają podobne ograniczenia:

 

  • analizowane dane muszą się zmieścić w pamięci operacyjnej komputera, na którym przeprowadzane są analizy. W praktyce uniemożliwia to ich użycie w systemach big data;
  • R jest językiem interpretowanym i napisane w nim biblioteki są wolniejsze od kodu kompilowanego. Niestety, zdecydowana większość bibliotek jest napisana właśnie w języku R, co przekłada się na długi czas wykonywania analiz;
  • dodatkowym powodem nieoptymalnej wydajności jest brak równoległego wykonywania operacji. Problem ten można w pewnym zakresie rozwiązać w obu otwartych wersjach języka R. Open R zawiera specjalistyczne biblioteki, a MRO automatycznie zrównolegli niektóre operacje matematyczne za pomocą biblioteki MKL (Intel Math Kernel Library) i pozwala uruchomić równolegle kod użytkownika za pomocą pętli forech;
  • dane źródłowe muszą zostać przesłane do komputera, na którym będą analizowane. Operacja taka jest długotrwała i ryzykowna z punktu widzenia bezpieczeństwa, bo potencjalnie poufne dane muszą zostać przesłane przez sieć do stacji roboczej analityka;
  • wsparcie techniczne jest oferowane wyłącznie przez społeczność, tymczasem w niektórych firmach obowiązuje zasada, że każdy zainstalowany program musi być objęty odpowiednim wsparciem.


Ograniczenia te nie dotyczą serwera MRS, czyli Microsoft R Server, będącego tematem pozostałych części artykułu. W tej części przyjrzymy się instalacji serwera MRS, jego budowie i działaniu oraz użyjemy go do oceny danych źródłowych.

> Instalacja

Następcą serwera Revolution R Enterprise jest serwer MRS, dostępny w czterech wersjach:

 

  • Windows – wymagany jest 64-bitowy system Windows 7 lub nowszy;
  • Linux – wymagana jest 64-bitowa dystrybucja Red Hat Enterprise (lub CentOS) w wersji 5 lub nowszej, albo SUSE Linux Enterprise Server 11 SP2 lub nowszej;
  • Hadoop – wymagana jest dystrybucja Cloudera w wersji 5 lub nowszej, Hortonworks HDP 1.3 lub HDP 2.0, albo MapR M3/M5/M7 w wersji 2 lub nowszej;
  • Teradata – wymagany jest serwer Teradata w wersji 14 lub nowszej.


Serwer MRS wymaga wcześniejszej instalacji MRO. Wersje MRO na różne platformy są dostępne pod adresem mran.microsoft.com/download/. Sam serwer MRS jest dostępny:

 

  • Dla studentów za darmo, w ramach programu DreamSpark (tinyurl.com/prdreamspark);
  • Dla programistów również za darmo, w ramach programu Visual Studio Dev Essentials (tinyurl.com/MRE-VSDE);
  • Dla posiadaczy subskrypcji MSDN (msdn.microsoft.com);
  • Dla pozostałych klientów jako osobny, licencjonowany produkt.


Microsoft udostępnił również szczegółowe instrukcje instalacji MRS na poszczególnych platformach. Są one dostępne pod adresami:

 

  • tinyurl.com/rserver-hadoop,
  • tinyurl.com/rserver-teradata,
  • tinyurl.com/rserver-linux.


Instalacja wersji dla systemów Windows została opisana m.in. na blogu tinyurl.com/rserver-windows. Po premierze serwera SQL Server 2016 MRS został zintegrowany z serwerem SQL i można go zainstalować za pomocą instalatora SQL jako SQL Server R Services.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"