Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



12.05.2017

SAP Executive Forum 2017

Jak rozwijać firmę w dobie digitalizacji? To jedno z wielu zagadnień, o których będą...
28.04.2017

100 stron w minutę

Epson WorkForce Enterprise
25.04.2017

MegaNAS-y

Netgear ReadyNAS 4360X/S
21.04.2017

Nowe pamięci

Samsung Z-SSD
18.04.2017

Dozorowanie w 4K

Panasonic True 4K
14.04.2017

Kompleksowe zarządzanie

Quest Active Administrator 8.1
11.04.2017

EMM dla Androida i IoT

Sophos Mobile 7
07.04.2017

Kontrola dostępu i...

VMware Workspace ONE, VMware AirWatch 9.1
05.04.2017

HPE Reimagine IT 2017

27 kwietnia 2017 r. w Warszawie odbędzie się HPE Reimagine IT 2017, nowa odsłona Wyzwań...

R Open / R Server

Data publikacji: 03-11-2016 Autor: Marcin Szeliga
Rys. 2. Lokalizację MRS można...
Rys. 3. Czas uczenia tego...
Rys. 4. Skrócenie czasu...
Rys. 5. Parametr histType...

W pierwszej części artykułu przedstawiliśmy Open R – najpopularniejszy i najszybciej rozwijający się język zaawansowanej analizy danych, który dzięki tysiącom ogólnodostępnych bibliotek upraszcza i skraca czas eksperymentów data science. Pora na szczegółowy opis platformy, ze szczególnym uwzględnieniem biblioteki ScaleR i formatu danych XDF.

Jak wspomnieliśmy w poprzednim odcinku, Microsoft opracował, na podstawie produktu przejętej w maju 2015 firmy Revolution Analytics, ogólnie dostępną wieloplatformową wersję języka R, o nazwie Microsoft R Open (MRO), wzbogaconą m.in. o możliwość „zamrożenia” używanych w projektach wersji bibliotek, równoległego wykonywania niektórych operacji matematycznych i integrację z usługami Azure. Obie otwarte wersje języka R mają podobne ograniczenia:

 

  • analizowane dane muszą się zmieścić w pamięci operacyjnej komputera, na którym przeprowadzane są analizy. W praktyce uniemożliwia to ich użycie w systemach big data;
  • R jest językiem interpretowanym i napisane w nim biblioteki są wolniejsze od kodu kompilowanego. Niestety, zdecydowana większość bibliotek jest napisana właśnie w języku R, co przekłada się na długi czas wykonywania analiz;
  • dodatkowym powodem nieoptymalnej wydajności jest brak równoległego wykonywania operacji. Problem ten można w pewnym zakresie rozwiązać w obu otwartych wersjach języka R. Open R zawiera specjalistyczne biblioteki, a MRO automatycznie zrównolegli niektóre operacje matematyczne za pomocą biblioteki MKL (Intel Math Kernel Library) i pozwala uruchomić równolegle kod użytkownika za pomocą pętli forech;
  • dane źródłowe muszą zostać przesłane do komputera, na którym będą analizowane. Operacja taka jest długotrwała i ryzykowna z punktu widzenia bezpieczeństwa, bo potencjalnie poufne dane muszą zostać przesłane przez sieć do stacji roboczej analityka;
  • wsparcie techniczne jest oferowane wyłącznie przez społeczność, tymczasem w niektórych firmach obowiązuje zasada, że każdy zainstalowany program musi być objęty odpowiednim wsparciem.


Ograniczenia te nie dotyczą serwera MRS, czyli Microsoft R Server, będącego tematem pozostałych części artykułu. W tej części przyjrzymy się instalacji serwera MRS, jego budowie i działaniu oraz użyjemy go do oceny danych źródłowych.

> Instalacja

Następcą serwera Revolution R Enterprise jest serwer MRS, dostępny w czterech wersjach:

 

  • Windows – wymagany jest 64-bitowy system Windows 7 lub nowszy;
  • Linux – wymagana jest 64-bitowa dystrybucja Red Hat Enterprise (lub CentOS) w wersji 5 lub nowszej, albo SUSE Linux Enterprise Server 11 SP2 lub nowszej;
  • Hadoop – wymagana jest dystrybucja Cloudera w wersji 5 lub nowszej, Hortonworks HDP 1.3 lub HDP 2.0, albo MapR M3/M5/M7 w wersji 2 lub nowszej;
  • Teradata – wymagany jest serwer Teradata w wersji 14 lub nowszej.


Serwer MRS wymaga wcześniejszej instalacji MRO. Wersje MRO na różne platformy są dostępne pod adresem mran.microsoft.com/download/. Sam serwer MRS jest dostępny:

 

  • Dla studentów za darmo, w ramach programu DreamSpark (tinyurl.com/prdreamspark);
  • Dla programistów również za darmo, w ramach programu Visual Studio Dev Essentials (tinyurl.com/MRE-VSDE);
  • Dla posiadaczy subskrypcji MSDN (msdn.microsoft.com);
  • Dla pozostałych klientów jako osobny, licencjonowany produkt.


Microsoft udostępnił również szczegółowe instrukcje instalacji MRS na poszczególnych platformach. Są one dostępne pod adresami:

 

  • tinyurl.com/rserver-hadoop,
  • tinyurl.com/rserver-teradata,
  • tinyurl.com/rserver-linux.


Instalacja wersji dla systemów Windows została opisana m.in. na blogu tinyurl.com/rserver-windows. Po premierze serwera SQL Server 2016 MRS został zintegrowany z serwerem SQL i można go zainstalować za pomocą instalatora SQL jako SQL Server R Services.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"