Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



17.08.2017

24 porty i PoE

NETGEAR GS724TPv2
11.08.2017

Z helem

WD Red / Red Pro
08.08.2017

Kontener jako usługa

SUSE CaaS Platform
03.08.2017

Natywna obsługa kontenerów

Red Hat OpenShift Online
28.07.2017

Luksusowa hybryda

HP Spectre x2
25.07.2017

Nowy napęd SSD

KC1000 NVMe PCIe
21.07.2017

Rekord świata

Lenovo x3950 X6
18.07.2017

Brightness Intellgence Plus

BenQ EW2770QZ
14.07.2017

Poza pasmem

Opengear ACM7000

R Open / R Server

Data publikacji: 03-11-2016 Autor: Marcin Szeliga
Rys. 2. Lokalizację MRS można...
Rys. 3. Czas uczenia tego...
Rys. 4. Skrócenie czasu...
Rys. 5. Parametr histType...

W pierwszej części artykułu przedstawiliśmy Open R – najpopularniejszy i najszybciej rozwijający się język zaawansowanej analizy danych, który dzięki tysiącom ogólnodostępnych bibliotek upraszcza i skraca czas eksperymentów data science. Pora na szczegółowy opis platformy, ze szczególnym uwzględnieniem biblioteki ScaleR i formatu danych XDF.

Jak wspomnieliśmy w poprzednim odcinku, Microsoft opracował, na podstawie produktu przejętej w maju 2015 firmy Revolution Analytics, ogólnie dostępną wieloplatformową wersję języka R, o nazwie Microsoft R Open (MRO), wzbogaconą m.in. o możliwość „zamrożenia” używanych w projektach wersji bibliotek, równoległego wykonywania niektórych operacji matematycznych i integrację z usługami Azure. Obie otwarte wersje języka R mają podobne ograniczenia:

 

  • analizowane dane muszą się zmieścić w pamięci operacyjnej komputera, na którym przeprowadzane są analizy. W praktyce uniemożliwia to ich użycie w systemach big data;
  • R jest językiem interpretowanym i napisane w nim biblioteki są wolniejsze od kodu kompilowanego. Niestety, zdecydowana większość bibliotek jest napisana właśnie w języku R, co przekłada się na długi czas wykonywania analiz;
  • dodatkowym powodem nieoptymalnej wydajności jest brak równoległego wykonywania operacji. Problem ten można w pewnym zakresie rozwiązać w obu otwartych wersjach języka R. Open R zawiera specjalistyczne biblioteki, a MRO automatycznie zrównolegli niektóre operacje matematyczne za pomocą biblioteki MKL (Intel Math Kernel Library) i pozwala uruchomić równolegle kod użytkownika za pomocą pętli forech;
  • dane źródłowe muszą zostać przesłane do komputera, na którym będą analizowane. Operacja taka jest długotrwała i ryzykowna z punktu widzenia bezpieczeństwa, bo potencjalnie poufne dane muszą zostać przesłane przez sieć do stacji roboczej analityka;
  • wsparcie techniczne jest oferowane wyłącznie przez społeczność, tymczasem w niektórych firmach obowiązuje zasada, że każdy zainstalowany program musi być objęty odpowiednim wsparciem.


Ograniczenia te nie dotyczą serwera MRS, czyli Microsoft R Server, będącego tematem pozostałych części artykułu. W tej części przyjrzymy się instalacji serwera MRS, jego budowie i działaniu oraz użyjemy go do oceny danych źródłowych.

> Instalacja

Następcą serwera Revolution R Enterprise jest serwer MRS, dostępny w czterech wersjach:

 

  • Windows – wymagany jest 64-bitowy system Windows 7 lub nowszy;
  • Linux – wymagana jest 64-bitowa dystrybucja Red Hat Enterprise (lub CentOS) w wersji 5 lub nowszej, albo SUSE Linux Enterprise Server 11 SP2 lub nowszej;
  • Hadoop – wymagana jest dystrybucja Cloudera w wersji 5 lub nowszej, Hortonworks HDP 1.3 lub HDP 2.0, albo MapR M3/M5/M7 w wersji 2 lub nowszej;
  • Teradata – wymagany jest serwer Teradata w wersji 14 lub nowszej.


Serwer MRS wymaga wcześniejszej instalacji MRO. Wersje MRO na różne platformy są dostępne pod adresem mran.microsoft.com/download/. Sam serwer MRS jest dostępny:

 

  • Dla studentów za darmo, w ramach programu DreamSpark (tinyurl.com/prdreamspark);
  • Dla programistów również za darmo, w ramach programu Visual Studio Dev Essentials (tinyurl.com/MRE-VSDE);
  • Dla posiadaczy subskrypcji MSDN (msdn.microsoft.com);
  • Dla pozostałych klientów jako osobny, licencjonowany produkt.


Microsoft udostępnił również szczegółowe instrukcje instalacji MRS na poszczególnych platformach. Są one dostępne pod adresami:

 

  • tinyurl.com/rserver-hadoop,
  • tinyurl.com/rserver-teradata,
  • tinyurl.com/rserver-linux.


Instalacja wersji dla systemów Windows została opisana m.in. na blogu tinyurl.com/rserver-windows. Po premierze serwera SQL Server 2016 MRS został zintegrowany z serwerem SQL i można go zainstalować za pomocą instalatora SQL jako SQL Server R Services.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"