Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



30.12.2016

Miniaturowy projektor LED

Vivitek Qumi Q3 Plus
27.12.2016

Zarządzanie i monitorowanie...

WatchGuard Wi-Fi Cloud
25.12.2016

Serwery serii „S”

Cisco UCS-S
22.12.2016

Wymienne szkła

Axis Q1659
19.12.2016

Dwa systemy

QNAP TES-x85U
15.12.2016

Mikrus z mocą

HP Z2 Mini
13.12.2016

Platforma dla biznesu

Red Hat Enterprise Linux 7.3
09.12.2016

Cloud i storage – nowości od...

SUSE OpenStack Cloud 7 i Enterprise Storage 4
06.12.2016

IEM zamiast VPN

baramundi Management Suite 2016 R2

R Open / R Server

Data publikacji: 03-11-2016 Autor: Marcin Szeliga
Rys. 2. Lokalizację MRS można...
Rys. 3. Czas uczenia tego...
Rys. 4. Skrócenie czasu...
Rys. 5. Parametr histType...

W pierwszej części artykułu przedstawiliśmy Open R – najpopularniejszy i najszybciej rozwijający się język zaawansowanej analizy danych, który dzięki tysiącom ogólnodostępnych bibliotek upraszcza i skraca czas eksperymentów data science. Pora na szczegółowy opis platformy, ze szczególnym uwzględnieniem biblioteki ScaleR i formatu danych XDF.

Jak wspomnieliśmy w poprzednim odcinku, Microsoft opracował, na podstawie produktu przejętej w maju 2015 firmy Revolution Analytics, ogólnie dostępną wieloplatformową wersję języka R, o nazwie Microsoft R Open (MRO), wzbogaconą m.in. o możliwość „zamrożenia” używanych w projektach wersji bibliotek, równoległego wykonywania niektórych operacji matematycznych i integrację z usługami Azure. Obie otwarte wersje języka R mają podobne ograniczenia:

 

  • analizowane dane muszą się zmieścić w pamięci operacyjnej komputera, na którym przeprowadzane są analizy. W praktyce uniemożliwia to ich użycie w systemach big data;
  • R jest językiem interpretowanym i napisane w nim biblioteki są wolniejsze od kodu kompilowanego. Niestety, zdecydowana większość bibliotek jest napisana właśnie w języku R, co przekłada się na długi czas wykonywania analiz;
  • dodatkowym powodem nieoptymalnej wydajności jest brak równoległego wykonywania operacji. Problem ten można w pewnym zakresie rozwiązać w obu otwartych wersjach języka R. Open R zawiera specjalistyczne biblioteki, a MRO automatycznie zrównolegli niektóre operacje matematyczne za pomocą biblioteki MKL (Intel Math Kernel Library) i pozwala uruchomić równolegle kod użytkownika za pomocą pętli forech;
  • dane źródłowe muszą zostać przesłane do komputera, na którym będą analizowane. Operacja taka jest długotrwała i ryzykowna z punktu widzenia bezpieczeństwa, bo potencjalnie poufne dane muszą zostać przesłane przez sieć do stacji roboczej analityka;
  • wsparcie techniczne jest oferowane wyłącznie przez społeczność, tymczasem w niektórych firmach obowiązuje zasada, że każdy zainstalowany program musi być objęty odpowiednim wsparciem.


Ograniczenia te nie dotyczą serwera MRS, czyli Microsoft R Server, będącego tematem pozostałych części artykułu. W tej części przyjrzymy się instalacji serwera MRS, jego budowie i działaniu oraz użyjemy go do oceny danych źródłowych.

> Instalacja

Następcą serwera Revolution R Enterprise jest serwer MRS, dostępny w czterech wersjach:

 

  • Windows – wymagany jest 64-bitowy system Windows 7 lub nowszy;
  • Linux – wymagana jest 64-bitowa dystrybucja Red Hat Enterprise (lub CentOS) w wersji 5 lub nowszej, albo SUSE Linux Enterprise Server 11 SP2 lub nowszej;
  • Hadoop – wymagana jest dystrybucja Cloudera w wersji 5 lub nowszej, Hortonworks HDP 1.3 lub HDP 2.0, albo MapR M3/M5/M7 w wersji 2 lub nowszej;
  • Teradata – wymagany jest serwer Teradata w wersji 14 lub nowszej.


Serwer MRS wymaga wcześniejszej instalacji MRO. Wersje MRO na różne platformy są dostępne pod adresem mran.microsoft.com/download/. Sam serwer MRS jest dostępny:

 

  • Dla studentów za darmo, w ramach programu DreamSpark (tinyurl.com/prdreamspark);
  • Dla programistów również za darmo, w ramach programu Visual Studio Dev Essentials (tinyurl.com/MRE-VSDE);
  • Dla posiadaczy subskrypcji MSDN (msdn.microsoft.com);
  • Dla pozostałych klientów jako osobny, licencjonowany produkt.


Microsoft udostępnił również szczegółowe instrukcje instalacji MRS na poszczególnych platformach. Są one dostępne pod adresami:

 

  • tinyurl.com/rserver-hadoop,
  • tinyurl.com/rserver-teradata,
  • tinyurl.com/rserver-linux.


Instalacja wersji dla systemów Windows została opisana m.in. na blogu tinyurl.com/rserver-windows. Po premierze serwera SQL Server 2016 MRS został zintegrowany z serwerem SQL i można go zainstalować za pomocą instalatora SQL jako SQL Server R Services.

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2013 Presscom / Miesięcznik "IT Professional"