Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.



26.10.2020

Nowa wersja nVision

Można już pobierać nową wersję nVision
26.10.2020

Monitorowanie infrastruktury

Vertiv Environet Alert
23.10.2020

Telefonia w chmurze

NFON Cloudya
23.10.2020

Nowości w EDR

Bitdefender GravityZone
23.10.2020

Wykrywanie anomalii

Flowmon ADS11
23.10.2020

Mobilny monitor

AOC 16T2
22.10.2020

HP Pavilion

HP zaprezentowało nowe laptopy z linii Pavilion.
22.10.2020

Inteligentny monitoring

WD Purple SC QD101
22.10.2020

Przełącznik 2,5GbE

QNAP QSW-1105-5T

NVIDIA GEFORCE 3080 RTX architektura Ampere i bezpieczeństwo

Data publikacji: 22-10-2020 Autor: Maciej Olanicki

Rzadko zdarza się, by premiera pojedynczego komponentu, w dodatku adresowanego na rynek konsumencki, wpłynęła na całą branżę IT w takim stopniu, jak karta NVIDIA GeForce RTX 3080. Nowa architektura przynosząca skok wydajności, ale też inne decyzje podjęte w ostatnim czasie przez Zielonych mogą odmienić współczesne centra danych, rynek procesorów serwerowych, a nawet mieć wpływ na cyberbezpieczeństwo.

 

Zanim jednak przejdziemy do omawiania długofalowych skutków, jakie niewątpliwie będą miały decyzje Nvidii z ostatnich kilku miesięcy, skupmy się w pierwszej kolejności na samej GeForce RTX 3080. Za niekiedy nawet kilkunastokrotny wzrost wydajności przetwarzania niektórych obciążeń odpowiada w pierwszej kolejności nowa architektura Ampere. Co ciekawe, składa się na nią szereg innowacji, które na rynek konsumencki trafiły w drugiej kolejności. Sama NVIDIA nie kryje bowiem, że z pełni możliwości nowej architektury korzystać będą nie gracze, lecz przede wszystkim dostawcy usług chmurowych oraz centra danych. Nie od dziś wiadomo, że akceleratory graficzne coraz chętniej są wykorzystywane do przyśpieszania centrów danych. Premiera układów w architekturze Ampere na pewno przyczyni się do jeszcze szybszej ich popularyzacji, niemniej warto pamiętać, że ta moc obliczeniowa może stać się mieczem obosiecznym – leżący tu potencjał z całą pewnością nie umknął uwadze cyberprzestępców.


ARCHITEKTURA AMPERE


Na GPU architektury Ampere składają się aktualnie 54 mld tranzystorów, co czyni je najbardziej pojemnymi czipami wyprodukowanymi w 7-nanometrowym procesie technologicznym w historii. Ponadto wykorzystana została tu trzecia generacja rdzeni Tensor, wprowadzająca nowe pojęcie do obliczeń pojedynczej precyzji, czyli tzw. Tensor Float (TF32). Jest on analogiczny do obliczeń Floating Point 32, przy czym bez jakichkolwiek zmian w kodzie algorytmów sztucznej inteligencji osiągnięto tu nawet sześciokrotny wzrost wydajności przetwarzania obciążeń w stosunku do rdzeni Tensor V100. W przypadku karty GeForce RTX 3080 obliczenia FP32 są przetwarzane dwukrotnie szybciej niż na karcie RTX 2080.


Kolejną ważną innowacją, jaka trafia do nas dzięki architekturze Ampere, jest technologia Multi-Instance GPU (MIG), dzięki której z łatwością można skalować liczbę GPU poświęcanych na dane obliczenia w zależności od potrzeb. Każde GPU może być podzielone nawet na siedem całkowicie niezależnych instancji izolowanych od siebie na poziomie sprzętowym. Każda z nich będzie dysponowała własnym dostępem do pamięci o wysokiej przepustowości, pamięci podręcznej oraz rdzeni obliczeniowych. Jeśli jednak zajdzie taka potrzeba, to połączyć ze sobą można będzie nawet tysiące GPU, co otwiera nowe możliwości nie tylko przed właścicielami centrów danych, ale także projektantami wszelkiej maści klastrów obliczeniowych.


Aby jednak możliwości skalowania instancji GPU mogły zostać odpowiednio zagospodarowane, konieczny był także rozwój technologii transferu informacji pomiędzy GPU. Również w tym obszarze NVIDIA przygotowała ciekawą innowację w postaci trzeciej generacji standardu NVLink. Dzięki temu udało się dwukrotnie przyśpieszyć transfery pomiędzy GPU w stosunku do mechanizmów wykorzystywanych w epoce rdzeni Tensor V100. W praktyce oznacza to, że poszczególne jednostki obliczeniowe są w stanie wymieniać się między sobą danymi z prędkością sięgającą 600 GB/s, a zatem dziesięciokrotnie szybciej, niż ma to miejsce w przypadku interfejsu PCIe 4. Jakby tego było mało, dzięki wdrożeniu równolegle do NVLink i NVSwitch możliwe jest osiągnięcie takich prędkości nie tylko w obrębie jednego klastra, lecz także pomiędzy serwerami. Ponadto zwiększono też przepustowość pamięci, która wynosi teraz do 1,6 terabajta na sekundę, co stanowi 67-procentowy wzrost w stosunku do poprzedniej generacji GPU, zwiększona została także maksymalna wielkość pamięci L2 cache – aktualnie jest to do 14 MB, czyli siedmiokrotnie więcej, niż to miało miejsce dotychczas.

 

[...]

Pełna treść artykułu jest dostępna w papierowym wydaniu pisma.

.

Transmisje online zapewnia: StreamOnline

All rights reserved © 2019 Presscom / Miesięcznik "IT Professional"