NVSwitch to opracowana przez firmę NVIDIA technologia sieciowa wysokiej przepustowości, zaprojektowana do łączenia wielu procesorów graficznych (GPU) w jeden spójny, wydajny system obliczeniowy. Jest ona rozwinięciem koncepcji NVLink i umożliwia tworzenie topologii połączeń, w której każdy GPU może komunikować się z każdym innym GPU w systemie z pełną przepustowością i minimalnymi opóźnieniami.

Geneza NVSwitch

Choć NVLink znacząco zwiększył możliwości wymiany danych między dwoma układami GPU, jego struktura była ograniczona topologicznie – każdy GPU mógł łączyć się bezpośrednio tylko z kilkoma innymi układami. W dużych systemach obliczeniowych, takich jak klastry AI czy superkomputery, stanowiło to ograniczenie skalowalności.

Aby rozwiązać ten problem, NVIDIA opracowała NVSwitch – sprzętowy przełącznik (switch) wysokiej przepustowości, który pełni funkcję wielokanałowego węzła komunikacyjnego, łączącego dziesiątki procesorów graficznych w jedną logiczną całość.

Po raz pierwszy technologia NVSwitch została zaprezentowana w 2018 roku w serwerze NVIDIA DGX-2, który jako pierwszy umożliwiał bezpośrednią komunikację między 16 procesorami graficznymi Tesla V100 bez udziału CPU.

Jak działa NVSwitch

NVSwitch można porównać do „switcha sieciowego”, ale działającego na poziomie komunikacji między GPU.
Każdy procesor graficzny łączy się z NVSwitchem za pomocą kilku kanałów NVLink, a sam przełącznik odpowiada za routowanie danych pomiędzy wszystkimi GPU w systemie.

Najważniejsze cechy:

pełna łączność GPU-GPU (full-mesh) – każdy układ ma bezpośredni dostęp do pamięci każdego innego GPU,
ogromna przepustowość – rzędu terabajtów na sekundę w systemach wieloprocesorowych,
niskie opóźnienia (latency) – zapewniające efektywną współpracę między układami,
skalowalność – możliwość łączenia wielu NVSwitchy w większe klastry (np. DGX SuperPOD).

W praktyce NVSwitch tworzy jednolity system pamięci (Unified Memory Space), w którym wszystkie GPU mogą współdzielić dane bez konieczności przesyłania ich przez procesor główny.

Architektura i wydajność

W serwerach klasy DGX lub HGX, pojedynczy NVSwitch obsługuje wiele kanałów NVLink jednocześnie, osiągając łączną przepustowość przekraczającą 2 TB/s.
Dzięki temu:

dane przesyłane pomiędzy GPU nie powodują przeciążeń w systemie,
można trenować ogromne modele AI (np. językowe i multimodalne) w sposób rozproszony,
system zachowuje się jak jedna, spójna jednostka obliczeniowa, a nie zestaw niezależnych kart.

W najnowszych architekturach (np. Hopper H100, Grace Hopper Superchip) NVSwitch współpracuje również z procesorami CPU poprzez NVLink-C2C (Chip-to-Chip), co otwiera drogę do pełnej integracji CPU i GPU w ramach jednego ekosystemu obliczeniowego.

Zastosowania NVSwitch

sztuczna inteligencja i uczenie głębokie (Deep Learning) – trenowanie ogromnych modeli językowych (LLM), sieci neuronowych i modeli multimodalnych,
obliczenia naukowe (HPC) – symulacje fizyczne, chemiczne, genetyczne, astronomiczne,
analiza danych i przetwarzanie w chmurze – systemy Big Data i AI as a Service,
superkomputery i serwery DGX / HGX – m.in. NVIDIA DGX H100, Selene, Cerebras-Gaudi.

Zalety NVSwitch

pełna topologia połączeń GPU-GPU,
maksymalna przepustowość między układami,
niskie opóźnienia i wysoka efektywność energetyczna,
możliwość skalowania w poziomie (wielosystemowe klastry GPU),
jednolita przestrzeń pamięci, ułatwiająca programowanie i trenowanie modeli AI.

Wady i ograniczenia

technologia dostępna wyłącznie w profesjonalnych systemach serwerowych NVIDII,

wysoki koszt infrastruktury (serwery DGX/HGX),
brak zastosowań konsumenckich,
wymaga oprogramowania i frameworków przystosowanych do pracy w architekturze wielogpu (np. CUDA, NCCL, TensorFlow).

NVSwitch to kluczowa technologia NVIDII, która umożliwia budowę potężnych, skalowalnych systemów obliczeniowych AI, w których wiele GPU działa jak jedna zintegrowana jednostka. Dzięki połączeniu z NVLink pozwala osiągnąć ogromną przepustowość, minimalne opóźnienia i pełną współdzielność pamięci między procesorami graficznymi.

To właśnie NVSwitch, w połączeniu z GPU H100 i architekturą Hopper, stanowi fundament superkomputerów AI, na których trenowane są współczesne modele językowe i generatywne – w tym systemy klasy LLM, takie jak GPT czy Gemini.

NVSwitch

Opublikowano przez mgr Bartłomiej_Speth w dniu 20 listopada 2025

Geneza NVSwitch

Jak działa NVSwitch

Architektura i wydajność

Zastosowania NVSwitch

Zalety NVSwitch

Wady i ograniczenia

mgr Bartłomiej_Speth

Jak usunąć hasło BIOS w laptopie / Administrator Password / Power On Password removal

DiskOnChip 2000 – zapomniany SSD sprzed ery SSD ?

Joystick PC Raider Professional Analog – ile kosztował i jak działał sprzęt dla graczy PC w 1994 roku

NVSwitch

Opublikowano przez mgr Bartłomiej_Speth w dniu 20 listopada 2025

Geneza NVSwitch

Jak działa NVSwitch

Architektura i wydajność

Zastosowania NVSwitch

Zalety NVSwitch

Wady i ograniczenia

mgr Bartłomiej_Speth

Podobne wpisy

Jak usunąć hasło BIOS w laptopie / Administrator Password / Power On Password removal

DiskOnChip 2000 – zapomniany SSD sprzed ery SSD ?

Joystick PC Raider Professional Analog – ile kosztował i jak działał sprzęt dla graczy PC w 1994 roku