Nvidia Tesla

Z Wikipedii, wolnej encyklopedii
Skocz do: nawigacji, wyszukiwania
Nvidia Tesla GPU

Tesla jest to grupa układów firmy NVIDIA przeznaczonych do wspomagania obliczeń naukowo-inżynieryjnych za pomocą technologii CUDA. Układy te zaprojektowano jako typowe karty rozszerzeń komputerów PC, które (w 2009 r.) mogą być instalowane w każdym komputerze posiadającym wolne gniazdo PCI Express. Układy Tesla są pierwszymi masowo produkowanymi układami przeznaczonymi do pracy w technologii GPGPU.

Charakterystyka urządzenia[edytuj | edytuj kod]

Układy serii Tesla zostały wprowadzone na rynek jesienią 2006 r. jako nowa rodzina produktów firmy NVidia przeznaczonych do zastosowań w segmencie komputerów o bardzo dużej mocy obliczeniowej. Wyposażone są w procesory ze zunifikowanymi jednostkami cieniującymi o architekturze masowo produkowanych kart graficznych GeForce i Quadro. Część z nich (z wyjątkiem układów Tesla C2050 i Tesla C2070) pozbawiona jest wyjścia video oraz układów elektronicznych przeznaczonych bezpośrednio do generowania obrazu i w tym sensie nie są to karty graficzne – producent określa je mianem computing processors (procesory obliczeniowe).

W porównaniu z kartami graficznymi serii GeForce, układy Tesla charakteryzują się znacznie zwiększoną pojemnością wysokiej jakości, specjalnie testowanej pamięci operacyjnej DRAM. Pamięć ta jest taktowana nieco wolniejszym zegarem, co powoduje zmniejszenie przepustowości szyny danych. Urządzenia Tesla oparte na architekturze Fermi obsługują pamięć ECC, oferują pełną wydajność procesorów strumieniowych w obliczeniach w podwójnej precyzji oraz posiadają dwa układy DMA co umożliwia jednoczesny transfer w obu kierunkach po szynie PCIe i obliczenia.

Zastosowania[edytuj | edytuj kod]

Dzięki ogromnej mocy obliczeniowej, niskiej cenie, stosunkowo niewielkiemu zapotrzebowaniu na energię elektryczną oraz zgodności ze środowiskiem CUDA, układy Tesla stanowią atrakcyjną alternatywę dla tradycyjnych systemów obliczeniowych dużej mocy, jak klastry CPU i superkomputery. Głównym obszarem ich zastosowań są problemy masywnie równoległe rozwiązywane w arytmetyce zmiennoprzecinkowej: obliczenia naukowo-inżynierskie (np. symulacje przepływów płynów, symulacje metodą dynamiki molekularnej), rozwiązywanie równań bardzo wielu zmiennych, analiza danych finansowych, obróbka dźwięku i obrazu, diagnostyka medyczna. W wielu przypadkach zastosowanie procesorów obliczeniowych Tesla spowodowało przyspieszenie obliczeń (względem konwencjonalnych komputerów klasy PC) o kilka do nawet kilkuset razy[1].

Pierwszym superkomputerem wykorzystującym układy Tesla jest japoński TSUBAME — hybrydowy klaster składający się (pod koniec 2008 r.) z 655 serwerów Sun x4600 oraz 170 serwerów Tesla S1070[2]. W listopadzie 2008 r. zajął on 29. miejsce na liście TOP500 najszybszych komputerów świata[3].

Specyfikacje[edytuj | edytuj kod]

Układy Tesla dostępne są jako:

  • Pojedyncze urządzenia w obudowie karty graficznej. Symbole tych urządzeń rozpoczynają się literą C (ang. Card – 'Karta'), np. C870, C1060. Łączy się je z komputerem głównym poprzez złącze PCI-Express na płycie głównej. Modele C2050 i C2070 posiadają pojedyncze wyjście video (gniazdo DVI).
  • Pojedyncze urządzenia w obudowie karty graficznej, pozbawione własnego wentylatora (chłodzenie pasywne) i wyjścia video. Symbole tych urządzeń rozpoczynają się lub kończą literą M, np. M2050, M2070, K20M. Łączy się je z komputerem głównym poprzez złącze PCI-Express na płycie głównej. Wprowadzone na rynek w 2010 r. wraz z premierą architektury Fermi i przeznaczone do serwerów w dużych centrach obliczeniowych.
  • Wolnostojące zestawy kilku kart. Symbole tych urządzeń rozpoczynają się literą D (ang. Desktop), np D870. Łączy się je z komputerem głównym poprzez kabel PCI-Express. Jedynym reprezentantem tej klasy urządzeń jest D870.
  • Zestawy kilku (zwykle czterech) kart obliczeniowych w formie modułów 1U do montowania w szafach montażowych. Symbole tych urządzeń rozpoczynają się literą S (ang. Server), np. S870, S1070. Procesory GPU w tych urządzeniach są parami podłączone do przełączników PCIe (PCIe x16 Gen2 switch), które następnie za pomocą dwóch kabli PCI-Express łączy się z jednym lub dwoma komputerami.

Poniższa tabela przedstawia główne parametry urządzeń Tesla:

Model GPU Procesory skalarne Pamięć Całkowita moc obliczeniowa CUDA Compute capability
Typ Liczba
Liczba
Zegar
MHz
Przepustowość maks.
GB/s
Rodzaj
Szerokość szyny danych
bit
Rozmiar
GB
Zegar
[MHz]
fp 32
GFLOPS
fp 64
GFLOPS
C870 GT80 1 128 1350 77 GDDR3 384 1,5 800 519 1.0
D870 GT80 2 256 (2*128) 1350 154 (2*77) GDDR3 384 2*1,5 800 1037 1.0
S870 GT80 4 512 (4*128) 1350 307 (4*77) GDDR3 384 4*1,5 800 2074 1.0
C1060 T10 1 240 1296 102 GDDR3 512 4 800 936 78 1.3
S1070 T10 4 960 (4*240) 1296 lub 1440 408 (4*102) GDDR3 512 4*4 792 3732 lub 4147 311 lub 345 1.3
C2050 T20 1 448 1150 144 GDDR5 384 3 1500 1030 515 2.0
C2070 T20 1 448 1150 144 GDDR5 384 6 1500 1030 515 2.0
M2050[4] T20 1 448 1150 148 GDDR5 384 3 1500 1030 515 2.0
M2070[4] T20 1 448 1150 150 GDDR5 384 6 1500 1030 515 2.0
M2075[4] T20A 1 448 1150 150 GDDR5 384 6 1500 1030 515 2.0
M2090[4][5] T20A 1 512 1300 177 GDDR5 384 6 1850 1331 665 2.0
K10[6] GK104 2 2 * 1536 745 2 * 160 GDDR5 256 2*4 2500 2*2290 2*95 3.0
K20[7][8] GK110 1 2496 706 208 GDDR5 384 5 2600 3520 1170 3.5
K20X[7][9] GK110 1 2688 732 250 GDDR5 384 6 2600 3950 1310 3.5
K40[10] GK110 1 2688 745 288 GDDR5 384 12 3000 4290 1430 3.5

Uwagi

  • Źródło: NVidia. Część danych dotyczących częstotliwości zegarów jest prawdopodobnie zaokrąglona.
  • CUDA Compute Capabilities to specyfikacja technicznych możliwości urządzenia; patrz: Cuda C Programming Guide.
  • Skróty fp32 i fp64 oznaczają dokładność obliczeń zmiennopozycyjnych (32 lub 64 bity).
  • W teście LINPACK (fp64) urządzenia C1060 i S1070 osiągnęły wydajność odpowiednio 50 GFLOPS i 200 GFLOPS.
  • Procesor T10 posiada tę samą architekturę, co GT200 (karty graficzne GeForce) i GT 200GL (NVidia Quadro).
  • Urządzenie S1070 produkowane jest w dwóch wersjach różniących się częstotliwością zegara procesorów skalarnych.

Zobacz też[edytuj | edytuj kod]

Linki zewnętrzne[edytuj | edytuj kod]

Wikimedia Commons

Przypisy