Nvidia

Mi az Nvidia Ampere?

Mi az Nvidia Ampere?

Ami a GPU-kat illeti, az Nvidia vezető szakértő. 1993 óta az üzleti életben az Nvidia kiváló minőségű professzionális és fogyasztói GPU-k széles skáláját gyártotta.  Feldolgozóik megbecsült architektúrája áll termékük sikerei mögött, különösen elsődleges vonaluk, a GeForce. Az Nvidia grafikus processzorai túlmutattak a játéktéren, kiterjesztve jelenlétüket a mély tanulás, az AI (mesterséges intelligencia) és a gyorsított elemzés terén. Az Nvidia egy évtizeddel ezelőtt behatolt az adatközpontok piacára, kezdve a Fermi chipekkel. Ezt követően ismétlések történtek, és a vállalat folyamatosan kiadott GPU-kat adott ki, amelyek kielégítik az adatközpontok gyorsabb feldolgozási sebességének kielégíthetetlen igényét. Az Nvidia GPU-jai az évek során fejlődtek, és az architektúra-tervek elsősorban az evolúciót hajtják.  

Nvidia Ampere építészete

A verseny komolyan szoros a GPU-gyártók között, de az Nvidia semmit sem tart vissza az első hely megszerzéséhez. Valójában az Nvidia uralta az AI piacot az elmúlt évtizedben. 2020-ban az Nvidia első 7 nm-es (8 nm-es fogyasztói alkatrészek) GPU-jának híre 54 milliárd tranzisztorral volt összenyomva egy ilyen kicsi szerszámban. Kódnevű Amper André-Marie Ampère francia matematikus után, Az Nvidia processzorarchitektúrája jelentős előrelépést jelent az elődeihez, a Turinghez és a Volthoz képest, több funkciót, jobb hatékonyságot és magasabb teljesítményt ígér alacsonyabb teljesítményszinteken. Az Ampere áll az Nvidia második generációs RTX GPU-ja, az RTX 30 sorozat mögött, és állítólag kétszer olyan gyors, mint az RTX 20 sorozatú társaik. Az Ampere architektúra az Nvidia A100 adatközpontos GPU-k mögött rejlő erő.

Ampere specifikációi

Az Ampere az Nvidia első 7nm / 8nm GPU-ja, a fogyasztói sugárkövetés második generációja, és a tenzormagok harmadik generációja van. Az Ampere a GA100, GA102 és GA104 GPU-k mögöttes architektúrája, amelyek a GeForce RTX 3090, RTX 3080, RTX 3070 és legutóbb az RTX 3060-ba vannak beágyazva. Az Nvidia várhatóan kiadja az RTX 3050-et is a következő hónapokban. Eközben a vállalati GA100 GPU 20x több számítási teljesítményt nyújt, mint az adatközpont GPU-k korábbi generációi. Az alábbiakban áttekintjük az Nvidia Ampere-alapú professzionális és fogyasztói GPU-ját [1]:

GPU GA100 GA102 GA102 GA104
Grafikus kártya Nvidia A100 GeForce RTX 3090 GeForce RTX 3080 GeForce RTX 3070
Folyamat (nm) TSMC N7 Samsung 8N Samsung 8N Samsung 8N
Tranzisztorok (milliárd) 54 28.3 28.3 17.4
Die méret (mm ^ 2) 826 628.4 628.4 392.5
GPC konfiguráció 8 × 16 7 × 12 6 × 12 6 × 8
SM-ek 108 82 68 46
CUDA magok 6912 10496 8704 5888
RT magok Egyik sem 82 68 46
Tenzormagok 432 328 272 184
Boost Clock (MHz) 1410 1700 1710 1730
VRAM sebesség (Gbps) 2.43 19.5 (GDDR6X) 19 (GDDR6X) 14 (GDDR6)
VRAM (GB) 40 (max. 48) 24 10 8
Busz szélessége 5120 (max. 6144) 384 320 256
ROP-ok 128 112 96 96
TMU-k 864 656 544 368
GFLOPS FP32 19492 35686 29768 20372
RT TFLOPS N / A 69 58 40
Tensor TFLOPS FP16 (ritkaság) 312 (628) 143 (285) 119 (238) 81. (163)
Sávszélesség (GB / s) 1555 936 760 448
TBP (watt) 400 (250 PCIe) 350 320 220

Nvidia A100 

Az Nvidia A100 az első GPU, amely az Ampere architektúrát használta. A vállalati chip adatközpontokra irányul, és olyan GPU-intenzív feladatokhoz készült, mint például a mély tanulás és az AI. A TSMC 7 nm-es folyamatának felhasználásával készült, hatalmas mennyiségű, 54 milliárd tranzisztor. A vállalati GPU-k korábbi generációit 20x-os teljesítménynövekedéssel teljesítette: 6 912 CUDA mag, 432 textúra leképező egység, 160 ROP, harmadik generációs Tensor mag és 40 GB-os VRAM memória sávszélességgel, amely 1.6TB / sec. A DGX A100 a világ első mesterséges intelligencia-rendszere nyolc A100-as klaszterrel és borsó 199 000 dolláros árcédulával.

GeForce RTX 30 sorozat

A vállalati piac uralma mellett az Nvidia mindig a fogyasztókat, különösen a játékosokat és az alkotókat tartja szem előtt. Az Ampere architektúrát az Nvidia fogyasztói grafikus kártyái is átvették. A GeForce RTX második generációja az Ampere-alapú GPU-kat hordozza, ami kétszer annyiba emeli a teljesítményt, mint az előző generáció.

A legtöbb szempontból az Ampere több mint kétszer akkora, mint Turing processzor-kapacitása. Megduplázta Turing árnyékoló teljesítményét az FP32 CUDA magok kétszeresével. Pontosabban 30 Shader-TFLOPS, 2.7-szer több, mint Turingé, ami csak 11 Shader-TFLOPS. Hasonlóképpen, Turing Tensor Core értéke 89 Tensor-TFLOPS, de az Ampere több mint kétszeresére növelte ezt az arányt a 238 Tensor-TFLOPS értékével. Nem szabad megfeledkezni a Ray Tracing Core sebességéről, amely 58 RT-TFLOPS, 1.Hétszer gyorsabb, mint a Turing 34 RT-TFLOPS-ja, és a GPU-k még gyorsabb futtatása érdekében az Ampere chip csatlakozik a világ leggyorsabb memóriájához, a Micron G6X-hez.

Az RTX 30 sorozat a Samsung 8N Nvidia Custom Process segítségével készült, 28 milliárd tranzisztorral a GA102 és 17 milliárd tranzisztorral a GA104 számára. A Titan RTX 3090 osztályt a GA102 GPU hajtja, és rendkívül hatékony fogyasztói kártya teljesítményt nyújt. A korábbi generációktól eltérően az RTX 3090 harmadik felek számára nyitott az egyedi tervezésre.

Az RTX 3080 egy GA102 GPU-t is használ, amely az RTX 2080 teljesítményének kétszeresét és lenyűgöző 4K játéktudást nyújt. A GA104 GPU-val hajtott RTX 3070 fele az RTX 2080 Ti-nek. A nemrég megjelent RTX 3060 szintén soha nem hagyja figyelmen kívül a megdöbbentő teljesítményét, amelyet a továbbfejlesztett sugárkövető magok, a tenzor magok, az új streaming többprocesszorok és a nagy sebességű G6 memória hajt.

A teljesítmény hatalmas növekedése ellenére az új RTX GPU-k nem nehezednek a zsebre. A sokkal gyorsabb grafikus kártyák könnyen hozzáférhetőek, amikor az árakról van szó. Az Nvidia GeForce zászlóshajója, az RTX 3080 699 dollárnál kezdődik, az RTX 3070 499 dollárért, az RTX 3060 ára pedig 329 dollár. A magasabb kategóriájú RTX 3090 1499 dollárba kerül; a Titan-szintű teljesítményét tekintve még mindig jelentősen olcsó.

Néhány hónappal a megjelenése után állítólag hiány volt az Ampere-alapú grafikus kártyákból, és nem meglepő, hogy az Ampere lenyűgöző teljesítménye elfogadható áron. Azok számára, akik fontolóra veszik a GPU frissítését, itt a legjobb alkalom, hogy kézbe vegye az Nvidia Ampere alapú GPU-jait.

Források

[1] Walton, Jarred. „Az Nvidia RTX 30-Series Ampere Architecture Deep Dive: Minden, amit tudunk”. https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 2020. október 13.

Az egérmutató és a kurzor méretének, színének és sémájának módosítása a Windows 10 rendszeren
Az egérmutató és a kurzor a Windows 10 operációs rendszerben nagyon fontos szempont. Ez elmondható más operációs rendszerekről is, tehát valójában eze...
Ingyenes és nyílt forráskódú játékmotorok a Linux játékok fejlesztéséhez
Ez a cikk felsorolja azokat az ingyenes és nyílt forráskódú játékmotorokat, amelyek felhasználhatók 2D és 3D játékok fejlesztésére Linuxon. Számos ily...
Shadow of the Tomb Raider for Linux Tutorial
A Shadow of the Tomb Raider a Tomb Raider sorozat tizenkettedik kiegészítője - az Eidos Montreal által létrehozott akció-kaland játék franchise. A ját...