Mi az Nvidia Ampere?

Ami a GPU-kat illeti, az Nvidia vezető szakértő. 1993 óta az üzleti életben az Nvidia kiváló minőségű professzionális és fogyasztói GPU-k széles skáláját gyártotta. Feldolgozóik megbecsült architektúrája áll termékük sikerei mögött, különösen elsődleges vonaluk, a GeForce. Az Nvidia grafikus processzorai túlmutattak a játéktéren, kiterjesztve jelenlétüket a mély tanulás, az AI (mesterséges intelligencia) és a gyorsított elemzés terén. Az Nvidia egy évtizeddel ezelőtt behatolt az adatközpontok piacára, kezdve a Fermi chipekkel. Ezt követően ismétlések történtek, és a vállalat folyamatosan kiadott GPU-kat adott ki, amelyek kielégítik az adatközpontok gyorsabb feldolgozási sebességének kielégíthetetlen igényét. Az Nvidia GPU-jai az évek során fejlődtek, és az architektúra-tervek elsősorban az evolúciót hajtják.

Nvidia Ampere építészete

A verseny komolyan szoros a GPU-gyártók között, de az Nvidia semmit sem tart vissza az első hely megszerzéséhez. Valójában az Nvidia uralta az AI piacot az elmúlt évtizedben. 2020-ban az Nvidia első 7 nm-es (8 nm-es fogyasztói alkatrészek) GPU-jának híre 54 milliárd tranzisztorral volt összenyomva egy ilyen kicsi szerszámban. Kódnevű Amper André-Marie Ampère francia matematikus után, Az Nvidia processzorarchitektúrája jelentős előrelépést jelent az elődeihez, a Turinghez és a Volthoz képest, több funkciót, jobb hatékonyságot és magasabb teljesítményt ígér alacsonyabb teljesítményszinteken. Az Ampere áll az Nvidia második generációs RTX GPU-ja, az RTX 30 sorozat mögött, és állítólag kétszer olyan gyors, mint az RTX 20 sorozatú társaik. Az Ampere architektúra az Nvidia A100 adatközpontos GPU-k mögött rejlő erő.

Ampere specifikációi

Az Ampere az Nvidia első 7nm / 8nm GPU-ja, a fogyasztói sugárkövetés második generációja, és a tenzormagok harmadik generációja van. Az Ampere a GA100, GA102 és GA104 GPU-k mögöttes architektúrája, amelyek a GeForce RTX 3090, RTX 3080, RTX 3070 és legutóbb az RTX 3060-ba vannak beágyazva. Az Nvidia várhatóan kiadja az RTX 3050-et is a következő hónapokban. Eközben a vállalati GA100 GPU 20x több számítási teljesítményt nyújt, mint az adatközpont GPU-k korábbi generációi. Az alábbiakban áttekintjük az Nvidia Ampere-alapú professzionális és fogyasztói GPU-ját [1]:

GPU	GA100	GA102	GA102	GA104
Grafikus kártya	Nvidia A100	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
Folyamat (nm)	TSMC N7	Samsung 8N	Samsung 8N	Samsung 8N
Tranzisztorok (milliárd)	54	28.3	28.3	17.4
Die méret (mm ^ 2)	826	628.4	628.4	392.5
GPC konfiguráció	8 × 16	7 × 12	6 × 12	6 × 8
SM-ek	108	82	68	46
CUDA magok	6912	10496	8704	5888
RT magok	Egyik sem	82	68	46
Tenzormagok	432	328	272	184
Boost Clock (MHz)	1410	1700	1710	1730
VRAM sebesség (Gbps)	2.43	19.5 (GDDR6X)	19 (GDDR6X)	14 (GDDR6)
VRAM (GB)	40 (max. 48)	24	10	8
Busz szélessége	5120 (max. 6144)	384	320	256
ROP-ok	128	112	96	96
TMU-k	864	656	544	368
GFLOPS FP32	19492	35686	29768	20372
RT TFLOPS	N / A	69	58	40
Tensor TFLOPS FP16 (ritkaság)	312 (628)	143 (285)	119 (238)	81. (163)
Sávszélesség (GB / s)	1555	936	760	448
TBP (watt)	400 (250 PCIe)	350	320	220

Nvidia A100

Az Nvidia A100 az első GPU, amely az Ampere architektúrát használta. A vállalati chip adatközpontokra irányul, és olyan GPU-intenzív feladatokhoz készült, mint például a mély tanulás és az AI. A TSMC 7 nm-es folyamatának felhasználásával készült, hatalmas mennyiségű, 54 milliárd tranzisztor. A vállalati GPU-k korábbi generációit 20x-os teljesítménynövekedéssel teljesítette: 6 912 CUDA mag, 432 textúra leképező egység, 160 ROP, harmadik generációs Tensor mag és 40 GB-os VRAM memória sávszélességgel, amely 1.6TB / sec. A DGX A100 a világ első mesterséges intelligencia-rendszere nyolc A100-as klaszterrel és borsó 199 000 dolláros árcédulával.

GeForce RTX 30 sorozat

A vállalati piac uralma mellett az Nvidia mindig a fogyasztókat, különösen a játékosokat és az alkotókat tartja szem előtt. Az Ampere architektúrát az Nvidia fogyasztói grafikus kártyái is átvették. A GeForce RTX második generációja az Ampere-alapú GPU-kat hordozza, ami kétszer annyiba emeli a teljesítményt, mint az előző generáció.

A legtöbb szempontból az Ampere több mint kétszer akkora, mint Turing processzor-kapacitása. Megduplázta Turing árnyékoló teljesítményét az FP32 CUDA magok kétszeresével. Pontosabban 30 Shader-TFLOPS, 2.7-szer több, mint Turingé, ami csak 11 Shader-TFLOPS. Hasonlóképpen, Turing Tensor Core értéke 89 Tensor-TFLOPS, de az Ampere több mint kétszeresére növelte ezt az arányt a 238 Tensor-TFLOPS értékével. Nem szabad megfeledkezni a Ray Tracing Core sebességéről, amely 58 RT-TFLOPS, 1.Hétszer gyorsabb, mint a Turing 34 RT-TFLOPS-ja, és a GPU-k még gyorsabb futtatása érdekében az Ampere chip csatlakozik a világ leggyorsabb memóriájához, a Micron G6X-hez.

Az RTX 30 sorozat a Samsung 8N Nvidia Custom Process segítségével készült, 28 milliárd tranzisztorral a GA102 és 17 milliárd tranzisztorral a GA104 számára. A Titan RTX 3090 osztályt a GA102 GPU hajtja, és rendkívül hatékony fogyasztói kártya teljesítményt nyújt. A korábbi generációktól eltérően az RTX 3090 harmadik felek számára nyitott az egyedi tervezésre.

Az RTX 3080 egy GA102 GPU-t is használ, amely az RTX 2080 teljesítményének kétszeresét és lenyűgöző 4K játéktudást nyújt. A GA104 GPU-val hajtott RTX 3070 fele az RTX 2080 Ti-nek. A nemrég megjelent RTX 3060 szintén soha nem hagyja figyelmen kívül a megdöbbentő teljesítményét, amelyet a továbbfejlesztett sugárkövető magok, a tenzor magok, az új streaming többprocesszorok és a nagy sebességű G6 memória hajt.

A teljesítmény hatalmas növekedése ellenére az új RTX GPU-k nem nehezednek a zsebre. A sokkal gyorsabb grafikus kártyák könnyen hozzáférhetőek, amikor az árakról van szó. Az Nvidia GeForce zászlóshajója, az RTX 3080 699 dollárnál kezdődik, az RTX 3070 499 dollárért, az RTX 3060 ára pedig 329 dollár. A magasabb kategóriájú RTX 3090 1499 dollárba kerül; a Titan-szintű teljesítményét tekintve még mindig jelentősen olcsó.

Néhány hónappal a megjelenése után állítólag hiány volt az Ampere-alapú grafikus kártyákból, és nem meglepő, hogy az Ampere lenyűgöző teljesítménye elfogadható áron. Azok számára, akik fontolóra veszik a GPU frissítését, itt a legjobb alkalom, hogy kézbe vegye az Nvidia Ampere alapú GPU-jait.

Források

[1] Walton, Jarred. „Az Nvidia RTX 30-Series Ampere Architecture Deep Dive: Minden, amit tudunk”. https: // www.tomshardware.com / features / nvidia-ampere-architecture-deep-dive. 2020. október 13.