Maxwell (mikroarkitektur)

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 29. maj 2020; checks kræver 4 redigeringer .
Maxwell
Udgivelses dato Februar 2014
Producenter TSMC
Pascal

Maxwell  er kodenavnet for en GPU -mikroarkitektur udviklet af Nvidia som en efterfølger til Kepler -mikroarkitekturen . Maxwell-arkitekturen blev introduceret i senere modeller af GeForce 700-serien og bruges også i GeForce 800M-serien , GeForce 900-serien og Quadro Mxxx-serien. Nvidia tog Kepler som grundlag for den nye Maxwell-arkitektur og forfinede den på flere områder. I Maxwell-arkitekturen er SMX streaming multiprocessoren blevet omdøbt til SMM ( Streaming Maxwell Multiprocessor ), opdelt i fire blokke med 32 stream-processorer. I alt indeholder SMM-klyngen 128 stream-processorer. Mindre kompleks kontrollogik sikrer en mere effektiv fordeling af opgaver på tværs af CUDA -kerner . Spånarealet steg med 25 % fra 118 mm² til 148 mm². Samtidig steg antallet af transistorer fra 1,3 milliarder til 1,87 milliarder, en stigning på 44 %. Årsagen ligger i ændringen i chippens layout.

Mikroarkitekturen er opkaldt efter James Clerk Maxwell , grundlæggeren af ​​teorien om elektromagnetisk stråling .

Funktioner i Nvidia Maxwell-arkitekturen

Øget allokeret delt hukommelse

Maxwell-arkitekturen giver 64 KB distribueret (registreret) hukommelse, mens denne hukommelse i Fermi eller Kepler er delt mellem L1-cachen og distribueret hukommelse. I Maxwell kan en blok bruge op til 48 KB distribueret hukommelse, og en stigning i den samlede mængde af denne hukommelse kan føre til en stigning i belastningen af ​​multiprocessoren. Dette blev gjort muligt ved at kombinere funktionaliteten af ​​L1-cachen og teksturcachen i en separat blok.

Hurtigere atomoperationer i delt hukommelse

Maxwell-arkitekturen introducerede indbyggede atomoperationer på 32-bit heltal i distribueret hukommelse, såvel som CAS-operationer på 32-bit og 64-bit værdier i hukommelsen - de kan bruges til at implementere andre atomfunktioner. I tilfældet med Kepler og Fermi skulle der anvendes et kompliceret Lås/Opdater/Unlock princip, hvilket medførte ekstra omkostninger.

Dynamisk samtidighed

Dynamisk parallelisme, introduceret med Kepler GK110, gør det muligt for GPU'en at skabe opgaver for sig selv. Understøttelse af denne funktion blev først tilføjet i CUDA 5.0, hvilket tillader tråde på GK110 at køre yderligere kerner på den samme GPU.

Fliselagt gengivelse

For første gang for Nvidia og GeForce-serien af ​​videokort er flisegengivelsesteknologi blevet introduceret for at øge ydeevnen og reducere hukommelsesbelastningen. [1] [2] Samtidig har AMD's konkurrenter det praktisk talt ikke, denne teknologi mangler stadig på nuværende tidspunkt, den eneste undtagelse er VEGA-serien med HBM-hukommelse.

Sammenligning af Kepler og Maxwell

Egenskaber Kepler Maxwell
GPU GK107 (Kepler) GM107 (Maxwell)
CUDA-kerner 384 640
basisfrekvens 1058 MHz 1020 MHz
GPU boost frekvens n/a 1085 MHz
gigaflops 812,5 1305,6
Computeregenskaber 3.0 5,0
Distribueret hukommelse / SM 16 KB / 48 KB 64 KB
Registrer filstørrelse / SM 256 KB 256 KB
Maksimalt antal blokke 16 32
Hukommelsesfrekvens 5000 MHz 5400 MHz
L2 cache størrelse 256 KB 2048 KB
TDP 64 W 60 W
transistorer 1,3 mia 1,87 mia
Krystal område 118 mm² 148 mm²
Procesteknologi 28 nm 28 nm

efterfølger

Den næste arkitektur efter Maxwell kom under kodenavnet Pascal . [3]

Noter

  1. Hovedhemmeligheden bag effektiviteten af ​​nye NVIDIA-arkitekturer afsløres . 3DNews - Daily Digital Digest. Hentet 1. marts 2019. Arkiveret fra originalen 2. marts 2019.
  2. Tile-gengivelse - den hemmelige opskrift på Maxwell/Pascal-arkitektur . www.hardwareluxx.ru Hentet 1. marts 2019. Arkiveret fra originalen 2. marts 2019.
  3. NVIDIA-opdateringer GPU-køreplan; Annoncerer Pascal Arkiveret 25. marts 2014 på Wayback Machine // NVIDIA Official Blog, 25. marts 2014