NvidiaTesla

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 5. oktober 2020; checks kræver 6 redigeringer .

Tesla er navnet på en familie af NVIDIA  -computersystemer baseret på CUDA - arkitektur GPU'er , der kan bruges til generel videnskabelig og teknisk databehandling. Tesla kan ikke helt erstatte den sædvanlige universelle processor , men den giver dig mulighed for at bruge computerressourcen fra mange af dens kerner til at løse en vis række ressourcekrævende opgaver (for at udføre parallel databehandling). Eksempler på sådanne opgaver er proteinfoldningssimulering, DNA- sekventering , vejrmodellering , økonomisk risikoanalyse mv.

Tesla-systemer kom først på markedet med udgivelsen af ​​NVIDIAs ottende generation af G80 -grafikchip . Tesla er bygget på basis af konventionelle grafikprocessorer, men i modsætning til videoacceleratorer har den ikke midlerne til at vise et billede på en skærm. Da Tesla er en slags coprocessor , kan Tesla bruges til at skabe computersystemer baseret på personlige computere såvel som som en del af servere og computerklynger .

NVIDIA tilbyder sit produkt til det højtydende klyngemarked og hævder, at fordelen ved heterogene computersystemer med Tesla er større energieffektivitet og lavere omkostninger (mindre alsidighed kan betragtes som en ulempe).

Specifikationer og konfigurationer

2007 Tesla-modeller baseret på G80 GPU (den eneste gruppe af kort uden understøttelse af 64-bit flydende komma -operationer ):

Tesla-modeller baseret på GT200 (2008-2009):

Tesla-modeller baseret på GF100 og GF110 (2011):

Modeller [1] fra 2012-2014 er foreslået baseret på Kepler- arkitekturen :

I 2015 blev modeller baseret på Maxwell-mikroarkitekturen introduceret :

Pascal- chips tjente som grundlag for kortene fra 2016-2017 [2] :

I 2017 dukkede en model baseret på Volta op  - Tesla V100, i form af PCIe- og NVLink-kort [2] .

I 2018 introduceres det Turing -baserede Tesla T4-kort [2] .

Beskrivelse Model Antal GPU'er Kernefrekvens, MHz shader processorer Hukommelse Teoretisk præstation, gigaflops [3] Computerevner [4] TDP , W Noter/formfaktor
Antal Frekvens, MHz Båndbredde, GB / s Videohukommelse standard Videohukommelsesbus, bit Videohukommelsesstørrelse, MB Frekvens (effektiv), MHz Enkelt præcision i alt (MUL+ADD+SF) Enkelt præcision, MAD (MUL+ADD) Dobbelt præcision, FMA
Computermodul baseret på GPU [5] C870 en 600 128 1350 76,8 GDDR3 384 1536 1600 518,4 345,6 0 1.0 170,9 ATX skærmkort
Tilsluttet supercomputer [5] D870 2 600 2×128 (256) 1350 153,6 GDDR3 384 3072 1600 1036,8 691,2 0 1.0 Fastgjort system eller stativ
Computermodul baseret på GPU [5] S870 fire 600 4×128 (512) 1350 307,2 GDDR3 384 6144 1600 2073,6 1382,4 0 1.0 1U stativ
2. generation Tesla-processorer [6] C1060 en 602 240 1300 102,4 GDDR3 512 4096 1600 933,12 622,08 77,76 1.3 187,8 ATX grafikkort
IEEE 754-2008 FMA
2. generations
GPU-computermodul [7]
S1070 fire 602 4×240 (960) 1440 409,6 GDDR3 512 16384 1600 4147,2 2764,8 345,6 1.3 Enkelt rack
IEEE 754-2008 FMA
3. generations
Tesla-processor [8]
C2050 en 575 448 1150 144 GDDR5 384 3072 [9] 3000 1288 1030,4 [10] 515,2 2.0 238 Fuld størrelse
IEEE 754-2008 FMA grafikkort
3. generations
Tesla-processor [8]
C2070 en 575 448 1150 144 GDDR5 384 6144 [9] 3000 1288 1030,4 [10] 515,2 2.0 247 Fuld størrelse
IEEE 754-2008 FMA grafikkort
M2050
GPU -computermodul
M2050 en 575 448 1150 148,4 GDDR5 384 3072 [10] 3092 1288 1030,4 [10] 515,2 2.0 225
IEEE 754-2008 FMA Compute Module
M2070/M2070Q [11]
GPU-beregningsmodul
M2070/M2070Q en 575 448 1150 150,336 GDDR5 384 6144 [10] 3132 1288 1030,4 [10] 515,2 2.0 225
IEEE 754-2008 FMA Compute Module
S2050 1U
GPU computersystem
S2050 fire 575 4×448 (1792) 1150 4×148,4 (593,6) GDDR5 384 12288 [10] 3092 5152 4121.6 [10] 2060.8 2.0 900 1U Rack
IEEE 754-2008 FMA

Se også

Noter

  1. http://www.nvidia.com/content/PDF/kepler/Tesla-KSeries-Overview-LR.pdf
  2. 1 2 3 NVIDIA-produktoversigt og teknisk kort
  3. Nvidia annoncerer Tesla 20-serien arkiveret 18. februar 2012.
  4. Hvilken hardware og software kræves til PhysX?
  5. 1 2 3 Ingen officielle data; formodes at være baseret på GeForce 8800 GTX.
  6. Ingen officielle data; formodes at være baseret på GeForce GTX 280.
  7. Forskellen mellem Tesla S1070 og S1075
  8. 1 2 Ingen officielle data; formodes at være baseret på GeForce 400-serien.
  9. 1 2 Med ECC aktiveret vil brugertilgængelig hukommelse være 2,625 GB pr. GPU for C2050, S2050 og 5,25 GB pr. GPU for C2070.
  10. 1 2 3 4 5 6 7 8 GF100 udfører den nye FMA(D) (Fused Multiply-Add) instruktion for både 32-bit enkelt præcision flydende komma- og 64-bit dobbelt præcision flydende tal (GT200 understøtter FMA-instruktionen for doubler) kun). Forskellen mellem FMA(D) og MAD (Multiply-Add) instruktionerne, når man udfører en operation som A×B+C er, at FMA(D) ikke afrunder produktets resultat før tilføjelse, hvilket giver et mere præcist resultat.
  11. NVidia Tesla M2050 & M2070/M2070Q specifikationer online

Links