NAS parallelle benchmarks

NAS parallelle benchmarks
Type industrielt benchmark
Udvikler NASA Advanced Supercomputing Division
Skrevet i Fortran, C
Første udgave 1991 ( 1991 )
Hardware platform på tværs af platforme
nyeste version 3.4
Internet side nas.nasa.gov/Software/NP...

NAS Parallel Benchmarks  er et sæt benchmarks designet til at teste funktionerne i meget parallelle supercomputere . De blev udviklet i begyndelsen af ​​1990'erne af NASAs numeriske aerodynamiske simuleringsprogram [1] og vedligeholdes af NASA Advanced Supercomputing (NAS) Division, der er placeret på NASA Ames Research Center .

Historie

Benchmark- pakker tidligere end NPB, såsom Livermore loops , LINPACK Benchmark og NAS Kernel Benchmark Program , var målrettet mod vektorcomputere. Mange af disse blev hurtigt utilstrækkelige, til dels på grund af begrænsningerne forbundet med tuning-induceret parallelisme og den utilstrækkelige størrelse af problemerne, der ikke passede til parallelle systemer. Industrielle applikationer, der kører i præstationsevalueringstilstand, var også dårligt egnede til dem på grund af de høje omkostninger ved at portere dem til et parallelt system og umuligheden af ​​automatisk at parallelisere dem til store systemer.

NAS Parallel Benchmarks testsuite blev udviklet i 1991-1992 hos NASA Ames [1] . Formålet med at lave en testpakke var at evaluere supercomputeres ydeevne på få timer. Pakken inkluderer beregningsmæssige kerner, der oftest optrådte i den numeriske simulering af et rumfartøjs flyvning til løsning af problemer med hydro- og aerodynamik [1] .

Oprindeligt skabte skaberne af NPB et sæt regler og anbefalinger til implementering af test, specificering af acceptable programmeringssprog, algoritmer, datadimensioner, begrænsninger for parallelisering, organisering af datainput og -output, måling af tid og publicering af resultater. Den første udgivne version, NPB 1, definerede 8 tests (EP, MG, CG, FT, LU, SP, BT [2] ) og gav implementeringseksempler i Fortran 77 [3] .

Derefter skrev de en offentligt tilgængelig softwareimplementering, som modtog version 2.0 (1995-1996 [4] ). I version 2.3 (1997) og 2.4 (2002) blev NPB-pakken suppleret med en variant paralleliseret ved hjælp af MPI-standarden.

I version NPB 3 blev implementeringer tilføjet med OpenMP parallelisering, samt i Java og High Performance Fortran .

Tests

I version 3.3 indeholder NPB 3.3-pakken 11 tests.

Prøve Fulde navn [5] Udseende version Beskrivelse [5] Bemærkninger
MG M ulti G rid - flere gitter NPB 1 [2] [5] Approksimation af løsningen til den tredimensionelle diskrete Poisson-ligning ved hjælp af V-Cycle Multigrid-metoden
CG C onjugate G radient — konjugeret gradient Approksimation til den mindste egenværdi af en stor sparsom symmetrisk positiv-definit matrix ved hjælp af invers iteration sammen med den konjugerede gradientmetode som en rutine til løsning af SLAE
FT Hurtig Fourier - transformation — Hurtig Fourier-transformation Løsning af en 3D PDE med Fast Fourier Transform (FFT)
ER Heltalssortering - sortering af heltal Sortering af små heltal ved hjælp af lommesortering [6]
EP Pinligt parallelt - Ekstremt parallelt Generering af uafhængige normalfordelte stokastiske variabler ved hjælp af en:Marsaglia polar metode
BT B lås T ridagonal Løser et syntetisk system af ikke-lineære differentialer. partielle differentialligninger (3-dimensionelt system af Navier-Stokes-ligninger for en komprimerbar væske eller gas) ved hjælp af tre algoritmer: et blok tridiagonalt skema med alternerende retningsmetoden (BT), et skalært fem-diagonalt skema (SP) og en symmetrisk successiv over-relaxation-metode (SSOR-algoritme, LU-problemet).
  • BT-testen har en undertype med høj I/O-intensitet [7]
  • Alle tre versioner af testen har multi-zone muligheder [8]
SP S calar P entadiagonal [9]  — Scalar pentadiagonal
LU Nedre - Øvre ekspansion ved hjælp af den symmetriske Gauss - Seidel metode [9]
U.A. Ustruktureret A daptiv [ 10]  — Ustruktureret adaptiv NPB 3.1 [11] Løsningen af ​​varmeligningen under hensyntagen til diffusion og konvektion i en terning. Varmekilden er mobil, gitteret er uregelmæssigt og skifter hvert 5. trin. [12] Brugt 3D mørtel metode
DC Data C ube - operatør - operator "datakube" [ 13]
DT Datatrafik [ 11] [ 14] - datatrafik NPB 3.2 [11]  Simulering af dataudvekslinger mellem kildenoder, processornoder og forbrugernoder Kun MPI-version

Litteratur

Noter

  1. 1 2 3 A. N. Svistunov. Afsnit "Performanceevaluering af klyngesystemer". 2.2. NAS parallelle benchmarks . Uddannelseskursus "Teknologier til opbygning og brug af klyngesystemer" . Nizhny Novgorod State University N. I. Lobachevsky (2007). Hentet 8. januar 2015. Arkiveret fra originalen 20. maj 2017.
  2. 1 2 David H Bailey, The NAS Parallel Benchmarks Arkiveret 5. marts 2016 på Wayback Machine // David Padua, red., Encyclopedia of Parallel Computing, Springer, nov 2009.
  3. Baily, D.; Barscz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Weeratunga, S. (marts 1994), " The NAS Parallel Benchmarks Archived December 22, 2016 at the Wayback Machine ", NAS Technical Report RNR-94-007, NASA Ames Research Center, Moffett Field, CA.
  4. Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (december 1995), " The NAS Parallel Benchmarks 2.0 ", Arkiveret 2011-09-27 , NAS teknisk rapport NAS-95-020, NASA Ames Research Center, Moffett Field, CA.
  5. 1 2 3 Weeratunga, D.; Barscz, E.; Barton, J. & Browning, D. (marts 1994), The NAS Parallel Benchmarks , NAS Technical Report RNR-94-007 , NASA Ames Research Center, Moffett Field, CA Arkiveret 22. december 2016 på Wayback Machine 
  6. Saphir, W.; van der Wijngaart, R.; Woo, A. & Yarrow, M., Nye implementeringer og resultater for NAS Parallel Benchmarks 2 Arkiveret 6. februar 2017 på Wayback Machine 
  7. Wong, P. & van der Wijngaart, R. (januar 2003), NAS Parallel Benchmarks I/O Version 2.4 , NAS Technical Report NAS-03-002 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen 
  8. van der Wijngaart, R. & Jin, H. (juli 2003), NAS Parallel Benchmarks, Multi-Zone Versions , NAS Technical Report NAS-03-010 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen 
  9. 1 2 van der Wijngaart, R. (oktober 2002), NAS Parallel Benchmarks Version 2.4 , NAS Technical Report NAS-02-007 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 på Wayback Machine 
  10. Feng, H.; van der Wijngaart, F.; Biswas, R. & Mavriplis, C. (juli 2004), Unstructured Adaptive (UA) NAS Parallel Benchmark, Version 1.0 , NAS Technical Report NAS-04-006 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen 
  11. 1 2 3 Ændringer i NAS parallelle benchmarks (link ikke tilgængeligt) . NASA Advanced Supercomputing Division. Hentet 17. marts 2009. Arkiveret fra originalen 3. maj 2012. 
  12. http://www.exascale.ru/shmem.pdf  (utilgængeligt link) ; Alternative programmeringsmodeller for højhastighedskommunikationsnetværk Arkiveret 4. marts 2016 på Wayback Machine , Korzh A. A., NICEVT, s. 31.
  13. Frumkin, M. & Shabanov, L. (september 2004), Benchmarking Memory Performance with the Data Cube Operator , NAS Technical Report NAS-04-013 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 på Wayback-maskinen 
  14. Communication Intensive Grid Benchmark DT  (utilgængeligt link) // NASA Ames, 2004.

Links