NAS parallelle benchmarks

NAS parallelle benchmarks
Type	industrielt benchmark
Udvikler	NASA Advanced Supercomputing Division
Skrevet i	Fortran, C
Første udgave	1991 ( 1991 )
Hardware platform	på tværs af platforme
nyeste version	3.4
Internet side	nas.nasa.gov/Software/NP...

NAS Parallel Benchmarks er et sæt benchmarks designet til at teste funktionerne i meget parallelle supercomputere . De blev udviklet i begyndelsen af 1990'erne af NASAs numeriske aerodynamiske simuleringsprogram [1] og vedligeholdes af NASA Advanced Supercomputing (NAS) Division, der er placeret på NASA Ames Research Center .

Historie

Benchmark- pakker tidligere end NPB, såsom Livermore loops , LINPACK Benchmark og NAS Kernel Benchmark Program , var målrettet mod vektorcomputere. Mange af disse blev hurtigt utilstrækkelige, til dels på grund af begrænsningerne forbundet med tuning-induceret parallelisme og den utilstrækkelige størrelse af problemerne, der ikke passede til parallelle systemer. Industrielle applikationer, der kører i præstationsevalueringstilstand, var også dårligt egnede til dem på grund af de høje omkostninger ved at portere dem til et parallelt system og umuligheden af automatisk at parallelisere dem til store systemer.

NAS Parallel Benchmarks testsuite blev udviklet i 1991-1992 hos NASA Ames [1] . Formålet med at lave en testpakke var at evaluere supercomputeres ydeevne på få timer. Pakken inkluderer beregningsmæssige kerner, der oftest optrådte i den numeriske simulering af et rumfartøjs flyvning til løsning af problemer med hydro- og aerodynamik [1] .

Oprindeligt skabte skaberne af NPB et sæt regler og anbefalinger til implementering af test, specificering af acceptable programmeringssprog, algoritmer, datadimensioner, begrænsninger for parallelisering, organisering af datainput og -output, måling af tid og publicering af resultater. Den første udgivne version, NPB 1, definerede 8 tests (EP, MG, CG, FT, LU, SP, BT [2] ) og gav implementeringseksempler i Fortran 77 [3] .

Derefter skrev de en offentligt tilgængelig softwareimplementering, som modtog version 2.0 (1995-1996 [4] ). I version 2.3 (1997) og 2.4 (2002) blev NPB-pakken suppleret med en variant paralleliseret ved hjælp af MPI-standarden.

I version NPB 3 blev implementeringer tilføjet med OpenMP parallelisering, samt i Java og High Performance Fortran .

Tests

I version 3.3 indeholder NPB 3.3-pakken 11 tests.

Prøve	Fulde navn [5]	Udseende version	Beskrivelse [5]	Bemærkninger
MG	M ulti G rid - flere gitter	NPB 1 [2] [5]	Approksimation af løsningen til den tredimensionelle diskrete Poisson-ligning ved hjælp af V-Cycle Multigrid-metoden
CG	C onjugate G radient — konjugeret gradient		Approksimation til den mindste egenværdi af en stor sparsom symmetrisk positiv-definit matrix ved hjælp af invers iteration sammen med den konjugerede gradientmetode som en rutine til løsning af SLAE
FT	Hurtig Fourier - transformation — Hurtig Fourier-transformation		Løsning af en 3D PDE med Fast Fourier Transform (FFT)
ER	Heltalssortering - sortering af heltal		Sortering af små heltal ved hjælp af lommesortering [6]
EP	Pinligt parallelt - Ekstremt parallelt		Generering af uafhængige normalfordelte stokastiske variabler ved hjælp af en:Marsaglia polar metode
BT	B lås T ridagonal		Løser et syntetisk system af ikke-lineære differentialer. partielle differentialligninger (3-dimensionelt system af Navier-Stokes-ligninger for en komprimerbar væske eller gas) ved hjælp af tre algoritmer: et blok tridiagonalt skema med alternerende retningsmetoden (BT), et skalært fem-diagonalt skema (SP) og en symmetrisk successiv over-relaxation-metode (SSOR-algoritme, LU-problemet).	BT-testen har en undertype med høj I/O-intensitet [7] Alle tre versioner af testen har multi-zone muligheder [8]
SP	S calar P entadiagonal [9] — Scalar pentadiagonal
LU	Nedre - Øvre ekspansion ved hjælp af den symmetriske Gauss - Seidel metode [9]
U.A.	Ustruktureret A daptiv [ 10] — Ustruktureret adaptiv	NPB 3.1 [11]	Løsningen af varmeligningen under hensyntagen til diffusion og konvektion i en terning. Varmekilden er mobil, gitteret er uregelmæssigt og skifter hvert 5. trin. [12]	Brugt 3D mørtel metode
DC	Data C ube - operatør - operator "datakube" [ 13]	NPB 3.1 [11]
DT	Datatrafik [ 11] [ 14] - datatrafik	NPB 3.2 [11]	Simulering af dataudvekslinger mellem kildenoder, processornoder og forbrugernoder	Kun MPI-version

Litteratur

Weeratunga, D.; Barscz, E.; Barton, J. & Browning, D. (marts 1994), The NAS Parallel Benchmarks , NAS Technical Report RNR-94-007 , NASA Ames Research Center, Moffett Field, CA
Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (december 1995), " The NAS Parallel Benchmarks 2.0 ", NAS Technical Report NAS-95-020, NASA Ames Research Center, Moffett Field, CA.

Noter

↑ 1 2 3 A. N. Svistunov. Afsnit "Performanceevaluering af klyngesystemer". 2.2. NAS parallelle benchmarks . Uddannelseskursus "Teknologier til opbygning og brug af klyngesystemer" . Nizhny Novgorod State University N. I. Lobachevsky (2007). Hentet 8. januar 2015. Arkiveret fra originalen 20. maj 2017. (ubestemt)
↑ 1 2 David H Bailey, The NAS Parallel Benchmarks Arkiveret 5. marts 2016 på Wayback Machine // David Padua, red., Encyclopedia of Parallel Computing, Springer, nov 2009.
↑ Baily, D.; Barscz, E.; Barton, J.; Browning, D.; Carter, R.; Dagum, L.; Fatoohi, R.; Fineberg, S.; Frederickson, P.; Weeratunga, S. (marts 1994), " The NAS Parallel Benchmarks Archived December 22, 2016 at the Wayback Machine ", NAS Technical Report RNR-94-007, NASA Ames Research Center, Moffett Field, CA.
↑ Bailey, D.; Harris, T.; Saphir, W.; van der Wijngaart, R.; Woo, A.; Yarrow, M. (december 1995), " The NAS Parallel Benchmarks 2.0 ", Arkiveret 2011-09-27 , NAS teknisk rapport NAS-95-020, NASA Ames Research Center, Moffett Field, CA.
↑ 1 2 3 Weeratunga, D.; Barscz, E.; Barton, J. & Browning, D. (marts 1994), The NAS Parallel Benchmarks , NAS Technical Report RNR-94-007 , NASA Ames Research Center, Moffett Field, CA Arkiveret 22. december 2016 på Wayback Machine
↑ Saphir, W.; van der Wijngaart, R.; Woo, A. & Yarrow, M., Nye implementeringer og resultater for NAS Parallel Benchmarks 2 Arkiveret 6. februar 2017 på Wayback Machine
↑ Wong, P. & van der Wijngaart, R. (januar 2003), NAS Parallel Benchmarks I/O Version 2.4 , NAS Technical Report NAS-03-002 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen
↑ van der Wijngaart, R. & Jin, H. (juli 2003), NAS Parallel Benchmarks, Multi-Zone Versions , NAS Technical Report NAS-03-010 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen
↑ 1 2 van der Wijngaart, R. (oktober 2002), NAS Parallel Benchmarks Version 2.4 , NAS Technical Report NAS-02-007 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 på Wayback Machine
↑ Feng, H.; van der Wijngaart, F.; Biswas, R. & Mavriplis, C. (juli 2004), Unstructured Adaptive (UA) NAS Parallel Benchmark, Version 1.0 , NAS Technical Report NAS-04-006 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 kl. Wayback- maskinen
↑ 1 2 3 Ændringer i NAS parallelle benchmarks (link ikke tilgængeligt) . NASA Advanced Supercomputing Division. Hentet 17. marts 2009. Arkiveret fra originalen 3. maj 2012. (ubestemt)
↑ http://www.exascale.ru/shmem.pdf (utilgængeligt link) ; Alternative programmeringsmodeller for højhastighedskommunikationsnetværk Arkiveret 4. marts 2016 på Wayback Machine , Korzh A. A., NICEVT, s. 31.
↑ Frumkin, M. & Shabanov, L. (september 2004), Benchmarking Memory Performance with the Data Cube Operator , NAS Technical Report NAS-04-013 , NASA Ames Research Center, Moffett Field, CA Arkiveret 27. september 2011 på Wayback-maskinen
↑ Communication Intensive Grid Benchmark DT (utilgængeligt link) // NASA Ames, 2004.

NAS parallelle benchmarks

Historie

Tests

Litteratur

Noter

Links