Cluster - en gruppe af computere forenet af højhastighedskommunikationskanaler, der repræsenterer en enkelt hardwareressource fra brugerens synspunkt. En klynge er en løst koblet samling af flere computersystemer, der arbejder sammen om at udføre fælles applikationer og fremstår for brugeren som et enkelt system. En af klyngeteknologiens første arkitekter, Gregory Pfister , definerede en klynge som følger: " En klynge er en type parallelt eller distribueret system, der:
Normalt skelnes følgende hovedtyper af klynger:
De er forkortet til HA ( High Availability ) . Skabt for at sikre høj tilgængelighed af den service, der leveres af klyngen. Det redundante antal noder, der er inkluderet i klyngen, garanterer levering af service i tilfælde af fejl på en eller flere servere. Det typiske antal noder er to, hvilket er det mindste antal, der resulterer i øget tilgængelighed. Der er skabt en masse softwareløsninger til at bygge sådanne klynger.
Failover-klynger og -systemer er opdelt i 3 hovedtyper:
En bestemt teknologi kan kombinere disse principper i enhver kombination. For eksempel understøtter Linux-HA en overtagelseskonfigurationstilstand , hvor kritiske anmodninger behandles af alle noder sammen, mens andre er jævnt fordelt mellem dem. [en]
Princippet for deres drift er baseret på fordelingen af anmodninger gennem en eller flere inputknudepunkter, som omdirigerer dem til behandling til andre computerknudepunkter. Det oprindelige mål for en sådan klynge er ydeevne, men de bruger ofte også metoder, der øger pålideligheden. Lignende designs kaldes serverfarme . Software (software) kan enten være kommerciel ( OpenVMS , MOSIX , Platform LSF HPC, Solaris Cluster , Moab Cluster Suite, Maui Cluster Scheduler) eller gratis ( OpenMosix , Sun Grid Engine , Linux Virtual Server ).
Klynger bruges til beregningsformål, især i videnskabelig forskning. For computerklynger er væsentlige indikatorer høj processorydeevne i operationer med flydende kommanumre ( flops ) og lav latenstid af det samlende netværk og mindre signifikant - hastigheden af I/O-operationer, som er vigtigere for databaser og webtjenester . Computerklynger gør det muligt at reducere beregningstiden sammenlignet med en enkelt computer ved at opdele opgaven i parallelt eksekverende grene, der udveksler data over et forbindende netværk. En typisk konfiguration er et sæt computere bygget af offentligt tilgængelige komponenter, der kører Linux-operativsystemet og forbundet med Ethernet , Myrinet , InfiniBand eller andre relativt billige netværk. Et sådant system omtales almindeligvis som en Beowulf -klynge . Højtydende klynger er særligt udmærkede (Benævnt med den engelske forkortelse HPC Cluster - High-performance computing cluster ). En liste over de mest kraftfulde højtydende computere (kan også henvises til med den engelske forkortelse HPC ) kan findes på TOP500 verdensranglisten . I Rusland er der en vurdering af de mest kraftfulde computere i CIS. [2]
Sådanne systemer betragtes normalt ikke som klynger, men deres principper ligner stort set klyngeteknologi. De kaldes også netsystemer . Den største forskel er den lave tilgængelighed af hver knude, det vil sige manglende evne til at garantere dens drift på et givet tidspunkt (knudepunkter forbindes og afbrydes under drift), så opgaven skal opdeles i en række uafhængige processer. Et sådant system, i modsætning til klynger, ligner ikke en enkelt computer, men fungerer som et forenklet middel til at distribuere beregninger. Ustabiliteten af konfigurationen, i dette tilfælde, kompenseres af et stort antal knudepunkter.
Serverklynge (i informationsteknologi ) - en gruppe af servere , der er logisk kombineret, i stand til at behandle identiske anmodninger og bruges som en enkelt ressource. Oftest er servere grupperet gennem et lokalt netværk. En gruppe af servere er mere pålidelig og yder bedre end en enkelt server. Sammenlægning af servere til én ressource sker på niveau med softwareprotokoller.
I modsætning til en hardwareklynge af computere kræver klynger organiseret af software:
I de fleste tilfælde fungerer serverklynger på separate computere. Dette giver dig mulighed for at forbedre ydeevnen ved at fordele belastningen på hardwareressourcer og giver fejltolerance på hardwareniveau.
Princippet om at organisere en klynge af servere (på niveau med en softwareprotokol) giver dig dog mulighed for at køre flere softwareservere på en hardwareserver. Sådan brug kan være påkrævet:
To gange om året udgiver TOP500 -organisationen en liste over de fem hundrede mest produktive computersystemer i verden, blandt hvilke klynger ofte dominerer i de senere år. Den hurtigste klynge er IBM Roadrunner ( Los Alamos National Laboratory , USA , oprettet i 2008), dens maksimale ydeevne (i juli 2008) er 1.026 Petaflops . Det hurtigste system i Europa (i juli 2008 ) er en supercomputer, BlueGene /P er placeret i Tyskland , i forskningscentret i byen Jülich , Nordrhein-Westfalen , den maksimalt opnåede ydeevne er 167,3 Teraflops .
Klyngesystemer indtager en værdig plads på listen over de hurtigste, mens de overgår supercomputere markant i pris. Fra juli 2008 var den 7. plads i TOP500-klassificeringen SGI Altix ICE 8200-klyngen ( Chippewa Falls , Wisconsin , USA).
Et relativt billigt alternativ til supercomputere er klynger baseret på Beowulf- konceptet , som er bygget af almindelige billige computere baseret på gratis software. Et praktisk eksempel på et sådant system er Stone Soupercomputeren ved Oak Ridge National Laboratory ( Tennessee , USA, 1997).
Den største privatejede klynge (ud af 1000 processorer ) blev bygget af John Koza.
Historien om oprettelsen af klynger er uløseligt forbundet med den tidlige udvikling inden for computernetværk. En af årsagerne til fremkomsten af højhastighedskommunikation mellem computere var håbet om at samle computerressourcer. I begyndelsen af 1970'erne satte TCP/IP -protokolgruppen og Xerox PARC - laboratoriet standarder for netværk. Hydra -operativsystemet til DEC PDP-11- computere dukkede også op , klyngen oprettet på dette grundlag fik navnet C.mpp ( Pittsburgh , Pennsylvania , USA, 1971). Det var dog først omkring 1983, at mekanismer blev udviklet til nemt at dele opgaver og filer over et netværk, mest fra SunOS (det BSD -baserede operativsystem fra Sun Microsystems ).
Det første kommercielle klyngeprojekt var ARCNet , skabt af Datapoint i 1977. Det blev ikke rentabelt, og derfor udviklede klyngebyggeri sig først i 1984, hvor DEC byggede sit VAXcluster baseret på VAX/VMS -operativsystemet . ARCNet og VAXcluster blev designet ikke kun til fælles databehandling, men også til deling af filsystemet og periferiudstyr, under hensyntagen til bevarelsen af dataintegritet og entydighed . VAXCluster (nu kaldet VMSCluster ) er en integreret komponent i HP OpenVMS -operativsystemet, der bruger DEC Alpha- og Itanium-processorer .
To andre tidligt anerkendte klyngeprodukter omfatter Tandem Hymalaya (1994, klasse HA ) og IBM S/390 Parallel Sysplex (1994).
Historien om at skabe klynger fra almindelige personlige computere skylder meget til projektet Parallel Virtual Machine . I 1989 åbnede denne software til at forbinde computere til en virtuel supercomputer muligheden for at skabe øjeblikkelige klynger. Som et resultat overgik den samlede ydeevne af alle de billige klynger, der blev oprettet på det tidspunkt, summen af kapaciteten af "seriøse" kommercielle systemer.
Oprettelsen af klynger baseret på billige personlige computere forbundet med et datatransmissionsnetværk fortsatte i 1993 af det amerikanske luftrumsagentur NASA , derefter i 1995 blev Beowulf- klynger , specielt designet baseret på dette princip, udviklet. Succesen med sådanne systemer ansporede udviklingen af grid-netværk , som har eksisteret siden starten af UNIX .
Et meget brugt værktøj til at organisere inter-server-interaktion er MPI -biblioteket , der understøtter C- og Fortran -sprogene . Det bruges for eksempel i vejrsimuleringsprogrammet MM5 .
Solaris -operativsystemet leverer Solaris Cluster -softwaren , som bruges til at give høj tilgængelighed og failover for servere, der kører Solaris. Der er en open source-implementering til OpenSolaris kaldet OpenSolaris HA Cluster .
Flere programmer er populære blandt GNU/Linux- brugere:
Klyngemekanismer er planlagt til at blive indbygget i DragonFly BSD -kernen , som i 2003 udgik fra FreeBSD 4.8. I fremtiden er der også planer om at gøre det til et enkelt operativsystemmiljø .
Microsoft frigiver HA-klyngen til Windows - operativsystemet . Der er en opfattelse af, at det blev oprettet på grundlag af Digital Equipment Corporation- teknologi , understøtter op til 16 (siden 2010) noder i en klynge samt drift i et SAN (Storage Area Network). Et sæt API'er bruges til at understøtte distribuerede applikationer, der er tomme felter til at arbejde med programmer, der ikke involverer arbejde i en klynge.
Windows Compute Cluster Server 2003 (CCS), udgivet i juni 2006, er designet til avancerede applikationer, der kræver klyngedatabehandling. Udgaven er designet til at blive implementeret på flere computere, der er grupperet for at opnå supercomputerkraft. Hver klynge på Windows Compute Cluster Server består af en eller flere mastermaskiner, der distribuerer job, og flere slavemaskiner, der udfører hovedarbejdet. I november 2008 blev Windows HPC Server 2008 introduceret for at erstatte Windows Compute Cluster Server 2003.
Novell Open Enterprise Server (OES) - netværksoperativsystem, " fusion " af Novell NetWare og SUSE Linux Enterprise Server ; i stand til blandt andet at skabe blandede klynger, hvor ressourcer kan svigte fra en NetWare-server til en Linux-server og omvendt.