Computer gå

Den aktuelle version af siden er endnu ikke blevet gennemgået af erfarne bidragydere og kan afvige væsentligt fra den version , der blev gennemgået den 24. marts 2020; checks kræver 6 redigeringer .

Computer Go  er en gren af ​​kunstig intelligens til at skabe computerprogrammer, der spiller Go .

Folk føler, at de er bedre til Go end computere, fordi de sammenligner dem med mennesker. "Måske er det ikke sådan, at computere spiller går dårligt, men folk spiller det for godt." Go, sammenlignet med andre spil med fuld information, har funktioner, der gør det særligt nemt for folk at spille. Stenene bevæger sig ikke som skakbrikker, de skifter ikke farve som i reversi. Disse funktioner giver folk mulighed for at beregne lange kæder af bevægelser, hvilket er meget svært for en maskine.

Men i de sjældne tilfælde, hvor sten gentagne gange fanges og afspilles på de samme punkter, har mennesker problemer, mens de er nemme for computere.

Forhindringer for programmer

I lang tid blev computer Go anset for at være væsentligt forskellig fra computerskak , da metoder baseret på hurtig søgning sammenlignet med menneskelig erfaring, kombineret med relativt lav domænekendskab, ikke ville være effektive for Go. Derfor er der brugt mange kræfter inden for computer Go på at kombinere ekspertviden med lokal søgning for at besvare spørgsmål om spillets taktiske karakter. Resultatet af disse bestræbelser var programmer, der var i stand til at finde gode løsninger i nogle lokale situationer, men havde åbenlyse svagheder i den overordnede bearbejdning af spillet. Derudover fik disse klassiske programmer kun lidt i form af spillekraft, da hardwaren blev mere kraftfuld, og derfor gik udviklingen på dette område generelt langsomt. Derfor mente man, at et program, der spiller godt i Go, kun kan skabes i en fjern fremtid og kun ved hjælp af generel viden inden for kunstig intelligens, der er akkumuleret på det tidspunkt. Selv at skrive et program, der kunne afgøre vinderen af ​​et gennemført spil, blev opfattet som en ikke-triviel opgave.

I 2006 dukkede programmer baseret på Monte Carlo-søgningen op . Styrken af ​​kunstig intelligens-spillet er blevet forbedret. Men forskellen i forhold til spilleniveauet for professionelle Go-spillere forblev, og en betydelig sådan.

Men i 2015 vandt et computerprogram ( AlphaGo , af DeepMind ) for første gang en lige kamp mod en professionel ( Fan Hui , 2. professionelle dan) (med en score på 5-0) [1] .

I marts 2016 besejrede AlphaGo den professionelle Lee Sedol i de første tre sæt af fem spil. [2] Dette var første gang, at en 9 dan professionel, en af ​​de stærkeste spillere i verden, spillede en computer uden handicap. [3] I det fjerde spil kunne Li vinde, men computeren vandt det femte spil, så kampen endte med en score på 4:1. [4] [5] (se detaljer: AlphaGo vs. Lee Sedol kamp )

I maj 2017 blev der på Future of Go Summit spillet en minikamp på 3 spil mellem AlphaGo og en af ​​de stærkeste spillere i verden, lederen af ​​verdensranglisten Elo Ke Jie , hvor alle kampene blev vundet af program [6] [7] [8 ] . På samme forum besejrede AlphaGo et hold på 5 9. dan-proffer ( Mi Yuting (nr. 3 i ranglisten over de stærkeste spillere, rating før kampen 3571 point), Chen Yaoye (nr. 8, 3513)) , Zhou Ruiyang (nr. 10, 3509), Xi Yue (nr. 11, 3508), Tang Weixing (nr. 18, 3474)) [9] .

Board for stor

Det store bræt (19x19, 361 kryds) nævnes ofte som en stor hindring for at opbygge stærke Go-programmer. Problemet med det store bræt er, at det forhindrer dybe alfa-beta beskæringssøgninger .

Hidtil er den største tavle, hvor der hidtil er foretaget en fuldstændig opregning af positioner, en 6x7 tavle [10] .

Stort antal juridiske træk

For at fortsætte sammenligningen med skak, skal det bemærkes, at træk i gang næsten ikke er begrænset af reglerne. Mens det første træk i skak kan udføres på tyve måder, har det første træk i Go 55 muligheder, givet brættets symmetri. Efter de første par træk i forskellige hjørner af brættet, er spilsituationens symmetri tabt, og antallet af mulige træk stiger, og når antallet af gratis point på brættet.

Mangel på "præcis" åbningsteori

Den indledende fase af spillet i go - fuseki  - adlyder visse generelle principper for udvikling af stenkonfigurationer, men det er karakteriseret ved en meget større variation af træk end i skak. Nyheder kan forekomme ikke på det 20. træk, men allerede på det tredje eller fjerde, og kompetent åbningsspil er umuligt uden at forstå de strategiske perspektiver af de konstruktioner, der optræder på tavlen. Joseki (typiske skemaer til at spille en position på en begrænset del af brættet, især i hjørnerne), som i en vis forstand kan betragtes som en analog af de udviklede skakåbninger, tillader ikke mekanisk brug og giver ikke en garanteret resultat, da effekten af ​​deres brug afhænger af den overordnede position på hele bestyrelsen, så selv at vælge den rigtige joseki til en given position i et bestemt hjørne er en vanskelig intellektuel opgave.

Ko-wrestling

Ko-reglen fører ofte til en dramatisk ændring i kampens karakter, hvis konsekvenser er svære at vurdere selv for en erfaren spiller. Faktisk er det nødvendigt hver gang at måle konsekvenserne af "ikke-reaktion" på en ko-trussel (både ens egen og modstanderens) med omkostningerne ved at tabe ko-kampen. En person er nødt til at stole på sin erfaring og intuition, mens for en computer er disse begreber svære at formalisere.

Spillets additive karakter

I skak, som i mange andre spil, er der under spillet færre brikker på brættet, hvilket forenkler optællingen af ​​træk. Tværtimod tilføjer hvert næste træk en sten til brættet (selvom det er muligt at trække sig tilbage), hvilket skaber yderligere spiløjeblikke.

Skakteknik kan ikke bruges i go

Computer Go-programmer har længe været meget svagere end skakprogrammer. De tilgange, der blev anvendt i skakprogrammer, viste sig at være middelmådige i computer Go.

Skakregler er let formaliserede og kan præsenteres for en maskine i en bekvem form, der gør det muligt for den at spille på et højt niveau.

Men de simple positionsregler, der bruges i skak, vil ikke være effektive i Go. At bestemme værdien af ​​en sten kræver kompleks analyse, om ikke andet for at afgøre, om gruppen, den tilhører, er i live, hvor stor gruppens indflydelse er, og hvilke farer der truer den.

Evalueringsfunktion

En anden udfordring er at skabe en god evalueringsfunktion til Go. Der kan være flere gode træk på hvert træk, og for at vælge det bedste træk skal computeren vurdere de forskellige mulige udfald. Dette bliver en vanskelig opgave i Go. Det kan for eksempel være muligt at erobre modstanderens sten ved at befæste sin gruppe et andet sted. At beslutte, om en sådan udveksling er gavnlig, kan virke overvældende selv for en menneskelig spiller. Det kan også vise sig, at flytning til en anden del af bestyrelsen og bygningsform der kan være vigtigere.

Kombinatorisk kompleksitet

Det nævnes nogle gange, at nogle vanskelige kombinatoriske problemer (faktisk ethvert NP-komplet problem ) kan transformeres som anvendt på Go; det samme gælder dog for andre brætspil, såsom skak, generaliseret til et bræt i vilkårlig størrelse. NP-komplette problemer kan ikke løses af mennesker hurtigere end af computere: det er tvivlsomt, om en person for eksempel er i stand til at løse Travelling Salesman Problemet på en tid, der kan sammenlignes med den, en computer løser det for. Derfor forklarer evnen til at anvende NP-komplette problemløsningsmetoder på computer Go ikke menneskers overlegenhed over computere i dette spil.

Game over

I betragtning af at slutspillet af go (yose) indeholder færre mulige træk end begyndelsen eller midten, skulle man tro, at det ville være meget nemmere for en computer at spille denne del af spillet. Men også her var der problemer:

Det er således meget vanskeligt at programmere en effektiv algoritme selv til at spille den sidste fase af Go, endsige hele spillet [11] .

Hvorfor folk spillede Go bedre end computeren

Folk føler, at de er bedre til Go end computere, fordi de sammenligner dem med mennesker. "Måske er det ikke sådan, at computere spiller går dårligt, men folk spiller det for godt" [12] . Go, sammenlignet med andre spil med fuld information, har funktioner, der gør det særligt nemt for folk at spille. Sten bevæger sig ikke som brikker i skak, ændrer ikke farve som i reversi . Disse funktioner giver folk mulighed for at beregne lange kæder af bevægelser, hvilket er meget svært for en maskine.

Men i de sjældne tilfælde, hvor sten gentagne gange fanges og afspilles på de samme punkter, har mennesker problemer, mens de er nemme for computere.

Taktisk søgning

En meget vigtig del af spillet Go, der handler om at bestemme, hvilke grupper af sten der kan overleve, og hvilke der kan fanges, er kendt som "liv og død". Den mest direkte strategi til at bestemme liv og død er at bygge et søgetræ efter bevægelser, der påvirker den pågældende gruppe, og bestemme status for gruppen i endeknuderne af det pågældende træ.

Inden for grænserne af tid og tilgængelig RAM er det dog umuligt at afgøre med fuld nøjagtighed, hvilke bevægelser der påvirker den valgte gruppe. Det er for eksempel ikke ualmindeligt i situationer, hvor en gruppes liv kun kan sikres ved at fange en anden. Dette betyder, at for at løse det aktuelle problem, skal nogle heuristika anvendes til at bestemme de træk, der skal overvejes. Som et resultat viser programmer, der spiller Go, en sammenhæng mellem den tid, der bruges på at tænke, og kvaliteten af ​​at bestemme gruppernes levedygtighed.

Præsentationsproblemet

Der er et problem med positionsrepræsentation i Go for-programmer. Hvis der er en intensiv søgning efter en flytning i færd med at tænke på en flytning, så har visningen brug for en lille mængde data, der nemt kan kopieres og ødelægges. Hvis positionsoplysningerne indeholder meget strukturerede data, vil det være svært at kopiere og sænke søgeprocessen.

Den nemmeste måde at repræsentere det på er at skabe en en- eller todimensionel matrix, som vil indeholde information om, hvilken farve sten er i hver position af feltet og muligheden for at flytte til tomme positioner.

De fleste programmer bruger dog mere rå tavleinformation til at repræsentere en position. Det kan være oplysninger om, hvordan stenene hænger sammen i hver linje, og hvordan linjerne er forbundet med hinanden, oplysninger om grupper af sten, der er i risiko for at blive fanget, og som er i live. Og selvom denne information kan udtrækkes fra en direkte repræsentation, vil det være meget hurtigere at ændre den på hver tur og overføre den i færdig form. Sådanne yderligere ændringer kræver mere information, der skal huskes og kan reducere kopieringshastigheden, så problemet med at repræsentere spilsituationen er også akut for skaberne af Go-programmer.

Alternativt kan du kun beholde én kopi af brættet, og huske ændringerne, når du foretager et træk. Dette reducerer hukommelsesomkostninger og kopieringshastighed og sparer dig for at kopiere overflødig information igen og igen. Men det skal bemærkes, at denne præsentationsform kan kræve andre tilgange til dens fortolkning end at opbevare fuldstændig information om tavlen.

Brugen af ​​ikke-direkte repræsentationer i Go løber ind i en anden faldgrube relateret til selve spillets struktur. En position i Go består af enkelte sten, der danner forskellige strukturer (grupper og sæt af grupper). Ud fra spillets strategi og taktik er repræsentationsmuligheder, der eksplicit indeholder information om strukturer og tilstande, mere nyttige. Men sådan information kan ændre sig væsentligt bogstaveligt talt ved hvert træk (f.eks. et enkelt træk, der skaber en forbindelse mellem to grupper, der har et øje hver, forvandler faktisk disse to grupper, som er truet, til én, der med garanti er i live, hvilket burde afspejles i repræsentationen som en fagforening af disse grupper). Opgaven med at ændre en kompleks repræsentation i sådanne tilfælde er i sig selv meget ikke-triviel.

Systemdesign

Nye tilgange til problemer

Historisk set har hovedtilgangen til problemet med computer Go været "god gammel AI". Senere begyndte neurale netværk at blive betragtet som et alternativ til denne tilgang . Et af de programmer, der bruger den neurale netværksalgoritme til at spille Go er WinHonte [13] .

Resultaterne af disse udviklinger inden for computer Go bruges på andre områder: kognitiv videnskab , mønstergenkendelse og maskinlæring [14] . Spilteori , en gren af ​​anvendt matematik , gælder også for computer Go [14] .

AI-systemudvikling

Det eneste, programmet skal gøre som et resultat af at tænke på flytningen, er at angive det sted, hvor den næste sten skal placeres. Men selv en så simpel beslutning er svær at acceptere på grund af den tvetydighed af holdninger, som denne formulering kan føre til. Forskellige arkitekturer er blevet tilpasset til at løse dette problem. De mest populære er baseret på brugen af ​​et søgetræ , anvendelsen af ​​Monte Carlo-metoder , oprettelsen af ​​ekspertsystemer og brugen af ​​maskinlæring . Få programmer bruger kun et af disse; de fleste kombinerer flere tilgange.

Minimax søgetræ

En af de traditionelle AI -teknikker til at skabe programmer, der spiller spil, er at bruge et minimax søgetræ . For at gøre dette skal du overveje alle hypotetisk mulige sekvenser af træk op til en vis dybde og derefter bruge evalueringsfunktionen til at estimere værdien af ​​det træk, hvorfra hver sekvens startede. Det træk, der fører til det bedste resultat, gentages på brættet, og derefter udføres den samme procedure for hvert træk af computerspilleren. Mens søgetræmetoderne har været vellykkede i skak , har de været mindre succesfulde i Go.

Det skyldes dels, at det er svært at skabe en effektiv evalueringsfunktion og dels på grund af det store antal mulige flytninger, som giver en stor forgreningsfaktor. Dette gør søgetræsteknikken for ressourcekrævende. Derfor kan programmer, der gør stor brug af søgetræer, kun spille godt på et lille 9x9-bræt, men ikke på et stort 19x19-bræt.

Der er teknikker, der kan forbedre søgetræernes ydeevne, både hvad angår hastighed og hukommelse. Metoderne alfa-beta beskæring , Finde fundamentale afvigelser , MDT-f kan reducere forgreningsfaktoren næsten uden tab af spilkraft. På samme måde giver permutationstabellen mulighed for en reduktion i genberegninger, især når den bruges i forbindelse med den iterative uddybningsmetode . For hurtig adgang til dataene i permutationstabellen er det nødvendigt at bruge hashing . Zobrist-hashing er almindelig i Go-programmer, fordi det giver et lavt antal kollisioner og giver dig mulighed for hurtigt at opdatere information om hvert træk ved kun at bruge to XOR- operationer i stedet for en fuld beregning.

Selv med disse tidsreducerende teknikker er et fuldbordssøgningstræ stadig meget langsomt. Søgningen kan accelereres ved at begrænse forgreningen endnu mere, ved ikke at overveje muligheder for træk ind i modstanderens indflydelsesområde, eller ved at vælge først og fremmest at overveje grupper af sten, der er i positionen atari . Begge disse metoder risikerer dog ikke at overveje vigtige træk, der kan ændre spillets gang.

Resultaterne af computerkonkurrencer viser, at mønstertilpasningsmetoder til trinkædeudvælgelse, kombineret med hurtig begrænset taktisk søgning (forklaret ovenfor), er tilstrækkelige til at producere et konkurrencedygtigt program. For eksempel er GNU Go konkurrencedygtig, men den bruger ikke fuldbordssøgninger.

Ekspertsystemer

Begyndere lærer ofte ved at se optegnelser af gamle spil af mestre i spillet. Der er en stærk hypotese om, at akkumulering af viden er nøglen til at skabe stærk AI. For eksempel siger Tim Kinger og David Mechner: "Vi tror, ​​at kun ved at bruge værktøjerne til at akkumulere og vedligeholde viden inden for Go, kan du skabe meget stærkere programmer, end vi har i øjeblikket." De foreslår to veje: overvejelse af generelle former og deres brug, eller overvejelse af lokale oppositioner. "...Go-software mangler stadig både kvalitet og kvantitet af viden." [femten]

Efter implementering viste brugen af ​​erfaren viden sig at være meget effektiv. Hundredvis af retningslinjer og tommelfingerregler for stærkt spil er blevet formuleret af både amatører og professionelle på højt niveau. Programmørens opgave er at tage disse heuristika , formalisere dem i maskinkode og bruge mønstertilpasning og mønstergenkendelse til at finde ud af, hvornår de skal bruges. Det er også værd at udvikle et system til at identificere den bedste løsning, når flere principper gælder på én gang.

De fleste af de relativt vellykkede resultater er baseret på Go-playing færdigheder hos de programmører, der skrev programmerne, og deres personlige gæt om mestrenes spil, og ikke på grundlag af formelle matematiske fejlberegninger; de forsøger at få computeren til at efterligne den måde, de selv spiller Go. "De fleste konkurrencedygtige programmer har krævet 5-15 års menneskelig indsats og indeholder 50-100 moduler, der beskæftiger sig med forskellige aspekter af spillet." [16]

Denne metode har indtil for nylig været den mest succesrige teknik til at producere konkurrencedygtige Go-programmer på et felt i fuld størrelse. Eksempler på programmer, der har satset mere på erfaringsbaseret viden, er Handtalk (senere kendt som Goemate), The Many Faces of Go, Go Intellect og Go++, som alle på et tidspunkt blev betragtet som det bedste Go-program i verden.

Men tilføjelsen af ​​ekspertviden svækker nogle gange programmet, fordi blot overfladisk orientering i en situation kan føre til fejl. "De bedste programmer laver normalt gode træk på masterniveau, men som alle spillere ved, kan et dårligt træk ødelægge et godt spil." [16]

Monte Carlo metoder

Et af de vigtigste alternativer til at bruge kodet viden og finde træk er Monte Carlo-metoden . Essensen af ​​denne metode er, at de første positioner vælges på det aktuelle bræt, som du kan gå til, og derefter, startende sekventielt fra hver af dem, spilles et stort antal tilfældige spil. Den position, der giver det højeste forhold mellem gevinster og tab, vælges til næste tur. Fordelene ved denne metode er, at den kræver meget lidt viden om problemdomænet og ikke kræver meget hukommelse. Denne metode har dog også åbenlyse ulemper. På grund af det faktum, at træk er genereret tilfældigt, og ikke alle mulige fortsættelser tages i betragtning, vil nogle træk fejlagtigt blive bedømt som gode. Selvom det tilfældige udvalg af fortsættelser vil være gunstigt, kan modstanderen have nogle få, men ret indlysende træk, der vil tillade ham at opnå en fordel. Disse træk vil enten ikke falde ind i stikprøven, eller også vil antallet af gode fortsættelser være større. Resultatet er et program, der er stærkt strategisk, men taktisk svagt. Dette problem kan afhjælpes ved at tilføje en vis ekspertise og dybere søgning. Monte Carlo-programmer omfatter Zen , The Many Faces of Go v12 , Leela , MoGo , Crazy Stone [17] , Olga og Gobble.

I 2006 blev der udviklet en ny teknik, øvre tillidsgrænser anvendt på træer [18] , som bruges i mange programmer til at spille Go på et 9x9-bræt med fremragende resultater. UCT-teknikken har sammen med mange andre optimeringsteknikker til at spille på et 19x19-bræt gjort det muligt for MoGo at blive et af de stærkeste programmer. UCT-teknikken til at spille på et 19x19-bræt bruges af følgende programmer: MoGo, Crazy Stone, Mango . MoGo vandt 2007 Computer Olympiad og vandt et af tre blitzkampe mod Guo Juan [1] , 5. Dan. I 2008 vandt The Many Faces of Go Computer Olympiad efter at have tilføjet UCT til sin ekspertvidenbaserede mekanisme.

I 2008 vandt MoGo et af tre spil [19] mod Catalina Taranu , 5 pro-dan, på et 9x9-bræt med standardtid (30 minutter pr. spil pr. spiller). MoGo blev lanceret på en klyngecomputer (32 noder med 8 kerner ved 3 GHz). Disse resultater blev godkendt af det franske Go Federation [20] . MoGo spillede også på et 19x19-bræt mod den samme Catalina Taranu og tabte med et forspring på 9 sten. Det er dog værd at bemærke, at programmet spillede stærkt og tabte simpelthen på grund af dårlige ko-fight-valg i slutningen af ​​spillet, hvor computere traditionelt er svage.

Den 7. august 2008 vandt MoGo et 19x19 brætspil mod Kim MyungWan, 8p, med et 9-stens forspring med 1,5 point. Kim brugte 13 minutter på at tænke, mens MoGo brugte omkring 55, men han følte, at det ikke ville hjælpe ham med at vinde at bruge mere tid. MoGo blev lanceret fra Holland på en 800-node supercomputer indeholdende 4 kerner pr. node, 4,7 GHz og 15 Teraflops ydeevne . [21] . Myeonghwan og MoGo spillede fire kampe med forskellige handicap og tidsgrænser og vandt to kampe hver. Spilrapporter er tilgængelige på KGS [22] , hvor MoGo spillede under navnet MogoTitan.

I februar 2009 scorede MoGo en endnu større sejr - med et handicap på 7 sten besejrede hun 9. dan-spilleren Jun-Xun Zhou, og med et handicap på 6 sten brød modstanden fra 1. dan-spilleren Li-Chen Chien [23] .

I begyndelsen af ​​2012 havde CrazyStone [24] , baseret på samme Monte Carlo-metode som MoGo, en stabil 5 dan på KGS-serveren [25] .

I december 2010 nåede Zen-computerprogrammet 4. dan-niveau på KGS-serveren. Zen-programmet blev skabt af den japanske programmør Yoji Ojima. I juni 2011 nåede computerprogrammet Zen19d niveauet 5 dan på KGS-serveren og spillede med en hastighed på 15 sekunder pr. Denne version af programmet kørte på en 26-core computer. I marts 2012 nåede computerprogrammet Zen19D niveauet 6 dan på KGS-serveren og spillede med en hastighed på 15 sekunder pr. Denne version af programmet kørte på en 28-core computer [26] .

I marts 2012 vandt Zen19D 9 dan med 4 handicap sten mod Takemiya Masaki . Til denne kamp brugte vi en klynge af 4 computere (dobbelt 6-core Xeon X5680/4.2 GHz, 6-core Xeon W3680/4 GHz og to 4-core i7 920/3.5 GHz) forbundet via GbE LAN. Det samme udstyr bruges til Zen19S og Zen19D på KGS-serveren [27] .

Maskinlæring

Vidensbaserede programmer til at spille Go er meget effektive, men deres vidensniveau er tæt forbundet med niveauet for deres programmører og relaterede domæneeksperter. Dette problem kan omgås ved at bruge maskinlæringsmetoder , som gør det muligt for programmet at generere mønstre og adfærdsstrategier, som ikke er indbygget i det på forhånd.

Grundlæggende er denne tilgang implementeret ved hjælp af neurale netværk eller genetiske algoritmer , som giver dig mulighed for enten at finde den rigtige situation i en stor database af spil eller spille mange spil mod dig selv eller andre programmer eller mennesker. Velkendte programmer, der bruger neurale netværk, er NeuroGo og WinHonte.

Konkurrencer blandt computerprogrammer, der spiller go

Der er flere velkendte årlige konkurrencer blandt computerprogrammer, der spiller Go, hvoraf den mest berømte er Computer Olympiad. Der afholdes regelmæssige og mindre formelle konkurrencer på KGS (månedligt) og CKS (løbende).

De mest berømte Go-playing-programmer omfatter den nordkoreanske sølvstjerne KCC Igo, Handtalk (af Chen Zhixing), GoPlusPlus (Michael Reiss) og David Fotlands Many Faces of Go. GNU Go  er gratis software, der også har vundet computerkonkurrencer.

Historie

De første computer go-konkurrencer blev sponsoreret af USENIX. De blev afholdt i 1984-1988. Disse konkurrencer lancerede Nemesis, det første konkurrencedygtige Go-spilprogram fra Bruce Wilcox og David Fotlands G2.5, som senere skulle udvikle sig til Cosmos og The Many Faces of Go.

Et af de tidligste incitamenter til computer Go-udvikling var Ing Cup, en relativt stor pengepræmiekonkurrence sponsoreret af den taiwanske bankmand og Ing Cup- grundlægger Ing Chang-ki, der blev afholdt hvert fjerde år fra 1988 til 2000. Vinderen af ​​denne turnering fik lov til at udfordre de unge professionelle i et handicapspil med kort tid. Hvis programmet vandt, blev dets forfatter tildelt en pengepræmie, og der blev sat en ny præmie for sejren for en professionel med et lavere handicap. ing-præmierne skulle slutte 1) i 2000 2) da programmet slog en 1. professionel dan-spiller i et lige spil (NT $ 40.000.000 ). Den sidste vinder var Handtalk i 1993, der modtog NT$250.000 for at slå 8-9-årige professionelle med 11 sten. I 2000 forblev præmien på NT$400.000 for at slå en professionel med et handicap på 9 sten uopkrævet [28] .

Overraskende nok er Japan først for nylig begyndt at sponsorere sine egne computer Go-mesterskaber. FOST Cup-konkurrencen blev afholdt årligt fra 1995 til 1999 i Tokyo. Den blev afløst af Gifu Challenge, der blev afholdt årligt fra 2003 til 2006 i Ogaki, Gifu Prefecture .

I oktober 2015 besejrede AlphaGo , udviklet af DeepMind , den tredobbelte europamester Fan Hui (2. professionel dan) i en fem-kamps kamp med en score på 4-1. Dette er første gang i historien, at en computer har slået en professionel i gang i et lige spil [1] [29] [30] .

I marts 2016 besejrede AlphaGo den niende danprofessionelle Lee Sedol i fire ud af fem kampe. [2]

I maj 2017, på Future of Go Summit , vandt AlphaGo tre spil ud af tre i en minikamp med en af ​​de stærkeste spillere i verden, verdenslederen Elo Ke Jie [6]

Problemer med at spille computer med computer

Når to computere spiller Go mod hinanden, bør det ideelle billede af spillet være menneske-til-menneske. Dette er dog svært at opnå, især i det sene spil. Hovedproblemet er, at programmet ikke kan føre en dialog med fjenden. Så hvis der er nogen uenighed om gruppernes status, så er der ingen måde for programmerne at løse dem. En måde at løse dette problem på kunne være at introducere en menneskelig dommer eller et højt specialiseret softwaremiljø til at evaluere den endelige stilling. En alternativ metode er at lade programmerne foretage træk, indtil statussen for alle omstridte grupper er endeligt fastlagt. Den største hindring for implementeringen af ​​denne løsning er, at i nogle varianter af reglerne for Go (for eksempel de japanske regler), bliver spillere straffet for ekstra træk og mister point. Derfor er der en risiko for, at programmet, efter at have tvivlet på sin fordel, taber efter at have udspillet vindersituationen.

Se også

Noter

  1. 1 2 David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre. Mestring af spillet Go med dybe neurale netværk og træsøgning   // Nature . — 2016-01-28. — Bd. 529 , udg. 7587 . — S. 484–489 . — ISSN 0028-0836 . - doi : 10.1038/nature16961 . Arkiveret fra originalen den 24. september 2019.
  2. 1 2 Kunstig intelligens: Googles AlphaGo slår Go-mester Lee Se-dol . BBC News Online (12. marts 2016). Hentet 12. marts 2016. Arkiveret fra originalen 11. august 2021.
  3. Googles DeepMind besejrer den legendariske Go-spiller Lee Se-dol i historisk sejr . www.theverge.com. Hentet 9. marts 2016. Arkiveret fra originalen 11. august 2021.
  4. Kunstig intelligens: Go mester Lee Se-dol vinder mod AlphaGo-programmet . BBC News Online (13. marts 2016). Hentet 13. marts 2016. Arkiveret fra originalen 5. maj 2021.
  5. Googles AlphaGo AI slår Lee Se-dol igen for at vinde Go-serien 4-1 . Randen . Hentet 15. marts 2016. Arkiveret fra originalen 15. marts 2016.
  6. 1 2 AlphaGo-programmet slog den stærkeste Go-spiller med en score på 3-0 , INTERFAX.RU (27. maj 2017). Arkiveret fra originalen den 11. august 2021. Hentet 27. maj 2017.
  7. Verdensmesteren i spillet go tabte tre kampe i træk til et computerprogram , Lenta.Ru onlineudgave (27. maj 2017). Arkiveret fra originalen den 11. august 2021. Hentet 27. maj 2017.
  8. Anton Baboshin. Rise of the Machines. Googles idé slog lederen af ​​verdensranglisten . "Sport-Express" (27. maj 2017). Hentet 27. maj 2017. Arkiveret fra originalen 26. februar 2019.
  9. Go Ratings . Hentet 29. maj 2017. Arkiveret fra originalen 15. august 2021.
  10. Sammenligning af Go board-formater (utilgængeligt link) . Hentet 24. juni 2009. Arkiveret fra originalen 27. januar 2011. 
  11. Se Computer Go-programmering arkiveret 15. august 2006 på Wayback Machine -siderne på Senseis bibliotek
  12. Raiko, Tapani: "The Go-Playing Program Called Go81" Arkiveret 11. oktober 2010 på Wayback Machine sektion 1.2
  13. WinHonte 2.01 (downlink) . Hentet 24. juni 2009. Arkiveret fra originalen 3. juli 2007. 
  14. 1 2 Müller, Martin. Computer Go  (utilgængeligt link) , Artificial Intelligence 134 (2002): p150
  15. Müller, Martin. Computer Go  (utilgængeligt link) , Artificial Intelligence 134 (2002): s151
  16. 1 2 Müller, Martin. Computer Go  (utilgængeligt link) , Artificial Intelligence 134 (2002): s148
  17. Crazy Stone . Hentet 24. juni 2009. Arkiveret fra originalen 29. oktober 2007.
  18. UCT . Hentet 24. juni 2009. Arkiveret fra originalen 7. juli 2021.
  19. Arkiveret kopi (link ikke tilgængeligt) . Hentet 24. juni 2009. Arkiveret fra originalen 28. maj 2009. 
  20. Fédération Française de Go . Hentet 24. juni 2009. Arkiveret fra originalen 13. august 2021.
  21. Senseis bibliotek: MoGo . Hentet 24. juni 2009. Arkiveret fra originalen 15. maj 2021.
  22. KGS spilarkiver . Hentet 24. juni 2009. Arkiveret fra originalen 11. august 2021.
  23. Maskinsindet ramte en mand i gang (utilgængeligt link) . Hentet 24. juni 2009. Arkiveret fra originalen 19. juni 2009. 
  24. CrazyStone på Senseis bibliotek . Hentet 30. juni 2012. Arkiveret fra originalen 16. juli 2009.
  25. KGS Go Server Rank Graph . Hentet 30. juni 2012. Arkiveret fra originalen 11. august 2021.
  26. Senseis bibliotek KGS-botvurderinger . Hentet 4. januar 2013. Arkiveret fra originalen 6. maj 2021.
  27. Zen computer Go-programmet slår Takemiya Masaki med kun 4 sten! (utilgængeligt link) . Dato for adgang: 4. januar 2013. Arkiveret fra originalen 20. januar 2013. 
  28. World Computer Go Championships . Hentet 24. juni 2009. Arkiveret fra originalen 24. september 2015.
  29. Kunstig intelligens besejrer den professionelle Go-spiller for første gang . Meduza. Dato for adgang: 27. januar 2016. Arkiveret fra originalen 4. februar 2016.
  30. AlphaGo: Mestring af det gamle spil Go med Machine Learning . research blog. Dato for adgang: 27. januar 2016. Arkiveret fra originalen 1. februar 2016.

Videnskabelige artikler (engelsk)

Websteder dedikeret til computer go

Computerprogrammer

  • AYA af Hiroshi Yamashita
  • Crazy Stone af Remi Coulom
  • GNU Go , det stærkeste open source Go-program
  • Go++ af Michael Reiss (sælges som Strongest Go eller Tuyoi Igo i Japan)
  • Go Intellect af Ken Chen
  • Handtalk/Goemate, udviklet i Kina af Zhixing Chen (sælges som Shudan Taikyoku i Japan)
  • Haruka af Ryuichi Kawa (sælges som Saikouhou i Japan)
  • Indigo af Bruno Bouzy
  • Katsunari af Shin-ichi Sei
  • KCC Igo, fra Nordkorea (sælges som Silver Star eller Ginsei Igo i Japan)
  • Leela , det første Monte Carlo-program til salg til offentligheden
  • The Many Faces of Go af David Fotland (sælges som AI Igo i Japan)
  • MoGo af Sylvain Gelly; parallel version [2] af mange mennesker.
  • Smart Go af Anders Kierulf, opfinder af Smart Game Format