AlphaGo vs. Lee Sedol (eller Google DeepMind Challenge Match ) var en go - kamp mellem 9. og 15. marts 2016 mellem Google DeepMinds AlphaGo- computerprogram og Lee Sedol , en koreansk 9-dan professionel . Der blev spillet i alt 5 kampe. Spillet blev spillet efter kinesiske regler, værdien af komi var 7,5 point. Tidskontrollen er klassisk - hver spiller får to timer og 3 byoyomi på 60 sekunder pr. spil. AlphaGo brugte 1920 CPU'er og 280 GPU'er , der kørte i et distribueret netværk [1] . Spillene blev streamet live på YouTube [2] . Kampen endte med AlphaGos sejr med en score på 4:1 [3] [4] . Begivenheden er blevet sammenlignet med den historiske skakkamp i 1997 mellem Deep Blue og Garry Kasparov , som til en vis grad beseglede skakkens skæbne [5] [6] [7] .
Vinderen af kampen skulle modtage en belønning på $1 million; Da AlphaGo var vinderen, sagde Google DeepMind, at præmiepengene ville blive doneret til velgørende formål, herunder UNICEF og go-to-organisationer [8] . Lee Sedol modtog $170.000 ($150.000 for deltagelse og yderligere $20.000 for at vinde et af spillene) [9] .
Efter at have vundet kampen tildelte Korea Paduk Association AlphaGo den højeste go-rangering, "æres 9. dan ", for programmets "oprigtige indsats" for at mestre spillet [10] .
Go er et komplekst brætspil, der foruden logik kræver brug af intuition, kreativ og strategisk tænkning [11] [12] . I lang tid var det ekstremt svært at lære computerprogrammer at spille Go på niveau med en stærk amatør [13] . I forhold til skak får kunstig intelligens flere opgaver, hvis løsning kræver efterligning af den menneskelige tankeproces [14] . Tilbage i 1965 skrev matematikeren Irving John Goode :
Gå på computeren? - For at programmere en computer til at spille et meningsfuldt spil Go, og ikke bare spille efter reglerne, er det nødvendigt at formalisere principperne for en god strategi eller lave et læringsprogram. Principperne i spillet go er bedre og mere mystiske end skak og afhænger mere af værdivurderinger. Derfor mener jeg, at det er endnu meget sværere at skabe et computerprogram, der spiller Go intelligent, end et skakprogram [15] .
Indtil 2015 [16] kunne de bedste Go-programmer kun nå niveauet for amatør dan [17] . Computeren klarede sig bedre på 9x9-brættet, hvor nogle programmer var i stand til at udkonkurrere professionelle spillere. Før fremkomsten af AlphaGo hævdede nogle udviklere, at computere aldrig ville være i stand til at slå de bedste menneskelige spillere [18] . Elon Musk , en af Deepminds tidlige investorer, sagde i 2016, at kunstig intelligens ifølge eksperter er 10 år væk fra at slå de bedste professionelle spillere [19] .
AlphaGos kamp mod Lee Sedol kan sammenlignes med skakkampen fra 1997 mellem Deep Blue-programmet og Garry Kasparov , hvor IBM-programmets sejr over den regerende mester blev det symbolske udgangspunkt for en ny æra, hvor computere overgik mennesker i skak [20 ] .
AlphaGo har betydelige forskelle fra sine forgængere programmer. Den bruger neurale netværk , hvor heuristiske estimater ikke er baseret på specifikke værdier af variabler kodet af mennesker, men i vid udstrækning udvindes af programmet selv, gennem titusinder af visninger af spillede spil og egne spil med sig selv [16] [21 ] [22] . Selv AlphaGo-udviklingsteamet er ikke selv i stand til at specificere, hvordan AlphaGo vurderer positionen i spillet og vælger sit næste træk [23] . Monte Carlo-metoden er også blevet en af de vigtigste måder at øge programmets effektivitet i valg af træk. Ved oprettelsen af programmet blev der brugt data fra teorien om mønstergenkendelse og maskinlæring [16] .
I begyndelsen af 2016 blev der offentliggjort materialer om, at AlphaGo i oktober 2015 besejrede den tredobbelte europæiske Go-mester Fan Hui (2. professionel dan) med en score på 5-0; således besejrede kunstig intelligens for første gang en professionel spiller på et 19x19-bræt uden handicap [24] [25] . Nogle eksperter pegede på et stærkt hul i spilleniveauet mellem Fan Hui og Li Sedol, ejeren af den højeste rang - 9. professionelle dan og mange titler vundet [26] . Tidligere var computerprogrammerne Zen og Crazy Stone i stand til at besejre professionelle spillere med et forspring på fire eller fem sten [27] [28] . Den canadiske spilteori- og kunstig intelligensforsker Jonathan Schaeffer sammenlignede efter AlphaGos sejr over Fan Hui programmet med et "vidunderbarn", som mangler erfaring, og udtalte, at virkelige præstationer vil begynde, når programmet spiller med en rigtig topspiller; Li Sedol forudsagde sejr i kampen [25] Lee Hajin , en professionel spiller og generalsekretær for International Go Federation , sagde, at AlphaGo og Lee Sedol har lige store chancer for at vinde den kommende kamp [25] .
Efter sit nederlag udtalte Fan Hui, at takket være denne kamp begyndte han at spille bedre og begyndte at se ting i spillet, som han ikke havde lagt mærke til før; i marts 2016 var Fan Huis globale placeringer steget med omkring 300 positioner [29]
Go-eksperter fandt adskillige fejl begået af AlphaGo i kampene mod Fan Hui, især ved vurderingen af positionen på hele brættet i modsætning til individuelle taktiske øjeblikke; ved starten af kampen mod Lee Sedol var det dog ikke kendt, hvor meget programmet var blevet forbedret siden da [26] [30] . AlphaGo var ikke specifikt tunet til Lee Sedols spillestil, hvilket ville have været svært at gøre alligevel, eftersom AlphaGos "træning" involverede at se titusinder af spil; et par hundrede eller tusinde af Lee Sedols kampe var ikke nok til at ændre programmets spillestil. I stedet kiggede AlphaGo på stærke amatørspilleres spil på internetservere og spillede derefter mod sig selv; der var ingen Lee Sedol-spil i AlphaGo træningsdatabasen [31] [32] .
I et interview før kampen forudså Lee Sedol, at han nemt ville vinde med en score på 4-1 eller endda 5-0, så ville Google forfine AlphaGo i 2-3 år, hvorefter de ville tage hævn på ham. I dette tilfælde vil det være rigtig interessant at spille med en opdateret version af AlphaGo, mente Lee [33] [34] .
Lee Sedol, en professionel 9 dan go-spiller [35] , betragtes som en af de stærkeste spillere i go's historie [36] . Hans karriere begyndte i 1996, da han blev forfremmet til 1. Dan i en alder af 12, og siden da har han vundet adskillige Go-titler [37] . Lee Sedols stil er præget af uortodokse kreative bevægelser [38] . Ved at forudsige sin ubetingede sejr [38] blev Lee Sedol, et par uger før kampen, ejer af en af de vigtigste koreanske go-titler - Myeongin [39] .
AlphaGo er et computerprogram skabt af Google DeepMind . AlphaGo-algoritmen bruger en kombination af de seneste fremskridt til at finde den optimale strategi i spiltræet med de nyeste maskinlæringsteknikker kombineret med intensiv indlæring af folks spil og træning, mens man spiller med sig selv [16] . Oprindeligt blev AlphaGo trænet til at efterligne menneskelig leg ved at studere mange spil spillet af både professionelle og stærke amatører, inklusive KGS serverdatabasen med omkring 30 millioner træk fra 160 tusinde spil af spillere fra 6 til 9 og [16] [40 ] . Efter at have nået et vist niveau i strategi og taktik, skiftede programmet til at spille mod sig selv og forstærkende læring [41] . Systemet bruger ikke en database over træk. Som en af skaberne af programmet forklarede, [23] ,
Selvom vi har programmeret denne maskine, ved vi ikke, hvilken bevægelse den vil foretage. Hendes bevægelser er et emergence -fænomen , der er resultatet af træning. Vi laver blot dataserier og indlæringsalgoritmer. Men de træk, hun tyr til, er ikke i vores hænder, og meget bedre, end vi som spillere kunne vælge.
Den version af programmet, der blev brugt i kampen mod Li Sedol, brugte samme computerkraft som i kampene mod Fan Hui - 1920 CPU og 280 GPU [1] . I maj 2016 annoncerede Google , at AlphaGo brugte TPU , en processor udviklet af Google specifikt til maskinlæring, [42] [43] under træning .
Fem kampe af kampen fandt sted den 9., 10., 12., 13. og 15. marts 2016 i Seoul [44] .
Spillene blev spillet efter kinesiske regler , komi var 7,5 point; tidskontrol - 2 timers almindelig tid for hver spiller 3 byoyomi- perioder på 60 sekunder [9] . Legene blev afholdt i en lukket hal i nærværelse af tre officielle observatører, blandt dem var Fan Hui. Under spillene blev der ikke registreret hændelser, der førte til observatørers indgriben.
Kampene blev transmitteret live på YouTube sammen med livekommentarer af spillet på engelsk fra Michael Redmond [45] (den eneste ikke-asiatiske spiller med en 9 professionelle dan [46] ) og på koreansk fra Yoo Changhyuk , Song Taegon og andre Koreanske fagfolk [47] [48] [49] . Aya Huan (amatør 6-dan-spiller og medlem af DeepMind-udviklingsteamet) satte goban- sten til AlphaGo [6] . Arbejdet med programmet blev udført ved hjælp af Google Cloud Platform , serveren var placeret i USA [50] .
Udviklerne besluttede at bruge en "fast" version af programmet før hvert spil, så det brugte ikke de spil, der blev spillet i denne kamp til selvlæring og tilpassede sig ikke Lee Sedols spillestil, og redefinerede hver gang sin strategi [51] .
Vinderen af kampen modtog $1 million som belønning. Repræsentanter for Google DeepMind sagde, at hvis AlphaGo vinder, planlægger de at donere disse penge til velgørende fonde (inklusive UNICEF ) og organisationer, der er involveret i udviklingen af Go [8] . Lee Sedol modtog $150.000 for at deltage i kampen og $20.000 for sejre i individuelle sæt [8] [9] .
Spillet # | sort | hvid | Resultat | datoen | flytter sig | Tidsforbrug [ca. en] |
---|---|---|---|---|---|---|
en | Lee Sedol | Alpha Go | 0-1 (overgav sig) | 9. marts 2016 | 186 | Lee Sedol: 1 time 32 min. - AlphaGo: 1t. 55 min |
2 | Alpha Go | Lee Sedol | 1-0 (overgav sig) | 10. marts 2016 | 211 | Lee Sedol: 2 timer - AlphaGo: 2 timer. |
3 | Lee Sedol | Alpha Go | 0-1 (overgav sig) | 12. marts 2016 | 176 | Lee Sedol: 2 timer - AlphaGo: 1t. 51 min. |
fire | Alpha Go | Lee Sedol | 0-1 (overgav sig) | 13. marts 2016 | 180 | Lee Sedol: 2 timer - AlphaGo: 1t. 59 min. |
5 [ca. 2] [52] [53] | Lee Sedol | Alpha Go | 0-1 (overgav sig) | 15. marts 2016 | 280 | Lee Sedol: 2 timer - AlphaGo: 2 timer. |
Samlet score: AlphaGo - Lee Sedol: 4-1 |
I en kommentar til kampens første kamp bemærkede både Cho Hansung (9. professionel dan) og Michael Redmond , at AlphaGo havde forbedret sig markant sammenlignet med oktoberkampen mod Fan Hui [54] . Allerede på fuseki -stadiet blev det klart, at programmet spillede på niveau med de bedste menneskelige spillere; Nie Weiping (Pro 9. dan, Kina) foreslog, at AlphaGo spiller ind i kraften af 6. eller 7. dan i fuseki og 13.-15. dan i tuban [55] . Lee Sedol selv sagde efter at have tabt den anden kamp: "I går blev jeg overrasket, men i dag har jeg ingen ord" [56] . Efter Lee Sedols tredje nederlag vandt AlphaGo kampen før tidsplanen, og kommentatorerne var enige om, at der stadig var håb om en menneskelig sejr [57] . Ke Jie , som på det tidspunkt førte ranglisten over spillere og også udfordrede AlphaGo, udtalte, at han begyndte at tvivle på sin sejr over programmet [58] . Der blev bemærket fejl i spillene fra programmets side; Demis Hassabis udtalte, at de vil blive omhyggeligt analyseret, og at AlphaGo tilsyneladende "ikke kender nogle af de klassiske tesuji og laver taktiske fejl", hvilket blev klart efter kampen tabte til det, da programmet, efter Lee Sedols vigtigste vindertræk, begyndte at foretage ulogiske træk i stedet for at overgive sig [59] . Efter kampen udtalte Lee Sedol, at han var besejret mentalt, men slet ikke teknisk [60] . Programmet viste en evne til kreative løsninger, som overraskede mange spillere (for eksempel træk nummer 37 i det andet spil); nogle træk var i modstrid med den klassiske teori om Go, men de beviste deres effektivitet i kampen, nogle professionelle begyndte at bruge disse resultater i deres spil [23] . Cho Hye-young (9. professionel dan) udtalte, at hun gerne ville lære spillet fra AlphaGo, da hun "ved alt" [61] . Lee Sedol besluttede selv at ændre nogle aspekter af sit spil efter kampen [60] . Kommentatorerne under kampen var enige om, at AlphaGo lavede fejl og var sikre på, at det i sidste ende ville løbe tør for territorium for at vinde [23] , men i sidste ende førte træk, der i starten virkede svage, til en sejr [57] .
Nøglemomenter af festerUnder spillene bemærkede observatører fire exceptionelle træk, der påvirkede resultatet i spillene; Lee Sedol kommenterede dem i en række artikler i Dong-a Ilbo [62] :
Spil 1 : Trækket, der ramte Lee Sedol. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Invasion, træk 102 [63] . |
Andet spil : Et uventet kreativt træk af programmet [64] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Træk 37, et "skulderspark" afvist af klassisk spilteori. |
Tredje spil : Imponerende modangreb [57] . | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Stræk 32 udfolder angrebet i spillet. |
Spil 4 : Lee Sedol 's Divine Move. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Efter at have spillet tesuji (78. træk) , ændrede AlphaGos score sig dramatisk [65] . |
I det første spil, som fandt sted den 9. marts, vandt AlphaGo (Hvid). Lee Sedol holdt spillet under kontrol det meste af tiden, programmet udnyttede i de sidste 20 minutter, og tvang Lee til at underkaste sig [63] . Efter spillet udtalte Lee, at han lavede en kritisk fejl i begyndelsen af spillet, og at programmets strategi i spillets indledende fase var "fantastisk", og den kunstige intelligens lavede et usædvanligt træk, som en person ville spil aldrig [63] . Go Game Guru- webstedets anmelder David Omerod bemærkede, at Lee Sedols syvende træk var "et mærkeligt træk for at teste AlphaGos kraft i fuseki ", og at programmets tilbagevenden var "præcis og effektiv"; efter hans vurdering blev den første del af spillet overladt til AlphaGo, og Lee begyndte at vinde fordelen tilbage med træk 81, og lavede derefter "tvivlsomme" træk 119 og 123, efterfulgt af 129, som førte til nederlag [54] . Cho Hansung , som kommenterede spillet, bemærkede AlphaGos stærke fremgang sammenlignet med kampen mod Fan Hui i oktober 2015 [54] . Michael Redmond bemærkede, at stilen i programmet blev mere aggressiv sammenlignet med kampene mod Fan Hui [66] .
Efter Kim Sungryongs (9. professionel dan) mening var Lee Sedol chokeret over træk 102 [67] , hvorefter han tænkte på returtrækket i mere end 10 minutter [67] . Lee Sedol indrømmede nederlag i træk 186 efter omkring tre en halv times spil, selvom han stadig havde 28 minutter og 28 sekunder tilbage på sit ur [67] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Flytter 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bevæger 100-186 |
I det andet spil, som fandt sted den 10. marts, vandt AlphaGo med sort. Efter kampen udtalte Lee Sedol, at "AlphaGo viste et næsten perfekt spil" [68] og at "helt fra begyndelsen af spillet, følte han ikke et eneste øjeblik, hvor han ville være i spidsen" [69] . En af skaberne af programmet, Demis Hassabis, udtalte, at systemet var sikker på sejren fra midten af spillet, da selv de professionelle, der kommenterede spillet, ikke kunne afgøre, hvem der var foran [69] .
Michael Redmond bemærkede, at programmets 37 forløb var "kreativt" og "unik" [23] . Det tog Lee Sedol en usædvanlig lang periode at besvare det [23] . Ahn Yong-gil (8. professionel dan) beskrev træk nr. 37 som "et sjældent og spændende skulderslag", men bemærkede, at Lees tilbagevenden var "udsøgt". Han udtalte, at kontrollen over spillet var gået fra en spiller til en anden flere gange, og bemærkede især tiltagene i program nr. 151, 157 og 159, og kaldte dem "geniale" [64] .
AlphaGo afveg fra den konventionelle visdom i dette spil og viste en bredere tilgang, som Go-professionelle beskrev som tilsyneladende fejl ved første øjekast, faktisk at udføre en vidtrækkende strategi [70] . Skaberne af programmet forklarede, at AlphaGo ikke forsøger at maksimere antallet af point eller mængden af gevinster, men sandsynligheden for at vinde [23] [61] : Hvis AlphaGo skal vælge mellem at vinde 20 point med 80 % sandsynlighed eller at vinde 1 point med 99 % sandsynlighed, vil den vælge det sidste, selvom det betyder at miste point [23] . For eksempel ser det ud til, at træk 167, som giver Lee Sedol en kampchance, blev betragtet af kommentatorer som en åbenlys fejl; Ahn Yong-gil udtalte, at "når AlphaGo laver et træk, der ser svagt ud, kan vi betragte det som en fejl, men måske ville det være mere præcist at betragte et sådant træk som en sejrserklæring?" [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Flytter 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bevæger 100-199 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
flytter 200-211 |
I det tredje spil, der blev afholdt den 12. marts, vandt AlphaGo og vandt hele kampen før tidsplanen [71] .
Efter det andet spil udtrykte professionelle spillere stadig deres tvivl om, hvorvidt AlphaGo er så stærk en spiller, som en person kan være. Efter det tredje spil, ifølge analytikere, blev denne tvivl fjernet, programmets dygtighed i brydning blev bemærket - med Lee Sedols tilsyneladende alvorlige angreb, modtog han ikke fordele fra dette angreb [57] .
Ahn Yong-gil og David Omerod udtalte, at AlphaGo er "stærkere end nogen menneskelig spiller kendt af os" [57] . Det viste sig, at AlphaGo er i stand til at kontrollere situationen, når man udfører ko-fighting , hvilket tidligere blev betragtet som en væsentlig svaghed ved de fleste programmer, der spillede Go, i de foregående to spil var der ingen vigtig ko-fighting på brættet [72] . De noterede sig også programmets 148. træk - midt i en svær ko-kamp lavede AlphaGo, der havde "tillid" til at vinde kampen, et stort træk et andet sted på brættet [57] .
Li, der spillede sort, valgte High Chinese Fuseki og skabte en indflydelsessfære, som AlphaGo invaderede i træk 12, hvorefter programmet var i stand til at forsvare sin svage invaderende gruppe [57] . Ifølge An Yong-gil kan Lees 31 træk muligvis have været årsagen til hans nederlag [57] , Andy Jackson ( American Go Association ) besluttede, at spillets udfald allerede var afgjort på træk 35 [61] . Ved træk 48 havde AlphaGo overtaget kontrollen over spillet og tvunget Lee Sedol til at lave defensive træk. Lees modangreb på træk 77-79 gav ikke succes, ved træk 90 forenklede programmet positionen på brættet, hvorefter det erhvervede en stor mængde territorium på undersiden [57] . Lee forsøgte igen at starte et angreb, men programmets træk var umiskendelige. I træk 131 forsøgte han at arrangere en ko-kamp, hvilket provokerede programmet til at lave en fejl. I træk 176 sagde Lee Sedol op [57] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Flytter 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Slag 100-176 (122 i 113, 154 i , 163 i 145, 164 i 151, 166 og 171 i 160, 169 i 145, 175 i ) |
Den fjerde kamp, der blev afholdt den 13. marts, endte med Lee Sedols sejr. Ifølge Demis Hassabis lavede programmet en fejl i træk 79, da sandsynligheden for dets sejr ifølge dets egne skøn var 70 %; i det 87. træk faldt denne værdi kraftigt [73] [74] . David Omerod beskrev programbevægelserne fra 87 til 101 som typiske fejl for et program baseret på Monte Carlo-metoden [65] - søgemaskinen forsøger at afskære nogle sekvenser, der ikke er relateret til en bestemt situation; i nogle tilfælde kan dette føre til, at programmet afbryder de korrekte træk og ikke længere kan overveje dem i fremtiden [65] .
I dette spil valgte Lee Sedol amasi -strategien (territorieorienteret stil, der tillader fjenden at indtage vigtige indflydelsespunkter, men samtidig modtager spilleren selv garanteret territorium, hvorefter han kan forsøge at bryde fjendens indflydelse op) , der besluttede at vinde territorium på siderne, ikke i midten, i modsætning til AlphaGos strategi om at vinde med mange små opkøb [65] [75] . Ved at vælge en sådan strategi håbede Lee Sedol at drive modstanderen ind i en all-in situation, hvilket kunne være et sandsynligt svagt punkt i et program, hvis styrke er vurderingen af udvekslingen; i en sådan situation ville AlphaGos evne til at identificere de mindste fordele ikke have en stærk indflydelse på sandsynligheden for at vinde [65] .
De første 11 træk var identiske med begyndelsen af det andet parti, hvor Lee også spillede hvid. I fuseki-stadiet fokuserede Lee på at vinde territorium i hjørnerne og siderne af brættet, hvilket gjorde det muligt for AlphaGo at opbygge indflydelse på oversiden og i midten. Derefter invaderede Lee AlphaGos indflydelseszone (bevægelser 40-48), efter principperne for amasi . AlphaGo ofrede fire sten og greb initiativet (træk 47-69). Som svar på Lee Sedols træk fra 72 til 76 lavede programmet ingen fejl, og kommentatorerne begyndte at erklære, at spillet igen ville vise sig at være Lees nederlag, dog træk 78 (som var tesuji i denne situation) og kombinationen der fulgte det op til træk 82, vendte fuldstændigt udfaldet af spillet [65] . Trækket, som gjorde det muligt at dele modstanderen i midten, komplicerede spillet [76] . AlphaGos træk 83 og 85 var acceptable, men fra træk 87 til 101 lavede programmet en række svage, ærlig talt dårlige træk. I træk 92 tog Lee Sedol føringen af spillet, og træk 105 blev beskrevet af Ahn Yong-gil som det sidste træk, der førte til programmets nederlag; AlphaGo var ikke i stand til at vinde de tabte point tilbage og trak sig efter træk 180 [65] . AlphaGo vurderede, at hendes sandsynlighed for at vinde var mindre end 20 % [76] .
Gu Li (9. professionel dan, Kina) kaldte det 78. træk af Li Sedol for et "guddommeligt træk" (i terminologien i spillet Go - et specielt, kun sandt og genialt træk, der oftest sker "en gang i livet" på et kritisk tidspunkt af spillet) og bemærkede, at jeg absolut ikke så dette træk [65] . Ahn Yong-gil udtalte, at spillet var "Lee Sedols mesterværk og vil næsten helt sikkert blive berømt i Gos historie" [65] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Flytter 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bevæger 100-180 (177 tommer , 178 tommer ) |
Hvem der spiller sort i sidste kamp skulle ifølge kampens vilkår afgøres ved lodtrækning. På et pressemøde efter den fjerde kamp udtalte Lee Sedol dog, at han mente AlphaGo var stærkere, når han spillede med hvid, så han ville gerne spille sort i slutspillet, især da han allerede havde vundet med hvid. AlphaGo-repræsentanter var enige, så der var ingen lodtrækning [52] [53] .
I det sidste spil, der blev spillet den 15. marts, var vinderen AlphaGo (hvid) [77] . Helt til det sidste var der en ligeværdig kamp i gang i dette spil. Demis Hassabis udtalte, at programmet allerede i begyndelsen begik en grov fejl, som førte til en så lige kamp [77] .
Da han spillede sort, valgte Lee Sedol en fuseki , der ligner den, han spillede i kampens første kamp, hvorefter han skiftede til en territorial strategi, der førte til sejren i det foregående spil. Resultatet virkede jævnt indtil træk 48 til 58, hvor AlphaGo, der spillede unødvendige forcerede træk, tabte ko-trusler og aji , hvilket tillod Lee Sedol at tage føringen [78] . Michael Redmond foreslog, at programmet højst sandsynligt ikke så, at de berømte tesuji -erfarne spillere oftest kendte en sådan kombination af træk, men at programmet skulle beregne det helt fra begyndelsen [77] .
Ved det 90. træk, efter at have umiskendeligt reageret på Lee Sedols angrebstræk, genoprettede programmet balancen i spillet, hvorefter det lavede en række træk, som David Omerod kaldte "usædvanlige ... men snedigt imponerende" og tillod dem at fange en lille fordel [78] . Lee forsøgte at vinde pointene tilbage, men programmet reagerede umiskendeligt. Ahn Yong-gil fremhævede træk 154, 186 og 194. I yose -stadiet spillede AlphaGo også fejlfrit og beholdt territoriets føring, hvilket tvang Lee Sedol til at trække sig i træk 280 [78] .
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Flytter 1-99 |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bevæger 100-199 (118 i 107, 161 i ) |
| ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Slag 200-280 (240 i 200, 271 i , 275 i , 276 i ) |
Live-udsendelser af kampens kampe og deres analyse blev udført på koreansk , kinesisk , japansk og engelsk og russisk . Udsendelsen var på koreansk på Baduk TV [79] . Den første del blev kommenteret på kinesisk af Gu Li og Ke Jie for henholdsvis Tencent og LeEco med 60 millioner seere [29] . Kampen blev udsendt online på engelsk af Michael Redmond og Chris Garlock, vicepræsident for American Go Association ; det gennemsnitlige antal tilskuere var omkring 80 tusinde mennesker; det største antal tilskuere blev registreret i slutningen af 1. rate og beløb sig til 100 tusinde [80] . Analysen af spillene på YouTube blev ledet af Cho Hye -young (9. dan) og Kim Myeongwan (9. dan) [61] . I Rusland blev live-udsendelser af kampens kampe med analyse udført af 3 professionelle dan Alexander Dinershtein (1 spil) [81] [82] , Ilya Shikshin (1 professionel dan) og den flerfoldige europæiske mester blandt kvinder Natalia Kovaleva (2- 5 spil) [83] .
AlphaGos sejr var en væsentlig begivenhed inden for forskning i kunstig intelligens [84] . Tidligere blev det at lære en computer at spille Go betragtet som uden for rækkevidde af eksisterende teknologier og niveauet af deres udvikling [84] [85] [86] . De fleste eksperter var tilbøjelige til at tro, at det ville tage omkring 5 år, før AlphaGo-effektniveauprogrammet dukkede op [87] , nogle eksperter mente, at det ville tage endda 10 år, før computeren kunne besejre Go-mestrene [88] [89] . I begyndelsen af 2016 pegede de fleste forudsigelser på Lee Sedols sejr [84] .
Da computeren begyndte at slå de stærkeste menneskelige spillere i dam , skak , og nu gå, betragtes resultaterne af computerprogrammer inden for populære brætspil ikke længere som en så betydelig præstation og et vendepunkt i historien om udviklingen af kunstig intelligens sammenlignet med tidligere år; Deep Blue- udvikleren Murray Campbell kaldte AlphaGos sejr "slutten på en æra... brætspil er næsten færdige, og det er tid til at komme videre" [84] . Udviklerne af DeepMind har udtalt, at de overvejer at være vært for en StarCraft II -kamp mellem deres software og Tim Morten, en StarCraft II-mester [90] [91] . Brætspil med ufuldstændig information ( poker , bridge ) kan også blive genstand for forskning i computerprogrammers muligheder [92] [93] .
Sammenlignet med Deep Blue eller Watson er AlphaGos algoritmer designet til bredere opgaver, hvilket kan tyde på, at der også er sket fremskridt inden for generel udvikling af kunstig intelligens [94] ; AlphaGos sejr kunne være drivkraften til udviklingen af programmer med bredere mål. I marts 2016 udtalte den britiske forsker Sewart J. Russell, at "kunstig intelligens-teknikker udvikler sig meget hurtigere end forventet, hvilket gør spørgsmålet om langsigtede resultater mere relevant", og tilføjede, at "at sikre, at stadig stærkere AI-systemer forbliver, ville være under fuldstændig kontrol over mennesket ... der er meget arbejde at gøre ” [95] . Fysiker Stephen Hawking har advaret om, at fremtidige selvudviklende AI-systemer kan føre til, at mennesker uventet bliver fanget af maskiner [96] , nogle videnskabsmænd, især Jean-Gabriel Ganasia, udtalte, at "ting som 'sund fornuft'... skaber aldrig' afvise et sådant scenario [97] ; Ganasia ser ingen grund til at "tale om frygt. Tværtimod giver det håb på mange områder, for eksempel inden for sundhedspleje og rumforskning” [95] . Richard Sutton siger, at "folk ikke skal være bange ... men de skal være opmærksomme på det" [98] .
Forud for publiceringen af artiklen i tidsskriftet Nature i januar 2016, forskede flere organisationer allerede i neurale netværk for at skabe programmer, der spiller Go, især Facebook var ved at udvikle Darkforest- programmet , efterfølgende blev programkoden gjort offentligt tilgængelig [99] [100] . Efter kampen begyndte udviklingen af AphaGo-konkurrentprogrammer, blandt hvilke Deep Zen Go og Fine Art skiller sig ud.
Deep Zen Go-programmet blev tidligere udviklet under navnet Zen, men det var efter succesen med AlphaGo, at udvikleren tilføjede et element af dyb læring til Zen . I november 2016 fandt en kamp sted mellem Deep Zen Go og Japans mest betitlede spiller Cho Chikun [101] [102] . Kampen endte med mandens sejr med en score på 2: 1 [103] I marts 2017 blev "Tournament of Four" afholdt, hvor de stærkeste spillere fra Japan, Kina og Korea ( Yuta Iyama , Mi Yutin og Park Jong-hwan ) og Deep Zen Go kæmpede [104] , ifølge kampens resultater vandt computeren et spil ud af tre (mod Yuta Iyama) [105] [106] .
Fine Art-programmet er udviklet af det kinesiske firma Tencent . I marts 2017 vandt hun Software Go Championship, som dog ikke indeholdt AlphaGo; Deep Zen Go tog andenpladsen. Tidligere, i januar 2017, var Fine Art i stand til at slå den stærkeste menneskelige Go-spiller Ke Jie flere gange , som senere også spillede med AlphaGo , tabte tørt og anså yderligere spil med kunstig intelligens som meningsløse [107] .
Spillet Go, der tidligere blev betragtet som et rent asiatisk spil, ikke så almindeligt i vestlige lande, har vundet stor popularitet i forskellige lande i verden på grund af det faktum, at millioner af mennesker så og diskuterede kampen [84] . Ifølge Demis Hassabis så 280 millioner mennesker kampen, 35.000 artikler blev publiceret om den i pressen, og salget af go boards tidobledes [108] .
Mange af topspillerne bemærkede, at de træk, som programmet lavede, er ikke-standard; nogle træk virkede i starten tvivlsomme, men i løbet af spillet viste de deres effektivitet [88] . Mens spillere forsøger at lære og adoptere de bedste træk fra andre spil, laver AlphaGo sine egne originale træk [84] . AlphaGo har forbedret sig markant i forhold til kampen mod Fan Hui, men efter hans nederlag udtalte Li Sedol, at programmets spil stadig ikke er perfekt [109] [110]
Den kinesiske spiller Ke Jie , som førte verdensranglisten, udtalte før kampen, at han var i stand til at besejre AlphaGo, men ønskede ikke at spille med hende, da programmet ville begynde at "kopiere hans stil" [111] . Efter kampens første tre kampe indrømmede Ke Jie allerede, at han "kunne tabe" [112] , men efter den fjerde kamp begyndte han igen selvsikkert at tale om sin sejr og hævdede, at hvis programmets præstationer i den fjerde kamp. kamp er "dens sande styrke, så fortjener den ikke at spille med ham" [113] .
Dommeren i kampen mod Fan Hui, Toby Manning, og generalsekretæren for International Go Federation, Li Hajin , udtalte, at spillere i fremtiden vil kunne lære af computeren, finde ud af, hvor de lavede fejl i spillet, og forbedre deres spillefærdigheder [110] .
Efter kampen undskyldte Lee Sedol for sit tab og udtalte, at han "undervurderede AlphaGos evner og følte sig magtesløs" [84] . Han understregede, at udfaldet af kampen var "Lee Sedols nederlag" og ikke "menneskehedens nederlag." [96] [114] . Lee erkendte, at hans tab var uundgåeligt, men at "robotter aldrig vil forstå skønheden i spillet, som mennesker gør" [96] . Lee kaldte resultatet i den fjerde rate "en uvurderlig sejr, som han ikke ville bytte for noget" [114] . Lee Sedol udtalte, at han lærte meget af at spille med AlphaGo, og hans stil blev mere fleksibel; han indså, hvor svag menneskelig intuition kan være, og hans evner til at forudsige modstanderens næste træk blev stærkt forbedret [115] .
Den koreanske Paduk Association tildelte AlphaGo en æresrang på 9. professionel dan for "oprigtig indsats for at mestre de taoistiske grundprincipper i go og opnå et niveau af spille tæt på det guddommelige" [10] .
Efter kampens afslutning, den 17. marts 2016, meddelte repræsentanter for regeringen i Republikken Korea, at de ville investere 863 millioner dollars (1 billion koreanske won) i forskning i kunstig intelligens over de næste fem år [116]
Mange spillere udtrykte deres ønske om at blive AlphaGos næste modstander [117] , men blandt de mest sandsynlige kandidater var Ke Jie , som hævdede at vinde programmet [118] . Kampen med Ke Jie fandt sted fra 23. maj til 27. maj 2017, AlphaGo vandt alle tre spil [119] [120] [121] .
Gå | |||||
---|---|---|---|---|---|
| |||||
Beholdning | |||||
Regler |
| ||||
Spillets stadier | |||||
Terminologi | |||||
Udledninger | |||||
Organisationer | |||||
Titler | |||||
Internationale turneringer |
| ||||
Gå i kunsten |
| ||||
Andet | |||||
|