AlphaZero er et (Alpha Zero) neuralt netværk udviklet af DeepMind , der bruger en generaliseret AlphaGo Zero- tilgang . Den 5. december 2017 udgav DeepMind-holdet et fortryk af AlphaZero-programmet, som efter at have trænet i 24 timer var i stand til at besejre verdensmestrene blandt skak- , shogi- og go -programmer ( Stockfish , Elmo og tredagesversionen af AlphaGo Zero, henholdsvis [1] ). Således er AlphaZero kunstig intelligens på nuværende tidspunkt det stærkeste af alle programmer til at spille shogu and go. I skak kan AlphaZero's magt ikke vurderes i øjeblikket, på grund af manglen på spil er de ikke blevet spillet siden 2017.
AlphaZero (AZ) er en mere generaliseret version af AlphaGo Zero (AGZ) algoritmen, som udover go også kan spille shogi og skak . Forskellene mellem AZ og AGZ er:
Mens traditionelle programmer evaluerer spilpositioner baseret på stormestres erfaringer, bruger AlphaZero dybe neurale netværk til at evaluere dem , hvilket kræver mere tid pr. position. AlphaZero analyserer kun 80.000 positioner i sekundet i skak og 40.000 i shogi, sammenlignet med 70 millioner for Stockfish og 35 millioner for Elmo. AlphaZero kompenserer for de lave scores i sekundet ved at bruge Monte Carlo-søgning og fokuserer dermed meget mere selektivt på de mest lovende muligheder.
I AlphaZero vs. Stockfish skakspillene havde hvert program et minuts tid pr. træk. AlphaZero havde den bedste computerhardware i forhold til Stockfish. Ud af 100 kampe fra en normal startposition vandt AlphaZero 25 kampe med hvid, 3 med sort, og rejste de resterende 72. [2]
I hundrede kampe shogi mod Elmo vandt AlphaZero halvfems gange, tabte otte gange og endte i to uafgjorte.
Efter 8 timers læring, hvordan man spiller Go på egen hånd, i kampe mod den tidligere version af AlphaZero, vandt AlphaZero tres kampe og tabte fyrre.
Nogle stormestre, såsom Hikaru Nakamura og Komodo-skaberen Larry Kaufman , har understreget, at AlphaZero's magt ikke bør overdrives, og argumenterer for, at kampens resultater ville have været anderledes, hvis programmet havde adgang til åbningsbaser (fordi Stockfish var optimeret til dette scenarie) [3] . AlphaZero besejrede Stockfish og fratog sidstnævnte adgang til åbningsbaserne og slutspilsbordene , og spillede med meget bedre computerudstyr end modstanderen [4] [5] . Tørfisk var også begrænset i den tid, det tog at lave et træk: den atypiske tidskontrol, 1 minut pr. træk, tillod ikke dyb tænkning i kritiske positioner. Derudover blev der brugt versionen af Stockfish 8, som udkom for et år siden. Alle fire omstændigheder: mangel på strøm, tidsbegrænsning, nedlukning af åbningsbogen og brug af en forældet version bidrog til Stockfishs nederlag.
Shogi-programmeringsfællesskabet er heller ikke helt tilfredse med vilkårene for AlphaZero vs. Elmo-kampen. [6] [7]
DeepMind publicerede en artikel i Science [8] i december 2018 . AlphaZero kørte ikke på en supercomputer, men på 4 TPU'er og en CPU med 44 kerner.
Stockfish 8-motoren blev brugt på computerkraft svarende til AlphaZero. Tidskontrol - 3 timer plus 15 sekunder pr. træk. Ud af 1000 spil vandt AlphaZero 155 spil, tabte 6, resten endte uafgjort. I en række spil med givne startpositioner vandt AlphaZero 95 spil ud af 100. [9]
AlphaZero vandt 98,2 % af spillene med sort og 91,2 % af alle.
Aviser kom ud med overskrifter om, at undervisning i skak kun tog fire timer: "det blev gjort i lidt mere end intervallet mellem morgenmad og frokost" [10] . Wired promoverede AlphaZero som "den første kunstige intelligens , der er mester for mange brætspil " [11] .
"Jeg har altid undret mig over, hvordan det ville være, når højere væsener lander på jorden og viser os, hvordan de spiller skak," sagde den danske stormester Peter Heine Nielsen til BBC , "nu ved jeg det." Den norske stormester Jon Ludwig Hammer beskrev AlphaZero som "vanvittig angrebsskak" med dybt positionsspil. Den tidligere verdensmester Garry Kasparov sagde: "Dette er en bemærkelsesværdig præstation, selvom vi allerede forventede noget lignende efter succesen med AlphaGo" [12] .
Garry Kasparov kaldte dette spil "skak fra en anden dimension", der "rystede [spillet] til dets selve fundamentet" [13] .
Skak | |
---|---|
Hovedartikler | |
Skak inventar | |
skak regler | |
Gloseliste over betingelser | |
Skak taktik | |
Skak strategi | |
debuterer | |
Slutspil | |
Skaksider |
|
Skak programmer |