Tartalomjegyzék:
Meghatározás - Mit jelent az AlphaGo?
Az AlphaGo egy szűk AI, egy számítógépes program, amelyet a Google DeepMind fejlesztett ki a sakkhoz hasonló két játékos számára kínált Go játékhoz, a két játékos számára. Az AlphaGo az első olyan AI-program, amely 2015 októberében képes volt egy professzionális emberi 2-dan lejátszót, Fan Hui-t legyőzni hátrányok nélküli teljes méretű táblán. Ezután 2016 márciusában legyőzte a világ egyik legmagasabb rangú emberi játékosát, a 9-dan Lee Sedolt, ötből négy játékot nyerve.
A Techopedia magyarázza az AlphaGo-t
Az AlphaGo projektet 2014-ben indították el tesztágyként annak érdekében, hogy megnézhesse, mennyire tudják a Google DeepMind mély tanulást használó neurális hálózati algoritmusa versenyezni a Go-n. Az AlphaGo algoritmusa a fakeresés és a gépi tanulási technikák kombinációja, amelyet kiterjesztett képzéssel erősítenek mind emberek, mind más számítógépes játékosok számára. A Monte Carlo fakeresést használja, és irányelveit egy politikai és értékhálózat vezeti, amelyet mély idegi hálózati technológiákkal valósítanak meg. A házirend-hálózat kiképzésben részesül, és segít az AI-nek a legjobban nyerni kívánt következő lépés előrejelzésében, miközben az értékhálózatot arra képzik, hogy szűkítsék a keresési fát, és meghatározzák ezen pozíciók értékét, az egyes pozíciókban a nyertesek becslése helyett az egész lefelé történő keresés a játék végéig.
Az AlphaGo-t először emberi játékosok történelmi mérkőzéseivel táplálták, mintegy 30 millió lépésből álló adatbázist használva, amely utánozta az emberi játékot. Miután az AI elérte a jártasságot, továbbképzték azzal, hogy a saját példányaival játszottak, és megerősítő tanulást alkalmaztak a továbbfejlesztéshez és a további tanuláshoz.
2015 októberében az AlphaGo elosztott számítástechnikai verziója lejátszotta és legyőzte Fan Hui-t, a 2-dan európai Go bajnokot, először jelölve meg, hogy egy számítógépes program verte egy profi játékost a Go-n. Hui fan ezután a vereség után néhány hónapig segített a DeepMind csapat tanácsadójaként. 2016 márciusában az AlphaGo felment Lee Sedol ellen, a világ egyik legmagasabb rangú játékosának, aki elérte a 9-dan legmagasabb szintjét. Négy játékot nyerve Lee-hez, ez jelentős áttörést jelentett az AI kutatásában, mivel ez azt jelentette, hogy a DeepMind által használt mély tanulási és neurális hálózatok algoritmusa bármilyen más célra felhasználható, mivel nem igazán programozták a Go lejátszását, hanem inkább megtanították. hogyan kell játszani a Go-t. Ez egy teljesen új világot nyit meg az AI kutatás számára.