AlphaGo Zero

De la Wikipedia, enciclopedia liberă
Pentru alte sensuri, vedeți Zero (dezambiguizare).
AlphaGo Zero
Prezență online

AlphaGo Zero este o versiune a programului Go software a echipei AlphaGo a companiei britanice DeepMind. Echipa AlphaGo a publicat un articol în revista Nature, la data de 19 octombrie 2017, prezentând realizarea programului derivat AlphaGo Zero, versiune creată fără a utiliza niciun fel de date din jocurile go jucate de oameni, dovedindu-se mult mai puternică decât oricare din versiunile anterioare. De data asta, programul a fost conceput să învețe doar jucând împotriva sa.[1] Printr-o astfel de abordare, programul a depășit spectaculos programul anterior AlphaGo Lee în doar trei zile, câștigând un meci împotriva acestuia cu 100 (o sută) la 0 (zero), atingând nivelul programului AlphaGo Master în 21 de zile și înfrângând cu scoruri semnificativ de mari toate vechile versiuni ale programului după 40 de zile.[2]

Antrenarea programelor de inteligență artificială (IA), fără folosirea datelor colectate și/sau derivate din jocurile experților umani, are o importanță extrem de mare, cu semnificații profunde asupra dezvoltării inteligențelor artificiale cu calități depășind cele umane, întrucât acest tip de date sunt „adesea scumpe, nesigure sau pur și simplu indisponibile”.[3] Demis Hassabis, cofondatorul și CEO al DeepMind, a declarat că programul AlphaGo Zero s-a dovedit a fi atât de puternic întrucât „nu mai era constrâns la limitele cunoașterii umane”.[4] David Silver, unul din primii autori ai seriei de articole publicate de DeepMind despre AlphaGo, în revista Nature, a declarat că progresul a fost posibil prin generalizarea algoritmilor de IA, care nu mai au nevoia de a învăța de la oameni.[5]

Ulterior Google a realizat programul AlphaZero, versiune generalizată a programului AlphaGo Zero, care poate juca șah și shōgi, în plus de abilitatea de a juca go. În decembrie 2017, AlphaZero a învins AlphaGo Zero cu scorul de 60 la 40, iar după doar opt ore de antrenament (jucând împotriva sa) a depășit AlphaGo Lee pe scala Elo. AlphaZero a învins de asemenea programe de vârf în șah (Stockfish) și în shōgi (Elmo).[6][7]

Costuri de hardware[modificare | modificare sursă]

Costul pentru un singur sistem AlphaGo Zero, incluzând componente special designate pentru acest proiect, au fost menționat ca fiind în jur de 25 de milioane dolari americani.[8][9]

Software[modificare | modificare sursă]

Referințe, note[modificare | modificare sursă]

  1. ^ Silver, David; Schrittwieser, Julian; Simonyan, Karen; Antonoglou, Ioannis; Huang, Aja; Guez, Arthur; Hubert, Thomas; Baker, Lucas; Lai, Matthew; Bolton, Adrian; Chen, Yutian; Lillicrap, Timothy; Fan, Hui; Sifre, Laurent; Driessche, George van den; Graepel, Thore; Hassabis, Demis (). „Mastering the game of Go without human knowledge”. Nature. 550 (7676): 354–359. Bibcode:2017Natur.550..354S. doi:10.1038/nature24270. ISSN 0028-0836. PMID 29052630. Accesat în . Format:Closed access
  2. ^ Hassabis, Demis; Siver, David (). „AlphaGo Zero: Learning from scratch”. DeepMind official website. Arhivat din original la . Accesat în . 
  3. ^ „Google's New AlphaGo Breakthrough Could Take Algorithms Where No Humans Have Gone”. Yahoo! Finance. . Accesat în . 
  4. ^ Knapton, Sarah (). „AlphaGo Zero: Google DeepMind supercomputer learns 3,000 years of human knowledge in 40 days”. The Telegraph. Accesat în . 
  5. ^ „DeepMind AlphaGo Zero learns on its own without meatbag intervention”. ZDNet. . Accesat în . 
  6. ^ Silver, David; Hubert, Thomas; Schrittwieser, Julian; Antonoglou, Ioannis; Lai, Matthew; Guez, Arthur; Lanctot, Marc; Sifre, Laurent; Kumaran, Dharshan; Graepel, Thore; Lillicrap, Timothy; Simonyan, Karen; Hassabis, Demis (). „Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm”. arXiv:1712.01815Accesibil gratuit [cs.AI]. 
  7. ^ Knapton, Sarah; Watson, Leon (). „Entire human chess knowledge learned and surpassed by DeepMind's AlphaZero in four hours”. The Telegraph. 
  8. ^ Alpert, Bill (). „Artificial Intelligence's Winners and Losers”. barrons.com. Accesat în . 
  9. ^ „Google Artificial Intelligence 'Alpha Go Zero' Just Pressed Reset On How To Learn”. Inc.com (în engleză). . Accesat în . 

Legături externe[modificare | modificare sursă]