AlphaGo: Różnice pomiędzy wersjami

Z Wikipedii, wolnej encyklopedii
[wersja przejrzana][wersja nieprzejrzana]
Usunięta treść Dodana treść
m poprawa linków
przypisy
Linia 1: Linia 1:
'''AlphaGo''' – program komputerowy stworzony przez Google [[DeepMind]], grającym w [[go]]<ref>{{Cytuj |tytuł=Artificial intelligence: Google’s AlphaGo beats Go master Lee Se-dol – BBC News |data dostępu=2016-03-26 |opublikowany=BBC News |url=http://www.bbc.com/news/technology-35785875 |język=en}}</ref>. W listopadzie 2015 roku jako pierwszy automat pokonał zawodowego gracza, Fan Hui, w pięciorundowym pojedynku na pełnej planszy w równej grze. Mecz zakończył się wynikiem 5:0. W marcu 2016 w meczu z jednym z najlepszych zawodowych graczy - [[Lee Sedol]]em - wygrał 4:1. W uznaniu wygranej AlphaGo otrzymał honorowy 9. dan od południowokoreańskiej federacji go.
'''WyszAlphaGo''' – program komputerowy stworzony przez Google [[DeepMind]], grającym w [[go]]<ref>{{Cytuj |tytuł=Artificial intelligence: Google’s AlphaGo beats Go master Lee Se-dol – BBC News |data dostępu=2016-03-26 |opublikowany=BBC News |url=http://www.bbc.com/news/technology-35785875 |język=en}}</ref>. W listopadzie 2015 roku jako pierwszy automat pokonał zawodowego gracza, Fan Hui, w pięciorundowym pojedynku na pełnej planszy w równej grze. Mecz zakończył się wynikiem 5:0. W marcu 2016 w meczu z jednym z najlepszych zawodowych graczy - [[Lee Sedol]]em - wygrał 4:1. W uznaniu wygranej AlphaGo otrzymał honorowy 9. dan od południowokoreańskiej federacji go<ref>{{Cytuj odcinek|tytuł=Match 1 - Google DeepMind Challenge Match: Lee Sedol vs AlphaGo|url=https://www.youtube.com/watch?v=vFr3K2DORc8&t=1h57m|autorzy=DeepMind|data dostępu=2017-05-04|emisja=2016-03-08}}</ref>.


Algorytm stojący za programem stanowi kombinację technik [[Sieć neuronowa|sieci neuronowych]], [[Uczenie maszynowe|uczenia maszynowego]] oraz [[Monte-Carlo Tree Search|wyszukiwania Monte Carlo]]<ref>{{Cytuj |tytuł=AlphaGo: Mastering the ancient game of Go with Machine Learning |data dostępu=2016-03-26 |opublikowany=Research Blog |url=http://googleresearch.blogspot.com/2016/01/alphago-mastering-ancient-game-of-go.html}}</ref>.
Algorytm stojący za programem stanowi kombinację technik [[Sieć neuronowa|sieci neuronowych]], [[Uczenie maszynowe|uczenia maszynowego]] oraz [[Monte-Carlo Tree Search|wyszukiwania Monte Carlo]]<ref name=":0">{{Cytuj |tytuł=AlphaGo: Mastering the ancient game of Go with Machine Learning |data dostępu=2016-03-26 |opublikowany=Research Blog |url=http://googleresearch.blogspot.com/2016/01/alphago-mastering-ancient-game-of-go.html}}</ref><ref name=":1">{{Cytuj|tytuł=Google achieves AI 'breakthrough' by beating Go champion|czasopismo=BBC News|data=2016-01-27|data dostępu=2017-05-04|url=http://www.bbc.com/news/technology-35420579|język=en-GB}}</ref>.


Został wybrany przez [[Science]] 22 grudnia 2016 roku jako jeden z "przebojów roku"<ref>{{Cytuj|tytuł=From AI to protein folding: Our Breakthrough runners-up|czasopismo=Science {{!}} AAAS|data=2016-12-16|data dostępu=2017-05-04|url=http://www.sciencemag.org/news/2016/12/ai-protein-folding-our-breakthrough-runners|język=en}}</ref>.
{{Przypisy}}

== Historia i współzawodnictwo ==
Go jest znacznie trudniejsze dla komputerów w wygraniu niż inne gry, takie jak [[szachy]], ponieważ znacznie większy [[współczynnik rozgałęzienia]] utrudnia stosowanie tradycyjnych metod AI, takich jak [[algorytm alfa-beta]], [[przechodzenie drzewa]] i [[wyszukiwanie heurystyczne]]<ref name=":0" /><ref>http://www.variational-bayes.org/~dayan/papers/sds94.pdf</ref>.

Prawie dwie dekady po tym, jak IBM Computer Deep Blue pokonał mistrza szachów świata Garry'ego Kasparova (w 1997 r.), najsilniejsze programy Go z wykorzystaniem technik sztucznej inteligencji osiągnęły tylko poziom amatora 5-dan<ref name=":2">{{Cytuj|autor=David Silver, Aja Huang, Chris J. Maddison, Arthur Guez, Laurent Sifre|tytuł=Mastering the game of Go with deep neural networks and tree search|czasopismo=Nature|wolumin=529|numer=7587|s=484–489|doi=10.1038/nature16961|url=http://www.nature.com/doifinder/10.1038/nature16961}}</ref> i wciąż nie mogły pokonać profesjonalnego gracza Go bez [[Handicap (go)|handicapów]]<ref name=":1" /><ref name=":3">{{Cytuj|autor=Jethro Mullen|tytuł=Computer scores big victory against humans in ancient game of Go|data=2016-01-28|data dostępu=2017-05-04|opublikowany=CNNMoney|url=http://money.cnn.com/2016/01/28/technology/google-computer-program-beats-human-at-go/index.html}}</ref><ref name=":0" />. W 2012 roku program [[Zen]], działający na czterech komputerach [[PC]], pokonał [[Masaki Takemiya|Masakiego Takemiya]] (9p) dwa razy z użyciem 5 i 4 kamieni [[handicap]]<ref>{{Cytuj|tytuł=Zen computer Go program beats Takemiya Masaki with just 4 stones!|czasopismo=Go Game Guru|data=2012-03-18|data dostępu=2017-05-04|url=https://gogameguru.com/zen-computer-go-program-beats-takemiya-masaki-4-stones/|język=en-US}}</ref>. W 2013 r. [[Crazy Stone]] pokonał [[Yoshio Ishida]] (9p) w grach na czterokamiennych handicapach<ref>http://sankei.jp.msn.com/life/news/130320/igo13032020420000-n1.htm</ref>.

Według Davida Silvera projekt badawczy AlphaGo został utworzony około 2014 roku w celu sprawdzenia, jak dobrze sieć neuronowa wykorzystująca głębokie uczenie się może rywalizować w Go<ref>{{Cytuj|tytuł=AlphaGo’s unusual moves prove its AI prowess, experts say|czasopismo=PCWorld|data dostępu=2017-05-04|url=http://www.pcworld.com/article/3043668/analytics/alphagos-unusual-moves-prove-its-ai-prowess-experts-say.html|język=en}}</ref>. AlphaGo stanowi znaczną poprawę w stosunku do poprzednich programów Go. W 500 grach przeciwko innym dostępnym programom Go, w tym Crazy Stone i Zen<ref>{{Cytuj|tytuł=Game Terminator! Computer wins 'world's most difficult board game'|czasopismo=Mail Online|data dostępu=2017-05-04|url=http://www.dailymail.co.uk/sciencetech/article-3419548/March-machines-Computer-BEATS-one-world-s-best-players-ancient-board-game-using-human-like-skills.html}}</ref>, AlphaGo działające na jednym komputerze przegrało tylko raz<ref>{{Cytuj|autor=Chris Duckett|tytuł=Google AlphaGo AI clean sweeps European Go champion {{!}} ZDNet|czasopismo=ZDNet|data dostępu=2017-05-04|url=http://www.zdnet.com/article/google-alphago-ai-clean-sweeps-european-go-champion/|język=en}}</ref>. W podobnym meczu AlphaGo na wielu komputerach wygrała wszystkie 500 gier granych przeciwko innym programom Go i 77% gier rozgrywanych przeciwko AlphaGo działającemu na jednym komputerze. Wersja rozproszona w październiku 2015 r. używała 1 202 [[Procesor|CPU]] i 176 [[GPU]]<ref name=":2" />.

=== Mecz przeciwko Fan Hui ===
W październiku 2015 r. dystrybuowana wersja AlphaGo pokonała profesjonalnego mistrza europejskiego Go [[Fan Hui]]<ref>{{Cytuj|autor=Cade Metz|tytuł=In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go|czasopismo=WIRED|data dostępu=2017-05-04|url=https://www.wired.com/2016/01/in-a-huge-breakthrough-googles-ai-beats-a-top-player-at-the-game-of-go/|język=en-US}}</ref>, 2-dan (z 9 dan możliwych), pięć do zera<ref name=":1" /><ref>http://www.britgo.org/files/2016/deepmind/BGJ174-AlphaGo.pdf</ref>. To był pierwszy raz kiedy program komputerowy Go pokonał profesjonalnego człowieka na pełnej planszy bez handicapów<ref>{{Cytuj|autor=David Larousserie et Morgane Tual|tytuł=Première défaite d’un professionnel du go contre une intelligence artificielle|czasopismo=Le Monde.fr|data=2016-01-27|data dostępu=2017-05-04|issn=1950-6244|url=http://www.lemonde.fr/pixels/article/2016/01/27/premiere-defaite-d-un-professionnel-du-go-contre-une-intelligence-artificielle_4854886_4408996.html|język=fr}}</ref>. Ogłoszenie wiadomości zostało opóźnione do 27 stycznia 2016 r., aby zbiegło się z publikacją w czasopiśmie Nature<ref name=":2" /> opisującego stosowane algorytmy<ref name=":1" />.

=== Mecz przeciwko Lee Sedolowi ===
AlphaGo zagrał z koreańskim zawodowcem Go Lee Sedol z 9-danami, jednym z najlepszych piłkarzy w Go<ref name=":3" />, w pięć meczy odbywających się w hotelu Four Seasons w Seulu, w Korei Południowej w dniach 9, 12, 13 i 15 marca 2016 r.<ref>{{Cytuj|autor=Samuel Gibbs|tytuł=Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast|czasopismo=The Guardian|data=2016-02-05|data dostępu=2017-05-04|issn=0261-3077|url=https://www.theguardian.com/technology/2016/feb/05/google-ai-alphago-world-no-1-lee-se-dol-live-broadcast|język=en-GB}}</ref><ref>{{Cytuj|tytuł=Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea|czasopismo=Business Insider|data dostępu=2017-05-04|url=http://www.businessinsider.com/google-deepmind-to-play-go-against-lee-sedol-in-south-korea-four-seasons-2016-2?r=UK&IR=T|język=en}}</ref>, które były transmitowane na żywo<ref>{{Cytuj|tytuł=YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March|data=2016-02-05|data dostępu=2017-05-04|opublikowany=VentureBeat|url=https://venturebeat.com/2016/02/04/youtube-will-livestream-googles-ai-playing-go-superstar-lee-sedol-in-march/}}</ref>. Aja Huang, członek zespołu DeepMind i amator 6-dan Go, umieszczał kamienie na planszy Go, jakie wskazywał mu AlphaGo, który działał w oparciu o Google Cloud Computing z serwerami z siedzibą w Stanach Zjednoczonych<ref>{{Cytuj|tytuł=韩国最大的传媒机构《中央日报》中文网|data dostępu=2017-05-04|opublikowany=chinese.joins.com|url=http://chinese.joins.com/gb/article.do?method=detail&art_id=148225&category=005001}}</ref>. Mecz stosował chińskie reguły z 7,5-punktowym [[komi]], a każda ze stron miała dwie godziny czasu myślenia plus trzy okresy po 60 sekund na tak zwane [[byo-yomi]]<ref>http://www.baduk.or.kr/news/report_view.asp?news_no=1671</ref>. Wersja AlphaGo grająca przeciwko Lee wykorzystała podobną moc obliczeniową, jaka była stosowana w meczu Fan Hui<ref>{{Cytuj|tytuł=Demis Hassabis on Twitter|czasopismo=Twitter|data dostępu=2017-05-04|url=https://twitter.com/demishassabis/status/708488229750591488|język=pl}}</ref>. Economist poinformował, że używał 1.920 CPU i 280 GPU.

W chwili gry, Lee Sedol miał drugą największą liczbę zwycięstw mistrzostw świata Go na świecie. Choć nie ma żadnej oficjalnej metody rankingu w międzynarodowym Go, niektóre źródła uznały Lee Sedola jako czwartego najlepszego gracza na świecie w tamtym czasie. AlphaGo nie był specjalnie szkolony do gry przeciwko Lee Sedolowi.

Pierwsze trzy mecze wygrał AlphaGo po rezygnacji Sedola. Jednak Sedol pokonał AlphaGo w czwartej grze, wygrywając rezygnację w ruchu 180. Mimo to AlphaGo osiągnęła czwartą wygraną, zdobywając piątą grę po rezygnacji.

Nagroda wyniosła 1 milion USD. Od kiedy AlphaGo wygrało cztery z pięciu gier, i tym samym całą serię, nagroda została przekazana organizacjom charytatywnym, w tym UNICEF. Lee Sedol otrzymał 150 000 dolarów za udział we wszystkich 5 meczach i dodatkowe 20 000 dolarów za jego wygraną.

W czerwcu 2016 podczas prezentacji na uniwersytecie w Holandii Aja Huang, jeden z zespołów Deep Mind, ujawnił, że poprawił problem, który wystąpił podczas czwartej gry meczu między AlphaGo i Sedol, a po ruchu 78. (który przez wielu specjalistów został nazwany "ręką Boga"), grałby dokładnie i zachowywał przewagę, ponieważ przed błędami, które doprowadziły do ​​przegranej, AlphaGo prowadziło całą grę i ruch Lee nie został zaliczony jako ten, który wygrał grę, ale spowodował, że ​​moce obliczeniowe programu były przekierowywane i zmylone. Huang wyjaśnił, że polityka sieci AlphaGo w znalezieniu najdokładniejszej kolejności i kontynuacji ruchu nieprecyzyjnie doprowadziła AlphaGo do niewłaściwej kontynuacji po ruchu 78., ponieważ jego sieć wartościująca nie uznała, że ​​78. ruch Sedola jest najbardziej prawdopodobny i wtedy po ruchu AlphaGo nie mogła dokonać właściwego dostosowania do logicznej kontynuacji.

=== Nieoficjalne mecze online pod koniec 2016 r. do początku 2017 r. ===
29 grudnia 2016 roku nowe konto o nazwie "Magist" z Korei Południowej zaczęło grać z profesjonalnymi graczami na serwerze Tygem. W dniu 30 grudnia zmieniono nazwę konta na "Master", a następnie 1 stycznia 2017 roku przeniesiono na serwer FoxGo. 4 stycznia DeepMind potwierdził, że "Magister" i "Master" były grającymi i ulepszonymi wersjami AlphaGo. Od 5 stycznia 2017 r. rekord internetowy AlphaGo wynosił 60 zwycięstw i 0 strat, w tym trzy zwycięstwa nad najlepszym graczem Go, Ke Jie, który został cicho poinformowany wcześniej, że "Master" jest wersją AlphaGo. Po tym, jak przegrał z "Masterem", Gu Li ofiarował kwotę 100 000 juanów (14 400 USD) na pierwszego człowieka, który mógł pokonać "Mastera". "Master" grał w tempie 10 gier dziennie. Wielu szybko zaczęło podejrzewać, że ​​jest to sztuczna inteligencja z powodu niewielkich lub żadnych odstępów pomiędzy grami. Jej rywalami byli tak liczni mistrzowie świata, jak Ke Jie, Park Jeong-hwan, Yuta Iyama, Tuo Jiaxi, Mi Yuting, Shi Yue, Chen Yaoye, Li Qincheng, Gu Li, Chang Hao, Tang Weixing, Fan Tingyu, Zhou Ruiyang, Jiang Weijie, Chou Chun-hsun, Kim Ji-seok, Kang Dong-yun, Park Yeong-hun i Won Seong-jin; mistrzostw krajowych lub mistrzostw świata, takich jak Lian Xiao, Tan Xiao, Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin, Gu Zihao, Shin Jinseo, Cho Han-seung i An Sungjoon. Wszystkie 60 gier, z wyjątkiem jednego, to szybkie tempo gry z trzema 20 lub 30 sekundami byo-yomi. "Master" zaproponował przedłużenie byo-yomi do jednej minuty, kiedy grał z Nie Weipingem ze względu na jego wiek. Po wygraniu 59-go gry, "Master" ujawnił się na czacie będąc kontrolowanym przez dr Aja Huang z zespołu DeepMind, potem zmienił swoją narodowość na Zjednoczone Królestwo. Po tych meczach współtwórca Google DeepMind, Demis Hassabis napisał na Twitterze: "czekamy na oficjalne, pełne gry później [2017] we współpracy z organizacjami Go i ekspertów".

Ludzcy gracze popełniają więcej pomyłek w szybkich grach online, niż w pełnych turniejach turniejowych ze względu na krótki czas reakcji. Nie wiadomo ostatecznie, czy AlphaGo odniesie sukces w turniejach, jak ma to miejsce w internecie. Jednak eksperci z Go są pod wrażeniem wydajności AlphaGo i jego stylu nieludzkiej gry; Ke Jie stwierdził, że "Gdy ludzkość przez tysiące lat ulepszyła naszą taktykę, komputery informują nas, że ludzie są w pełni w błędzie... Chciałbym powiedzieć, że żaden człowiek nie dotknął krawędzi prawdy Go".

=== Future of Go Summit w Wuzhen<ref>{{Cytuj|tytuł=Exploring the mysteries of Go with AlphaGo and China's top players {{!}} DeepMind|data dostępu=2017-05-04|opublikowany=DeepMind|url=https://deepmind.com/blog/exploring-mysteries-alphago/}}</ref><ref>{{Cytuj|autor=Matt Burgess|tytuł=DeepMind's AlphaGo is back..and this time it's taking on five humans at once|czasopismo=WIRED UK|data dostępu=2017-05-04|url=http://www.wired.co.uk/article/deepmind-go-alphago-china-may-2017|język=en-GB}}</ref> ===
Późnym majem 2017 roku AlphaGo zagra kilka gier w Wuzhen, na przykład:
* 23, 25 i 27 maja, [[Ke Jie]] vs. AlphaGo
* 24 maja, Chińska drużyna ([[Chen Yaoye]], [[Mi Yuting]], [[Shi Yue]], Tang Weixing, [[Zhou Ruiyang]]<ref>{{Cytuj|tytuł=柯洁AlphaGo大战发布会举行 胜者获150万美金|data dostępu=2017-05-04|opublikowany=sports.sina.com.cn|url=http://sports.sina.com.cn/go/2017-04-10/doc-ifyecezv2909179.shtml}}</ref>) vs. AlphaGo
* 26 maja, Pair Go: [[Gu Li]] i AlphaGo vs. [[Lian Xiao]] i AlphaGo<ref>{{Cytuj|tytuł=人机大战第二季5月乌镇见! 慢棋+团队配对赛|data dostępu=2017-05-04|opublikowany=sports.sina.com.cn|url=http://sports.sina.com.cn/go/2017-04-10/doc-ifyecezv2914164.shtml}}</ref>

== Hardware ==
Wczesna wersja AlphaGo była testowana na sprzęcie z różnymi CPU i GPU, działającymi w trybie asynchronicznym lub rozproszonym. Każdemu ruchowi przyznano dwie sekundy czasu myślenia. Otrzymane oceny Elo są wymienione poniżej. W meczach z większą ilością czasu na ruch osiąga się wyższe oceny.
{| class="wikitable sortable"
|+Konfiguracja i wydajność
!Konfiguracja
!Wyszukiwane
wątki
!Liczba CPU
!Liczba GPU
!Ocena Elo
|-
|Pojedyncza
|40
|48
|1
|2,181
|-
|Pojedyncza
|40
|48
|2
|2,738
|-
|Pojedyncza
|40
|48
|4
|2,850
|-
|Pojedyncza
|40
|48
|8
|2,890
|-
|Rozproszona
|12
|428
|64
|2,937
|-
|Rozproszona
|24
|764
|112
|3,079
|-
|Rozproszona
|40
|1,202
|176
|3,140
|-
|Rozproszona
|64
|1,920
|280
|3,168
|}
W maju 2016 r. firma Google przedstawiła własne, zastrzeżone urządzenia "tensorowe jednostki przetwarzania (TPU)", które to zostały już wdrożone w wielu wewnętrznych projektach w Google, w tym meczu AlphaGo z Lee Sedol.

== Algorytm ==
Od roku 2016 algorytm AlphaGo wykorzystuje kombinację [[Uczenie maszynowe|uczenia maszynowego]] i technik [[Przechodzenie drzewa|przechodzenia drzewa]], w połączeniu z rozległym szkoleniem, zarówno grając przeciwko komputerom jak i ludziom. Wykorzystuje on [[Monte-Carlo Tree Search]], kierując się "wartością sieci" i "polityką sieci", realizowaną za pomocą technologii sieci neuronowych. Do przesyłania danych wejściowych przed wysłaniem do sieci neuronowych stosuje się ograniczoną ilość wstępnego przetwarzania detekcji funkcji specyficznych dla danej gry (na przykład aby zaznaczyć, czy ruch pasuje do wzoru [[nakade]]).

Sieci neuronowe systemu zostały początkowo załadowane z ludzkiej wiedzy na temat rozgrywek. AlphaGo był początkowo szkolony, aby naśladować sztukę ludzką, próbując dopasować ruchy ekspertów do gier historycznych, wykorzystując bazę danych około 30 milionów ruchów. Gdy osiągnęła pewien stopień biegłości, trenowano ją dalej, grała przeciwko innym kopiom samej siebie, korzystając z nauki wzmocnienia, aby poprawić swoją grę. Aby uniknąć "lekceważenia" marnowania czasu swojego przeciwnika, program został specjalnie zaprogramowany do rezygnacji, jeśli jego ocena prawdopodobieństwa wygrania spadnie poniżej określonego progu. Na meczu w marcu 2016 r. przeciwko Lee, próg rezygnacji został ustalony na 20%.

== Styl gry ==
Toby Manning, sędzia meczu AlphaGo vs. Fan Hui, opisuje styl programu jako "konserwatywny". Styl gry AlphaGo zdecydowanie opowiada się za większym prawdopodobieństwem wygranej o mniejszej ilości punktów niż mniejszym prawdopodobieństwem zdobycia większej liczby punktów. Strategia maksymalizacji prawdopodobieństwa wygrania różni się od tego, co ludzie robią, co ma na celu maksymalizację zysków pola gry i wyjaśnia niektóre dziwne ruchy.

== Odpowiedź na zwycięstwo nad Lee Sedolem w 2016 ==

=== Społeczność AI ===
Zwycięstwo AlphaGo w marcu 2016 było znaczącym krokiem w badaniach nad sztuczną inteligencją. Go był wcześniej uważany za trudny problem w uczeniu maszyn, który miał być poza zasięgiem technologii w tych czasach. Większość ekspertów uważała, że ​​program Go tak potężny, jak AlphaGo był oddalony o co najmniej pięć lat, niektórzy eksperci uważali, że zanim komputer pokonałby mistrzów Go, minęłoby jeszcze jakieś dziesięć lat. Większość obserwatorów na początku 2016 meczów oczekiwała, że Lee pokona AlphaGo.

W grach takich jak warcaby (które zostały "rozwiązane" przez program "Chinook"), szachy, a teraz Go wygrane przez komputery, zwycięstwa w popularnych grach planszowych nie mogą już służyć jako główne kroki dla sztucznej inteligencji w dotychczasowy sposób. Murray Campbell z Deep Blue nazwał AlphaGo zwycięstwem "końca ery... gry planszowe są mniej lub bardziej skończone i nadszedł czas, aby przejść dalej".

W porównaniu z Deep Blue lub z Watsonem, algorytmy AlphaGo są potencjalnie bardziej ogólne i mogą być dowodem na to, że naukowa wspólnota dokonuje postępów w [[Silna sztuczna inteligencja|silnej sztucznej inteligencji]]. Niektórzy komentatorzy uważają, że zwycięstwo AlphaGo daje dobrą okazję, aby społeczeństwo zaczęło dyskutować nad przygotowaniami do ewentualnego przyszłego wpływu maszyn na inteligencję ogólnego przeznaczenia (jak zauważył przedsiębiorca Guy Suter, sama AlphaGo wie tylko, jak grać w Go i nie ma ogólnej inteligencji: "Nie mogłaby się obudzić pewnego ranka i zdecydować, że chce nauczyć się używać broni palnej"). W marcu 2016 r. Stuart Russell stwierdził, że "metody AI przebiegają znacznie szybciej niż się spodziewano, co sprawia, że ​​kwestia długoterminowego efektu staje się bardziej pilna" dodając, że "zapewnienie, że ​​coraz silniejsze systemy AI pozostaną całkowicie pod kontrolą człowieka... jest wiele do zrobienia". Niektórzy uczeni, np. Stephen Hawking ostrzegli (w maju 2015 r. przed meczami), że niektóre przyszłe samodoskonalące się AI mogą uzyskać rzeczywisty ogólną inteligencję, prowadzącą do nieoczekiwanego przejęcia nadzoru przez AI; inni uczeni nie zgadzają się: Ekspert AI Jean-Gabriel Ganascia uważa, że ​​"takie rzeczy jak "rozsądek"... nigdy nie będą odtwarzalne" i mówi: "nie rozumiem, dlaczego mówimy o obawach, przeciwnie, to powoduje wiele nadziei w wielu dziedzinach, takich jak badania dotyczące zdrowia i przestrzeni kosmicznej ". Informatyk Richard Sutton "Nie sądzę, że ludzie powinni się bać... ale myślę, że ludzie powinni zwracać uwagę".

=== Społeczność Go ===
Go to popularna gra w Chinach, Japonii i Korei, a mecze z 2016 r. były oglądane przez setki milionów osób na całym świecie. Wielu czołowych graczy Go określało grę AlphaGo jako nieortodoksyjne pozornie wątpliwe ruchy, które początkowo zaskakiwały widzów, ale miały sens w dalszej perspektywie: "Wszyscy najlepsi gracze Go doskonalą swój styl, naśladując najlepszych graczy". AlphaGo wydaje się mieć zupełnie oryginalne ruchy poprzez samoistne ich stwarzanie". AlphaGo okazało się nieoczekiwanie silniejsze, nawet w porównaniu z jego meczem z października 2015 r., w którym komputer po raz pierwszy w historii pokonał zawodowego Gracza Go, bez użycia handicapu. Nazajutrz po pierwszej porażce Lee, Jeong Ahram, czołowy korespondent dla jednego z największych dzienników w Korei Południowej, powiedział: "Ostatnia noc była bardzo mroczna... Wielu piło alkohol". Korea Baduk Association, organizacja, która nadzoruje profesjonalistów Go w Korei Południowej, przyznał firmie AlphaGo honorowy 9-dan tytuł za wykazanie umiejętności twórczych i przyspieszenia postępów gry.

Ke Jie, chiński 18-latek powszechnie uznawany za najlepszego gracza na świecie, początkowo twierdził, że będzie w stanie pokonać AlphaGo, ale odmówił grania przeciwko niej, obawiając się, że "mogłaby skopiować mój styl". W miarę postępów w meczach, Ke Jie stwierdził, że "bardzo prawdopodobne jest, że mogę przegrać" po analizie pierwszych trzech meczów, ale odzyskał pewność po tym, jak AlphaGo wykonał błędy w czwartej rozgrywce.

Toby Manning, sędzia meczu AlphaGo przeciwko Fan Hui i Hajin Lee, sekretarz generalny Międzynarodowej Federacji Go, stwierdził, że w przyszłości Go gracze otrzymają pomoc od komputerów, aby dowiedzieć się, co zrobili źle w grach i poprawić swoje umiejętności.

Po dwóch meczach Lee powiedział, że czuje się "oniemiały": "Już od samego początku meczu nie udało mi się zdobyć przewagi nad pojedynczym ruchem, było to całkowite zwycięstwo Alphago". Lee przeprosił za swoje straty, stwierdzając po trzeciej grze, że "źle oceniłem możliwości AlphaGo i poczułem się bezsilny". Podkreślił, że porażka to "klęska Lee Sedola", a nie "klęska ludzkości". Lee powiedział, że jego ostateczna strata przeciwko maszynie "była nieunikniona", ale stwierdził, że ​​"roboty nigdy nie zrozumieją piękna gry tak samo, jak my ludzie". Lee nazwał swoje gry jako cztery zwycięstwa "bezcenne zwycięstwa, których nie wymieniłbym za nic ".

== Podobne systemy ==
Facebook pracuje także nad własnym systemem do gry w Go Darkforest, opartym również na połączeniu nauczania maszynowego i przechodzeniu drzewa. Nie pokonał jeszcze zawodowego gracza. Darkforest przegrał z "CrazyStone" i "Zen" i ma być do nich podobny.

DeepZenGo, system opracowany przy wsparciu portalu Dwango i Uniwersytetu Tokio, przegrał 2-1 w listopadzie 2016 roku z mistrzem Go Cho Chikun, który zajmuje wysokie miejsce w Japonii.{{Przypisy}}


[[Kategoria:Go]]
[[Kategoria:Go]]

Wersja z 13:27, 4 maj 2017

WyszAlphaGo – program komputerowy stworzony przez Google DeepMind, grającym w go[1]. W listopadzie 2015 roku jako pierwszy automat pokonał zawodowego gracza, Fan Hui, w pięciorundowym pojedynku na pełnej planszy w równej grze. Mecz zakończył się wynikiem 5:0. W marcu 2016 w meczu z jednym z najlepszych zawodowych graczy - Lee Sedolem - wygrał 4:1. W uznaniu wygranej AlphaGo otrzymał honorowy 9. dan od południowokoreańskiej federacji go[2].

Algorytm stojący za programem stanowi kombinację technik sieci neuronowych, uczenia maszynowego oraz wyszukiwania Monte Carlo[3][4].

Został wybrany przez Science 22 grudnia 2016 roku jako jeden z "przebojów roku"[5].

Historia i współzawodnictwo

Go jest znacznie trudniejsze dla komputerów w wygraniu niż inne gry, takie jak szachy, ponieważ znacznie większy współczynnik rozgałęzienia utrudnia stosowanie tradycyjnych metod AI, takich jak algorytm alfa-beta, przechodzenie drzewa i wyszukiwanie heurystyczne[3][6].

Prawie dwie dekady po tym, jak IBM Computer Deep Blue pokonał mistrza szachów świata Garry'ego Kasparova (w 1997 r.), najsilniejsze programy Go z wykorzystaniem technik sztucznej inteligencji osiągnęły tylko poziom amatora 5-dan[7] i wciąż nie mogły pokonać profesjonalnego gracza Go bez handicapów[4][8][3]. W 2012 roku program Zen, działający na czterech komputerach PC, pokonał Masakiego Takemiya (9p) dwa razy z użyciem 5 i 4 kamieni handicap[9]. W 2013 r. Crazy Stone pokonał Yoshio Ishida (9p) w grach na czterokamiennych handicapach[10].

Według Davida Silvera projekt badawczy AlphaGo został utworzony około 2014 roku w celu sprawdzenia, jak dobrze sieć neuronowa wykorzystująca głębokie uczenie się może rywalizować w Go[11]. AlphaGo stanowi znaczną poprawę w stosunku do poprzednich programów Go. W 500 grach przeciwko innym dostępnym programom Go, w tym Crazy Stone i Zen[12], AlphaGo działające na jednym komputerze przegrało tylko raz[13]. W podobnym meczu AlphaGo na wielu komputerach wygrała wszystkie 500 gier granych przeciwko innym programom Go i 77% gier rozgrywanych przeciwko AlphaGo działającemu na jednym komputerze. Wersja rozproszona w październiku 2015 r. używała 1 202 CPU i 176 GPU[7].

Mecz przeciwko Fan Hui

W październiku 2015 r. dystrybuowana wersja AlphaGo pokonała profesjonalnego mistrza europejskiego Go Fan Hui[14], 2-dan (z 9 dan możliwych), pięć do zera[4][15]. To był pierwszy raz kiedy program komputerowy Go pokonał profesjonalnego człowieka na pełnej planszy bez handicapów[16]. Ogłoszenie wiadomości zostało opóźnione do 27 stycznia 2016 r., aby zbiegło się z publikacją w czasopiśmie Nature[7] opisującego stosowane algorytmy[4].

Mecz przeciwko Lee Sedolowi

AlphaGo zagrał z koreańskim zawodowcem Go Lee Sedol z 9-danami, jednym z najlepszych piłkarzy w Go[8], w pięć meczy odbywających się w hotelu Four Seasons w Seulu, w Korei Południowej w dniach 9, 12, 13 i 15 marca 2016 r.[17][18], które były transmitowane na żywo[19]. Aja Huang, członek zespołu DeepMind i amator 6-dan Go, umieszczał kamienie na planszy Go, jakie wskazywał mu AlphaGo, który działał w oparciu o Google Cloud Computing z serwerami z siedzibą w Stanach Zjednoczonych[20]. Mecz stosował chińskie reguły z 7,5-punktowym komi, a każda ze stron miała dwie godziny czasu myślenia plus trzy okresy po 60 sekund na tak zwane byo-yomi[21]. Wersja AlphaGo grająca przeciwko Lee wykorzystała podobną moc obliczeniową, jaka była stosowana w meczu Fan Hui[22]. Economist poinformował, że używał 1.920 CPU i 280 GPU.

W chwili gry, Lee Sedol miał drugą największą liczbę zwycięstw mistrzostw świata Go na świecie. Choć nie ma żadnej oficjalnej metody rankingu w międzynarodowym Go, niektóre źródła uznały Lee Sedola jako czwartego najlepszego gracza na świecie w tamtym czasie. AlphaGo nie był specjalnie szkolony do gry przeciwko Lee Sedolowi.

Pierwsze trzy mecze wygrał AlphaGo po rezygnacji Sedola. Jednak Sedol pokonał AlphaGo w czwartej grze, wygrywając rezygnację w ruchu 180. Mimo to AlphaGo osiągnęła czwartą wygraną, zdobywając piątą grę po rezygnacji.

Nagroda wyniosła 1 milion USD. Od kiedy AlphaGo wygrało cztery z pięciu gier, i tym samym całą serię, nagroda została przekazana organizacjom charytatywnym, w tym UNICEF. Lee Sedol otrzymał 150 000 dolarów za udział we wszystkich 5 meczach i dodatkowe 20 000 dolarów za jego wygraną.

W czerwcu 2016 podczas prezentacji na uniwersytecie w Holandii Aja Huang, jeden z zespołów Deep Mind, ujawnił, że poprawił problem, który wystąpił podczas czwartej gry meczu między AlphaGo i Sedol, a po ruchu 78. (który przez wielu specjalistów został nazwany "ręką Boga"), grałby dokładnie i zachowywał przewagę, ponieważ przed błędami, które doprowadziły do ​​przegranej, AlphaGo prowadziło całą grę i ruch Lee nie został zaliczony jako ten, który wygrał grę, ale spowodował, że ​​moce obliczeniowe programu były przekierowywane i zmylone. Huang wyjaśnił, że polityka sieci AlphaGo w znalezieniu najdokładniejszej kolejności i kontynuacji ruchu nieprecyzyjnie doprowadziła AlphaGo do niewłaściwej kontynuacji po ruchu 78., ponieważ jego sieć wartościująca nie uznała, że ​​78. ruch Sedola jest najbardziej prawdopodobny i wtedy po ruchu AlphaGo nie mogła dokonać właściwego dostosowania do logicznej kontynuacji.

Nieoficjalne mecze online pod koniec 2016 r. do początku 2017 r.

29 grudnia 2016 roku nowe konto o nazwie "Magist" z Korei Południowej zaczęło grać z profesjonalnymi graczami na serwerze Tygem. W dniu 30 grudnia zmieniono nazwę konta na "Master", a następnie 1 stycznia 2017 roku przeniesiono na serwer FoxGo. 4 stycznia DeepMind potwierdził, że "Magister" i "Master" były grającymi i ulepszonymi wersjami AlphaGo. Od 5 stycznia 2017 r. rekord internetowy AlphaGo wynosił 60 zwycięstw i 0 strat, w tym trzy zwycięstwa nad najlepszym graczem Go, Ke Jie, który został cicho poinformowany wcześniej, że "Master" jest wersją AlphaGo. Po tym, jak przegrał z "Masterem", Gu Li ofiarował kwotę 100 000 juanów (14 400 USD) na pierwszego człowieka, który mógł pokonać "Mastera". "Master" grał w tempie 10 gier dziennie. Wielu szybko zaczęło podejrzewać, że ​​jest to sztuczna inteligencja z powodu niewielkich lub żadnych odstępów pomiędzy grami. Jej rywalami byli tak liczni mistrzowie świata, jak Ke Jie, Park Jeong-hwan, Yuta Iyama, Tuo Jiaxi, Mi Yuting, Shi Yue, Chen Yaoye, Li Qincheng, Gu Li, Chang Hao, Tang Weixing, Fan Tingyu, Zhou Ruiyang, Jiang Weijie, Chou Chun-hsun, Kim Ji-seok, Kang Dong-yun, Park Yeong-hun i Won Seong-jin; mistrzostw krajowych lub mistrzostw świata, takich jak Lian Xiao, Tan Xiao, Meng Tailing, Dang Yifei, Huang Yunsong, Yang Dingxin, Gu Zihao, Shin Jinseo, Cho Han-seung i An Sungjoon. Wszystkie 60 gier, z wyjątkiem jednego, to szybkie tempo gry z trzema 20 lub 30 sekundami byo-yomi. "Master" zaproponował przedłużenie byo-yomi do jednej minuty, kiedy grał z Nie Weipingem ze względu na jego wiek. Po wygraniu 59-go gry, "Master" ujawnił się na czacie będąc kontrolowanym przez dr Aja Huang z zespołu DeepMind, potem zmienił swoją narodowość na Zjednoczone Królestwo. Po tych meczach współtwórca Google DeepMind, Demis Hassabis napisał na Twitterze: "czekamy na oficjalne, pełne gry później [2017] we współpracy z organizacjami Go i ekspertów".

Ludzcy gracze popełniają więcej pomyłek w szybkich grach online, niż w pełnych turniejach turniejowych ze względu na krótki czas reakcji. Nie wiadomo ostatecznie, czy AlphaGo odniesie sukces w turniejach, jak ma to miejsce w internecie. Jednak eksperci z Go są pod wrażeniem wydajności AlphaGo i jego stylu nieludzkiej gry; Ke Jie stwierdził, że "Gdy ludzkość przez tysiące lat ulepszyła naszą taktykę, komputery informują nas, że ludzie są w pełni w błędzie... Chciałbym powiedzieć, że żaden człowiek nie dotknął krawędzi prawdy Go".

Future of Go Summit w Wuzhen[23][24]

Późnym majem 2017 roku AlphaGo zagra kilka gier w Wuzhen, na przykład:

Hardware

Wczesna wersja AlphaGo była testowana na sprzęcie z różnymi CPU i GPU, działającymi w trybie asynchronicznym lub rozproszonym. Każdemu ruchowi przyznano dwie sekundy czasu myślenia. Otrzymane oceny Elo są wymienione poniżej. W meczach z większą ilością czasu na ruch osiąga się wyższe oceny.

Konfiguracja i wydajność
Konfiguracja Wyszukiwane

wątki

Liczba CPU Liczba GPU Ocena Elo
Pojedyncza 40 48 1 2,181
Pojedyncza 40 48 2 2,738
Pojedyncza 40 48 4 2,850
Pojedyncza 40 48 8 2,890
Rozproszona 12 428 64 2,937
Rozproszona 24 764 112 3,079
Rozproszona 40 1,202 176 3,140
Rozproszona 64 1,920 280 3,168

W maju 2016 r. firma Google przedstawiła własne, zastrzeżone urządzenia "tensorowe jednostki przetwarzania (TPU)", które to zostały już wdrożone w wielu wewnętrznych projektach w Google, w tym meczu AlphaGo z Lee Sedol.

Algorytm

Od roku 2016 algorytm AlphaGo wykorzystuje kombinację uczenia maszynowego i technik przechodzenia drzewa, w połączeniu z rozległym szkoleniem, zarówno grając przeciwko komputerom jak i ludziom. Wykorzystuje on Monte-Carlo Tree Search, kierując się "wartością sieci" i "polityką sieci", realizowaną za pomocą technologii sieci neuronowych. Do przesyłania danych wejściowych przed wysłaniem do sieci neuronowych stosuje się ograniczoną ilość wstępnego przetwarzania detekcji funkcji specyficznych dla danej gry (na przykład aby zaznaczyć, czy ruch pasuje do wzoru nakade).

Sieci neuronowe systemu zostały początkowo załadowane z ludzkiej wiedzy na temat rozgrywek. AlphaGo był początkowo szkolony, aby naśladować sztukę ludzką, próbując dopasować ruchy ekspertów do gier historycznych, wykorzystując bazę danych około 30 milionów ruchów. Gdy osiągnęła pewien stopień biegłości, trenowano ją dalej, grała przeciwko innym kopiom samej siebie, korzystając z nauki wzmocnienia, aby poprawić swoją grę. Aby uniknąć "lekceważenia" marnowania czasu swojego przeciwnika, program został specjalnie zaprogramowany do rezygnacji, jeśli jego ocena prawdopodobieństwa wygrania spadnie poniżej określonego progu. Na meczu w marcu 2016 r. przeciwko Lee, próg rezygnacji został ustalony na 20%.

Styl gry

Toby Manning, sędzia meczu AlphaGo vs. Fan Hui, opisuje styl programu jako "konserwatywny". Styl gry AlphaGo zdecydowanie opowiada się za większym prawdopodobieństwem wygranej o mniejszej ilości punktów niż mniejszym prawdopodobieństwem zdobycia większej liczby punktów. Strategia maksymalizacji prawdopodobieństwa wygrania różni się od tego, co ludzie robią, co ma na celu maksymalizację zysków pola gry i wyjaśnia niektóre dziwne ruchy.

Odpowiedź na zwycięstwo nad Lee Sedolem w 2016

Społeczność AI

Zwycięstwo AlphaGo w marcu 2016 było znaczącym krokiem w badaniach nad sztuczną inteligencją. Go był wcześniej uważany za trudny problem w uczeniu maszyn, który miał być poza zasięgiem technologii w tych czasach. Większość ekspertów uważała, że ​​program Go tak potężny, jak AlphaGo był oddalony o co najmniej pięć lat, niektórzy eksperci uważali, że zanim komputer pokonałby mistrzów Go, minęłoby jeszcze jakieś dziesięć lat. Większość obserwatorów na początku 2016 meczów oczekiwała, że Lee pokona AlphaGo.

W grach takich jak warcaby (które zostały "rozwiązane" przez program "Chinook"), szachy, a teraz Go wygrane przez komputery, zwycięstwa w popularnych grach planszowych nie mogą już służyć jako główne kroki dla sztucznej inteligencji w dotychczasowy sposób. Murray Campbell z Deep Blue nazwał AlphaGo zwycięstwem "końca ery... gry planszowe są mniej lub bardziej skończone i nadszedł czas, aby przejść dalej".

W porównaniu z Deep Blue lub z Watsonem, algorytmy AlphaGo są potencjalnie bardziej ogólne i mogą być dowodem na to, że naukowa wspólnota dokonuje postępów w silnej sztucznej inteligencji. Niektórzy komentatorzy uważają, że zwycięstwo AlphaGo daje dobrą okazję, aby społeczeństwo zaczęło dyskutować nad przygotowaniami do ewentualnego przyszłego wpływu maszyn na inteligencję ogólnego przeznaczenia (jak zauważył przedsiębiorca Guy Suter, sama AlphaGo wie tylko, jak grać w Go i nie ma ogólnej inteligencji: "Nie mogłaby się obudzić pewnego ranka i zdecydować, że chce nauczyć się używać broni palnej"). W marcu 2016 r. Stuart Russell stwierdził, że "metody AI przebiegają znacznie szybciej niż się spodziewano, co sprawia, że ​​kwestia długoterminowego efektu staje się bardziej pilna" dodając, że "zapewnienie, że ​​coraz silniejsze systemy AI pozostaną całkowicie pod kontrolą człowieka... jest wiele do zrobienia". Niektórzy uczeni, np. Stephen Hawking ostrzegli (w maju 2015 r. przed meczami), że niektóre przyszłe samodoskonalące się AI mogą uzyskać rzeczywisty ogólną inteligencję, prowadzącą do nieoczekiwanego przejęcia nadzoru przez AI; inni uczeni nie zgadzają się: Ekspert AI Jean-Gabriel Ganascia uważa, że ​​"takie rzeczy jak "rozsądek"... nigdy nie będą odtwarzalne" i mówi: "nie rozumiem, dlaczego mówimy o obawach, przeciwnie, to powoduje wiele nadziei w wielu dziedzinach, takich jak badania dotyczące zdrowia i przestrzeni kosmicznej ". Informatyk Richard Sutton "Nie sądzę, że ludzie powinni się bać... ale myślę, że ludzie powinni zwracać uwagę".

Społeczność Go

Go to popularna gra w Chinach, Japonii i Korei, a mecze z 2016 r. były oglądane przez setki milionów osób na całym świecie. Wielu czołowych graczy Go określało grę AlphaGo jako nieortodoksyjne pozornie wątpliwe ruchy, które początkowo zaskakiwały widzów, ale miały sens w dalszej perspektywie: "Wszyscy najlepsi gracze Go doskonalą swój styl, naśladując najlepszych graczy". AlphaGo wydaje się mieć zupełnie oryginalne ruchy poprzez samoistne ich stwarzanie". AlphaGo okazało się nieoczekiwanie silniejsze, nawet w porównaniu z jego meczem z października 2015 r., w którym komputer po raz pierwszy w historii pokonał zawodowego Gracza Go, bez użycia handicapu. Nazajutrz po pierwszej porażce Lee, Jeong Ahram, czołowy korespondent dla jednego z największych dzienników w Korei Południowej, powiedział: "Ostatnia noc była bardzo mroczna... Wielu piło alkohol". Korea Baduk Association, organizacja, która nadzoruje profesjonalistów Go w Korei Południowej, przyznał firmie AlphaGo honorowy 9-dan tytuł za wykazanie umiejętności twórczych i przyspieszenia postępów gry.

Ke Jie, chiński 18-latek powszechnie uznawany za najlepszego gracza na świecie, początkowo twierdził, że będzie w stanie pokonać AlphaGo, ale odmówił grania przeciwko niej, obawiając się, że "mogłaby skopiować mój styl". W miarę postępów w meczach, Ke Jie stwierdził, że "bardzo prawdopodobne jest, że mogę przegrać" po analizie pierwszych trzech meczów, ale odzyskał pewność po tym, jak AlphaGo wykonał błędy w czwartej rozgrywce.

Toby Manning, sędzia meczu AlphaGo przeciwko Fan Hui i Hajin Lee, sekretarz generalny Międzynarodowej Federacji Go, stwierdził, że w przyszłości Go gracze otrzymają pomoc od komputerów, aby dowiedzieć się, co zrobili źle w grach i poprawić swoje umiejętności.

Po dwóch meczach Lee powiedział, że czuje się "oniemiały": "Już od samego początku meczu nie udało mi się zdobyć przewagi nad pojedynczym ruchem, było to całkowite zwycięstwo Alphago". Lee przeprosił za swoje straty, stwierdzając po trzeciej grze, że "źle oceniłem możliwości AlphaGo i poczułem się bezsilny". Podkreślił, że porażka to "klęska Lee Sedola", a nie "klęska ludzkości". Lee powiedział, że jego ostateczna strata przeciwko maszynie "była nieunikniona", ale stwierdził, że ​​"roboty nigdy nie zrozumieją piękna gry tak samo, jak my ludzie". Lee nazwał swoje gry jako cztery zwycięstwa "bezcenne zwycięstwa, których nie wymieniłbym za nic ".

Podobne systemy

Facebook pracuje także nad własnym systemem do gry w Go Darkforest, opartym również na połączeniu nauczania maszynowego i przechodzeniu drzewa. Nie pokonał jeszcze zawodowego gracza. Darkforest przegrał z "CrazyStone" i "Zen" i ma być do nich podobny.

DeepZenGo, system opracowany przy wsparciu portalu Dwango i Uniwersytetu Tokio, przegrał 2-1 w listopadzie 2016 roku z mistrzem Go Cho Chikun, który zajmuje wysokie miejsce w Japonii.

  1. Artificial intelligence: Google’s AlphaGo beats Go master Lee Se-dol – BBC News [online], BBC News [dostęp 2016-03-26] (ang.).
  2. Match 1 - Google DeepMind Challenge Match: Lee Sedol vs AlphaGo. DeepMind 2016-03-08. [dostęp 2017-05-04].
  3. a b c AlphaGo: Mastering the ancient game of Go with Machine Learning [online], Research Blog [dostęp 2016-03-26].
  4. a b c d Google achieves AI 'breakthrough' by beating Go champion, „BBC News”, 27 stycznia 2016 [dostęp 2017-05-04] (ang.).
  5. From AI to protein folding: Our Breakthrough runners-up, „Science | AAAS”, 16 grudnia 2016 [dostęp 2017-05-04] (ang.).
  6. http://www.variational-bayes.org/~dayan/papers/sds94.pdf
  7. a b c David Silver i inni, Mastering the game of Go with deep neural networks and tree search, „Nature”, 529 (7587), s. 484–489, DOI10.1038/nature16961.
  8. a b Jethro Mullen, Computer scores big victory against humans in ancient game of Go [online], CNNMoney, 28 stycznia 2016 [dostęp 2017-05-04].
  9. Zen computer Go program beats Takemiya Masaki with just 4 stones!, „Go Game Guru”, 18 marca 2012 [dostęp 2017-05-04] (ang.).
  10. http://sankei.jp.msn.com/life/news/130320/igo13032020420000-n1.htm
  11. AlphaGo’s unusual moves prove its AI prowess, experts say, „PCWorld” [dostęp 2017-05-04] (ang.).
  12. Game Terminator! Computer wins 'world's most difficult board game', „Mail Online” [dostęp 2017-05-04].
  13. Chris Duckett, Google AlphaGo AI clean sweeps European Go champion | ZDNet, „ZDNet” [dostęp 2017-05-04] (ang.).
  14. Cade Metz, In Major AI Breakthrough, Google System Secretly Beats Top Player at the Ancient Game of Go, „WIRED” [dostęp 2017-05-04] (ang.).
  15. http://www.britgo.org/files/2016/deepmind/BGJ174-AlphaGo.pdf
  16. David Larousserie et Morgane Tual, Première défaite d’un professionnel du go contre une intelligence artificielle, „Le Monde.fr”, 27 stycznia 2016, ISSN 1950-6244 [dostęp 2017-05-04] (fr.).
  17. Samuel Gibbs, Google’s AI AlphaGo to take on world No 1 Lee Se-dol in live broadcast, „The Guardian”, 5 lutego 2016, ISSN 0261-3077 [dostęp 2017-05-04] (ang.).
  18. Google DeepMind is going to take on the world's best Go player in a luxury 5-star hotel in South Korea, „Business Insider” [dostęp 2017-05-04] (ang.).
  19. YouTube will livestream Google’s AI playing Go superstar Lee Sedol in March [online], VentureBeat, 5 lutego 2016 [dostęp 2017-05-04].
  20. 韩国最大的传媒机构《中央日报》中文网 [online], chinese.joins.com [dostęp 2017-05-04].
  21. http://www.baduk.or.kr/news/report_view.asp?news_no=1671
  22. Demis Hassabis on Twitter, „Twitter” [dostęp 2017-05-04] (pol.).
  23. Exploring the mysteries of Go with AlphaGo and China's top players | DeepMind [online], DeepMind [dostęp 2017-05-04].
  24. Matt Burgess, DeepMind's AlphaGo is back..and this time it's taking on five humans at once, „WIRED UK” [dostęp 2017-05-04] (ang.).
  25. 柯洁AlphaGo大战发布会举行 胜者获150万美金 [online], sports.sina.com.cn [dostęp 2017-05-04].
  26. 人机大战第二季5月乌镇见! 慢棋+团队配对赛 [online], sports.sina.com.cn [dostęp 2017-05-04].