[es] - [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

X Files
Vladimir Stefanovic
Pozarevac

SuperModerator
Član broj: 15100
Poruke: 4902
*.dynamic.sbb.rs.

Jabber: xfiles@elitesecurity.org

+638 Profil

[Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{24.12.2017. u 16:40 - pre 77 meseci}

Da li je neko (pro)pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

Ukratko, jedna Google-ova kompanija - DeepMind, specijalizovana za razvoj AI, privukla je pažnju razvojem i primenom inovativnog "General Reinforcement Learning Algorithm" ( https://arxiv.org/pdf/1712.01815.pdf ), koji je sa lakoćom pobedio najbolju OpenSource mašinu za šah STOCKFISH. Prethodno je pobedio i majstora igre GO, što se smatralo teorijom.

Ideja "Reinforcement alogoritma" je da se mašini zadaju samo pravila igre, bez ikakve baze znanja (recimo o otvaranjima), dakle "tabula raza", a ona kasnije kreće sama sa sobom da igra i "uči". Posle određenog vremena (od nekoliko sati), mašina je spremna.

Linkova je mnogo, takođe i YT primera igre sa StockFishom
https://en.chessbase.com/post/...is-here-alphazero-learns-chess
https://www.chess.com/news/vie...ys-stockfish-in-100-game-match
https://deepmind.com/blog/alphago-zero-learning-scratch/

Ako se pogledaju neke odrigrane šahovske partije, zaključuje se da "novi algoritam", u odnosu na tradicionalne algoritme, daleko manje pridaje pažnju osvajanju materijala (figura, odnosno uvećanju sume bodova), već se pažnja usmerava na kvalitet (razvoj i harmoniju figura na tabli). Ovakav stil igre dovodi do prostog "gušenja" protivničkih figura (materijala) na tabli, koje jednostavno kasne sa razvojem štiteći materijal, što neminovno dovodi do gubitka partije u kasnijoj fazi.

_{[Ovu poruku je menjao X Files dana 25.12.2017. u 13:14 GMT+1]}

Odgovor na temu

Branimir Maksimovic

Član broj: 64947
Poruke: 5534
c-bg-d-p3-92.bvcom.net.

+1064 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{25.12.2017. u 15:53 - pre 77 meseci}

Nesto sam pratio nije bas pod fer uslovima pobedio stock fisha ;)

edit:
nesto kao alphazero je nasao nacin da zrtvuje materijaj i postavi poziciju tako da protivnik tu prednost ne moze da iskoristi.
2. stock fish nije koristio tabele otvaranja, a i pitanje je sama komparativnost hardvera posto alpha zero radi na specijalizovanom hardveru.

Odgovor na temu

X Files
Vladimir Stefanovic
Pozarevac

SuperModerator
Član broj: 15100
Poruke: 4902
89.216.51.*

Jabber: xfiles@elitesecurity.org

+638 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{26.12.2017. u 06:10 - pre 77 meseci}

Da, definitivno uslovi nisu ravnopravni da bi se govorilo o jačini jedne spram druge mašine za šah. Ja sam temu "nesrećno" fokusirao samo na šah.

Čak i tih par sati koje je Alpha Zero samog sebe učio da igra šah, sigurno nisu sati desktop računara. Možda je to i nekoliko desetina, stotina ili hiljada godina učenja desktop mašine. Ko će ga znati.

U suštini, poenta je u prikazivanju efektivnosti i efikasnosti tog "reinforcement learning" algoritma, koji se može primeniti u mnoge svrhe. Ne samo za igre jedan na jedan, već i kod raznih vrsta dijagnostika, prognoza i sl. Problem je naravno u dostupnosti podataka i njihovoj količini, da bi algoritam imao ikakvu šansu za učenjem.

Ono što je kod tog algoritma inovativno je da se samo zadaju pravila (igre), a on kasnije igra sam sa sobom i (nekako) uči na greškama.

Pratićemo.

Odgovor na temu

djoka_l
Beograd

Član broj: 56075
Poruke: 3453

Jabber: djoka_l

+1462 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{26.12.2017. u 07:53 - pre 77 meseci}

Jedan dobar video o mogućnostima i slabostima AI:

Odgovor na temu

Cola
Slađan Čolić
Banja Luka

Član broj: 23736
Poruke: 160
213.91.78.*

Sajt: www.knjigaimena.com

+5 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{27.12.2017. u 20:06 - pre 76 meseci}

NIje da ne vjerujem ali da li je stvarno bilo 4h? Ko to može dokazati?
Sa druge strane, kao što mi je kolega rekao, AlphaZero je znao protiv koga se bori i mogao je u ta "4h" da nađe slabosti StockFish-a, dok sa druge strane SF nije mogao unaprijed da se testira protif AZ.
Takođe SF nije koristio bazu otvaranja, a bez nje on ne radi optimizovano.

Nije da nisa impresioniran, to je veliki napredak, ali pitanje je koliko u toj priči ima marketinga...

http://www.knjigaimena.com

Odgovor na temu

Rapaic Rajko
Bgd

Član broj: 4105
Poruke: 810
*.e-info.ba.

+62 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{05.01.2018. u 08:20 - pre 76 meseci}

Znaci, ipak previse neverovatno da bi bilo istinito.

Ne mogu da se setim gde sam citao (engleski) clanak, ali znam da nije pomenuto da ni StockFish nije koristio baze otvaranja; to je receno samo za AlphaZero.
Pa jos kad jedan od svedoka eksperimenta (naucnik i sahista) kaze 'sad znam kako bi vanzemaljska inteligencija igrala sah' - lako se primiti, zar ne?

Ali opet, sama cinjenica da program moze da 'igra' vise razlicitih igrica, uz (relativno) malo adaptacija, to vec nesto znaci.
Sa zanimanjem cekamo dalja desavanja

Odgovor na temu

X Files
Vladimir Stefanovic
Pozarevac

SuperModerator
Član broj: 15100
Poruke: 4902
*.static.isp.telekom.rs.

Jabber: xfiles@elitesecurity.org

+638 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{08.01.2018. u 08:31 - pre 76 meseci}

Slažem se, deluje nestvarno!

Pitam se, ukoliko ovakav algoritam stvarno radi na način kako su rekli, koliko mu je zapravo čovek asistirao (koliko ga je usmerio baš za šah), a koliko je algoritam sam zaključio kako da igra, na primer koja otvaranja da koristi. Iz priloženih partija se vidi da se ipak fokusirao na nekoliko. Žrtva od dva pešaka u početnoj fazi partije (da bi se razvile svoje jače figure i usput ugušile protivnikove), zaista je neuobičajena u konvecncionalnom šahu.

Ponoviću tvoju rečenicu, "sa zanimanjem cekamo dalja desavanja", pa makar na kraju rekli da je fejk ;)

Odgovor na temu

mjanjic
Šikagou

Član broj: 187539
Poruke: 2707

+700 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{08.01.2018. u 12:22 - pre 76 meseci}

Ko je bar malo upoznat sa neuronskim mrežama, ima neku predstavu kako složenost (broj slojeva, čvorova po sloju, i sl.) te neuronske mreže drastično utiče na to šta ta neuronska mreža može "naučiti", tj. za kakve je poslove sve možemo "istrenirati" da radi perfektno.

Na kraju krajeva, i ljudski mozak je jedna veoma složena neuronska mreža (sa oko 80 i nešto više milijardi neurona, plus koliki broj sinapsi između njih), samo što je takozvani "Neural coding" malo problematičan kod bioloških neurona. Neke stvari su odgonetnute, ali neke su još uvek nedokučive.
Na kraju krajeva, još uvek nije do kraja baš jasno šta je to svest, biologija se bavi jednim pogledom, a psihologija potpuno drugim.

Međutim, ono što mi je najinteresantnije kod Google-ovog rešenja je da AI navodno "vidi" samo sirove piksele i da mora sam da "nauči" i "shvati" o čemu se radi i kako da upravlja nekom igrom (prvo su krenuli sa jednostavnim arkadnim igrama, pa prešli na 3D vožnje, itd.).
Ovde se postavlja pitanje kako AI "zaključuje" šta je najveći uspeh u nekoj igri? Ispada da oni to kao nisu isprogramirali, a praktično su za svaku igricu morali posebno da pripreme AI kako bi ga pustili da sam "uči"? Ako sam zaključuje na osnovu grafičkog prikaza piksela šta treba da radi, onda mogu odmah da mu puste bilo koju igricu da nači ili bilo šta drugo, nema potrebe za posebnu "pripremu".

Očigledno je da u ovom delu (AI "vidi" samo piksele i nema ugrađenu logiku kako igra funkcioniše niti pravila) ima više marketinga nego bilo čega drugog, jer je očigledno da oni moraju da isprogramiraju poseban interfejs za svaku od igara koje su do sada "savladali", a da li će AI da "vidi" piksele preko posebnog interfejsa preko koga "razume" šta na ekranu znači vreme (npr. kod simulacije auto trka), a šta osvojeni poeni ili izgubljena loptica i sl. (npr. kod igre "breakout"), ili će AI da ima ugrađeno razumevanje za određenu igru, praktično je isto. Oni su samo sve to razdvojili u više slojeva, pa je AI u posebnom sloju i ne mora se posebno prilagođavati za različite namene (general purpose neural network), ali se interfejs za ulaz i izlaz podataka mora posebno pripremati za svaku primenu.

Inače bi jednostavno mogli da mu priključe kameru i puste da počne da uči o svetu oko nas.

A svako može da iskoristi neko od Open Source rešenja za AI bazirano na neuronskim mrežama i pokušati da ga istrenira da npr. igra šah, samo... mora se napraviti interfejs preko koga će igrati šah (bilo protiv nekog postojećeg računarskog programa ili same sebe) i/ili čitati poteze odigranih partija iz neke baze, a mora se imati i dovoljno moćan hardver da se u razumnom vremenu kvalitetno odradi "treniranje".

Blessed are those who can laugh at themselves, for they shall never cease to be amused.

Odgovor na temu

X Files
Vladimir Stefanovic
Pozarevac

SuperModerator
Član broj: 15100
Poruke: 4902
*.static.isp.telekom.rs.

Jabber: xfiles@elitesecurity.org

+638 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{08.01.2018. u 13:02 - pre 76 meseci}

Citat:

Međutim, ono što mi je najinteresantnije kod Google-ovog rešenja je da AI navodno "vidi" samo sirove piksele i da mora sam da "nauči" i "shvati" o čemu se radi i kako da upravlja nekom igrom (prvo su krenuli sa jednostavnim arkadnim igrama, pa prešli na 3D vožnje, itd.).
Ovde se postavlja pitanje kako AI "zaključuje" šta je najveći uspeh u nekoj igri? Ispada da oni to kao nisu isprogramirali, a praktično su za svaku igricu morali posebno da pripreme AI kako bi ga pustili da sam "uči"? Ako sam zaključuje na osnovu grafičkog prikaza piksela šta treba da radi, onda mogu odmah da mu puste bilo koju igricu da nači ili bilo šta drugo, nema potrebe za posebnu "pripremu".

Ovaj deo te nisam najbolje razumeo. Zapravo, prema Google-u, sva pravila igre JESU (nekako) zadali, što znači i da se zna šta je cilj. Strategiju nisu zadali (npr. standardna otvaranja) ili tehnike matiranja. Ako sam dobro shvatio, nakon zadavanja pravila, mašina igra sama protiv sebe, od "najglupljih poteza" i nekako uči na greškama i uspesima. E sad, i meni ovo deluje nadrealno...

Odgovor na temu

mjanjic
Šikagou

Član broj: 187539
Poruke: 2707

+700 Profil

Re: [Kompjuterski šah] Da li je neko pratio nedavna dogadjanja oko DeepMind AlphaZero projekta?

^{31.03.2018. u 13:59 - pre 73 meseci}

Hasabis na jednoj konferenciji govori u starim arkadnim igrama, na kojima su prvo testirali svoj AI, i tu pominje da AI zapravo "vidi" samo sirove piksele i da mu nije pruženo nikakvo "znanje" o tome kako igra funkcioniše i šta je cilj igre. Ispada da to i nije baš tako, jer su morali za svaku igru da pripreme AI kako bi mogo da počne "samotreniranje".
Ako su uspeli da istreniraju AlphaGo da pobedi i najjačeg profesionalca, šah je bio dečja igra imajući u vidu daleko manju tablu i broj kombinacija, plus mnogo lakšu procenu pozicije (daleko lakše istrenirati neuronsku mrežu; ne kažem da je lako, nego daleko lakše nego za Go).

Na istoj konferenciji je prezentovano par radova iz projekta Human Brain Project, u okviru koga se neki naučnici bave time kako simulirati rad ljudskog mozga direktno pomoću hardvera. Neki su predložili posebne arhitekture procesora, gde bi na samom CPU bilo daleko više memorije, a manje logičkih jedinica, jer se praktično pri simulacijama rada mozga određenih životinja čiji je mozak relativno jednostavan u odnosu na ljudski, većina vremena potroši na komunikaciju sa memorijom.

Međutim, ne vidim da će bilo šta da se postigne i stavljanjem tipa 32GB memorije na istu silikonsku pločicu na kojoj je i sam ALU, jer je problem u celoj arhitekturi svih današnjih procesora opšte namene: logička jezgra praktično rade sa registrima, kojih ima vrlo ograničen broj.
Možda bi bilo dobro pokušati sa grafičkim karticama, gde npr. GTX 1080Ti ima 3584 CUDA jezgara, dok GeForce GTX TITAN Z ima čak 5760 CUDA jezgara. Ne znam da li su dostupne u prodaji kartice sa nVidia Volta tehnologijom (prošle godine dostupne samo određenim grupama naučnika), niti se zna cena, ali imajući u vidu da za "obične" istraživače Titan V košta 3000$, ko zna koliko košta Volta.
Ali, to je još jedan pravac u kojem će se ići u budućnosti, naročito kad se ima u vidu propusni opseg memorijske magistrale.

Blessed are those who can laugh at themselves, for they shall never cease to be amused.

Odgovor na temu