Back to Search
Start Over
AlphaZero: strojno učenje podrškom bez domenskog znanja
- Source :
- Math.e, Volume 39, Issue 1
- Publication Year :
- 2021
- Publisher :
- Croatian Mathematical Society, 2021.
-
Abstract
- U ovom članku ćemo opisati AlphaZero, algoritam tvrtke DeepMind koji tabula rasa (to jest, bez unaprijed implementirane ikakve strategije igranja osim samih pravila) može postići nadljudski učinak u raznovrsnim izazovnim domenama, poput šaha, shogija (japanskog šaha) i igre Go. Predstavljen u [14], ovaj algoritam je uvjerljivo pobijedio ponajbolje svjetske igrače u navedenim trima igrama, a njegovu su izuzetnost šahovski velemajstori usporedili s igrom kakvu bi prezentirala superiorna vanzemaljska vrsta. Stvaranje algoritma koji tabula rasa stječe nadljudsku vještinu u zahtjevnim domenama bio je dugogodišnji cilj umjetne inteligencije te upravo AlphaZero, svojom sposobnošću prilagođavanja raznolikim pravilima igre, predstavlja njegovo ispunjenje i značajan korak naprijed prema ostvarenju općeg sustava za igranje igara. U članku ćemo izložiti osnovne koncepte algoritma AlphaZero, te demonstrirati rezultate dobivene njegovom implementacijom za igru Connect Four (Četiri u nizu) pomoću programskog jezika Python i njegovih dodatnih biblioteka. Za dodatne pojedinosti čitatelja upućujemo na diplomski rad [10].
- Subjects :
- alpha zero
strojno učenje
učenje s podrškom
Subjects
Details
- Language :
- Croatian
- ISSN :
- 13346083
- Volume :
- 39
- Issue :
- 1
- Database :
- OpenAIRE
- Journal :
- Math.e
- Accession number :
- edsair.od.......951..ad807d6b52ae8fe5c28319bd9f6579e1