뮤제로 by 바죠

뮤제로 

https://www.nature.com/articles/s41586-020-03051-4

'뮤제로'는 또 하나의 산을 넘었다는 의미로 보인다. 

알파고와 달리 규칙이 주어지지 않았는데도(without rule) 바둑, 체스 쇼기는 물론 아타리 비디오 게임까지 정복(마스터)했다. 

규칙이 없는 상태에서도 이전 알파고들 보다 나은 성과를 낸 것이다.

"세계가 어떻게 돌아가는 지 이해하는 걸 스스로 구축할 수 있고, 이 이해를 미리보기 기획에 적용한 시스템을 처음으로 개발했다"

"뮤제로는 무에서 출발했지만 시행착오를 거쳐 세상의 규칙은 물론 슈퍼맨과 같은 성능을 낼 수 있는 규칙들을 동시에 발견했다"

'알파제로'가 갖고 있던 미리보기(lookahead) 트리 서치와 결합해 '뮤제로'라는 새로운 물건을 만들었다.

알파제로는 화학, 양자물리학 등에 미적용되고 있다. 

"뮤제로의 파워풀한 러닝과 플래닝 알고리즘은 로보틱스, 산업 시스템, 게임의 룰이 알려지지 않은 다른 복잡한 현실 환경 문제를 해결하는데 신기원을 열 것"

알파제로'는 바둑에 이어 체스, 쇼기(일본 장기)도 스스로 독파한 인공지능이다. 
알파고 제로의 일종의 범용 버전이다. 
명칭에서도 바둑을 뜻하는 고(GO)를 뺐다. 
규칙만 알면 모든 보드게임을 익힐 수 있어 바둑에 특화된 알파고를 압도했다. 
알파제로는 2016년 체스 AI 챔피언 스톡피시를 4시간 만에, 2017년 쇼기 AI 챔피언 엘모를 2시간 만에 꺾었다. 
스톡피시와 엘모는 입력된 빅데이터를 기반으로 최적의 수를 검색하는 반면, 알파 제로는 인간의 두뇌처럼 심층신경망 기술을 통해 데이터를 스스로 학습하고 승률을 높이는 좋은 수를 찾아냈다.








핑백

덧글

댓글 입력 영역

최근 포토로그



MathJax