이것은 TensorFlow를 사용하여 신경망 기반 Go AI의 구현입니다. 딥 마인드의 알파고 알고리즘에서 영감을 동안,이 프로젝트는 딥 마인드 프로젝트가 아니며 공식 AlphaGo 프로젝트와 제휴하지 않습니다. 5 월에 2016, 구글은 자체 하드웨어 “텐서 처리 장치”를 발표, 그것은 이미 구글에서 여러 내부 프로젝트에 배포 했다 명시, 리 세돌에 대 한 알파고 일치를 포함 하 여. [57] [58] 4개월 후 중국 정상회담, 알파고는 바둑의 발상지인 중국에서 열린 바둑 정상회의의 미래에 참여했다. 5일간의 축제는 바둑의 신비를 국내 최고의 선수들과 상호 협력하는 정신으로 탐구할 수 있는 기회를 제공했습니다. 더욱 전략적인 움직임을 발굴하기 위해 고안된 이 정상회담에는 페어 바둑, 팀 바둑, 세계 최고의 선수 Ke Jie와의 매치 등 다양한 게임 형식이 포함되어 있습니다. 결국 프로 팀은 1~2점을 얻기 위해 까다로운 움직임을 보였습니다. AlphaGo 관대 하게 그들에게 훨씬 더 준 – 그것은 지금까지 앞서 그 차이를 만들지 않았다. 반응: 시스템의 신경망은 처음에는 인간의 게임 플레이 전문 지식에서 부트스트랩되었습니다. AlphaGo는 처음에 약 3천만 이동의 데이터베이스를 사용하여 기록 된 역사적 게임에서 전문 플레이어의 움직임을 일치시키려고 시도하여 인간의 플레이를 모방하도록 훈련되었습니다.
[20] 어느 정도 숙련도에 도달하면, 강화 학습을 통해 플레이를 향상시키기 위해 다른 인스턴스에 대해 많은 수의 게임을 플레이하도록 설정하여 더 많은 훈련을 받았습니다. [4] 상대방의 시간을 “무례하게” 낭비하지 않으려면, 승리 확률에 대한 평가가 특정 임계값 아래로 떨어지면 이 프로그램은 특히 사임하도록 프로그램되어 있습니다. 이대호와의 경기에서는 사임 문턱을 20%로 설정했다. [63] AlphaGo의 2016년 3월 승리는 인공 지능 연구의 중요한 이정표였습니다. [66] Go는 이전에 는 당시 의 기술에 도달할 수 없을 것으로 예상되는 기계 학습의 어려운 문제로 간주되었습니다. [66] [67] [68] 대부분의 전문가들은 AlphaGo만큼 강력한 바둑 프로그램이 적어도 5년 이상 떨어져 있다고 생각했습니다. [69] 일부 전문가들은 컴퓨터가 Go 챔피언을 이기기까지 적어도 10년이 걸릴 것이라고 생각했습니다. [11] [70] [71] 2016년 경기 초반 대부분의 관측자들은 이승우가 알파고를 이길 것으로 예상했다. [66] 시간이 지남에 따라 AlphaGo는 개선되었고 학습과 의사 결정에 점점 더 강하고 더 나아졌습니다. 이 과정을 강화 학습이라고 합니다.
AlphaGo는 다른 글로벌 경기장에서 바둑 세계 챔피언을 물리 치고 틀림없이 모든 시간의 가장 큰 바둑 선수가되었다. Nature의 2018년 논문은 잠재적인 제약 약물 분자를 컴퓨팅하는 새로운 수단의 기초로 AlphaGo의 접근 방식을 인용했습니다. [92] 2017년 5월 우젠에서 개최된 바둑 정상회의의 미래에서 알파고 마스터는 세계 랭킹 1위인 Ke Jie와 3경기를 치렀고, 중국 최고의 프로 선수들과 함께 두 경기를 치렀고, 한 쌍의 바둑 게임과 5명의 인간 선수로 구성된 팀을 상대로 한 경기를 치렀습니다. [45] 2016년 12월 29일, 한국의 티젬 서버 “Magister”(서버중국어판에서 `Magist`로 표시)의 새로운 계정이 프로 플레이어들과 게임을 하기 시작했습니다. 12월 30일에 계정 이름을 “마스터”로 변경한 다음 2017년 1월 1일에 FoxGo 서버로 이동했습니다. 1월 4일, 딥마인드는 “마법사”와 “마스터”가 알파고 마스터라고 불리는 알파고의 업데이트된 버전으로 플레이되었다는 것을 확인했습니다. [40] [41] 2017년 1월 5일 현재, AlphaGo Master의 온라인 기록은 60승 0패였으며, [42] 바둑의 최고 랭킹 선수 인 Ke Jie를 상대로 3번의 승리를 거두었으며, [43] 마스터는 알파고 버전이라는 사실을 미리 브리핑했습니다. [42] 마스터에게 패한 후, 구리는 마스터를 물리칠 수 있는 최초의 인간 플레이어에게 10만 위안(미화 14,400달러)의 현상금을 제공했다.
[41] 마스터는 하루에 10경기의 페이스로 경기를 했다. 많은 사람들이 게임 사이에 거의 또는 전혀 쉬지 않아 AI 플레이어라고 빠르게 의심했습니다.