Нейросеть AlphaZero всего за четыре часа научилась безупречно играть в шахматы

08 декабря 2017, 11:45

Спустя 20 лет после того, как компьютерная программа DeepBlue победила чемпиона мира Гарри Каспарова, в шахматах грянула новая революция. Алгоритму AlphaZero, разработанному Google и DeepMind, хватило всего четырех часов игры с самим собой, чтобы синтезировать шахматные знания человечества за полтора тысячелетия и достичь уровня, который не только превосходит людей, но и позволяет громить чемпионов среди компьютерных алгоритмов. Все блестящие хитрости и утонченности, которые программисты использовали для создания шахматных движков, были отправлены на свалку истории, отмечает портал Chess24.com Нейросеть победила сильнейшую шахматную компьютерную программу Stockfish 8 в ста партиях, не проиграв ни одной. Играя белыми, AlphaZero добилась 25 побед при 25 ничьих. Без преимущества первого хода ей удалось выиграть три партии при 47 ничьих. Итого в ста играх нейросеть одержала 28 побед, сведя остальные 72 вничью. Как утверждают разработчики, AlphaZero достигла этого уровня всего через четыре часа после того, как в нее были загружены только базовые правила игры в шахматы, без дополнительных сведений о тактике, алгоритмах и дебютах. В отличие от традиционных шахматных программ, AlphaZero выбирает ход не за счет перебора возможных вариантов, а применяя собственные алгоритмы, выработанные при самообучении. Для сравнения: AlphaZero рассматривала 80 тысяч позиций за секунду, тогда как Stockfish - до 70 миллионов. Ранее детище DeepMind потратило два часа на постижение сеги (японские шахматы) и за восемь часов научилась безупречной игре в го. По мнению компании-разработчика, в будущем подобные нейро-алгоритмы смогут решать важные исследовательские задачи, включая разработку новых лекарств и материалов.