Шахматы – непростая игра. По крайней мере по человеческим меркам. Но для сверхмощного искусственного интеллекта это обычная забава, которую можно освоить за весьма короткое время. В статье, опубликованной в онлайн-библиотеке Arxiv.org, инженеры из Google в деталях рассказывают о том, как их новейшая ИИ-конфигурация AlphaZero смогла развить «сверхчеловеческие возможности» в шахматах всего за несколько часов.
После того, как в систему внесли лишь базовый набор правил (без стратегий), AlphaZero потребовалось всего четыре часа на то, чтобы освоить игру настолько хорошо, что перед ним пал даже самый сильный в мире шахматный движок Stockfish.
После серии из 100 игр против Stockfish ИИ-алгоритм AlphaZero одержал победу 25 раз за игру белыми фигурами и три раза за игру черными. Все остальные партии обе системы сыграли вничью. В итоге Stockfish не смогла победить ни одного раза, а AlphaZero, в свою очередь, ни одного раза не проиграла.
«У нас появился новый повелитель шахмат. Это без сомнений революционизирует игру, но было бы неплохо подумать и о том, как это может быть применено вне шахмат», — прокомментировал результаты Дэвид Крамалей, исследователь шахматной игры и главный редактор сайта Chessable.
Система AlphaZero основывается на наработках ИИ-алгоритмов AlphaGo и AlphaGo Zero, создателями которых являются инженеры лаборатории искусственного интеллекта DeepMind, принадлежащей Google. DeepMind занимается совершенствованием этих ИИ-алгоритмов уже в течение нескольких лет, попутно побеждая с помощью них лучших в мире игроков в древнюю логическую игру го. Кульминация победной серии состоялась в октябре этого года, когда новая и полностью автономная версия ИИ-алгоритма AlphaGo, обучавшаяся исключительно на игре с самой собой, а не против человеческих оппонентов, победила все свои предыдущие версии.
В то же время предыдущие версии алгоритма AlphaGo Zero частично обучались игре с помощью наблюдения за тем, как играют люди. Таким образом разработчики хотели помочь ей в изучении стратегий игры, но, как оказалось, на самом деле это ее лишь замедлило в развитии. Полное предоставление самой себе при обучении сказалось на существенно более эффективных результатах AlphaGo Zero в соревнованиях один на один.
«Это как наблюдать за инопланетной цивилизацией, изобретающей свою собственную математику», — говорил в интервью порталу Gizmodo еще в октябре Ник Хайнс, ученый MIT, работающий в области компьютерных наук.
«То, что мы здесь видим, это самостоятельная, самодостаточная модель, созданная с исключенным фактором человеческих предрассудков. Она самостоятельно способна обучаться тому, что сама посчитает оптимальным, что, безусловно, будет дифференцировать ее от наших собственных концепций».
Однако развитие сферы ИИ происходит настолько быстро, что то, что было достигнуто к октябрю этого года, могло уже устареть. В опубликованной статье инженеры DeepMind отмечают, как самая последняя версия AlphaZero перешла на новый уровень и способна заниматься решением более широкого круга задач. Это означает, что теперь AlphaZero способна не только великолепно играть в шахматы. Она также отлично справляется с сёги (японской настольной игрой) и го, в которых достигнуть совершенства ей удалось всего за 2 и 8 часов соответственно.
Пока ни инженеры Google, ни инженеры DeepMind открыто не выступали с комментариями по поводу новых результатов своей работы, они ожидают стороннего и независимого экспертного анализа статьи в Arxiv.org. Правда, уже понятно, что восхождение данного алгоритма к вершинам искусственного интеллекта еще далеко до своего завершения, но уже сейчас он настолько крут, что его признают даже гроссмейстеры.
«Всегда хотел узнать, как бы выглядела игра в шахматы между более развитыми видами, высадившимися на Земле. Теперь знаю», — прокомментировал результаты AlphaZero гроссмейстер Петер Хейне Нильсен.