Hamelion

Оперативные новости, плюрализм мнений

Наука

Новые шахматные правила были оценены искусственным интеллектом AlphaZero

Искусственный интеллект (ИИ) поистине виртуозен там, где безотказно действуют законы математической логики. Примером тому служит игра в шахматы, которая готова претерпеть некоторые изменения для того, чтобы стать еще более привлекательной для игроков во всем мире.

О том, как ИИ помогает проверить возможность внесения изменений в игру, рассказывает сегодня шахматный портал ChessBase.

* * *

Изменение существующих правил для шахмат, попытка сделать их более динамичными — нетривиальная задача: вам понадобятся годы опыта и большое количество людей, играющих в новые версии, чтобы оценить качество и привлекательность любого нового варианта. Бывший чемпион мира по шахматам Владимир Крамник предложил девять новых вариантов, и DeepMind использовала свою технологию ИИ, чтобы оценить их в гораздо более короткие сроки.

AlphaZero — это система обучаемого ИИ, которая может изучать оптимальные стратегии для любого набора правил с нуля без какого-либо человеческого вмешательства и обеспечивает компьютерное моделирование игры как альтернативу для балансировки игры. AlphaZero демонстрирует свой потенциал для использования в качестве инструмента для творческого исследования и разработки новых вариантов шахматных правил. Учитывая растущую глубину знаний шахматной дебютной теории, высокий процент ничьих в профессиональной игре и немалое количество партий, которые заканчиваются, пока оба игрока все еще готовятся к игре дома, в последнее время наблюдается растущий интерес к вариантам шахмат, таким как шахматы Фишера.

AlphaZero была использована для изучения девяти вариантов шахмат, которые включают атомарные изменения в правилах шахмат, сохраняя игру, близкую к оригиналу, но позволяя использовать новые стратегические и тактические модели. Эффективно моделируя десятилетия человеческой игры за считанные часы, AlphaZero может ответить, как потенциально могли бы выглядеть игры между хорошо подготовленными людьми, если бы эти варианты были приняты. В этом процессе программа выделила несколько вариантов шахмат, которые оказались очень динамичными и интересными. Полученные данные демонстрируют богатые возможности, которые выходят за рамки современных шахматных правил.

Разработка правил — важная часть разработки игры, и небольшие изменения правил игры могут иметь большое влияние на общую игровую возможность и динамику игры. Тонкая настройка и балансировка наборов правил в играх часто является трудоемким процессом, а автоматизация процесса балансировки — это открытая область исследований, где недавно были использованы машинное обучение и эволюционные методы, чтобы помочь разработчикам игр более эффективно балансировать игры. Здесь исследуется потенциал AlphaZero для использования в качестве инструмента исследования игрового баланса и игровой динамики при различных наборах правил в настольных играх, взяв шахматы в качестве примера использования.

Популярные игры часто развиваются со временем, и современные шахматы не исключение. Считается, что первоначальная игра в шахматы зародилась в Индии в шестом веке, откуда она сначала распространилась в Персию, затем в мусульманский мир, а затем в Европу и весь остальной мир. В средневековье европейские шахматы все еще в значительной степени основывались на Шатранге, раннем варианте, пришедшем из Сасанидской империи, который был основан на индийской Чатуранге. Примечательно, что ходы ферзя и слона были гораздо более ограниченными, а фигуры не были такими мощными, как в современных шахматах. Рокировки не существовало, но прыжок короля и прыжок ферзя существовали как особые первые ходы короля и королевы. Помимо мата, также можно было выиграть, «обнажив» короля противника, оставив фигуру в одиночестве, а ее армию — захваченной.

Эволюцию шахматных вариантов на протяжении веков можно рассматривать через призму изменений в сложности пространства поиска и неопределенности ожидаемого конечного результата на протяжении всей игры, причем последнее подчеркивается современными правилами и считается важным для общей ценности развлечения. Современные шахматы были появились в XV веке и являются одной из самых популярных игр на сегодняшний день, захватывая воображение игроков по всему миру.

Интерес к дальнейшему развитию шахмат не ослабевает, особенно с учетом уменьшения количества решающих партий в профессиональных шахматах и растущей зависимости от теоретической и домашней подготовки с шахматными имитаторами. Эта тенденция, вкупе с любопытством и желанием поработать с такой вдохновляющей игрой, породила множество вариантов шахмат, которые предлагались на протяжении многих лет. Эти варианты включают изменения доски, расстановки фигур или правил — это должно предложить игрокам «что-то тонкое, искрящееся или забавное, чего нельзя сделать в обычных шахматах». Вероятно, самый известный и популярный вариант шахмат — это так называемые шахматы 960 или случайные шахматы Фишера, в которых фигуры первого ранга помещаются в одну из 960 случайных перестановок, что делает теоретическую подготовку невозможной.

AlphaZero продемонстрировала самые современные результаты в игре го, шахматах и сёги, при этом система обучалась самостоятельно без какого-либо человеческого контроля. AlphaZero также показала многообещающие перспективы за пределами игровых сред, как показывает недавнее применение модели для глобальной оптимизации квантовой динамики.

Есть много способов изменить правила шахмат, и недостаточно рассматривать только атомарные изменения, которые максимально приближают игру к классическим шахматам. В некоторых случаях необходимо было внести вторичные изменения в правило 50 ходов, чтобы избежать потенциально бесконечных игр. Идея заключалась в том, чтобы попытаться сохранить симметрию и эстетическую привлекательность оригинальной игры, в то же время раскрывая динамические варианты с новыми моделями дебюта, миттельшпиля или эндшпиля и новым вариантом дебютной теории. Поэтому не рассматривалось никаких изменений, связанных с изменением самой доски, количества фигур или их расположения.

Каждое из гипотетических изменений правил, перечисленных в таблице ниже, потенциально может повлиять на игру желаемым или нежелательным образом. В качестве примера можно рассмотреть шахматы без рокировки. Одним из возможных результатов запрета рокировки является то, что это приведет к агрессивному стилю игры и атакующим играм, учитывая, что короли более уязвимы во время игры, и требуется время, чтобы увести их в безопасное место. Тем не менее, неспособность легко защитить своего короля может сделать саму атаку плохим выбором из-за возможностей контратаки, которые открываются для защищающейся стороны. В классических шахматах игроки обычно рокируются перед атакой. Следовательно, такое изменение можно также рассматривать как ведущее к беспристрастной игре и гораздо более сдержанному подходу к игре.

Исторически сложилось так, что единственный способ оценить такие идеи, заключается в том, чтобы проанализироватьогромное количество партий, сыгранных людьми в течение длительного периода времени, для того, чтобы накопить достаточно опыта и понимания. Это не только длительный процесс, но и для начала он требует поддержки большого числа игроков. AlphaZeroсмогла автоматизировать этот процесс и смоделировать эквивалент десятилетий человеческой игры в течение дня, что позволяет проверить все гипотезы в имитационной модели и наблюдать возникающие закономерности и теории для каждого из рассматриваемых вариантов игры.

Список рассматриваемых изменений в правилах игры в шахматы.

Вариант Изменение основного правила Изменение вторичного правила
Без рокировки Рокировка запрещена на протяжении всей игры. -
Без рокировки (10) Рокировка запрещена первые 10 ходов -
Пешка на одно поле Пешки могут двигаться только на одно поле -
Пат = победа Форсирование патовой ситуации — это скорее победа, чем ничья -
Торпедо Пешки могут двигаться на 1 или 2 клетки влюбом месте доски. Взятие на проходе может произойти где угодно на доске. -
Полуторпеда Пешки могут двигаться на два поля как со 2-го, так и со 3-го ряда. -
Пешка Пешки могут двигаться назад на одно поле, но только на 2/7 ряд для белых / черных соответственно. Ходы пешек не учитываются в правиле 50 ходов
Пешка боком Пешки также могут двигаться вбок на одно поле. Захваты без изменений, по диагонали вверх Боковые ходы пешкой не учитываются в правиле 50 ходов
Самозахват Можно снимать собственные фигуры -

Чтобы оценить различия в игре между набором шахматных вариаций, используется количественная оценка вариаций и экспертный анализ, основанный на большом наборе репрезентативных партий. Хотя общее количество решений и дебютное разнообразие добавляют привлекательности любому шахматному варианту, субъективные вопросы эстетической ценности и типов позиций, ходов и паттернов, которые возникают, невозможно полностью уловить количественно. Чтобы дать глубокую качественную оценку привлекательности этих шахматных вариаций, необходимо опереться на опыт шахматного гроссмейстера Владимира Крамника, бывшего чемпиона мира по шахматам и большого авторитета в этой игре. Характеризуя типичные образцы, игроки сами должны судить, найдут ли они некоторые из этих шахматных вариантов достаточно интересными, чтобы опробовать их на практике.

Читайте ранее в этом сюжете: Microsoft в Индии обучит миллион студентов искусственному интеллекту

Источник