Новое ИИ-приложение от DeepMind играет в Stratego на экспертном уровне.

Stratego — это настольная игра для двух игроков, которую сложно освоить. Цель каждого игрока - захватить флаг противника, спрятанный среди их первоначальных 40 игровых фишек. Каждая игровая фигура отмечена рангом — игроки с более высоким рангом побеждают игроков с более низким рангом при ходах. Игра усложняется тем, что ни один из игроков не может видеть маркировку на игровых фигурах противника, пока они не встретятся лицом к лицу.

Предыдущие исследования показали, что сложность игры выше, чем у шахмат или го, с 10⁵³⁵ возможными игровыми сценариями. Этот уровень сложности делает чрезвычайно сложной задачу для компьютерных экспертов, пытающихся создать системы искусственного интеллекта, играющие в Stratego. В этой новой попытке исследователи использовали другой подход, создав приложение, способное превзойти большинство людей и других систем искусственного интеллекта.

Как и в случае с другими конструкциями систем ИИ, DeepNash впервые научился играть в Stratego, играя сам с собой много раз — в данном случае 5,5 миллиарда раз — что эквивалентно сотням лет игрового времени для человека. После того, как он научился играть, исследователи не пытались изучать стратегии у опытных игроков-людей или даже играть против других противников в целом.

Вместо этого исследователи разработали алгоритм, который стремился к оптимальной стратегии для каждого хода, а не к совершенству. Алгоритм был основан на теории игр: оптимальная стратегия давала бы DeepNash как минимум 50/50 шансов на успех при любом заданном ходе — намного больше, чем люди могли бы надеяться достичь.

Тестирование показало, что команда нашла способ улучшить шансы ИИ-приложения, играющего в Stratego — оно достигло рекорда в 84%, сыграв 50 раз на игровой онлайн-платформе, и таким образом вошло в тройку лучших игроков на платформе. сайт. А противникам-людям никогда не говорили, что они играют против компьютера.

В своей статье, опубликованной в журнале Science, группа описывает уникальный подход, который они использовали для повышения уровня игры в приложении.

Источник: Tech Xplore.

Технологии Алгоритмы Искусственный интеллект Машинное обучение