DeepNash: Искусственный интеллект освоил стратегию в игре Stratego

Искусственный интеллект шагнул на новую вершину, освоив классическую игру Stratego, которая развитее, чем шахматы и го, и требует стратегического мышления. В опубликованной работе в журнале Science представлен DeepNash — ИИ, который обучился этой игре с нуля и достиг уровня человеческих экспертов, играя против самого себя.

DeepNash использует новаторский подход, основанный на теории игр и методах глубокого обучения без модели. Стратегия ИИ стремится к равновесию Нэша, что делает его игру практически неуязвимой для соперников. В результате DeepNash занял одно из трех лучших мест на крупнейшей онлайн-платформе Stratego, Gravon.

Stratego представляет собой игру с несовершенной информацией, где игроки не видят фишек противника. Этот аспект усложняет задачу для ИИ, который должен балансировать между различными возможными исходами. Метод, названный Регуляризованной динамикой Нэша (R-NaD), позволил DeepNash добиться невероятных показателей, включая 100% побед над лучшими ботами по Stratego.

Достижения DeepNash могут быть полезны не только в играх, но и в реальных задачах с ограниченной информацией, изменяя подходы к решению сложных проблем.

*компания Meta Platforms Inc. признана экстремистской организацией, ее деятельность на территории России запрещена