Программы, основанные на технологии искусственного интеллекта, побеждают лучших из людей в шашки, шахматы и Го ‑ довольно сложных играх, в которых оба игрока в любое время точно знают игровой расклад.

Портал The Economic Times рассказывает о Libratus, системе искусственного интеллекта, которая в этом году успела победить четырёх лучших профессиональных игроков в покер, использует в игре трёхсторонний подход, где вариантов решения, как говорят учёные, больше, чем атомов во Вселенной.

В исследовании, опубликованном в журнале Science, сотрудники американского университета Карнеги-Меллон наглядно продемонстрировали, как их программе ИИ удаётся достичь невозможных для человека показателей путём разделения игры на поддающиеся вычислению части и избавления от потенциальных недостатков своей стратегии по ходу состязания, основываясь на манере игры оппонента.

Программы, основанные на технологии искусственного интеллекта, побеждают лучших из людей в шашки, шахматы и Го ‑ довольно сложных играх, в которых оба игрока в любое время точно знают игровой расклад.

Игроки в покер, напротив, соревнуются друг с другом, используя в игре скрытую информацию: какие карты держат противники и не блефуют ли они.

Во время прошедшего в январе 20-дневного состязания в Rivers Casino в Питтсбурге, где было осуществлено 120 000 карточных раздач, Libratus стал первым искусственным интеллектом, победившим лучших игроков в Техасский Холдем без ограничений, который был основным ориентиром и давней проблемой для машинного разума с его несовершенными игровыми решениями.

Libratus побил каждого из игроков индивидуально в игре с двумя игроками, а также в общем зачёте, накопив фишек на сумму более 1,8 млн долларов.

«Алгоритмы Libratus не используют экспертные знания в конкретных областях или полученные от людей данные и предназначены не только для покера. Таким образом они используются во многих основанных на неполной информации играх», ‑ говорят исследователи.

Скрытая информация такого рода применяется повсюду в реальных стратегических взаимодействиях, включая деловые переговоры, сферу компьютерной безопасности, финансы, стратегическое ценообразование и в военных целях.

Libratus включает в себя три основных модуля, первый из которых вычисляет абстрактную схему игры, которой легче и меньше, чем в случае рассмотрения всех возможных вариантов решений, а их в игре примерно 10 в степени 161.

Затем он создает собственную детальную стратегию для первых раундов матча в Техас Холдем и примерную стратегии для последующих раундов. Эта стратегия называется «черновой стратегией».

В финальных раундах игры второй модуль создает новую, более детализированную абстрактную схему, основанную на игровом раскладе.

Он также в режиме реального времени вычисляет стратегию для этой части игры, что уравновешивает стратегии для различных частей игры с использованием черновой стратегии в качестве руководства ‑ что необходимо для того, чтобы найти безопасные игровые решения.

Третий модуль предназначен для совершенствования черновой стратегии по ходу состязания. Как правило, искусственный интеллект использует машинное обучение, чтобы найти ошибки в стратегии противника и воспользоваться ими.

Тем не менее, как говорит Сэндхолм, это также делает искусственный интеллект уязвимым в случае, если противник изменит стратегию.

Вместо этого самообучающийся модуль Libratus анализирует размеры ставок оппонентов, чтобы выявить потенциальные недостатки черновой стратегии.

Затем Libratus добавляет эти недостающие ветви решений, вычисляет для них стратегии и добавляет их в план.

В дополнение победам над живыми профессиональными игроками, Libratus был опробован против лучших старых образцов искусственного интеллекта для игры в покер.

«Методы, которые мы разработали, по большей части являются независимыми от областей применения и могут использоваться для других стратегических взаимодействий на основе неполной информации, в том числе для вариантов, не предназначенных для развлечения», ‑ говорят исследователи.

Они также добавили: «Из-за повсеместного распространения скрытой информации в стратегических взаимодействиях реального мира мы считаем, что парадигмы, представленные в Libratus, будут иметь решающее значение для будущего развития и обширного применение ИИ».

Искусственный интеллект Libratus разделался с 4 лучшими профессиональными игроками в покер
Оценка