При игре в покер приходится иметь дело с неполной информацией. Поэтому игра так сложна и больше похожа на реальную ситуацию.

Как однажды сказал великий Кенни Роджерс, хороший игрок должен знать, когда играть и должен знать, когда закончить. На этой неделе в казино Питтсбурга «Rivers Casino» компьютерная программа, которая называется Libratus, возможно, наконец-то докажет, что компьютеры умеют это лучше, чем любой картёжник.

Libratus сыграет серию из тысяч партий в безлимитный техасский холдем (no-limit Texas hold’em), популярную разновидность покера. Состязаться один на один с искусственным интеллектом (ИИ) в течение 20 дней собрались несколько опытных профессиональных покерных игроков. Уже сыграно больше половины запланированных партий. Libratus лидирует, выиграв почти на $800000 больше, чем его соперники из мира людей. Так что, хотя пока ничего нельзя гарантировать, в картах победа ИИ вполне может состояться.

Победа Либратуса была бы огромным достижением в разработке искусственного интеллекта. Покер требует ума и способности размышлять. Как показывает практика, машинам трудно это имитировать. Покер фундаментально отличается от шашек, шахмат или го, так как во время игры руки соперника не видны. В играх с «неполной информацией» невероятно сложно рассчитать идеальную стратегию с учётом любого возможного шага оппонента. Особую остроту игре придают правила безлимитного техасского холдема: соперник может поставить практически любую сумму.

«Покер одна из самых трудных игр для машины»,- говорит Эндрю Нг (Andrew Ng), руководитель исследовательского отдела компании «Baidu». «В игре нет оптимальной линии поведения. Наоборот, интеллектуальная система должна придавать своим действиям случайный характер, чтобы оппоненты не поняли, когда она блефует.»

Либратус создан Туомасом Сандхольмом (Tuomas Sandholm), профессором факультета вычислительной техники университета Карнеги-Меллона, и его аспирантом Ноамом Брауном (Noam Brown). Сандхольм, специалист по теории игр и искусственному интеллекту, эмигрировавший из Финляндии ради докторской степени, считает удивительным, что люди так долго обыгрывают компьютеры. «Я поражён, насколько сильны эти выдающиеся профессионалы. Из всех игр, которые освоил робот, покер единственная игра, в которую машина пока не играет лучше человека.»

Исследователи в области искусственного интеллекта используют теорию игр или математику принятия стратегических решений, чтобы найти лучшую стратегию в условиях неопределённости, эквилибриума. Так как возможных вариантов очень много, обычно используется некоторая форма аппроксимации.

«Насколько удачным или неудачным оказывается ход зависит от факторов, которые не поддаются наблюдению»,- говорит Винсент Конитзер (Vincent Conitzer), профессор и преподаватель ССИ и теории игр из университета Дьюка. «Поэтому приходится быть непредсказуемым. Тот, кто никогда не блефует, плохой игрок. Тот, кто всегда блефует, плохой игрок. Теория игр подсказывает, как придать своей игре случайный характер, так сказать, в оптимальной степени».

В прошлом году Сандхольм руководил разработкой предыдущей программы-игрока в покер. Она называлась Claudico и с треском проиграла в матче против нескольких покерных игроков-профессионалов. Он объясняет, что использование новых достижений позволяет Либратусу достичь такого высокого уровня игры. Это новая техника аппроксимации эквилибриума, а также новые методики анализа возможных результатов, когда на более поздних этапах игры открываются карты. Такой анализ очень сложен с точки зрения вычислений, поэтому проводится во время каждой игры в Питтсбургском суперкомпьютерном центре, который совместно используют университет Карнеги-Меллона и Питтсбургский университет.

Об успехах в области обучения машин и ИИ свидетельствует появление в последнее время играющих программ со сверхчеловеческими способностями. Британская «DeepMind», дочерняя компания американской «Alphabet », разработала программу, которая смогла обыграть одного из лучших в мире игроков в го. Это впечатляющее достижение, потому что го очень сложная игра. Кроме того, во время игры трудно оценить её ход.

Над обучением машин игре в покер работают несколько разных исследовательских групп. Ещё одна академическая группа, куда входят представители университета Альберты из Канады, Карлова университета и Чешского технического университета из Чехии недавно разработала программу под названием DeepStack, которая уже обыграла несколько профессионалов в безлимитный техасский холдем. Однако, говорит Сандхольм, в матче против Либратуса играют намного более сильные игроки, а сам матч состоит из гораздо большего количества партий. Это обеспечивает более надёжный статистический результат.

Техники, используемые при создании более успешного покерного бота, могут найти широкое применение в реальной жизни. Теория игр уже используется в исследованиях в области воздействия преднамеренных помех и кибербезопасности, автоматизированных систем управления для службы такси, подготовки управляющей программы для робота, говорит Сэм Ганзфрид (Sam Ganzfried), принимавший участие в создании Клаудико. В настоящее время он старший преподаватель Флоридского международного университета в Майами.

Но, даже если Либратус триумфально завершит этот матч, это вовсе не будет означать, что человеку больше нечего делать за карточным столом. Использованные машиной технологии не позволяют овладеть версией безлимитного техасского холдема с участием нескольких игроков.

Original

Reviewer
Название
Почему покер имеет такое важное значение для искусственного интеллекта
Описание
При игре в покер приходится иметь дело с неполной информацией. Поэтому игра так сложна и больше похожа на реальную ситуацию.
Автор
Издатель
8d9.ru
Лого
Почему покер имеет такое важное значение для искусственного интеллекта
Оценка