воскресенье, 6 апреля, 2025
Команда разработчиков из социальной сети Фейсбук представили новый ИИ для игры в покер. Алгоритм, на основе которого работает ИИ, ничем не уступает профессиональным игроками в техасском холдеме, хедзапе и играх с костями.
Подробнее о ReBeL
Программа представляет собой сжатый информационный архив. Ему не требуются обширные знания в предметной области. Он работает на основе анализа ситуации, а также принимает решения в течение нескольких секунд. За основу анализа он берет популярные стратегии и убеждения. Эта разработка получила название ReBeL, что расшифровывается как Recursive Belief-based Learning.
Высказывание одного из основателей звучало так:
«Это будет шагом в будущее, шагом к массовому производству универсальных способов внедрения и взаимодействия искусственного интеллекта в многопользовательские игры. Алгоритмы в основе программы настроены так, чтобы реагировать на массовые настройки участников игры. Проанализировав это, наша программа выявляет наиболее выгодное решение в данном случае. Приложение станет отличным решением для аукционов, создания систем кибербезопасности и, быть может, производства автомобилей».
О конкурентах
Ранее игроки покер онлайн уже наблюдали за подобными попытками создания ИИ для покера. Предыдущие версии работали на основе усиленного поиска и самообучались медленнее. Алгоритмы запоминали поведение клиентов, а затем искали эти паттерны в играх, пытаясь давать прогноз. Этот подход был неэффективен, так как в ходе анализа не учитывались индивидуальные сценарии. Другими словами, люди уникальны, а шанс повторения какого-либо записанного ранее сценария другим человеком крайне мал.
ReBeL же анализирует состояние игроков. Помимо полученных ранее данных о поведении пользователей, программа анализирует настроение игроков в настоящем времени, учитывая ценность призов. В конце концов, программа создает несколько возможных решений. Из этих решений она выбирает одно, которое произойдет наиболее вероятно в данный момент. В учет берутся данные:
1. Рука пользователя.
2. Игровой банк.
3. Количество фишек.
Чтобы проверить успех ReBel AI, система соревновалась с Донг Кимом, который широко известен как один из лучших хедз-ап игроков в покерном сообществе. ReBel удалось играть с гораздо большей скоростью, чем профессионалу: на принятие решений уходило меньше пяти секунд. В ходе испытаний из 7500 раздач ИИ выигрывал у Донга в среднем 0,165ББ за одну раздачу.
Вывод
Создание подобных программ развивает возможности машинного обучения. В будущем искусственный интеллект сможет принимать быстрые решения в различных ситуациях и компенсировать недостаток информации своими новыми методами.
Разработки в сфере ИИ могут отыграть важную роль уже в ближайшем будущем. Сейчас именитые компании из разных отраслей инвестируют большие средства для развития машинного мышления. В данном случае покер является площадкой, на основе которой можно совершенствовать ИИ и далее применять его уже в мировых масштабах.