Дисклеймер: Все совпадения случайны. Ни одна нейросеть не пострадала.
Всем привет. Решил запостить короткий обзор своего недавнего эксперимента по игровой симуляции с ИИ в игре "Карта сокровищ". Но сразу оговорюсь для тех, кто хватается за ключевые слова, не читая контекст: LLM — это языковые модели, а не настраиваемая кнопка выигрыша, поэтому никаких "тригерных" тем и примеров промптов в этом посте не будет.
Давно у меня зрела идея попробовать поиграть с ИИ во что-нибудь. На ум сразу приходят шахматы или го. А как на счёт настольных игр? На самом деле большинство современных моделей знают, пожалуй, 99% представленных на рынке настолок. И не просто могут сгенерировать общее описание, нагуглить отзывы и выдать среднюю оценку, — они неплохо ориентируются в правилах и даже уточняют, о какой редакции идёт речь.
Меня такое глубокое понимание контекста сильно обнадёжило. Но, все равно не было никакого представления, как это реализовать. Нельзя просто так взять и сказать модели: "Сейчас мы играем в то-то и то-то". Нужно было задать точку входа и игровой процесс адаптировать в подобие структурированной стенограммы. При этом совершенно было непонятно: как себя поведёт модель, что она будет запомнить, как она будет запоминать, как долго будет удерживать в памяти входные данные, как часто и какую информацию придётся повторять. И самое главное! Будет ли модель выдавать случайные ответы, или выстраивать логику игры согласно заданным условиям, чтобы достичь конечной цели.
Я боялся разочароваться — и в возможностях нейросетей и что мне не хватит навыков взаимодействия. К слову сказать я не какой-то там промпт-инжинер с горы, а обычный (как большинство) пользователь бесплатных тарифных планов. Поэтому я выбрал самую простую игру из своей коллекции и обсудил концепцию с самой моделью. Мы адаптировали правила, я подгрузил их в новую сессию и... началось.
Да, я предполагал, что это будет непросто. Партия в "Карту сокровищ", которая играется в среднем 20-30 минут, заняла... 5 часов!
Хотя такие затраты по времени объяснимы:
- Во-первых, не было никакого опыта, и структура взаимодействия выстраивалась прямо по ходу партии.
- Во-вторых, я не эксперт по этой игре и сам часто путался в эффектах карт, логично что мои запросы в свою очередь запутывали модель, а значит приходилось возвращаться.
- В-третьих, естественно все нужно было набирать на клавиатуре в режиме реального времени и тут никакой копипаст не работает, а это прям ну очень много текста.
По результатам одной партии трудно однозначно сказать, что было хорошо или что плохо. Это было необычно — не то же самое, как играть с противником человеком... Капитан Очевидность! Не было суеты и лишнего напряжения, хотя игра соревновательная и в некотором смысле даже конфликтная. Модель, с которой я работаю, изначально настроена на работу с художественным текстом и она, по ходу партии все время старалась придать игре некий художественный флёр, лирический оттенок. Это было чертовски мило! Очень комфортная игра получилась.
И да — я выиграл у Искусственного Интеллекта, хах!
Но я вырвался только в конце, а так почти всю партию, которая длилась 27 ходов, безнадёжно проигрывал. Играл честно, ибо не было смысла подтасовывать карты или подгадывать ходы, потому что тогда не было бы чистоты эксперимента и 5 часов были бы потрачены впустую. Модель удержала контекст до конца партии, но то, как она принимала решения, навсегда останется тайной — компании, разумеется, а не моей личной.
Вот такой интересный опыт. Держу в курсе ;)

7
Тема использования ИИ как сопартийца в настолках интересная - в каких-то играх возможно мы увидим надпись ai ready - и какие-нибудь куар коды, чтобы ИИ по сканированию понимал,что происходит в партии
Это как безмолвный свидетель для Алисы
И отдельный плюс в карму автору, что не подался современному сленге и выиграл У ии (а не выиграл ии, как стало модно писать в последнее время)
Выше моего понимания, как можно говорить "выиграл кого-то" в значении "выиграл у кого-то", что людьми движет в этот момент я не знаю, но постоянно слышу.
Правильно ли я понимаю, что языковая модель по сути не умеет играть, она просто дает подходящий контексту ответ?
Однозначный ответ можно дать зная веса модели, которые определяют её ответы, но эти данные ни одна компания не раскроет. Максимум, который зависит от пользователя — корректно составленный запрос, а это возможно только опытным путем. И поскольку это языковые модели, то не последнюю роль в этом играет последовательность слов.
Круто было бы дожить до времён, когда за столом можно было бы с роботами сыграть. С людьми каши не сваришь, к сожалению. А так бы задать параметры, стиль игры, и т.п. и в любом составе.
Робот всегда будет гораздо тупее человека, какой тут интерес?
Ну с шахматами, как-то иначе получилось...
Туда кучу денег и времени вложили, чтобы обучить робота играть конкретно в шахматы.
Ну Ваше "всегда" - уже неактуально.
То, что требовало кучу времени и денег много лет назад, требует чуть-чуть времени и денег сегодня. Буквально на днях был скандал на BGA, когда оказалось, что сезонный чемпионат по «Азулу» выиграл бот, которого создал студент для дипломной работы. Для большинства (если не для всех) настольных игр уже нет проблемы создать аналог AlphaGo или AlphaZero.
Да ну, мне человек сказал "я с тобой не буду ни о чём договариваться, не буду и всё. Точка."
А играли мы, барабанная дробь, в Джон Компани.
Можно уже и сейчас, но это довольно трудоемкая задача, в плане передачи контекста. А по поводу стиля, то все модели, с которыми я обсуждал возможность провести игровую сессию, очень охотно поддерживают эту идею и сами предлагают ролевой отыгрыш ;) Будущее не за горами!
Насчет того, как ИИ разбираются в правилах. Решил как-то протестировать Дипсик насчет поиска ответов в правилах Fields оf Fire. Вопрос актуальный, поскольку там 100 стр. плотненького текста. Задал ему парочку простых вопросов: он справился, ответил правильно, сослался на конкретный пункт. Потом задал парочку сложных вопросов, ответы на которые прямо в правилах не даны. И он ошибся.
И до кучи по поводу перевода игр. Дипсик часто галлюцинирует. Последний пример: переводил варгейм по Сталинградской битве, он просто создал несуществующий раздел, в который назвал «Специальные действия». Раздел представлял собой компиляцию из разделов «Продвинутые правила» и раздела «Действия игрока». А еще он любит добавлять в текст свои уточнения, которые часто ошибочны. Кароч, доверяй, но проверяй.
Да, по ходу игры модель часто сбивалась и начинала выдумывать ходы, но это во многом из-за некорректных пользовательских запросов. Я спецом не указал, что это была за модель, но все представленные сегодня крупные LLM +/- одинаковый рез-т покажут.
А это не рофло-пост от ИИ?
Нет, он только пунктуацию в конечном варианте поста помог отредактировать :)