Мета учит ИИ лгать, разрабатывать стратегии

Meta обучила агента ИИ играть в настольную игру, которая включает в себя общение с другими игроками, чтобы убедить их поддержать ее стратегии, а затем предать их.

Компания, которой принадлежат Facebook, Instagram и WhatsApp, заявляет, что ее ИИ Cicero в ближайшем будущем может найти широкое применение, включая разработку более интеллектуальных виртуальных помощников с комбинированным использованием таких технологий, как обработка естественного языка (NLP) и стратегическое мышление. сообщение в блоге, выпущенное компанией.

В исследовательской статье в академическом журнале Science компания Meta сообщила, что ее ИИ Cicero достиг производительности человеческого уровня в стратегической настольной игре Diplomacy в онлайн-лиге, где он сыграл 40 игр против 82 человек, попав в 10% лучших участников, сыгравших более одна игра.

Diplomacy сталкивает семь игроков друг с другом за контроль над картой Европы. Каждый ход начинается с переговоров игроков друг с другом о поддержке их планов и заканчивается тем, что они одновременно пытаются выполнить свои ходы. Без поддержки других игроков многие из этих ходов потерпят неудачу.

По словам Мета, игра стала сложной задачей для агента ИИ, поскольку для победы требовалось понять, блефуют ли его противники или разрабатывают стратегию определенным образом, чтобы выиграть игру. ИИ необходимо было расширить определенный уровень эмпатии во время игры, чтобы наладить сотрудничество с другими игроками, чего ИИ не нужно было делать, играя в такие игры, как шахматы, против противников-людей.

Агенты ИИ с годами совершенствуются в стратегических играх: в 1997 году программное обеспечение Deep Blue от IBM победило чемпиона мира по шахматам Гэри Каспарова, а в 2016 году AlphaGo от DeepMind обыграла лучшего игрока в го Ли Седоля. Facebook также разработал еще один механизм искусственного интеллекта, который может превзойти людей в покере.

Стратегическое мышление

Цицерон построен на двух основных технологических компонентах: стратегическом мышлении и обработке естественного языка (НЛП). Исследователи объяснили, что в то время как механизм стратегического мышления предсказывает действия других игроков и использует эту информацию для формирования собственной стратегии, механизм обработки естественного языка генерирует сообщения и анализирует ответы в разговорах с другими игроками, чтобы вести переговоры и достигать соглашения.

Чтобы помочь агенту ИИ генерировать релевантные разговоры, исследователи начали с модели генерации естественного языка с 2,7 миллиардами параметров, предварительно обученной на тексте из Интернета, и настроили ее на разговоры между игроками-людьми в более чем 40 000 игр от webDiplomacy.net.

«Мы разработали методы автоматической аннотации сообщений в обучающих данных с соответствующими запланированными ходами в игре, чтобы во время вывода мы могли контролировать создание диалогов для обсуждения конкретных желаемых действий для агента и его собеседников», — сказали исследователи в более подробном отчете. Сообщение блога.

Meta открыла исходный код Cicero, чтобы другие исследователи могли использовать возможности агента ИИ.

Кроме того, компания создала портал для размещения предложений по исследованиям в области сотрудничества человека и ИИ посредством НЛП с использованием Дипломатии в качестве основной концепции.

Долгосрочные планы

Крупные технологические компании, такие как Microsoft, Google, Amazon, соревнуются друг с другом в разработке более интеллектуальных независимых виртуальных помощников для поддержки различных вариантов использования в бизнесе, от колл-центров до агентов ИИ, которые могут проводить анализ настроений и обучать новым навыкам личность. Согласно отчету Fortune Business Insights, мировой рынок обработки естественного языка (NLP), который включает таких помощников, по прогнозам, вырастет с 26,4 млрд долларов в 2022 году до 161,8 млрд долларов к 2029 году.

Исследователи из Meta, похоже, предположили, что успех Цицерона в дипломатии превосходит возможности других виртуальных помощников, доступных сегодня, заявив в своем блоге: «Например, нынешние помощники ИИ могут выполнять простые задачи на вопросы и ответы, например сообщать вам погоду — но что, если бы они могли вести долгую беседу с целью научить вас новому навыку?»

Это раскопки таких инструментов, как Google Duplex, Amazon Alexa, Microsoft Xiaoice и Apple Siri. Но Цицерону тоже не до долгих разговоров, так как его рассуждения строго краткосрочны. Как сказали исследователи Meta в статье в журнале Science: «Со стратегической точки зрения Цицерон рассуждал о диалоге исключительно с точки зрения действий игроков на текущем ходу. Он не моделировал, как его диалоги могут повлиять на отношения с другими игроками в долгосрочной перспективе игры».

Новости
Дата публикации: 2022.12.04