ИИ от Цукерберга готовят на смену Госсекретарю США

Новый шаг ИИ к превосходству над людьми

Сергей Карелов

3 min readMay 7, 2021

Потенциал способностей ИИ позволит ему:

✔️ либо превзойти людей только в отдельных областях,
✔️ либо превзойти во всем, и тогда привет.

Прояснение этого вопроса происходит этапами. И только что начался 3й — решающий этап.

Дело было так.

Этап 1

Сначала ИИ превзошел людей в состязательных играх (где стороны интеллектуально противостоят друг другу).

Первым пал бастион игр с открытой информацией, в которых игроки обладают полным знанием всех прошлых событий и нынешней ситуации в игре: шахматы, Го — всюду ИИ от DeepMind сумел выйти на недостижимый людям уровень игры.

Этап 2

Взят бастион игр с неполной информацией. В таких играх игроки знают не все: напр., в покере, — какие карты у других игроков (этот класс игр особенно интересен для экономистов, т.к. включает практические проблемы — поиск оптимальных стратегий для заключения сделок и аукционов). В 2017 ИИ Libratus победил в 20-дневном покерном турнире и выиграл у профессиональных игроков более 1,7 миллиона долларов.

Отличительной особенностью ИИ Libratus стало его свойство минимизировать «сожаление» о собственных плохих решениях. Специальный алгоритм для каждого решения вычисляет значение «сожаления» — насколько алгоритм «сожалеет» о том, что он не сделал определенный шаг в прошлом. Сначала алгоритм принимает решения случайно, но затем подключает к каждому решению значение «сожаления», в зависимости от того, насколько плохим оно было. К этому умению ИИ «сожалеть» добавили 262 терабайта информации для выработки стратегии, сумев ужать её до 11 терабайт, и привет: профессионалам пришлось слиться и в игре с неполной информацией.

Этап 3 (2021)

Потерпев полный крах в состязательных (конкурентных) играх, за людьми оставалось преимущество:

в играх кооперативных (где нужно кооперироваться с другими игроками)
и в самом сложном — смешанных конкурентно-кооперативных играх.

Казалось, что здесь ИИ ловить нечего. Но увы, пал и этот, почти что последний бастион.

5 мая на ICLR-2021 (одна из 3х самых крутых ИИ конференций) троица из Facebook AI Research рассказала о новом ИИ, уже играющем на уровне ТОР 2% лучших мировых игроков в конкурентно-кооперативную игру «Дипломатия».

Это стратегическая игра в меняющиеся альянсы, которая включает в себя как сотрудничество, так и конкуренцию в Европе, разделенной на 75 провинций. В игру играют семеро игроков, которым, помимо умения конкурировать и сотрудничать, требуется хитрость, обман и коварство, (как и в реальной дипломатии). А еще (т.к. на каждом ходу игроки делают ходы одновременно) нужно моделировать, что другие думают о вас и вашей стратегии. Игроки строят и мобилизуют воинские части для оккупации провинций, пока кто-либо не захватит большинство центров снабжения. Игроки могут атаковать или защищаться, могут, создавая союзы, поддерживать атаки и защиту других игроков. В полной версии игроки могут вести переговоры. В упрощенном варианте игры «дипломатия без прессы», переговоров нет.

Перебор вариантов здесь невозможен. В самой короткой 20-ходовой игре можно сыграть почти 10⁸⁶⁸ способами (это 10 с 868 нулями). Поэтому Facebook применил убойный сдвоенный алгоритм, сочетающий контролируемое обучение на человеческих данных с одноэтапным поиском с помощью минимизации «сожалений». Алгоритм реализован в боте SearchBot, который превзошел бот DeepMind’a, анонимно играя против людей на веб-сайте Diplomacy и войдя в 2% лучших игроков. Но это лишь начало.

Ждать абсолютного превосходства ИИ над людьми в игре Дипломатия не долго. В планах Facebook: задействовать обучение с подкреплением, минимизировать «сожаление» более чем на 1 ход, расширить союзы умением координировать действия.

Подробней в докладе на конференции.

Если всё получится, взращенный Цукербергом ИИ сможет со временем сильно упростить работу Госсекретаря США.

________________________

Спасибо за просмотр! Ставьте лайки и подписывайтесь на канал. Всего доброго!

ИИ от Цукерберга готовят на смену Госсекретарю США

Новый шаг ИИ к превосходству над людьми

Этап 1

Этап 2

Этап 3 (2021)

Written by Сергей Карелов

No responses yet