ИИ от Цукерберга готовят на смену Госсекретарю США
Новый шаг ИИ к превосходству над людьми
Потенциал способностей ИИ позволит ему:
✔️ либо превзойти людей только в отдельных областях,
✔️ либо превзойти во всем, и тогда привет.
Прояснение этого вопроса происходит этапами. И только что начался 3й — решающий этап.
Дело было так.
Этап 1
Сначала ИИ превзошел людей в состязательных играх (где стороны интеллектуально противостоят друг другу).
Первым пал бастион игр с открытой информацией, в которых игроки обладают полным знанием всех прошлых событий и нынешней ситуации в игре: шахматы, Го — всюду ИИ от DeepMind сумел выйти на недостижимый людям уровень игры.
Этап 2
Взят бастион игр с неполной информацией. В таких играх игроки знают не все: напр., в покере, — какие карты у других игроков (этот класс игр особенно интересен для экономистов, т.к. включает практические проблемы — поиск оптимальных стратегий для заключения сделок и аукционов). В 2017 ИИ Libratus победил в 20-дневном покерном турнире и выиграл у профессиональных игроков более 1,7 миллиона долларов.
Отличительной особенностью ИИ Libratus стало его свойство минимизировать «сожаление» о собственных плохих решениях. Специальный алгоритм для каждого решения вычисляет значение «сожаления» — насколько алгоритм «сожалеет» о том, что он не сделал определенный шаг в прошлом. Сначала алгоритм принимает решения случайно, но затем подключает к каждому решению значение «сожаления», в зависимости от того, насколько плохим оно было. К этому умению ИИ «сожалеть» добавили 262 терабайта информации для выработки стратегии, сумев ужать её до 11 терабайт, и привет: профессионалам пришлось слиться и в игре с неполной информацией.
Этап 3 (2021)
Потерпев полный крах в состязательных (конкурентных) играх, за людьми оставалось преимущество:
- в играх кооперативных (где нужно кооперироваться с другими игроками)
- и в самом сложном — смешанных конкурентно-кооперативных играх.
Казалось, что здесь ИИ ловить нечего. Но увы, пал и этот, почти что последний бастион.
5 мая на ICLR-2021 (одна из 3х самых крутых ИИ конференций) троица из Facebook AI Research рассказала о новом ИИ, уже играющем на уровне ТОР 2% лучших мировых игроков в конкурентно-кооперативную игру «Дипломатия».
Это стратегическая игра в меняющиеся альянсы, которая включает в себя как сотрудничество, так и конкуренцию в Европе, разделенной на 75 провинций. В игру играют семеро игроков, которым, помимо умения конкурировать и сотрудничать, требуется хитрость, обман и коварство, (как и в реальной дипломатии). А еще (т.к. на каждом ходу игроки делают ходы одновременно) нужно моделировать, что другие думают о вас и вашей стратегии. Игроки строят и мобилизуют воинские части для оккупации провинций, пока кто-либо не захватит большинство центров снабжения. Игроки могут атаковать или защищаться, могут, создавая союзы, поддерживать атаки и защиту других игроков. В полной версии игроки могут вести переговоры. В упрощенном варианте игры «дипломатия без прессы», переговоров нет.
Перебор вариантов здесь невозможен. В самой короткой 20-ходовой игре можно сыграть почти 10⁸⁶⁸ способами (это 10 с 868 нулями). Поэтому Facebook применил убойный сдвоенный алгоритм, сочетающий контролируемое обучение на человеческих данных с одноэтапным поиском с помощью минимизации «сожалений». Алгоритм реализован в боте SearchBot, который превзошел бот DeepMind’a, анонимно играя против людей на веб-сайте Diplomacy и войдя в 2% лучших игроков. Но это лишь начало.
Ждать абсолютного превосходства ИИ над людьми в игре Дипломатия не долго. В планах Facebook: задействовать обучение с подкреплением, минимизировать «сожаление» более чем на 1 ход, расширить союзы умением координировать действия.
Подробней в докладе на конференции.
Если всё получится, взращенный Цукербергом ИИ сможет со временем сильно упростить работу Госсекретаря США.
________________________
Спасибо за просмотр! Ставьте лайки и подписывайтесь на канал. Всего доброго!