Воображение бессмыслицы без умения мыслить

ИИ близок к пределу имитации разума людей

Сергей Карелов
3 min readApr 18, 2022
“colorless green ideas sleep furiously” — сreated with DALL·E, an AI system by OpenAI

Два прорывных научных результата этого года подводят предварительный итог многолетних попыток имитировать на компьютерах высокоуровневые когнитивные способности людей.

Первый прорывной результат продемонстрировал Open AI (1)

Их новая версия DALL-E 2 способна превращать текстовые описания в фотореалистичные изображения.

ИИ научили имитировать высокоуровневые когнитивные способности людей, решая 3 важнейших класса задач, отличающих нас от животных:

  1. Оперирование существующими и создание новых визуальных образов, в т.ч. эстетически изысканных и оригинальных.
  2. Оперирование существующими и создание новых повествований из грамматически, семантически и прагматически правильных предложений на естественном языке.
  3. Увязка обоих модальностей (зрение и язык) для уже существующих и новых элементов.

1й и 2й классы задач ИИ-системы умели решать и до появления DALL-E 2. Теперь же им доступен и 3й класс, причем:

  • как для тестов и образов, имеющих смысл с точки зрения людей;
  • так и для не имеющих смысла.

Последнее можно проиллюстрировать известным примером Хомского — грамматически-корректным, но бессмысленным предложением:

«Бесцветные зеленые идеи яростно спят»

Для DALL-E 2 бессмысленность этой фразы ничуть не мешает вообразить ее визуальный образ (см. рисунок выше).

Это показывает, что у DALL-E 2 нет пределов воображения. Даже полное отсутствие в описании смысла (в человеческом понимании) не мешает ИИ-системе создать по описанию визуальное представление бессмыслицы.

Однако предел в имитации разума людей все же есть. Что демонстрируют результаты другой работы.

Второй прорывной результат представлен статьей «Shared computational principles for language processing in humans and deep language models» (2).

Авторы показали, что восприятие речи мозгом происходит ровно по той же схеме, что и в системах машинного обучения, использующих авторегрессионные глубокие языковые модели. Эти модели не знают ничего о правилах языка. Они лишь следуют простым принципам.

  1. Непрерывно предсказывают следующее слово.
  2. Сопоставляют эти предсказания с входящим словом для вычисления степени неожиданности (ошибки прогноза).
  3. Полагаются на контекстуальные детали.

Подобным образом работают:

  • NLP-системы типа GPT-3, ничего не понимая в тексте и не зная никаких правил, а лишь предсказывая следующее слово,
  • упомянутая DALL-E 2, превращающая тексты в изображения, ничего не зная о правилах их формирования, а лишь предсказывая очередной пиксель.

Фундаментальный вывод этой работы таков.

Хотя язык может играть центральную организующую роль в процессах познания людей, лингвистической компетенции недостаточно для обретения здравого смысла: мышления и понимания.

Иными словами,

машина может сколь угодно совершенно владеть языком (проходя тест Тьюринга и эксперимент Китайской комнаты), но всё ее владение — ничто иное, как способность предсказывать следующий элемент текста; и эта способность имеет нулевую ценность для понимания смысла текста и порождения новых значимых текстов на основе интеграции знаний из предыдущих.

Это же справедливо и для визуальных образов. Здесь также прогнозирование очередного пикселя имеет нулевую ценность для понимания и порождения новых осмысленных образов на основе предыдущих.

Т.о., совокупность результатов обеих работ позволяет предположить наличие непреодолимой для статистического машинного обучения пропасти между двумя типами высокоуровневых когнитивных способностей:

✔️ языковой и зрительной компетенций, приобретаемых в результате машинного обучения;

✔️ компетенций здравого смысла, приобрести которые в результате машинного обучения современные ИИ-системы не могут.

Вероятной причиной этой пропасти может быть, как вычислительный подход, так и то, что опыт алгоритмически несжимаем.

________________________

Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях

--

--

Сергей Карелов
Сергей Карелов

Written by Сергей Карелов

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

No responses yet