Новая теория, как мозг строит модель мира

Это прорывной шаг к построению сильного ИИ

Image for post
Image for post

Что вы видите на этой картинке?

Наверняка вы скажите, что видите кружку. Тогда как на самом деле, это всего лишь набор черных линий, нарисованных на плоскости.

Но мы почему-то уверены, что это не набор линий на плоскости, а 3х мерный объект.

Нейробиологи считают, что кора головного мозга шаг за шагом обрабатывает получаемую от глаз информацию, выделяя в ней все больше определенных свойств (паттернов). И так до тех пор, пока мозг не признает, что глаза видят кружку.

Сегодня так работают алгоритмы глубокого обучения на нейронных сетях в задачах распознавания образов.

Обучившись на многих изображениях, алгоритм легко определит, что «видит» очередную кружку, хотя ее размеры, пропорции, цвет и толщина линий — совсем иные, чем у всех прежде «виданных» алгоритмом кружек.

Но при этом алгоритм, не только не понимает, что это кружка, но и, что еще удивительней, не понимает, что перед ним 3х мерный объект.

Он вообще ничего не понимает и бессмысленно спрашивать его, как этот объект может выглядеть при другом угле зрения, какой он может быть на ощупь и может ли в нем быть жидкость.

До недавнего времени стройной общепринятой теории, объясняющей, как кора головного мозга трансформирует плоское изображение в ментальную репрезентацию 3х мерного объекта, не существовало.

Новое исследование компании Numenta предлагает совершенно революционный подход (это, как и всегда в моих постах, моя субъективная оценка) к построению подобных теорий. Её основы изложены в этой статье, описывающей, каким образом мозг изучает и познает структуру объектов окружающего мира.

Что такое теория сенсомоторного вывода

Революционная теория, разработанная исследователями из Numenta, позволяет понять, каким образом в мозге осуществляется процесс сенсомоторного вывода (sensorimotor inference). Так авторы теории назвают процесс понимания мозгом структуры объектов той части мира, что информационно доступна ему в настоящий момент через поток сенсорных ощущений. А говоря простым языком, — это процесс, позволяющий мозгу понять, например, при ощупывании неизвестного предмета, что вы держите в руках.

Сенсомоторный вывод выполняется в мозге с помощью специального механизма, называемого авторами аллоцентрической локацией (allocentric location), т.е. определением местонахождения каких-либо объектов во внешнем (по отношению к человеку) мире.

Принципиально важно, что механизм аллоцентрической локации — это часть единого алгоритма работы мозга и потому работает при обработке информации от всех наших органов чувств.

Например, при обработке зрительной информации. Когда вы смотрите на изображение кружки, то для каждой части картинки и каждого отрезка линии в вашем мозге назначается локация (месторасположение в пространстве), связанная с реальной трехмерной кружкой в реальном окружающем вас пространстве (похожим образом компьютеры создают модели объектов в приложениях для автоматизации проектирования). В результате такой переработки, поступившая от глаз информация об отрезках и линиях в мозге превращается в информацию о физическом объекте реального мира. И дальше мозг может этот «мысленный объект» вертеть, смотреть на него с разных углов и т.д.

Но вернемся к сенсомоторному выводу.

Еще в XIX веке Герман фон Гельмгольц заметил, что, хотя наши глаза двигаются три-четыре раза в секунду, наше зрительное восприятие стабильно. Следовательно, мозг должен учитывать, как двигаются глаза. Иначе нам бы казалось, что мир вокруг нас постоянно дергается три-четыре раза в секунду.

Но ведь точно так же, когда вы прикасаетесь к чему-то, было бы странно, если бы мозг обрабатывал только тактильные ощущения и одновременно не знал, как двигаются ваши пальцы.

Этот принцип объединения движения с изменяющимися ощущениями называется сенсомоторной интеграцией. Как и где сенсомоторная интеграция происходит в мозге, до самого последнего времени оставалось тайной.

Революционный потенциал теории, разработанной компанией Numenta, в том, что она довольно убедительно описывает, каким образом сенсомоторная интеграция происходит во всех областях неокортекса. Причем не как отдельный процесс, а как неотъемлемая часть всей сенсорной обработки. И таким образом получается, что сенсомоторная интеграция является ключевой частью единого «алгоритма интеллекта», реализуемого неокортексом.

Эта теория способна объяснить очень многое и, в частности:

— почему вы воспринимаете кружку в трех измерениях и почему вы можете представить, как бы она выглядела с разных сторон;

— почему ваше восприятие кружки является стабильным, хотя ваш взгляд перемещается и останавливается на разных частях изображения (если для входных данных назначены правильные локации кружки, то неважно, откуда и под каким углом вы смотрите на изображение.

Пример, как это работает

Схематично увидеть, как работает весь процесс, при котором сенсомоторная интеграция посредством аллоцентрической локации осуществляет сенсомоторный вывод, вы можете на этом видео на 4,5 мин.

А ниже этот процесс представлен в виде нескольких рисунков.

Рис. 1: Общая схема сенсомоторного вывода при 3х касаниях предмета, обрабатываемых 3мя колонками неокортекса.

Рис. 2: Распознавание объекта при 3х последовательных касаниях.

Рис. 3: Распознавание объекта при 3х одновременных касаниях.

Результаты моделирования вот такой виртуальной руки (снабженной сенсорами касаний),

Image for post
Image for post

касающейся каждого из 80 физических объектов, описанных 3D CAD моделями высокого разрешения

показали точность распознавания 98,7% при всего лишь нескольких касаниях, смоделированных на нейронной сети всего из 4х уровней (аналогичный результат на традиционных технологиях распознавания требует до 100 уровней обработки и миллионов учебных шаблонов).

Что дальше?

Но это далеко не все. В рамках теории сенсомоторного вывода, можно предположить, что

обработка любой информации в коре головного мозга связана с локациями. Причем даже тогда, когда эти локации не соотносятся с физическими объектами в мире.

Если это так, то это значит, что мы управляем абстрактными концепциями с помощью тех же механизмов, что используем для физических объектов материального мира. И здесь мы вплотную подходим к ключевой функции сильного/общего интеллекта (интеллекта человеческого уровня) — оперирование абстрактными концепциями.

Демис Хассибис — сооснователь DeepMind — сказал:

«Человеческий мозг — это единственное существующее доказательство того, что общий тип интеллекта, который мы пытаемся создать, вообще возможен. И поэтому нам нужно попытаться понять, как же мозг достиг этих возможностей».

Вся стратегия компании Numenta строится на Biologically inspired machine intelligence —

создании ИИ, в основе которого лежат идеи, вдохновленные принципами работы мозга.

Вот почему так важна теория сенсомоторного вывода. Она может позволить строить машины, которые будут узнавать и изучать мир вокруг себя так же, как это делает наш мозг — через движение.

_________________________

Хотите читать подобные публикации? Подписывайтесь на мой канал вТелеграме, Medium, Яндекс-Дзене

Считаете, что это стоит прочесть и другим? Дайте им об этом знать, кликнув на иконку “понравилось”.

Written by

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store