Большой Брат — 2

Еще не всеведущ, но знает о вас куда больше, чем вы думаете

Image for post
Image for post
Фото ОВД-ИНФО

Привыкая к мысли о неизбежности тотального цифрового контроля, мы успокаиваем себя ограниченностью его возможностей.

  • Подумаешь, Большой Брат может обнаружить меня среди протестующих по геолокации смартфона, — но ведь его можно и дома оставить.
  • Подумаешь, ББ может распознавать лица демонстрантов, — но поди найди среди тысяч часов видеозаписи момент, когда я бросил в космонавта пластиковый стаканчик.

Старый «китайский подход» — решать проблемы числом, а не умением, усадив за анализ видео армию «видеоаналитиков», имеет массу недостатков. А при масштабировании наблюдения за пределы отдельных «горячих точек» и, тем паче, на весь мегаполис и страну, «китайский подход» вообще не реализуем, — слишком много нужно «видеоаналитиков» и, следовательно, слишком высока стоимость технологии наблюдения.

Так может ИИ в состоянии решить эту проблему, взяв на себя автоматизированный поиск, так сказать, «потенциальных правонарушителей»?

Мы успокаиваем себя, что это не под силу современному ИИ, умеющему решать лишь задачи статистического распознавания паттернов (в изображениях, текстах, речи и т.д.), но ни черта не понимающему, что он распознает. Он может распознать в потоке речи редкие слова, известные лишь немногим (типа, Frankenfood — генетически модифицированные продукты). Но при этом, на вопрос «How many legs does a centipede have» (сколько ног у сороконожки), ответ может быть и 4, и 8, но уж никак не 30 или 382.

Конечно, и этот ничего не понимающий ИИ можно научить распознавать что угодно. Но для этого нужно, чтобы его научили. А для обучения нужно иметь море размеченных данных (например, тысячи фото кошек с пометкой для ИИ, что это кошка, и тысячи фото собак, людей, птиц и т.д. с пометкой, что это не кошка).

Когда же встает задача, научить ИИ распознавать факт бросания в космонавта пластикового стаканчика, нужно загрузить на вход ИИ тысячи таких сцен.

Но и после того, как ИИ научится это делать, он не сможет распознать, когда в космонавта бросят урну (она же совсем не похожа на стаканчик).

Казалось бы, нам можно расслабиться. ББ далеко не всеведущ, хоть и научился распознавать наши лица.

Но тут появляется Большой Брат — 2, умеющий автоматически распознавать, что люди делают:

стаканчик в космонавта бросают, урну или заточенную копьём арматуру. И не только это, но и вообще что угодно: закурил не там, где можно, или пописал в неположенном месте, — да мало ли что еще.

__ __ __ __ __

Трансформация синтезированных изображений, чтобы быть визуально реалистичными. В верхних левых углах каждого синтезируемого изображения (a) находится карта его сегментации. Изображения (b) получено на системе CycleGAN, ( c) на CyCADA, (d) на системе Amazon Go. Источник: https://arxiv.org/abs/2006.02110

В основе ББ-2 тот же подход, что позволил достичь недостижимого для людей уровня мастерства в играх, типа Го, шахматы и т.д. Главное, что оказалось для этого нужно — уменьшить зависимость от больших данных, содержащих примеры сделанных людьми ходов. Победившая в 2016 чемпиона по Го программа AlphaGo была обучена на 30 млн. примеров, сделанных людьми игровых ходов. А превзошедшая её в 2017 программа AlphaZero вообще обошлась без человеческих примеров ходов, тренируясь в игре сама с собой.

Вот только как сделать, чтобы машина сама генерировала для своего собственного обучения миллионы трехмерных сцен, изображающих всевозможные действия людей, и чтоб эти сцены были автоматически размечены (например, метка: молодой человек бросает пластиковый стаканчик (урну, арматуру …) в космонавта)?

Кудесники из Amazon Go показали, как это делается.

  • Строится модель анализа сцен по смеси реальных и синтетических (искусственно созданных) данных.
  • Затем эту модель используют для автоматической маркировки (разметки) кадров из набора данных, в котором создаются синтетические изображения.
  • Затем используется условная генеративно-состязательная сеть (cGAN) для создания реалистичного изображения из данных, сгенерированных моделью анализа сцены (см. рис. выше).

Исследователи планируют создать набор данных, состоящий из 100 тыс. полностью аннотированных изображений нескольких людей, взаимодействующих в Panoptic-среде CMU.

Последнее означает следующее. Для детектирования объектов на изображении используется самая продвинутая Panoptic-сегментация, объединяющая в себе преимущества семантической сегментации (выделяет разные классы объектов на изображении: это человек, это урна …) и instance-сегментаций (разделяет объекты одного класса на разные объекты: это космонавт, это хулиган …).

Как тут не вспомнить про Panopticon — проект «идеальной тюрьмы» (или обобщенно, — институционального здания и системы управления), разработанный английским философом и социальным теоретиком Джереми Бентамом в конце 18-го века (подробней в моем посте «Тотальная идеальная е-тюрьма по-китайски»).

Суть проекта в том, чтобы обеспечить централизованное наблюдение за всеми заключенными одним сторожем без того, чтобы заключенные знали, наблюдаются они в данный момент или нет.

Цель проекта Паноптикум:

  • сделав Большого Брата -2 хоть и не всеведущим, но знающим о действиях каждого из людей,
  • обеспечить для власти прозрачность социальной реальности, тем самым делая власть для общества невидимой.

И если это удастся, то мы или наши ближайшие потомки довольно скоро лишимся не только свободы слова и собрания, но и свободы действий, выбора, воли … И все это добровольно, и даже не очень заметив этого.

________________________________

Если понравился пост:
- нажимаете на кнопку аплодисментов, — автору будет приятно :-)
- подпишитесь на
обновления канала на платформе Medium;
- оставьте комментарий.
Еще больше материалов на моем Телеграм канале «Малоизвестное интересное».
Подпишитесь

Written by

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store