Риск военного конфликта Китая и США близок к 50%

Китая с Тайванем — примерно 75%, а России и США — около 30%

Как это ни парадоксально, но всякая точная наука основывается на
приблизительности. Если кто-то говорит вам, что точно знает что-то, можете смело делать вывод: вы разговариваете с человеком, понятия не имеющим о точности.
Бертран Рассел

Мой новый пост приурочен к весьма интересному событию —

открыт свободный доступ к визуальному интерфейсу новой системы прогнозирования военизированных межгосударственных споров (militarised interstate disputes — MID).

Система разрабатывалась 10 лет командой из 30 специалистов инвестиционного фонда Coolabah Capital Investments.

Это не академическое исследование. Тут, говоря словами Нассима Талеба,

От точности прогнозов этого инвестфонда зависят $7 млрд инвестиций, находящихся под его управлением. Вот почему это не только любопытная, но и весьма интригующая новость.

Кроме того, т.к. доступ к системе открыт, каждый может сам увидеть и проанализировать, как менялись шансы войны между парами стран (Россия и США, Россия и Китай, Индия и Китай, Германия и Россия, Австралия и Китай …) за последние 160 лет, и каков их прогноз на ближайший год, 5 и 10 лет.

Не менее интересен контекст этой новости.

Ибо, не зная его, можно промахнуться в оценке важности и перспектив новой системы прогнозирования. Поэтому я решил написать поподробней и об этом контексте, который касается следующего.

  • Измерить можно все, — любые неопределенности и риски.
  • Однако:
    — смысл слов «неопределенность» и «риск», а также их отличие друг от друга не до конца ясны даже многим специалистам;
    — тот факт, что число находится между нулем и единицей, недостаточно для того, чтобы считать это вероятностью.
  • Почему прогнозирование военных конфликтов раньше считалось либо ненаучным либо бессмысленным.
  • Как понять, где в континууме «облаков-часов-черных лебедей» расположены конфликтные процессы, и каковы пределы их предсказуемости.
  • В чем секрет успешного преодоления «непредсказуемости» будущего, известный банкирам и страховщикам.
  • Зачем инвестфондам прогнозирование войн.
  • В чем особенности новой системы прогнозирования и каковы перспективы.

Если контекст новости вам не важен, сразу переходите к последнему разделу поста “Шкура на кону предсказаний войны”.

Измерить можно все

К обеду астролябия была продана интеллигентному слесарю за три рубля.
— Сама меряет, — сказал молодой человек, передавая астролябию покупателю, — было бы что мерять.
И.Ильф, Е.Петров “12 стульев”

Изобретатель прикладной информационной экономики Дуглас Хаббард в своей замечательной книге «Как измерить все, что угодно Оценка стоимости нематериального в бизнесе» пишет следующее.

“Существуют два основных толкования слова «нематериальное». Во-первых, нематериальными, по традиции, считают вещи, буквально не являющиеся материальными (телесными, осязаемыми), но, тем не менее, поддающиеся измерению. Хорошими примерами объектов, которые нельзя потрогать, но можно измерить, служат время, бюджет, право собственности на патент и т. д. Сегодня уже сложилась целая индустрия оценки нематериальных активов, таких как авторское право и торговая марка. Но со временем слово «нематериальный» стали употреблять и в значении «не
поддающийся никакому измерению — прямому или косвенному». И вот я утверждаю, что объектов, нематериальных в этом смысле слова, вообще не существует”.

Дуглас Хаббард

Объясняя, почему неизмеримость нематериального — всего лишь иллюзия, Хаббард пишет, что люди считают вещи неизмеримыми по трем причинам, проистекающим из ошибочных представлений о разных аспектах количественной оценки: сущности измерения, его объекта и метода.

Сущность измерения

Сущность понятия измерение в том, что так называется совокупность снижающих неопределенность наблюдений, результат которых выражается некой величиной. Таким образом, измерением считается не только полное устранение, но и частичное сокращение неопределенности. Наличие ошибки измерения (избежать которой не удаётся никому и никогда) вовсе не девальвирует ценность полученного результата. Проведенное измерение — все равно шаг вперед по сравнению с прежними представлениями. И это ключевая идея проведения любых экспериментов, опросов и прочих научных измерений. Истинное измерение не обязано быть абсолютно точным, чтобы считаться таковым. Ибо, как показал К.Шеннон, это всего лишь способ получения информации, представляющей собой снижение неопределенности в сигнале.

Ценность такой трактовки сущности измерения в том, что оно не должно устранять неопределенность полностью. Одного только снижения неопределенности вполне достаточно, ибо его эффект может многократно превышать затраты на проведение измерения.

Объект измерения

«Ничто так не мешает прогрессу знания, как расплывчатость терминологии» — еще в 18 веке писал шотландский философ Томас Рейд. Увы, но и спустя 300 лет мы зря тратим время на обсуждение расплывчатых терминов, типа искусственного интеллекта. И самое ужасное, что многие из нас готовы признать ненаучными и бессмысленными оценки неопределенности и рисков будущих войн, при том, что и то, и другое остается для нас весьма расплывчатыми терминами.

Увы, но смысл слов «неопределенность» и «риск», а также их отличие друг от друга, не до конца ясны даже многим специалистам. Как писал еще в 1920-х экономист Фрэнк Найт:

«Неопределенность следует употреблять как нечто кардинально отличающееся от риска в его привычном понимании, хотя до сих пор четкую грань между ними никто не провел… Существенным фактом является то, что в одних случаях «риск» означает величину, поддающуюся измерению, а в других — нечто совсем иного характера и что возникают важные и принципиальные отличия в развитии явления в зависимости от того, присутствует в нем неопределенность или риск».

Именно поэтому, как считает Дуглас Хаббард, — «давая определение своим терминам, так важно понимать, для принятия каких решений мы проводим свои измерения». Посему, далее мы будем использовать следующие определения.

Неопределенность — это отсутствие полной определенности, т.е. существование более чем одной возможности. Наличие неопределенности означает, что «истинный» результат (состояние, последствие, стоимость) неизвестен.

Показателем неопределенности является ряд вероятностей, приписанных ряду возможностей.

Риск — это такое состояние неопределенности, когда в число возможностей входят убытки, катастрофы или любые иные нежелательные исходы.

Показателем риска является набор возможностей с приписанными им количественными вероятностями и количественно определенным ущербом.

Например, мы полагаем, что существует 40%-я вероятность того, что в течение года между США и Китаем может произойти вооруженное столкновение с потерями США, как минимум, десятков жизней военнослужащих и убытками в миллиарды долларов.

Мы определились с двумя аспектах количественной оценки из трех.

✔️ С сущностью измерений риска военных конфликтов:
мы не ждем абсолютно точных предсказаний, а стремимся снизить неопределенность возникновения различного рода военизированных межгосударственных споров и риски последующих потерь военными живой силы и техники, а также потерь среди населения и объектов инфраструктуры.

✔️ С определениями неопределенности и рисков, а также с их показателями.

Теперь дело за определением и выбором метода измерения.

Методы предсказания военных конфликтов

Фото: Минобороны России

Читателя не должно смущать то, что до последнего времени точность методов предсказаний военных конфликтов была крайне невысока. Во-первых, как уже сказано выше, даже от не самых точных измерений (оценок вероятности и т.п.) может быть польза. А во-вторых, сейчас в этом деле все меняется со скоростью, соизмеримой со скоростью роста объема диска ноутбука.

Так вот. Желающим познакомиться с предысторией вопроса могу рекомендовать обзорную работу 2017 года «Conflict forecasting and its limits». В ней много чего интересного.

Например.

  • Как окончательно провалился метод экспертной оценки в области политики и экономики. Филип Тэтлок исследовал прогнозы 300 экспертов в области политики и экономики за более чем 20 лет и показал, что предсказательная способность экспертов в отношении геополитических событий была в среднем не лучше, чем случайные предположения. Эксперты, добившиеся успеха в один период, обычно прокалывались в следующем. В целом, даже самые опытные эксперты показали себя не лучше, чем новички. В итоге, довольно простые алгоритмы легко превзошли всех их. Выводы этого исследования нам особенно интересны, т.к. оно фокусировалось именно на прогнозировании военных конфликтов.
  • Эконометрические подходы в области прогнозирования международных конфликтов и гражданской войны (начиная с традиционных методов регрессии — обычно логистических из-за бинарной природы результата — до более сложных моделей случайного леса или нейронных сетей) могут идентифицировать потенциально конфликтные ситуации. Однако, они, как правило, не могут определить, какая из сторон и когда на практике начнет войну.
  • Достижения в вычислительных методах и, в частности, в области анализа текста, позволили анализировать крупные и более тематически широкие «живые» источники информации от информационных агентств и, таким образом, перейти от структурных к краткосрочным измерениям напряженности и различным эвристическим маркерам конфликта (так, например, работает The Integrated Crisis Early Warning System (ICEWS). И хотя системы, основанные на данных из новостных источников, достигли определенных успехов в прогнозировании (особенно после включения в них данных из соцсетей), предсказание землетрясений и цунами работает куда лучше, чем предсказание военных конфликтов.
  • Альтернативные подходы, основанные на моделировании, имитирующем взаимодействие между участниками потенциального конфликта (например, модель переговоров и коалиций) оказались успешными для прогнозирования конкретных ожидаемых и/или желаемых событий (например, с помощью такой системы было обнаружено укрытие Усамы бен Ладена в Пакистане). Однако, обобщение сильно упрощенных теоретико-игровых моделей конкретных ситуаций пока остается под вопросом: теория игр может быть не в состоянии уловить тонкости поведения живых людей. Кроме того, агентные модели обычно настолько сложны, что наша способность делать выводы из них ограничена. В итоге, можно успешно играть с различными сценариями и оценивать контрфакты. Но и только.
  • Довольно широко используются подходы, основанные на агрегированных прогнозах «мудрости толпы»: турниры экспертов и рынки предсказаний для коллективного анализа материализации сценариев будущего, а также разного рода «прогнозные кентавры» (см. мой 5-и серийный постосериал «ЦРУ создает кентавров для предсказания будущего»). Все они показывают неплохую результативность на отдельных конкретных событиях, но, к сожалению, не подлежат обобщению. Самым же уязвимым местом оказывается отбор и ранжирование экспертов. Как это обычно бывает, — человеческий фактор становится наиболее уязвимым местом.

Читателям, желающим дальше знакомиться с системами прогнозирования конфликтов, имеет смысл обратиться к библиографии вышедшего в декабре 2020 сборника Forecasting in International Relations. Имеет смысл также посмотреть примеры хотя бы этих трёх конкретных систем.

Система Conflictforecast проста как редис, но кое-что полезное в ней есть. https://conflictforecast.org/
Система ICEWS. Хороший инструмент мониторинга ситуаций, но с прогнозами дело не так чтоб хорошо. https://www.lockheedmartin.com/en-us/capabilities/research-labs/advanced-technology-labs/icews.html
Система Global Urban Analytics for Resilient Defence (GUARD) — сетевая аналитика предсказания конфликтов, разработанная Институтом Алана Тьюринга. https://www.turing.ac.uk/research/impact-stories/predicting-conflict-year-advance

Существенный недостаток большинства существующих систем в том, что используемые ими модели машинного обучения не дают откалиброванных вероятностных прогнозов. То есть они, как правило, систематически недооценивают вероятности в некоторых частях диапазона вероятностей и/или переоценивают вероятности в других диапазонах.

Допустим, на основе набора исторических данных мы обучили прогностическую модель предсказывать вероятность большой войны между Китаем и США. Теперь предположим, что модель предсказала вероятность такой войны 5%. Если бы мы жили в мультивселенной, мы проверили бы это предсказание, понаблюдав за отношениями между Китаем и США в нескольких параллельных вселенных. И если при наблюдении в 100 вселенных, война между Китаем и США случилась в пяти, мы бы сказали, что предсказанная вероятность 5% отражает реальную вероятность.

Но увы, мультиверса у нас нет. А проверить предсказанную вероятность, наблюдая за следующими 100 войнами между Китаем и США в нашей единственной реальности, мы тоже, увы, не можем. Поэтому единственный доступный для нас способ обеспечить, чтобы предсказанное число отражало реальную вероятность — это калибровка модели.

Задача калибровки в том, чтобы научиться

✔️ сначала задавать желаемую вероятность, с которой неизвестная величина попадёт в предложенный вами интервал,

✔️ а потом на основании некоторых умозаключений предлагать верхнюю и нижнюю границу доверительного интервала (например, 90%-ного, при котором неизвестная величина окажется внутри него в девяти случаях из десяти).

Например, нам задан вопрос

Точный ответ на этот вопрос, скорее всего, знает довольно мало людей, однако, любой читатель вполне способен приблизительно оценить данную величину.

Один из способов показать неточность определения величины — выразить ее в виде интервала возможных значений. В статистике интервал, в котором с некоторой вероятностью может содержаться правильный ответ, называется доверительным интервалом (confidence interval); 90-процентный доверительный интервал — это диапазон значений, содержащий правильное с вероятностью 90 %.

Допустим, мы стремимся дать ответ, который будут точен с вероятности 90 %. Тут возможны варианты. Предположим, кто-то предполагает диапазон размаха крыльев от 9 до10 метров. Но он кажется довольно узким, и если отвечающий не большой спец в самолётах, то вероятность промаха будет весьма велика. Иными словами, давая такой узкий диапазон оценок, человек проявляет чрезмерную уверенность, — довольно широко распространённое когнитивное искажение. Как можно предположить из названия этого искажения, оно проявляется в переоценки точности своих ответов. Также можно сказать, что если человек не профи в самолетах, то диапазон оценок в 9–10 метров больше похож на доверительный интервал в 10%, а не в 90%. Чтобы это исправить, нужна калибровка.

Другим крайним случаем может быть диапазон от 9 до 100 метров. Но столь широкий диапазон говорит о недостаточной уверенности, либо о доверительном интервале большем 90 %. То есть, это может быть доверительный интервал 99 %, а то и 99,95 %. Подобные диапазоны оценок подойдут, если вы вообще ничего не знаете о самолётах. А чтобы доверительный интервал был 90 %, этот диапазон нужно сократить. И для этого тоже нужна калибровка.

Помимо проблемы калибровки, практически у всех существующих систем прогнозирования войн есть принципиальный недостаток. Они разработаны на исследовательские гранты или целевым образом финансируются госструктурами типа министерств обороны разных стран.

Следовательно, их разработчики при выдаче своих прогнозов, говоря словами Нассима Талеба, не рискуют собственной шкурой («не ставят шкуру на кон»).

Шкура на кону предсказаний войны

Кристофер Джой

Мы заканчиваем знакомиться с контекстом новости о запуске новой системы прогнозирования военизированных межгосударственных споров (militarised interstate disputes — MID). Теперь посмотрим на новую систему.

Она разрабатывалась 10 лет командой из 30 специалистов инвестиционного фонда Coolabah Capital Investments (CCI). Лидер проекта — Кристофер Джой (Christopher Joye), портфельный менеджер инфестфонда, ранее работавший в Goldman Sachs и RBA. Об истории проекта Джой написал третьего дня в Financial Review.

Принципиальным отличием системы CCI является избранный ее авторами метод измерения вероятности конфликтов. Он похож на то, как справляются с непредсказуемостью банкиры и страховщики.

  • Выдавая большие долгосрочные кредиты, банкиры вынуждены оценивать самые разные риски. И среди таких рисков есть настоящие «черные лебеди». Например, когда в случае дефолта крупного заёмщика исчезают и его активы, используемые в качестве обеспечения кредита. Конечно же, такое случается крайне редко. Но ведь все же случается.
  • Аналогичная проблема стоит перед страховщиками, страхующими от стихийных бедствий. Землетрясения, цунами, торнадо, лавины, — всё это непредсказуемые катастрофы. Но страховщиков ничуть не смущает их непредсказуемость. Они знают секрет, как минимизировать риски такой непредсказуемости.

Как у банкиров со страховщиками, у инвестфонда есть детальная база данных по истории непредсказуемых «черных лебедей» — военизированных межгосударственных споров за последние 160 лет. Аналитики инвестфонда прекрасно оперируют передовыми количественными методами, включая новейшие методы машинного обучения для прогнозирования эмпирической вероятности различных типов военных конфликтов (от логистической регрессии до градиентного бустинга деревьев решений).

Кроме того (и это принципиально важно), используемый в системе CGI подход:

✔️ основан на калибровке вероятностных прогнозов;

✔️ учитывает временной горизонт предсказаний;

✔️ рассчитывает риски не огульно (для всех типов военных конфликтов), а в зависимости от степени серьезности конфликта.

Про значение калибровки было сказано в предыдущем разделе.

Временные горизонты прогнозирования составляют: 1, 5 и 10 лет.

Прогнозируются 4 типа (степени серьезности) конфликтов: угроза применения силы («Угроза»), фактическое применение силы («Сила»), военное столкновение или рейд («Атака»), продолжительная серия военных действий («Война»).

В качестве коррелятов военных конфликтов используется обширный набор показателей из различных международных баз данных.

При прогнозировании учитываются более 200 коррелятов, детальное описание которых можно найти в брошюре и техническом описании системы прогнозирования (их можно скачать с её открытого сайта www.predictingwar.com).

Чтобы оценить работу системы прогнозирования, лучше всего поиграть с ней самостоятельно. Мне же остается лишь дать несколько поясняющих примеров.

Пример 1. Прогноз вероятности военного столкновения Китая и Тайваня на горизонте 10 лет.

Пример 2. Прогноз вероятности военного столкновения Китая и США на горизонте 10 лет.

Пример 3. Прогноз вероятности военного столкновения России и США на горизонте 10 лет.

Пример 4. Матрица прогнозов вероятности военных столкновений между парами из восьми стран (Китай, Индия, Россия, Тайвань, Великобритания, США, Япония, Германия) на горизонте 10 лет.

Пример 5. Матрица прогнозов вероятности полномасштабной войны между парами из восьми стран (Китай, Индия, Россия, Тайвань, Великобритания, США, Япония, Германия) на горизонте 10 лет.

Наибольшая вероятность полномасштабной войны в ближайшие 10 лет у Китая с Индией 21,9%.

У России наибольшая вероятность полномасштабной войны в ближайшие 10 лет прогнозируется с Китаем 9,2%, а с США всего 2,4%.

Давать какие-либо еще комментарии не вижу смысла. Кристофер Джой поставил свою шкуру на кон. Дальше будем смотреть на результаты.

________________________

Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях.

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации