Чем «толще хвост», тем сильней он «виляет собакой»

Прорывной результат анализа 2,5 тыс. лет эпидемий

Image for post
Image for post
Явный и реальный хвост эпидемии. Источник: https://www.nature.com/articles/s41567-020-0921-x

Нассим Талеб теперь уж точно войдет в историю главным ниспровергателем статистических методов оценки рисков. Первое ниспровержение состоялось в 2016. Тогда в ходе Нобелевского симпозиума Нассим Талеб опроверг теорию о спаде насилия в мире, а заодно математически обосновал страшный вывод — большой войны с десятками миллионов жертв не миновать .

Новое ниспровержение датируется маем 2020 и связано с пандемией COVID-19. В опубликованной вчера работе «Хвостовой риск инфекционных болезней» Нассим Талеб и Паскуале Сирилло рассказывают о результатах статистического анализа всех больших эпидемий на Земле за 2,5К лет. При анализе они использовали ту же методологию, что была ими использована в 2016 для анализа числа жертв войн за всю историю.

В основе методологии Теория экстремальных значений — Extreme value theory (спецраздел матстатистики для работы с «Черными лебедями», имеющими максимальное отклонение вероятности от среднего значения — ураганы, наводнения, землетрясения и т.д.) и обобщенное распределение Парето — Generalized Pareto distribution (позволяет моделировать только хвост распределения).

Результаты нового анализа вполне могут стать предметом рассмотрения на очередном Нобелевском симпозиуме.

Вот их резюме.

  1. Анализ 2.5 тыс. лет эпидемий показал, что статистическое распределение их жертв имеет чрезвычайно «толстый хвост» (Fat-Tailed Distribution). В «толстом хвосте» графика этого распределения зачастую прячутся «Черные лебеди» — редкие, маловероятные, но очень значимые события — что делает бессмысленным вычисление средних значений. По своей «толщине» хвост распределения жертв пандемий не уступает распределению жертв войн.
  2. Чем «толще хвост» распределения, тем сильнее он «виляет собакой». Т.е. тем больше статистической информации содержится в крайних точках и тем меньше — в «массовых» событиях высокой частоты, где она становится почти шумом. Поэтому расчеты на основе средних значений по «массовым» событиям могут быть неинформативными и ненадежными. Для распределений с «толстыми хвостами» нужно извлекать ценную информацию из пиковых событий, прячущихся в хвостах. Это делается путем отказа от опоры на средние значения и использования вместо этого Теории экстремальных значений и обобщенного распределения Парето.
  3. Такой подход меняет все: от моделей эпидемий до политических решений по борьбе с ними. Он дает совсем иные результаты. Но главное, он меняет . Сегодняшние доминирующие представления о вероятностных рисках основаны на сравнении «теплого и длинного». Практически все (обыватели, журналисты, эксперты, политики) сопоставляют число жертв пандемии с числом жертв автомобильных аварий, сердечных приступов, рака, падений с лестниц и т.п. Это в корне ошибочно, поскольку распределение жертв последних имеет тонкие гауссовские хвосты, в которых просто не спрятаться «черным лебедям». А в толстых хвостах пандемий их может быть сколько угодно и без ограничений размера. Не понимая этого: (1) реалистичное управление рисками невозможно, (2) используемые модели (типа SIR) хороши для научных дискуссий, но бессмысленны для принятия практических решений.

В заключение о важном дополнении к работе Талеба и Сириллио.

✔️ Авторы, имхо, абсолютно правы, утверждая, что Теория экстремальных значений — единственно верный статподход современной науки для управления риском и принятия решений в борьбе с пандемией.

✔️ Но от себя добавлю. Этот подход единственный в рамках привычной нам науки. В постнауке (а она уже рядом) есть методы покруче Теории экстремальных значений. Подтверждая выводы последней, , идет куда дальше. Оно в корне меняет отношение Homo sapiens к неопределенности, являющейся не чем иным, как непомерной ценой, заплаченной за интеллект.

Об этом мой очередной пост, от написания которого снова пришлось отвлечься из-за Талеба.

________________________________


Written by

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store