Чем «толще хвост», тем сильней он «виляет собакой»

Прорывной результат анализа 2,5 тыс. лет эпидемий

Сергей Карелов
3 min readMay 26, 2020
Явный и реальный хвост эпидемии. Источник: https://www.nature.com/articles/s41567-020-0921-x

Нассим Талеб теперь уж точно войдет в историю главным ниспровергателем статистических методов оценки рисков. Первое ниспровержение состоялось в 2016. Тогда в ходе Нобелевского симпозиума Нассим Талеб опроверг теорию о спаде насилия в мире, а заодно математически обосновал страшный вывод — большой войны с десятками миллионов жертв не миновать .

Новое ниспровержение датируется маем 2020 и связано с пандемией COVID-19. В опубликованной вчера работе «Хвостовой риск инфекционных болезней» Нассим Талеб и Паскуале Сирилло рассказывают о результатах статистического анализа всех больших эпидемий на Земле за 2,5К лет. При анализе они использовали ту же методологию, что была ими использована в 2016 для анализа числа жертв войн за всю историю.

В основе методологии Теория экстремальных значений — Extreme value theory (спецраздел матстатистики для работы с «Черными лебедями», имеющими максимальное отклонение вероятности от среднего значения — ураганы, наводнения, землетрясения и т.д.) и обобщенное распределение Парето — Generalized Pareto distribution (позволяет моделировать только хвост распределения).

Результаты нового анализа вполне могут стать предметом рассмотрения на очередном Нобелевском симпозиуме.

Вот их резюме.

  1. Анализ 2.5 тыс. лет эпидемий показал, что статистическое распределение их жертв имеет чрезвычайно «толстый хвост» (Fat-Tailed Distribution). В «толстом хвосте» графика этого распределения зачастую прячутся «Черные лебеди» — редкие, маловероятные, но очень значимые события — что делает бессмысленным вычисление средних значений. По своей «толщине» хвост распределения жертв пандемий не уступает распределению жертв войн.
  2. Чем «толще хвост» распределения, тем сильнее он «виляет собакой». Т.е. тем больше статистической информации содержится в крайних точках и тем меньше — в «массовых» событиях высокой частоты, где она становится почти шумом. Поэтому расчеты на основе средних значений по «массовым» событиям могут быть неинформативными и ненадежными. Для распределений с «толстыми хвостами» нужно извлекать ценную информацию из пиковых событий, прячущихся в хвостах. Это делается путем отказа от опоры на средние значения и использования вместо этого Теории экстремальных значений и обобщенного распределения Парето.
  3. Такой подход меняет все: от моделей эпидемий до политических решений по борьбе с ними. Он дает совсем иные результаты. Но главное, он меняет мировоззренческие представления о соизмеримости вероятностей, неопределенностей и рисков. Сегодняшние доминирующие представления о вероятностных рисках основаны на сравнении «теплого и длинного». Практически все (обыватели, журналисты, эксперты, политики) сопоставляют число жертв пандемии с числом жертв автомобильных аварий, сердечных приступов, рака, падений с лестниц и т.п. Это в корне ошибочно, поскольку распределение жертв последних имеет тонкие гауссовские хвосты, в которых просто не спрятаться «черным лебедям». А в толстых хвостах пандемий их может быть сколько угодно и без ограничений размера. Не понимая этого: (1) реалистичное управление рисками невозможно, (2) используемые модели (типа SIR) хороши для научных дискуссий, но бессмысленны для принятия практических решений.

В заключение о важном дополнении к работе Талеба и Сириллио.

✔️ Авторы, имхо, абсолютно правы, утверждая, что Теория экстремальных значений — единственно верный статподход современной науки для управления риском и принятия решений в борьбе с пандемией.

✔️ Но от себя добавлю. Этот подход единственный в рамках привычной нам науки. В постнауке (а она уже рядом) есть методы покруче Теории экстремальных значений. Подтверждая выводы последней, «Динамическое причинно-следственное моделирование» Фристона, идет куда дальше. Оно в корне меняет отношение Homo sapiens к неопределенности, являющейся не чем иным, как непомерной ценой, заплаченной за интеллект.

Об этом мой очередной пост, от написания которого снова пришлось отвлечься из-за Талеба.

________________________________

Если понравился пост:
- нажмите на “палец вверх”;
- подпишитесь на
обновления канала на платформе Medium;
- оставьте комментарий.
Еще больше материалов на моем Телеграм канале «Малоизвестное интересное».
Подпишитесь

--

--

Сергей Карелов

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации