Найден метод надежного прогноза успешности стартапов

Это изменит $330 млрд.-ный венчурный бизнес (и не только)

12 min readJun 18, 2019

Авторы открытия считают, что научились, как бы, оцифровывать потенциал конвертации человеческого капитала в рост коммерческой успешности стартапов.

Найденный способ — формальный: задал нужные входные данные и алгоритм выдаст результат.

Как показала проверка, предсказательная точность способа примерно вдвое выше лучших показателей профессионалов венчурных инвестиций, чья работа при этом несравненно дороже.

Всё это звучит абсолютно нереально.
Ну не может такого быть, потому что не может быть никогда!

Но метод тщательно проверен на 26-летней статистике мировой базы данных стартапов, и лежащая в основе метода гипотеза подтвердилась.

Это открытие, теоретически, способно перевернуть не только индустрию венчурных инвестиций, но и весь бизнес. Ведь речь идет о 100%-но автоматизируемой аналитике, по мнению авторов, решающей заветную задачу любого бизнеса —

прогноз превращения знаний в деньги.

Эта аналитика предоставляет возможности:

оцифровывать скорость притока в компанию знаний и компетенций за счет прихода в неё новых сотрудников;
анализировать возникающие в результате переходов людей перетоки компетенций в масштабах всей социальной сети из конкурирующих компаний;
весьма точно прогнозировать на годы вперед трансформацию притока знаний и компетенций в коммерческий успех компаний.

Т.е. просто улет! Но есть и обоснованные сомнения.

Не в прогнозной точности новой модели. Она действительно вдвое выше, чем прогнозы экспертов по венчурным инвестициям (тут против результатов численного моделирования на реальных данных, при всем желании, не попрешь).

Сомнения есть в интерпретации гипотезы,

положенной авторами в основу своего метода.

Ведь что, на самом деле, лежит в основе их модели?

Авторы считают, что их модель оцифровывает потенциал конвертации человеческого капитала стартапов в рост коммерческой успешности их бизнеса.
Мне же видится, что все существенно проще. Не в знаниях дело. Эта модель описывает —

конвертацию связей во впечатления, конвертируемые затем в деньги.

Если эта альтернативная гипотеза верна, то найден очередной поразительный и, я бы даже сказал, скандальный пример работы «сетевой формулы успеха» Альберта-Ласло Барабаши — «сетевого Эйнштейна» 21 века.

Самое главное — команда

Этот фраза — даже не тезис, а закон. И он известен всем хоть как-то причастным к венчурному бизнесу.

Попытки оцифровать данный закон для формального анализа эффективного потенциала команд были многочисленные. Пытались измерять все-все-все: образование, возраст и опыт работы людей, географию работы, частоту переходов, профайлы компаний нанимателей, само- и внешние оценки компетенций …, ну и, конечно же, показанные в прошлом результаты (измеряемые десятками несопоставимых методов).

Не работало ни-че-го!

Предсказательные возможности построенных на этих методиках моделей ничем не отличались от случайного выбора (например, подбрасыванием монетки).

И вот дождались-таки революции. Группа исследователей из Отделения математических наук и Отделения бизнеса и менеджмента Лондонского университета, Института Алана Тьюринга (Лондон), Катанийского университета (Сицилия) и Объединенной лаборатории наук о сложности (Вена) пошла другим путем.

Авторы исследования, названного «Predicting success in the worldwide start-up network», предложили оригинальный синтетический подход.

Зачем заморачиваться в попытках препарировать то, что люди привносят в бизнес компании, приходя в нее работать? Знания, опыт, компетенции, связи, «тараканы в голове» …
Да все это они и приносят, — со всеми плюсами и минусами.
Любая компания работает не сама по себе, а в конкурентной сетевой среде. Точками кристаллизации данной среды — узлами сети — выступают конкурирующие на рынке компании. А ключевой ресурс, за который они конкурируют — это люди, регулярно меняющие место работы.
Такую конкурентную среду можно представить в виде графа социальной сети: узлы — это компании, а социальные связи — это конкретные люди, переходящие с работы на работу между компаниями. И если из компании А в компанию В (или наоборот) никто не переходил, то и связи между компаниями нет.

Вот такая интересная модель получилась. Но при этом остался вопрос на миллион долларов.

Если с людьми между компаниями перетекают пока что весьма плохо измеримые знания и компетенции, каким интегральным показателем можно все эти перетоки измерить?

Исследователи нашли простой до гениальности ответ — а не надо вообще заморачиваться, ведь все это — информация.

С переходом людей между компаниями, происходит переток некой информации между узлами сети.
Чем больше информации втекло в какой-то узел (и чем меньше утекло), тем узлу (компании) лучше для адаптации в конкурентной среде и принятия оптимальных решений.
Следовательно, достаточно измерять скорости перетока информации между узлами социальной сети, чтобы вычислять накапливаемую в ее узлах информацию. Это и будет нужный показатель.

Осталось понять, а есть ли в теории сетей такой показатель?

Задача о бассейне

Ход рассуждения авторов исследования был, примерно, таков.

Рассмотрим способы анализа процессов информационного обмена, например, в наукометрических базах данных. Как в таких сетях определяется влиятельность публикаций? Да примерно так же, как и в интернете определяется ранг сайтов — по метрикам центральности узлов графа.

Эта центральность может определяться по-разному:

Центральность по степени (degree centrality)- вычисляется по количеству связей.
Центральность по посредничеству (betweenness centrality)- вычисляется как количество кратчайших путей между всеми парами узлов, которые проходят через заданный узел.
Центральность по собственному вектору (eigenvector centrality) — демонстрирует зависимость влиятельности узла от значений влиятельности его соседей.
Центральность по близости (closeness centrality) — показывает скорость распространения информации по сети.

Стоп! А ведь closeness centrality — это ровно то, что надо: скорость перетока информации по социальной сети.

Следовательно, центральность по близости и следует вычислять, измеряя тем самым скорость перетоков информации по сети. Ну а дальше, как в задаче про бассейн — чем больше воды в него втекло и чем меньше вытекло, тем выше в нем уровень воды.

Нужны большие данные

Итак, гипотеза оформилась. Нужно сопоставить:

— зафиксированную по годам динамику объемов перетоков информации за счет переходов людей между компаниями;
— и успешность компаний (для каждого конкретного месяца и года на горизонте в несколько лет).

Базу данных перетоков людей сделали, почистив от кривой и неполной информации базу Crunchbase. Из первоначальных 531К осталось 42К компаний из 117 стран. Эти 42К узлов полученной сети объединили 284К связями — переходами 32К людей между компаниями.

Сеть получилась динамическая — сильно меняющаяся во времени за 26 лет с 1990 по 2015.

Потом еще поколдовали с двухсторонними связями, в результате чего их число сократилось примерно вдвое — до 135К. В результате получилась сеть, названная World Wide Start-up (WWS).

***Визуализация наиболее активной части WWS (8% узлов и 31% связей). Источник:*** https://www.researchgate.net/publication/332494529_Predicting_success_in_the_worldwide_start-up_network

Кто самый успешный?

По гипотезе авторов исследования,

самые успешные компании — те, в которые больше всего втекло знаний, компетенций и опыта ведущих сотрудников, и меньше всего вытекло.

Измеряется этот показатель на основе ежемесячного мониторинга показателя центральности по близости (closeness centrality) каждой компании. Как такой показатель назвать? Да как угодно: накопленный человеческий капитал, притекшие и неутекшие знания и т.д.

Вот, например, как в сети WWS смотрится компания Airbnb и её связей через своих ведущих сотрудников с другими компаниями сети.

***Фрагмент отображения компании компания Airbnb в сети WWS. Источник:*** https://www.researchgate.net/publication/332494529_Predicting_success_in_the_worldwide_start-up_network

В квадрате из красных пунктирных линий показан перешедший в 2013 на работу в Airbnb Томас Аренд, бывший до того, среди прочего, Senior product manager в Google, International product leader в Twitter и Product manager в Mozilla. С его приходом в Airbnb, компания увеличила свой накопленный человеческий капитал и, за счет установления связей с новыми компаниями, повысила свой показатель центральности по близости.

А вот характерный пример того, как менялся во времени показатель накопленного человеческого капитала и, соответственно, центральности по близости у пяти компаний.

***Динамика показателя накопленного человеческого капитала пяти компаний: Apple, Microsoft, Facebook, Airbnb и Uber. Источник:*** https://www.researchgate.net/publication/332494529_Predicting_success_in_the_worldwide_start-up_network

Легендарный Apple — годами стоит почти как вкопанный вблизи максимума показателя, но все же по чуть-чуть приближаясь к этому максимуму.

Microsoft — также титан, в начале 90х и сейчас играющий с Apple на равных, но повидавший не столь блистательные времена, ощутимо просев в период с 1995 по 2005.

Уникальный «единорог» 1й декады 21 века Facebook ракетой взмыл в 2005 и за 10 лет практически достал лидеров Apple и Microsoft.

Еще более амбициозные, чем Facebook, «единороги» 2й декады 21 века Airbnb и Uber поднимаются вверх, но прошли лишь полпути до лидеров.

Итак, осталось решить, как измерять успешность. Здесь авторы решили не изобретать велосипеда.

Компания считается успешной на горизонте времени 7 лет, если в течение этого времени произойдет, как минимум, одно из следующих событий — компания:

— будет куплена другой компанией;
— купит другую компанию;
— выйдет на IPO.

Такой подход к оценке успешности выглядит не сильно интеллектуальным. Но, положа руку на сердце, ведь примерно так же, не мудрствуя лукаво, оценивается успешность стартапов профессионалами венчурного рынка.

Ну а теперь посмотрим, что у исследователей получилось.

Результаты моделирования

В ходе моделирования 26 летней истории 135 тыс. переходов 32 тыс. людей между 42 тыс. компаний, для каждого модельного месяца рассчитывались показатели центральности по близости для каждой из входящих в сеть компаний.
По результатам этого расчета центральности, компании ранжировались: чем выше центральность по близости, тем выше ранг.
В зависимости от ранга компании, рассчитанного для месяца Х года Y, прогнозировалась «траектория успешности» компании на 7 лет вперед (начиная с месяца Х+1 года Y). Траектория предполагалась тем более успешной, чем выше ранг компании.
Для следующего модельного месяца все повторялось заново. И тем самым, динамически обновляя расчет центральности по близости, а затем и ранга, ежемесячно уточнялся прогноз «траектории успешности» компаний на 7 лет вперед.

Так поэтапно и просчитали все 26 лет. А потом сравнили с тем, что было в реальности.

Результат получился вот какой.

***Прогнозирование долгосрочного успеха компаний на основе рейтинга центральности по близости. Источник:*** https://www.researchgate.net/publication/332494529_Predicting_success_in_the_worldwide_start-up_network

На нижнем графике синей линией показана успешность прогнозов проверяемой модели на ежемесячной основе по сравнению с успешность прогнозов нулевой модели (случайное рейтингование компаний), показанной черной линией.

Показатель успешности прогнозов определяется так. Например:

максимальный показатель синей линии в 48% (2003 год) означает, что 48% компаний из списка Тор-20 рейтинга центральности по близости показали в следующие 7 лет, как минимум 1 из 3х типов успеха (были куплены, сами купили или вышли на IPO);
минимальный показатель синей линии в 17% (2007 год) означает, что только 17% компаний из списка Тор-20 рейтинга центральности по близости показали в следующие 7 лет, как минимум 1 из 3х типов успеха.

На верхнем графике показана вероятность (p-значение) случайного получения показателя успешности прогнозов выше, чем наблюдавшийся в соответствующем месяце. Серая затененная область указывает периоды времени, где прогноз статистически значим (р-значение < 0,05). Например, для 48% в 2003 г. р-значение < 0,0001, а для 17% в 2007 г. р-значение получилось не очень статистически значимое — больше 0,1.

Принимая во внимание, что точность предсказаний успеха стартапов на ранних инвестиционных стадиях экспертами венчурного бизнеса составляет примерно 10–15%, получается следующее.

В период стабильно растущей экономики модель показала повышение точности предсказаний успешности стартапов в несколько раз, по сравнению с нулевой моделью (случайное рейтингование компаний).
По мере приближения и вхождения в кризис, предсказательная точность модели снижалась, оставаясь при этом, в среднем, все же вдвое более точной, по сравнению с нулевой моделью.
Среднее улучшение точности предсказаний успешности стартапов на ранних инвестиционных стадиях, по сравнению с предсказаниями экспертов венчурного бизнеса, составило, примерно 100% (25–30% по сравнению с 10–15%).

Так что сами видите, модель работает весьма точно. Несравненно точнее случайного гадания. И ощутимо точнее прогнозов лучших специалистов венчурной индустрии.

Из чего следует, что в скором времени процедура скринига стартапов будет проводиться не людьми, а ИИ.

Тем более, что авторы исследования показали, как, например, это можно сделать.

Дело в том, что разработанная модель предоставляет лишь эвристические рекомендации и не дает численного прогноза вероятности конкретного стартапа достичь коммерческого успеха на горизонте в 7 лет (для справки, — длительность временного горизонта прогноза модели в исследовании изменялась).

Однако в приложении к исследованию, авторы показали, что с использованием классификационной модели, например, логистической регрессия (logistic regression), вполне возможен численный расчет вероятности успеха для конкретного стартапа. При тестировании авторы расчитали точность таких предсказаний. Измеренная показателем F-мера (F1 score — совместная оценка точности и полноты) она составила 0,6.

Так что получается, что вслед за биржевыми маклерами, уже заменяемыми ИИ, могут приготовиться на выход аналитики скринига стартапов. ИИ это будет делать точнее, быстрее и дешевле.

Итак, резюмируем.

A. Новый метод повышает точность прогнозов успешности стартапов.
B. Также он позволяет автоматизировать процесс скринига стартапов, понизив его стоимость и повысив скорость.

Однако остался важный вопрос.

—Каков «физический смысл» новой модели?

— Иными словами, что в реальности отображает лежащий в основе модели расчетный показатель центральности по близости?

Альтернативная гипотеза — не знания, а связи

Авторы считают, что «физический смысл» их модели — оцифровка перетоков знаний и компетенций между компаниями, вследствие переходов людей с работы на работу.

Возможно. Но тогда получается, что успех стартапа определяется, как бы его «талантом» — неким интегральным показателем аккумулированных в нем знаний, компетенций и опыта его сотрудников.

И вот тут-то в самый раз вспомнить о замечательной новой междисциплинарной науке — сетевой «Науке об успехе» («Science of Success»), убедительно доказавшей на многих примерах, что

в сетевых системах из двух ключевых факторов — «талант» и «связи» — доминирующую роль играет вовсе не фактор «таланта», а фактор «связей».

На эту тему мною уже написано так много, что я не буду здесь вдаваться в детали, а переадресую желающих в них разобраться:

к серии постов канала «Малоизвестное интересное» с тегом #ScienceOfSuccess;
путеводителю по постам этой темы, озаглавленном «Новая наука об успехе и удаче. Как на них влияет сетевое устройство мира»;
ну и конечно же к «Библии» этой темы — книге великого Барабаши, уже несколько месяцев входящей в топы мировых бестселлеров, — «The Formula: The Universal Laws of Success».

В этом месяце CNN, Forbes и Inc — BookAuthority включили бестселлер Барабаши «The Formula: The Universal Laws of Success» в список 17 книг, которые “обязательно нужно прочесть в 2019”. Источник https://bookauthority.org/books/new-success-ebooks?t=12berr&s=author&book=0316505498

Главные заповеди этой «Библии» таковы.

✔️ В цифросетевом мире не только экономика, но и успех, в основном, зависит «от впечатлений» — т.е. не от продуктивности автора и качества его продукта или достижений, а от их (автора и продукта) коллективного восприятия обществом.

✔️ Восприятие в цифросетевом мире, в первую очередь, зависит от связей — кто про вас знает, кто вас рекомендует, насколько известны и влиятельны ваши «инфлюенсеры», и насколько «центрально по близости» они встроены в сетевую систему.

Команда Барабаши и его последователей в других лабораториях мира, занимающихся исследованиями в области «Science of Success», за последние пару лет раскрыли удивительные особенности карьеры творческих профессий: ученых, художников и ряда других творческих профессий, результативность которых в течение карьеры может быть эффективно оценена.

Выводы всех этих исследований довольно однозначны:

Необходимо четко различать продуктивность и успех любой творческой деятельности.
Продуктивность деятельности зависит от участвующих в ней людей, а успех — от восприятия этой деятельности и её продуктивности другими людьми («Performance is about you, success is about us»)
В цифросетевом мире закон Матфея («Богатые будут богаче, а бедные беднее») уже не просто закон, а Основной закон — так сказать, конституция цифрового мира. И согласно этой «конституции», —

наибольший успех получает тот, кто уже наиболее известен.

Математической основой конституции цифрового мира является «предпочтительность установления сетевых связей» (preferential attachment) — например, новый документ в сети более вероятно будет иметь ссылку на уже существующий документ, на который уже есть много ссылок.

Preferential attachment — это и есть закон Матфея цифрового мира, согласно которому

успех писателей, художников, актеров и т.п. зависит от их связей — их встроенности в свои профильные социальные сети.

Изучив динамику взаимосвязей в этих сетях, исследователи «Science of Success» не только способны точно рассчитать уровень успеха того или иного автора или актера, но и довольно точно определить, когда его звездный час настанет и будет ли он единственный в его карьере или имеет шанс повториться (см. новейшую работу на эту тему «Quantifying and predicting success in show business»).

Ну а теперь вернемся к исследованию «Predicting success in the worldwide start-up network»:

его базовой гипотезе о центральности по близости компаний, как основном предикторе их успеха;
интерпретации центральности по близости компании, как суммарных знаний и компетенций работающих в ней сотрудников.

Так вот, согласно «Science of Success», пункт 2 вообще не нужен.
Успех стартапов подобен успехам творческих профессионалов. Ведущую роль здесь играет на талант (знания, компетенции) учредителей и ведущих сотрудников, а их связи и случай.

Стартаперы — тоже своего рода художники или, если хотите, артисты.

Ибо центральность по близости компании, интегрирующая центральность по близости всех ее сотрудников, является необходимым и достаточным условием успеха компании.

Иными словами, соберите в стартапе как можно больше известных персон, уже засветившихся в других, желательно, как можно более известных компаниях, и имеющих максимально большую сеть известных и влиятельных знакомых в индустрии, — и компания достигнет успеха.

Вне зависимости от собранных в стартапе знаний и компетенций и даже от продукта компании.

И всё это потому,

что в цифросетевом мире стартапов рулят связи его сотрудников и впечатления, генерируемые инфлюенсерами их профильной социальной сети.

Ну а знания, компетенции и тому подобное …, конечно, тоже кое-что значат. Но это не главное в венчурном сетевом бизнесе впечатлений.

Этот вывод основан всего лишь на моих спекуляциях, сделанных путем переноса базовой идеи сетевой «Науки об Успехе» на интерпретацию результатов исследования «Predicting success in the worldwide start-up network».

Какая из двух интерпретаций — авторов исследования или моя — окажется верной, покажут дальнейшие исследования.

Ну а пока зафиксируем уже доказанный и сам по себе фантастический прорыв.

Найден метод надежного прогноза успешности стартапов.
Это довольно сильно повлияет на $330 млрд.-ный венчурный бизнес.

________________________________

Если понравился пост:
- нажмите на “палец вверх”;
- подпишитесь на обновления канала на платформе Medium;
- оставьте комментарий.
Еще больше материалов на моем Телеграм канале «Малоизвестное интересное». Подпишитесь