Цифровое министерство пропаганды

Практический кейс алгоритмической цензуры Яндекса

Сергей Карелов
7 min readMar 19, 2021
Источник: Gettyimages

В наше время две темы чрезвычайно важны и актуальны, как для каждого из нас, так и для всего общества.

1. Расширяющийся контроль государства и мегакорпораций в формировании медийной повестки.

2. Рост значения фактора предвзятости алгоритмов машинного обучения при принятии решений государством и бизнесом.

Кейс, о котором я хочу рассказать, объединяет обе темы, что делает его особенно важным и показательным.

Целый год я изучал работу алгоритма публикации постов Яндекс Дзена на собственном опыте. Изучал, поставив, как говорит Нассим Талеб, «шкуру на кон».

И вот результат.

✔️ Шкуру я проиграл.

✔️ Но зато теперь понимаю, как работает алгоритмическая цензура Яндекс Дзена.

Полагаю, этот мой опыт может быть полезен и тем, кто пишет для Яндекс Дзена, и тем, кто читает посты на этой платформе.

— — —

Вряд кто будет спорить, что Интернет неуклонно превращается в главную медиа-среду для молодых, а со временем, весьма вероятно, и для более старшего населения.

Полагаю, также мало людей возьмется спорить с тем, что лидирующая роль в формировании медийной повестки Рунета принадлежит одной мега-корпорации. И это не Сбер или Газпром-Медиа, а Яндекс.

Посему нет ничего удивительного в том, что

и государство, и Яндекс, хоть и из разных побуждений, но одинаково заинтересованы в своем влиянии на то, что видят и читают люди в сети, какие новости стоят в топах, и какого рода контент наиболее популярен.

О том, как столкнулись интересы государства и мега-корпорации (неукротимый носорог Яндекса налетел на несокрушимую скалу государства) в вопросе формирования приоритетов новостной выдачи (дискриминации тех, кто не входит в цифровую экосистему Яндекса), пишут все крупные СМИ вот уже второй месяц ([1], [2], [3], а предыстория вопроса здесь [4]).

Однако, не новостями едиными питает читателей медийная среда. Содержательные посты, статьи, анализы и прогнозы влияют на умы и настроения общества не меньше новостей.

Резонно предположить, — если для приоритезации новостных выдач у Яндекса работает целая система (алгоритмы оценки, «колдунщики» и т.д.), что-то похожее должно работать и на платформе формирования содержательной ленты (посты блогеров и медиа) Яндекс Дзен.

Вот конкретный пример — кейс моего канала «Малоизвестное интересное»:

как за год число показов постов моего канала в ленте ЯДзена было уменьшено в 14 раз.

Вот как выглядели показатели канала год назад — период в 60 дней за февраль-март 2020 (официальная статистика ЯДзен)

Из статистики видно, что число показов постов канала за месяц было примерно 3212 тыс. (6424 тыс. за 60 дней поделить пополам) при среднем CTR% (Click-Through Rate или кликабельность — отношение числа кликов по карточке публикации к числу ее показов в ленте Дзена) 7,8% и среднем проценте дочитывания (доля дочитавших пост до конца) 56%

А вот как выглядит статистика этого года для интервалов в 90 и 30 дней (статистика за 60 дней теперь отменена ЯДзеном)

Как видите, число показов постов за месяц здесь получается примерно 572 тыс. (1718 тыс за 90 дней поделить на 3) при среднем CTR% 5,3% и среднем проценте дочитывания 65%.

А за последний месяц число показов постов упало до 237 тыс. при среднем CTR% 2,8% и среднем проценте дочитывания 61% .

Таким образом, за год среднее число показов постов за месяц упало в 14 (!) раз. При этом у тех читателей, кому удается увидеть пост в ленте и прочесть его, средний процент дочитывания за год, наоборот, выросна 20+% (с 51% до 61–65%).

Какие могут быть объяснения для столь катастрофичного падения (в 14 раз!) числа показов постов канала?

Вот мое объяснение

  • Показы постов канала регулярно блокируются алгоритмом показов, и я должен постоянно отслеживать, заблокирован ли мой очередной пост или нет.
  • Когда я вижу, что показы поста не растут, пишу в службу поддержки ЯДзена. На разбирательство уходит несколько дней.
  • В итоге (во всех случаях!) мне присылается такой стандартный текст
  • Т.о. после нескольких дней блокировки происходит её снятие. Но увы, этим дело не заканчивается. Уже будучи разблокированным, пост каким-то загадочным образом (как будто получив некую «чёрную метку») показывается в несколько раз реже, чем другие посты канала (которые не подвергались блокировке).
    Вот пример поста, упомянутого в ответе службы поддержки, приведенном выше.

Вы спросите, — как часто такие блокировки случаются?

Увы, все чаще.

Например, за последние 10 дней из опубликованных 6 постов 3 поста (половина!) были заблокированы вышеописанным манером.

А вот объяснение блокировок и падения числа просмотров службой поддержки ЯДзен

Далее идет длинный перечень советов, чтобы научить меня писать хорошие посты.

В целом, из ответа следует, что за год посты канала стали настолько хуже, что

алгоритму (это же он оценивает качество постов) не оставалось ничего другого, как снизить число показов в 14 раз.

Какова же должна быть предвзятость алгоритма, если за чуть больший чем год период число подписчиков канала на ЯДзен увеличилось более чем в 2 раза (с 8 до 18 тыс — см. рис. ниже). Получается, что алгоритму просто не оставалось ничего, как тупо уменьшать аудиторию канала с 97 до 18 тыс. (см рисунок ниже).

Рост числа подписчиков на платформе ЯДзене подтверждается близкими показателями канала на других платформах (существует 4 зеркала канала на разных платформах: Телеграм, ЯДзен, Medium и Facebook).

Например, в Телеграм за год число подписчиков выросло с 24 до 29 тыс. А за последние полгода прирост шел таким образом (графиков за больший период TGStat не предоставляет).

Резюме

Зачем государству и мега-корпорациям нужна дискриминация определенного контента и/или авторов?

Ответ давно известен. И те, и другие исповедуют банальную заповедь рекламодателя:

«Всегда говорите правду, говорите много правды, говорите гораздо больше правды, чем от вас ожидают, никогда не говорите всю правду».

  • Государству эта заповедь нужна для пропаганды.
  • Мега-корпорациям — для соблюдения собственных бизнес интересов.

Что же до практических механизмов реализации этой заповеди, то они могут быть разными. В цифровую эпоху проще всего использовать «метод искажающей дозировки», т.е. сохранения некой доли достоверности и расстановке акцентов (приоритетов), которые придавали бы событиям (трактовке темы) характер, угодный интерпретаторам [5].

Таким образом, при формировании, что ленты новостного агрегатора, что ленты платформы ЯДзен, —

достаточно научить алгоритм «правильно» расставлять приоритеты, и одни новости и публикации поднимутся в топ, а другие уйдут за границу видимости для большинства пользователей.

Но ведь для этого надо уметь «правильно учить» алгоритм, а это совсем не просто. Тут набором ключевых слов не обойтись.

Слава богу, есть куда более продвинутые методики машинного обучения, обеспечивающие развитый функционал для любого «цифрового министерства пропаганды». Будь то настоящее министерство или мега-корпорация, — всё одно.

Остается не отвеченным лишь один вопрос –

за что же дискриминируется именно канал «Малоизвестное интересное»? Чем он не угодил алгоритму ЯДзена?

Полагаю, ответ лежит на поверхности. И «мотивация алгоритма» ЯДзена та же, что и «мотивация алгоритма» поиска в кейсе Яндекса с Роскомнадзором — нужно продвигать своих. Тех, кто, как пишет ТАСС, «входит в цифровую экосистему Яндекса».

Кто же это для ЯДзен?

Точно никто не скажет. Но попробую предположить.

Вот, например, канал «О Жизни и об Истории»: число подписчиков в 1.5 раза меньше, чем у канала «Малоизвестное интересное», но аудитория наоборот — в 3 раза больше.

Посмотрим, о чем пишет этот канал:

  • вытирает ноги об актера Алексея Серебрякова за то, что тот приехал в Россию, ибо, по мнению автора, «в Канаде не заработаешь, а в России — вполне»;
  • хвалит правительство России за то, что «во избежание социальных потрясений, в том числе и инициированных Западом, власть находит необходимым проводить политику некоторого умиротворения сограждан»;
  • поддерживает «бесогонения» Никиты Михалкова против популярных актеров, ибо «с их стороны — несусветная глупость раскачивать лодку, точнее даже — уютную яхточку, — в которой они разместились, во многом благодаря существующему ныне политическому режиму».

И т.д. и т.п.

А может всё это лишь продукт моей фантазии? Может, интересы Яндекса здесь ни при чем. И во всем виноваты вырвавшиеся из под контроля людей алгоритмы. Полагаю, что такая трактовка могла бы подойти для канала «О Жизни и об Истории». Я же от такой версии воздержусь.

Есть еще вариант — всё объясняется спецификой аудитории. Так что ж, за год аудитория ЯДзена изменилась в 14 раз?

Не думаю …

А в завершение уточню.

Всё сказанное в этом посте является оценочными суждениями, выражающими личное мнение автора.

________________________

Спасибо за просмотр! Ставьте лайки и подписывайтесь на канал. Всего доброго!

--

--

Сергей Карелов

Малоизвестное интересное на стыке науки, технологий, бизнеса и общества - содержательные рассказы, анализ и аннотации