ВК населяют десятки тысяч ботов, которые хвалят власти и ругают Запад. Об этом знает руководство соцсети, но не мешает им работать. Визуальное исследование «Новой-Европа»
Масштабы активности ботов в ВК огромны: в популярных новостных пабликах они пишут до 35% всех комментариев. Ботосфера населена эльфами, троллями, поклонниками губернаторов и депутатов, нейросетями, защищающими «Единую Россию», и даже СММ-щиками «Ростелекома». Чтобы разобраться, кого можно встретить на просторах крупнейшей российской соцсети, «Новая-Европа» совместно с Re:Russia изучила более 7 млн комментариев, оставленных ботами в 2023 году, по данным проекта «Ботнадзор». Нам удалось выяснить, чем разные ботофермы отличаются друг от друга, какую повестку продвигают и как с ними (не) борется ВК.
Аналитическую часть совместного исследования читайте на Re:Russia
В декабре в комментариях к посту «Известий» в ВК об очередном брифинге Минобороны между пользователями произошла перепалка:
Камила: поддерживать гибель украинских военных никак нельзя! Мы ведь братские народы, мы должны всеми силами остановить это кровопролитие!
Матвей: Никто не радуется их гибели, радуются тому, что земли освобождаются от присутствия тех, кто годами не давал их жителям жить спокойно
Григорий: Украинские военные могут сдаться в плен российской армии, где им при необходимости даже медицинскую помощь оказывают
На первый взгляд, ничего необычного — обычный спор между пользователями. Но посмотрим подробнее, кто именно пишет комментарии. По данным проекта «Ботнадзор», страницу Матвея ВК блокировал и разблокировал обратно три раза, и сейчас она снова доступна. Суммарно он оставил 686 похожих комментариев.
Григорий написал 313 комментариев, почти все они также касались войны, и его страница сейчас заблокирована. И Матвей, и Григорий — боты.
К сожалению, призывы Камилы к человечности утопают в бесконечных комментариях сотрудников кремлевских ботоферм… Но постойте, мы ведь помним о существовании и антивоенной ботофермы. Вдруг Камила тоже бот? Посмотрим, о чем она писала еще:
«Человеческая жизнь бесценна, — пока всё сходится — но Зеленский видимо считает иначе, раз он до сих пор предпочитает получать западные деньги за продолжение конфликта, в котором украинцы гибнут».
Стоп. Читаем дальше.
«Любое обсуждение сотрудничество между двумя государствами идет на пользу обеим странам, так что, переговоры с КНДР наверняка будут успешными».
«При Путине здравоохранение, образование, например, сделали значительный скачок вперед💪🏻💪🏻»
Камила действительно бот, правда далеко не оппозиционный. Более того, скорее всего, она нейросеть. Камила написала 268 комментариев, и ВК банил и разбанивал ее страницу два раза.
Получается, что 13 декабря в комментариях «Известий» «добрый» кремлебот вступил в дискуссию со «злыми».
Чтобы лучше разобраться в разнообразии этой вселенной, «Новая-Европа» изучила более 7 млн комментариев ботов в ВК за 2023 год.
КАК МЫ СЧИТАЛИ
По открытым данным проекта «Ботнадзор», в 2023 году 120 тысяч аккаунтов ботов написали 7 млн 312 тысяч комментариев. Боты были классифицированы «Ботнадзором» на эльфов, региональных, рекламных, других провластных ботов и прочие менее многочисленные категории. Проект вычислял ботов по похожим паттернам активности, после чего большая часть аккаунтов ботов валидировались вручную.
Чтобы валидировать кластеризацию «Ботнадзора», а также выделить дополнительные подкластеры провластных ботов, мы провели собственный анализ на основе групп, в которые боты пишут комментарии.
Для анализа поведения ботов мы взяли только те аккаунты, которые в 2023 году написали десять и более комментариев не менее чем в трех разных пабликах. Таких оказалось 58 тысяч, и они написали 94,5% всех комментариев ботов. В дальнейшем мы учитываем только их.
Чтобы визуализировать кластеры ботов, мы представили каждого бота в виде вектора, отражающего группы, в которые он писал комментарии. Каждая координата этого вектора — определенный паблик, и число 0 или 1 по этой координате для каждого бота показывает, писал ли в него бот. Мы учитывали только те паблики, в которые писало не менее пяти ботов. Получившиеся векторы мы отнормировали, т. е. поделили на длину вектора. Таким образом, чем ближе векторы двух ботов друг к другу, тем в более похожие паблики они писали.
Чтобы изобразить ботов в виде двумерной картинки и кластеризовать их, сначала мы снизили размерность векторов с 9843 (именно столько пабликов мы учитывали) до десяти с помощью метода PCA, а получившиеся векторы спроецировали на плоскость с помощью t-SNE.
Нужно иметь в виду, что иногда при применении такого метода на 2D-картинке могут образоваться «ложные» кластеры, так что для анализа их границ нужно использовать дополнительные параметры. Так, мы проверяли, на какие темы говорят боты, с помощью анализа частоты слов, которые они используют. Оказалось, что боты, которые используют слова с похожей частотой, оказались рядом на нашем графике. Более того, кластеры ботов, принадлежащих разным ботофермам, хорошо выделяются по используемой лексике: например, эльфы чаще других ботов используют слово «война», а кремлеботы — «запад».
Кластеры, которые визуально выделяются нашим методом, хорошо совпали с разбивкой ботов на категории «Ботнадзора» — на эльфов, провластных, региональных и рекламных ботов.
Для более детального анализа провластных ботов и разбивки их на категории «добрых» и «злых», а также выделения подкластера «Единой России», мы использовали комбинацию методов машинного обучения, коротая ориентировалась на близость ботов друг к другу на двумерной плоскости, а также частоту некоторых слов, искользуемых в комментариях (например, "Единая Россия"). Сначала мы использовали приблизительную разбивку на кластеры с помощью k-means. Затем мы построили логистическую регрессию, используя в качестве обучающей выборки ботов, точно попадающих и точно не попадающих в желаемые кластеры (например, тех, кто упоминал «ЕР», и тех, кто на визуализации находился далеко от них).
Нужно отметить, что любая кластеризация не может быть идеально точной. Иногда аккаунты попадают не в ту категорию, к которой на самом деле относятся, хоть таких случаев и немного.
Для определения «настроя» ботов мы использовали модель для оценки тональности. Для определения тем — модель Bertopic. Поскольку, во-первых, комментариев ботов слишком много, а во-вторых, «злые кремлеботы» пишут слишком похожие комментарии в непропорционально больших количествах, сначала мы составили из исходных данных датасет, на котором обучили модель. В него вошли по 20 тысяч комментариев ботов каждой категории, кроме «злых кремлеботов» — для них мы взяли 50 тысяч.
После обучения модели на этом датасете мы применили ее ко всем данным для предсказания категории комментария. Из визуализации мы исключили комментарии, не попавшие ни в одну из тем: таких оказалось от 10 до 23% в зависимости от категории ботов.
Набор векторов, который мы использовали для анализа кластеров ботов в начале статьи, можно использовать и для анализа пабликов. Для этого нужно произвести математическую операцию «транспонирование» — тогда векторы будут представлять уже не ботов, а паблики, в которых они обитают.
Чтобы упростить анализ, мы ограничили его пабликами, в которые писали не менее 50 разных аккаунтов ботов за 2023 год. Как и в случае визуализации ботов, мы снова уменьшили размерность сначала с помощью PCA (на этот раз до 50), затем t-SNE. Так мы получили расположение популярных среди ботов пабликов на плоскости. Чтобы получившиеся точки не накладывались друг на друга, мы использовали функцию spring_layout библиотеки NetworkX.
Вот более подробные портреты ботов из каждой категории.
«Злые кремлеботы»
Самая милитаристская, антизападная и при этом многочисленная категория. Не пишут почти ни о чем, кроме войны и геополитики. Несмотря на то, что многие социологические исследования показывают усталость россиян от войны, на стратегию «злых кремлеботов» это не очень влияет: их нарративы в 2023 году практически не менялись. Подробнее о «злых кремлеботах» можно почитать в статье на Re: Russia.
Раньше считалось, что государство отдает подобные пропагандистские кампании на аутсорс структурам Пригожина, в частности его «Агентству интернет-исследований». В феврале 2023-го Пригожин признал, что действительно является создателем «фабрики троллей».
Можно предположить, что как самый большой кластер провластных ботов, раньше «злые кремлеботы» принадлежали именно Пригожину.
Исследователь российской пропаганды из университета Пассау Серж Поляков считает, что сейчас на замену пригожинским структурам могла прийти АНО «Диалог». «Он, по всей видимости, был создан как конкурирующая организация (в рамках путинской кагэбэшной схемы “весов и противовесов”), и Пригожин ей эту конкуренцию проиграл в целом еще до начала полномасштабного вторжения, — говорит Поляков. — Теперь троллей и ботов на аутсорсе нет, всё под более-менее прямым контролем».
По данным проекта «Ботнадзор», те, кого мы назвали «злыми кремлеботами», критиковали Пригожина уже во время его конфликта с Минобороны, поэтому, вероятно, уже тогда не были ему подконтрольны.
Активность: > 5 млн комментариев за 2023 год (73% от всех ботов).
Вид: человек (боты управляются реальными людьми — вероятно, наемными сотрудниками).
Уязвимость к бану: средняя (забанено 53%).
Настрой: негативный (в три раза больше негативных комментариев, чем позитивных).
Места обитания: почти везде, но чаще всего крупные пропагандистские и «нейтральные» новостные издания.
Любимые темы: военные действия, противостояние с Западом, споры с идеологическими противниками. На социальные темы, характерные для других категорий ботов (дети, цены, чиновники), эти боты пишут значительно меньше.
«Добрые кремлеботы»
В июле прошлого года научпоп-издание TechInsider опубликовало в ВК пост про кадык. Скоро в него массово пришли боты, утверждающие, что «Кадыров — герой России». Скорее всего, дело в том, что слово «кадык» созвучно с фамилией главы Чечни, что и сбило с толку алгоритмы ботов. Это хорошая иллюстрация работы «добрых кремлеботов», хотя обычно они всё же выбирают более подходящие посты.
Такие боты хоть и согласны со «злыми кремлеботами» в том, что только Путин может спасти Россию, а причина всех бед — Запад, иногда их взгляды не совпадают (пример этого — история из начала нашей статьи). «Добрые кремлеботы» стремятся к мирным переговорам и хотят завершить «СВО» как можно быстрее. Часто такие боты пишут комментарии невпопад — их тексты, похоже, генерируются нейросетями или написаны заранее. Это не очень многочисленный, но регулярно встречающийся вид ботов.
Внутри кластера выделяется группа ботов, которые непропорционально часто упоминают «Единую Россию» (57% от всех «добрых кремлеботов»). Кроме упоминаний «ЕР» такие боты мало отличаются от обычных — и по темам, и по времени активности. Но некоторые отличия всё же есть. Например, боты, упоминающие «ЕР», чаще пишут о том, что в России успешно борются с коррупцией. «Ну статистика не даст соврать! Цифры говорят о том, что коррупции становится меньше в нашей стране, значит какие-то меры явно принимаются!» — утверждают они. Другое отличие — боты из подкластера «ЕР» почти в три раза реже оказываются забаненными, чем обычные «добрые кремлеботы».
Активность: 406к комментариев за 2023 год (6% от всех комментариев ботов).
Вид: нейросеть (часто оставляют односложные восхищенные комментарии и эмодзи, стиль сообщений выглядит неестественно).
Уязвимость к бану:
подвид не относящихся к «ЕР»: высокая (забанено 71%);
подвид относящихся к «ЕР»: низкая (забанено 24%).
Настрой: нейтрально-позитивный (число негативных и позитивных комментариев похоже).
Места обитания: чаще всего крупные пропагандистские и нейтральные новостные издания, но в целом живут почти везде.
Любимые темы: короткие восклицания с выражением одобрения в ответ на комментарии сородичей («Огонь!», «Я поддерживаю!»); призывы к переговорам и миру с акцентом на то, что достичь этого может только Путин; противостояние с Западом; социальные темы — цены, коррупция (говорят, что в России успешно борются с проблемами).
Эльфы
«Успешно уничтожены все евро, наша валюта отрицательно растет по плану». «Игорь Конашенков будет озвучивать курс рубля». «Сами знают, что лучше, а наши как воровали, так и сидят и как гибли солдаты, так и гибнут, одного сняли и на другое место воткнули», — комментарии такого содержания оставляют эльфы.
Это антивоенные боты, почти все из которых, скорее всего, связаны с «Легионом эльфов» Free Russia. Они выступают против Путина и войны, но чаще всего в их аргументации звучат социальные темы: цены, дети, коррупция.
9 февраля журналист Андрей Захаров сообщил со ссылкой на два источника, что «фабрика эльфов» закрывается из-за скандала, вследствие которого возникли проблемы с финансированием (в ноябре 2023 года проект стал публичным после слива внутренней информации, опубликованной SVTV). Директор Центра стратегических коммуникаций Free Russia Foundation Егор Куроптев подтвердил Захарову, что проект закрылся, однако, по словам Куроптева, связи со скандалом здесь нет и на проект просто закончились деньги.
Из выборки комментариев ботов в течение одной недели в апреле следует, что сейчас доля комментариев оппозиционных ботов составляет всего 1,7% от всех комментариев ботов.
Вероятно, «фабрика эльфов» правда закрылась, а оставшиеся комментарии могут быть написаны ботами с других оппозиционных ботоферм, масштабы активности которых значительно меньше.
Активность: 724к комментариев за 2023 год (10,5% от всех комментариев ботов).
Вид: человек.
Неуязвимость к бану: низкая (забанено 84%).
Настрой: очень негативный (число негативных комментариев в девять раз больше, чем позитивных).
Места обитания: чаще всего крупные нейтральные паблики на разные темы, в том числе региональные, но также встречаются в пропагандистских группах.
Любимые темы: повышение цен и экономика, проблемы беженцев и эмиграция, дети, коррупция, Путин, осуждение войны.
Регионалы
Функция этих ботов в том, чтобы хвалить местную власть, а в темы федеральной политики и войны они не лезут, поэтому по контенту от прошлых категорий ботов достаточно далеки. Их темы сфокусированы вокруг городской инфраструктуры и других бытовых вопросов.
Своя небольшая ботоферма, судя по всему, есть во многих российских регионах. Исследователь университета Пассау Серж Поляков считает, что это хорошо вписывается в концепцию «центров управления регионами» (ЦУР) АНО «Диалог», которые ответственны за пропаганду в школьных и городских пабликах.
Активность: 606к комментариев за 2023 год (9% от всех комментариев ботов).
Вид: человек.
Уязвимость к бану: низкая (забанено 6%).
Настрой: позитивный (позитивных комментариев немного больше, чем негативных).
Места обитания: чаще всего региональные сообщества.
Любимые темы: ЖКХ, инфраструктура, транспорт, жилье, школы, поддержка местной власти, праздники и фестивали.
Рекламщики
«У нас такой же вирус. Из носа вообще не текло, впервые такое. Мы лечили оциллококцинумом по схеме. Нос промывала аквалором, капала називин 5 дней. Горло смазывала хлорофиллиптом масляным», — такой комментарий легко можно принять за искренний совет заботливой мамы.
Но не в ситуации, когда одни и те же аккаунты оставляют сообщения сотнями со взломанных страниц, рекламируя похожую продукцию и не проявляя никакой другой активности. Часто боты продвигают гомеопатию, противовирусные препараты и ноотропы, лечебные свойства которых доказательная медицина не признает.
Подавляющее большинство рекламных ботов продвигают лекарства в группах для мам и беременных, но в похожей активности участвуют также «Ростелеком», МТС, «Газпромнефть». Проект «Ботнадзор» находил ботофермы Альфа-банка, «Норникеля», «Сибура», «Сибагро» и продавцов автотоваров. Про войну и политику такие боты, конечно, не пишут.
Активность: 90к комментариев за 2023 год (1,3% от всех комментариев ботов).
Вид: человек.
Уязвимость к бану: низкая (забанено 14%).
Настрой: позитивно-нейтральный (позитивных комментариев в два раза больше, чем негативных, но нейтральных сильно больше, чем среди других категорий).
Места обитания: тематические группы, в основном для мам и беременных. Но иногда появляются и в крупных новостных пабликах.
Любимые темы: чаще всего лекарства, но иногда встречаются и бренды компаний из других сфер — «Ростелеком», МТС, «Газпромнефть».
Боты и где они обитают
Можно заметить, что разнообразие ботосферы ВК удивительно широко. У каждого типа ботов есть свои любимые места обитания. Мы нарисовали интерактивную карту, которая поможет понять, кого именно вы, скорее всего, видите в комментариях в конкретном паблике.
На карте паблики, в которые пишут одни и те же боты, находятся ближе друг к другу. Для каждого паблика цветом показан вид ботов, превалирующий в нем.
Большинство пабликов оказались полностью захвачены «злыми кремлеботами», но у каждого вида есть свой «регион», где он оставляет больше всех комментариев.
При этом если в некоторых пабликах доминировали эльфы, это не значит, что кремлеботы туда не дотягивались. «Злые кремлеботы» присутствуют практически во всех пабликах, которые мониторит «Ботнадзор». Наиболее популярны у них пропагандистские ресурсы и некоторые региональные группы. У «добрых кремлеботов» ситуация похожая: они писали комментарии почти во всех популярных пабликах. Можно предположить, что у них нет списка групп, которые они должны комментировать, и они просто ищут посты по всему ВК по ключевым словам.
Зона влияния эльфов сильно уже. На «полуострове эльфов» можно найти популярные «нейтральные» паблики (такие как Forbes, «Лепрозорий»), и набор региональных групп, где эльфы доминируют.
Известные пропагандистские ресурсы («РИА Новости», «Коммерсант» и т. д.) эльфы также комментируют, но в таких пабликах они значительно уступают кремлеботам.
А вот региональные боты ограничиваются более узким кругом пабликов. В крупных пропагандистских изданиях и региональных группах, не входящих в их привычные места обитания, такие боты тоже появляются, но достаточно редко.
Похоже обстоит ситуация и с рекламными ботами. Так как обычно они продвигают фармацевтические товары, они живут преимущественно в группах для мам и беременных, где кроме них нет никаких других ботов. Некоторые рекламные боты появляются в крупных новостных и региональных группах, но это происходит нечасто.
В контакте с АП
Нет сомнений в том, что команда ВК умеет выявлять ботов. Эльфов, например, банили постоянно, кремлеботов — тоже регулярно и обычно сразу большими группами. Большинство аккаунтов кремлеботов (около 88%) были забанены в какой-то момент.
Но больше интересна политика разбанов. Если эльфов разбанивают очень редко (такое может происходить, например, если настоящий владелец страницы восстановил к ней доступ), то кремлеботов — массово, часто по несколько сотен или даже тысяч аккаунтов в день. Самый массовый такой случай произошел 11 декабря — тогда соцсеть забанила почти 8 тысяч активных аккаунтов и в тот же день почти всех их разбанила.
По количеству страниц больше всего разбанивают «злых кремлеботов», потому что их просто больше. Но в процентном соотношении чаще всего снимают ограничения с «добрых», причем именно с тех, кто упоминает «Единую Россию», — более чем в два раза чаще, чем с любых других провластных аккаунтов.
Эксперт по ботофермам, попросивший об анонимности, считает, что «разбан» происходит по договоренности с руководством соцсети и ВК полностью «покрывает» ботофермы. «Среди ботов всегда забанен определенный процент. Раньше их банили гораздо чаще, а сейчас общее количество разбаненных страниц уже приближается к 100 тысячам», — говорит эксперт.
Модераторы сообществ в ВК, по его словам, чаще банят тех, кто рассказывает другим пользователям о ботах, чем самих ботов.
Интересно, что если кремлеботов банят и разбанивают, то региональных и рекламных ботов по сравнению со всеми остальными просто почти никогда не банят.
***
«Кремль контролирует сотни бот-ферм и групп троллей, как больших, так и маленьких. Такие подразделения существуют почти у каждого силового ведомства, у всех региональных губернаторов и мэров, а также у всех политических партий. С начала 2022 года их количество заметно увеличилось. В эту систему вкладываются значительные ресурсы. Число ботов будет продолжать расти, потому это оправдывает себя, и практически некому ей противостоять, за исключением небольшой группы активистов», — считает Антон Михальчук из Free Russia Foundation.
Активная ботосфера распространена во многих авторитарных режимах: Китае, Иране, Венесуэле и других странах, говорит социолог Максим Алюков. В демократических странах тоже есть попытки вести информационные кампании, в том числе с помощью ботов, но из-за системы «сдержек и противовесов» с ними борются более активно, говорит Алюков, например, Конгресс США может настойчиво потребовать от Facebook усилить модерацию.
В России же тенденция обратная: вместо ограничения кампаний манипуляции общественным мнением государство их активно развивает. В конце 2021 года гендиректором VK-холдинга стал выходец из «Ростелекома» и сын замглавы Администрации президента Владимир Кириенко. А саму соцсеть возглавил Степан Ковальчук — внук президента «Курчатовского института» Михаила Ковальчука и сын президента «Национальной Медиа Группы» (НМГ) Кирилла Ковальчука.
Именно команда младшего Ковальчука отвечала за провластный контент в соцсети, рассказывали «Медуза» и The Bell. Это подтверждает источник «Новой-Европа», близкий к руководству VK-холдинга. Кроме того, по его словам, на Ковальчуке «замыкается» работа с ботами. «Раньше с этим было строго — банили всех [ботов]. Сейчас в VK на уровне холдинга есть специальный отдел GR. [Они] всем занимаются и [являются] ответственными за повесточку», — сообщил он.