В нашем предыдущем исследовании мы рассказали, как выглядит российское гражданское общество в Telegram и какие тактики повышают вовлеченность пользователей в этом мессенджере. Для этого мы собирали посты и метаданные каналов и размечали их как антивоенные или нейтральныe (милитаристские). Антивоенные каналы мы брали из данных «Ковчега» и дособирали, проходясь по репостам существующих каналов (метод Snowball). А нейтральные либо милитаристские каналы мы брали с сайтов зарегистрированных Минюстом организаций и с сайта фонда «Президентских грантов» и также проходились по репостам, чтобы обогатить датасет. Все собранные каналы мы дополнительно вручную разметили на их отношение к войне.
Напомним вкратце основные выводы нашего исследования по Telegram-каналам:
- Антивоенных каналов больше, чем милитаристских, и охваты их постов в 2,7 раз больше, чем у милитаристских и нейтральных.
- Посты должны быть эмоционально окрашенными, при этом позитивная эмоциональная окраска собирает немного большие охваты, чем негативная (корреляция с позитивной окраской в 2,5 раза больше).
- В день оптимально публиковать от 2 до 3 постов (оптимальное значение по нашей выборке 2,8). И желательно, чтобы в постах были медиафайлы.
А как выглядит ландшафт российского гражданского общества в Instagram? Какие акторы там наиболее представлены? Какие темы там наиболее популярны между разными по степени независимости акторами и по сравнению с Telegram?
Вкратце: тренды в Instagram российского гражданского общества
- Альбомы и фотопосты имеют больше взаимодействий, чем видеопосты.
- Количество эмоджи: для антивоенных аккаунтов посты с эмоджи более популярны (в 46 раз), чем без («идеальное» количество — 2), а для нейтральных аккаунтов, наоборот, популярнее посты вообще без эмоджи.
- Идеальные дни недели для постинга — пятница и суббота.
- Среди антивоенных аккаунтов негативно окрашенные посты имеют больше взаимодействий. Среди нейтральных аккаунтов нет трендов на то, чтобы какой-то вид эмоциональной окрашенности был более вовлекающим.
Данные с «Грядки»
Одна из основных миссий Лаборатории – сбор данных и изучение организаций, относящих себя к российскому гражданскому обществу. Мы собираем как зарегистрированные организации, так и организации без юридической формы и изучаем их коммуникацию в цифровом пространстве. Этот датасет мы называем «Грядка». Изначально «Грядка» состояла только из вебсайтов зарегистрированных Минюстом организаций, но постепенно мы расширили ее на Telegram и Instagram. Аккаунты организаций в Instagram мы собирали похожим образом, что и аккаунты в Telegram. Во-первых, у нас были те же источники данных: сайты «Грядки» и подборки данных от «Ковчега» и Reshim.
Итак, вот откуда собирали данныe по сайтам: Открытые НКО, Минюст РФ, SPARK-Interfax, cайт фонда «Президентских Грантов» за 2022–2023 гг., «Если быть точным».
Откуда брали Instagram-аккаунты: подборки Ковчега и Reshim, веб-скрейпинг ссылок на Instagram с сайтов нашего датасета «Грядки».
Всего акторов в «Грядке» | 9524 |
Из них имеют Instagram-аккаунты | 422 (4.4% организаций) |
Из них антивоенные | 93 (22% из всех Instagram аккаунтов в выборке) |
Всего мы собрали 422 Instagram-аккаунтов — точнее, 800 постов антивоенных аккаунтов и 3066 постов нейтральных аккаунтов. Мы анализировали отдельно антивоенные организации и отдельно нейтральные (в основном (но не обязательно) принадлежащие официально зарегистрированным в Минюсте организациям). Антивоенные Instagram-аккаунты мы брали из подборок с сайта «Ковчега» и Reshim. А нейтральные аккаунты были собраны веб-скрейпингом с сайтов зарегистрированных НКО. Разделение этих аккаунтов и их сравнение было необходимо, потому что эти организации отличаются степенью зависимости от государства и государственного финансирования, следовательно, их коммуникация с благополучателями в соцсетях может отличаться. Помимо этого, у этих организаций во многом отличается целевая аудитория.
В нашем исследовании мы смотрели статистику по постам за последние 12 месяцев (с сентября 2022-го по сентябрь 2023-го). Но с учетом того, что CrowdTangle умеет выдавать только топ-400 постов по любой из заданных метрик для всей подборки аккаунтов, в нашей выборке постов не все посты, а только топ-400 самых плохих и самых хороших за это время по всем аккаунтам.
Как мы собирали эти данные
В отличие от относительно несложного скрейпинга данных через Telegram API и библиотеку Telethon, скрейпинг Instagram запрещен компанией Meta (как и скрейпинг страниц Facebook). Но зато существует инструмент CrowdTangle, который сотрудничает с Meta и выдает ограниченный доступ к скрейпингу Instagram и Facebook проверенным партнерам и организациям, в основном журналистам, НКО и профессиональным фактчекерам. Нам удалось получить доступ к аккаунту CrowdTangle.
В CrowdTangle сообщения оцениваются для определения их эффективности. Сообщения с оценкой 10x обычно считаются хорошими, в то время как оценка -10x указывает на низкую эффективность. Цель состоит в том, чтобы представить оценки, которые интуитивно понятны даже новичкам. Оценки основаны на реальных взаимодействиях, которые получает сообщение, по сравнению с ожидаемыми взаимодействиями. Взаимодействиями с постом считаются лайки, комментарии и репосты. Считается, что у сообщения высокая эффективность (overperforming), если у него 100 взаимодействий против ожидаемых 50, и тогда оценка составляет 2.0x. Для сообщений с низкой эффективностью (underperforming) эти показатели будут такими: если ожидаемое число взаимодействий 200, но получило только 100, то показатель считается как -2x. Сообщение без взаимодействий получает оценку в -2 раза от базового значения. Если сообщение эффективно, но не достигает минимума, установленного для Instagram, его оценка варьируется между 0x и 1x. Для underperforming постов в этом диапазоне оценка находится между 0x и -1x. Наконец, разные взаимодействия могут иметь веса, что означает, что некоторые взаимодействия могут оказаться более важными при расчете оценок.
Аналитика
Посмотрим на список лидирующих по показателям эффективности аккаунтов за последние 30 дней. Среди антивоенных организаций наибольшее количество взаимодействий у Helpdesk media и у ОВД-Инфо, но их рост замедляется. Наибольший рост взаимодействий происходит у «Весны», они же выкладывают больше всего постов. У «Феминистского антивоенного сопротивления» и «Первого отдела» тоже идет прирост взаимодействий.
Имя аккаунта | Всего взаимодействий | Прирост взаимодействий | Среднее кол-во постов в день | Просмотры видео | Кол-во подписчиков | Рост % и # | |
Среднее по датасету | 3 679.71 | 2.925% | 0.25 | 9 096.84 | 7 863.69 | +1.41% | |
1 | helpdeskmedia | 222 276 | 2.369% | 1.47 | 845 474 | 212 237 | -0.88% -1 888 |
2 | ovdinfo | 27 261 | 0.826% | 0.83 | 0 | 131 481 | -0.64% -850 |
3 | vesna_democrat | 27 255 | 2.294% | 3.47 | 0 | 11 520 | +1.74% +197 |
4 | fem_antiwar_resistance | 13 416 | 2.308% | 0.8 | 0 | 24 265 | +0.35% +84 |
5 | one_dept | 7510 | 1.848% | 1.27 | 0 | 10 681 | +0.37% +39 |
Среди «нейтральных» организаций с большим отрывом лидирует аккаунт sumerkiii. Это аккаунт фонда «Марафон 5 дней», который занимается адресной помощью больным детям через фандрайзинг в соцсетях. В каждом их посте есть фотографии детей и реквизиты для помощи. У этого аккаунта самый большой прирост взаимодействий и их общее количество за последние 30 дней. Вторая организация в топе — это приют для собак в Хабаровске, который тоже существует за счет пожертвований и адресного фандрайзинга в соцсетях. И последний аккаунт в топ-5 — это очень похожий аккаунт, тоже приют для собак, но в Ногинске. Организации на третьем и четвертом месте — известные «Ночлежка» и «Нужна помощь» — имеют много подписчиков, но у «Ночлежки» взаимодействия растут (возможно, благодаря видео), а у «Нужна помощь» взаимодействия падают.
Имя аккаунта | Всего взаимодействий | Прирост взаимодействий | Среднее кол-во постов в день | Просмотры видео | Кол-во подписчиков | Рост % и # | |
Среднее по датасету | 125.61 | 0.422% | 0.06 | 41.53 | 3 240.25 | -0.04% | |
1 | sumerkiii | 12 205 | 2.801% | 0.17 | 4794 | 87 575 | +0.96% +837 |
2 | angel_hranitel_khv | 4244 | 3.802% | 0.63 | 730 | 5876 | +0.36% +21 |
3 | nochlezhka | 3206 | 1.66% | 0.23 | 2142 | 27 603 | +0.14% +38 |
4 | nuzhnapomosh.ru | 3105 | 0.458% | 0.47 | 0 | 48 217 | -0.35% -168 |
5 | nogdog_ig | 1845 | 1.102% | 1.13 | 481 | 4898 | – |
Если сравнивать в целом датасет антивоенных аккаунтов и нейтральных по средним показателям, то можно заметить, что у антивоенных аккаунтов показатели взаимодействий растут, а у нейтральных скорее падают, но незначительно. Также у антивоенных аккаунтов в среднем в 29 раз больше взаимодействий, в 7 раз больше прирост взаимодействий и 2,4 раза больше подписчиков в среднем.
Какие стратегии ведения соцсетей приводят к высокой эффективности взаимодействия с аудиторией?
Лучшие практики для ведения активистских антивоенных аккаунтов по результатам анализа нашей выборки :
- Альбомы гораздо лучше вовлекают пользователей, чем просто фото (средняя эффективность 7.74 против 5.65). Видеопосты наименее эффективны (4.9).
- Количество эмоджи: посты с эмоджи вовлекают эффективнее, чем посты без (идеально 2 эмоджи). В среднем в постах количество эмоджи составляет 1.3.
- Идеальная длина постa для хороших показателей вовлеченности — 840 символов (средняя длина 433 символа).
- Идеальный день недели для хороших показателей вовлеченности — пятница, в то время как в среднем больше всего постов появляется в среду. Значит, есть смысл публиковать в пятницу, больше людей увидят пост. Но при этом сммщики знают об этой тенденции и, возможно, специально подгадывают выкладывание хороших постов на пятницу, так что невозможно сказать точно, насколько это естественный тренд.
- Время публикации: самые высокие метрики вовлеченности у постов, опубликованных около часа дня по Москве, в то время как в среднем посты появляются чаще всего около трех часов дня по Москве. Но мы предполагаем, что время постинга недостаточно репрезентативно, потому что в выборке не так много сообщений и аккаунты, оперирующие в разных часовых поясах.
Стоит отметить, что наблюдаемые результаты не являются причинно-следственной связью, а скорее их можно рассматривать как некоторую корреляцию между эффективностью акаунтов и практикой их ведения. То есть не стоит ожидать, что если в каждом посте добавлять два эмоджи, использовать только альбомы и длину поста ровно в 840 символов, то и эффективность аккаунта резко вырастет. При этом, если учитывать полученные результаты, то в среднем можно повысить эффективность ведения аккаунта.
Если сравнить лучшие практики ведения Instagram для антивоенных и нейтральных акаунтов, то создается впечатление, что для последних аудитория Instagram не является основной. И это связано не только со значительным превосходством антивоенных аккаунтов по эффективности (в среднем в 29 раз больше взаимодействий), но и с параметрами лучших практик нейтральных аккаунтов: посты с фото получают больше взаимодействий; эффективнее посты длиной в среднем 2200 символов; лучший день для публикаций — суббота, а время — 17 часов по Москве, и в то же время наличие эмоджи не влияет на эффективность. Из этого можно выдвинуть гипотезу, что работа с аудиторией инстаграма не в приоритете у «нейтральных» организаций, и они откладывают посты под вечер или на выходной день и копируют, не форматируя под Instagram, текст из других социальных сетей. Поэтому мы предполагаем, что нейтральным акаунтам для повышения эффективности досаточно использовать лучшие практики антивоенных аккаунт, приведенные выше.
Эмоциональная окраска постов
Мы разметили посты в нашей выборке на их эмоциональную окраску (сентимент) с помощью языковой модели sismetanin/rubert-ru-sentiment-rusentiment, доступной на сайте Hugging Face. RuBert — это российская версия модели языковой классификации Bert. Ее суть заключается в том, чтобы на основе любого текста, который анализируется моделью, выдать классификацию: «нейтральная окраска», «позитивная окраска» или «негативная окраска». Также там есть «дискурсивный акт» и «пропуск» для неклассифицированных сообщений, но мы не изучали подробно эти классы, так как они встречаются крайне редко и не релевантны теме нашего исследования.
Пример негативно окрашенного поста.
Пример позитивно окрашенного поста.
Посты с нейтральной окраской занимают в целом 90% от всех постов у антивоенных и 73% нейтральных. Распределение overperfoming и underperforming по постам с нейтральной окраской примерно 50/50 в обеих подвыборка. А среди постов с негативной и позитивной окраской ситуация интереснее.
Подавляющее большинство постов в антивоенной выборке аккаунтов имеют нейтральную эмоциональную окраску. Но если смотреть отдельно на окрашенные посты, то видно, что негативно окрашенные посты имеют больше взаимодействий, чем позитивно окрашенные. Это не совпадает с нашими наблюдениями по данным Telegram, про которые мы писали в нашем прошлом исследовании, где получалось, что позитивно окрашенные посты вовлекают пользователей лучше. Но, во-первых, в этих исследованиях используются разные метрики для оценки вовлеченности, а во-вторых, по Instagram у нас собрано гораздо меньше постов, поэтому это только предварительные результаты.
Среди нейтральных акаунтов тоже превалируют неокрашенные посты, но эмоционально окрашенных постов в среднем чуть больше, чем в выборке антивоенных аккаунтов. Это связано с тем, что количество постов в этой выборке в целом больше, чем в выборке антивоенных аккаунтов (3066 против 800 постов). В процентном соотношении (overperforming/underperforming) позитивно и негативно окрашенные посты имеют примерно одинаковое количество взаимодействий с пользователями, но негативные тоже немного лучше по взаимодействиям. Это интересно тем, что есть ощущение, что нейтральные, более прогосударственные аккаунты, меньше пытаются работать на взаимодействие с аудиторией — все их показатели в среднем слабее, чем средние показатели антивоенных Instagram-аккаунтов.
Какие параметры наиболее важны для повышения эффективности постов?
Это исследование было направлено не только на изучение российского гражданского общества в Telegram, но и на то, чтобы дать какие-то практические рекомендации для активистов. Для того чтобы определить, какие параметры оказались наиболее важны для того, чтобы пост оказался эффективным, мы использовали ансамблевую модель XGBoost. XGBoost — это алгоритм машинного обучения (на основе дерева решений), используемый для задач классификации и регрессии. Анализ важности признаков в XGBoost оценивает значимость каждой входной переменной, измеряя, как часто она используется при разделении дерева решений для предсказания целевой переменной (в нашем случае повышенная эффективность поста) и насколько это улучшает производительность модели. Признаки, часто используемые и приносящие существенное улучшение производительности, считаются более важными для предсказания целевой переменной.
Картинка 2. Наиболее важные параметры для высокого перфоманса поста в Instagram на основе модели XGBoost
Вид поста предсказывает эффективность взаимодействия поста лучше всего, но это не стоит воспринимать как рекомендацию, потому что распределение по видам постов неравномерно и постов с видео сильно меньше. Сентимент поста важнее для предсказания эффективности поста.
Картинка 3. Наиболее важные параметры для высокой эффективности поста в Instagram на основе модели XGBoost
Для антивоенных аккаунтов картина получается более интересная, потому что на первом месте сентимент, что показывает, что действительно есть статистически значимый тренд на негативно окрашенные посты. Остальные параметры распределены по важности почти так же, только количество эмоджи имеет наименьшее значение, а не день недели.
Итак, выводы
Мы узнали, каковы параметры у Instagram-постов с самым большим количествам взаимодействий, а главное, что эти посты отличаются между подвыборками (незарегистрированные антивоенные аккаунты vs. нейтральные аккаунты). По итогам анализа 422 Instagram-каналов и 3866 постов мы получили следующие результаты:
- эффективность у антивоенных инициатив такая же, как и у организаций с нейтральной позицией;
- краткие результаты по эффективности: альбомы вовлекают лучше фотографий и видео, а лучший день для публикации постов — это пятница;
- эмоциональная окраска у постов: негативные посты более эффективны, чем позитивные.