Представьте, что специалисты НКО умеют прогнозировать, сколько пожертвований будет на счете организации через несколько месяцев или через год. А еще знают, какие действия повлияли на «всплески» поступлений, допустим, весной, и, более того, понимают, что нужно делать, чтобы вызвать их снова. Получить такую информацию из будущего можно уже сейчас, благодаря алгоритмам машинного обучения. Корреспондент Теплицы Наталья Баранова узнала у экспертов, каким образом НКО с помощью новых технологий смогут выстроить устойчивую пиар-кампанию.
Машинное обучение представляет собой компьютерную систему, которая способна обучаться, предсказывать, работать с большим объемом данных. Для НКО внедрение этой технологии в свою работу откроет новые возможности для разработки пиар-стратегии на годы вперед.
Как это работает
Алгоритм машинного обучения работает на основе большого объема информации. Модель можно обучить делать расчеты именно благодаря данным. «Нужно, чтобы у вас были фактические данные в разрезе времени, аудитории и географии. Если вы хотите прогнозировать на полгода вперед, желательно чтобы у вас было уже несколько полугодий накоплено», – объяснил независимый аналитик Михаил Богданов.
Задачу, что нужно спрогнозировать, можно ставить по-разному. Тут для НКО есть два варианта. Во-первых, имея данные, собранные за год, можно спрогнозировать, какой объем пожертвований поступит на счет вашей организации в будущем. Во-вторых, и этот путь сложный, но полезный, понять, от каких факторов зависят пики поступлений от жертвователей. По мнению экспертов, именно для второго варианта стоит использовать методы машинного обучения.
Еще по теме: 4 способа использовать машинное обучение для решения проблем
Основатель Data Mining Labs и сообщества Open Data Science Алексей Натекин считает, что общую модель разработать невозможно, для каждой общественной организации она будет своя. По его мнению, все силы нужно бросить на построение модели, которая сможет легко выявлять факторы успешности и неуспешности различных всплесков в пожертвованиях.
«Надо не столько пытаться предсказать пожертвования как ряд (бесполезная затея, вы напрямую влияете на ряд своими действиями). Нужно выяснить, что на что влияет, чтобы самим изменить поведение и стратегию». Алексей Натекин
Что нужно
1. Много данных. Эксперты сходятся во мнении: чем больше данных у вас будет, тем правдивее окажется прогноз. «Чтобы повысить точность анализа, желательно собрать больше микроданных с непрозрачными связями. И разметить все кампании по сбору средств на успешные и неуспешные», – посоветовал начальник отдела аналитики Яндекс.Деньги Александр Матвеев.
Другими словами, многофакторный прогноз должен состоять из нескольких переменных: из аудитории, времени, географии, сезона. Но чем больше факторов вы найдете, тем лучше.
Еще по теме: Андрей Себрант: Не нужно бояться, что машины умнее нас, нужно научиться работать с ними
2. Собирайте информацию о пиар-кампаниях. В первую очередь, нужно найти все данные, которые так или иначе влияют на увеличение или уменьшение пожертвований. Обратите внимание на ход ваших пиар-кампаний. «Например, выясните, кто их аудитория, как чек влияет от времени (праздников), кто был в информационных партнерах, как часто такие кампании проводились. Что, где и когда вы писали, кто, как и когда реагировал, куда просачивалась информация. Учесть отдельные переговоры с крупными жертвователями и фондами, чтобы исключить их из данных», – перечислил важные моменты Алексей Натекин.
«Такими микроданными могут быть, например, сведения о том, в каких каналах проводилась кампания (Facebook, ВКонтакте, сайт, что-то еще), в каких городах, какая погода там стояла в дни кампании». Александр Матвеев
Некоторые полезные для анализа параметры можно получить через платежное решение, которое проводит пожертвования, например, размер средних чеков. «Фонды, которые принимают пожертвования через Яндекс.Кассу, также могут анализировать динамику реккурентных платежей (подписок на регулярные пожертвования)», – добавил Матвеев.
3. Используйте уже готовые алгоритмы. Вам не нужно придумывать специальные математические модели, чтобы сделать прогноз. Все алгоритмы уже готовы, правда, ими нужно уметь пользоваться. Для того чтобы просто спрогнозировать объем пожертвований, нужно использовать такой метод машинного обучения, как прогнозирование временных рядов (или регрессионный анализ).
По мнению Александра Матвеева, самый простой анализ можно проводить и в MS Excel. А чтобы проанализировать микроданные и сделать прогноз временных рядов, можно использовать статистические пакеты или языки программирования с развитыми библиотеками анализа данных, например, Python/R.
«Более сложный анализ можно проводить с помощью простых для входа и бесплатных на начальном этапе пакетов для машинного обучения с наглядной визуализацией. Например, RapidMiner (это среда для проведения экспериментов и решения задач машинного обучения и интеллектуального анализа данных. – Прим. ред.)». Александр Матвеев
4. Найдите аналитика. Вы уже поняли, что для сбора необходимой информации потребуется много времени и знаний: работа кропотливая. По мнению экспертов, с этой задачей справится аналитик, если у него есть подготовка в области эконометрики, моделирования или анализа данных. Такие специалисты, к примеру, есть в Data Mining Labs. Кстати, команда проекта ведет интересный курс по машинному обучению.
5. Участвуйте в хакатонах по открытым данным. Один из отличных вариантов – заявить свою идею на одном из хакатонов по анализу больших данных. Именно на таких событиях вы сможете представить проект, найти команду (аналитиков, которые вам и нужны). Такие хакатоны довольно часто проходят во многих городах России под названием Open data day при поддержке экспертных сообществ и государственных структур. Следить за предстоящими хакатонами можно в специальной рубрике Теплицы.