29-30 сентября 2018 года при поддержке Теплицы социальных технологий прошел хакатон Международного Мемориала memo.id. Два дня активисты правозащитных организаций вместе с программистами, дата-аналитиками создавали проекты, используя базы данных Мемориала. В хакатоне приняло участие 5 команд, каждая из которых получила памятные призы.
Все проекты были созданы на основе предоставленных архивов баз данных Мемориала. Подробный список доступных данных смотрите на сайте хакатона.
Проекты-участники хакатона
Проект «West-Ost. Судьба немцев и советских мирных граждан, угнанных в трудовое рабство во время и после Второй мировой войны».
В 1990-1991 годах на адрес общества «Мемориал» пришло 320 тысяч писем с историями советских граждан, которые были отправлены во время войны на принудительные работы в Третий рейх. В письмах содержится порядка 15 000 документов и фотографий из лагерей. Задача проекта состояла в систематизации данных, чтобы в них читалась история отдельных людей или целых деревень.
Сетевой анализ позволил создать кластеры на основе двух точек: место лагеря и место, откуда пришло письмо. После очистки данных и геокодирования получилось 86 000 адресов, которые были визуализированы.
Вторая часть проекта состоит в анализе фотографий, соотнесении схожих фотокарточек и поиске групп людей, которые были в одном лагере или жили в мирное время в одной деревне.
Авторы проекта: Ксения Тихомирова, Натали Забловски, Николь Морозова.
Проект «Шаблон хранения данных о репрессированных людях»
По данным Мемориала порядка 20 миллионов человек подверглись репрессиям в период с 1930 по 1956 год. Но на сегодня не существует единой базы данных о репрессированных.
Задача проекта была создать единый шаблон для хранения данных, чтобы ускорить поиск нужной информации. При этом внутри одного следственного дела у репрессированного может фигурировать несколько имен. Шаблон должен содержать всю, даже противоречивую, информацию из баз.
Для пилотного объединения данных были взяты базы Мемориала и проекта «Открытый список». Участники проекта изучили схемы хранения данных и предложили доработанный вариант шаблона.
Описание проекта и схемы на GitHub
Запуск проекта ожидается к 29 октября 2018 года.
«Хакатон – крутейшее место, где ты понимаешь, что твой проект нужен другим людям, а проекты других людей нужны тебе. На хакатоне формируется команда, которая готова делать длительные вещи и работать дальше. Я очень быстро прокачался в дата-аналитике, и специалисты смогли объяснить мне за два дня такие вещи, которые я самостоятельно осваивал бы месяц». Александр Прохоров, участник проекта «Шаблон хранения данных о репрессированных людях»
Авторы проекта: Никита Чистиков, Екатерина Мишина, Александр Прохоров.
Проект «Места памяти: как город говорит об истории репрессий»
В основе проекта лежит база проекта «Москва. Топография террора», которая содержит более 740 адресов и описаний объектов, связанных с историей политических репрессий в Москве и Московской области. К таким объектам относятся памятники, музеи, мемориальные комплексы и памятные доски.
Команда проекта провела качественный анализ данных и сделала ряд наблюдений. Например, если разделить памятники на коллективные и индивидуальные, то можно увидеть закономерность, что индивидуальные доски появляются с 60-х годов, а коллективные – в конце перестройки. На индивидуальных памятных досках указываются заслуги деятелей в культуре, науке и редко упоминается факт репрессии.
В планах проекта сделать анализ про доступность памятников и анализ риторики сообщений о реабилитированных людях за последние 50 лет.
Геоданные «Топографии» (.json)
Авторы: Сергей Бондарьков, Дарья Быченкова, Василий Старостин, Надежда Леонтьева, Маргарита Маслюкова, Алексей Яскевич.
Проект «Динамика репрессий как способ идентификации»
Григорий Рашков в течение двух дней анализировал, каких данных не хватает в существующих базах и как можно заполнить фрагменты утерянных знаний на основе того, что есть.
В основе анализа лежит гипотеза, что часть репрессий совершались по профессиональному признаку или по принадлежности к учреждению (математическая школа Лузина, «дело врачей»). Григорий анализировал базу данных по профессиям и обнаружил несколько пиковых дней ареста: например, депортация латышских офицеров 14 июня 1941 года или арест военных в 1940 году за участие в Финской войне.
Из 3 миллионов доступных записей на хакатоне удалось проанализировать 1,2 миллиона данных. В оставшейся части данных указана неполная дата ареста, и необходима дополнительная сверка с другими базами.
Приложение для iOS «Открытый список»
Николай Кецарис сделал прототип приложения, которое содержит базу данных проекта «Открытый список» и позволяет пользователям искать необходимую информацию о своих родственниках с помощью смартфона. В приложении будет доступна карточка со сведениями о репрессированных и дополнительная информация из Википедии, если это был известный человек.
Хотите присоединиться к проектам? Пишите на [email protected] – предлагайте свои идеи или подключайтесь к другим командам.
29 октября 2018 года состоится ежегодная акция «Возвращение имен», посвященная памяти жертв политических репрессий. Часть проектов будет готова к памятному дню.