Как ты, AI, ML и IoT можете остановить сексуальное насилие над детьми прямо сейчас

Казалось бы, машинное обучение (ML), искусственный интеллект (AI), распознавание лиц, the Интернет вещей (IoT) – все эти технологические решения должны были ускорить процесс поиска и облегчить задачу. Но все оказалось сложнее. Фото: Pexels.com (CC0).

В 2015 году генеральному директору компании Thorn (Цифровая защита детей) Джули Кордуа позвонили. Следователь Министерства внутренней безопасности просил ее о помощи. Ему требовалось найти технологическое решение, которое помогло бы в поиске маленькой девочки. Ребенок стал жертвой сексуального насилия, и видеоролики…

В 2015 году генеральному директору компании Thorn (Цифровая защита детей) Джули Кордуа позвонили. Следователь Министерства внутренней безопасности просил ее о помощи. Ему требовалось найти технологическое решение, которое помогло бы в поиске маленькой девочки. Ребенок стал жертвой сексуального насилия, и видеоролики со сценами издевательства над девочкой распространялись по всей Сети.

Уже восемь месяцев Департамент внутренней безопасности безрезультатно искал ребенка. Ее данных и фотографий не было в базе пропавших и эксплуатируемых детей. Никто не искал ее, не заявлял о пропаже с того самого момента два года назад, когда в Сеть было выложено видео с актом насилия. Именно поэтому дело по ее розыску было открыто так поздно.

У Джули Кордуа не было на руках никакого ответа. Тем не менее ее команда разработчиков приступила к поиску технологического решения, которое помогло бы идентифицировать и найти ребенка. Увы, но в тот момент все их усилия не принесли результатов.

Девочку нашли в 2018 году, спустя пять лет после выгрузки видео в Сеть. И технологии тут были ни при чем. Следователь смог выделить два предмета, которые фигурировали на заднем фоне видео. Далее началась кропотливая работа по сужению мест поиска.

Выделялись фабрики по производству замеченных на видео вещей, точки продажи, и в конце концов место поиска сузилось до одного района. Поиск вещей перешел в социальные сети. В результате одна из вещиц была обнаружена на фото женщины в Фейсбуке, которая оказалась матерью девочки. Следователи вышли на адрес и спасли девочку из рук ее отчима, который в течение всего этого времени совершал акты насилия над ребенком.

Казалось бы, машинное обучение (ML), искусственный интеллект (AI), распознавание лиц, Интернет вещей (IoT) – все эти технологические решения должны были ускорить процесс поиска и облегчить задачу следователям. Но все оказалось сложнее.

Спасение детей чаще всего происходит на стыке технологий и права. Тем не менее есть хорошие новости: технологические бренды сотрудничают с правоохранительными органами, и совместно они улучшают применение новых технологий, таких как автоматизация распознавания лиц, предметов, окружения.

Эта технология может вывести поиск детей и борьбу с насилием в режим реального времени. Давайте рассмотрим, как технологические бренды создают продукты и сервисы на основе ML для решения сложных задач поиска. А затем поговорим о том, чем вы можете помочь в этом деле.

Для успешного и быстрого поиска нам требуются инструменты сопоставления изображений. 500 изображений с актами сексуального насилия над детьми загружаются в Сеть каждую минуту. И хуже всего то, что этот процесс трудно остановить. Те, кто загружает подобные фото, знают, что даже незначительные манипуляции с изображением создают проблемы для отслеживания и идентификации жертвы. Достаточно добавить на фото дополнительный значок, изменить размер – и фото распознается как новое, заносится в базу как новое, создается новое дело по поиску жертвы. Работа следователей превращается в невообразимый хаос и неразбериху.

И до недавнего времени ручной анализ изображений был единственным способом найти и отследить людей, совершивших насилие над ребенком.

«Поиск насильника по фотографиям в этой огромной вселенной Сети похож на поиск иголки в стоге сена», – говорит Кортни Грегуар, старший юрист Microsoft Digital Crimes Unit.

Чтобы решить эту проблему, Microsoft разработала инструмент под названием PhotoDNA. Этот бесплатный инструмент может анализировать снимки (hash-matching technology), создавая базу изображений со сценами насилия. После того как снимок просканирован, не важно, каким изменениям он подвергнется, его копии будут распознаны и удалены в режиме реального времени, данные о передвижении снимка по Сети станут доступны правоохранительным органам.

Таким образом, создан инструмент, который может не только быстро определить новые снимки с актами насилия над детьми, которые были загружены недавно, но и отобрать дубликаты, чтобы облегчить работу по поиску жертвы и насильника.

Как работает PhotoDNA

  • Инструмент с помощью пользователей сканирует Сеть и находит фотографии и видео со сценами насилия.
  • Программа анализирует изображение, создает цифровой код (hash) и загружает фото в базу данных.
  • Программа сканирует сервисы, которые согласились на участие в проекте, на предмет наличия схожих фото (Facebook, Google).
  • В случае если кто-то загружает в Сеть снимок с актами насилия, которого нет в базе, PhotoDNA создает цифровой код (hash), а сам снимок уходит в правоохранительные органы.

Чтобы привлечь к работе с базой данных как можно больше специализированных организаций, Microsoft выгрузила PhotoDNA в облако. Это означает, что больше организаций могут сопоставлять и отслеживать изображения жестокого обращения с детьми. К проекту присоединились более 70 компаний и организаций, среди них Фейсбук и Google.

В 2012 году компания Microsoft заключила соглашение о сотрудничестве с компанией Thorn. Это стало маленькой революцией в сфере борьбы с насилием над детьми. Обе компании объединили усилия и создали платформу для сбора и свободного распространения фотографий, помеченных программой PhotoDNA. Такие цифровые метки получили название – хэш (hash)

До 2012 года фото или видео со сценой насилия могло попасть в базу данных правоохранительных органов разными путями в бесконечном количестве своих копий. Дело в том, что до создания проекта Thorn каждый фото- и поисковый сервис самостоятельно выискивал у себя снимки с контентом насилия, сам помечал, сам отправлял в базу. В результате следователи не могли  по полученным снимкам понять, новое ли это дело, или по этому ребенку уже идет розыск. В базе данных и в делах образовался невообразимый хаос.

Дошло до того, что помощь и поиск жертв пришлось отложить, чтобы разобраться и очистить базу от дубликатов, которые делали работу следователей хаотичной и бессистемной.

Но дело пошло. Thorn’s Industry Hash Sharing Platform – это первая инициатива, которая позволяет участвующим организациям работать вместе, чтобы остановить насилие и торговлю детьми. Была создана централизованная база данных обмена хэшей. Компании партнеры могут использовать хэши, уже идентифицированные другими сервисами через PhotoDNA Cloud. Используя общую базу данных, они проводят сканирование своих платформ.

Если при сканировании сервис обнаруживает ранее занесенное в базу изображение, он отслеживает его перемещение и, следовательно, помогает в поисках. Но если отсканированные изображения еще не были хэшированы, PhotoDNA Cloud сообщает о них, как о появлении новой жертвы.

Результат: мгновенное распознавание изображений, которые не были занесены в базу, а значит могут быть фактами нового акта насилия над ребенком. Это значительно сокращает срок от момента идентификации до открытия дела и поиска ребенка. Сейчас нашей героине, с истории которой мы начали эту статью, не пришлось бы ждать два года, прежде чем начались ее поиски.

Результатом партнерства Thorn-Microsoft стало то, что девять крупнейших фотобанков США и такие компании, как Фейсбук и Google, присоединились к проекту. Они используют более 90 000 хэш-файлов для идентификации контента с актами насилия над детьми и пополняют базу данных своими находками.

Но есть еще кое-что…

Можно найти ребенка и без фото самого ребенка. Достаточно присмотреться к окружению и заднему фону на фото или видео. В нашей истории следователи использовали вещи, которые они заметили на видео. Но процесс поиска по этим уликам был долгим и трудоемким.

Но и здесь ситуация начала меняться. Сервис TraffickCam – первый шаг в автоматизации процесса определения места преступления в режиме реального времени. Если насилие произошло в отеле, сервис поможет определить местоположение отеля. Для этого он сравнивает элементы интерьера, которые попали на видео или фото, с фотографиями номеров отелей в своей базе.

Как работает TraffickCam

  • Сервис просит пользователей делать снимки номеров отелей, в которых они останавливаются.
  • Пользователи загружают снимки в базу данных.
  • Сервис сравнивает фото с места преступления с фото в своей базе данных и выдает результаты.

Данное решение не идеально, но оно перспективно. Со временем база данных расширится, а алгоритмы распознавания станут более быстрыми и точными.

Отсканировать каждого ребенка – такое технологическое решение уже предлагается, и вскоре каждому родителю надо будет решить, заносить ли своих детей в базу данных на случай похищения и розыска.

Новые технологии сканирования радужки глаза позволят осуществлять поиск детей в режиме реального времени. Директор Центра биометрических исследований Cylan University в Университете Карнеги-Меллона Мариос Саввидас как раз работает над такой технологией.

«Сейчас правоохранительные органы имеют только фотографии пропавших без вести детей, но внешность может измениться. Дети взрослеют, они меняются. Радужная же оболочка глаза остается без изменений на протяжении всей жизни. Наш сканер поможет получить данные, которые значительно ускорят поиск», – сказал Саввидас.

Для сканирования оболочки глаза требуется три секунды. После этого вся информация о ребенке заносится в базу данных. У этого способа есть значительные преимущества в сравнении с принятым сейчас методом идентификации с помощью отпечатка пальца. Радужку, по утверждениям разработчиков, можно будет «прочесть» с расстояния в 30 метров даже через машинное стекло.

Идея создателей технологии заключается в том, чтобы установить сканеры в аэропортах и контрольно-пропускных пунктах на границе. Но для поиска похищенного ребенка его данные сперва надо будет занести в базу. То есть родителям будет предложено добровольно отсканировать радужную оболочку глаза своего ребенка и поместить ее в базу данных на случай похищения.

А теперь ваш выход. Вы можете стать частью этой борьбы с насилием над детьми. Новые цифровые инструменты идентификации жертв насилия и их поиск не означают окончание такого явления, как насилие или похищение ребенка. Но они, без сомнения, улучшают и ускоряют процесс идентификации и поиска жертв и насильников. Чем больше данных мы соберем, тем быстрее будет проходить процесс поиска.

Независимо от того, являетесь ли вы организацией или частным лицом, вы можете принять участие в создании базы данных для ускорения процесса работы программ искусственного интеллекта.

Если вы представляете организацию с платформой для обмена фотографиями и готовы присоединиться к движению, напишите в Thorn [email protected].

Если вы пользователь, скачайте приложение TraffickCam и каждый раз, когда остановитесь в отеле, сфотографируйте свой номер. Так мы совместно будем пополнять базу данных, которая поможет ML, AI, IoT делать свое дело быстро и точно.

Статья подготовлена на основе материалов сайта towardsdatascience.com

Будьте с нами на связи, независимо от алгоритмов

Telegram-канал E-mail рассылка RSS-рассылка
Как победить алгоритмы: прочитай инструкции, как настроить приоритетный показ материалов в социальных сетях и подключить RSS-ленту.