Благодаря объединению крадусорсинга и новых алгоритмов распознавания повторяющихся шаблонов стало возможно идентифицировать отдельных животных в находящихся под угрозой исчезновения популяциях, как сообщили исследователи из Массачусетского технологического института (MIT).
Экологи, как правило, ставят на животное метку, отпускают его на волю и следят за его дальнейшим перемещением, в том числе фотографируя животное в его естественной среде обитания и каталогизируя полученные изображения вместе с такой информацией, как размер животного и его географическая локация.
Но, по мере накопления большого количества изображений, их просмотр и определение животного на фотографии становится очень тяжелой работой.
Сай Равела (Sai Ravela), главный научный сотрудник отдела Земли, атмосферы и планетарных наук в Массачусетском технологическом институте, считает, что ручной поиск через каталог из 10 000 снимков может занять у одного человека 15 лет.
Для того, чтобы решить эту проблему, ученые разработали программное обеспечение, которое автоматизирует большую часть этого процесса.
Система, получившая название SLOOP, осуществляет поиск по базе изображений, используя алгоритмы распознавания повторяющихся шаблонов для анализа таких черт животного, как полоски или пятна, на каждом изображении. Затем система определяет около 20 наиболее вероятных совпадений для животного. К этому исследователи затем добавляют всю силу краудсорсинга, прося пользователей выбирать наиболее похожие пары. С помощью этой информации система переформирует список, сводя его к меньшему количеству изображений и оставляя только те, на которых с наибольшей вероятностью изображено данное животное.
Для того, чтобы оценить потенциал краудсорсинга, команда Равелы опубликовала тысячи фотографий саламандр — в группах по четыре — на платном краудсорсинговом ресурсе Mechanical Turk. Исследователи попросили пользователей классифицировать похожие изображения. Чтобы оценить способность пользователей распознавать изображения, система была запрограммирована таким образом, что знала правильные варианты в трех из четырех случаях. Если пользователь правильно классифицировал изображения в этих случаях, то система принимала его четвертый ответ. Треть пользователей проявили очень хорошие способности в сопоставлении повторяющихся шаблонов.
Объединяя компьютерные алгоритмы с краудсорсингом, исследователи смогли быстро идентифицировать соответствия среди тысяч фотографий с точностью 97%.
Сейчас команда работает над дальнейшей автоматизацией системы и разработкой алгоритмов, которые смогут отделять животное от фонового изображения. Это сложная задача, поскольку система должна будет отличить, например, ногу ящерицы от соседней ветки. Чтобы решить эти проблемы, команда разрабатывает алгоритмы распознавания с помощью геометрии и объединения алгоритмов распознавания поведения.
Равела с коллегами в настоящее время применяет систему для работы с исчезающими и находящимися под угрозой исчезновения видами, в том числе гекконами, китовыми акулами и сцинками, и в июне представит свою работу на конференции по распознаванию шаблонов поведения в Мексике.