Анатолий Кац: компьютерное зрение и его применения (видео)

18-го июля 2012 в здании Международного Мемориала Анатолий Кац (@anatoliy314) рассказал о компьютерном зрении и его применениях: распознавании лиц, зданий, алгоритмах распознавания, а также о том, насколько вероятна антиутопия с тотальным распознаванием лиц граждан.

Алгоритмы компьютерного зрения (в частности, распознавания лиц) стали появляться в начале 2000-х. Однако, заняло несколько лет,чтобы эта технология попала в массовое производство. В России на данный момент известно два центра разработки компьютерного зрения: в МГУ (на двух факультетах) и в Нижнем Новгороде (где компания Intel ведёт разработку свободной библиотеки компьютерного зрения OpenCV).

Анализ протестной активности

В современных российских условиях алгоритмы компьютерного зрения можно использовать, например, для объективной оценки числа протестующих на митингах. Для этого необходимо оценить плотность толпы и скорость толпы. Последняя определяется с помощью анализа скорости «характерных точек» (т.е. точек, выделяющихся из своего окружения).

Важно понимать, что любой алгоритм компьютерного зрения должен быть основан на устойчивости к ошибкам. Как говорит Анатолий, одно из главных правил компьютерного зрения: «какой бы алгоритм мы не написали, он точно будет ошибаться». В качестве примера, автор привёл расчет числа митингующих, основанный на фотографиях с Дня России.

Другие применения включали бы подсчет числа прохожих на улице и использование этих данных для планирования городского пространства.

Распознавание зданий и городской ландшафт

Как распознавать здания? Контуры, высота, цвет – не подходят для распознавания образов. А вот текстура объекта и характерные элементы (например, окна или характерные архитектурные детали) подходят. Текстуру объекта мы можем с помощью распределения линий, пересекающихся под определенным углом.

В ответ на вопрос о том, а не лучше ли использовать QR-коды, чтобы получить информацию о каком-то здании, докладчик ответил: «если вы увидели красивое здание, вы не станете искать QR-код», указывая на то, что по мере прогресса технологий, можно будет уйти от использования QR-кодов. Кроме того, GPS помагает компьютерному зрению тем, что сужает число вариантов для распознавания.

Другие примеры

Запись живой трансляции (видео в хорошем качестве появится в ближайшее время). Анатолий рассказал о перспективах реставрации изображений для расследования преступлений прошлого с помощью компьютерного зрения. Однако, для многих исторических изображений сначала потребуется реставрация, которую можно сделать автоматически и полуавтоматически.

Ещё один пример того, как компьютерное зрение может помочь человечеству – это автоматическое или полуавтоматическое распознавание раковой опухоли на томограммах. Проблема, однако, даже не в технологии, а в этических вопросах (очень неправильно если машина будет сухим языком о том, что у человека смертельное заболевание).

Перспективы компьютерного зрения

«А теперь поговорим о плохом», говорит Анатолий, «на данный момент мощность смартфона слишком маленькая (пока) для распознавания образов». По закону Мура, однако, смартфоны скоро придут к необходимой мощности. Возможно, будут специальные процессоры для компьютерного зрения.

По мнению Анатолия, уже через год можно будет ожидать первые гражданские приложения с компьютерным зрением. Но в полную силу это все заработает только года через два.

Важно говорить ещё и об антиутопических аспектах компьютерного зрения (тотальном распознавании лиц для слежки). Как говорит Анатолий, «Скорее всего плохие люди уже используют эти технологии». Однако, добавляет он, до тотального распознавания лиц ещё долго – приблизительно лет двадцать.