Через несколько лет люди будут работать вместе с самообучающимися машинками, которые уже становятся хорошими экспертами во многих областях. В этом убежден директор по маркетингу сервисов компании «Яндекс» Андрей Себрант. Корреспондент Теплицы Наталья Баранова подготовила интервью с экспертом и узнала, как технологии машинного обучения применяются в повседневной жизни, какие проекты связанные с машинным обучением есть в России и почему «боязнь умных машин» может только навредить.
– Андрей, можете на простом примере рассказать, что такое машинное обучение?
– Давайте разберем такую ситуацию: перед вами две фотографии – кошачья и собачья морды. Большинство из нас за долю секунды ответит, где собака, а где кошка. А теперь представьте, что вам нужно поставить задачу программисту, описать формальный алгоритм, который поможет отличить одно животное от другого.
Программист начал бы думать: «У них разные зрачки, а это двумерный массив пикселей для программы, я должен выделить либо круглые, либо вытянутые элементы». А если кошка закрыла глаза, если у нее нет усов, она уже перестала быть кошкой? Вы уже поняли, что это будет очень долгий и сложный процесс. Мы с вами так задачи не решаем, мы просто смотрим на изображение и сразу понимаем отличия, потому что в детстве мы много видели и кошек, и собак.
Так вот внутри компьютера можно создать некую вычислительную среду, где есть миллионы фотографий и кошечек, и собачек. А мы предлагаем этой среде самой научиться их распознавать. Сначала она может ошибаться, давать неправильные ответы. Но мы в процессе ей подсказываем, советуем поправить что-то. В итоге система, которая просмотрела миллионы фотоснимков, начнет совершенно точно определять, что изображено на новой картинке.
– Выходит, главный принцип работы – это узнаваемость?
– Да, нужен обучающий набор данных, конкретные примеры что есть что. Система, как и мы, учится на примерах, она точно так же, как и мы, не может объяснить, почему это кошка, а это собака. И такие системы внутри компьютера, которые не работают по заданному алгоритму, а только методом проб и ошибок – это и есть современная система машинного обучения.
Еще по теме: 10 онлайн-курсов по машинному обучению
Понятный пример – сервис Auto.ru. Туда люди загрузили миллионы фотографий своих автомобилей с указанием марки, чтобы их продать. И эта база стала хорошим обучающим механизмом. Самообучающаяся программа увидела все фотографии с информацией и теперь умеет отличать автомобили точно так же, как могла бы отличать кошек от собак. Теперь можно сфотографировать любой автомобиль на улице, и она с высокой точностью назовет вам его марку.
– А где мы в обычной жизни встречаемся с технологиями машинного обучения?
– Они вокруг нас. Мы их уже и не замечаем. Например, поисковые системы научились распознавать, что именно нарисовано на картинке. Раньше поиск работал только по изображениям, у которых была подпись. А сейчас благодаря машинному обучению на запрос «старый замок» вы увидите картинки и с крепостью, хотя это слово вы не вводили. Поиск резко улучшился, людям такие вещи кажутся уже очевидными.
– Какие проекты на тему машинного обучение есть в России?
– У нас очень много всего. Во-первых, все, что делается в Интернете. В современной почтовой службе относительно мало спама и неважно, где у вас ящик – на Mail.ru или на Яндексе. Это случилось благодаря тому, что алгоритмы обучились бороться со спамерами. Мы и не задумываемся, что относительно чистые почтовые ящики – это заслуга самообучающихся алгоритмов. Поиск – это машинное обучение. Перевод у Яндекса или Google – тоже машинное обучение, и никто не строил для этого, например, математических моделей языка.
На российских заводах вовсю внедряют новые технологии, многое уже компьютеризировано.
Например, на Магнитогорском металлургическом комбинате удалось сэкономить большую сумму за счет внедрения алгоритмов машинного обучения, которые позволили оптимизировать расход материалов при производстве стали. (Подробнее о проекте можно почитать по ссылке – Прим. ред.) Есть много примеров из фармакологии, где за счет машинного обучения стало возможным ускорить разработку лекарств.
В целом уровень технологических и информационных продуктов в России такой же, как и во всем мире.
– Чат-боты тоже работают на машинном обучении? На каком этапе развития они сейчас?
– Да, и все чат-боты и в будущем будут работать на машинном обучении. Сейчас же некоторые из чат-ботов вообще не понимают, что их спрашиваешь. Зачастую есть 15 стандартных ответов и все. Если это чат-бот магазина, то он попытается продать что должен всеми способами.
Общение с такими чат-ботами вызывает только озверение. Те, которые выживут, будут понимать, что предложить пользователю, а в какой момент лучше отвязаться. Нужен персонализированный разговор с покупателями. А таких проектов пока довольно мало, и все на стадии разработки.
– Каким образом машинное обучение может изменить нашу жизнь?
– Безусловно, что-то будет автоматизировано, что-то нет. Например, профессия оператора колл-центра исчезает из-за внедрения технологии машинного обучения. Если раньше устройство не могло разобрать, что же спрашивает человек, то теперь машины стали понимать человеческую речь. У операторов сотовой связи больше половины входящих звонков принимают не живые люди, а алгоритмы.
Качество современного перевода тоже сильно изменило нашу жизнь. У людей потихоньку исчезают языковые барьеры.
– Нужно ли в таком случае бояться того, что машины будут умнее нас?
– Нужно не бояться, не паниковать, а учиться с ними работать. Машины становятся вполне хорошими экспертами. В скором времени нам предстоит работать рядом с самообучающимися машинками и понимать, чем они могут быть полезны. Например, большое количество запросов «Яндекса» обслуживаются алгоритмом «Палех», основанном на нейронных сетях. Именно он позволяет поиску «Яндекса» точнее понимать, о чем его спрашивают люди.
Паника вообще вредна. Боязнь «умных» машин может снизить качество жизни и карьерные перспективы.
Сейчас важно уметь быстро учиться и переучиваться. Время востребованности профессии становится очень коротким. Не нужно думать, что вы до пенсии сможете проработать на одном месте.
– Европейские эксперты беспокоятся, что искусственный интеллект может навредить обществу. В начале 2017 года несколько крупных международных фондов пожертвовали 27 млн долларов на его изучение. Они хотят, чтобы разработки происходили под общественным контролем, а машины соблюдали этические нормы. По-вашему, их опасения обоснованы?
– Дело, с одной стороны, хорошее, но проблема в том, что нет такой формулы, по которой можно определить «справедливость и уровень морали». Многие думают, что компании работают по формулам, которые эксперты легко могут оценить. Но оценивать нечего. Любую технологию можно применять по-разному. Сейчас в открытом доступе лежат мощнейшие системы машинного обучения, которыми будут пользоваться и жулики.
Нужно беспокоиться не о развитии самих технологий, а мониторить информацию о том, кто и зачем их будет применять.
Есть справедливое опасение, основанное на реальных фактах: мобильная связь может быть использована террористами. Можно поставить задачу так «А давайте ограничим развитие мобильной связи» или по-другому «Как сделать так, чтобы террористы не могли использовать связь, но она бы развивалась?». Это уже хорошая задача.
– Получается, для начала нужно разобраться, что именно контролировать. Кто должен участвовать в общественном контроле?
– Для начала внутри профессионального сообщества нужно сформулировать общие цели. Например, очень популярная сфера для использования машинного обучения – автомобили без водителей. И вокруг этой темы много споров, много противников автомобилей-беспилотников.
Я не понимаю людей, которые говорят, что если человек задавит другого человека – это нормально, а если машина – тогда ее вообще нельзя выпускать на дорогу. Но эта технология может спасти миллионы жизней, люди будут гибнуть меньше, чем сейчас. Это что, плохая цель?
Еще по теме: Dextro: искусственный интеллект против пыток в полиции
Так вот в этой ситуации нужно сначала в экспертном сообществе разобраться. Вместе с психологами, философами и социологами сформулировать четкую цель. Абстрактная формулировка вроде «машина никогда не должна убивать человека» не подойдет.
– Расскажите о своих проектах, чем вы сейчас занимаетесь?
– В департаменте маркетинга мои проекты направлены на то, чтобы общение с людьми, во многом уже автоматизированное, стало бы гораздо приятнее тупой современной рекламы. Для нас важна персонализация. У «Яндекса» 100 млн пользователей. Ни в какую голову не может поместиться 100 млн характеристик разных людей.
Показательный пример – «Яндекс.Музыка». Сервис накопил данные о том, что человек слушает, и на основе этого подсказывает ему треки. И это приятно! Никто из людей не анализировал конкретные вкусы, никто не привлекал специалистов из музыкальной сферы. С этим справились умные самообучающиеся алгоритмы.
Сайт Андрея Себранта.