Голос зачем скрывать тебе. Какие бесплатные сервисы меняют речь в реальном времени

Как повысить свою безопасность с помощью трансформации голоса Изображение: DALL·E

Зачем человеку могут понадобиться интонации магистра Йоды из «Звездных войн»? Конечно, прикольно почувствовать себя хоть в чем-то похожим на великого воина джедаев. Но какая польза от этих забав для гражданского активиста или независимого журналиста, погруженного в свою непростую работу?

Распознавание голоса

Это понятие сегодня широко используется там, где речь идет лишь о голосовом управлении. (Если еще не видели прелестный скетч про двух шотландцев в лифте, обязательно посмотрите.) Есть также большой пласт программ и сервисов, преобразующих человеческую речь в текст. Но мы сейчас не об этом.

Наша тема — безопасность, и тут распознавание голоса можно приблизительно разделить на две задачи: аутентификацию и идентификацию. Аутентификация сводится к сравнению двух образцов голоса. Система безопасности сопоставляет неизвестный образец с «одобренным» образцом. Если они совпадают, человек получает доступ в защищенное помещение, базу данных, панель управления устройством. Идентификация подразумевает сравнение неизвестного образца с N идентифицированных образцов для определения личности автора. Идентификация — частый эпизод в популярных детективных фильмах и сериалах. Сравнение голосов действительно используется в криминалистике и называется соответствующе: forensic voice comparison. Помимо задач, использующих автоматизацию, есть и чисто «ручные», например опознание свидетелем или потерпевшим подозреваемого по голосу.

Насколько велика точность такого определения личности человека? Зависит от ряда условий, например от длины записанного отрывка. Чем он длиннее, тем больше материала для анализа. Другой критерий — качество (чистота) записи. Также голос человека может меняться, например, из-за волнения или болезни. Ошибка идентификации при отсутствии этих негативных факторов составляет всего несколько процентов. Голосовое опознание принимается судами разных стран мира как доказательство, хотя по этому вопросу ведутся бесконечные споры

Человек может научиться имитировать голос другого человека. Некоторые люди, которым звонили якобы попавшие в аварию дети (мошенники используют такой способ), оправившись от стресса, клялись, что «это был голос моего мальчика». Но человек-имитатор не в состоянии добиться сколько-нибудь значимого успеха, пытаясь обмануть современные автоматизированные средства. А вот если подделать человеческий голос пытается машина («компьютер против компьютера»), попытка удастся с вероятностью до 50%.

Робот-убийца (голосом приемной матери Джона Коннора по телефону): — Дорогой, ты в порядке?
Терминатор (голосом юного Джона Коннора по телефону): — Все хорошо. (Прикрыв телефонную трубку, Джону) Как зовут собаку?
Джон: — Макс.
Терминатор: — Джанель, что там с Вулфи? Я слышу, как он лает.
Робот-убийца: — Вулфи в порядке, дорогой. Где ты?
Терминатор (вешает трубку, Джону): — Твои приемные родители мертвы.

(Из кинофильма «Терминатор 2: Судный день»)

Трансформация голоса

Верно ли, что трансформация голоса — занятие исключительно для мошенников и роботов-убийц из апокалиптического будущего? Конечно нет. Активисты, работающие в условиях идеологической цензуры, доносительства и репрессий, иногда вынуждены действовать анонимно. Им нужно, например, собирать информацию о нарушениях прав человека и публиковать ее, но они, конечно, не хотят рисковать жизнью или оказаться в тюрьме. Пишущим авторам проще: они пользуются псевдонимами. А вот если есть картинка и звук, приходится искать способы скрыть лицо и изменить голос.

Первая задача не такая уж и сложная. Любители Zoom, к примеру, могут использовать смешные встроенные аватарки собачек и лисичек. При желании в Zoom нетрудно создать собственного виртуального персонажа. Для особенно креативных людей найдутся программы, готовые на время заменить ваше лицо на волка, Золушку или Шрека. В конце концов, можно просто отключить камеру.

А вот со звуком сложнее. Именно посредством звука мы обычно передаем информацию друг другу на онлайн-встречах. Выключить микрофон означало бы запереть себя в текстовом чате. Возможно, так и стоит поступить, если вы особенно опасаетесь за свою безопасность. В остальных случаях можно задуматься об изменении голоса.

К сожалению, в популярных программах для видеоконференций пока нет встроенных опций для трансформации голоса. (Если вы такую программу обнаружили, пожалуйста, напишите нам.) Поэтому приходится использовать программы-фильтры. Такие программы принимают звук с микрофона и меняют его в соответствии с вашими предпочтениями. А в Zoom — или что вы используете для онлайновых встреч — передают голос, совсем не похожий на ваш. Такие программы по-английски называются real-time voice changers — изменители голоса в реальном времени.

Сервис Super Voice Changer

Тот, кто выбрал системный шрифт для интерфейса этой программы, должно быть, отдавал предпочтение иероглифам и недолюбливал латиницу. Да и название Super Voice Changer выдает нехватку фантазии. Но для нас главное, что программа простая, бесплатная и работает. (Я скачал и попробовал версию 9.7.7.0.) После запуска программа тихонечко сидит в системном трее и скромно ждет, когда вы вспомните о ней и щелкнете мышью. Нажав кнопку Template, можно выбрать какой-нибудь из пресетов с прикольными названиями. Например, можно обогатиться знанием, чем, по мнению разработчика, Sweet girl отличается от Lovely girl, Soft girl и Sexy girl.

Окна программы Clownfish Voice Changer
Окна программы Clownfish Voice Changer. Скриншот

Кнопка Record открывает крошечный диктофончик. Здесь можно записать фрагмент речи с выбранными настройками и, если вы сами себе понравились, сохранить его на память в WAV-файле. Если ничего не получается, проверьте, какой микрофон выбран в настройках системы (кнопка Microphone в верхней части окна). Возможно, на вашем компьютере есть выбор из нескольких микрофонов. Например, встроенный микрофон ноутбука, микрофон в гарнитуре и вдобавок виртуальный микрофон, созданный другой программой обработки звука. Выберите один микрофон, остальные отключите.

Если новый голос для вас недостаточно sweet и magnetic, можете подвигать влево-вправо ползунки Pitch, Timbre, Tune и Tone. Будете звучать в Zoom как сладкоголосый британский певец Энгельберт Хампердинк.

Сервис Clownfish Voice Changer

Еще одна бесплатная программа, и тоже (увы!) только для Windows. Clownfish — рыбка-клоун, знаменитый мультипликационный герой. Трудно сказать, почему программу для работы с человеческой речью назвали в честь рыбы, да еще по имени Немо. Как и предыдущая программа, Clownfish Voice Changer отдыхает в системном трее, а меню можно вызвать правым кликом мыши. Приятная неожиданность — есть интерфейс на русском языке. Правда, не все пункты меню и окошки локализованы. На день написания этой статьи была доступна версия программы 1.70.

Пресеты доступны по кнопкам. Можно изменять высоту самостоятельно, микшировать до четырех пресетов, а также добавить к пресету всяческие шумы. Чтобы к результату не примешивался оригинальный голос, снимите галочку в поле Append original voice.

Clownfish имеет дополнительные интересные функции. Например, преобразование текста в речь. Можно вставить текст в окошко и дать команду Read text. Казалось бы, ну что тут особенного — таких программ в своем классе немало. Но все-таки это дополнительная, а не основная функция. Кроме того, в отдельном меню можно выбрать, кому «поручить» прочесть текст: эстонцу, турку или, допустим, кхмеру. Русскоязычный «чтец» озвучил отрывок из юридического журнала с таким чугунным акцентом, которому позавидовали бы исполнители роли второразрядных мафиози из голливудских боевиков класса «Б». Но, если не выпендриваться и поручать немецкие тексты виртуальному немцу, а французские — виртуальной француженке, результат будет вполне приличный. 

Краткие выводы

Трансформация голоса — вполне доступная для обычного пользователя функция. Она не сведет риск идентификации к абсолютному нулю, но снизит его, и это уже неплохо. Можно сбить с толку даже хорошо знающих вас людей, что уж говорить о незнакомцах. Помните, однако, что автоматическая трансформация голоса — не панацея. Человека можно идентифицировать не только по тону и тембру, но и по интонации, любимым словечкам и присказкам, манере общения.

Кроме того, говорящий может допускать чисто человеческие ошибки, например случайно сообщить о себе идентифицирующую информацию. Если вы стремитесь обеспечить собственную анонимность, не забывайте, что ваш оппонент будет использовать весь доступный ему массив данных о вас, включая текстовые реплики в чате, характерный ник и аватарку. Возможно, даже время вашего появления в чате даст ему дополнительную информацию для установления вашей личности.

Примеры программ из этой статьи мы привели ради вашей первой практики. Есть более функциональные, комфортные в использовании средства. Но все они, к сожалению, платные (или условно-бесплатные с тестовой версией). Как сказал бы магистр Йода, анонимности больше хочет кто, платить приходится тому.