Нейросеть FakeYou для замены голоса и лица на аудио и видео

FakeYou – это сервис, который использует технологию глубокого фейка (deep fake) для создания аудио- и видеозаписей, где ваши любимые персонажи говорят то, что вы хотите. Глубокий фейк – это метод искусственного интеллекта, который позволяет создавать реалистичные видео и аудио, в которых лица и голоса людей могут быть заменены на другие.

С помощью FakeYou вы можете загрузить аудио- или видеозапись с вашим персонажем и предоставить текст или голосовую запись с желаемым содержанием. Сервис затем использует алгоритмы глубокого фейка для синхронизации губ и голоса персонажа с предоставленным контентом. В результате вы получаете видео или аудио, где ваш персонаж говорит то, что вы задали.

Однако, стоит отметить, что использование технологии глубокого фейка вызывает некоторые этические и юридические вопросы. Создание поддельных аудио- и видеозаписей может использоваться для манипуляции информацией или создания контента, который может вредить другим людям. Поэтому важно использовать такие сервисы с ответственностью и этическими соображениями.

Как зарегистрироваться

Переходим на сайт https://fakeyou.com/ и нажимаем «Sign up».

Здесь предлагается единственный способ регистрации – по адресу электронной почты.

Заполняем поля в форме регистрации: имя, адрес электронной почты, пароль и подтверждение пароля. Нажимаем «Sign up».

После регистрации пользователю предлагается ознакомиться с тарифными планами сервисами: стоимостью и возможностями. Нажимаем на логотип FakeYou в левом верхнем углу сайта и начинаем знакомиться с функционалом сервиса.

Как пользоваться

Сервис имеет простой пользовательский интерфейс.

Предлагается три инструмента:

Text to Speech – преобразование текста в речь.
Voice to Voice – преобразование загруженного аудиофайла или собственного голоса на другую речь.
Video Lip Sync – создание видеоролика, где губы персонажа будут открываться синхронно в такт произносимым словам (липсинк).

Рассмотрим функционал Text to Speech. Выбираем «Text to Speech» на главной странице сайта.

Здесь выбираем голос, который будет озвучивать введенный нами текст. FakeYou предлагает нам для озвучки голос Лорда Волан-де-Морт. Чтобы выбрать другой голос, нажимаем «Explore Voices». Здесь можно выбрать язык. К сожалению, русский отсутствует. И категорию, например, «реальные люди». Сервис автоматом предлагает персонажа. Для выбора другого персонажа, нажимаем на иконку, показанную на рисунке ниже.

В поле «Your Text» вводим текст. В бесплатной версии сервиса ограничение на количество символов: итоговая аудиозапись ограничена 12 секундами длительностью. Затем нажимаем «Speak» и немного ожидаем пока сервис сгенерирует аудиозапись и после можно приступить к прослушиванию, нажав иконку «Воспроизвести». Чтобы сохранить файл или поделиться им в социальных сетях, нажимаем «Share&Download».

Рассмотрим функционал Voice to Voice. Выбираем «Voice to Voice» на главной странице сайта.

Выбираем голос из списка и загружаем свой аудиофайл или переходим во вкладку «Microphone» для записи собственного голоса. Затем нажимаем «Convert» и немного ожидаем пока сервис сгенерирует аудиозапись и после можно приступить к прослушиванию, нажав иконку «Воспроизвести». Чтобы сохранить файл или поделиться им в социальных сетях, нажимаем «Share&Download».

Рассмотрим функционал Video Lip Sync. Выбираем «Video Lip Sync» на главной странице сайта.

Здесь выбираем один из предложенных шаблонов или загружаем свой, нажав «upload it as a template». Затем загружаем аудиофайл.

И нажимаем «Submit» и немного ожидаем пока сервис сгенерирует результат.

Какие есть лимиты и ограничения

Бесплатная версия сервиса ограничена в части количества вводимых символов и размера загружаемых медиафайлов. Пользователь может оформить подписку на один из трёх тарифных планов:

Plus – от $7/мес. Подписка позволяет воспроизводить речь продолжительностью до 30 сек, загружать аудио длительностью до 4 минут и видео продолжительностью не более 1 минуты.
Pro – от $15/мес. Подписка открывает доступ к более быстрым и точным алгоритмам, позволяет воспроизводить речь продолжительностью до 1 минуты, загружать аудио длительностью до 5 минут и видео продолжительностью не более 2 минут.
Elite – от $25/мес. Приобретение тарифного плана снимает любые ограничения и открывает доступ к спецпредложениям.

Аналоги

Uberduck – это сервис, который предлагает преобразование текста в речь с использованием голосов известных знаменитостей или собственных голосов пользователей. С помощью этого сервиса можно создавать звуковые файлы или стримы с текстами, которые затем могут быть озвучены выбранными голосами.

С сервисами с подобным функционалом можно ознакомиться в этой статье.

По материалам: neuroseti.ru