lactoriacornuta . (lactoriacornuta) wrote,
lactoriacornuta .
lactoriacornuta

Искусственный интеллект научили имитировать человеческие голоса
06.03.2018 16:43
Технология под названием Deep Voice работает на основе машинного обучения: она "тренировалась" на звукозаписи, включающей в себя около 2400 голосов
Поделиться:
Искусственный интеллект научили имитировать человеческие голоса
Фото: Baidu
Сотрудники пекинской компании Baidu создали роботизированную систему, которая воспроизводит человеческую речь, с точностью копируя ее уникальные характеристики. Об этом сообщает интернет-издание Naked Science.

Технология под названием Deep Voice работает на основе машинного обучения: она "тренировалась" на звуковой записи, длящейся более 800 часов и включающей в себя около 2400 разных голосов. Для эффективной работы нейросети нужно около 100 пятисекундных звуковых сигналов, при этом она может обмануть системы распознавания голоса с помощью всего десяти пятисекундных семплов.

Deep Voice точно имитирует тембр и интонации голоса, что делает производимые им звуки неотличимыми от настоящих, и, по мнению создателей, система найдет широкое применение в совершенно разных областях. Например, она может быть использована для создания персонализированных цифровых помощников, оказания услуг по автоматическому синхронному переводу, озвучивания книг, фильмов и видеоигр. Более того, нейросеть облегчит жизнь тем, кто по каким-то причинам утратил возможность говорить, и скрасит одиночество детей, читая им сказки на ночь, когда родители уехали в командировку. Интересно, что Deep Voice умеет менять голос, делая его мужским вместо женского или добавляя ему иностранный акцент.

"Это настоящий прорыв с технической точки зрения, - говорит один из авторов разработки Лео Зу. - Нам удалось решить сложнейшую генеративную проблему, а именно, мы смогли синтезировать живую речь со всеми ее особенностями".

Deep Voice может применятся для работы голосовых помощников, озвучивания мультимедийных продуктов и синтеза речи людей с ограниченными возможностями.

Правда, у технологии есть проблема: возможно, ею захотят воспользоваться мошенники, чтобы вводить людей в заблуждение или обманывать программы, работающие на основе распознавания речи. А юристы опасаются, что в скором времени аудиозаписи перестанут являться доказательством в ходе судебных процессов.
Subscribe

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your IP address will be recorded 

  • 1 comment