Новая служба преобразования текста в речь Google имеет более реалистичные голоса

27.03.2018 23:44 48

Новая служба преобразования текста в речь Google имеет более реалистичные голоса

Теперь Google позволит разработчикам использовать синтез «текст в речь», который обеспечивает голос в Google Assistant и Maps. Cloud Text-to-Speech теперь доступен через облачную платформу Google, и компания заявляет, что она может использоваться для управления системами голосового ответа в центрах обработки вызовов, включения речи устройства IoT и преобразования медиафайлов, таких как статьи новостей и книги, в устный формат. На 12 языках имеется 32 разных варианта голоса, и пользователи могут настраивать подачу тона, скорость голоса и прирост громкости.

Кроме того, выбор доступных голосов был построен с использованием модели WaveNet Google. Он был разработан командой Google DeepMind, и компания впервые объявила об этом в 2016 году. Вместо того, чтобы использовать фрагменты речи и навязывать их вместе, чтобы делать слова, которые часто звучат очень роботизированными, WaveNet формирует отдельные звуковые волны, создавая более естественную звучащую речь. С тех пор Google улучшила WaveNet, сделав ее в 1000 раз быстрее и способную генерировать более качественный звук. В тестах слушатели сказали, что голоса WaveNet были на 20 процентов лучше, чем другие сгенерированные голоса, и их оценки показали, что WaveNet снижает разрыв в уровне между генерируемой речью и человеческой речью примерно на 70 процентов.