Китайская компания Baidu научила свою нейросеть имитировать человеческий голос. Программе пришлось проанализировать аудиозапись длительностью более месяца, пишет Naked Science.
Технология имитации речи получила название Deep Voice. Обучение нейросети проходило с помощью аудиозаписи длительностью в 33 сутки, которая содержала более 2400 образцов человеческого голоса.
В результате программа научилась не просто подражать этим голосам, но и с точностью копировать их тембр и интонацию. Deep Voice также умеет менять голос с женского на мужской и придавать ему тот или иной иностранный акцент. Более того, она способна за минуту обойти системы распознавания голоса.
По мнению авторов разработки, она будет востребована в самых разных сферах жизнедеятельности человека.
Так, с помощью Deep Voice можно озвучивать книги и другие программы, переводить фильмы, и самое главное – существенно облегчит жизнь людям, потерявшим способность издавать звуки.
Читайте также:
Подробнее в сюжете: Технологии