Специалисты Санкт-Петербургского Федерального исследовательского центра РАН (СПб ФИЦ РАН) с помощью алгоритмов искусственного интеллекта и компьютерного зрения научились распознавать речь человека по губам. Новая разработка позволит усовершенствовать работу голосовых помощников в шумных условиях, сообщает ТАСС.
Голосовые команды часто используются как в повседневной жизни, так и в различных производственных сферах. Но цифровые алгоритмы правильно распознают слова только в условиях относительной тишины. При наличии шумового фона точность выполнения команд заметно снижается.
Тестирование программы провели с помощью водителей, управлявших шумными большегрузными автомобилями. На их смартфоны установили необходимое программное обеспечение. Результаты показали, что точность распознавания данных только по чтению губ составляет 60-80%, а в сочетании со звуковым сигналом – более 90%.
Ученые отметили, что в будущем нейросеть смогут использовать пилоты, операторы тяжелой промышленной техники, а также работники торговых центров и других мест скопления людей.
Ранее сообщалось, что российские ученые адаптировали нейросеть для анализа литературных текстов. Система может определить тип персонажей по репликам и описанию и раскрыть характер их взаимоотношений.
Читайте также:
Подробнее в сюжете: Десятилетие науки и технологий