НАУКА И ТЕХНОЛОГИИ

Ученые из Санкт-Петербурга научили нейросеть читать по губам

Россия, Санкт-Петербург •11/04/2023 — 16:33

Специалисты Санкт-Петербургского Федерального исследовательского центра РАН (СПб ФИЦ РАН) с помощью алгоритмов искусственного интеллекта и компьютерного зрения научились распознавать речь человека по губам. Новая разработка позволит усовершенствовать работу голосовых помощников в шумных условиях, сообщает ТАСС.

Голосовые команды часто используются как в повседневной жизни, так и в различных производственных сферах. Но цифровые алгоритмы правильно распознают слова только в условиях относительной тишины. При наличии шумового фона точность выполнения команд заметно снижается.

Петербургские ученые предложили использовать нейросеть, которая воспринимает как звуки, так и движения губ. Нейросетевую модель научили распознавать несколько сотен наиболее распространенных команд. Для обучения применяли видеозаписи в сопровождении звука. При этом нейросеть смогла самостоятельно определять, какой вид данных окажется наиболее точным.

Тестирование программы провели с помощью водителей, управлявших шумными большегрузными автомобилями. На их смартфоны установили необходимое программное обеспечение. Результаты показали, что точность распознавания данных только по чтению губ составляет 60-80%, а в сочетании со звуковым сигналом – более 90%.

Ученые отметили, что в будущем нейросеть смогут использовать пилоты, операторы тяжелой промышленной техники, а также работники торговых центров и других мест скопления людей.

Ранее сообщалось, что российские ученые адаптировали нейросеть для анализа литературных текстов. Система может определить тип персонажей по репликам и описанию и раскрыть характер их взаимоотношений.

Сюжет

Десятилетие науки и технологий

#НАУКА

Путин на встрече с молодыми учеными: Россия добилась успехов в импортозамещении научного оборудования

21:42, 02/12/2024

#ГЕОЛОГИЯ

Раскрыто влияние оледенения на формирование долины Волги

15:02, 08/11/2024

#ПИЯВКИ

Реликтовых пиявок впервые нашли в озерах Алтая

15:42, 29/10/2024

#МОЗГ

Вместо слова – мысль: как новейшие технологии помогают восстанавливаться после инсульта

17:40, 28/10/2024