Специалисты «Яндекса» разработали усовершенствованную систему онлайн-перевода. Она использует как старые статистические алгоритмы, так и нейронные сети, сообщает пресс-служба компании.
Искусственный интеллект переводит не отдельные слова и фразы, а целые предложения. Однако он плохо справляется с редкими именами, топонимами и проч. и в таких случаях начинает просто перебирать подходящие варианты (условно, Good morning kids может отобразить как «Хорошие морники»). Статистическому переводчику не под силу создать связный текст, но он эффективен при переводе редких слов или оборотов.
Задача нейронных сетей – создать предложение с учетом внутренних смысловых связей, то есть контекста.
Для того чтобы избежать грамматических ошибок и шероховатостей, переведенное предложение проходит сквозь модель языка (свод знаний, накопленный системой).«Нейросеть улавливает смыслы даже в случае, если слова, которые их передают, находятся в разных частях предложения», – говорится в сообщении «Яндекса».
Работая одновременно, две системы компенсируют недостатки друг друга. Предлагается два варианта текста, затем алгоритм на основе метода машинного обучения CatBoost по десяткам критериев отбирает лучший.
Сейчас гибридная система используется только при переводе с английского на русский, но в ближайшие месяцы «Яндекс» планирует расширить список языков.
Читайте также: