10:45 25/01/2023

«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией

Shutterstock/FOTODOM

«Яндекс» обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, передает РИА «Новости» со ссылкой на представителей компании.

«Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов», – рассказали в компании.

Новый алгоритм построен на основе системы оптического распознавания символов. Он учитывает особенности почерка, узнает буквы, утратившие свою актуальность, а также понимает особую структуру архивных документов. Специалисты обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков.

«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд», – рассказала руководитель «Поиска» Елена Бубнова.

Ранее сообщалось, что Google хочет покончить с проблемой плохого почерка медиков. Американская компания планирует интегрировать функцию перевода каракулей врачей в текст.

Иван Ракович

НАУКА И ТЕХНОЛОГИИ РАСШИФРОВКА ЯНДЕКС СТАРАЯ ОРФОГРАФИЯ

Подробнее в сюжете: Технологии

Читайте также:

18+

«МИР24» информационно-аналитический интернет-портал. Сетевое издание. Закрытое акционерное общество «Межгосударственная телерадиокомпания «Мир». Главный редактор: Батыршин Р.И. Свидетельство о регистрации СМИ ЭЛ № ФС77-50091 от 06 июня 2012 года. Свидетельство выдано Федеральной службой по надзору в сфере связи, информационных технологий и массовых коммуникаций. Все права на любые материалы, опубликованные на сайте, защищены в соответствии с российским и международным законодательством об авторском праве и смежных правах. При полном или частичном использовании текстовых материалов МТРК «Мир» активная гиперссылка на страницу www.mir24.tv обязательна.

Онлайн-трансляция эфирного потока в сети интернет без согласования строго запрещена. Трансляция эфира возможна исключительно при использовании плеера и системы онлайн-вещания Закрытого акционерного общества МТРК «Мир».

На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети «Интернет», находящихся на территории Российской Федерации).

© 2000 — 2024 МТРК «Мир»

Для корреспонденции:

107076, Москва, улица Краснобогатырская,

д. 44, стр.1

Юридический адрес:

115184, Москва, улица Пятницкая, д. 25

Телефон / факс: (495) 648-07-92, 964-08-01

Реклама на ТВ и радио: (495) 748-13-90

Развитие сети: (495) 748-35-96

Обращение в Компанию

Закупки и тендеры

Вакансии

Интернет-портал: Алексей Тихонов

Радио «МИР»: Елена Коритич

Реклама: reklama@mir24.tv

Служба продвижения: pr@mirtv.ru