«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией

10:45 25/01/2023
«Яндекс» научил нейросети расшифровывать документы с дореволюционной орфографией

«Яндекс» обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, передает РИА «Новости» со ссылкой на представителей компании.

«Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов», – рассказали в компании.

Новый алгоритм построен на основе системы оптического распознавания символов. Он учитывает особенности почерка, узнает буквы, утратившие свою актуальность, а также понимает особую структуру архивных документов. Специалисты обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков.

«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд», – рассказала руководитель «Поиска» Елена Бубнова.

Ранее сообщалось, что Google хочет покончить с проблемой плохого почерка медиков. Американская компания планирует интегрировать функцию перевода каракулей врачей в текст.