«Яндекс» обучил нейросети расшифровывать архивные документы с дореволюционной орфографией, передает РИА «Новости» со ссылкой на представителей компании.
«Попробовать технологию в действии можно уже сейчас в сервисе «Поиск по архивам»: он открывает всем желающим доступ к более чем 2,5 миллиона страниц исторических документов», – рассказали в компании.
Новый алгоритм построен на основе системы оптического распознавания символов. Он учитывает особенности почерка, узнает буквы, утратившие свою актуальность, а также понимает особую структуру архивных документов. Специалисты обучили нейросеть на массиве данных из сотен тысяч рукописных строк из реальных текстов XVIII-XIX веков.
«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд», – рассказала руководитель «Поиска» Елена Бубнова.
Ранее сообщалось, что Google хочет покончить с проблемой плохого почерка медиков. Американская компания планирует интегрировать функцию перевода каракулей врачей в текст.
Подробнее в сюжете: Технологии
Читайте также: