Искусственный интеллект научился читать древнерусские грамоты
Систему искусственного интеллекта научили расшифровывать тексты древнерусских грамот. Разработку представили в Новгородском государственном университете (НовГУ).
Ученые рассказали, что компьютерное зрение хорошо умеет распознавать буквы, однако у древних текстов есть своя специфика. Между тем задача по расшифровке грамот очень важна – только в Великом Новгороде найдено более 1200 таких артефактов. Процесс обработки текста очень долгий и трудоемкий – многие символы могут иметь несколько вариантов прочтений, также используются устаревшие буквы и редкие диакритические знаки.
Для обучения нейросети использовали пять «эталонных» грамот, где буквы разметили вручную. Также в датасет вошли автоматические вырезки букв, выполненные детектором.
Ученые отметили, что новое приложение позволяет быстро загружать фотографии, распознавать буквы и экспортировать результаты. Система способна обучаться самостоятельно, в дальнейшем этот процесс будет автоматизирован. В процессе обучения датасет дополняется новыми расшифровками.
Использование ИИ позволит существенно сократить время расшифровки древних грамот. Также модель будет пригодна для расшифровки рукописей, сообщили в НовГУ.
Ранее стало известно, что искусственный интеллект научился восстанавливать тексты на латыни. Программу назвали «Эней». Ее обучили на базе данных из почти 200 тысяч известных надписей и 16 миллионов символов.