Нейросеть научилась отличать мужчин и женщин по тексту

19:06 24/04/2018
Генетики раскрыли тайну описанной Дарвином коровы-бульдога
ФОТО : Mir24.tv / Дмитрий Белицкий

Ученые Национального исследовательского ядерного университета «МИФИ», Курчатовского института и Воронежского госуниверситета разработал метод обучения компьютера, позволяющий распознать пол человека по написанному им тексту с точностью до 80% случаев. Работа опубликована в Procedia Computer Science.

«Мы достигли высоких результатов в определении пола автора текста благодаря продвинутым нейросетевым моделям, в условиях, когда  автор не скрывает свой пол. На очереди задача определения пола в условиях его намеренного сокрытия», – рассказал доцент НИЯУ МИФИ Александр Сбоев.

Специалисты сравнили точность гендерной идентификации текстов на основе двух подходов к моделированию: алгоритмы машинного обучения (метод опорных векторов и градиентный бустинг) и нейронные сети глубокого обучения (сверточные нейронные сети и рекуррентные нейронные сети с долгой краткосрочной памятью).

Письменный текст неизбежно отражает некоторые характеристики автора, в том числе пол, психологические особенности, уровень образования. С помощью текста можно диагностировать у человека отдельных заболеваний, а также суицидальное поведение. Потребность в такой диагностике есть от кадровых служб и служб безопасности, а также у маркетологов, пытающихся угадать интересы потребителей.