Магистрантка Университета ИТМО в Санкт-Петербурге Ксения Бурая и ее коллеги из Национального университета Сингапура разработали специальный алгоритм, который может предсказать семейное положение пользователя, используя данные трех социальных сетей вместо одной, сообщает пресс-служба российского вуза.
Программисты выяснили, что профилирование пользователя сразу по нескольким соцсетям позволяет получить более точную информацию о его индивидуальных чертах. Выбрав такую характеристику, как семейное положение, ученые объединили данные Twitter, Instagram и Foursquare и научили специальный алгоритм предсказывать этот параметр с точностью до 86%, что на 17% точнее, чем по одной из соцсетей.
«Чтобы алгоритм понимал данные, на которых его будут обучать, ученые превратили активность пользователей из Нью-Йорка, Сингапура и Лондона в наборы, или векторы, из таких параметров, как средний размер твита, наиболее частые объекты на фото, распределение чекинов и так далее. Затем к этим векторам программисты применили базовые модели машинного обучения», - говорится в распространенном сообщении.
Ксения Бурая собирает и анализирует данные пользователей и адаптирует их под шкалу психотипов MBTI (Myers-Briggs Type Indicator), которая характеризует человека с точки зрения того, как он взаимодействует с миром.
«Согласно многим научным источникам, психотип человека тесно связан с его семейным положением. Поэтому мы решили проверить, насколько точно сможем предсказать этот параметр, чтобы в будущем использовать его для определения психотипа», - объясняет Ксения Бурая.
Ученые полагают, что в будущем результаты совместно исследования помогут составлять психологический портрет человека, будут полезны рекрутерам, а также позволят вычислить членов опасных группировок, людей, склонных к депрессии и самоубийству. Доклад о своих достижениях Ксения Бурая представит на одном из самых значимых научных событий в своей области — Конференции AAAI по искусственному интеллекту, которая пройдет 4−9 февраля в Сан-Франциско.
Подробнее в сюжете: Социальные сети