Нейросеть научилась отличать отличников от двоечников

Нейросеть научилась отличать отличников от двоечников

Российские ученые представили алгоритм, умеющий анализировать сообщения в соцсетях и определять, кто их написал – отличник или двоечник. Специалисты утверждают, что точность составляет 94%, пишет EPJ Data Science.

Исследователи предоставили для изучения нейросети посты в Twitter и ВКонтакте.

"Наша модель с точностью до 94% выявляла учащихся с высокой и низкой успеваемостью... Такой подход может быть полезен и для выявления депрессии, влияющей на учебные достижения", - заявил автор работы, заведующий лабораторией вычислительных социальных наук Института образования НИУ ВШЭ Иван Смирнов.

Ученый и его коллеги собрали и изучили сообщения, которые на своих страницах в ВКонтакте написали примерно 2,4 тысячи подростков, проходивших в 2012 году специальный тест на оценку грамотности и способности применять знания на практике.

Материал был предоставлен для тренировки нейросетям, которые проанализировали смысловое содержание и стилистику сообщений и сопоставили их с типичным уровнем образования и успеваемости людей, для которых характерны подобные интересы, знания и стиль написания.

В итоге нейросеть научилась довольно точно определять двоечников и отличников.

Отмечается, что отличникам характерны длинные тексты, связанные с литературой, физикой и описанием мыслительных процессов. Их сообщения богаты лексиконом и в них присутствуют иностранные слова.

А вот двоечники "удобряли" свои тексты в основном смайлами и словами, написанными заглавными буквами. Также эта категория пользователей сети чаще всего обсуждала гороскопы, ДТП и службу в армии.

"Наши результаты показали, насколько уязвима конфиденциальность пользователя в социальной сети. Люди переживают из-за вездесущих камер и систем распознавания лиц, однако, даже /…/ короткий текст, может стать источником информации, которую человек не собирался раскрывать", - резюмировали специалисты.