Движение компьютерной мыши показывает ваше поведение.

Фото: Pixabay/CC0 Public Domain

Интернет, IT
Инструменты
Шрифты

В двух недавно опубликованных исследовательских работах компьютерные ученые из Люксембургского университета и международные партнеры показывают, как можно использовать движения мыши для получения дополнительных знаний о поведении пользователей. Хотя у этого есть много интересных приложений, движения мыши также могут раскрывать конфиденциальную информацию о пользователях, такую как их возраст или пол. Ученые хотят повысить осведомленность об этих потенциальных проблемах с конфиденциальностью и предложили меры по их устранению.

Профессор Луис Лейва из Люксембургского университета и автор двух статей более подробно объясняет основные выводы.

Моя мышь, мои правила.

«Мы продемонстрировали, насколько просто собирать поведенческие данные о пользователях в любом масштабе, ненавязчиво отслеживая движения их курсора мыши, и прогнозировать демографические данные пользователя с разумной точностью, используя пять строк кода. В течение многих лет запись движений мыши на веб-сайтах была легко, однако для их анализа требовались передовые знания в области информатики и машинного обучения. Сегодня существует множество библиотек и фреймворков, которые позволяют любому, обладающему минимальными знаниями в области программирования, создавать довольно сложные классификаторы. Это создает новые проблемы с конфиденциальностью, а пользователи не могут иметь простой механизм уклонения».

Поведенческое профилирование пользователей с помощью отслеживания движение мыши. Фото: University of Luxembourg

Основываясь на своих результатах, команда разработала метод предотвращения отслеживания мыши путем искажения координат мыши в реальном времени. «Он основан на недавних исследованиях в области состязательного машинного обучения и был реализован как расширение веб-браузера, так что каждый может извлечь выгоду из этой работы на практике», - объясняет Лейва. Расширение веб-браузера MouseFaker доступно на Github.

Эта работа была представлена на 6-й конференции по взаимодействию и поиску информации с человека 6th ACM SIGIR Conference on Human Information Interaction and Retrieval.

Тем не менее, отслеживание мыши имеет очень практическое применение для веб-мастеров и, в частности, для поисковых систем. Доктор Иоаннис Апаракис из Telefonica Research и соавтор обеих публикаций поясняет: «Когда вы ищете что-то в Google или Bing, ваши движения мыши посылают поисковой системе слабый сигнал, указывающий, интересует ли вас контент, который вам был показан. Поскольку отслеживание мыши может иметь проблемы с конфиденциальностью, мы исследовали возможность записи только небольшой части всей траектории движения и посмотрели, можем ли мы по-прежнему делать выводы, как люди делают выбор в веб-поиске».

Команда проанализировала три типичных сценария, в которых пользователям приходилось делать выбор в поисковых системах: когда они замечают рекламу, когда они покидают страницу и когда они разочаровываются.

Результаты интересны: если пользователи обратят внимание на рекламу, это будет сигнализироваться начальными движениями мыши. В случае отказа от страницы, на самом деле все наоборот: последние движения сообщают, решил ли пользователь уйти, удовлетворен ли он результатами поиска или нет, без необходимости нажимать на что-либо. В случае разочарования результаты были неоднозначными, но казалось, что средняя часть траектории движения мыши дает больше информации, чем начальная или конечная части.

Исследователи обнаружили, что можно предсказать вышеупомянутые задачи, иногда используя всего две или три секунды движения мыши. Таким образом, они приходят к выводу, что, отслеживая только интересные части, поисковые системы могут получать полезную информацию и улучшать свои услуги, уважая при этом конфиденциальность пользователей. Эта работа будет представлена на 44-й Международной конференции по исследованиям и разработкам в области информационного поиска ACM SIGIR Conference on Research and Development in Information Retrieval.

Профессор Лейва говорит: «За счет эффективной записи нужного количества данных о движении мы можем сэкономить ценную полосу пропускания и хранилище, уважать конфиденциальность пользователя и увеличить скорость обучения и развертывания моделей машинного обучения. Учитывая масштаб Интернета, это принесет чистую выгоду для нашей среды».

Об исследовании можно прочитать в The ACM Digital Library.

Источник: Techxplore