Ученые изучили в своем расследовании основы теневого бана в Twitter.

Фото: Pixabay/CC0 Public Domain

Интернет, IT
Инструменты
Шрифты

В последние годы платформы социальных сетей разрабатывают и внедряют различные стратегии для модерации контента, публикуемого их пользователями, и обеспечения того, чтобы он не был оскорбительным или неуместным. Это вызвало серьезные споры, и некоторые пользователи утверждали, что эти методы ограничивают свободу слова в Интернете.

Исследователи из французских научно-исследовательских заведений Inria, IRIT/ENSHEEIT и LAAS/CNRS недавно провели исследование известного метода модерирования контента в социальных сетях, известного как теневой бан (shadowbanning). Теневой бан происходит, когда сайт социальной сети вмешивается в онлайн-активность конкретного пользователя без его ведома, например, делая его сообщения или комментарии невидимыми для других пользователей. Это часто достигается с помощью алгоритмов принятия решений или других вычислительных методов, которые обучены выявлять сообщения или комментарии, которые можно считать неуместными.

«Как для исследователей, предметом нашего исследования является понимание взаимодействия пользователей с алгоритмами принятия решений», - сказал изданию TechXplore Эрван Ле Меррер, один из исследователей, проводивших исследование. «Эти алгоритмы часто предлагаются в форме черного ящика, что означает, что пользователи ничего не знают об их функционировании, но принимают свои решения как следствие данных, которые они предоставляют. Мы подвергли сомнению алгоритмы автоматической модерации в социальных сетях как пример таких алгоритмов принятия решений».

Исследователи намеревались изучить основы теневого бана на конкретной платформе социальных сетей: Twitter. Они решили сосредоточиться на Twitter, потому что за последние несколько лет его модерация пользовательского контента получила значительное внимание.

«Мы полагались на некоторый код с открытым исходным кодом, который может обнаруживать некоторые ограничения, налагаемые на пользователей, и видимость их профилей, твитов или взаимодействий», - пояснили исследователи. «Мы улучшили этот код для поддержки массовых тестовых кампаний и проверили видимость твитов около 2,5 миллионов пользователей твиттера».

После накопления и компиляции набора данных, содержащего информацию, касающуюся видимости твитов, размещенных пользователями в Twitter, исследователи использовали его, чтобы попытаться понять причины, по которым некоторые пользователи могли подвергаться теневому бану. Для этого они проанализировали собранные данные с использованием стандартных подходов к интеллектуальному анализу, проверив две разные гипотезы о том, почему видимость некоторых пользователей в Twitter могла быть затруднена.

Первая гипотеза заключалась в том, что ограничение видимости сообщений некоторых пользователей было вызвано ошибками или сбоями в работе платформы. Во-вторых, теневой бан распространяется как эпидемия среди пользователей, которые взаимодействуют друг с другом.

«Поскольку в какой-то момент Twitter заявил, что они не используют методы теневого бана (имея в виду, что проблемы являются ошибками), мы решили использовать статистические методы для проверки вероятности такого сценария ошибки, который должен быть равномерно распределен между пользователями и, следовательно, по нашим данным», сказал Ле Меррер. «Мы выяснили, что некоторые группы населения пострадали по-разному (например, политики и знаменитости в меньшей степени, чем боты или случайно выбранные пользователи)».

Результаты анализа показывают, что гипотеза о том, что теневой бан происходит из-за ошибок или ошибок в системе Twitter, статистически маловероятна. Интересно, что они также отметили, что друзья или подписчики пользователей, подвергшихся теневому бану, с большей вероятностью будут также подвергаться теневому бану.

«Чтобы заменить маловероятный рассказ об ошибке, предложенный Twitter, другим сценарием, мы разработали модель, которая охватила часто встречающиеся группы пользователей, имеющих теневой бан», - заявили исследователи. «Другими словами, наша модель показывает, что пользователи, находящиеся в теневой бане, с большей вероятностью будут иметь друзей, находящихся в теневом бане. Распространенность теневого бана среди некоторых пользователей и их контактов действительно ставит под сомнение заявление Twitter о методах модерации».

Это недавнее исследование проливает свет на динамику и механизмы теневого бана, показывая, что часто существуют группы пользователей, которые имеют теневой бан, и которые взаимодействуют друг с другом. Это может быть связано с тем, что алгоритмы принятия решений учатся классифицировать соединения пользователей, заблокированных в теневом бане, как других потенциальных кандидатов для теневого бана. Это также может быть вызвано алгоритмом нацеливания на слова, часто используемые в определенных сообществах.

В будущем исследователи надеются провести дальнейшие расследования, изучающие основы и ограничения машинных систем для модерации онлайн-контента и рекомендаций онлайн-контента.

«Мы планируем продолжить расследование алгоритмических черных ящиков», - заявили они. «Онлайн-сервисы теперь предоставляют своим пользователям доступ к большому количеству таких систем (т. е. систем рекомендаций, кредитного рейтинга, разного рода ранжирования и т. д.), поэтому выбор будет трудным».

Источник: Tech Xplore