Информация о статье

ИСКУССТВЕННЫЕ ПРОФИЛИ «ВКОНТАКТЕ» И ИХ ВЛИЯНИЕ НА СОЦИАЛЬНУЮ СЕТЬ ПОЛЬЗОВАТЕЛЕЙ

Аделя Динаровна Кавееваa  (E-mail: adele.kaveeva@mail.ru)

Константин Евгеньевич Гуринb 

aКазанский федеральный университет, Казань, Россия

bУдмуртский государственный университет, Ижевск, Россия

Цитирование: Кавеева А.Д., Гурин К.Е. (2018) Искусственные профили «ВКонтакте» и их влияние на социальную сеть пользователей. Журнал социологии и социальной антропологии, 21(2): 214–231. https://doi.org/10.31119/jssa.2018.21.2.8

Аннотация. Статья посвящена проблеме поддельных аккаунтов (фейков) в социальных онлайн-сетях и возникающим из-за них искажениям данных о структуре сетевых взаимодействий между пользователями. Фейки создают дополнительный «шум» в данных, что затрудняет исследование сети как социального пространства. Вмешательство фейков оставляет отпечаток как на структуре сети, так и на ее свойствах. Оценка числа и влияния фейков имеет значение и для формирования выборок из сетей, поскольку анализ полных сетей зачастую невозможен в силу их размеров.

Цель статьи — оценка влияния поддельных аккаунтов на характеристики локальной сети дружбы между пользователями сайта «ВКонтакте» на примере жителей Ижевска. Авторы выделяют ключевые характеристики, по которым можно распознать фейк, и представляют опыт создания на их основе классификатора для определения того, является ли аккаунт пользователя подлинным или нет. Для создания классификатора был применен алгоритм случайного леса. Сравнение топологии исследуемой сети до и после удаления из нее фейковых аккаунтов демонстрирует, на изменение каких именно сетевых метрик влияет наличие в сети профилей, не являющихся подлинными. Так, было установлено, что по мере удаления фейков наименее интегрированные участники теряют связь с основной частью сети и происходит рост числа ее компонент. Таким образом, фейки служат сильными концентраторами связей, распределенными по всей сети, завышая наблюдаемые уровни ассортативности и транзитивности.

Ключевые слова: анализ социальных сетей, ВКонтакте, анализ данных в R, фейк, поддельный аккаунт, онлайн-сообщества

Благодарность: Авторы статьи выражают благодарность Дмитрию Сорокину (университет ИТМО), разработавшему библиотеку VKR для языка программирования R, с помощью которой были собраны данные для исследования. Работа выполнена при поддержке Программы повышения конкурентоспособности Казанского (Приволжского) федерального университета.

 

Литература

Алымов А.С., Баранюк В.В., Смирнова О.С. (2016) Детектирование бот-программ, имитирующих поведение людей в социальной сети «ВКонтакте». International Journal of Open Information Technologies, 8: 55–60.

Adewole K.S., Anuar N.B., Kamsin A., Varathan K.D., Razak S.A. (2017) Malicious accounts: Dark of the social networks. Journal of Network and Computer Applications, 79: 41–67. https://doi.org/10.1016/j.jnca.2016.11.030.

Ahmed N. K., Neville J., and Kompella R. (2013) Network Sampling: From Static to Streaming Graphs. ACM Transactions on Knowledge Discovery from Data (TKDD), 8(2), Article 7. https://doi.org/10.1145/2601438

Blagus N., Šubelj L., Bajec M. (2017) Empirical comparison of network sampling: How to choose the most appropriate method? Physica A: Statistical Mechanics and its Applications, 477: 136–148. https://doi.org/10.1016/j.physa.2017.02.048.

Boshmaf Y., Muslukhov I., Beznosov K., and Ripeanu M. (2011) The Socialbot Network: When Bots Socialize for Fame and Money. Proceedings of the 27th Annual Computer Security Applications Conference: 93–102.

Cao Q., Sirivianos M., Yang X., Pregueiro T. (2012) Aiding the Detection of Fake Accounts in Large Scale Social Online Services. Proceedings of the 9th USENIX conference on Networked Systems Design and Implementation: 1–15.

Chen C.-M., Guan D., Su Q.-K. (2014) Feature set identification for detecting suspicious URLs using Bayesian classification in social networks. Information Sciences, 289: 133–147.

Conover M., Ratkiewicz J., Francisco M., Gonçalves B., Menczer F. and Flammini A. (2011) Political polarization on Twitter. Proceedings of the 5th International AAAI Conference on Weblogs and Social Media: 89–96.

Conti M., Poovendran R., and Secchiero M. (2012) Fakebook: Detecting fake profiles in on-line social networks. Proceedings of the 2012 International Conference on Advances in Social Networks Analysis and Mining (ASONAM 2012): 1071–1078.

Cresci S., Di Pietro R., Petrocchi M., Spognardi A., Tesconi M. (2015) Fame for sale: Efficient detection of fake Twitter followers. Decision Support Systems, 80: 56–71. https://doi.org/10.1016/j.dss.2015.09.003

Davydov L. (2016) On the Use of Social Networks as a Tool for Creating Political Authority’s Image. International Journal of Environmental & Science Education, 11(18): 12423–12430.

El Azab A., Idrees A.M., Mahmoud A. M., Hefny H. (2016) Fake Account Detection in Twitter Based on Minimum Weighted Feature set. International Scholarly and Scientific Research & Innovation, 10(1): 13–18.

Ferrara E., Varol O., Davis C., Menczer F., and Flammini A. (2016) The Rise of Social Bots. Communications of the ACM, 59(7): 96–104. https://doi.org/10.1145/2818717.

Fire M., Kagan D., Elyashar A., Elovici Y. (2014) Friend or foe? Fake profile identification in online social networks. Social Network Analysis and Mining, 4(1): 1–23.

Fire M., Katz G., and Elovici Y. (2012) Strangers intrusion detection — detecting spammers and fake profiles in social networks based on topology anomalies. ASE Human Journal, 1(1): 26–39.

Frank O. (1978) Sampling and estimation in large social networks. Social Networks, 1: 91–101.

Freeman D.M. (2017). Can You Spot the Fakes? On the Limitations of User Feedback in Online Social Networks. Proceedings of the 26th International Conference on World Wide Web (WWW '17): 1093–1102. https://doi.org/10.1145/3038912.3052706.

Granovetter M. (1976) Network sampling: Some first steps. American Journal of Sociology, 81: 1267–303.

Leskovec J., Faloutsos C. (2006) Sampling from large graphs. Proceedings of the 12th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ACM: 631–636.

Wagner C., Singer P., Karimi F., Pfeffer J., and Strohmaier M. (2017) Sampling from Social Networks with Attributes. Proceedings of the 26th International Conference on World Wide Web (WWW '17): 1181–1190. https://doi.org/10.1145/3038912.3052665.

Xiao C., Freeman D. M., Hwa T. (2015) Detecting Clusters of Fake Accounts in Online Social Networks. Proceedings of the 8th ACM Workshop on Artificial Intelligence and Security, 91–101. https://doi.org/10.1145/2808769.2808779

Yang Z., Wilson C., Wang X., Gao T., Zhao B. Y., and Dai Y. (2011) Uncovering social network sybils in the wild. Internet Measurement Conference: 259–268.

Zhu Y., Wang X., Zhong E., Liu N., Li H., Yang Q. (2012) Discovering Spammers in Social Networks. Proceedings of the Twenty-Sixth AAAI Conference on Artificial Intelligence: 171–177.

 

Источники

GitHub (2017) Access to VK (Vkontakte) API via R [https://github.com/Dementiy/vkR] (дата обращения: 31.08.2017).

Similar Web (2017) Top Websites Ranking [https://www.similarweb.com/top-websites] (дата обращения: 31.08.2017).