Şüpheli ağlarda topluluk tanıma
Tarih
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
Özet
Son yıllarda sosyal ağların kullanımının hızlı bir şekilde artması ile sosyal ağlarda topluluk tanıma konusu önem kazanmaya başlamıştır. Sosyal dökümanların ve bağlantıların analiz edilerek gizil toplulukların keşfedilmesine yönelik birçok yöntem geliştirilmiştir. Bu çalışmada, suç ağı olduğu kanıtlanmamış olası şüpheli ağların analiz edilmesi için bir üretici olasıklı topluluk tanıma modeli geliştirilmiştir. Bu model, klasik yöntemlerdeki bağlantı bilgisinin keşfinin yanında sosyal ağdaki aktörlerin ilgilendiği konulara dair içerik analizi yapmaktadır. Bir sosyal ağdaki kullanıcılara ait yönlü mesaj verisi kullanılarak, benzer konuları konuşan ağ üyeleri aynı topluluk altında kümelenmeye çalışılmıştır. Bu çalışmada geliştirilen model için Topluluk-Konu (TK) modeli temel alınmıştır. TK modeli, ağın bağlantı bilgisini kullanmadığı için topolojik olarak ayrık topluluklar üretmektedir. Bu eksiklik, TK modeline bağlantı bilgisinin eklenmesi ile çözülmeye çalışılmıştır. Enron şirketine ait eposta verileri üzerinde yapılan testler ile hem konusal hem de topolojik olarak benzer kullanıcıların başarılı bir şekilde bir topluluk altında kümelendiği gözlenmiştir.
In recent years, with the rise of the use of social networks, the issue of community detection in social networks has come into prominence. Many approaches have been developed to extract latent communities analyzing social documents and connections. In this study, a generative probabilistic community detection model is developed to analyze suspicious networks which are not proven as criminal networks. In addition to the discovery of connection information in classic methods, this model makes content analysis about topics interested by actors in the social network. By the use of directive message information of users in a network, network members who talk about the same topics, are tried to be grouped in the same community. Community-topic model is used as base for the model developed in this study. Community-topic model produces topologically diverse communities as it does not use connection information of the network. This deficiency has been tried to be solved with the addition of connection information to the community-topic model. With the tests made on the e-mail information belonging to Enron company, it is observed that topically and topologically similar users are successfully grouped in a single community.









