做科学研究应该有实际的应用场景或者是研究意义,这样做的这个研究才合理。而不是为了研究而研究。

最近呢,看了一些社区发现的论文,了解了社区发现做了哪些事,有着哪些方法。但是最近一个根本性的问题让我陷入了沉思。那就是社区发现的实际应用场景和真实数据集的情况。

看了很多如何进行社区发现的算法,却不知道发现这些社区是用来干嘛的,我能将其应用到真实的数据上嘛?如何应用呢?真实数据如何采集呢?

我带着这一系列的困惑去寻找答案,查看一些资料和数据集去探究社区发现的意义。然后在此写下一些我的粗略的看法,如果存在一些不恰当或缺失的地方,请不吝赐教,万般感谢。

社区发现的意义和应用

网络理论是描述和分析各种学科中复杂系统的重要工具。社区结构被定义为一组节点,它们之间的联系比网络的其他部分更加紧密,它们广泛存在于现实世界中的许多复杂系统中,如社会学、生物学、交通系统等(Newman 2018)。在这些系统中发现社区已经成为理解网络结构与系统行为之间关系的主要方法。社区检测作为一种揭示潜在结构的有效技术,已经被应用于许多场景,如在社交媒体中寻找潜在的朋友(朱等人,2017年) ,为用户推荐产品(李和张2020年) ,分析社会意见(王等人,2017年) ,等等[1]。在生物信息领域通过划分生物分子社区,来发现相同功能或结构的生物分子。

在医疗保健的不同领域,使用网络科学方法和算法,包括社区检测方法的趋势日益增加。这些领域包括蛋白质网络、药物处方、医疗保健欺诈检测和药物滥用。假药、标签外营销问题,以及在医院网络中寻找医疗社区结构,都是在医疗保健中使用社区检测的例子[2]。

数据集

网络中节点一般代表实体,边代表实体之间的关系。
社交网络数据节点一般代表用户,边代表用户之间的关系,如互相关注,相互信任。
协作网络中,节点代表作者,如果作者共同发表过论文,就连接两个作者。
web网络,节点代表网页,有向边代表指向另一网页的超链接。

[1] Huang, X., Chen, D., Ren, T. et al. A survey of community detection methods in multilayer networks. Data Min Knowl Disc 35, 1–45 (2021). https://doi.org/10.1007/s10618-020-00716-6
[2]Saeed Shirazi, Amir Albadvi, Elham Akhondzadeh, Farshad Farzadfar, Babak Teimourpour,A new application of community detection for identifying the real specialty of physicians,International Journal of Medical Informatics,Volume 140,2020,104161,ISSN 1386-5056.

Logo

瓜分20万奖金 获得内推名额 丰厚实物奖励 易参与易上手

更多推荐