如何治理“网络暴力”

 在人类文明不断发展向前的进程中,大数据时代应运而来。随着互联网的普及,广大网络用户获得了更方便,更广泛的表达渠道。然而不可否认的是,由于互联网的匿名性,使得网络社区也出现了无序的情绪宣泄和肆意的网络暴力(Network violence)。一场场“言语风暴”的背后,是 个别人“键对键”时忽视了表达的分量、罔顾了发言的责任。要知道,匿名和虚拟不是“张口就来”的理由,道德和法治才是“言由心生”的前提。互联网并不是法外之地。2022 年初,中央网信办开展了为期 1 个月的“清朗·2022 年春节网络环境整治”专项行动,其中重点整治的五个方面任务,排在首位的就是“网络暴力、散播谣言等问题”。

表达有边界,流量有底线。如果说网络暴力行为是淹没理性、蚕食公序的洪水猛兽,那么网络 平台理应成为一道守护精神家园的坚固堤坝。近日,某社交平台在A市试点抽样统计了近一个月内匿名网民在社交平台上公开发表的言论,并对常用词条出现的次数进行统计(此数据见附件1)。另外,在同一个月内,该平台还对分享了地理位置的匿名网民的公开言论也以社区为单位进行了统计(此数据见附件 2)。请根据以上数据,回答以下问题:

问题 1:在社交平台上发表的言论在某些程度上能够反应一个人的价值观。物以类聚,人以群 分。有相同的价值观的网民其语言的情感色彩往往有趋同性。请根据附件1中的数据,区分A市网民的价值观念群体;

问题 2:我们相信世间还是正能量的人多,“键盘侠”是相对少数存在的群体。结合问题 1 的 结果,请以合理的算法识别可能存在的“键盘侠”们,并尝试寻找“键盘侠”们与其他群体不同的词条;

问题 3:每个社区由不同群体的网民组成。根据附件2中的数据,并结合问题1的结果,建立算法分析每个社区中不同群体网民的组成比例;

问题 4:城市能够根据不同的功能划分为多个区域(如大学城,商业区等等),不同的功能区由附近多个小的社区组成。同一功能区的网络言论往往有一些相似性(如大学城的学生较多,所发 表的言论也有相似之处)。请基于提供的数据建立算法,对 A 市进行较为合理的功能区划分。针对划分的结果提出治理“网络暴力”的解决方案或者建议。

数据描述

附件 1:不同网民在一个月内发言的统计数据。行代表网民(netizen),共随机抽样了 8449 个网 民。列代表词条(word),共有 17681 个不同的词条。数据中每一个元素代表统计得到的某一个网 民发言的某个词的个数(单位是百)。

附件 2:不同社区(一个社区包含多个网民)在一个月内的发言的统计数据。行代表社区(community) 共统计了 604 个社区的发言。列代表词条(word),共有 17681 个不同的词条。最后一列(position) 代表该社区的位置坐标(坐标是用 x 号隔开,例如 26.96x7.97 代表(26.96,7.97))。数据中每一个元素代表统计得到的某一个社区内的网民发言的某个词的个数(单位是百)。

备注:为了去除词条的敏感性,该数据不提供每一词条的具体含义。并且为了保护共享地理位置的 网民隐私,附件 2 只测量了社区总体网民发言的次数。

 网盘链接:https://pan.baidu.com/s/10wErqrycYLGGe8kPId2tfg 
提取码:8848  附代码、原题、附件1、2

Logo

大数据从业者之家,一起探索大数据的无限可能!

更多推荐