论文分享|SuperedgeRank算法及其在网络舆情的超网络模型中识别意见领袖的应用

作者:史谅

论文信息

Title:SuperedgeRank algorithm and its application in identifying opinion leader of online public opinion supernetwork;

Published:March 2014.

Author:NingMa、YijunLiu.

Journal:Expert Systems with Applications.

推荐理由

充分利用超网络的这些属性和功能,可以将信息,心理,观点提升到与互联网用户平行的位置。这样可以更好地描述网上舆情的形成和演变。通过构建网络用户,信息,心理,观点四层超网络,进一步确定网络舆情导报,分析其功能机制。同时还可以探索影响舆论的心理动机以及对网民影响最大的环境信息。

图1 SuperedgeRank算法从建模到检验全流程

从环境子网考虑了外部信息对互联网用户对影响,并提出了外部信息传播的影响力程度的算法;从心理子网中计算容易转化的心理类型,来研究心理动因与信息发布之间的内在联系;同时从观点子网中提取出重要观点,对意见领袖的导向进行分析。

图2 SuperedgeRank算法公式

总体来看,这篇文章在对于意见领袖识别的算法上还有需要改进和避免的地方,但是其中对于意见领袖传播过程中出现的外部信息影响和心理动因的想法值得借鉴,重心不仅仅应该放在识别谁是意见领袖,而应该对怎样成为意见领袖的过程进行更加多方面的定量研究。

研究背景

  1. 互联网上的意见领袖是网络社区中非常重要的人物,对推动舆论形成起到了重要作用。网络舆论与中国社会转型时期的各种矛盾和敏感问题密切相关,网络上的一些负面内容不可避免地会对社会造成负面影响。如果监督指导不到位,将直接影响社会稳定和安全。
  2. 到目前为止,引入社会网络分析,文本挖掘和基于PageRank算法的不同领域的意见领袖,已经有很多理论被引入,但很少有人结合上述方法来解决意见领袖识别问题,目前还没有关于超网络分析的研究确定意见领袖。

研究方法

通过定量研究的方式,首先建立了一个具有社会、心理、环境和观点的多维子网络的超网络模型,根据这个模型提出了Node Superdegree、Superedge Degree、Superedge–superedge Distance、Superedge Overlap等指标。在此基础上,参考pagerank算法,采用SuperedgeRank算法进行超边排序,并利用排序结果在意见超网络模型中识别意见领袖。最后,通过案例研究验证了该方法的可行性和创新性。

图3 数据采集​​和处理过程

 

研究框架

首先,本文简要介绍了网络舆情超级网络模型的建立,主要包括社会,环境,心理和观点子网四个子网。然后计算建立的在线舆论超级网络模型超越之间的相关性,包括信息传播的影响程度,不同心理类型之间的心理转化可能性以及不同观点之间关键词的相似性。基于这些计算,开发了一种新的SuperedgeRank算法,对网络舆情超级网络的所有超级进行计算和排序,并确定公众事件中的意见领袖。最后以“日本的核泄漏危机”为例,验证了超网络分析方法和SuperedgeRank算法的可靠性。。

研究结论及应用

在现阶段,网上舆情控制主要是通过剔除负面意见领袖流言蜚语的长期存在的帖子来进行的。这种干预策略行不通,有时甚至引起公众的不满。基于SuperedgeRank算法,可以识别四层子网中不同类型的关键节点。然后可以制定不同的指导和干预策略。例如,在社会子网络中,负面的意见领袖可以被孤立,而积极的意见领袖则应该受到保护。在环境子网中,识别出关键信息后,我们可以分析其时间,措辞和语言形式,以找到为什么它是特别有影响力的。在心理子网中,我们可以确定主要的心理类型。然后,我们可以用心理学的理论来分析,这可能意味着更好的干预策略。在观点子网络中,我们可以从大量在线帖子中找出主流观点。如果这个观点是谣言,那么迅速澄清就会大大帮助。因此,我们可以基于SuperedgeRank算法在超网络中进行不同优先级的各种研究。