系列文章目录
- 谣言检测文献阅读一—A Review on Rumour Prediction and Veracity Assessment in Online Social Network
- 谣言检测文献阅读二—Earlier detection of rumors in online social networks using certainty‑factor‑based convolutional neural networks
- 谣言检测文献阅读三—The Future of False Information Detection on Social Media:New Perspectives and Trends
- 谣言检测文献阅读四—Reply-Aided Detection of Misinformation via Bayesian Deep Learning
- 谣言检测文献阅读五—Leveraging the Implicit Structure within Social Media for Emergent Rumor Detection
- 谣言检测文献阅读六—Tracing Fake-News Footprints: Characterizing Social Media Messages by How They Propagate
前言
文章:EANN: Event Adversarial Neural Networks for Multi-Modal Fake News Detection
发表会议:SIGKDD (A 类会议论文)
时间:2018年
摘要
社交媒体上假新闻检测的独特挑战之一是如何识别新出现的事件的假新闻。不幸的是,大多数现有方法几乎无法应对这一挑战,因为它们倾向于学习无法转移到未见过事件的特定于事件的特征。为了解决这个问题,我们提出了一个名为事件对抗神经网络(EANN)的端到端框架,它可以派生事件不变特征,从而有利于检测新到达事件的假新闻。它由三个主要组件组成:多模态特征提取器、假新闻检测器和事件鉴别器。
1 介绍
实际上,现有模型倾向于捕获许多不同事件之间不共享的特定于事件的特征。这种特定于事件的功能虽然能够帮助对已验证事件的帖子进行分类,但会损害对新出现事件的检测。出于这个原因,我们相信学习所有事件之间的共享特征将有助于我们从未经验证的帖子中检测假新闻,而不是捕获特定于事件的特征。因此,这项工作的目标是设计一个有效的模型来去除不可转移的事件特定特征,并保留所有事件之间的共享特征,以完成识别假新闻的任务。
要删除特定于事件的特征, 第一步是识别它们。对于不同事件的帖子,它们有自己独特或特定的不可共享的功能。这些特征可以通过测量不同事件对应的帖子之间的差异来检测。在这里,帖子可以用学习到的特征来表示。因此,识别特定事件的特征等同于测量不同事件的学习特征之间的差异。然而,这是一个技术上具有挑战性的问题。首先,由于帖子的学习特征表示是高维的,像平方误差这样的简单度量可能无法估计这些复杂特征表示之间的差异。其次,特征表示在训练阶段不断变化。这要求所提出的测量机制能够捕捉特征表示的变化并始终如一地提供准确的测量。尽管这非常具有挑战性,但有效估计不同事件上学习到的特征之间的差异是去除事件特定特征的前提。因此,如何有效地估计这种情况下的差异是我们必须解决的挑战。
为了解决上述挑战,我们提出了一种端到端框架,称为事件对抗神经网络(EANN),用于基于多模态特征的假新闻检测。受对抗网络[10]思想的启发,我们在训练阶段结合事件鉴别器来预测事件辅助标签,相应的损失可用于估计不同事件之间特征表示的差异。损失越大,差异越小。
EANN 由三个主要组件组成:多模态特征提取器、假新闻检测器和事件鉴别器。多模态特征提取器与假新闻检测器配合执行识别假新闻的主要任务。同时,多模态特征提取器试图欺骗事件鉴别器以学习事件不变表示。对于多模态特征提取器,我们使用卷积神经网络 (CNN) 从帖子的文本和视觉内容中自动提取特征。
本文的主要贡献可归纳如下:
- 据我们所知,我们是第一个提出针对新的和时间紧迫的事件的假新闻检测,它可以基于多模态特征识别假新闻,并通过去除事件特定的特征来学习可转移的特征。为此,我们提出了一种端到端的事件对抗神经网络。
- 所提出的 EANN 模型使用事件鉴别器来衡量不同事件之间的差异,并进一步学习可以很好地泛化新出现事件的事件不变特征。
- 我们提出的 EANN 模型是假新闻检测的通用框架。集成的多模态特征提取器可以很容易地替换为为特征提取而设计的不同模型。
2 相关工作
2.1 假新闻检测
我们将假新闻的定义指定为故意捏造的新闻,并且可以验证为假新闻
2.2 对抗网络
所提出的模型还在事件鉴别器和多模态特征提取器之间建立了一个极小极大博弈。特别是,强制多模态特征提取器学习事件不变表示以欺骗鉴别器。通过这种方式,它消除了对收集到的数据集中特定事件的紧密依赖关系,并对看不见的事件实现了更好的泛化能力。
3 方法论
3.1 模型概述
我们模型的目标是学习用于假新闻检测的可转移和可区分的特征表示。如图 1 所示,为了实现这一点,所提出的 EANN 模型集成了三个主要组件:多模态特征提取器、假新闻检测器和事件鉴别器。首先,由于社交媒体上的帖子通常包含不同形式的信息(例如,文本帖子和附加图像),多模态特征提取器包括文本和视觉特征提取器来处理不同类型的输入。在学习了文本和视觉潜在特征表示后,将它们连接在一起形成最终的多模态特征表示。假新闻检测器和事件鉴别器都建立在多模态特征提取器之上。假新闻检测器将学习到的特征表示作为输入来预测帖子是假的还是真的。事件鉴别器基于此潜在表示识别每个帖子的事件标签。
图 1:事件对抗神经网络 (EANN) 的架构。蓝色网络是文本特征提取器,橙色网络是视觉特征提取器,假新闻检测器是紫色,事件鉴别器是绿色。
3.2 多模态特征提取器
3.2.1 文本特征提取器
3.2.2 视觉特征提取器
使用了预训练的 VGG19 [28]。在 VGG19 网络的最后一层之上,我们添加了一个全连接层,将最终视觉特征表示的维度调整为 p。在与文本特征提取器的联合训练过程中,预训练的 VGG19 神经网络的参数保持不变以避免过度拟合。
3.3 假新闻检测器
使用交叉熵损失函数,然后进行数据更新。我们需要使模型能够学习更一般的特征表示,这些特征表示可以捕获所有事件之间的共同特征。这种表示应该是事件不变的,并且不包括任何特定于事件的特征。为了实现这个目标,我们需要去除每个事件的唯一性。特别是,我们测量不同事件之间特征表示的差异性并将它们删除以捕获事件不变的特征表示。
3.4 事件鉴别器
事件鉴别器是一个神经网络,由两个具有相应激活函数的全连接层组成。它旨在基于多模态特征表示将帖子正确分类为 K 个事件之一。我们将事件鉴别器表示为,其中 表示其参数。我们通过交叉熵定义事件鉴别器的损失,并使用 来表示事件标签的集合。
3.5 模型集成
将损失函数组合,形成整体的损失函数。
梯度反转层(Gradient reversal layer, GRL)
GRL作用:将传入到GRL的梯度乘上一个负数,使得在GRL前后的网络的训练目标是相反的。在接入GRL以后,特征提取器就会有两个目标需要满足,第一是特征提取器需要生成能够预测出正确标签的特征,第二是i特征提取器提取的特征需要尽可能无法判断出来自哪个任务域。
如果没有接入GRL,任务判别器的优化目标是尽可能区分出特征提取器提取出来的特征是来自目标域还是源域,特征提取器优化目标是尽可能生成易于区分是来自于哪个域的特征。他们优化目标相同。
加入梯度反转层后,特征提取器的优化目标就会与任务判别器的优化目标相反,优化目标变成了需要生成尽可能无法判断来自于那个任务域的特征。
GRL在正向传播中,实现一个恒等变换,在反向传播过程中,是让梯度用了负的系数,再往上一层传播。
4.1 数据集
推特数据集和微博数据集
4.2 基线
4.3 实施细节
在文本特征提取器中,我们为词嵌入的维度设置 k = 32。我们设置 ,并且在 Text-CNN 中过滤器的窗口大小从 1 到 4 不等。文本和视觉提取器中全连接层的隐藏大小为 32。对于假新闻检测器,全连接层的隐藏大小为 64。事件鉴别器由两个全连接层组成:第一层的隐藏大小为 64 ,第二层的隐藏大小为 32。对于所有基线和提出的模型,我们在训练阶段使用相同的批量大小 100 个实例,训练 epoch 为 100。
4.7 收敛性分析
文章出处登录后可见!