· 阅读摘要:
在本文中,作者基于CNN、Attention、GAT提出CS-GAT模型,在一些通用数据集上,表现良好。
·参考:
[1] 融合CNN-SAM与GAT的多标签文本分类模型
这篇论文写的很好,介绍模型的时候就很清楚了。有指导意义。
【注1】:我个人认为这篇文章是标准“模型拼接”的输出,这种发文方式还是很香的。
[1] 参考论文信息
论文名称:《融合CNN-SAM与GAT的多标签文本分类模型》
出版物:“计算机工程与应用”
期刊信息:CSCD扩展
[2] 模型
模型图如下:
文本与标签词嵌入层:使用了glove的预训练词向量,对文本数据和标签都是使用glove来转化词向量的。
BiLSTM层:双向LSTM,用的很多了。
融合局部和全局文本特征提取层:这里我们要从BiLSTM层
的输出BiLSTM层
中提取局部信息和全局信息。
· 对于局部信息,多卷积核大小的CNN
+最大Pooling
用于提取。
· 对于全局信息,使用注意力机制进行提取。
· 最后可以将提取的局部信息和全局信息拼接在一起。
【注二】:CNN+Pooling、Attention是比较基础的文本分类领域知识。也比较常用这些技术。
Label Graph Attention Layer:这是GAT
模型的内容。将标签编码为图形结构。
标签-文本交互层:全局标签信息表示和文本上下文语义信息表示用于交互式注意力计算。
自适应融合层:将标签文本交互层的输出与融合局部和全局文本特征提取层的输出进行融合,然后进行分类。
【注三】:GAT模型比较抽象,论文地址:https://arxiv.org/pdf/1710.10903.pdf
文章出处登录后可见!
已经登录?立即刷新