情绪分析:有没有办法在评论中提取正面和负面的方面?
原文标题 :Sentiment Analysis: Is there a way to extract positive and negative aspects in reviews?
目前,我正在做一个项目,我需要实时提取正面和负面评论中使用的相关方面。
对于更消极和更积极的概念,这将是一个词的上下文化问题。区分在否定语境中听起来是肯定的词(考虑讽刺)。
这是一个例子:非常好的欢迎!我们像在家一样吃传统菜肴,质量和数量都在预约中!!!*
积极方面:欢迎、传统菜肴、质量、数量
任何人都可以向我推荐一些关于这个主题的教程、论文或想法吗?
先感谢您。
回复
我来回复-
ewz93 评论
该回答已被采纳!
此任务称为基于方面的情感分析 (ABSA)。最流行的是 2014 年语义评估研讨会(任务 5)中指定的格式和数据集及其随后几年的更新版本。
历年模型效率概览:
https://paperswithcode.com/sota/aspect-based-sentiment-analysis-on-semeval
有关该主题的资源和存储库的良好来源(有些非常先进,但也有一些对初学者更友好的资源):
https://github.com/ZhengZixiang/ABSAPapers
仅根据我在本主题中的一般经验,一个非常强大的起点,不需要机器学习模型设计方面的高级知识,就是准备一个令牌分类格式的数据集(例如为 SemEval2014 任务提供的数据集)并使用它来微调预训练的变压器模型,例如 BERT、RoBERTa 或类似模型。查看任何关于如何对一个令牌分类模型进行微调的教程,比如在 huggingface 中的这个。他们通常使用流行的命名实体识别 (NER) 任务作为示例任务,但对于 ABSA 任务,您基本上做同样的事情,但使用其他标签和不同的数据集。
显然,更简单的方法是采用更多基于规则的方法,或者将基于规则的方法与训练有素的情绪分析模型/否定检测等相结合,但我认为通常使用基于规则的方法,您可以预期性能要差得多与使用最先进的模型作为变压器相比。
如果您想比仅仅微调预训练的 Transformer 模型更高级,请查看我提供的第二个和第三个链接,并查看一些专门为基于方面的情感分析设计的机器学习模型设计。
2年前