情绪分析:有没有办法在评论中提取正面和负面的方面?

扎眼的阳光 nlp 192

原文标题Sentiment Analysis: Is there a way to extract positive and negative aspects in reviews?

目前,我正在做一个项目,我需要实时提取正面和负面评论中使用的相关方面。

对于更消极和更积极的概念,这将是一个词的上下文化问题。区分在否定语境中听起来是肯定的词(考虑讽刺)。

这是一个例子:非常好的欢迎!我们像在家一样吃传统菜肴,质量和数量都在预约中!!!*

积极方面:欢迎、传统菜肴、质量、数量

任何人都可以向我推荐一些关于这个主题的教程、论文或想法吗?

先感谢您。

原文链接:https://stackoverflow.com//questions/71439779/sentiment-analysis-is-there-a-way-to-extract-positive-and-negative-aspects-in-r

回复

我来回复
  • ewz93的头像
    ewz93 评论

    此任务称为基于方面的情感分析 (ABSA)。最流行的是 2014 年语义评估研讨会(任务 5)中指定的格式和数据集及其随后几年的更新版本。

    历年模型效率概览:

    https://paperswithcode.com/sota/aspect-based-sentiment-analysis-on-semeval

    有关该主题的资源和存储库的良好来源(有些非常先进,但也有一些对初学者更友好的资源):

    https://github.com/ZhengZixiang/ABSAPapers

    仅根据我在本主题中的一般经验,一个非常强大的起点,不需要机器学习模型设计方面的高级知识,就是准备一个令牌分类格式的数据集(例如为 SemEval2014 任务提供的数据集)并使用它来微调预训练的变压器模型,例如 BERT、RoBERTa 或类似模型。查看任何关于如何对一个令牌分类模型进行微调的教程,比如在 huggingface 中的这个。他们通常使用流行的命名实体识别 (NER) 任务作为示例任务,但对于 ABSA 任务,您基本上做同样的事情,但使用其他标签和不同的数据集。

    显然,更简单的方法是采用更多基于规则的方法,或者将基于规则的方法与训练有素的情绪分析模型/否定检测等相结合,但我认为通常使用基于规则的方法,您可以预期性能要差得多与使用最先进的模型作为变压器相比。

    如果您想比仅仅微调预训练的 Transformer 模型更高级,请查看我提供的第二个和第三个链接,并查看一些专门为基于方面的情感分析设计的机器学习模型设计。

    2年前 0条评论