何时使用 Word2vec 和词袋?

社会演员多 nlp 420

原文标题When to use Word2vec and bag of words?

我仍然不确定何时使用 word2vec 以及何时依赖词袋。例如,如果我想开发一个文本聚类模型,将文本作为输入并为每个输入输出一个聚类,我应该关心单词表示并使用 word2vec 还是应该依赖词袋并处理输入文本作为文档?请与我分享更多阅读和理解资源;我对文本预处理和聚类非常感兴趣,并想尽我所能学习。

此外,如果我想使用 k-Means 进行聚类,我应该拆分数据还是将整个数据合二为一?

原文链接:https://stackoverflow.com//questions/71672310/when-to-use-word2vec-and-bag-of-words

回复

我来回复
  • gojomo的头像
    gojomo 评论

    没有硬性规定。通常,对于您认为合理合适的任何一组技术,并且在您的技能/预算范围内,您可以针对您的特定数据和任务尝试所有这些技术,然后选择更好的技术。

    (随着时间的推移,您可能会对某些方法更可能反映您任务的“基本”部分的情况产生一些模糊的直觉 – 但它们只能在 StackOverflow 答案中传达所有可能性。)

    如果您尝试了特定的事情并且对结果感到惊讶或失望,这可能会产生一个更容易回答的问题,您可以在其中提供数据/任务的细节,以及您尝试过的内容以及结果是什么,以及询问特定的意外行为,或您想要纠正/改进的特定方面。

    1年前 0条评论