何时使用 Word2vec 和词袋?
nlp 420
原文标题 :When to use Word2vec and bag of words?
我仍然不确定何时使用 word2vec 以及何时依赖词袋。例如,如果我想开发一个文本聚类模型,将文本作为输入并为每个输入输出一个聚类,我应该关心单词表示并使用 word2vec 还是应该依赖词袋并处理输入文本作为文档?请与我分享更多阅读和理解资源;我对文本预处理和聚类非常感兴趣,并想尽我所能学习。
此外,如果我想使用 k-Means 进行聚类,我应该拆分数据还是将整个数据合二为一?