站点图标 AI技术聚合

pytorch中没有string数据类型的处理

Table of Contents

One-hot

  1. 使用one-hot编码对单词进行编码(适用于有限且少量词库的数据)
  2. one-hot对英文字母编码(仅26维向量)

Embedding

  1. word2vec
  2. glove

解决“i dislike”和“i like”之间单词相关性和类似中文汉字较多的数据问题

文章出处登录后可见!

已经登录?立即刷新
退出移动版