创建一个好的训练数据集的最佳方法是什么?
tensorflow 208
原文标题 :Best way to create a good training dataset?
我有一个带有文本输入和标签作为输出的训练数据集。目前大约有 50 种不同的标签。我想知道创建一个好的火车数据集的理想方法是什么。
我创建的当前训练数据集非常有偏差。例如。对于标签 1,大约有 200 个输入数据点,对于标签 13,只有 5 个输入数据点,因此输出受到影响。什么是创建的好方法一个健壮的模型?