◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
合理增加学习数据
当机器学习训练数据量不足时,如何尽可能合理地增加数据是一个常见的难题。
一种方法是重采样,即直接复制现有数据。此外,过采样可以创建新数据,如 SMOTE 算法和数据增强技术。
然而,需要注意的是,并不是所有数据删除操作都是有益的。例如,将 NUM1 中的一个 A 删除可能不会显着改善数据集,因为重采样也会生成相同的数据。
一个更有效的方法是创建真正的新数据,但要注意以下几点:
欲了解更多信息,请参阅有关处理不平衡数据集的博客:https://www.cnblogs.com/wuliytTaotao/p/9308944.html。
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。