多项选择题
在分类问题中,我们经常会遇到正负样本数据量不等的情况,比如正样本为10w条数据,负样本只有1w条数据,以下最合适的处理方法是()?
A.将负样本重复10次,生成10w样本量,打乱顺序参与分类 B.直接进行分类,可以最大限度利用数据 C.从10w正样本中随机抽取1w参与分类 D.将负样本每个权重设置为10,正样本权重为1,参与训练过程
多项选择题 在统计模式识分类问题中,当先验概率未知时,可以使用()?
多项选择题 在整个随机森林的算法过程中,以下哪两个随机过程可使随机森林很大程度上避免了过拟合现象的出现?()
多项选择题 假定某同学使用Naive Bayesian(NB)分类模型时,不小心将训练数据的两个维度搞重复了,那么关于NB的说法中正确的是?()