科技
教育
生活
旅游
时尚
美容
美食
健康
体育
游戏
汽车
元宇宙
家电
财经
综合
变量分箱的好处包括【点击查看详情】
1、降低异常值的影响,增加模型的稳定性:数据中存在异常值时,会使模型产生一定的偏差,从而影响预测效果,通过分箱方法可以降低异常值的噪声特性,使模型更稳健。2、缺失值作为特殊变量参与分箱,减少缺失值填补的不确定性:由于录入、操作失误或数据存储问题导致训练数据出现缺失值,而大部分机器学习模型都是无法处理缺失值的,树模型可以处理缺失值,但对实际有缺失值的变量不会起很大作用。
相关视频/文章
动视 51dongshi.net 版权所有
Copyright © 2019-2022