排序
数据分箱:Bin edges must be unique: index([0.15, 0.19, 0.19, 0.22, 17.35], dtype=’float64′, name=’LBXlHG”)You can drop duplicate edaes by settina the ‘duplicates’ kwara
报错原因:待分箱德变量值中存在重复的边界值,导致无法分段,如上图所示,0.19为边界值,但存在重复解决方法:可以使用等频率分箱,先将变量排序,然后使用等频分箱
Bin edges must be unique: Index([0.0, 0.0, 1.0, 1.0], dtype=’float64′, name=’age’).You can drop duplicate edges by setting the ‘duplicates’ kwarg。
【报错原因】 分箱变量和目标变量存在相同元素 【解决方法】 删除相同的元素再分箱