数据分箱:Bin edges must be unique: index([0.15, 0.19, 0.19, 0.22, 17.35], dtype=’float64′, name=’LBXlHG”)You can drop duplicate edaes by settina the ‘duplicates’ kwara

20250513211750897-image

报错原因:

待分箱德变量值中存在重复的边界值,导致无法分段,如上图所示,0.19为边界值,但存在重复

解决方法:

可以使用等频率分箱,先将变量排序,然后使用等频分箱

20250513212053912-image

 

© 版权声明
THE END
喜欢就支持一下吧
点赞10 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容