数据分箱共4篇
数据分箱:Bin edges must be unique: index([0.15, 0.19, 0.19, 0.22, 17.35], dtype='float64', name='LBXlHG

数据分箱:Bin edges must be unique: index([0.15, 0.19, 0.19, 0.22, 17.35], dtype=’float64′, name=’LBXlHG”)You can drop duplicate edaes by settina the ‘duplicates’ kwara

报错原因:待分箱德变量值中存在重复的边界值,导致无法分段,如上图所示,0.19为边界值,但存在重复解决方法:可以使用等频率分箱,先将变量排序,然后使用等频分箱 
空鱼O的头像-决策链社区论坛空鱼O21天前
07010
Bin edges must be unique: Index([0.0, 0.0, 1.0, 1.0], dtype='float64', name='age').You can drop duplicate edges by setting the 'duplicates' kwarg。-决策链社区论坛

Bin edges must be unique: Index([0.0, 0.0, 1.0, 1.0], dtype=’float64′, name=’age’).You can drop duplicate edges by setting the ‘duplicates’ kwarg。

【报错原因】 分箱变量和目标变量存在相同元素 【解决方法】 删除相同的元素再分箱
里里里里卡42的头像-决策链社区论坛里里里里卡421个月前
07912
分类、分箱常用方法-决策链社区论坛

分类、分箱常用方法

在决策链里面,对连续变量进行分类、分箱常用以下方法(1)分箱节点(2)多变量转换标签编码如图所示,把beerneg变量<=20的值转成第1组,>20的值转成第2组  
空鱼O的头像-决策链社区论坛空鱼O1个月前
015611
数据分箱:unsupperted operand type(s) for -:'str' and 'str'-决策链社区论坛

数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’

报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
空鱼O的头像-决策链社区论坛空鱼O1个月前
0687