在大多数回归分析,如线性回归,逻辑回归等分析中,分类变量往往需要指定一个参照因子(ref)进行分析,例如性别Gender的元素包含male和female,在通常情况下female往往会被作为ref处理,如果想要修改male为参照因子,则可能需要对数据提前进行一些处理。
修改分类变量参照因子的方法:
(1)有些算法/功能节点携带了相关的参数
(2)如果节点没有修改参照因子的参数,则可以通过修改分类变量的编码来实现
算法取参照因子往往是按照数字或者字母默认的顺序来取的,
如果分类因子为2,4,6,7,则参照因子默认为2
如果分类因子为a,c,f,e,则默认参照因子为a
因此,对于Gender,它的分类有male和female,默认参照因子为female。
如果想修改参照因子为male,则可以用多变量转换标签编码把female转为1,把male转为0,则在回归分析中会默认将0(即male)作为参照因子
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容