None of the stratifying variables have 2+ valid levels
分类自变量存在常量或者局部常量,应该删掉 存在常量得情况: (1)常量:只有一个值,没有变化的量,如下图的Var1 (2)局部常量,无法直接判断,但划分分组后能够发现,如下图的Var2  ...
转换多变量标签编码:’<=' not supported between instances of 'str' and 'int'
报错原因:使用“>=”,'<=','==','>','<'等数学逻辑符号判断目标变量时,要求目标变量的值全部都为数值如图对Var2进行数学逻辑判断但是Var2的值中存在abc这个字符串,因此Var2这个...
报错信息:Merge keys are not unique in left dataset, not a one-to-many merge
通常为左表的Key存在重复,应该使用m:m(多对多)的方法连接
转换多变量标签编码:unterminated string literal (detected at line 1) (, line 1)
报错原因:编写的命令中,字符串的索引符号有误,不能写中文符号,应该用英文符号
数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’
报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
环境缺失:Error in library(XXXXX)
报错原因:当看到有Error in library()这个错误的时候,说明有个别的R包环境缺失解决方法:(1)自行安装补充环境点程序-R终端打开R终端,输入install.packages('XXX')安装环境,缺什么包就写什...
如何插补变量中的空值NA
变量中的NA即空值是无法参与计算的,在计算前建议先对NA值进行处理,对NA进行插补是常用的方法在决策链中有以下方法对NA进行插补:(1)空值插补节点,提供了多种方法(2)批量空值插补节点,在...
没有模板如何知道节点的连接方法?
在决策链中,每个节点都有输入和输出的端口以传递数据分析的数据流,很多时候,即使没有模板流程,同样可以实现正确的连接(1)查看分析节点的输入端口信息,鼠标悬停在输入端口,查看端口数据...
多分类逻辑回归:Error in MASS:polr(as.formula(fml), weights = WD[, var weight], data = WD, :attempt to find suitable starting values failed
报错原因:因变量应该为数值,而不能是字符串解决方法:将因变量转编码为数值
在回归分析中,如何修改分类变量的参照因子
在大多数回归分析,如线性回归,逻辑回归等分析中,分类变量往往需要指定一个参照因子(ref)进行分析,例如性别Gender的元素包含male和female,在通常情况下female往往会被作为ref处理,如果想...
Lapack routine dgesv: system is exactly singular: U[1,1]= 0
错误原因: 算法在计算过程中产生了奇异矩阵,导致无法计算,是参数,变量组合导致算法无法成功执行,可能的原因很多,例如变量间存在共线性很高的变量,样本量不足、用了分布类型非法的变量等...
分类预测:‘DecisionTreeRegressor’ object has no attribute ‘predict proba’
错误原因:回归模型不能使用分类预测解决方法:把分类预测节点改成回归预测节点
转换变量类型:变量XXX类型转换失败,could not convert string to float: XXXX
错误原因:待转换类型的变量存在字符串,如图所示“<10.00”为字符串,字符串无法转换为数值,即无法转为连续型解决方法:(1)删除有字符串的行(2)把字符串的单元格修改成数值或者NA
聚合表格:JAVA GATEWAY_EXITED] Java gateway process exited before sending its port numbe
报错原因:用错节点了,未分组目录内的节点都是还无法正常使用的节点解决方法:更换节点,选择行聚合目录的节点
聚类热图:only defined on a data frame with all numeric-alike variables
报错原因:选择分析的变量中存在个别非数值变量解决方法:删除这些非数值的变量
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配
Error in ifelse(decision_type %in% c(“>=”, “>”), ret.second(split_index), : Unknown decision_type
【报错原因】尽管 LightGBM 模型支持直接处理分类变量,但是在后续节点中 TREESHAP 计算 LightGBM 模型的 SHAP 值时分类变量是存在一些问题的。【解决方法】对分类变量进行独热编码,然后再次运...