为什么有些看起来是数值的分类/字符串变量无转成连续型continue
如图,以下有三个变量Var1,Var2,Var3,看起来都是数值的分类变量,应该能够把他们转成连续的 尝试使用转换变量类型的节点把Var2和Var3转成连续的 结果只有Var3转换成功了 这是因为Var2变量的...
ROC操作特征曲线: More than one “best” threshold was found, aborting. Change ‘best.policy’ to alter this behavior
ROC操作特征曲线显示以上错误原因:算法在搜素ROC操作特征曲线的最佳阈值的时候。发现有多个最佳阈值,因此建议我们修改最佳阈值的规则解决方法:直接才参数界面修改最佳阈值的选择方法
数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’
报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
转换多变量标签编码:invalid syntax (<string>, line 1)
报错原因: (1)通常为条件未指定变量(逻辑符号或者运算符号前面缺少变量),此处应该为x1<=20 and x1>=3 如下图在*号前面没有变量,没有x1**x2的写法,必须是x1*x2*x3这种
转换多变量标签编码:invalid syntax. Perhaps you forgot a comma? (, line 1)
报错原因:通常为逻辑连接符未加空格,此处应该写为x1<=20 and x2>=3
转换多变量标签编码:name ‘x’ is not defined
报错原因: 通常为写错变量名,如下图所示,只定义了x1和x2,“x”是一个没有定义的变量名 解决方法: 使用正确的变量名写命令,如上图的命令应该写成x1<=20 and x1>=3 此外,如下图所示...
Error in paste(self$Code, self$ld, sep = ” “):cannot get ALTSTRING ELT during GC
报错原因:R语言自动清理内存失效解决方法:保存工程后重开软件
Errorin glm.fit(x= c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,:NA/NaN/lnf in ‘y’
报错原因:通常为因变量的数值存在非数值的样本解决方法:检查因变量的值是否合法,对应的分布类型是否正确,将因变量非数值的样本转换成数值
Error: cannot allocate vector of size XXXXXX Kb/Mb
报错原因:内存不足解决方法:(1)减少变量或者样本(2)关闭其他空闲软件(3)加内存
转换多变量标签编码:invalid character’‘'(U+2018)(<string>,line 1)
错误原因:使用中文符号编写命令,如下图,这种单引号为中文字符解决方法:改成英文字符的符号
Permission denied: ‘XXXXXXXX/run logic coef.tsv’.
错误原因: 看到“Permission denied”这个提示就是计算机的文件没有读写权限 自己用其他软件(Excel,记事本等)把分析结果的文件打开导致决策链无法访问。真是一种低级的错误,自己的计算机权...
Lasso回归-生存状态:Non-positive event times encountered; not permitted for Cox family
错误原因:因变量生存状态、生存时间的值必须大于0,不能等于0或者小于0解决方法:用筛选样本或者过滤表格节点,去除因变量不符合要求的样本
计算时间间隔:time data “2020-10-20” doesn’t match format “%Y-%m-%d %H:%M:%S”, at position 4. You might want to try:
错误原因:日期格式不匹配,如下图所示,待计算的两个日期变量的值,存在格式为Year-Month-Day H:M:S的行,则计算时间间隔的时候,必须选择Year-Month-Day H:M:S的格式解决方法:如下图所示,修...
转换多变量标签编码:cannot assign to subscript here, Maybe you meant ‘==’ instead of ‘=’? (, line 1)
报错原因:命令的符号写错了,不是写“=”,是写“==”解决方法:把=换成==
分类预测:‘DecisionTreeRegressor’ object has no attribute ‘predict proba’
错误原因:回归模型不能使用分类预测解决方法:把分类预测节点改成回归预测节点
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配
预测器SE:Error: Measure ’classif.acc‘ incompatible with task type ‘sury‘
错误原因: 机器学习生存模型没有ACC的评估方法,只有分类模型才有 解决方法: 修改模型类型,以及评估方法
COX回归PH检验:Error in gzfile(file,”rb”): cannot open the connection
错误原因:节点连接错误,只能连接在多因素COX回归后面解决方法:使用多因素COX回归连接这个节点
没有模板如何知道节点的连接方法?
在决策链中,每个节点都有输入和输出的端口以传递数据分析的数据流,很多时候,即使没有模板流程,同样可以实现正确的连接(1)查看分析节点的输入端口信息,鼠标悬停在输入端口,查看端口数据...
孟德尔随机化分析如何把Beta值转成OR值
在孟德尔随机化分析中,通常使用Beta作为效应值,如果需要讲Beta转换被OR,则参考以下的计算公式OR = exp(Beta)Beta = ln(OR)CI置信区间:OR_lower = exp(Beta_lower)OR_upper = exp(Beta_upper...
导入数据:’utf-8′ codec can’t decode byte 0xa1 in position 10971: invalid start byte
报错原因: 文件编码不是windows系统默认的,常常是因为Excel导出文件的时候选错了导出编码类型 解决方法: (1)Excel导出表格的时候选择正确的导出形式,避免选择CSV UTF-8 (2)如果方法一处...
聚合表格:JAVA GATEWAY_EXITED] Java gateway process exited before sending its port numbe
报错原因:用错节点了,未分组目录内的节点都是还无法正常使用的节点解决方法:更换节点,选择行聚合目录的节点
转换多变量标签编码:invalid entry 0 in condlist: should be boolean ndarray
报错原因:编写变量字符串识别的命令时,忽略了变量存在NA的情况,通常发生于str.contains()等方法解决方法:增加一个参数 ”na=False“ 帮助函数识别NA,x1.str.contains('ABC',na=False)
在回归分析中,如何修改分类变量的参照/参考/ref因子
在大多数回归分析,如线性回归,逻辑回归等分析中,分类变量往往需要指定一个参照因子(ref)进行分析,例如性别Gender的元素包含male和female,在通常情况下female往往会被作为ref处理,如果想...
Lapack routine dgesv: system is exactly singular: U[1,1]= 0
错误原因: 算法在计算过程中产生了奇异矩阵,导致无法计算,是参数,变量组合导致算法无法成功执行,可能的原因很多,例如变量间存在共线性很高的变量,样本量不足、用了分布类型非法的变量等...
环境缺失:Error in library(XXXXX)
报错原因:当看到有Error in library()这个错误的时候,说明有个别的R包环境缺失解决方法:(1)自行安装补充环境点程序-R终端打开R终端,输入install.packages('XXX')安装环境,缺什么包就写什...
Error in readRDS(model URl port) : ‘file’◆◆◆◆◆◆◆
错误原因:模型端口没有连接,灰色端口都是模型端口,带有模型端口的节点都可能出现这类错误.鼠标悬停端口上能看到输入输出的数据类型解决方法:连接灰色端口
Error in ifelse(decision_type %in% c(“>=”, “>”), ret.second(split_index), : Unknown decision_type
【报错原因】尽管 LightGBM 模型支持直接处理分类变量,但是在后续节点中 TREESHAP 计算 LightGBM 模型的 SHAP 值时分类变量是存在一些问题的。【解决方法】对分类变量进行独热编码,然后再次运...