排序
转换多变量标签编码:name ‘x’ is not defined
报错原因: 通常为写错变量名,如下图所示,只定义了x1和x2,“x”是一个没有定义的变量名 解决方法: 使用正确的变量名写命令,如上图的命令应该写成x1<=20 and x1>=3 此外,如下图所示...
转换变量类型:变量XXX类型转换失败,could not convert string to float: XXXX
错误原因:待转换类型的变量存在字符串,如图所示“<10.00”为字符串,字符串无法转换为数值,即无法转为连续型解决方法:(1)删除有字符串的行(2)把字符串的单元格修改成数值或者NA
Error in mediation::mediate(model_med, model_total, treat = var_treatment, :weights on outcome and mediator models not identical请检查表格变量类型是否符需要转换,变量值是否需要插补空值,变量名是否存在非法字符!
【报错原因】 当上游节点包含调查设计cox回归节点时,需要注意回归类型必须选择生存回归模型 【解决方法】 回归类型参数换成生存回归模型
数据连接:Merge keys are not unique in either left or right dataset; not a one-to-one merge
报错原因:左表或者右表存在重复的id解决方法:(1)把匹配模式替换为1:m或者m:m(2)把左右表id去重复
None of the stratifying variables have 2+ valid levels
分类自变量存在常量或者局部常量,应该删掉 存在常量得情况: (1)常量:只有一个值,没有变化的量,如下图的Var1 (2)局部常量,无法直接判断,但划分分组后能够发现,如下图的Var2  ...
Error in ifelse(decision_type %in% c(“>=”, “>”), ret.second(split_index), :Unknown decision_type
【报错原因】 对于lightgbm 数据存在数值类别,变成字符类别 【解决方法】 https://github.com/ModelOriented/treeshap/issues/28
分析单元“143.Lasso回归-二项式 Plus”运算出错,请检查.Error in if (series types datafarmestypelseries types datafarmesvar == :arqument is of length zero请检查表格变量类型是否符需要转换,变量值是否需要插补空值,变量名是否存在非法字符!
【报错原因】 变量名有非法字符 【解决方法】 修改变量名,去除非法字符,和数字开头的变量名
运算因错误中止,原因:Error in mediation::mediate(model_med, model_total, treat = var_treatment, :weights on outcome and mediator models not identical
【报错原因】 中介模型和全模型的'权重'变量必须保持一致(存在/不存在) 【解决方法】 增加权重值或者删掉权重值
Error in coxph(formula = Surv(Survival_time, vital_status) ~ FOXD2.AS1 + :an id statement is required for multi-state models
【报错原因】 生存状态、生存时间不是连续型变量 【解决方法】 需要添加变量类型转换节点
Error in binom.test(sum(mydata1[, var_input[i]] < mydata2[, var_input[i]]), :'n'必需是大于等于'x'的正整数
【报错原因】 需要配对分组变量 【解决方法】 建议更换分组变量
Error in glm.fit(x= c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,:NA/NaN/lnf in ‘y’
报错原因:通常为因变量的数值存在非数值的样本解决方法:检查因变量的值是否合法,对应的分布类型是否正确,将因变量非数值的样本转换成数值
为什么有些看起来是数值的分类/字符串变量无转成连续型continue
如图,以下有三个变量Var1,Var2,Var3,看起来都是数值的分类变量,应该能够把他们转成连续的 尝试使用转换变量类型的节点把Var2和Var3转成连续的 结果只有Var3转换成功了 这是因为Var2变量的...
Error in .observed[i, ] <- c(.km1.timept, .ll1.timept, .ul1.timept) :replacement has length zero。
【报错原因】 数据问题 【解决方法】 更换数据或变量
NHANES读取Alpha:E:\NHANES\NHANESW2007-2008\Examination\bmx e.xpt表中缺少SEQN列!不能和其他表进行联合查询,你可以尝试单是名独提取此数据集。
报错原因:(1)勾选了“是否转换变量代码为变量描述信息”的参数,导致表格的SEQN变量名被改变,因此无法进行数据连接(2)所读取的表格本身不存在SEQN这一列,因此无法进行数据连接解决方法:...
限制性立方样条:Error in data.frame(Threshoid = thre p, Threshold Cl lower = ci num[[“normal”]][2],
错误原因:置信区间无法求出解决方法:曲线置信区间的计算
单因素亚组COX回归:Error in rowSums(fit$influencel, 1:3]): X◆◆◆◆◆◆◆y◆◆◆◆◆◆α◆◆◆。
报错原因:变量组合的模型拟合失败,模型中间数据缺失解决方法:(1)修改变量组合(2)增删一些样本(3)修改方法或者参数
转换多变量标签编码:invalid syntax. Perhaps you forgot a comma? (, line 1)
报错原因: (1)通常为逻辑连接符未加空格,此处应该写为x1<=20 and x2>=3 (2)字符串输入错误,入下图所示,55-59 years是一个字符串,应该写成x2=='55-59 years'
转换多变量标签编码:invalid entry 0 in condlist: should be boolean ndarray
报错原因:编写变量字符串识别的命令时,忽略了变量存在NA的情况,通常发生于str.contains()等方法解决方法:增加一个参数 ”na=False“ 帮助函数识别NA,x1.str.contains('ABC',na=False)
Error in confusionMatrix.default(as.factor(y_pred_label), reference = as.factor(y_label)) : The data contain levels not found in the data.
【报错原因】DCA绘图暂时只支持标签是0和1的数据。【解决方法】在完成模型训练和测试集预测之后,连接高级变量运算节点,将真实标签和预测标签(modelPred)转换为 0 和 1 的形式。
筛选样本:根据输入的列名没有找到匹配的规范变量名
报错原因:筛选样本选在的变量名在上游节点输出的数据中找不到。该错误常常发生在修改现呈的工程,没有根据上游的输出变量去重新修改下游节点的变量参数解决方法:把报错节点的变量参数重新设置...
数据分箱:Bin edges must be unique: index([0.15, 0.19, 0.19, 0.22, 17.35], dtype=’float64′, name=’LBXlHG”)You can drop duplicate edaes by settina the ‘duplicates’ kwara
报错原因:待分箱德变量值中存在重复的边界值,导致无法分段,如上图所示,0.19为边界值,但存在重复解决方法:可以使用等频率分箱,先将变量排序,然后使用等频分箱
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配
Bin edges must be unique: Index([0.0, 0.0, 1.0, 1.0], dtype=’float64′, name=’age’).You can drop duplicate edges by setting the ‘duplicates’ kwarg。
【报错原因】 分箱变量和目标变量存在相同元素 【解决方法】 删除相同的元素再分箱