排序
Lasso回归-生存状态:Non-positive event times encountered; not permitted for Cox family
错误原因:因变量生存状态、生存时间的值必须大于0,不能等于0或者小于0解决方法:用筛选样本或者过滤表格节点,去除因变量不符合要求的样本
出现应用程序未处理的异常:OutOfMemoryException / Out of memory
报错原因:内存溢出,内存不足解决方法:参考 https://bbs.statsape.com/q-and-a/540.html如果是调查设计相关的分析,慎用分类变量,否则容易出现内存溢出
SHAP:expected str, bytes or os.PathLike object, not NoneType
报错原因:shap分析节点的模型输入端口没有连接解决方法:连接shap分析的模型输入端口
多条件过滤表格:Can only use .str accessor with string values!
报错原因:表格中的字符串变量被python识别为其他类型,通常发生于True/False的识别,在python中这种变量通常判定为Bool型解决方法:按照以下的方式设置条件
数据任务器SE:Error in strsplit(pm$get para value(“positive”),”\s*”): non-character arqument
错误原因:参数未填完整,如下图所示,正类参数未填解决方法:将必要参数补充完整
为什么机器学习交叉验证/自助法的流程只有一个Test的分析结果
问题原因:在决策链1.0中,节点的循环控制机制还不完善,使用交叉验证/自助法的训练流程,不能一个一个节点运算,这样只能得到单次循环的分析结果解决方法:在第一次逐个节点运算,设置好节点参...
转换多变量标签编码:cannot assign to subscript here, Maybe you meant ‘==’ instead of ‘=’? (, line 1)
报错原因:命令的符号写错了,不是写“=”,是写“==”解决方法:把=换成==
多因素限制立方样条曲线:Error in `[.data.frame`(unique_cbind_dataframe, , xvar_data[i]) : 选择了未定义的列
错误原因:数据端口输入顺序与自变量选择顺序不一致解决方法:(1)重新连接数据端口,保持连接顺序与自变量选择选择顺序一致,如下图,如果多因素限制立方样条曲线节点选择的自变量顺序为Var2...
梯度提升-生存:could not convert string to float: ‘F’
报错原因:选择的自变量可能存在字符串类型,以上例子中F为字符串类型解决方法:(1)去除字符串类型变量(2)将字符串类型变量转换编码
数据分析基线描述:Error in data.frame(Var = c(var num, var cate),ld = c(continuous rowid.:◆◆◆ζ↔◆◆◆◆◆◆:14 15
报错原因:分组变量可能存在异常,确保每组的样本数足够,避免用连续型变量做分组解决方法(1)检查分组变量类型(2)替换分组变量
Error in gbm.fit(x = x, y = y, offset = offset, distribution = distribution, :The data set is too small or the subsampling rate is too large: nTrain * bag.fraction <= n.minobsinnode
【报错原因】 数据量太小或者Minnodesize太大 【解决方法】 增大数据量,或者输入小一点的minnodesize
多因素Cox回归:Error in seg.default(0, 1,length=g+1): “length.out’ must be a non-negative number.
报错原因:校准曲线计算失败,只能尝试调整校准曲线相关参数解决方法:(1)调整观测时间,确保观测时间内样本足够(2)调整分组数据,分组数据通常为3-5组,但不能少于3组(3)调整区间样本数...
Error in model.frame.default(Terms, newdata, na.action = na.action, xlev = object$xlevels) :因子loop_number里出现了新的层次2
【报错原因】 外部验证里的变量值和原始数据变量不一样 【解决方法】 更换变量
转换多变量标签编码:name ‘x’ is not defined
报错原因: 通常为写错变量名,如下图所示,只定义了x1和x2,“x”是一个没有定义的变量名 解决方法: 使用正确的变量名写命令,如上图的命令应该写成x1<=20 and x1>=3 此外,如下图所示...
Error in glmnet(x, y, family = “binomial”, alpha = 1, nlambda = lambda_values) :x has missing values; consider using makeX() to impute them
【报错原因】 选择变量里含有空缺值 【解决方法】 建议将变量的空缺值进行插补
数据任务器SE:Error. Task ‘classification’ has missing values in column(s) ‘Surgery,_duration’, but learner ‘classiflog regnot support this
报错原因:输入的特征变量存在缺失值解决方法:对存在缺失值的特征变量提前插补
Error in confusionMatrix,default(as.factor(y pred label)reference = as.factorly label): The data must contain some levels that overlap the reference…
【报错原因】 DCA绘图里:y_pred_label <- as.numeric(y_pred_score > thresh)cm <- confusionMatrix(as.factor(y_pred_label), reference = as.factor(y_label))$table 【解决方法】 ...
Errorin glm.fit(x= c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,:NA/NaN/lnf in ‘y’
报错原因:通常为因变量的数值存在非数值的样本解决方法:检查因变量的值是否合法,对应的分布类型是否正确,将因变量非数值的样本转换成数值
转换多变量标签编码:invalid syntax (<string>, line 1)
报错原因: (1)通常为条件未指定变量(逻辑符号或者运算符号前面缺少变量),此处应该为x1<=20 and x1>=3 如下图在*号前面没有变量,没有x1**x2的写法,必须是x1*x2*x3这种