排序
调查设计秩和检验:Error in if (length(unique ind) == 2 || !is.na(model[“estimate”]][[“difference in mean rank score”])) {:missing value where TRUE/FALSE needed
错误原因:(1)分组变量异常,可能不存在这个变量(2)统计模型拟合失败,无法得到统计值解决方法:(1)重新拖一个节点后把参数重新设置一遍(2)选择方法参数,切换其他统计模型方法(3)修...
Lapack routine dgesv: system is exactly singular: U[1,1]= 0
错误原因: 算法在计算过程中产生了奇异矩阵,导致无法计算,是参数,变量组合导致算法无法成功执行,可能的原因很多,例如变量间存在共线性很高的变量,样本量不足、用了分布类型非法的变量等...
转换变量类型:变量XXX类型转换失败,could not convert string to float: XXXX
错误原因:待转换类型的变量存在字符串,如图所示“<10.00”为字符串,字符串无法转换为数值,即无法转为连续型解决方法:(1)删除有字符串的行(2)把字符串的单元格修改成数值或者NA
COX回归PH检验:Error in gzfile(file,”rb”): cannot open the connection
错误原因:节点连接错误,只能连接在多因素COX回归后面解决方法:使用多因素COX回归连接这个节点
Error in eval(family$initialize) : y值必需满足0 <= y <= 1
【报错原因】 变量选择有问题,不可以是字符串,必须是0和1的二分类变量 【解决方法】 更换因变量,把因变量转为0,1二分类
预测器SE:Error: Measure ’classif.acc‘ incompatible with task type ‘sury‘
错误原因: 机器学习生存模型没有ACC的评估方法,只有分类模型才有 解决方法: 修改模型类型,以及评估方法
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配
分类预测:‘DecisionTreeRegressor’ object has no attribute ‘predict proba’
错误原因:回归模型不能使用分类预测解决方法:把分类预测节点改成回归预测节点
3 nodes produced errors;, first error: matrix multiplication: incompatible matrix dimensions:5595×2 and 4×1
【报错原因】 模型不拟合 【解决方法】 换变量,数据,模型数量
Error in gbmt::gbmt(x.names = var_independent, unit = var_dependent, time = var_time, :Unit ‘5’ has duplicated time points
【报错原因】 数据问题,有重复值 【解决方法】 更换数据或变量
Error in ifelse(decision_type %in% c(“>=”, “>”), ret.second(split_index), :Unknown decision_type
【报错原因】 对于lightgbm 数据存在数值类别,变成字符类别 【解决方法】 https://github.com/ModelOriented/treeshap/issues/28
Error: You should have at least two distinct break values. Value cannot be null. (Parameter ‘s’)
【报错原因】模型拟合问题【解决方法】更换模型或变量
Error in gbm.unify(model, data):Models built on data with categorical features are not supported – please encode them before training.
【报错原因】 类别数据需要encode 【解决方法】 前面链接 独热编码+标签转换编码+转换变量类型 进行encode
Error in confusionMatrix,default(as.factor(y pred label)reference = as.factorly label): The data must contain some levels that overlap the reference…
【报错原因】 DCA绘图里:y_pred_label <- as.numeric(y_pred_score > thresh)cm <- confusionMatrix(as.factor(y_pred_label), reference = as.factor(y_label))$table 【解决方法】 ...
Error in gbm.fit(x = x, y = y, offset = offset, distribution = distribution, :The data set is too small or the subsampling rate is too large: nTrain * bag.fraction <= n.minobsinnode
【报错原因】 数据量太小或者Minnodesize太大 【解决方法】 增大数据量,或者输入小一点的minnodesize
Error in ranger::ranger(dependent.variable.name = task$target_names, data = task$data(), :User interrupt or internal error.
【解决方法】 增大内存或者减少参数搜索空间mtry不能大于特征数量
Error in imputeTS::na_ma(v, k = k, weighting = “linear”) :At least 2 non-NA data points required in the time series to apply na_ma.
【报错原因】 ID id筛选之后数据没了 【解决方法】 更换数据或变量
Eror in fiter(X,Y,ofset = ofs,penalty,.matix = penalty.matrix,: NA/NaN/nfin foreign functiocall (arg 1).
【报错原因】 数据问题,数据量太少,概率一致,算不出来 【解决方法】 增加预测数据,或者repeat