多分类逻辑回归:Error in MASS:polr(as.formula(fml), weights = WD[, var weight], data = WD, :attempt to find suitable starting values failed
报错原因:因变量应该为数值,而不能是字符串解决方法:将因变量转编码为数值
调查设计秩和检验:Error in if (length(unique ind) == 2 || !is.na(model[“estimate”]][[“difference in mean rank score”])) {:missing value where TRUE/FALSE needed
错误原因:(1)分组变量异常,可能不存在这个变量(2)统计模型拟合失败,无法得到统计值解决方法:(1)重新拖一个节点后把参数重新设置一遍(2)选择方法参数,切换其他统计模型方法(3)修...
数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’
报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
计算时间间隔:time data “2020-10-20” doesn’t match format “%Y-%m-%d %H:%M:%S”, at position 4. You might want to try:
错误原因:日期格式不匹配,如下图所示,待计算的两个日期变量的值,存在格式为Year-Month-Day H:M:S的行,则计算时间间隔的时候,必须选择Year-Month-Day H:M:S的格式解决方法:如下图所示,修...
聚类热图:only defined on a data frame with all numeric-alike variables
报错原因:选择分析的变量中存在个别非数值变量解决方法:删除这些非数值的变量
在回归分析中,如何修改分类变量的参照因子
在大多数回归分析,如线性回归,逻辑回归等分析中,分类变量往往需要指定一个参照因子(ref)进行分析,例如性别Gender的元素包含male和female,在通常情况下female往往会被作为ref处理,如果想...
转换多变量标签编码:invalid syntax (<string>, line 1)
报错原因: (1)通常为条件未指定变量(逻辑符号或者运算符号前面缺少变量),此处应该为x1<=20 and x1>=3 如下图在*号前面没有变量,没有x1**x2的写法,必须是x1*x2*x3这种
转换多变量标签编码:cannot assign to subscript here, Maybe you meant ‘==’ instead of ‘=’? (, line 1)
报错原因:命令的符号写错了,不是写“=”,是写“==”解决方法:把=换成==
如何去除变量存在NA或者inf的样本
变量中的NA或者inf是无法参与计算的,通常需要在执行统计分析前将这些样本删除。 去除NA样本的方法: (1)筛选行空值的节点 (2)多条件过滤表格,使用notnull()的方法 删除inf样本 (1)筛选i...
Lapack routine dgesv: system is exactly singular: U[1,1]= 0
错误原因: 算法在计算过程中产生了奇异矩阵,导致无法计算,是参数,变量组合导致算法无法成功执行,可能的原因很多,例如变量间存在共线性很高的变量,样本量不足、用了分布类型非法的变量等...
转换多变量标签编码:invalid syntax. Perhaps you forgot a comma? (, line 1)
报错原因:通常为逻辑连接符未加空格,此处应该写为x1<=20 and x2>=3
分类预测:‘DecisionTreeRegressor’ object has no attribute ‘predict proba’
错误原因:回归模型不能使用分类预测解决方法:把分类预测节点改成回归预测节点
筛选样本:根据输入的列名没有找到匹配的规范变量名
报错原因:筛选样本选在的变量名在上游节点输出的数据中找不到。该错误常常发生在修改现呈的工程,没有根据上游的输出变量去重新修改下游节点的变量参数解决方法:把报错节点的变量参数重新设置...
环境缺失:Error in library(XXXXX)
报错原因:当看到有Error in library()这个错误的时候,说明有个别的R包环境缺失解决方法:(1)自行安装补充环境点程序-R终端打开R终端,输入install.packages('XXX')安装环境,缺什么包就写什...
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配
如何插补变量中的空值NA
变量中的NA即空值是无法参与计算的,在计算前建议先对NA值进行处理,对NA进行插补是常用的方法在决策链中有以下方法对NA进行插补:(1)空值插补节点,提供了多种方法(2)批量空值插补节点,在...
Error in readRDS(model URl port) : ‘file’◆◆◆◆◆◆◆
错误原因:模型端口没有连接,灰色端口都是模型端口,带有模型端口的节点都可能出现这类错误.鼠标悬停端口上能看到输入输出的数据类型解决方法:连接灰色端口
预测器SE:Error: Measure ’classif.acc‘ incompatible with task type ‘sury‘
错误原因: 机器学习生存模型没有ACC的评估方法,只有分类模型才有 解决方法: 修改模型类型,以及评估方法
Error in paste(self$Code, self$ld, sep = ” “):cannot get ALTSTRING ELT during GC
报错原因:R语言自动清理内存失效解决方法:保存工程后重开软件
None of the stratifying variables have 2+ valid levels
分类自变量存在常量或者局部常量,应该删掉 存在常量得情况: (1)常量:只有一个值,没有变化的量,如下图的Var1 (2)局部常量,无法直接判断,但划分分组后能够发现,如下图的Var2  ...
Error in ifelse(decision_type %in% c(“>=”, “>”), ret.second(split_index), : Unknown decision_type
【报错原因】尽管 LightGBM 模型支持直接处理分类变量,但是在后续节点中 TREESHAP 计算 LightGBM 模型的 SHAP 值时分类变量是存在一些问题的。【解决方法】对分类变量进行独热编码,然后再次运...
转换多变量标签编码:’<=' not supported between instances of 'str' and 'int'
报错原因:使用“>=”,'<=','==','>','<'等数学逻辑符号判断目标变量时,要求目标变量的值全部都为数值如图对Var2进行数学逻辑判断但是Var2的值中存在abc这个字符串,因此Var2这个...
COX回归PH检验:Error in gzfile(file,”rb”): cannot open the connection
错误原因:节点连接错误,只能连接在多因素COX回归后面解决方法:使用多因素COX回归连接这个节点
Errorin glm.fit(x= c(1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,:NA/NaN/lnf in ‘y’
报错原因:通常为因变量的数值存在非数值的样本解决方法:检查因变量的值是否合法,对应的分布类型是否正确,将因变量非数值的样本转换成数值
报错信息:Merge keys are not unique in left dataset, not a one-to-many merge
通常为左表的Key存在重复,应该使用m:m(多对多)的方法连接
孟德尔随机化分析如何把Beta值转成OR值
在孟德尔随机化分析中,通常使用Beta作为效应值,如果需要讲Beta转换被OR,则参考以下的计算公式OR = exp(Beta)Beta = ln(OR)CI置信区间:OR_lower = exp(Beta_lower)OR_upper = exp(Beta_upper...
孟德尔随机化分析如何增加样本的交集工具变量数
在孟德尔随机化分析中,获取样本间的交集工具变量是前提,如果交集工具变量数量过少甚至没有,则都无法成功执行后续的分析。增加交集工具变量的方法有:(1)扩大暴露样本SNP的P值,即扩大显著...