导入数据:’utf-8′ codec can’t decode byte 0xa1 in position 10971: invalid start byte
报错原因: 文件编码不是windows系统默认的,常常是因为Excel导出文件的时候选错了导出编码类型 解决方法: (1)Excel导出表格的时候选择正确的导出形式,避免选择CSV UTF-8 (2)如果方法一处...
为什么有些看起来是数值的分类/字符串变量无转成连续型continue
如图,以下有三个变量Var1,Var2,Var3,看起来都是数值的分类变量,应该能够把他们转成连续的 尝试使用转换变量类型的节点把Var2和Var3转成连续的 结果只有Var3转换成功了 这是因为Var2变量的...
转换多变量标签编码:invalid character’‘'(U+2018)(<string>,line 1)
错误原因:使用中文符号编写命令,如下图,这种单引号为中文字符解决方法:改成英文字符的符号
潜类别混合增长模型:Error in gridsearch(rep=50,maxiter=10,minit = model, hlme(as.formula(fml),: The model minit did not converge.
错误原因:数据,变量组合无法拟合,可参考:https://cecileproust-lima.github.io/lcmm/articles/usual_problems.html解决方法:可以尝试换参数,换变量
转换变量类型:变量XXX类型转换失败,could not convert string to float: XXXX
错误原因:待转换类型的变量存在字符串,如图所示“<10.00”为字符串,字符串无法转换为数值,即无法转为连续型解决方法:(1)删除有字符串的行(2)把字符串的单元格修改成数值或者NA
聚合表格:JAVA GATEWAY_EXITED] Java gateway process exited before sending its port numbe
报错原因:用错节点了,未分组目录内的节点都是还无法正常使用的节点解决方法:更换节点,选择行聚合目录的节点
Permission denied: ‘XXXXXXXX/run logic coef.tsv’.
错误原因: 看到“Permission denied”这个提示就是计算机的文件没有读写权限 自己用其他软件(Excel,记事本等)把分析结果的文件打开导致决策链无法访问。真是一种低级的错误,自己的计算机权...
转换多变量标签编码:unterminated string literal (detected at line 1) (, line 1)
报错原因:编写的命令中,字符串的索引符号有误,不能写中文符号,应该用英文符号
转换多变量标签编码:invalid entry 0 in condlist: should be boolean ndarray
报错原因:编写变量字符串识别的命令时,忽略了变量存在NA的情况,通常发生于str.contains()等方法解决方法:增加一个参数 ”na=False“ 帮助函数识别NA,x1.str.contains('ABC',na=False)
ROC操作特征曲线: More than one “best” threshold was found, aborting. Change ‘best.policy’ to alter this behavior
ROC操作特征曲线显示以上错误原因:算法在搜素ROC操作特征曲线的最佳阈值的时候。发现有多个最佳阈值,因此建议我们修改最佳阈值的规则解决方法:直接才参数界面修改最佳阈值的选择方法
Lasso回归-生存状态:Non-positive event times encountered; not permitted for Cox family
错误原因:因变量生存状态、生存时间的值必须大于0,不能等于0或者小于0解决方法:用筛选样本或者过滤表格节点,去除因变量不符合要求的样本
多分类逻辑回归:Error in MASS:polr(as.formula(fml), weights = WD[, var weight], data = WD, :attempt to find suitable starting values failed
报错原因:因变量应该为数值,而不能是字符串解决方法:将因变量转编码为数值
调查设计秩和检验:Error in if (length(unique ind) == 2 || !is.na(model[“estimate”]][[“difference in mean rank score”])) {:missing value where TRUE/FALSE needed
错误原因:(1)分组变量异常,可能不存在这个变量(2)统计模型拟合失败,无法得到统计值解决方法:(1)重新拖一个节点后把参数重新设置一遍(2)选择方法参数,切换其他统计模型方法(3)修...
数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’
报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
计算时间间隔:time data “2020-10-20” doesn’t match format “%Y-%m-%d %H:%M:%S”, at position 4. You might want to try:
错误原因:日期格式不匹配,如下图所示,待计算的两个日期变量的值,存在格式为Year-Month-Day H:M:S的行,则计算时间间隔的时候,必须选择Year-Month-Day H:M:S的格式解决方法:如下图所示,修...
聚类热图:only defined on a data frame with all numeric-alike variables
报错原因:选择分析的变量中存在个别非数值变量解决方法:删除这些非数值的变量
在回归分析中,如何修改分类变量的参照因子
在大多数回归分析,如线性回归,逻辑回归等分析中,分类变量往往需要指定一个参照因子(ref)进行分析,例如性别Gender的元素包含male和female,在通常情况下female往往会被作为ref处理,如果想...
转换多变量标签编码:invalid syntax (<string>, line 1)
报错原因: (1)通常为条件未指定变量(逻辑符号或者运算符号前面缺少变量),此处应该为x1<=20 and x1>=3 如下图在*号前面没有变量,没有x1**x2的写法,必须是x1*x2*x3这种
转换多变量标签编码:cannot assign to subscript here, Maybe you meant ‘==’ instead of ‘=’? (, line 1)
报错原因:命令的符号写错了,不是写“=”,是写“==”解决方法:把=换成==
如何去除变量存在NA或者inf的样本
变量中的NA或者inf是无法参与计算的,通常需要在执行统计分析前将这些样本删除。 去除NA样本的方法: (1)筛选行空值的节点 (2)多条件过滤表格,使用notnull()的方法 删除inf样本 (1)筛选i...
Lapack routine dgesv: system is exactly singular: U[1,1]= 0
错误原因: 算法在计算过程中产生了奇异矩阵,导致无法计算,是参数,变量组合导致算法无法成功执行,可能的原因很多,例如变量间存在共线性很高的变量,样本量不足、用了分布类型非法的变量等...
转换多变量标签编码:invalid syntax. Perhaps you forgot a comma? (, line 1)
报错原因:通常为逻辑连接符未加空格,此处应该写为x1<=20 and x2>=3
分类预测:‘DecisionTreeRegressor’ object has no attribute ‘predict proba’
错误原因:回归模型不能使用分类预测解决方法:把分类预测节点改成回归预测节点
筛选样本:根据输入的列名没有找到匹配的规范变量名
报错原因:筛选样本选在的变量名在上游节点输出的数据中找不到。该错误常常发生在修改现呈的工程,没有根据上游的输出变量去重新修改下游节点的变量参数解决方法:把报错节点的变量参数重新设置...
环境缺失:Error in library(XXXXX)
报错原因:当看到有Error in library()这个错误的时候,说明有个别的R包环境缺失解决方法:(1)自行安装补充环境点程序-R终端打开R终端,输入install.packages('XXX')安装环境,缺什么包就写什...
数据连接:Unable to allocate XXX GiB for an array with shape (XXXXX) and data type float64.
错误原因:内存不足,在数据连接中m:m的模型内存消耗很大解决方法:(1)增加计算机内存(2)改用1:m或者1:1的模式匹配