导入数据:’utf-8′ codec can’t decode byte 0xa1 in position 10971: invalid start byte
报错原因: 文件编码不是windows系统默认的,常常是因为Excel导出文件的时候选错了导出编码类型 解决方法: (1)Excel导出表格的时候选择正确的导出形式,避免选择CSV UTF-8 (2)如果方法一处...
为什么有些看起来是数值的分类/字符串变量无转成连续型continue
如图,以下有三个变量Var1,Var2,Var3,看起来都是数值的分类变量,应该能够把他们转成连续的 尝试使用转换变量类型的节点把Var2和Var3转成连续的 结果只有Var3转换成功了 这是因为Var2变量的...
转换多变量标签编码:invalid character’‘'(U+2018)(<string>,line 1)
错误原因:使用中文符号编写命令,如下图,这种单引号为中文字符解决方法:改成英文字符的符号
潜类别混合增长模型:Error in gridsearch(rep=50,maxiter=10,minit = model, hlme(as.formula(fml),: The model minit did not converge.
错误原因:数据,变量组合无法拟合,可参考:https://cecileproust-lima.github.io/lcmm/articles/usual_problems.html解决方法:可以尝试换参数,换变量
转换变量类型:变量XXX类型转换失败,could not convert string to float: XXXX
错误原因:待转换类型的变量存在字符串,如图所示“<10.00”为字符串,字符串无法转换为数值,即无法转为连续型解决方法:(1)删除有字符串的行(2)把字符串的单元格修改成数值或者NA
聚合表格:JAVA GATEWAY_EXITED] Java gateway process exited before sending its port numbe
报错原因:用错节点了,未分组目录内的节点都是还无法正常使用的节点解决方法:更换节点,选择行聚合目录的节点
Permission denied: ‘XXXXXXXX/run logic coef.tsv’.
错误原因: 看到“Permission denied”这个提示就是计算机的文件没有读写权限 自己用其他软件(Excel,记事本等)把分析结果的文件打开导致决策链无法访问。真是一种低级的错误,自己的计算机权...
转换多变量标签编码:unterminated string literal (detected at line 1) (, line 1)
报错原因:编写的命令中,字符串的索引符号有误,不能写中文符号,应该用英文符号
转换多变量标签编码:invalid entry 0 in condlist: should be boolean ndarray
报错原因:编写变量字符串识别的命令时,忽略了变量存在NA的情况,通常发生于str.contains()等方法解决方法:增加一个参数 ”na=False“ 帮助函数识别NA,x1.str.contains('ABC',na=False)
ROC操作特征曲线: More than one “best” threshold was found, aborting. Change ‘best.policy’ to alter this behavior
ROC操作特征曲线显示以上错误原因:算法在搜素ROC操作特征曲线的最佳阈值的时候。发现有多个最佳阈值,因此建议我们修改最佳阈值的规则解决方法:直接才参数界面修改最佳阈值的选择方法
Lasso回归-生存状态:Non-positive event times encountered; not permitted for Cox family
错误原因:因变量生存状态、生存时间的值必须大于0,不能等于0或者小于0解决方法:用筛选样本或者过滤表格节点,去除因变量不符合要求的样本
多分类逻辑回归:Error in MASS:polr(as.formula(fml), weights = WD[, var weight], data = WD, :attempt to find suitable starting values failed
报错原因:因变量应该为数值,而不能是字符串解决方法:将因变量转编码为数值
调查设计秩和检验:Error in if (length(unique ind) == 2 || !is.na(model[“estimate”]][[“difference in mean rank score”])) {:missing value where TRUE/FALSE needed
错误原因:(1)分组变量异常,可能不存在这个变量(2)统计模型拟合失败,无法得到统计值解决方法:(1)重新拖一个节点后把参数重新设置一遍(2)选择方法参数,切换其他统计模型方法(3)修...
数据分箱:unsupperted operand type(s) for -:’str’ and ‘str’
报错原因:目标的分箱变量不是连续型,只有连续型变量才能(才需要)分箱
计算时间间隔:time data “2020-10-20” doesn’t match format “%Y-%m-%d %H:%M:%S”, at position 4. You might want to try:
错误原因:日期格式不匹配,如下图所示,待计算的两个日期变量的值,存在格式为Year-Month-Day H:M:S的行,则计算时间间隔的时候,必须选择Year-Month-Day H:M:S的格式解决方法:如下图所示,修...
聚类热图:only defined on a data frame with all numeric-alike variables
报错原因:选择分析的变量中存在个别非数值变量解决方法:删除这些非数值的变量