将一组计量资料按观察值大小分为不同组段,然后将各观察值归纳到各组段中,最后清点各组段的观察值个数(称频数),以表格形式表示之,称为频数分布表又称“频次分布表”,简称“频数表”。
我们在结果中也包含了卡方检验: 数据是否符合期望的假设。将数据中的观测值与原假设为真时的期望值进行比较。确定一个变量是否可能来自某个给定的分布
Ho:不同组别的比例相同
Ha:不同组别的比例不同
统计猿(Statsape)操作:
当你想做方差分析的时候,在数据分析单元里,分析方法选择频数的比较与检验和单向频数表。
提交分析方法后:
输入参数:选择变量:你想做的频数变量。分类型,离散型数字或者字符串变量,选择多个变量可做多个单向频数表
如与理论频数比较:用户判断来设置频数,检查各组是否与频数一致(卡方)。如果变量是两类,则默认的理论频率是0.5,0.5,如果填写的不是两个理论频率或者和不为1,则用默认的理论频率
多变量联合分布:当多个变量选择后,点击不光生成各变量单独频数,且生成各变量交叉联合频数;
分解字符串计算频数:只针对字符串,点击则开始分解字符串进行计算频数;
分解字符串分隔符:只针对字符串,1.逗号 2.分号 3. / 4.\ 选择字符串是以什么间隔的。从而分解字符串来计算频数
合并频数阈值: 只针对字符串, 几个字符串的的频率小于某个阈值, 则全部计入一个字符串的频数
分析成功后,会到跳到结果页面。可以选择下载解压包。本地解压,即可查看结果。或者下载pdf查看
运算结果:打开压缩包可以看到以下结果
1. 饼图:我们通过饼图来显示出变量中各组的频数分布。如果输入多个变量,那每个变量都会有一个频数饼图
2. 结果表格:图为选择两个变量并点了多变量联合分布。频数表是把每个输入变量的分组频率展示出来。如果变量是两分类会做了卡方检验(P-value, CI low, upp)。 检验数据是否符合期望的假设。如果P值<=0.05, 拒绝H0,不同组别的比例不相同,每组有差异。如果P值>0.05, 接受H0,不同组别的比例相同,每组无差异。
因为这里点了多变量联合分布,所以多出2个表:多变量联合频数分布表和除去缺失值表。各个变量中,各种组的联合频次。
暂无评论内容