找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 1165|回复: 7

什么是卡方检验?

[复制链接]
发表于 2013-9-29 08:58:36 | 显示全部楼层 |阅读模式
悬赏8质量豆未解决
什么是卡方检验?欢迎参与交流!

 楼主| 发表于 2013-9-30 16:29:58 | 显示全部楼层
卡方检验是用途很广的一种假设检验 方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析 等。
回复

使用道具 举报

 楼主| 发表于 2013-9-30 16:36:06 | 显示全部楼层
基本思想
在分类资料统计分析 中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别?
处理 发癌数 未发癌数 合计 发癌率%
甲组   52        19       71    73.24
乙组   39         3        42    92.86
合计   91         22     113   80.33

52  19
39   3
是表中最基本的数据,因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*(91/113)=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。
回复

使用道具 举报

 楼主| 发表于 2013-9-30 16:40:33 | 显示全部楼层
利用统计学软件 分析结果如下:
data kafang;
input row column number @@;
cards;
1 1 52
1 2 19
2 1 39
2 2 3
;
run;
proc freq;
tables row*column/chisq;
weight number;
run;
统计量    自由度  值      概率
卡方         1  6.4777    0.0109(显著)
似然比卡方   1  7.3101    0.0069
连续校正卡方 1  5.2868    0.0215
Mantel-Haenszel 卡方 1  6.4203   0.0113
Phi 系数        -0.2394
列联系数       0.2328
Cramer 的 V -0.2394
回复

使用道具 举报

发表于 2013-9-30 16:42:00 | 显示全部楼层
这类东东俺不光不懂,还听不懂,进来只为凑个人气
回复

使用道具 举报

 楼主| 发表于 2013-9-30 16:45:56 | 显示全部楼层
检验方法
假设有两个分类变量X和Y,它们的值域分另为{x1, x2}和{y1, y2},其样本频数列联表为:
​         y1     y2   总计
x1      a       b   a+b
x2      c       d   c+d
总计 a+c b+d a+b+c+d

若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)
K^2 = n (ad - bc) ^ 2 / [(a+b)(c+d)(a+c)(b+d)] 其中n=a+b+c+d为样本容量
K^2的值越大,说明“X与Y有关系”成立的可能性越大。
当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度:
P(K^2≥k) 0.50 0.40 0.25 0.15 0.10
k 0.455 0.708 1.323 2.072 2.706
P(K^2≥k) 0.05 0.025 0.010 0.005 0.001
k 3.841 5.024 6.635 7.879 10.828

例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。
回复

使用道具 举报

 楼主| 发表于 2013-9-30 16:49:26 | 显示全部楼层
四格表资料检验
四格表资料的卡方检验用于进行两个率或两个构成比的比较。
1. 专用公式:
若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),
自由度v=(行数-1)(列数-1)
2. 应用条件:
要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但有1=<理论频数<5时,卡方值需要校正,当样本含量小于40或理论频数小于1时只能用确切概率法计算概率。
行X列表资料检验
行X列表资料的卡方检验用于多个率或多个构成比的比较。
1. 专用公式:
r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]
2. 应用条件:
要求每个格子中的理论频数T均大于5或1<T<5的格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行X列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。
回复

使用道具 举报

 楼主| 发表于 2013-9-30 16:52:04 | 显示全部楼层
列联表资料检验
同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。
1. R*C 列联表的卡方检验:
R*C 列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。
2. 2*2列联表的卡方检验:
2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)],此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。
列联表卡方检验应用中的注意事项同R*C表的卡方检验相同。
卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,卡方值越大,越不符合,偏差越小,卡方值就越小,越趋于符合,若量值完全相等时,卡方值就为0,表明理论值完全符合。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

手机版|小黑屋|QPDCA平台自律公约|QPDCA质量论坛 ( 苏ICP备18014265号-1 )

QPDCA质量论坛最好的质量管理论坛 GMT+8, 2024-5-10 03:07 , Processed in 0.092569 second(s), 14 queries , Gzip On.

无锡惠山区清华创新大厦901室0510-66880106

江苏佳成明威管理咨询有限公司 版权所有

快速回复 返回顶部 返回列表