|
CMH统计分析方法在多中心试验s×r表资料的应用
中国卫生统计1999年第16卷第3期
史周华 俞戟 蔡雪亚 梁泉峰
关键词:CMH统计分析 s×r表 多中心试验
多中心试验中,有时试验的对象分为两组或两组以上,分别给予不同的处理,其结果作为反应变量不仅仅是二分类,也可能是多分类,且属性可能是有序的,也可能是无序的或名义的,这样构成分层的s×r列联表资料。多中心试验的2×2、2×r(列变量为有序变量)和s×2(行变量为有序变量)列联表资料是s×r列联表资料的特殊情况。本文阐述CMH统计分析方法在多中心(或分层)试验广义s×r列联表资料的应用。
CMH作为扩展的MH检验,从一定意义上讲,是一种概括统计方法,它在考虑多中心(或分层)试验混杂因素影响的前提下,根据s×r表格中行变量与列变量的属性不同,给出三种检验统计量。当行变量与列变量均为有序变量时,给出非零相关统计量(Nonzero Correlation);当行变量为无序变量而列变量为有序变量时,给出行平均秩分差异统计量(Row Mean Scores Differ),即方差分析统计量;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,给出一般联系统计量(General Association)。
下面以简表形式表示第h试验中心(或第h层)的s×r表,h=1,2,…,q。q为层数,s为行数,r为列数。
表1 第h层s×r列联表
|
处理组 |
反应变量水平 |
|
1 |
2 |
… |
r |
合计 |
|
1 |
nh11 |
nh12 |
… |
nh1r |
nh1+ |
|
2 |
nh21 |
nh22 |
… |
nh2r |
nh2+ |
|
?? |

|

|
|

|

|
|
s |
nhs1 |
nhs2 |
… |
nhsr |
nhs+ |
|
合计 |
nh+1 |
nh+2 |
… |
nh+r |
nh |
以向量形式表示,则有:
n′h=(nh11,nh12,…,nh1r,…,nhs1,nhs2,…,nhsr)
依据重超几何分布的原理,在周边合计不变的情况下,H0成立时,向量nh的概率分布可以写成

这里nhij表示第h层第i行(组)第j列(反应变量水平)所对应的实际数,nhi+为第h层第i组合计数,i=1,2,…,s。nh+j为第h层第j列合计数,j=1,2,…,r。nh为第h层的合计数,Phi+=nhi+/nh,Ph+j=nh+j/nh,nhij的期望值为:

以向量形式表示,则有:
P′h*+=(Ph1+,Ph2+,…,Phs+)
P′h+*=(Ph+1,Ph+2,…,Ph+r)
nh的期望值及方差分别为:

这里,DPh+*是以向量Ph+*中元素作为主对角元素的对角阵,DPh*+是以向量Ph*+中元素作为主对角元素的对角阵, 表示克罗内克积。这样,多中心(或分层)试验s×r表的CMH统计量为:

Ah是{nh-mh}的线性函数矩阵,它有如下三种情况:
(1)当CMH为一般联系统计量QGMH时:
Ah={[I(r-1),O(r-1)]?[I(s-1),O(s-1)]}
自由度v=(s-1)(r-1)
(2)当CMH为行平均秩分统计量QSMH时:
Ah=a′h [I(s-1),O(s-1)] 自由度v=s-1
(3)当CMH为非零相关统计量QCSMH时:
Ah=[a′h?c′h] 自由度v=1
这里,{ah}={ah1,ah2,…,ahr}为第h层第j列反应变量水平秩分矩阵(j=1,2,…,r);{ch}={ch1,ch2,…,chs}为第h层第i行变量水平秩分矩阵(i=1,2,…,s)。
需要说明的是:对多中心(或分层)试验s×r列联表资料的CMH统计量计算,涉及到矩阵知识,手工计算是很繁杂的,现在一般用计算机来实现。由于SAS软件(6.10版本以上较好)提供了CMH在此方面的应用程序,所以本文实例均用SAS程序来实现。
表1属于行变量与列变量均为有序变量的三个中心试验4×3列联表资料,SAS给出的CMH统计量应取非零相关统计量,采取整数评分法:QCSMH=12.627,v=1,P=0.001;采取修正Ridit评分法:QCSMH=12.840,v=1,P=0.001。说明病程与依沙酰胺疗效有相关关系,病程越短,其疗效越好。
表1 病程与依沙酰胺疗效的关系
|
试验中心 |
病 程 |
疗 效 |
合计 |
|
治愈 |
好转 |
无效 |
|
中心1 |
<1月 |
24 |
10 |
3 |
37 |
|
1~3月 |
10 |
4 |
2 |
16 |
|
3月~5年 |
35 |
26 |
10 |
71 |
|
>5年 |
10 |
8 |
4 |
22 |
|
中心2 |
<1月 |
25 |
12 |
3 |
40 |
|
1~3月 |
11 |
4 |
2 |
17 |
|
3月~5年 |
30 |
22 |
8 |
60 |
|
>5年 |
10 |
10 |
5 |
25 |
|
中心3 |
<1月 |
20 |
8 |
2 |
30 |
|
1~3月 |
10 |
4 |
1 |
15 |
|
3月~5年 |
20 |
17 |
5 |
42 |
|
>5年 |
12 |
10 |
6 |
28 |
表2属于行变量无序,列变量有序的三中心试验4×4列联表资料,SAS给出的CMH统计量应取行平均秩分差异统计量,采取整数评分法,QSMH=41.127,v=s-1=4-1=3,P=0.001;采取修正Ridit评分法,QSMH=41.891,v=s-1=3,P=0.001,说明该病A、B、C、D型与痰液中SB含量有关。
表2 患者病程与痰液中SB含量的关系
|
试验中心 |
病 型 |
嗜酸细胞含量 |
合计 |
|
- |
+ |
++ |
+++ |
|
中心1 |
A型 |
0 |
2 |
9 |
6 |
17 |
|
B型 |
3 |
5 |
5 |
2 |
15 |
|
C型 |
5 |
7 |
3 |
2 |
17 |
|
D型 |
3 |
5 |
3 |
0 |
11 |
|
中心2 |
A型 |
1 |
3 |
7 |
5 |
16 |
|
B型 |
4 |
6 |
4 |
2 |
16 |
|
C型 |
5 |
9 |
3 |
2 |
19 |
|
D型 |
3 |
5 |
4 |
0 |
12 |
|
中心3 |
A型 |
0 |
3 |
10 |
7 |
20 |
|
B型 |
5 |
6 |
5 |
3 |
19 |
|
C型 |
7 |
9 |
4 |
2 |
22 |
|
D型 |
4 |
6 |
2 |
1 |
13 |
表3属于行变量与列变量均为无序变量的四中心试验4×3列联表资料,SAS给出的CMH统计量应取一般联系统计量,采取整数评分法,QGMH=0.643,v=(s-1)(r-1)=(4-1)(3-1)=6,P=0.423;采取修正Ridit评分法,QGMH=0.517,v=(s-1)(r-1)=6,P=0.472。说明两种血型划分系统之间互相独立,它们之间没有确定的倾向性。
表3 某地5 688人按2种血型划分的结果
|
研究中心 |
ABO
血型 |
MN血型 |
合计 |
|
M |
N |
MN |
|
中心1 |
O |
101 |
112 |
203 |
426 |
|
A |
88 |
122 |
201 |
411 |
|
B |
108 |
146 |
248 |
502 |
|
AB |
23 |
36 |
64 |
123 |
|
中心2 |
O |
87 |
122 |
192 |
401 |
|
A |
90 |
125 |
194 |
409 |
|
B |
112 |
146 |
229 |
487 |
|
AB |
20 |
33 |
58 |
111 |
|
中心3 |
O |
93 |
130 |
189 |
412 |
|
A |
90 |
107 |
206 |
403 |
|
B |
106 |
135 |
257 |
498 |
|
AB |
25 |
32 |
46 |
103 |
|
中心4 |
O |
98 |
111 |
211 |
420 |
|
A |
90 |
115 |
212 |
417 |
|
B |
113 |
132 |
231 |
476 |
|
AB |
18 |
29 |
42 |
89 |
小结
CMH统计分析方法在多中心试验s×r表资料的应用,需要根据行变量与列变量的属性特征,采用不同的统计量。当行变量与列变量均为有序变量时,采用非零相关统计量,自由度为1;当行变量为无序变量列变量为有序变量时,采用行平均秩分差异统计量(即方差分析统计量),自由度为s-1;当行变量与列变量均为无序变量或行变量是有序变量列变量为无序变量时,采用一般联系统计量,自由度为(s-1)(r-1)。P值取各自统计量相对应的P值。
作者单位:史周华 梁泉峰 山东中医药大学(250014)
俞 戟 蔡雪亚 上海医科大学
参考文献
1.Maura E.Stokes,Categorical Data Analysis Using SAS System.North Carolina:SAS Institute Inc,1997,105~140.
2.金丕焕,苏炳华.临床试验设计与统计分析.上海:上海科学技术文献出版社,1997,44.
3.金丕焕.医用统计方法..上海:上海医科大学出版社,1993,170~177.
4.胡良平.现代统计学与SAS应用.北京:军事医学科学出版社,1996:164~190,191~197.
5.倪宗瓒.医学统计学.北京:人民卫生出版社,1990,19~21.
6.高惠璇.SAS/STAT软件使用手册.北京:中国统计出版社,1997,394~400.
|