|
时间序列方法在卫生人力资源需求预测中的应用
中国卫生统计1999年第16卷第5期
汤泽群 黄飞 陈松林 杨哲 凌莉 方积乾
提 要 目的:为制定广东省卫生资源的规划,进行优化配置,对全省的卫生技术人员总数进行预测。方法:求和自回归滑动平均模型(ARIMA)与多重回归分析相结合。结果:广东省2000年和2010年的卫技人数预测值分别为256 880和323 739人,或每千人口3.5人和4.0人。结论:ARIMA模型在卫生人力资源需求预测中的应用是可行的。
关键词:时间序列 求和自回归滑动平均模型 多重回归分析 预测 卫生技术人员总数
为制定广东省卫生资源规划,进行优化配置,本研究拟对广东全省的卫生技术人员总数进行预测。预测的关键是选择科学而切实可行的预测方法,以往的预测仅根据卫生人力资源某年或几年的数据进行,没有考虑卫生人力资源数据的动态变化特点,以及其他因素对卫生人力资源需求的影响〔1~2〕。本研究旨在试用能较好解决上述问题的时间序列方法,并结合多重回归分析,兼用人口和经济因素,预测广东全省未来的卫生技术人员总数。
资料与方法
1.资料来源
1978~1995年各年广东全省的卫生技术人员总数,人口数和人均国民生产总值分别来源于当年的广东省卫生统计年鉴和广东省统计年鉴;对1996~2010年各年的人口数和人均国民生产总值按文献〔3〕的预测进行。
2.预测方法
预测指标(因变量):广东省全省未来卫生技术人员总数。
用于预测的指标(自变量):时间,1978~1995年;人口指标,全省各年人口数;经济指标,全省各年人均国民生产总值。
(1)时间序列方法:针对时间效应,用时间序列方法中的求和自回归滑动平均模型(ARIMA)〔4~7〕进行首轮预测,采用Box-Jenkins建模方法。建模程序主要包括四个步骤:
①辩识:通过序列的自相关系数(ACF),偏自相关系数(PACF)和Q统计量来辩识模型,确定模型是否平稳,必要时使用差分的方法达到平稳的目的;进而确定自回归及滑动平均的参数p和q。模型为:
Φ(Β)(1-B)dyt=Θ(B)εt
式中,
Φ(B)=1-φ1B-…-φpBp,Θ(B)=1-θ1B-…-θqBq,
yt是各年卫生技术人员数序列,d是差分阶数,B是后移算子,Ψ1,…,Ψp为自回归系数,θ1,…,θq为滑动回归系数,{εt}是白噪声序列。
②估计:采用有条件最小二乘法(CLS)。
③诊断检验:用χ2检验检测所估计模型的白噪声残差,其残差应是一随机序列,否则进行残差分析,必要时需重新确定模型。
④预测:利用拟合的模型进行预测。
(2)多重回归方法
针对人口和经济的效应,建立卫生技术人员总数首轮预测的残差与人口、经济的回归方程;将人口、经济的预测值代入回归方程,即得应在首轮预测值之外附加的残差预测值。
最终预测值:首轮预测值与残差预测值的和即为卫生技术人员总数的最终预测值。
所有计算均由SAS for Windows 6.11软件包实现。
结果与分析
1.全省卫生技术人员总数的时间序列预测结果
从图1可见,数据带有明显的趋势性,对其进行一阶差分,自相关系数(ACF)及偏自相关系数(PACF)见表1。

图1 全省卫技人数实际值与时间的趋势图
表1 卫技人数一阶差分后的ACF及PACF
|
时滞(lag) |
1 |
2 |
3 |
4 |
|
ACF |
0.5982* |
0.3591 |
0.2310 |
-0.1057 |
|
PACF |
0.5982* |
0.0020 |
0.0240 |
-0.3951 |
*:ACF及PACF的检验P<0.05。 序列自相关系数的白噪声检验:χ2=15.67,P<0.05,该序列符合ARIMA模型。选用ARIMA(0,1,1)对时间效应进行预测。白噪声残差的χ2检验:P>0.05,不拒绝残差为白噪声;残差平方和=1.70×109,残差的方差为:3 576 878.33,最小信息准则AIC=306.65。
最后模型为:
yt=yt-1+6 421.4112+εt+0.6356εt-1
如需要预测t+j年的数值,只需在上面的模型中以t+j代替t即可。全省卫生技术人员总数的时间序列预测结果见表2第(3)~(6)栏。
表2 全省卫生技术人员总数时间序列预测及最终预测结果
|
年
份
(1) |
全省卫
技人数
实际值
(2) |
首轮
预测值
(3) |
预测的
标准误
(4) |
首轮预
测的残
差值
(5)=(2)-(3) |
首轮相
对误差
(%)
(6)=(5)/(2) |
残差值
的预测值
(7) |
最终
预测值
(8) |
最终绝
对误差
(9)=(2)-(8) |
最终相
对误差
(%)
(10)=(9)/(2) |
|
1980 |
144537 |
145239.7 |
1891.3 |
-702.7 |
-0.49 |
4720.8 |
149960.5 |
-5423.5 |
-3.75 |
|
1981 |
151971 |
151661.1 |
3625.6 |
309.9 |
0.20 |
2586.8 |
154247.8 |
-2276.8 |
-1.50 |
|
1982 |
160710 |
158082.5 |
4765.9 |
2627.5 |
1.63 |
562.4 |
158644.9 |
2065.1 |
1.29 |
|
1983 |
166543 |
164503.9 |
5681.7 |
2039.1 |
1.22 |
-1038.9 |
163465.0 |
3078.0 |
1.85 |
|
1984 |
170495 |
170925.3 |
6469.2 |
-430.3 |
-0.25 |
-2820.3 |
168105.0 |
2390.0 |
1.40 |
|
1985 |
175337 |
177346.7 |
7170.7 |
-2009.7 |
-1.15 |
-4364.2 |
172982.5 |
2354.5 |
1.34 |
|
1986 |
180045 |
183768.1 |
7809.4 |
-3723.1 |
-2.07 |
-5916.2 |
177852.0 |
2193.0 |
1.22 |
|
1987 |
184126 |
190189.5 |
8399.7 |
-6063.5 |
-3.29 |
-7360.9 |
182828.6 |
1297.4 |
0.70 |
|
1988 |
187307 |
196610.9 |
8951.2 |
-9303.9 |
-4.97 |
-8451.0 |
188160.0 |
-853.0 |
-0.46 |
|
1989 |
192147 |
203032.4 |
9470.6 |
-10885.3 |
-5.67 |
-9680.9 |
193351.5 |
-1204.5 |
-0.63 |
|
1990 |
194771 |
209453.8 |
9962.9 |
-14682.8 |
-7.54 |
-13517.2 |
195936.6 |
-1165.6 |
-0.60 |
|
1991 |
199051 |
215875.2 |
10432.1 |
-16824.2 |
-8.45 |
-14662.6 |
201212.6 |
-2161.6 |
-1.09 |
|
1992 |
205110 |
222296.6 |
10881.0 |
-17186.6 |
-8.38 |
-15431.9 |
206864.7 |
-1754.7 |
-0.86 |
|
1993 |
211874 |
228718.0 |
11312.1 |
-16844.0 |
-7.95 |
-15285.4 |
213432.6 |
-1558.6 |
-0.74 |
|
1994 |
220153 |
235139.4 |
11727.4 |
-14986.4 |
-6.81 |
-15066.4 |
220073.0 |
80.0 |
0.04 |
|
1995 |
229894 |
241560.8 |
12128.5 |
-11666.8 |
-5.07 |
-14606.9 |
226953.9 |
2940.1 |
1.28 |
|
1996 |
- |
247982.2 |
12516.8 |
- |
- |
-15140.1 |
232842.2 |
- |
- |
|
1997 |
- |
254403.6 |
12893.3 |
- |
- |
-15635.2 |
238768.5 |
- |
- |
|
2000 |
- |
273667.9 |
13962.2 |
- |
- |
-16788.0 |
256879.9 |
- |
- |
|
2005 |
- |
305774.9 |
15581.5 |
- |
- |
-16577.4 |
289197.6 |
- |
- |
|
2010 |
- |
337882.0 |
17047.7 |
- |
- |
-14142.9 |
323739.1 |
- |
- |
2.全省卫生技术人员总数首轮预测残差的预测 全省卫技人数时间序列的预测值与实际值有一定的差别,试用首轮预测的残差值Y与全省人口数X1、人均国内生产总值的对数值X2来建立回归方程,方程为:
=1717419-19.06X1-3458850X2+131303X32
r2=0.890,SE=2714.99
将X1,X2的预测值代入上面方程,即可得到全省卫生技术人员总数首轮预测残差的预测值,结果见表2第(7)栏。
3.全省卫生技术人员数最终预测结果
首轮时间序列预测值与由回归方程得到的残差预测值之和即为最后全省卫生技术人员总数的预测值,全省卫生技术人员数最终预测结果见表2第(8)~(10)栏;其实际值与预测值的趋势见图2。

图2 全省卫技人数实际值、预测值与时间的趋势图
据预测结果,广东省2000年和2010年的卫技人数分别为257 725和328 304人,每千人口卫技人数分别为3.5和4.0,后者与广东省卫生事业第九个五年计划及2010年发展规划的3.5和4.3基本接近,但2010年的每千人口卫技人数预测值略偏低。
讨 论
1.以往对卫生技术人员数的预测,常常是根据模型拟合结果,仅由历史的卫技人数决定未来的人数,这是不够的,效果也不太理想。卫技人数的发展并非仅由自身决定,还受其他因素如人口、经济的影响。本文针对人口、经济的效应,兼用多重回归分析,最终预测值的误差较单纯用时间序列预测的误差小。
2.本模型用多重回归分析预测残差,1986年后效果较好,说明远期预测结果比较理想;而1986年之前的误差较大,可能卫技人数的发展存在着不明显的周期性等,有待今后进一步研究。
3.从前面的分析可见,如未来人口和经济的增长速度与预测的不同,则卫技人数的预测值会发生变化。只要有某年的人口数和人均国内生产总值,通过回归方程即可得到受人口和经济影响的卫技人数的变化值。故本预测模式,对广东省未来不同的人口和经济发展情况均适用。
4.在应用时间序列进行预测时,特别注意预测模型的适用条件和模型的选择。如本研究的卫技人数序列有增长的趋势,故应首先对数据进行差分变换,使数据列不再有趋势性,成为平稳序列,再用时间序列方法进行建模和预测。
作者单位:凌 莉 方积乾 中山医科大学卫生统计教研室(510089)
汤泽群 黄飞 陈松林 杨哲 广东省卫生厅
参考文献
1.严非,龚幼龙.卫生人力需要量预测方法的探讨:医院规划模式.国外医学*社会医学分册,1993,(2):49.
2.宋福建.卫生人力需求的预测方法.中国卫生经济,1992,11(4):31.
3.王鼎昌主编.二?一?年的广东——规划及战略研究.广州:广东人民出版社,1993,34
4.顾岚编著.时间序列分析在经济中的应用.北京:中国统计出版社,1994,185.
5.Crabtree-BF,Ray-SC,Schmidt-PM,et al.The individual over time:time series applications in health care research.J-Clin-Epidemiol.1990,43(3):241.
6.施锡铨,范正琦编著.数据分析方法.上海:上海财经大学出版社,1997,452.
7.SAS Institute Inc.SAS/ETS User's Guide.Version 5 Edition.Cary.NC.:SAS Institute Inc., 1984,127.
|