胡灵芝, 郭冬艳
(1.陕西中医学院 基础医学院, 陕西 咸阳 712046; 2.陕西中医学院 药学院, 陕西 咸阳 712046)
最早关于大黄止血的文献记载于汉代张仲景的《伤寒论》,临床运用于各种血证,《血证论》中云:“大黄一味,即是气药,又是血药,止血而不留瘀,尤为妙药.”故有“血证要药”之称.现代药理表明,大黄有抗菌消炎、镇痛解痉、收敛止血等作用.大黄不同的炮制品有不同的功效,临床若能准确熟练地随证遣用,收效颇佳[1-3].为了获得凝血时间与大黄理化成分之间的数学模型,本文拟利用薄层色谱鉴别法及高效液相色谱法分别测定其成分种类和含量所得数据[4],通过逐步回归法,利用MATLAB软件建立数学模型,探究大黄对凝血时间影响的主要理化参数.
逐步回归法是以多元回归为基础,利用最小二乘法原理建立正规方程,剔除影响不显著的因子,并求解回归系数的一种回归方法[5].
当考虑一个因变量受多个因素影响时,可用多元线性回归方程来描述一个因变量Y与多个自变量X1,X2,X3,…,Xm之间的线性回归关系.关系式如下:
b0为常数项,b1,b2,b3…bm是回归方程待定系数,ε是服从正态分布N(0,σ2)的随机误差[6].
在大黄炭提取工艺中,虽然测出的理化参数不多,但是对于凝血时间可能存在非主要影响因素,应选出对凝血时间影响显著的那些来建立回归模型,即建立最优回归方程用于估计与预测.
逐步回归法是在前进法和后退法的基础上进行双向筛选的一种方法.前进法是回归方程中的自变量从无到有、从少到多逐个引入回归方程;后退法与前进法正好相反,它是先将全部自变量选入方程,然后逐步剔除无统计学意义的自变量.逐步回归法其本质上是前进法,即回归方程中的自变量从无到有、从少到多逐个引入回归方程.但每引入一个自变量进入方程后,要对方程中的每一个自变量做基于偏回归平方和的F检验(H0:βj=0,H1:βj≠0)
需注意两点:一是自变量的选择,主要应根据专业知识和已开展的研究,从专业角度选择有关自变量;二是应在认真搜集可靠数据的基础上,再作多元线性回归分析,用数学方法得到最优回归方程.
大黄的化学成分主要是蒽醌衍生物,主要包括蒽醌苷和双蒽醌苷.双蒽醌苷中有番泻苷A、B、C、D、E、F;游离型的苷元有大黄素、大黄酸、大黄素、大黄酚、大黄素甲醚等.另含鞣质类物质、有机酸和雌激素样物质等.
取生大黄粉末约0.15 g,置具塞锥形瓶中,精密加甲醇25 mL,称定重量.摇匀,滤过,精密量取续滤液5 mL,挥去溶剂,加8%盐酸溶液10 mL,超声处理2 min,再加三氯甲烷10 mL,加热回流1 h,放冷.采用薄层色谱鉴别法及高效液相色谱法分别测定大黄炭成分种类和含量,建模过程中记为自变量.
称取12 g生大黄极细粉,用100 mL 0.5%CMC-Na溶液稀释,得到0.12 g/mL的药液,同法制得大黄炭药液.取昆明种小鼠12只,雌雄各半,适应性喂养4 d后,开始照0.12 g/(20 g·d),每次0.5 mL/20 g灌胃给药.每天上、下午分别灌胃给药1次,连续1周,到第8天上午给药40 min后开始进行凝血实验测定.用内径1 mm,长15 cm的玻璃毛细管插入小鼠左眼球后静脉丛取血,血液注满后取出,平放于桌面,每隔30 s折断毛细管两端0.5 cm,并缓慢左右拉开,观察折断处是否有凝丝,自血液流入毛细管内开始记时,至血凝丝出现为止,所历时间为毛细管该端凝血时间,取毛细管两端的平均值为该鼠的凝血时间[4],建模过程中记为因变量.
对实验结果数据进行提炼及整理,如表1所示.
表1 项目种类数据及变量名
每组数据进行正态性检验后,均服从正态分布.
由于逐步回归计算的工作量比较大,而MATLAB的应用则可使该回归分析运算变得简单.MATLAB软件又称为矩阵实验室,其特点是只要调用相应工具箱,利用一些简单的语句就可以获得想要的计算结果,是目前国际上最流行的科学与工程计算的软件之一[7].
符号说明:本次试验有13个自变量,用xi表示,有1个因变量,用y表示,具体如表1所示.
在MATLAB中输入以下语句:
>>X=[ ] {将表1中的自变量数据输入到方括号中(矩阵)}
>>Y=[ ] {将表1中的凝血时间数据输入到方括号中(列)}
>>stepwise(X,Y)
出现stepwise regression对话框,得逐步回归分析界面,如图1所示.
图1 MATLAB逐步回归分析界面
由图1可知,数据框中的第一列为回归系数,第二列为t统计量值,第三列为P值.
剔选变量的准则为系统默认值,即F分布所对应的临界值.选入变量的显著性水平为0.05,即当P≤0.05,说明该自变量对因变量的贡献具有显著性意义,就该将该变量选人回归方程.
单击图1中右侧的“nextstep”按钮,将逐步将P值小于0.05的变量引入回归方程之中[8,9].本次实验引入回归方程的是x6和x9.另外在界面下方出现有逐步回归过程中计算出的各种参数:常数项b0=570.544,相关系数R2=0.752 971,剩余标准差RMSE=9.267 4,F值为12.192 4,P=0.003 7.提炼数据得表2.
表2 相关参数
从中得到数学模型,即最优多元线性回归方程为:
Y=570.544-83.65X6-388.54X9
(1)
根据本次实验数据,结合数学模型,在大黄炭提取工艺中,“pH值”的含量越多,凝血时间会越短,“芦荟大黄素”的含量越多,凝血时间也会越短,即凝血时间与“pH值”和“芦荟大黄素”的含量均负相关,而与其他的因素关联程度并不是很密切.由回归系数可以看出,“芦荟大黄素”的含量对凝血时间的影响最大.
相关分析是用相关系数来描述变量间相互关系的密切程度和方向.根据公式计算出的相关系数仅是样本相关系数,它是总体相关系数的一个估计值,与总体相关系数之间存在着抽样误差,要判断自变量与因变量之间有无相关及相关的密切程度,必须进行假设检验.只有当检验拒绝了无效假设时,才可认为自变量与因变量间存在相关关系,然后根据计算出的相关系数的大小来判断相关关系的密切程度[10].
根据MATLAB软件计算所得结果,相关系数R2=0.752 971,即R=0.867 74,查相关系数临界值表,得R0.01(11)=0.684,因R>R0.01(11),所以回归方程具有极显著性意义.
回归方程假设检验的目的是推断多个自变量作为一个整体与因变量间的线性关系是否存在,即整个方程是否有统计学意义.方差分析法可以将回归方程中所有自变量X1,X2,X3,…,Xm作为一个整体来检验它们与应变量Y之间是否具有线性关系.
提出假设:H0:β1=β2=…=βm=0,H1:各βj(j=1,2,…,m)不全为0.
将应变量Y的总变异分解成两部分[5],即
(2)
SS总=SS回+SS残
(3)
并有Df总=Df回+Df残,Df总=n-1,Df回=m,Df残=n-m-1,其中,回归平方和的计算公式为
SS总=b1l1Y+b2l2Y+…+bmlmY=∑bjljY
(4)
残差平方和的计算公式为:
SS残=SS总-SS回
(5)
计算统计量:
(6)
根据MATLAB软件的计算结果,利用逐步回归得到的最优多元线性回归方程的方差分析如表3所示.
表3 逐步多元线性回归模型的方差分析结果
由于F≥Fα,(m,n-m-1),则回归方程(1)在显著性水平为0.05的水准上拒绝H0,接受H1,可认为凝血时间与“pH值”、“芦荟大黄素”之间存在显著的回归关系.
随着计算机软件技术的发展,使得多元线性回归在医学中的应用越来越广泛,主要应用有以下几种.
在医学研究中,许多现象的发生大都是多因素相互影响,相互制约,综合作用的结果.要想确切地了解该现象发生的影响因素,就需要去伪存真、由表及里地在众多因素中把真正起作用的因素找出来,多变量因素分析的方法就是逐步回归法[11].例如,在本次实验中,通过逐步回归法在大黄中找到影响凝血时间的主要理化参数为“pH值”和“芦荟大黄素”.
统计控制是指利用回归方程进行逆估计,即给因变量Y指定一个确定的值或者在一个范围内波动,通过控制自变量的值来实现.这种情况要求回归方程的决定系数R2要大,回归系数的标准误差要小[12].
逐步回归分析方法是通过一系列的假设检验,剔除在自变量中对因变量影响不显著的因素,建立最优多元线性回归方程,结合MATLAB软件的应用,使计算工作量大大地减少.多元线性回归要求预测值与应变量值的差值(即残差)服从正态分布,当样本量较大时可用忽略对正态性的要求.
对于影响大黄止血的理化参数,至今尚不十分清楚.但通过本次数学建模,探索到在大黄炭提取过程中,对于大黄凝血时间起关键影响因素的是“pH值”含量和“芦荟大黄素”含量.逐步回归的结果可推断某个因素与因变量有关联,但不能用逐步回归的结果推断某个因素与因变量无关联.逐步回归所剔除的自变量只能说明被剔除的自变量与因变量的关联性不强.在中药研究过程中,若能用计算机软件建立数学模型分析试验结果,使得结论更具有科学性、可靠性.
[1] 李 燕.大黄各炮制品提取物泻下作用的比较研究[J].中国实验方剂杂志学,2011,17(17):151-153.
[2] 周现军.不同炮制工艺对大黄中蒽醌成分含量的影响[J].辽宁中医药大学学报,2008,10(10):130.
[3] 严 华.同属不同种大黄及含大黄制剂中土大黄苷检查方法的研究[J].药物分析杂志,2010,30(9):1 615-1 618.
[4] 郭东艳.大黄炒炭前后化学成分变化及止血成分的实验研究[J].时珍国医国药,2010,21(12):3 152-3 153.
[5] 孙振球.医学统计学[M].北京:人民卫生出版社,2002.
[6] 姜启源.数学模型[M].北京:高等教育出版社,2003.
[7] 廖 爽.基于MATLAB的逐步回归法计算新疆伊犁地区煤的发热量[J].煤质技术,2011(4):1-5.
[8] 薛定宇.高等应用数学问题的MATLAB求解[M].北京:清华大学出版社,2008.
[9] 张圣勤.MATLAB7.0实用教程[M].北京:机械工业出版社,2006.
[10] 颜 虹.医学统计学[M].北京:人民卫生出版社,2005.
[11] 江开忠.多元统计分析在数学建模中的应用[J].上海工程技术大学学报,2012,26(1):84-89.
[12] 李春喜.生物统计学[M].北京:科学出版社,2011.