拓扑指数在酯类化合物沸点QSPR研究中的应用

2013-09-11 13:45刘明地吴启勋
关键词:酯类化合物邻接矩阵碳原子

刘明地,吴启勋,叶 丹

(青海民族大学化学与生命科学学院,青海西宁810007)

拓扑指数在酯类化合物沸点QSPR研究中的应用

刘明地,吴启勋*,叶 丹

(青海民族大学化学与生命科学学院,青海西宁810007)

酯类化合物主要是由C、H、O 3种元素组成,根据酯类化合物分子中碳原子与氧原子所构成的骨架结构特点,结合原子电负性对化合物性质的影响,将碳原子与氧原子的电负性之比(0.74)作为碳氧单键之间的距离,将氧原子与碳原子电负性之差的2蛐3(0.59)作为碳氧双键之间的距离,建立酯类化合物的顶点邻接矩阵和距离矩阵,求顶点邻接矩阵与距离矩阵之积构成的新矩阵M的最大特征值T,以特征值T为基础构建新的拓扑指数H(H=(ln T)2),结合酯类化合物中含有的碳原子个数N,对酯类化合物的沸点进行拓扑学研究,取得了良好的相关性,回归相关系数达到0.998。

酯类;拓扑指数;沸点;QSPR模型

近年来酯类化合物因具有独特生物活性、耐油、耐酸、高抗冲击性和耐蠕变性等多种性质,在各方面都有广泛的应用,研究其物理和化学性质也渐渐成为化学工作者的一个研究热点。但是酯类化合物在未达到沸点就有很大程度的水解,为了能够将酯类化合物更合理更好地用于高科技产品中,化学工作者致力于酯类化合物各项物性的研究,沸点的测定显得格外重要。鉴于前因酯类化合物的沸点的测定就必须采用特殊的测定方法,加之酯类化合物数目繁多,甚至还有现今科学上没有发现的酯类化合物,同时还会受到实验条件的限制,要逐一测定必要耗费大量的物力、人力,因此,就有必要找到一种既简便又能获得准确数据的方法来获取酯类化合物的沸点。近几年以部分依据并结合实验数据形成的算法对求知物性进行物性数据估算成为获得物性数据的一种主要方法。关于有机化合物沸点与分子结构的定量关系研究已有许多报道,总体主要有2种方法:一是基团贡献法[1-4],另一种方法是提取有机物分子结构的拓扑学、几何学和电子结构等参数,通过数理统计方法建立结构参数与沸点的定量结构与性质关系[5-7]QSPR模型,并利用建立的模型估算相似化合物的性质,其中用分子拓扑指数法获取物性数据成为研究热点。分子拓扑指数是从分子结构提炼出的信息进行数值化,分子的结构决定分子的性质,因此分子拓扑指数是分子的固有性质之一,能够很好地反映分子的结构信息。自1947年 Wiener[8]提出第一个拓扑指数后,学者们相继研究报道了100余种不同类型的拓扑指数[9-12]。随着计算机化学的日趋成熟,拓扑指数在化学中的应用已成为当前信息化学的重要分子。通过已知的物性数据研究化合物拓扑指数,将其运用于预测和估算同类化合物中其他已知分子甚至是未知分子的性质,这样既可获得较为准确的物性数据又能省时省力,还能减少资源的不必要消耗。我们以能反映酯类化合物分子结构信息的顶点邻接矩阵和距离矩阵为基础构建新拓扑指数H(H=(ln T)2),再结合酯类化合物中含有的碳原子个数N,对酯类化合物的沸点进行拓扑学研究,取得了良好的相关性。

1 拓扑指数H的计算

酯类化合物的分子中存在碳碳单键、碳氧单键、碳氢单键、碳氧双键,为了能够更直观地看清酯类化合物分子的骨架结构,作者将分子中的碳氢单键隐去,按酯类化合物的国际命名规则写出由碳、氧元素所构成的酯类分子骨架,并按照从左到右支链最后的顺序给骨架中各原子编号,然后写出酯类分子的顶点邻接矩阵和距离矩阵。对杂原子的处理,考虑到原子电负性对化合物性质的影响,作者将碳原子与氧原子的电负性之比作为碳氧单键之间的距离,碳原子的电负性之比作为碳碳单键之间的距离,将氧原子与碳原子电负性之差的2蛐3作为碳氧双键之间的距离。以乙酸乙酯(CH3COOCH2CH3)为例:碳原子与氧原子之间的距离为2.55蛐3.44=0.74,碳原子与碳原子之间的距离为2.55蛐2.55=1,碳氧双键之间的距离为2蛐3 (3.44-2.55)=0.59,则其顶点邻接矩阵A和距离矩阵D为:

将距离矩阵D与顶点邻接矩阵A相乘得到矩阵M:

利用MATLAB7.0.1求出矩阵M的特征值,矩阵M的最大特征值为:T=a1=12.810 4,定义新的拓扑指数H=(ln T)2。可见新构建的拓扑指数H是从能反映酯类化合物分子结构信息的酯类分子的顶点邻接矩阵和距离矩出发演算而来,因此新构建的拓扑指数H能够反映酯类化合物分子的结构信息,可以用于酯类化合物物性的研究。再结合酯类化合物分子中碳原子个数N进行线性拟合。

2 结果与讨论

2.1 数据的收集与处理

(Tj来自文献[13])2.2 回归方程的建立

表1 饱和脂肪酯类化合物的沸点(Tj)、拓扑指数(H)及所含碳原子数(N)

将所构建的拓扑指数H,酯类化合物分子中所含碳原子数N与酯类化合物的沸点Tj利用SPSS13.0进行多元线性逐步回归拟合,得到线性回归方程如下:

2.3 回归模型的评价

2.3.1 F检验、t检验

从所建立的线性回归模型方程的相关评价参数可知:r等于0.998,高于文献中的r值,属于优级标准,且F值较大,s值较小,P=0.000,说明所建的回归模型有意义。再由构建回归方程各参数标准回归系数(*0.669H,*0.332N)可知,作者自定义的拓扑指数H标准系数最大,是影响酯类化合物沸点(Tj)的关键因素,并且构建回归方程所用参数各系数的P值都小于0.05,顺利通过t检验,说明各系数有意义,模型比较稳定。同时作者做了预测值与实验值之间的比较(见表2),从表中可发现预测值与实验值之间的基本吻合,误差较小。综上所述,所建回归模型可以很好地预测酯类化合物的沸点。

表2 酯类化合物沸点与计算值的比较蛐℃

2.3.2 残差分布图

图1 残差分布图

从残差分布图(见图1)可知,所建模型的残差以0为中心分布,其中大部分残差集中于0左右,近似正态分布,所建模型预测值与实验值之间的残差都很小,且分布集中,因此可知预测值与实验值非常接近。再从计算值与实验值的对比图(图2)可见,计算值与实验值几乎是重合于一点,说明计算值可以很好地反映实验值,达到预测的效果。

图2 计算值与实验值的对比图

2.3.3 模型稳定性评价(LOO法)

LOO法又称留一去一法,即每次抽出一个样本,用剩余的样本建模并预测抽出样本的数值,依次往复直到所有样本都被抽出一次并进行预测为止,最后计算样本预测值与实验值的误差(也可以求相关系数),预测值与实验值之间的误差越小或者预测值与实验值之间的相关系数越接近1就说明所建模型越稳定。留一去一法是评价模型稳定性和对外部样本预测能力最重要也最有效的一种方法。其检验如下:

Tj的交互检验结果:n=15,r=0.997,s= 3.774,F=2 029.385,P=0.000

留一去一法检验结果显示预测值与实验值之间的相关系数达到0.997,即预测值与实验值之间非常接近,线性相关性非常好,且s值小,F值大,P为0。因此,说明所建模型稳定性好对外部样本的预测可信。

3 结论

综上所述,可知酯类化合物的沸点与从该化合物的距离矩阵、顶点邻接矩阵中提炼并构建的新拓扑指数H以及酯类化合物分子中所含碳原子个数 N有密切的关系,所建的回归方程的回归系数达到 0.998,同时计算值与实验值之间非常接近,说明作者所构建的新拓扑指数用于酯类化合物的QSPR研究是可行的,对酯类化合物的沸点有很好的预见性,为酯类化合物沸点的估算预测提供了一种新方法。

[1]伍科,邓文生,贾冬梅,等.有机物临界性质预测方法研究进展[J].计算机与应用化学,2009,26(1):125-128.

[2]熊焰,丁倩,虞大红,等.离子液体热物理性质与相行为预测的基团贡献法[J].化工学报,2012,63(3):667-676.

[3]王小艳,司继林.估算有机物正常沸点的基团贡献法的研究进展[J].山东化工,2012,41(5):34-36.

[4]杨振生,赵先兴,李春利,等.结合图论和基团贡献法的非均相共沸精馏挟带剂设计[J].化工学报,2012,63(10):3158-3164.

[5]刘万强,曹晨忠.脂肪族含氧有机物沸点的定量构效关系[J].化工学报,2012,63(12):3739-3746.

[6]冯长君,沐来龙.边支化度指数与环烷烃沸点的相关性[J].化学工业与工程,2005,22(5):338-341.

[7]刘凤萍,曹晨忠,吴湘江,等.用分子拓扑指数预测饱和酯类化合物的气相色谱保留指数[J].计算机与应用化学,2008,25 (6):711-716.

[8]Wiener H.Structural determination of paraffin boiling points[J].JAm Chem Soc,1947,69(1):17-20.

[9]Hosoya H,Topological index.A proposed quantity characterizing the topological nature of structural isomers of saturated hydrocarbons[J].Bull Chem Soc Jpn,1971,44(9):2332-2339.

[10]Randic M.On characterization ofmolecular Branching[J].JAm Chem Soc,1975,97(23):6609-6615.

[11]Balaban A T.Chemical graphs:looding back and glimpsing ahead[J].JChem Inf Comput Sci,1995,35(3):339-350.

[12]刘万强,曹晨忠.极化效应指数与脂肪酯类化合物沸点的定量构效关系研究[J].化学学报,2010,68(23):2401-2408.

[13]叶川,张丽,徐小龙,等.分子拓扑指数估算值的沸点[J].内蒙古石油化工,2009,21:14-15.

〔责任编辑 杨德兵〕

The App lication of Topological Index in QSPR Research of Ester Compounds′Boiling Point

Liu Ming-di,Wu Qi-xun*,Ye Dan
(School of Chemistry and Life Science,QinghaiUniversity for Nationalities,Xining Qinghai,810007)

Ester compounds are mainly composed of C,H,O,according to the characteristic of the structure of esters bones which are composed of oxygen atom and carbon atoms,and combining with atomic electronegativity which has an impact on compound's properties,then taking the ratio of atomic electronegativity between oxygen atom and carbon atom(0.74)as the distance of the key of C-O in esters compounds and taking two-thirds of the electronegativity difference between oxygen atom and carbon atom as the distance of the key of C=O,we set up estermolecules distancematrix and vertex adjacency matrix,and a new matrix is constructed using the productof twomatrices,the characteristic value of the newmatrix is T,and then we build up a new topological index H(H=(ln T)2)which is based on the characteristic value T,combining with the number N of carbon atoms in estersmolecules,using those factorswe study the boiling point of ester compounds in topology,that has obtained good correlation.The regression correlation coefficients is 0.998.

esters;topological index;boiling point;QSPRmodel

O623

A

1674-0874(2013)06-0034-04

2013-10-20

刘明地(1987-),男,陕西商洛镇安人,硕士,研究方向:物质结构与物性定量关系;*吴启勋,男,教授,硕士生导师,通信作者。

猜你喜欢
酯类化合物邻接矩阵碳原子
轮图的平衡性
脂肪酶在白酒酯类化合物合成中的作用研究进展
Rapid synthesis and characterization of bridged (bis-, tri- and tetra-) aryl carboxylic acid derivatives at room temperature by ultrasonic irradiation
碳链异构有关的同分异构体书写补遗
“碳”疑解惑
有机化合物命名易错题直击
基于邻接矩阵变型的K分网络社团算法
新型(Z)-2-[(2-碘苯氧基)(芳基)]次甲基-2-丁烯酸酯类化合物的合成
邻苯二甲酸酯类化合物的生殖毒性及其环境内分泌干扰效应
Inverse of Adjacency Matrix of a Graph with Matrix Weights