葡萄酒中元素分布与其原产地关系的分类模型

2014-01-17 06:12王丙涛涂小珂靳保辉林燕奎谢丽琪
食品科学 2014年2期
关键词:产地葡萄酒分类

王丙涛,陈 波,涂小珂,颜 治,靳保辉,林燕奎,谢丽琪

(深圳出入境检验检疫局,深圳市食品安全检测技术研发重点实验室,广东 深圳 518045)

葡萄酒中元素分布与其原产地关系的分类模型

王丙涛,陈 波,涂小珂,颜 治,靳保辉,林燕奎,谢丽琪

(深圳出入境检验检疫局,深圳市食品安全检测技术研发重点实验室,广东 深圳 518045)

为了解决进口葡萄酒来源复杂,原产地难鉴别的问题,使用电感耦合等离子体质谱检测葡萄酒中的元素含量,采用偏最小二乘法建立聚类分类模型用于原产地鉴别。电感耦合等离子体质谱检测了澳大利亚、智利、法国、意大利和西班牙5个国家的100份葡萄酒中的41种元素,通过变量两两相乘进行扩维,偏最小二乘法变量筛选方法对扩维后的大量变量进行处理,删除冗余变量和影响不显著的变量,建立了聚类分析模型,模型可以很好地将各国葡萄酒样品区分,分辨准确率在96%以上。将来自5个国家的99份和南非的11份葡萄酒样品检测数据代入模型,判别结果令人满意。

葡萄酒;元素;分类模型;原产地

2009年以来中国葡萄酒进口量突飞猛进,中国已经成为世界上第五大葡萄酒消费国。2011年葡萄酒的进口均价为3.89美元每升,市场平均售价为进口均价的10倍以上,巨额的利润导致大量假冒红酒进入市场,特别是名牌葡萄酒,如拉菲,国内一年的消费量居然超出拉菲年产量的10倍以上,显而易见至少90%以上的拉菲都是假酒。每年的糖酒交易会上,各种假冒红酒登堂入室,令国内市场十分混乱。但怎样才能遏制这种假货泛滥的现象,除了加强市场监管外,关键还要从技术上鉴别假酒。

利用葡萄酒中的有机化合物[1-4]、花青素[5]、同位素比[6-9]、稳定同位素[10-11]、甚至DNA分析[12]等方法鉴定葡萄酒的真实产地报道较多,同时葡萄酒中含有丰富的常量元素和微量元素,这些元素的存在对葡萄酒的感官质量和稳定性以及葡萄酒的品质有着至关重要的影响,产地地球化学元素的配置直接影响葡萄中的元素分布,多元素含量作为变量的指纹分析技术也有用于产地鉴定的报道[13-14]。Baxter等[15]最早报道了使用电感耦合等离子体-质谱(inductively coupled plasma-mass spectrometry,ICPMS)测定葡萄酒中的多种元素含量,使用多元统计分析技术来确定葡萄酒的原产地域。面对大批量来自世界各地的葡萄酒,采用ICP-MS检测研究了几个主要进口国家葡萄酒中的元素分布,通过偏最小二乘法聚类分析,找出葡萄酒产地与特征元素相关性信息,建立葡萄酒原产地聚类分析鉴别模型,为葡萄酒的产地鉴定提供技术手段和数据基础。

1 材料与方法

1.1 样品来源和分布

样品来自5个不同的国家和地区,共计199份,其中法国45份、意大利41份、西班牙37份、智利36份、澳大利亚40份,所有的样品均采集自深圳各出入境口岸正规手续进口样品。由于不同国家葡萄酒风格或者酿造工艺的区别,在所采集的样品中既有单葡萄品种葡萄酒,又有含多种葡萄品种的混合型葡萄酒,葡萄酒样品相关的国家和产区、葡萄品种信息见表1。

表1 5个国家葡萄酒样品的具体产地信息Table1 The geographical origin of wines samples from five foreign countries

1.2 试剂与仪器

K、Na、Ca、Mg、Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Mo、Cd、Ce、Ti等各单元素国家标准溶液以及15种稀土元素混合国家标准溶液,质量浓度在10~1 000 mg/L。其他试剂均为优级纯或分析纯。

Xseries2电感耦合等离子体质谱仪 美国热电公司。

1.3 方法

1.3.1 仪器参数设定

功率:1 400 W;雾化器:Bremen;雾化气流速:0.85 mL/min;冷却气流速:14.2 L/min;辅助气流速:0.8 L/min;采样深度:150;脉冲电压:3 380 V;模拟电压:1 800 V。

1.3.2 样品前处理

使用移液枪准确吸取待测样品溶液0.5 mL(精确至0.01 mL)至15 mL比色管中,加入等量的硝酸,静置消解1~2 h后,去离子水定容,上机测定。同样方法配制试剂空白。

2 结果与分析

2.1 ICP-MS分析

采用ICP-MS检测所有样本中的K、Na、Ca、Mg、 Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Y、Mo、Cd、Ce、Ti以及15种稀土元素等共计41种元素含量。结果显示,不同元素之间含量相差很大,K含量很高,基本都在1 000 mg/L以上,Na、Ca、Mg含量在几十到几百mg/L范围内,Fe、Mn、B、Rb含量一般在几个mg/L,Zn、Cu、Ba、Sr等含量稍低,一般为几百μg/L,其他一些元素含量更低,甚至属于痕量范围,见表2。要从如此大量 的数据中分析出各来源国葡萄酒的特征信息,采用常规的统计方法根本无法实现。

表2 一些元素的ICP-MS检测结果Table 2ble 2 ICP-MS analytical results for 27 elements in imported wines

2.2 偏最小二乘法(partial least squares method,PLS)

对葡萄酒中的有效成分进行分析后会产生大量的数据,无论是香气等有机成分还是元素等常规理化指标,仅依靠简单的数据大小无法判别样品归类,往往需要采取一定的数据统计方法进行处理[16-19],建立适当的分类模型,才能将大量数据简化成可视化指标进行判别。

偏最小二乘回归是对多元线性回归模型的一种扩展,在其最简单的形式中,只用一个线性模型来描述独立变量Y与预测变量组X之间的关系:

式中:b0为截距;bp为数据点1到p的回归系数。

变量筛选主要通过误差方程计算出每删除特定变量引起的误差变化的大小来选择变量,重新建立预报模型。方法在删除那些对所研究问题影响不大的变量的同时,保证模型的总误差值的增长最小。

式中:ΔEi表示删除第i个变量时,模型总误差的增加值,通过不断删除ΔE(i)值为最小的变量达到变量筛选优化的效果;bi为线性模型第i个变量的回归系数矢量;1i为第i个分量为1,其余分量为0的一种特殊矢量;T为正交矩阵;矩阵(TTT)-1为对角矩阵;R为PLS正交分解得到的矩阵。

本PLS判别模型的源代码为Excel下VBA代码。已知的X数据(不同产地元素含量矩阵)和Y数据(样品分类信息,相应的葡萄酒产地类别Y=1,否则为0),先对X数据两两相乘进行扩维,使其自变量数增加,而后使用变量筛选计算方法去除冗余变量,最终获取约40个变量用于建立模型。模型的交叉验证相关系数需大于0.9,则模型可靠性更高。

2.2.1 直接对原始数据进行PLS处理分析

检测的葡萄酒中41种元素部分元素含量过低,无法对相关数据进行处理,经过筛选选择K、Na、Ca、Mg、Fe、Cu、Mn、Zn、B、Al、V、Cr、Ba、Rb、Sr、Pb、Li、Co、Ni、As、Se、Y、Mo、Cd、Ce、Ti 26种元素的数据信息,以100个样本的数据信息构成100×26维的自变量数据矩阵X,以5个国家构成目标变量矩阵Y,其中Y有5个矢量y1、y2、y3、y4、y5,分别代表澳大利亚、西班牙、意大利、法国、智利。将可用于数据分析的变量不经预处理直接进行PLS建模分析,共选择原始变量26个,根据y的信息分别对变量矩阵X做正交分解,建立回归模型,模型交叉检验相关系数(CR)分别为0.873 5、0.772 8、0.719 2、0.781 1、0.661 1,实际判别准确率分别为90%、80%、75%、80%和65%。对于某产地信息yi,模型计算出来的该产地样本点估计值大于0.5,则判断正确,否则判错,同时模型计算出来的其他产地样本的估计值小于0.5,则判断正确,否则判错,通过样本总数和判别正确数来计算全部样品实际判别的准确率。

2.2.2 变量扩维后进行PLS建模分析

直接对原始数据进行PLS分析所建立的分类模型还无法满足要求,为了进一步理清各变量之间的相关性,将对变量进行扩维,引入各变量之间的非线性项,通过变量之间两两相乘,使得变量数从原来的26个,扩充到445个,Y矩阵不变,对X和Y进行PLS正交分解建立分析模型。CR分别为0.942 6、0.907 2、0.883 4、0.936 5、0.912 2。变量扩维后模型的实际判别准确率比扩维前显著提高。采用PLS变量筛选方法对扩维后的大量变量进行处理,通过指定判据删除冗余变量或者影响不显著的变量,从而在不影响预报准确性的前提下最大限度的减少冗余变量,使模型简化至最优化。以意大利地区葡萄酒为例,目标变量y3筛选过程中入选自变量数与模型相关系数的关系如图1所示,PLS模型分析结果见表3。

图1 PLS模型筛选过程中模型CR值与入选变量数的关系图Fig.1 Relationship between the correlation coefficient of cross validation and the number of variables selected for the PLS model

表3 5个葡萄酒产地回归模型信息Table3 PLS model parameters for the five wine producing countries

采用3列矢量模型的拟合值y1、y2、y3、y4、y5的不同组合构成不同来源国家葡萄酒的产地判别分类图。如图2所示,澳大利亚、法国和智利显示了较好的分类效果,同样是欧洲的3个国家的法国、意大利和西班牙的分类效果同样比较满意,只是有两个意大利的样本结果在分类范围外,介于法国和意大利之间,而意大利同其他几个国家的分类还是相当满意的。意大利的样品点分布比较松散,CR也稍微偏低,低于0.9,模型判别效果没有达到最佳,经分析可能与选取的意大利红葡萄酒样品葡萄品种来源较多有关,虽然都来自意大利,但葡萄品种多达12种,从侧面也反映了不同葡萄品种之间的模型离散性。

图2 PLS模式识别分类图Fig.2 The PLS-based classification models for wines from the five countries

2.3 实际样品分析

采用上述建立的PLS模型,分析了来自法国、澳大利亚、智利和意大利的99份葡萄酒,结果显示,不同国家之间的葡萄酒样品均能得到很好的判别,特别是澳大利亚、智利等与欧洲国家酒样区分明显。但在法国和意大利的葡萄酒样品中,有4份样品出现异常,这可能与葡萄品种多样化、产区不同有关,也不排除个别酒样来源有异常,需要进一步进行考察研究。同时将11份南非的葡萄酒检测数据代入计算,结果显而易见,均没有落在任何国家范围内。这5个国家110份实际样品的总体鉴别准确率达到96.4%,进一步说明了本实验所建立模型的可靠性和准确度。

3 结 论

对于不同产区的葡萄酒而言,各个大洲的差别还是比较明显的。当采用PLS分析时,通过变量扩维,引入变量两两相乘,大大增加了变量数,避免了有效信息的损失,同时通过变量优化删除一些冗余变量和影响不显著的变量后,达到很好的分类效果,由此建立的分类模型,不仅能够将不同大洲的葡萄酒严格区分,还可以将欧洲不同国家之间的葡萄酒分离,模型的预报能力大大提高,鉴别准确率均达96%以上。进一步对实际样品进行分析,将检测数据代入模型进行计算,分类效果也达到实验要求,结果令人满意。

[1] 王秀芹, 张庆华, 战吉成, 等. 产地与品种对葡萄酒中酚类物质含量的影响[J]. 食品科学, 2009, 30(21): 113-118.

[2] 陶永胜, 李华, 王华. 中国不同产区赤霞珠干红葡萄酒香气成分数据的可视化分析[J]. 分析化学, 2008, 36(5): 635-657.

[3] BELTR˘N N H, MERMOUD M A D, MUÑOZ R E. Geographical classification of Chilean wines by an electronic nose[J]. International Journal of Wine Research, 2009, 1: 209-219.

[4] GRANATO D, KATAYAMA F C U, CASTRO I A. Phenolic composition of South American red wines classified according to their antioxidant activity, retail price and sensory quality[J]. Food Chemistry, 2011, 129(2): 366-373.

[5] GAMBELLI L, SANTARONI G P. Polyphenols content in some Italian red wines of different geographical origins[J]. Journal of Food Composition and Analysis, 2004, 17(5): 613-618.

[6] KELLYA S, HEATON K, HOOGEWERFF J. Tracing the geographical origin of food: the application of multi-element and multi-isotope analysis[J]. Trends in Food Science & Technology, 2005, 16(12): 555-567.

[7] ALMEIDA C M, TERESA M, VASCONCELOS S D. ICP-MS determination of strontium isotope ratio in wine in order to be used as a fingerprint of its regional origin[J]. Journal of Analytical Atomic Spectrometry, 2001, 16(6): 607-611.

[8] BARBASTE M, HALICZ L, GALY A, et al. Evaluation of the accuracy of the determination of lead isotope ratios in wine by ICP MS using quadrupole, multicollector magnetic sector and time-of-flight analyzers[J]. Talanta, 2001, 54(2): 307-317.

[9] DEHELEAN A, VOICA C. Determination of lead and strontium isotope ratios in wines by inductively coupled plasma mass spectrometry[J]. Romanian Journal of Physics, 2012, 57(7/8): 1194-1203.

[10] SPITZKE M E, FAUHL-HASSEK C. Determination of the13C/12C ratios of ethanol and higher alcohols in wine by GC-C-IRMS analysis[J]. European Food Research and Technology, 2010, 231(2): 247-257.

[11] GIACCIO M, VICENTINI A. Determination of the geographical origin of wines by means of the mineral content and the stable isotope ratios: a review[J]. Journal of Commodity Science Technology and Quality, 2008, 47(Ⅰ/Ⅳ): 267-284

[12] İŞÇI B, YILDIRIM H K, ALTINDIŞLI A. A review of the authentication of wine origin by molecular markers[J]. Journal of The Institute of Brewing, 2009, 115(3): 259-264.

[13] WATLING R J, LEE G S, SCADDING C J. The application of solution and laser ablation based ICP-MS and solution based AES for the provenance determination of selected food and drink produce[J]. The Open Chemical and Biomedical Methods Journal, 2010, 3: 179-196.

[14] PANEQUE P, SOTOMAYOR M T ˘, CLAVIJO A, et al. Metal content in southern Spain wines and their classification according to origin and ageing[J]. Microchemical Journal , 2010, 94(2): 175-179.

[15] BAXTER M J, CREWS, DENNIS H M M J, et al. The determination of the authenticity of wine from its trace element composition[J]. Food Chemistry, 1997, 60(3): 443-450.

[16] 刘巍, 李德美, 刘国杰, 等. 利用近红外光谱技术对葡萄酒原产地进行fisher判别[J]. 酿酒科技, 2010(7): 65-67; 69.

[17] 张军, 王方, 魏纪平, 等. 基于SVM的天津产地玫瑰香葡萄酒定性分析[J]. 光谱学与光谱分析, 2011, 31(1): 109-113.

[18] 高年发, 李丽, 张健. 利用模式识别技术鉴别中国葡萄酒的产地和品种[J]. 中国酿造, 2009(3): 68-72.

[19] LINDE G V, FISCHER J L, COETZEE P P. Multi-element analysis of South African wines and their provenance soils by ICP-MS and their classification according to geographical origin using multivariate statistics[J]. South African Journal for Enology and Viticulture, 2010, 31(2): 143-153.

A Classification Model for Wines Based on Elements Distribution and Geographical Origin

WANG Bing-tao, CHEN Bo, TU Xiao-ke, YAN Zhi, JIN Bao-hui, LIN Yan-kui, XIE Li-qi
(Shenzhen Key Laboratory of Detection Technology R & D on Food Safety, Shenzhen Entry-Exit Inspection and Quarantine Bureau, Shenzhen 518045, China)

In this study, efforts were made to address the difficulty in identifying the geographic origin of imported wines to China due to the complex sources. Inductively coupled plasma mass spectrometry (ICP-MS) was used to detect the contents of 41 elements in 100 samples of imported wines from Australia, Chile, France, Italy and Spain. Furthermore, analysis of the experimental data by partial least squares (PLS) method and cluster analysis was carried out to establish a classification model for tracing the geographical origin of the wines. After variable dimension expansion and variable selection, the PLS model without redundant or non-significant variables showed a good correlation coefficient of cross validation with an identification accuracy above 96%. For 110 additional new wine samples, including 99 from the five countries and 11 from South Africa, satisfactory identification results were obtained when applying the analytical data to the model.

wine; elements; classification model; geographical origin

TS261.7;O657

A

1002-6630(2014)02-0213-04

10.7506/spkx1002-6630-201402041

2013-03-27

国家质检总局科研项目(2012IK189);深圳市技术研究开发计划技术创新项目(CXZZ20120831160213590)

王丙涛(1977—),男,工程师,硕士,研究方向为食品理化检测。E-mail:fsyswbt@163.com

猜你喜欢
产地葡萄酒分类
自制的葡萄酒为啥爱“上头”?
分类算一算
警惕“洗产地”暗礁
分类讨论求坐标
食物离产地越远越好
十款葡萄酒与十块石头
测定不同产地宽筋藤中5种重金属
数据分析中的分类讨论
教你一招:数的分类
法国葡萄酒何以誉满天下