基于卷积神经网络的茶鲜叶主要内含物的光谱快速检测方法

2021-12-23 13:15李晓丽张东毅董雨伦金娟娟

中国农业大学学报 2021年11期

李晓丽张东毅董雨伦金娟娟何勇

(浙江大学生物系统工程与食品科学学院/农村农业部光谱传感重点实验室，杭州 310058)

茶是世界三大非酒精饮料之一，具有特殊的风味和保健功能[1]。茶由茶树的嫩叶制成，茶叶中的茶多酚和咖啡碱是决定茶叶色、香和味的重要成分[2]。茶多酚是一类多羟基化合物，主要由儿茶素组成[3]，被证明具有各种有益的药用特性，如抗氧化能力、抗肿瘤活性、预防心血管疾病和增强免疫力[4]。表没食子儿茶素没食子酸酯(EGCG)、表儿茶素没食子酸酯(ECG)、表没食子儿茶素(EGC)和表儿茶素(EC)是新鲜茶叶中具有不同生物活性的4种主要儿茶素[5]，在加工过程中，这些儿茶素可分别异构化为没食子儿茶素没食子酸酯(GCG)、儿茶素没食子酸酯(CG)、没食子儿茶素(GC)和儿茶素(C)[6]。咖啡碱(CAF)也是茶叶的重要成分[7]，它可以对人体产生刺激作用[8]。

研究表明，不同品种茶叶的茶多酚和CAF有较大的差异[9]，此外，茶树在生长过程中不同叶位的茶多酚和CAF也会有所不同[10]。通过研究鲜叶中茶多酚和CAF的含量一方面可以了解茶园中茶树的生长状况，进而对茶树进行更加有效的管理，同时也可以为选择具有更多生物活性成分的叶片提供指导，保证采摘茶叶的品质，以此促进我国茶产业的高质量发展。因此，迫切需要1种能够快速检测新鲜茶叶内含物含量的方法，为以后茶园智能采摘茶叶和精细化管理提供帮助。

目前，高效液相色谱(HPLC)[11]和毛细管电泳(CE)[12-13]等多种技术常用于测定茶叶中的儿茶素和CAF含量，但这些方法耗时且耗材，不能实现茶叶品质的在线实时检测。可见/近红外光谱(Vis/NIR)是1种快速、简单和非破坏性的技术，它已被广泛应用于许多领域[14]。随着光学仪器的改进和计算机科学与化学计量学的发展，Vis/NIR已广泛应用于茶叶质量分析领域[15-18]。Vis/NIR可以反映C-H，N-H，O-H主要化学键的吸收特性，因此被广泛用于有机物质组成的定量分析[19]。近年来，由于其特征学习能力，深度学习在分类和回归分析中具有更好的模型性能。深度学习最初是针对分类问题而开发的，最近有研究报道将深度学习用于光谱数据分析中的回归问题[20]。此外，深度学习方法不仅可以用作建模回归还可以进行特征提取[21]。研究表明，与其他机器学习方法相比，用于回归的卷积神经网络(CNN)可以获得相同甚至更好的模型性能。因此，本研究旨在探讨不同品种和不同叶片位置的茶鲜叶光谱和内含物的差异性，并基于Vis/NIR技术结合CNN算法来构建鲜叶中4种主要儿茶素(EGCG，ECG，EGC，EC)和CAF的定量模型，以期实现不同品种和叶位儿茶素单体和CAF的快速无损检测。

1 材料与方法

1.1 茶鲜叶样品采集

2019年4月25日在浙江大学华家池校区(30.3° N，120.2° E)茶园进行样品采集。茶树树龄为5年，采摘3个不同品种茶树的鲜叶，分别为‘菊花春’(JHC)，‘浙农25’(ZN25)和‘迎霜’(YS)，每个品种分别采摘6个叶位(叶梢第1叶至第6叶)，每个叶位随机收集9个样品。最终，共获得了162个新鲜茶叶样品。

1.2 可见/近红外光谱采集

使用XDS近红外光谱仪(FOSS，Denmark)在400～2 498 nm范围内以2 nm的分辨率进行叶面的Vis/NIR反射光谱采集。样本的每条光谱值均为光谱仪扫描32次的平均光谱值，每条光谱产生总共1 050个反射率值。吸光度的计算公式如下：

A=log(1/R)

(1)

式中：A为光谱的吸光度；R为光谱的反射率，%。

为了增加信噪比，每个茶叶样品测量3次，以3个光谱的平均值作为样品的光谱值，通过“ISIscan v1.50”软件获取光谱数据。

1.3 儿茶素和咖啡碱含量的化学检测

采集完新鲜茶叶样本的光谱后，将所有新鲜茶叶在冷冻干燥器(FreeZone6，Labconco Corp，Kansas City，MO，USA)中干燥超过24 h。冷冻干燥后，用研磨机(FW100，Taisite Instrument Co.，Ltd.，Tianjin，China)将样品研磨成粉末，并通过60目筛子筛分。随后，用25 mL水萃取0.1 g筛分的茶粉在85 ℃的温度下保持20 min。然后将上清液通过0.22 μm膜滤器过滤用于HPLC分析。整个操作在室温(25 ℃)和黑暗环境下进行，以防止儿茶素的分解。

通过配有紫外可见检测器(波长范围：190～600 nm)的日本岛津LC-20AD高效液相色谱仪来测定4种主要儿茶素和咖啡碱的含量[22]。流动相为：(A)V(乙酸)∶V(乙腈)∶V(蒸馏水)=0.5∶3∶96.5 和(B)V(乙酸)∶V(乙腈)∶V(蒸馏水)=0.5∶30∶69.5。梯度洗脱程序如下：0～35 min，线性梯度从20%至65%B流动相; 35～45 min，等度65%B流动相。流速为1.0 mL/min，注射体积为10 μL。检测波长为280 nm，柱温保持在35 ℃。

1.4 常规数据分析方法

1.4.1回归分析的样本划分

将所有茶叶样品根据4种儿茶素和CAF的化学含量值以升序排列，每3个样本分为1组，位于每组中间的样本被选为预测组，而剩余的2个样品被选为校准组。因此，校准组的化学值范围可以覆盖预测组的范围，使得模型更稳定。本次试验共有162个样本，因有1个异常样本将其剔除，最后161样本中107个样本用于校准集以建立检测模型，而剩余的54个样本用于预测集以测试模型的稳健性。

1.4.2建立回归模型

偏最小二乘回归(PLSR)是一种线性回归方法，它同时将自变量(X)和因变量(Y)投影到一个新的空间，其约束条件是可以尽可能多地解释X和Y之间的方差。所以它不仅是尽可能多地提取有用信息，还能加强X和Y之间的相关性[23]。通过对光谱进行预处理，比较光谱PLSR模型的预测能力，进而来评估预处理方法的性能。

1.4.3特征波长选择

Vis/NIR光谱通常由数千个光谱变量组成，其中包含许多非信息量或共线变量。全谱(Original)建模不仅会增加模型的复杂度和计算时间，还会影响模型的预测能力，从而阻碍了模型在实际生产中的应用。为了解决该问题，需要从Original中选择特征波长以减小Vis/NIR光谱数据的维数。CARS是一种基于偏最小二乘法(PLS)模型回归系数的波长选择方法，使用蒙特卡洛采样建立PLS模型，以获得PLS模型的回归系数的绝对值。计算每个波长的绝对回归系数的权重，并根据指数递减函数删除权重小的波长。选择与具有最小交叉验证均方根误差(RMSECV)的PLS模型相对应的候选子集[24]。竞争自适应加权抽样(Competitive adaptive reweighted sampling, CARS)是一种很好的变量选择方法，这些变量在PLS模型中具有绝对值更大的回归系数，以此来提高模型的预测能力。连续投影算法(Successive projections algorithm, SPA)是通过比较变量投影来选择特征波长的方法，它能够从光谱信息中充分寻找含有最低冗余信息的变量组，以减少变量之间的共线性。该算法可以通过设定目标变量数范围，利用某个波长在其它所有波长上的投影向量的大小来挑选引入的待选波长，最后基于校正模型，从所有待选波长集合中选出符合设定数量范围的特征波长[25]。最后分别对Original以及SPA和CARS选择的特征波长进行PLS回归，如图1中的①所示。

1.5 深度学习方法

深度学习在分类任务中取得了很好的效果之后，也开始应用于回归建模。在这项研究中，采用了基于自定义分类的CNN架构进行回归[26]。CNN架构是使用几个基本单元设计的，包括一维(1D)卷积层、最大池化层、relu层和完全连接层。一维卷积和最大池的组合用于从原始输入中自动进行特征表示，使用完全连接的块来建立提取的特征和相应标签之间的关系。训练任务的目的是使CNN模型的输出值和所测量的化学值之间的误差最小化。

在本研究中，通过CNN方法对4种儿茶素和CAF进行检测的整体框架分别如图1中的②和③所示。第1种是将CNN用作建模方法，通过训练CNN模型来对4种主要儿茶素和CAF进行预测。第2种CNN被用作特征提取，Original以及SPA和CARS选择的波长分别进行CNN特征提取，总共提取了64个特征，然后提取的特征被用作PLS回归模型的输入，以探索特征与化学成分之间的关系。CNN架构通过不同堆叠的矩形来表示，紫色的小矩形表示卷积核，圆圈表示完全连接层中的神经元，堆叠矩形旁边标记的数字描述了卷积核的数量，圆圈旁边标记的数字描述了完全连接层中的神经元数量，L为卷积层展开的全部神经元数量。将卷积内核大小设置为3，步长为1，最大池化层大小设置为2，步长为2。

1.6 模型评估

光谱数据分析和特征波长选择基于Matlab R2019b(The MathWorks, Natick, MA,USA)进行。CNN 在Python3和Pytorch框架(Facebook,Menlo Park,California,USA)上执行。PLSR是基于Unscrambler软件实现的(版本10.1，CAMO,Inc,Oslo,Norway)。开发模型的性能通过决定系数(R2)，均方根误差(RMSE)和残余预测偏差(RPD)进行评估，良好性能的模型应该包含较高的R2和RPD值，并有较低的RMSE值[27]。

图1 光谱检测4种主要儿茶素和咖啡碱的整体框架Fig.1 The overall framework of spectral detection of the four main catechins and caffeine

2 结果与分析

2.1 茶鲜叶的Vis-NIR光谱响应特性

茶叶样品的原始光谱采集如图2所示，波长范围为400～2 498 nm，所有茶叶样品在整个光谱区域具有相似的趋势，但吸光度的大小不同。在位于400～800 nm的可见光区域中存在480 nm和670 nm 2个明显的吸收峰。表明茶叶样品主要在可见光谱区范围内吸收蓝紫色(455～492 nm)和红色(622～770 nm)光，而很少吸收绿色(492～577 nm)光，这是茶叶显示绿色的原因。在近红外区域(800～2 500 nm)有7个吸收带，1 200 nm处的平坦吸收峰归因于-CH2的C-H伸缩振动的第二倍频；1 464 nm处的峰值带归因于O-H的振动；1 736 nm范围内的信号与-CH3的C-H振动相关；1 930 nm处的吸收峰来自O-H拉伸和HOH转变的组合振动；2 130 nm处的吸收带是由N-H弯曲和C=O拉伸的组合振动引起；在2 310 nm和2 350 nm

图2 茶样品的可见近红外光谱采集系统Fig.2 The visible and near infrared spectrum acquisition system of tea samples

处的2个峰分别较弱，分别对应于C-H弯曲和C-H对称拉伸[28]。这些条带与多酚和咖啡碱的各种官能团(CH、CH2、CH3、C=O、OH和NH)密切相关[29]。

2.2 茶鲜叶内含物统计分析

3个品种茶鲜叶不同叶位对4种主要儿茶素和咖啡碱的含量影响见图3。可以发现，‘JHC’和‘ZN25’的EGCG，EGC，ECG和EC在第1叶位的含量高于其他5个叶位，且‘YS’的EGCG，EGC和ECG在第1叶位的含量最高，每个品种茶叶的CAF从第1叶位到第3叶位含量基本一致，第4叶位到第6叶位含量则较低。此外，新鲜茶叶中4种主要儿茶素和咖啡碱的含量随茶树品种的变化而不同。在每个品种鲜叶的第1叶位中，儿茶素单体EGCG高于其他3种儿茶素单体含量，具体遵循以下的顺序：EGCG>EGC>ECG>EC。总之，4种儿茶素单体和CAF含量随茶树品种和叶位的变化而变化，而且品种和叶位对其含量的影响显著。

图3 鲜茶叶的叶位分布及不同叶位对4种主要儿茶素和咖啡碱含量的影响Fig.3 The leaf position distribution of fresh tea leaves and theeffects of different leaf positions on contents of four main catechins and caffeine

2.3 基于PLS的茶鲜叶中生化成分预测模型

PLS方法经常被用于各种化学成分的分析中，作为常规的回归方法，它的应用十分广泛。在本研究中，通过Original、SPA和CARS选择的特征波长作为输入变量，然后使用PLS对4种主要儿茶素和CAF进行回归分析建模。通过CARS和SPA选择光谱变量后，变量数从1 050个减少到20～75个，大大提高了检测效率。Original、SPA和CARS挑选的特征波长分别作为输入变量构建PLS回归模型的性能比较如表1所示。

表1 PLS回归模型的性能比较Table 1 Performance comparison of PLS regression model

2.4 基于CNN的茶鲜叶中生化成分预测模型

2.5 使用CNN提取特征

表2 CNN回归模型的性能比较Table 2 Performance comparison of CNN regression models

表3 通过CNN提取特征的PLS建模效果Table 3 PLS modeling effect of extracting features through CNN

2.6 传统方法与深度学习方法之间的比较

如表1和表2所示，4种主要儿茶素和CAF含量预测的常规方法和深度学习方法均具有良好的性能。将CNN用于回归建模时，使用Original和选定的波长进行CNN建模可获得比PLS模型更好或接近的性能。这说明，深度学习具有巨大的潜力，可以对4种主要儿茶素和CAF的可见近红外光谱进行回归分析。此外，通过CNN提取特征也获得了很好的建模效果(表3)，深度学习提取特征具有较大优势，并且基于SPA和CARS方法选择特征波长后的模型性能优于Original，这2种特征选择波长方法结合深度学习可以提高模型的准确性。深度学习作为建模和特征提取方法可用于回归问题的分析。

3 讨论

在鲜叶内含物统计分析中可以发现，‘JHC’和‘ZN25’的EGCG、EGC、ECG和EC在第1叶位的含量高于其他5个叶位，‘YS’的EGCG、EGC和ECGC在第1叶位的含量最高，每个品种茶叶的CAF从第1叶位到第3叶位含量基本一致，第4叶位到第6叶位含量则较低，这与Lin等[30]和Turkmen等[31]等的研究结果一致，茶树中的生化物质具有向上积累的趋势并且大部分储存在嫩叶中，在较老的叶子中很少。王峰等[32]在研究中也发现，不同品种的茶鲜叶6个叶位的儿茶素各个单体含量变化情况大致相同，从第1叶位至第6叶位依次递减。以上结果表明，茶树第1叶位叶片可为优质茶叶提供材料。

4 结论

本研究使用PLS方法对化学含量进行回归分析，并通过SPA和CARS方法简化建立的模型，然后又将CNN用于建模和特征提取，来预测4种主要儿茶素和CAF。结果表明，深度学习方法可以获得更好的模型效果，展现出巨大的优势。此外，试验是在没有任何处理的情况下对新鲜茶叶进行无损快速光谱扫描，实现了儿茶素和CAF的快速和无损测定，为Vis/NIR光谱在茶园精细化管理和嫩叶智能采摘中的应用奠定了基础。