基于蛋白组学技术的骆驼乳和牛乳蛋白差异分析

2022-09-05 11:16江宝塔穆哈德斯木扎帕尔木合塔尔丁泽人
现代食品 2022年16期
关键词:牛乳缓冲液结构域

◎ 江宝塔·穆哈德斯,木扎帕尔·木合塔尔,丁泽人

(1.新疆维吾尔自治区乳品质量监测中心,新疆 乌鲁木齐 830063;2.新疆畜牧科学院畜牧业质量标准研究所,新疆 乌鲁木齐 830011;3.新疆畜牧科学院饲料研究所,新疆 乌鲁木齐 830011)

针对目前乳品市场上存在的骆驼乳品质良莠不齐、特种乳掺假等问题,对骆驼乳及驼乳制品制订科学、有效的质量检测措施,建立基于蛋白检测的乳品质量监测系统,成为迫切需要解决的问题。本研究采用非标记(Label-free)定量蛋白质组学获得骆驼和牛乳源蛋白(去除酪蛋白)表达的差异变化。Labelfree定量技术可通过液相色谱-串联质谱(Liquid Chromatography-Tandem Mass Spectrometry, LC-MS/MS)技术获得的质谱图谱峰和强度来计算蛋白质的数目和相对定量值,从而鉴定蛋白质种数和相对质量[1]。样品上机检测前处理过程少,更多地保留了原始样本的信息。选择该技术对样本进行检测的主要原因包括以下5方面。①样品的类型不受限制,可对任意样本进行蛋白质定量和分析,每个样品可单独上机处理。②样本不需要特殊标记,排除了标记过程带入的实验误差风险[2]。③对于单个样本的蛋白总量要求相对较低,实验周期短,实验费用低[3-4]。④色谱和质谱具有较好的稳定性和重复性。⑤该技术可从蛋白的数量、表达差异及功能3个方面对样本进行全面分析。本研究首先明确骆驼乳和牛乳蛋白质的种数差异,揭示骆驼乳与牛乳乳源蛋白的表达差异,并分析骆驼乳差异蛋白的功能及通路,为后续建立基于乳源蛋白分析的乳品质量检测方法和评价体系提供有效的理论基础和数据参考。

1 材料与方法

1.1 材料与试剂

1.1.1 检测样品采集与制样

2021年10 月在新疆柴窝堡白杨沟村某骆驼和奶牛养殖户分别随机采集骆驼乳和牛乳各500 mL,冰盒保存送至实验室;样品在实验室中液氮储存后,放入装有干冰的保温盒送至新疆铭琮科技有限公司进行检测。将采集的驼乳与牛乳依不同比例均匀混合制得检测分析样,每种检测分析样设3个平行样,按顺序标记并编号,见表1。

表1 样本信息表

1.1.2 试剂

SDT缓冲液(4% SDS,100 mmol·L-1Tris-HCl,1 mmol·L-1DTT,pH 7.6)、SDT缓 冲 液(4%SDS,100 mmol·L-1DTT,150 mmol·L-1Tris-HCl,pH 8.0)、UA缓冲液(8 mol·L-1尿素,150 mmol·L-1Tris-HCl,pH 8.0)、碘乙酰胺(100 mmol·L-1IAA)、25 mmol·L-1碳酸氢铵缓冲液、BCA蛋白检测试剂盒(Bio-Rad,美国)、0.1%(v∶v)甲酸、5X上样缓冲液、12.5% SDS-PAGE凝胶、考马斯亮蓝R-250和84%乙腈。

1.2 仪器与设备

C18墨盒(Empore™ SPE Cartridges C18,Sigma)、 紫外分光光度计(HACH)、电泳仪(biorad)、Q萃取 质谱仪(Thermo Scientific)和EASY-nLC系统(Thermo Fisher Scientific)。

1.3 实验方法

1.3.1 蛋白质提取与消化

(1)蛋白质裂解与提取。将乳样品加入SDT缓冲 液(4% SDS,100 mmol·L-1Tris-HCl,1 mmol·L-1DTT,pH7.6)进行蛋白质的裂解和提取。使用BCA蛋白检测试剂盒测定蛋白量[5]。

(2)蛋白质消化。胰蛋白酶的蛋白质消化按照MANN等[6]描述的过滤辅助样品制备(Filter-Aided Sample Preparation,FASP)程序进行,具体步骤为每个样品取200 μg提取的蛋白质置于30 μL的SDT缓冲 液 中(4%SDS,100 mmol·L-1DTT,150 mmol·L-1Tris-HCl,pH 8.0)。接着加入UA缓冲液(8 mol·L-1尿素,150 mmol·L-1Tris-HCl,pH 8.0)重复超滤 (Microcon units,10 kD),再加入100 μL碘乙酰胺 (100 mmol·L-1IAA)阻断还原的半胱氨酸残基,置于黑暗处孵育30 min。孵育后使用100 µL UA缓冲液洗涤过滤器3次,100 µL 25mmol·L-1碳酸氢铵缓冲液洗涤2次。最后将4 µg胰蛋白酶置于40 µL 25 mmol·L-1碳酸氢铵缓冲液,37 ℃过夜消化,收集得到的多肽作为滤液。每个样品获得的多肽在C18墨盒上脱盐,真空离心浓缩,再加入40 µL 0.1%(v∶v)甲酸进行重组。使用280 nm的紫外光谱估计肽含量。

1.3.2 SDS-PAGE

每个样品取20 µg蛋白分别与5X上样缓冲液混合,煮沸5 min。蛋白质在12.5% SDS-PAGE凝胶(恒定电流14 mA,90 min)上分离。考马斯亮蓝R-250染色可见蛋白条带。

1.3.3 液相色谱串联质谱技术(LC-MS/MS)分析

LC-MS/MS分析在Q萃取质谱仪上进行,并耦合到液相系统EASY-nLC上120 min。将缓冲液A(0.1%甲酸)与多肽样品装载到与C18反向分析柱连接的反相捕集柱上,以缓冲液B(84%乙腈和0.1%甲酸)为线性梯度洗脱进行分离,流速为300 NL·min-1,采用IntelliFlow技术控制。质谱仪在正离子模式下工作以收集数据,仪器将选择丰度最高的母离子进行二级质谱绘制,从调查扫描(300~1800m/z)中动态选择最丰富的前驱体离子进行HCD片段化。自动增益控制(AGC)目标设置为3e6,最大注入时间设置为 10 ms。动态排除持续时间为40.0 s。在m/z200下的分辨率为70000,在m/z200下HCD光谱的分辨率设置为17500,隔离宽度为2m/z。归一化碰撞能量为30 eV, 欠填充比定义为在最大填充时间内可能达到的目标值的最小百分比。该仪器运行时启用了肽识别模式。

1.3.4 蛋白质的鉴定和定量

使用MaxQuant 1.5.3.17软件对每个样本的MS原始数据进行组合和检索。

对照组与实验组在IEMG贡献率上具有高度的一致性。贡献率比较高的下肢骨骼肌为股外侧肌、胫骨前肌、股内侧肌和股直肌。股外侧肌、股内侧肌、股直肌都属于股四头肌,可以使小腿伸,近固定时可以使大腿屈,远固定时使大腿在膝关节处伸。太极拳练习中的弓步、虚步动作中的主要主动发力肌肉为股四头肌,具有维持平衡或控制动作的作用,弓步和虚步中,也都需要胫骨前肌的收缩使踝关节跖屈。以上肌肉均属于大腿和小腿的前群肌肉,因此,可以认为在太极拳运动中下肢骨骼肌的前群肌肉起主导作用,后群肌肉主要起协同、平衡和固定关节的作用。这表明,太极拳练习缺乏对股二头肌、腓肠肌等大腿和小腿后群肌力的练习。

1.3.5 生物信息学分析

磷酸化多肽的聚类分析使用Cluster 3.0和Java Treeview软件进行层次聚类分析。基序分析采用MeMe分析。亚细胞定位采用CELLO分类系统[7]。域注释使用InterProScan软件搜索蛋白质序列,以从InterPro成员数据库Pfam中识别蛋白质结构域签名[8]。GO注释利用NCBI BLAST+客户端软件(NCBIBLAST-2.2.28+-win32.exe)和InterProScan软件对所选差异表达蛋白的蛋白序列进行局部搜索,寻找同源序列,然后利用Blast2GO软件绘制基因本体(GO)术语并进行序列注释[9]。GO注释结果由R语言绘制。KEGG注释按照注释步骤,将研究的蛋白质通过京都基因和基因组百科全书(KEGG)在线数据库(http://geneontology.org/)检索其KEGG orthology标识,并随后映射到KEGG中的通路[10]。富集分析Fisher精确检验。蛋白质-蛋白质相互作用分析通过基因符号或STRING软件从完整分子相互作用数据库中检索,结果以XGMML格式下载并导入Cytoscape软件进行可视化。

2 结果与分析

2.1 蛋白质鉴定结果统计

单个样本的蛋白质鉴定数量统计见表2。本研究实验组共计鉴定出800个蛋白质。通过使用韦恩图分析组间样本之间蛋白质的重叠情况,发现共有264个蛋白质发生重叠,实验组间具有多个差异蛋白质(图1)。

图1 组间蛋白质鉴定结果Venn图

表2 蛋白质鉴定结果统计表

2.2 蛋白表达差异结果数量统计

以FC>2倍且P<0.05为标准,筛选显著性差异蛋白质;以蛋白质存在于同一组样本中2个或以上平行样本,但不存在于另一组样本为标准,筛选有/无差异蛋白质。由表3和图2可知,C10与M10相比,显著性差异蛋白表现上调的有89个,其中接近一半的蛋白质(43/89,48.31%)差异倍数>10倍;表现下调的有19个,其中26.32%(5/19)的蛋白质差异倍数>10倍。C9、C8和C7与M10相比,显著性差异表现上调或下调的蛋白质种数均与C10与M10相比的结果相似。对5个分组之间比较差异表达蛋白,结果显示,共计136个蛋白质可以区分不同实验组,包括α-乳清蛋白(Alpha-lactalbumin)、乳清酸性蛋白(Whey acidic protein)和载脂蛋白C-II(Apolipoprotein C-II)等。

2.3 显著性差异蛋白质聚类分析

采用凝聚层次聚类算法对实验组的差异表达蛋白质进行分组归类,结果表明本研究的实验分组合理有效,择取的差异表达蛋白具有代表性。由图3可知,C10与C9的差异表达蛋白质区分不明显,但C8、C7较为直观地显示约1/3的差异表达蛋白表现下调。C10与M10相比,牛乳中表现上调的差异表达蛋白质在骆驼乳中的表达量较低。表明骆驼乳与牛乳的差异表达蛋白类别可有效区分骆驼乳品质,此发现可为建立骆驼乳源检测技术提供可靠的数据基础。

2.4 差异表达蛋白的亚细胞定位分析

由图4可知,对比5个分组的差异表达蛋白亚细胞定位,其中有59个蛋白质定位于细胞质(Cytoplasmic),42个蛋白质定位于细胞外(Extracellular),40个蛋白质定位于细胞核(Nuclear),13个蛋白质定位于细胞膜(Plasma Membrane),9个蛋白质定位于线粒体(Mitochondrial),3个蛋白质定位于溶酶体(Lysosomal),2个蛋白质定位于过氧化物酶体(Peroxisomal),2个蛋白质定位于内质网(ER),另外2个定位于其他细胞器。了解差异表达蛋白定位的亚细胞结构,可为后续建立基于乳源蛋白的骆驼乳及驼乳制品质量检测提供检测位点区域的选择,以便制造或研究出方便、快捷、高效的检测试剂。

图4 5个实验组差异表达蛋白质亚细胞定位饼图

2.5 差异表达蛋白结构域分析

由图5可知,位于Ras家族(Ras family)结构域的蛋白质种数最多,含有9个,其次是Hsp70蛋白(Hsp70 protein)结构域、β-酮酰基合成酶,N-端 结 构 域(Beta-ketoacyl synthase,N-terminal domain)、α-2-巨球蛋白家族(Alpha-2-macroglobulin family)结构域和14-3-3蛋白(14-3-3 protein)结构域等。由图6可知,酮酰基-合成酶C-末端延伸(Ketoacyl-synthetase C-terminal extension)、聚酮合酶脱水酶(Polyketide synthase dehydratase)、kringle domain(KR domain)、β-酮酰基合成酶,C-端结构域(Beta-ketoacyl synthase,C-terminal domain)、酰基转移酶结构域(Acyl transferase domain)、β-酮酰基合成酶,N-端结构域(Beta-ketoacyl synthase,N-terminal domain)这5个结构域的蛋白富集度显著性较高。

图5 5个实验组差异表达蛋白质结构域分析图

图6 5个实验组结构域富集分析图

Domain Name(Top 20)为结构域名称(蛋白质数目排名前20);The number of Proteins为蛋白质数 目;Domain Analysis为结构域分析。

2.6 差异表达蛋白的GO功能分析

一般情况下,差异表达蛋白的种数在某一功能类别越多,表明该功能越重要。以GO功能在Ontologies的树形分支结构中所处的2级层次注释结果进行统计,生物过程(Biological Process,BP)中细胞转化(Cellular process)、生物调节(Biological regulation)、刺激反应(Response to stimulus)、代谢过程(Metabolic process)和生物过程的调控(Regulation of biological process)等18个类别的蛋白质种数相对较多(均>2);分子功能(Molecular Function,MF)中结合功能(Binding)、催化活性(Catalytic activity)和分子功能调节(Molecular function regulator)等5个类别的蛋白质种数相对较多(均≥2);细胞组分(Cellular Componen,CC)中细胞外区域(Extracellular region)、细胞(Cell)、细胞区域(Cell part)、细胞器(Organelle)和细胞外区域组分(Extracellular region part)等14个类别的蛋白质种数均居多(均>2)(图7)。说明骆驼乳中差异表达蛋白质与生物体机体能量代谢调节与组织修复过程紧密相关。

图7 5个实验组差异表达蛋白质的GO注释统计图(Level 2)

筛选出Top 20显著富集的GO条目,由图8可知,BP中显著富集的GO条目为细胞器定位的建立(Establishment of organelle localization);MF中 显著富集的GO条目为氧化还原酶活性(Oxidoreductase activity);CC中显著富集的GO条目为黏附连接(Adherens junction)。这些具有高显著水平富集度的GO功能类别下的蛋白质在进一步研究骆驼乳差异表达蛋白质的生物学实验验证或机制研究中具有重要意义。

图8 5个实验组GO功能富集Top 20柱状图

2.7 差异表达蛋白的KEGG功能分析

由图9可知,5个实验组间参与细胞内吞作用(Endocytosis)的差异表达蛋白质最多,属于运输和分解代谢(Transport and catabolism)途径,此可能与驼乳相比于牛乳更能改善机体脂肪、糖代谢能力相关;PI3K-Akt信号通路(PI3K-Akt signaling pathwa)和肌动蛋白细胞骨架的调控(Regulation of actin cytoskeleton),分别属于信号转导(Signal transduction)和细胞蛋白(Cell motility)途径,此可能与驼乳相比于牛乳具备更好的细胞修复,促进已损害胰岛β细胞功能恢复能力相关;进一步分析差异表达蛋白质在代谢通路中的富集特征,实验组间显著富集在AMPK信号通路(AMPK signaling pathway)(图10),以其进行可视化展示,可见多个骆驼乳专属差异表达蛋白(图11,无背景色边框),包括PP2A、HMGR、HSL等。明确差异表达蛋白的信号通路及其所在信号通路中的位置,可为建立骆驼乳及驼乳制品质量标准筛选出个性化、可靠的蛋白检测提供详尽的数据基础,同时可为后续进一步研究功能性乳制品提供依据。

图9 5个实验组差异表达蛋白质的KEGG通路注释及归属柱状图

图10 5个实验组KEGG通路富集气泡图

图11 5个实验组差异表达蛋白的AMPK信号通路图

2.8 差异表达蛋白的互作网络分析

根据差异表达蛋白的聚集程度,将其分为5个簇,每个簇中的蛋白质具有相同/相似的功能(图12)。A0A5N4EFP0蛋白的连接度最高,其所在KEGG通路为甲状腺激素合成通路(Thyroid hormone synthesis),属于血清白蛋白,该蛋白发生变化可能会使系统受到干扰,是维持系统平衡和稳定的关键,从系统生理学上看,驼乳与牛乳相比,差异蛋白A0A5N4EFP0紧密连接的甲状腺激素合成通路对机体脑、骨骼、神经发育,神经系统双向调节,糖、脂肪代谢,组织细胞蛋白合成以及心血循环系统稳定等紧密相关,此为驼乳新功能探索提供了参考。互作网络分析还发现具有其他的蛋白质在生物学调控中发挥重要作用,为骆驼乳及驼乳制品质量检测方法的建立提供了更为清晰的蛋白选择方向。

图12 5个实验组间差异表达蛋白质相互作用网络归类图

3 结语

通过Label-free定量蛋白质组生物信息学分析对实验组的蛋白质种数、差异蛋白表达及其功能进行全面分析,对不同配比骆驼乳和牛乳间蛋白质的差异有初步的了解。①100%骆驼乳的蛋白质种数是100%牛奶蛋白质种数的近3倍,加入了10%、20%、30%牛奶的骆驼乳蛋白质种数略微减少,从蛋白质种数检测上无法有效区分骆驼乳品质。②5个实验组间的差异表达蛋白共有136个,包括α-乳清蛋白、乳清酸性蛋白和载脂蛋白C-II等,这些蛋白质的检测均可有效地区分不同品质骆驼乳及驼乳制品。③差异表达蛋白功能分析显示,骆驼乳差异表达蛋白的功能类别丰富,附含在多个信号通路上,这些通路与抗糖尿病、促进伤口愈合、增强肌肉力量、抗菌抗炎、促进骨骼生长、内分泌激素调节、神经营养以及代谢调节等有关。

本研究为骆驼乳及驼乳制品的质量检测提供了方向,后续可利用已获得的差异蛋白及其表达量差异和功能差异信息建立检测技术,挖掘出可广泛应用于骆驼乳及驼乳制品加工过程中质量检测、货品出厂检测及市场监督检测且高效、快速、便捷、节约成本的检测试剂或试纸。此外,可利用差异蛋白功能信息更深入研究其对机体健康功能的影响,骆驼乳的差异蛋白功能涉及生物体的生长、代谢、免疫和疾病等多个方面,骆驼乳中的差异蛋白对不同人群的体质、健康功能状态的影响值得探讨。基于驼乳牛乳差异蛋白研究的相关功能性的骆驼乳制品和涉及机体代谢、神经系统调节的医用药品均有待进一步的探索。

猜你喜欢
牛乳缓冲液结构域
细菌四类胞外感觉结构域的概述
SEMA3A、SEMA3B蛋白免疫组化染色中抗原修复方法的优化
牛乳中脂肪掺假检测技术的研究进展
pH(酸度)计的选择、使用及保养
新型醋酸纤维素薄膜电泳缓冲液的研究
UBR5突变与淋巴瘤B细胞成熟
牛乳的滋气味与调香初探
用毛细管电泳检测牦牛、犏牛和藏黄牛乳中β-乳球蛋白的三种遗传变异体
DEP结构域的功能研究进展
水稻DnaJ蛋白的生物信息学分析