胰蛋白酶镜像酶LysargiNase的开发及其在蛋白质组学研究中的应用

2019-02-04 03:05张俊令彭雪辉王富强徐平
生物工程学报 2019年5期
关键词:赖氨酸残基精氨酸

张俊令,彭雪辉,2,王富强,徐平,2

1 军事科学院军事医学研究院 生命组学研究所 蛋白质组学国家重点实验室 国家蛋白质科学中心 (北京) 北京蛋白质组研究中心,北京 102206

2 武汉大学 药学院 组合生物合成和药物开发教育部重点实验室,湖北 武汉 430071

蛋白质不仅是细胞的主要组成成分,也是生物学功能的主要执行者。蛋白质组学是系统鉴定、定量蛋白质及其翻译后修饰形式,并研究这些蛋白质生物学功能的新兴学科。随着质谱技术的快速发展,基于质谱的蛋白质组学方法已经成为生命科学和健康医学研究中不可或缺的工具[1]。

鸟枪法是基于质谱的蛋白质组学最常用的研究策略。其技术流程是先将蛋白质组样品经位点特异性蛋白酶消化形成肽组,再进行高效液相色谱分离和质谱检测。其中位点特异性蛋白酶的研发和使用是高效蛋白质组学技术发展的前提和基础[2]。

随着蛋白质组研究的迅速发展,新的特异性蛋白酶陆续被开发,多组合酶切方法的建立促进了蛋白质组深度覆盖鉴定技术的发展,也进一步提升了翻译后修饰位点鉴定的效率[3-4]。

1 蛋白质组学研究中常用的蛋白酶

1.1 C端蛋白酶

胰蛋白酶 (Trypsin) 是蛋白质组学研究中最常用的蛋白酶,可以高效、特异地切割赖氨酸和精氨酸的C端。由于赖氨酸和精氨酸在蛋白质序列中分布较广,蛋白质样品经Trypsin消化后可产生平均长度为14个氨基酸残基并以碱性氨基酸结尾的肽段[3,5-8]。这些肽段的羧基端的赖氨酸或精氨酸残基上以及氨基端分别带有一个正电荷[9],使得它们在离子阱中碰撞诱导解离(Collision-induced dissociation,CID) 时产生b、y类型(y离子为主)的离子碎片,便于被质谱有效检测[9-11]。因此,胰蛋白酶贡献了目前蛋白质组数据库中绝大部分的数据[3]。

丝氨酸蛋白酶LysC可特异性地切割赖氨酸的C端,对多种变性剂,如即使高达8 mol/L的尿素,都具有较好的耐受性,因此,LysC经常被用于Trypsin处理之前的消化,可提高Trypsin的消化效率[4],从而实现蛋白质组的高效鉴定。

同属丝氨酸蛋白酶的GluC能特异切割天冬氨酸和谷氨酸的C端,但其酶切特异性受制于反应缓冲液的pH值和组成成分[3,12]。在碳酸氢铵和醋酸铵缓冲液中,该酶对谷氨酸残基的酶切特异性高达80%左右,而对天冬氨酸残基的酶切特异性仅占8%左右;而在磷酸盐缓冲液中,谷氨酸和天冬氨酸残基均可被酶切。GluC 用于多组合酶切可以有效缩短那些不含赖氨酸和精氨酸肽的长度,使之更容易被检测,从而有效提高蛋白质鉴定的覆盖度。

ArgC则是一种半胱氨酸蛋白酶,可以特异性地切割精氨酸的C端。此外,该酶还可以低效切割赖氨酸的C端。因此,ArgC的酶切特异性较差[13],经常用于多组合酶切,从而提高蛋白质鉴定的覆盖度[14]。

胃蛋白酶 (Pepsin) 属天冬氨酸蛋白酶,倾向于切割芳香族氨基酸 (酪氨酸、苯丙氨酸和色氨酸) 的C端,它在低pH (pH 1–4)下活性最高,对于二硫键的质谱解析非常有利[4]。

糜蛋白酶 (Chymotrypsin),又叫胰凝乳蛋白酶,可以切割疏水性氨基酸 (苯丙氨酸、酪氨酸、亮氨酸、色氨酸和甲硫氨酸等) 的C端,可用于膜蛋白的跨膜区域的鉴定。但是,由于该酶的酶切位点为多种疏水性氨基酸而容易导致过多的漏切[4]。

同属丝氨酸蛋白酶的野生型和突变型α-溶解性蛋白酶 (α-lytic protease,WaLP/MaLP) 可以特异性地切割脂肪族氨基酸的羧基端,因此,WaLP/MaLP可以用于膜蛋白的鉴定。但是,由于酶切位点太多,消化产生的肽段较随机,会影响蛋白质组学实验数据的重复性[4,15]。

另外,在结构蛋白质组学研究中,非特异性的蛋白酶K (Proteinase K) 被应用于交联肽的结构解析[16];在膜蛋白的鉴定中,利用蛋白酶K消化产生的重叠肽帮助鉴定共价修饰 (磷酸化和甲基化)[17]。

1.2 N端蛋白酶

除这些C端蛋白酶外,越来越多的N端蛋白酶被发现和应用。如金属蛋白酶AspN,可以特异性地切割天冬氨酸的N端或谷氨酸的N端。同属金属蛋白酶的LysN则特异地切割赖氨酸的N端。而赖氨酸精氨酸N端蛋白酶 (LysargiNase) 是一种锌离子依赖的金属蛋白酶,可以特异性地切割赖氨酸和精氨酸的N端。

这些切割特异位点的N端蛋白酶与对应的C端蛋白酶,如 LysC/LysN[18]、GluC/AspN[4]、Trypsin/LysargiNase[19]可以产生除末端氨基酸残基之外中间位置的氨基酸顺序一致的肽段[20],因此被形象地称为镜像酶。在质谱检测时,N端蛋白酶酶切产生的肽段中碱性氨基酸残基位于N端,使得电荷主要集中分布在肽段的N端,因此,在CID/HCD碎裂模式下形成的谱图具有比y系列离子更强的b系列离子峰,与普通C端蛋白酶消化肽段得到的y离子峰较强的特性形成互补,成对使用可以提高碎片离子的覆盖度,实现所鉴定肽段的完整测序[20]。

其中,最近发现、鉴定的胰蛋白酶的镜像酶——LysargiNase表现出较高的酶切特异性和活性,与Trypsin组合使用显示了广泛的应用前景,因此,文中对其特点及应用进行综述。

2 LysargiNase的发现

LysargiNase的发现源于对人妊娠相关血浆蛋白A (Pregnancy-associated plasma protein A,PAPP-A)的研究。PAPP-A是metzincin部落(Metzincin clan) 中的一员,也称为pappalysin-1或IGFBP-4蛋白酶,是一种高度糖基化的170 kDa的多结构域蛋白酶,特异性切割胰岛素样生长因子结合蛋白 (IGFBPs)。Tallant等通过生物信息学检索分析,从古菌嗜乙酸甲烷八叠球菌Methanosarcina acetivoransC2A 中鉴定了一个新的可能的PAPP-A,将其命名为“ulilysin”[21]。

通过对ulilysin和pappalysin的底物特异性和活性的研究,Tallant等发现ulilysin可以特异地切割赖氨酸和精氨酸的N端[22-23]。2015年Huesgen等根据ulilysin的酶切位点特异性将其名称改为LysargiNase[19]。由于LysargiNase的酶切位点与Trypsin成镜像,因此,也称之为胰蛋白酶镜像酶。

3 LysargiNase的特性

3.1 LysargiNase的结构

在嗜乙酸甲烷八叠球菌中,LysargiNase以酶原形式表达,由342个氨基酸组成,分子量大小为40 kDa。在Ca2+的介导下,LysargiNase酶原(Pro-LysargiNase) 可以在Arg61和Ala322两个位点发生自切,从而产生有活性的29 kDa成熟的LysargiNase (Arg61–Ala322)[21]。

LysargiNase是唯一一个被发现的古菌pappalysin,与人类PAPP-A具有序列相似性,均属于金属蛋白酶中的锌金属蛋白酶超家族(Zincins superfamily) 中的 metzincin部落(Metzincin clan)。该部落中的蛋白酶都包含一个锌结合共有序列 (Zinc-binding consensus sequence,ZBCS) HEXXHXXGXXH/D (X代表20种氨基酸中的任何一种)。该序列提供了3个锌配体残基(由3个或2个组氨酸和1个天冬氨酸组成) 和作为广义碱 (General base) 的谷氨酸残基,具有高度保守性[21]。此外,该部落蛋白在邻近活性中心特定位置还有一个含甲硫氨酸的1,4-β-转角,称之为甲硫氨酸转角 (Met turn),甲硫氨酸转角在结构和空间上具有保守性,且对于酶结构的完整性和功能的发挥是不可缺少的[24]。Metzincin部落的命名也源于此特性。Metzincin部落已有多个家族成员,如虾红素astacins、ADAMs4/adamalysins、serralysins、matrix metalloproteinases (MMPs)、leishmanolysins、snapalysins和 pappalysins,它们均已有其蛋白质结构信息,为深入研究这些蛋白的功能创造了条件[25-29]。

根据这些蛋白质结构预测,metzincin部落成员具有相似的骨架结构和活性位点。利用锌结合蛋白家族蛋白酶的序列和结构相似性,预测LysargiNase (Arg61–Ala322) 的二级结构主要包括8个β链 (β-strand) (β1、β2、β3、β4、β5、β6、β7、β8)和5个α螺旋 (α-helix) (α1、α2、α3、α4、α5),其三维结构为椭球状分子[21]。

LysargiNase分子可被锌离子结合位点即活性位点分为两部分。其中,一部分是富含规则的二级结构的蛋白质N端亚结构域 (NTSD,Arg61–Asn235),另一部分为具有不规则二级结构的蛋白质C端亚结构域 (CTSD,Leu236–Ala322)。NTSD是通过强烈扭曲的 β1从分子的背面进入,主要是5个平行的β折叠片;CTSD起始于Leu236,并具有可作为两个邻近钙结合位点的支架[24]。

LysargiNase活性位点裂缝的顶部由NTSD的反平行链β7 (其反向平行于结合的肽底物) 和β5–β6带构成,其中,β5–β6带远离活性位点裂缝的区域用来调节填装进去的底物残基。裂缝底部由CTSD内的Tyr237–Trp240、Pro265–Gly268、甲硫氨酸转角 (Met turn) 及其后的4个残基(Asn288–Asp295) 的片段组成[23]。起催化作用的锌离子通过溶剂分子和ZBCS中的His228、His232和His238的N原子形成四面体配位嵌入活性位点α4中。

控制LysargiNase活性的开关是2个钙离子[24]。它们的结合位点位于LysargiNase的CTSD中。当钙离子缺失时,LysargiNase是无活性的;当钙离子存在时,该酶的结构才能被固定,并具有特异的酶切活性。

3.2 LysargiNase的蛋白酶活性

LysargiNase可特异地切割赖氨酸和精氨酸的N端,酶切特异性高达92%,而且与Trypsin类似,酶切活性略倾向于赖氨酸残基 (K∶R约52%∶40%)[19]。由于LysargiNase的酶切特点,可以产生N端带碱性氨基酸残基 (K/R) 的肽段,这种肽段的正电荷都位于其N端,因此,胰蛋白酶镜像酶消化的肽段在CID和HCD碎裂模式下产生以b离子为主的碎片离子,而在ETD碎裂模式下产生以c离子为主的碎片离子[20]。不仅如此,LysargiNase消化产生的肽段在碎裂时也易产生a离子,这些a离子可增加肽段鉴定的可信度[19]。

LysargiNase还可切开多种翻译后修饰,如甲基化、对称或不对称的二甲基化修饰的赖氨酸或精氨酸残基的N端,呈现出一定的二位、三位的羧肽酶活性。但LysargiNase无法切开乙酰化修饰的赖氨酸残基[19],这为该酶的结构改造和稳定性研究指明了方向。

LysargiNase的特性研究显示了与Trypsin有很好的互补性,因此Trypsin/LysargiNase的联合使用或许可以弥补各自单独使用的缺陷,为解决质谱蛋白质鉴定中的系列难题提供广阔的应用前景。

4 LysargiNase在蛋白质组学研究中的应用

4.1 蛋白质C末端蛋白质组鉴定

蛋白质羧基端的氨基酸序列及其修饰状态影响着蛋白质的生物学功能,在多种生物学过程中发挥重要作用。例如,许多生物活性肽羧基端的α-酰胺化可以中和羧基的负电荷,从而提高其与受体的结合能力,增强结合的稳定性[30]。因此蛋白质羧基端结构解析至关重要[31-32]。

在基于质谱的蛋白质组学研究中,传统的Trypsin可以特异性地切割赖氨酸和精氨酸的C端,产生C端带碱性氨基酸的肽段,但这使得蛋白质的羧基端肽段缺乏碱性氨基酸从而易产生一价离子,不能被质谱检测。LysargiNase可特异地切割赖氨酸和精氨酸的N端,产生N端带碱性氨基酸的肽段,这一特点可有效促进蛋白质羧基端肽段的鉴定。质谱检测发现,Trypsin消化的MDA-MB-231细胞裂解物中鉴定到39个蛋白质C端肽段,占肽段总鉴定量的0.9%;而在LysargiNase消化的MDA-MB-231细胞裂解物中鉴定到了70个蛋白C端肽段,占肽段总鉴定量的2.1%,是胰蛋白酶的2倍[19]。因此,利用LysargiNase可实现蛋白质C端蛋白质组学深度覆盖。

4.2 磷酸化蛋白质组研究

2015年Overall等[19]研究发现,LysargiNase可在Trypsin基础上将磷酸化位点的覆盖度提高23%。有意思的是LysargiNase更有利于鉴定到RXS和RXXSP等类型的motif。而这一类motif正是PKC、ERK和CDK5等激酶识别的底物[33]。2017年Heck等关于LysargiNase的研究表明,ETD碎裂模式可将LysargiNase酶切后的产物二级谱鉴定率由20%提高到41%。他们分别利用Trypsin和LysargiNase鉴定到12 280个和6 686个磷酸化位点,但其中仅有3 852个位点被共同鉴定,LysargiNase单独鉴定到2 834个磷酸化位点,使得磷酸化位点的鉴定量提高了18.7%。对这些位点的深入分析发现,LysargiNase对某些位点的鉴定具有偏好性,如RB1的S788 和Y813位点只能被LysargiNase鉴定到,不能被Trypsin鉴定到[20]。

我们实验室的研究发现,LysargiNase酶切后鉴定的磷酸化肽段与Trypsin具有很强的互补性。因此用它来提高磷酸化蛋白质组覆盖度的同时,也能够提供新的磷酸化motif和位点信息 (Peng,X et al.未发表数据)。

4.3 甲基化蛋白质组鉴定

蛋白质甲基化是一种重要的翻译后修饰,主要发生在精氨酸和赖氨酸残基上。蛋白质的甲基化修饰参与多种细胞过程,包括信号转导、mRNA剪接、转录控制、DNA修复和蛋白质易位等。精氨酸的甲基化主要有ω-NG-单甲基精氨酸(MMA)、ω-NG,NG-不对称二甲基精氨酸 (aDMA)和ω-NG,NG-对称二甲基精氨酸 (sDMA) 3种形式[34]。赖氨酸的甲基化主要有ε-N-单甲基赖氨酸、ε-N-二甲基赖氨酸或ε-N-三甲基赖氨酸3种类型[35-36]。蛋白质甲基化的失调通常与各种疾病状态相关,包括癌症[37-38]、心血管和肺部疾病[37]、神经退行性疾病[39-41]等。因此,对于蛋白质甲基化修饰的鉴定有助于相关疾病的诊疗。

在翻译后修饰蛋白质组学研究中,胰蛋白酶(Trypsin) 对于被修饰的赖氨酸和精氨酸残基会产生漏切,从而影响甲基化位点的鉴定[11,42]。而LysargiNase可以切割甲基化修饰的赖氨酸和精氨酸,比Trypsin切割甲基化赖氨酸的能力高出7倍左右[19]。另外,LysargiNase还可以切割精氨酸的3种甲基化形式,而Trypsin只能切割未修饰的精氨酸[1]。Ma等[43]利用LysargiNase和Trypsin的组合酶切,将甲基化位点的鉴定量在传统的Trypsin消化基础上提高了80%,且LysargiNase消化产生的甲基化肽段表明其切割可能更倾向于某些特定motif,例如RG、RGG等。

LysargiNase与Trypsin的互补性可用于提高甲基化位点的鉴定量,促进表观遗传学的研究和甲基化修饰相关疾病的研究。

虽然LysargiNase与Trypsin相比,在鉴定翻译后修饰方面有较好的优势和补充,但是,实验数据显示LysargiNase的肽段和蛋白鉴定量略低于Trypsin[17],而镜像酶的成对使用对两个酶的活性、位点特异性等提出了更高的要求。因此,要想使LysargiNase和Trypsin组合的使用发挥更好的作用,可能需要根据LysargiNase的结构和活性特点对其进行改造。

5 小结与展望

蛋白质及其翻译后修饰鉴定技术的发展得益于位点特异性蛋白酶的开发和性能的改善。以LysargiNase为代表的镜像酶的开发及其在蛋白质组学研究中的应用,不仅促进了传统蛋白质组学中难鉴定的C端蛋白质组研究,提升了蛋白质组研究的技术水平,而且已为多种蛋白质翻译后修饰鉴定研究提供了强有力的技术支持。随着对LysargiNase性质认识的不断深化、样品制备技术的改进以及质谱技术的发展,针对LysargiNase开发出更加高效甚至全新的鉴定策略,必然会进一步推动蛋白质组学深度覆盖鉴定和定量技术的进步,为深入探究蛋白质在生命活动中的功能奠定坚实的技术基础。

猜你喜欢
赖氨酸残基精氨酸
有氧运动和精氨酸补充对高血压的干预作用及其与内皮细胞功能的关系
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
水介导的通讯路径对脂肪酶热稳定性的影响
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
精氨酸改善宫内发育迟缓、对胎儿生长发育及母猪繁殖性能的影响
2015年赖氨酸市场回顾及2016年趋势展望
精氨酸联合谷氨酰胺肠内营养对烧伤患者的支持作用
精氨酸、可乐定、精氨酸联合左旋多巴不同激发试验对GH分泌的影响
2013年赖氨酸市场回顾及2014年趋势展望