栽培种花生FAE1基因的克隆和序列分析

2018-08-14 09:42张欣孙全喜吴琪王秀贞胡东青唐月异王志伟宋国生徐建志殷冬梅王传堂
山东农业科学 2018年6期
关键词:生物信息学分析基因克隆花生

张欣 孙全喜 吴琪 王秀贞 胡东青 唐月异 王志伟 宋国生 徐建志 殷冬梅 王传堂

摘要:脂肪酸链延长酶1(FAE1)是控制脂肪酸延长的关键酶,对芥酸的生物合成有至关重要的作用。本研究从栽培种花生的两个染色体组中分别克隆得到2个FAE1基因,命名为FAE1-A和FAE1-B。FAE1只有一个开放阅读框,无内含子,完整编码区长1 536 bp,编码511个氨基酸。利用相关软件或在线工具对FAE1进行生物信息学分析,结果表明其编码蛋白二级结构以α螺旋为主;无信号肽,表明FAE1蛋白不是分泌蛋白,而是在细胞中发挥作用,且主要存在于内质网上;FAE1蛋白不稳定系数小于40,总平均亲水系数为负数,属于不稳定的亲水性蛋白。本研究可为花生低芥酸育种提供依据。

关键词:FAE1;芥酸;花生;基因克隆;生物信息学分析

中图分类号:S565.2:Q781文献标识号:A文章编号:1001-4942(2018)06-0035-06

Abstract Fatty acid elongation 1 (FAE1) is a key enzyme that controls the elongation of fatty acids and plays a crucial role in the biosynthesis of erucic acid. In this study, two FAE1 genes, FAE1-A and FAE1-B, were cloned from two genomes of the cultivated peanut, respectively. FAE1 had only one open reading frame, no introns, and the complete coding sequence of the gene is 1 536 bp, encoding 511 amino acids. The bioinformatics analysis results showed that the secondary structure of FAE1 protein was mainly α-helix; there was no signal peptide, indicating that FAE1 was not secretory protein, and it worked in cells and mainly existed in endoplasmic reticulum; the instability coefficient of FAE1 was lower than 40 and the total mean hydrophilic coefficient was negative, so FAE1 was unstable hydrophilic protein. The study may facilitate peanut breeding for low erucic acid content.

Keywords FAE1; Erucic acid;Peanut; Gene cloning; Bioinformatics analysis

芥酸(C22∶1)是一种常见于十字花科植物种子中的长链脂肪酸,不易被人体消化吸收。试验证明,芥酸积累会引起心肌脂肪沉淀并导致心肌脂肪代谢障碍,严重危害健康[1-3]。因此,低芥酸含量已成为食用油品质的一项重要指标。

FAE1是控制脂肪酸碳链延长的关键基因[4]。该基因所编码的酶是长链脂肪酸合成过程的限速酶,决定了脂肪酸碳链的长度[5]。现已从拟南芥、甘蓝型和芥菜型油菜等植物中克隆到该基因[6-8],虽然不同材料中FAE1基因在长度与序列上存在差异,但均无内含子[9]。目前已将拟南芥FAE1基因转化到酵母、拟南芥、烟草和油菜中,FAE1的表达能使酵母和烟草的长链脂肪酸积累,且擬南芥和油菜基因组中FAE1拷贝数的增多使长链脂肪酸含量明显升高[4]。

花生含有丰富的蛋白质和脂肪,是我国主要的油料作物之一。据报道,有的花生品种(系)芥酸含量超出我国花生油国标(≥0.3%)[10]。本研究旨在克隆花生栽培种FAE1基因,为花生低芥酸遗传育种提供依据。

1 材料与方法

1.1 试验材料

栽培种花生F112-2(C1×FB4杂交后代)。

1.2 基因完整编码区获取

查找PeanutBase(https://www.peanutbase.org/home)获取二倍体野生种Arachis duranensis和A. ipaensis的FAE1编码区序列,其在PeanutBase中的ID分别是Aradu.RBU21和Araip.YN0DS。

1.3 引物设计

根据野生种A. duranensis和A. ipaensis的FAE1序列,利用Primer Premier 5.0软件分别设计引物,经过PCR引物筛选确定最终引物(表1)。

1.4 PCR扩增、克隆测序与序列比对

PCR反应体系(50 μL):PrimesSTAR GXL DNA Polymerase 1 μL,正反向引物各2 μL,模板2 μL,5×PA GXL Buffer 10 μL,2.5 mol/L dNTP 4 μL,加ddH2O补足体系。反应程序:94℃预变性1 min,98℃变性10 s,55℃退火15 s,68℃延伸2 min,共30个循环,结束反应。用1%琼脂糖凝胶电泳检测扩增产物。目的条带切胶回收后进行连接转化,FAE1-A和FAE1-B各挑取3个阳性单克隆送华大基因公司测序。利用DNAStar软件的Megalign组件将得到的栽培种FAE1-A和FAE1-B序列与野生种A. duranensis和A. ipaensis FAE1序列以及美国PeanutBase和福建农林大学(http://peanutgr.fafu.edu.cn/)发布的栽培种FAE1序列进行比对。

1.5 花生FAE1的生物信息學分析

利用DNAStar软件的EditSeq组件,分析蛋白分子量,酸性氨基酸、碱性氨基酸、疏水性氨基酸、极性氨基酸的含量,等电点等理化性质;利用NPS@中SOPMA预测蛋白质二级结构。通过NCBI的BLASTP(https://www.ncbi.nlm.nih.gov/Structure/cdd/docs/cdd_search.html)功能分析基因的保守域。利用在线生物信息学软件ExPASy的ProScale (http://web.expasy.org/protscale/)对该基因编码的蛋白进行亲/疏水性分析。利用 signalP(http://www.cbs.dtu.dk/services/SignalP/)对该基因编码蛋白的信号肽进行预测。通过生物信息学软件PSORT Ⅱ(https://psort.hgc.jp/form2.html)对基因编码蛋白进行亚细胞定位预测。利用生物序列分析中心网站(Center for Biological Sequence Analysis,网址http://www.cbs.dtu.dk)的TMHMM-2.0软件对该基因编码蛋白进行跨膜域预测。利用CBS的Protfun2.2 (http://www.cbs.dtu.dk/services/ProtFun/)在线生物信息学软件对该基因编码的蛋白进行功能预测。利用MEGA7.0软件采用NJ法构建系统进化树。

2 结果与分析

2.1 栽培种花生FAE1编码区序列的克隆

以栽培种花生F112-2 DNA为模板,使用筛选出的FAE1引物,经PCR各扩增出一条1.8 kb左右的片段(图1)。根据花生数据库所获二倍体野生种A. duranensis和A. ipaensis的FAE1完整编码区均为1 536 bp,本研究从栽培种花生中克隆得到的FAE1-A和FAE1-B完整编码区也均为1 536 bp,编码511个氨基酸。

将FAE1-A、FAE1-B、A. duranensis和A. ipaensis FAE1的核苷酸和氨基酸序列进行比对,发现核苷酸序列的第101、318、356、1 013、1 238、1 280、1 473位和1 520位A、B基因组之间存在差异,第919位栽培种与野生种存在差异,第1 480位栽培种FAE1-A与其他序列存在差异;氨基酸序列的第106位和491位A、B基因组之间存在差异,第306位栽培种与野生种存在差异,第493位栽培种FAE1-A与其他序列存在差异(图2、图5)。同时将FAE1-A和FAE1-B与PeanutBase中的Tifrunner品种和福建农林大学发布的花生栽培种序列进行了比对,结果表明FAE1-A和FAE1-B与Tifrunner品种中分别对应的两条序列比对相似性均为100%;与福建农林大学发布的一条序列比对相似性分别为98.64%和99.22%(图2)。

2.2 栽培种花生FAE1的生物信息学分析

2.2.1 栽培种花生FAE1编码蛋白的氨基酸序列分析 对FAE1-A和FAE1-B基因编码的蛋白质进行物理化学性质分析,结果显示: FAE1-A蛋白的理论分子量为57.03 kD,理论等电点为9.24,脂溶指数为95.56,总平均亲水系数为-0.037。FAE1-B蛋白的理论分子量为56.97 kD,理论等电点为9.24,脂溶指数为94.79,总平均亲水系数为-0.041。

FAE1-A蛋白含有的511个氨基酸残基中,Leu(L)含量最高,占氨基酸总数的11.0%;其次为Val(V)、Ser(S)、Gly(G),分别占氨基酸总量的7.6%、 7.4%和6.8%。含有41个带负电的氨基酸残基(Asp + Glu),占总数的8.0%;56个带正电的氨基酸残基(Arg + Lys),占总数的11.0%。在大肠杆菌中的半衰期为>10 h,不稳定系数为35.06,属于不稳定的蛋白质类型。

FAE1-B蛋白含有的511个氨基酸残基中,Leu(L)含量最高,占氨基酸总数的10.8%,其次为Val(L)、Ser(S)、Gly(G),分别占氨基酸总量的7.8%、7.4%和6.8%。含有41个带负电的氨基酸残基(Asp + Glu),占总数的8.0%;56个带正电的氨基酸残基(Arg + Lys),占总数的11.0%。在大肠杆菌中的半衰期为>10 h,不稳定系数为35.70,属于不稳定的蛋白质类型。

2.2.2 栽培种花生FAE1结构域分析 应用NCBI的BLASTP分析FAE1-A和FAE1-B的保守结构域,都位于15~510个氨基酸之间(图3、图4)。

2.2.3 栽培种花生FAE1编码蛋白的二级结构分析 通过分析预测蛋白质的二级结构,显示FAE1-A蛋白中α螺旋占32.88%,无β折叠,转角构象10.18%,无规卷曲占31.31%;FAE1-B蛋白中α螺旋占32.88%,无β折叠,转角构象9.78%,无规卷曲占31.70%。

2.2.4 栽培种花生FAE1编码蛋白的信号肽、亚细胞定位和跨膜域预测 预测结果表明该基因编码蛋白没有信号肽;在第38至第60位氨基酸和第80至第102位氨基酸分别构成了2个跨膜结构域;亚细胞定位在内质网上的蛋白占44.4%,定位在细胞质膜、高尔基、分泌系统的囊泡、线粒体、细胞外的蛋白均占11.1%。

2.3 同源基因氨基酸序列比对与进化树构建

利用DNAMAN软件将栽培种花生FAE1-A和FAE1-B的氨基酸序列与油菜、拟南芥、黄连木等10种不同作物FAE1的氨基酸序列比对,结果如表2、图5所示,构建的不同物种FAE1氨基酸序列系统进化树如图6所示。可以看出,栽培种花生FAE1-A、FAE1-B与野生种花生A. duranensis、A. ipaensis FAE1同源序列最相似,在进化树上各组成一个分支。

3 小结

本研究从栽培种花生中成功克隆出FAE1基因FAE1-A和FAE1-B,分别对应于栽培种花生二倍体祖先种A. duranensis和A. ipaensis的FAE1基因,其长度均为1 536 bp,均编码511个氨基酸,且均无内含子。将FAE1-A和FAE1-B与PeanutBase中的Tifrunner品种和福建农林大学发布的花生栽培种序列比对,发现它们之间有极高的相似性。对这两个基因进行生物信息学分析,结果表明其编码蛋白二级结构以α螺旋为主;无信号肽,表明FAE1蛋白不是分泌蛋白,而是在细胞中发挥作用,且主要存在于内质网上;FAE1蛋白不稳定系數小于40,总平均亲水系数为负数,属于不稳定的亲水性蛋白。下一步将克隆不同芥酸含量花生的FAE1-A和FAE1-B基因,寻找相关功能标记,为通过分子标记辅助选择技术培育低芥酸花生品种创造条件。

参 考 文 献:

[1] 张立实,谭茵,欧阳雁丽,等. 高芥酸菜籽油对大鼠肝组织脂肪酸氧化功能的影响[J]. 营养学报,1991,13(2):108-113.

[2] 雷红,蔡亮亮,操丽丽,等. 菜籽油中芥酸含量对小鼠食用安全性的影响[J]. 食品科学,2010,31(19):321-324.

[3] 焦红兵. 心脏病人少食菜籽油[J]. 农业科技与信息,2006(4):47.

[4] Millar A A, Kunst L. Very-long-chain fatty acid biosynthesis is controlled through the expression and specificity of the condensing enzyme[J]. The Plant Journal, 1997, 12(1): 121-131.

[5] Kunst L, Taylor D C, Underhill E W. Fatty acid elongation in developing seeds of Arabidopsis thaliana[J]. Plant Physiol. Biochem., 1992, 30(4): 425-434.

[6] James D W, Lim E, Keller J, et al. Directed tagging of the Arabidopsis FATTY ACID ELONGATION1 (FAE1) gene with the maize transposon activator[J]. The Plant Cell, 1995, 7(3): 309-319.

[7] 徐爱遐,黄镇,马朝芝,等.芥菜型油菜FAE1基因序列特征及其与芥酸含量关系的初步分析[J].作物学报,2010,36(5):794-800.

[8] 郭经宇,王茂华,刘绵学,等.甘蓝型油菜脂肪酸链延长酶基因FAE1的克隆与原核表达[J].应用与环境生物学报,2007,13(2):152-155.

[9] 庞慧,李莹,李密密,等. 十字花科植物FAE1基因的克隆与功能验证[J]. 植物资源与环境学报,2013,22(1):8-13.

[10]国家质量监督检验检疫总局.GB/T 1534—2003 花生油[S].2003-11-11.

猜你喜欢
生物信息学分析基因克隆花生
多少堆花生
雷公藤贝壳杉烯酸氧化酶基因的全长cDNA克隆与表达分析
三个小麦防御素基因的克隆及序列分析
到底埋在哪棵树下
花生去哪儿了
羊种布氏杆菌3型Omp25基因序列及其表达蛋白生物信息学分析
西藏牦牛NGB基因克隆及生物信息学分析
地黄纤维素合酶基因的克隆与生物信息学分析