白蜡虫脂酰辅酶A 还原酶基因家族鉴定及序列分析*

2022-09-22 01:18安佳琪
关键词:共线性基序相似性

柳 伟,安佳琪,高 熹 ,杨 璞,3

(1.中国林业科学研究院 高原林业研究所,云南 昆明 650224;2.云南农业大学 植物保护学院,云南 昆明 650201;3.国家林业和草原局,资源昆虫培育与利用重点实验室,云南 昆明 650224)

蜡酯在动物、植物和微生物中广泛存在,具有多种重要的生物学功能,其功能多与生存环境相适应[1]。蜡酯在植物中主要形成表皮蜡,可防止病菌和紫外线的侵害,还可以保护水分,或以高浓度的形式积累在一些种子油中[2]。动物蜡酯具有保护作用,如工蜂用分泌的蜂蜡筑巢,为自己提供庇护场所;还具有防水作用,如水禽用喙将尾脂腺分泌的蜡酯涂抹在羽毛上,使羽毛光润防水。蜡酯也是微生物中重要的储存脂类,各种细菌通过积累蜡酯将其作为主要的碳源和能量储存物质。蜡酯具有多种功能和性质,可作为人类生活中重要的经济油脂,广泛应用于医药、化妆品和食品工业,尤其是能源和化工等领域。

蜡酯由长链脂肪酸与长链醇通过酯化反应结合形成,其合成过程较为保守[1]。脂酰辅酶A 还原酶 (fatty acyl-CoA reductase,FAR) 将脂酰辅酶A 还原成相应的脂肪醇,然后与脂酰辅酶A 在蜡酯合成酶催化下形成蜡酯[3-5]。脂酰辅酶A 还原酶所催化的还原反应依赖NADPH。序列分析表明:动物和植物的FAR 较为保守,在N 端氨基酸有1 个长度约为300 aa 的NADPH 结合结构域,在C 端含有1 个Sterile 蛋白结构域[6-7]。

已有研究表明:FAR 催化生成的脂肪醇主要参与蜡酯、甘油三酯和信息素的合成[1]。同一生物体中有多个far基因,在不同组织的表达有不同的生理功能。拟南芥far3基因在叶、茎、花和根中均有表达,参与角质层蜡的合成[8-9];拟南芥中far1、far4和far5在根的内皮细胞中表达,主要参与软木脂的形成;意蜂far1基因主要在蜜蜂头部表达,参与信息素或醚酯的合成[10]。

白蜡虫 (Ericerus pela) 是一种有巨大经济价值的资源昆虫,在雄虫二龄时期分泌大量白蜡。白蜡的主要成分是蜡单酯,占白蜡总量的93%~95%。在机械、化工、食品、农林和信息技术等领域应用广泛[11-12],以白蜡为原料生产的高级烷醇也具有极大的药用价值[13]。FAR 在白蜡合成中起关键作用,但白蜡虫far基因家族缺少系统的进化分析研究。本研究对白蜡虫far家族基因进行鉴定,并进行序列特征分析,同时与其他物种中参与蜡酯合成的FAR 进行系统进化分析,以期为进一步探究白蜡虫蜡酯合成基因的特点与进化奠定分子基础。

1 材料与方法

1.1 far 基因家族鉴定和结构域分析

FAR 的结构域信息下载自Pfam 数据库(http://pfam.xfam.org/),再利用HMMER 3.0 在白蜡虫蛋白库搜索含有far基因结构域的序列。为避免基因组注释有遗漏的far基因,从Uniport 数据库(https://www.uniprot.org/)下载FAR 蛋白序列,在白蜡虫转录组蛋白库中进行本地BLAST 搜索,由此获得白蜡虫转录组预测的FAR。结合白蜡虫转录组注释信息,将这些FAR 对应的转录本在白蜡虫基因组序列上进行本地BLAST 搜索,获得的序列作为far候选基因。此外,在Nr (nonredundant protein sequence)、Nt (nucleotide sequence)和Swissport 数据库中注释为FAR 的基因组预测基因同样作为far候选基因。将以上far候选基因上传到CDD (https://www.ncbi.nlm.nih.gov/Structure/bwrpsb/bwrpsb.cgi)进行结构域分析,得到2 种序列,一种包含2 个完整的FAR 结构域(即NADB Rossmann 结构域和FAR C 结构域),另一种仅含有1 个FAR 结构域,对这些序列进行在线BLAST 分析,2 种方法都注释为FAR 的基因保留作为最终的候选far家族基因。

1.2 白蜡虫far 基因保守基序、基因结构和氨基酸序列属性分析

利用在线网站MEME (http://meme-suite.org/tools/meme)[14]对白蜡虫FAR 蛋白保守基序进行分析,基序的最大数值设为15,基序的长度设置介于6~200 之间,其他参数使用默认参数。对得到的保守基序使用CDD 进行功能注释;使用在线网站GSDS 2.0 (http://gsds.gao-lab.org/)[15]分析内含子和外显子;使用ExPASy (https://web.expasy.org/protparam/)在线工具[16]对筛选的白蜡虫FAR 蛋白序列进行等电点和蛋白分子量等属性分析。

1.3 白蜡虫far 基因染色体定位

将far基因在scaffold 上进行定位,得到起始位置信息,使用在线网站MapGene2Chrom web v2 (http://mg2c.iask.in/mg2c v2.0/)[17]将所有白蜡虫far基因在染色体上的物理位置绘制成图。单个染色体宽度设置为100 px,染色体边界宽度为2 px,其他参数设置保持默认值。

1.4 白蜡虫far 基因的共线性Circos 分析

使用Mauve 2.3.0 软件对白蜡虫far基因进行共线性分析,参数和视图使用默认值。得到far基因的共线性区域,连接共线性较好的far基因;利用Circos 对共线性结果进行可视化。

1.5 系统进化树的构建

利用ClustalX 软件对白蜡虫far基因氨基酸序列进行多序列比对,然后将得到的结果导入MEGA 6.0 软件,使用邻接法(Bootstrap=1 000)构建系统进化树[18];使用ClustalX 软件对不同物种的FAR (表1)进行多序列比对,在MEGA 6.0 中采用最大似然法(Bootstrap=500)绘制不同物种FAR蛋白进化树[19-20]。其中,拟南芥、西德蒙木和小鼠的FAR 来自NCBI;意蜂、果蝇、豌豆蚜和扶桑绵粉蚧的昆虫FAR 来自昆虫基因组与转录组数据库InsectBase (http://www.insect-genome.com/)。

表1 物种的FAR 信息Tab.1 FAR information for species

1.6 不同物种的far 基因共线性分析

为了进一步检测白蜡虫far基因与其他物种far基因[21-23]的共线关系,采用Mauve 2.3.0 软件进行共线性分析。参数设置和视图样式同1.4 节。

1.7 不同物种的FAR 相似性统计分析

为了探讨不同物种间FAR 序列的相似性,利用在线BLAST 计算每2 对FAR 序列之间的相似性,将统计结果导入在线网站Heatmapper (ht-tp://www.heatmapper.ca/expression/),氨基酸与高、中、低值的相似性以红、白、绿三色表示,并根据统计结果进行聚类分析。

2 结果与分析

2.1 白蜡虫far 基因家族鉴定

根据转录组注释信息,197 条序列注释为far基因。利用197 个候选基因的转录本序列进行基因分析。一些基因被发现是同一基因的不同转录本。根据转录本在scaffold 中的位置,共鉴定出17 个基因。

根据基因组预测基因的注释信息,26 条序列注释为far基因。与转录组得到的序列进行比对,在白蜡虫far基因家族中有30 个far基因;其中有22 个具有2 个完整的结构域和合适的序列长度,可以进行后续分析。

2.2 保守基序、基因结构和氨基酸序列分析

对15 个保守基序(图1)进行分析,MEME分析结果显示:基序1~6、9、12 和14 属于NADB Rossmann 结构域,基序7、8、10 和13 属于FAR C 结构域。CDD 分析结果显示:基序1~4、9 和14 属于NADB Rossmann 结构域,基序8 和13 属于FAR C 结构域。MEME 分析与CDD 分析结果基本一致。此外,基序11 和15 位于域间区域,所有FAR 都包含基序11 或15,但二者并不同时存在于1 个FAR 中。

图1 白蜡虫FAR 保守基序分析Fig.1 Conserved motif analysis of FAR in Ericerus pela

白蜡虫far基因有6~11 个外显子、5~10 个内含子。外显子平均长度为145~225 bp,内含子平均长度为777~7 098 bp。Epfar-5包含10 个内含子和11 个外显子,数量最多(图2)。在22 条白蜡虫FAR 中,氨基酸序列长度为467~587 aa,仅有FAR-19 的等电点小于7。

图2 白蜡虫far 基因结构分析Fig.2 Gene structure analysis of the far genes in E.pela

2.3 白蜡虫far 基因染色体定位

图3 显示:22 个far基因分布在16 个重叠群(contig)上,contig113 的far基因最多(4 个),其次 是contig1166 (3 个),即contig113 和1 166 有far基因簇;contig683 有2 个far基因;其余13 个contig 上各有1 个far基因。

图3 白蜡虫far 基因在基因组上的分布Fig.3 Genomic distribution of the far genes of E.pela

2.4 白蜡虫far 基因的共线性Circos 分析

由图4 可知:22 个far基因共有11 个共线性模块。其中,far6 号基因与其他far基因有最多的共线性模块,与far5、9、13、18 号基因都有连线。far9 号有3 个连线。far2 号和27 号各有2 个连线。其余5 个基因只有1 个连线。

2.5 系统进化树

由图5 可知:白蜡虫的22 个far基因聚为2 类。第1 类有12 个far基因,聚为4 组;第2类有9 个far基因,聚为2 组。由图6 可知:不同物种的FAR 大多按所属物种的亲缘关系聚为3 类。白蜡虫的FAR 主要在第1 类,豌豆蚜(Acyrthosiphon pisum)和黑腹果蝇(Drosophila melanogaster)的FAR 主要在第2 类,扶桑绵粉蚧(Phenacoccus solenopsis)的FAR 在第1、2 类中都有分布,第1 类中的FAR 基本与白蜡虫聚在一起。

图5 白蜡虫FAR 的系统发育树Fig.5 Phylogenetic tree of FAR in E.pela

图6 8 个物种的FAR 的系统发育树Fig.6 Phylogenetic tree of FAR in eight species

2.6 不同物种的far 基因共线性分析

由图7 可知:白蜡虫与扶桑绵粉蚧的共线性最好,二者之间的共线性连线最多,共线性模块覆盖率最高。白蜡虫far基因与小鼠、意蜂、豌豆蚜和黑腹果蝇far基因的共线性较差,共线性连线较少,共线性模块覆盖率较低。白蜡虫far基因与拟南芥和西德蒙木的far基因共线关系最差,几乎没有共线性连线。

图7 白蜡虫与拟南芥和扶桑绵粉蚧的far 基因共线性分析Fig.7 Synteny analysis of far genes among E.pela,Arabidopsis thaliana and Phenacoccus solenopsis

2.7 不同物种的FAR 相似性

由图8 可知:不同物种的FAR 的氨基酸相似性在25%~60%,高相似性 (50%~60%) 的FAR蛋白主要来自同一物种。拟南芥和西德蒙木的FAR 相似性约为50%;不同昆虫体内FAR 蛋白的相似性大多不高 (25%~40%);具有泌蜡功能的FAR 氨基酸与其他物种的FAR 相似性仅为25%~40%。

图8 不同物种的FAR 相似性热图Fig.8 Heat maps of FAR similarity of different eight species

3 讨论

脂酰辅酶A 还原酶是生物体内蜡质合成的关键酶之一,在动物、植物和微生物中广泛存在。截至目前,蜡质合成途径以及关键酶的研究较少,仅有少部分植物(拟南芥和希蒙德木等)[24]、动物(小鼠和鹅等)[25-26]和昆虫(褐飞虱和巢蛾等)[27-29]开展了FAR 的功能研究。随着研究工作的深入展开,发现far基因在昆虫基因组中一般以基因家族存在,如对褐飞虱far基因家族进行了功能分析[30]。本研究基于白蜡虫的全基因组数据,结合生物信息学分析方法对其far基因家族进行鉴定,获得30 个far候选基因,多数含有NADB_Rossmann 结构域和FAR C 结构域;氨基酸普遍等电点大多在7 以上,说明其可能多在弱碱性环境发挥作用。

基因家族成员可以紧密排列在一起,形成1 个基因簇(一般认为200 kb 的核苷酸单位中含有3 个以上基因的基因群)[31],更多的家族基因分布在同一染色体的不同部位,或者分散于不同的染色体,具有各自不同的表达调控模式。对白蜡虫far基因的染色体分布和基因重复进行分析后发现2 个基因簇,其中的11 对基因有一定的共线性。白蜡虫far基因家族仅有2 个基因簇,其他基因大多存在于不同contig 上。这些成簇排列的far基因可能由基因复制产生,具有共线性的far基因可能有相同的起源。基序在白蜡虫far基因家族成员内分布相似,在白蜡虫FAR 的NJ 树中,含有基序11 的聚为一小支,表明含有相同基序的FAR 序列或者功能可能更相似。

不同物种的FAR 氨基酸相似性分析表明:多数相似性高的FAR 都是同一物种或亲缘关系近的物种。同属泌蜡功能相关的FAR 在相同物种间相似性高,在不同物种间相似性低。不同物种的FAR 进化分析表明:同物种的FAR 大多聚在一起,亲缘关系近的聚为1 小支。系统进化的分析结果与共线性分析的结果一致,从共线性分析来看,白蜡虫与亲缘关系最近的扶桑绵粉蚧的far基因有更多的共线性连线,而与拟南芥的far基因共线性连线非常少。

4 结论

本研究获得30 个白蜡虫far基因候选基因,其中22 个具有完整的结构域。序列分析和系统进化分析表明:这些基因存在很多保守基序,基因之间共11 个共线性模块,聚类为2 大支,不同物种之间的FAR 亲缘关系较远。该研究为了解白蜡虫far基因的功能分化提供了参考。

猜你喜欢
共线性基序相似性
龙眼全基因组和转录本序列SSR位点的鉴定
带TRS基序突变的新型冠状病毒威胁更大
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
浅析当代中西方绘画的相似性
通过合成生物学可改造非豆科植物进行固氮(2020.8.8 iPlants)
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
12个毫无违和感的奇妙动物组合
基于隐喻相似性研究[血]的惯用句