对蚕学专业引入基因组与生物信息学课程的思考

2011-08-15 00:51张瑞芝潘国庆周泽扬
蚕学通讯 2011年4期
关键词:信息学家蚕基因组

向 恒 张瑞芝 潘国庆 周泽扬*

(1.西南大学蚕学与系统生物学研究所;2.西南大学动物科技学院;3.西南大学生物技术中心,重庆 北碚 400715)

当今,高通量技术的应用对于生物分子定量和定性的研究来说具有重要意义,也表明生命科学正在从一种以描述性为主的学科发展到以信息为主的学科。因此,生物学家就需要提高数学、计算机和统计分析等方面的技能,而提高学生在生命科学中信息分析能力的需要也是迫切的。然而,由于计算机硬件、软件条件或者教师知识程度等多个方面的原因,基因组与生物信息学的教育水平却远落后于生物化学和分子生物学,表现出了诸如序列分析等多个方面技能上的不足。正是由于存在这些限制,基因组与生物信息学课程经常被限制在研究生阶段,而未引入本科生的学习范畴。随着当前基因组和蛋白质组数据的爆炸性增长,本科生关于基因组与生物信息学的学习需要就如过去学习色谱层析和电泳技术的需要一样,同等重要。早在2003年,西南大学家蚕研究团队就完成了家蚕基因组的框架图谱,在此基础上,2008年又公布了精细图谱,序列覆盖度高达8.48倍,精确鉴定了14.6万个以上的基因。基于这些基因组数据,开展蚕学专业学生的基因组与生物信息学教学具有明显的平台优势。

近几年,一些基于网络的易操作程序,诸如Biology Workbench(http://workbench.sdsc.edu/)和 Protein Explorer (http://www.umass.edu/microbio/chime/pe_beta/pe/protexpl/),已经大大降低了基因组与生物信息学的教学难度,可以运用于该门课程中。这些程序大多都是免费的,学生只要有能上网的电脑就可以访问它们。这使得老师可以布置作业,让学生访问基因组数据并进行分析,进而掌握这些程序及其生物信息分析思路。Biology Workbench是一款新颖的软件,学生可以通过它的服务器存储序列数据。这一应用也相当有用,因为师生们可以不必用移动磁盘携带着数据来进行教学。而Protein Explorer是一种免费的浏览器插件,与常用的RasMol软件相似,能显示出蛋白质和核酸等大分子的三维结构。而且,与RasMol输入命令的方式不同,Protein Explorer采用菜单的形式,使得学生可以不用去死记那些命令,就能容易的进行三维结构分析。最终,学生可以利用Protein Explorer软件对比已知晶体结构的大分子序列,分析未知分子的结构。

运用上述软件,我们可以设计两套课程方案来传授蚕学专业学生掌握家蚕基因组数据及其信息分析的方法。第一套方案是将基因组与生物信息学和目前学生正在开设的分子生物学课程进行整合。在此前提下,学生将基因组与生物信息学认作为一种分析生命科学问题的应用性学科。该学科是开放式的、探究式的,允许学生从中学会如何去分析一些基因或蛋白质所包含的具体生物学信息。总之,相对于开展生物学实验而言,学习基因组与生物信息学可以更容易的让学生知道怎样去发现生命科学问题,以及如何着手解答这些问题。这样就给予了学生自主学习,以及利用计算机辅助生命科学实验开展研究的机会,提高了他们的科学研究素养。

例如,利用昆虫杆状病毒表达系统对家蚕热激蛋白基因(heat shock protein,HSP)进行亚克隆及cDNA表达的常规实验课程,老师能够对其进行优化。首先,可以教会学生怎样从家蚕基因组数据中提取出该基因的DNA序列,并告诉他们如何利用软件进行翻译,从而得到蛋白质序列。再将该序列输入Biology Workbench中,并利用BLAST软件检索它的同源序列以进行后续分析。接下来,学生可以通过分析开放阅读框(open reading frame,ORF)得到该基因的cDNA序列及其编码的蛋白质序列。最后,学生还可以利用软件分析该cDNA的限制性酶切位点,从而更好的设计出亚克隆策略。所有这些生物信息分析的内容与实验课程有机的结合在了一起,而在学期期末还可以让学生提供除实验报告外的另一份信息分析报告。这样的话,学生不仅获得了实验操作的动手能力,还学会了生物信息的分析能力,以及将基因组与生物信息学用于实验中,指导实验、辅助实验,进行真正的生物学研究的能力。比如,当学生在挖胶抽提用于亚克隆的cDNA时,就可以基于基因的预测信息知道哪条带是自己需要的。同样的,当他们通过聚丙烯酰胺凝胶电泳(SDS-PAGE)比较表达的重组蛋白的时候,通过生物信息预测的蛋白质大小就能派上用场。当然,如果表达蛋白的分子量比预测的大,就认为该蛋白很可能发生了糖基化作用,导致其分子量变大,更多的研究内容随之也被引出。因此,将基因组与生物信息学传授给学生,不仅可以鼓励他们拓宽挖深自己的实验结果,让他们认识到生物学的问题不是那么容易就能解决的,书本上的知识是多么的浅显,还可以激发他们对生物学的兴趣,以及采用更多更新的手段分析生命科学问题的能力。

第二套方案是针对学生单独开设与家蚕基因组数据相关的基因组与生物信息学课程。该套方案仅需要一间配备有多台计算机及其局域网的教室,而该条件在西南大学已经得到满足。而且,除了进行上机实行直接操作外,还应该具备相应的理论课程。在理论课中,老师可以传授学生家蚕基因组数据所包含的内容、生物信息学常用软件及其模型算法的理论背景知识、以及如何运用这些软件分析数据的方法思路。而在实验课中,学生可以利用这些软件进行常规的DNA、RNA和蛋白质分析。大致设计为以下四个单元:1)基因组,2)蛋白质结构,3)数据库和多重序列对齐,4)小亚基核糖体RNA和系统进化分析。每个单元开展至少10学时(7学时理论,3学时实验),以使得学生能掌握基因组与生物信息学的理论知识,以及能通过分析一个基因或者蛋白质数据来充分理解这些知识,这样在今后的研究过程中,他们就可以学以致用了。

比如,在蛋白质结构单元,老师可以提供家蚕铜锌超氧化物歧化酶(Cu/Zn superoxide dismutase)的蛋白质序列给学生,并告诉他们这是他们在基因组单元分析检索到的基因所翻译的。然后,学生可以利用Biology Workbench中的程序预测出该蛋白质的功能基序、α螺旋、β折叠和跨膜结构域等内容。也可以利用Protein Explorer软件分析它的三维结构,并对预测准确性进行测试。其次,学生可以运用Biology Workbench对该蛋白质及其其他物种中的同源序列进行多重序列对齐,并使用Protein Explorer基于三维结构来分析它们的多重序列重叠位点。这就让学生理解了蛋白质活性位点的氨基酸残基保守性。最后,学生还可以利用多重序列对齐的结果,构建系统进化树,对铜锌超氧化物歧化酶基因在不同物种中的进化历程进行探讨。从而,将四个单元的知识都串了起来,让学生可以更好的综合掌握住基因组与生物信息学的理论知识和操作方法。当然,也反过来促使学生更好的理解了分子生物学中关于基因和蛋白质的结构以及进化的基本概念。

目前,基因组与生物信息学已经成为了一套完整的学科,并在生命科学研究的多个方面都有所运用。无论是将它与现有其他课程进行整合,或者将其作为单独的一门课程,都应当让学生弄清掌握生物信息工具来解决生命科学问题是必要的也是必须的。幸运的是,在国外,基因组与生物信息学已经融入到了本科生的课程中,并取得了良好的效果。而通过西南大学蚕学专业的试点工作,我们相信国内的高等院校最终也会发展到这条路上来。

[1]Ditty J L,et al.Incorporating genomics and bioinformatics across the life sciences curriculum[J].PLoS biology,2010,8(8):e1000448.

[2]Cooper S.Integrating bioinformatics into undergraduate courses[J].Biochemistry and Molecular Biology Education,2001,29(4):167-168.

[3]张春霆.生物信息学的现状与展望[J].世界科技研究与发展,2000,22(6):17-20.

猜你喜欢
信息学家蚕基因组
家蚕原原种“871”“872”种性变化分析
牛参考基因组中发现被忽视基因
鸡NRF1基因启动子区生物信息学分析
抗BmNPV家蚕新品种“川抗1号”的育成
家蚕猝倒病的发生与防治
血清HBV前基因组RNA的研究进展
初论博物馆信息学的形成
紫花白及基因组DNA提取方法的比较
浙江省1973年引进家蚕品种名
miRNA-148a在膀胱癌组织中的表达及生物信息学分析