基于PubMed 和预印本网站的生物医学检索课分层设计研究*
——以新型冠状病毒的认识特点为例

2020-09-16 08:11
科技创新与生产力 2020年9期
关键词:生物医学检索数据库

郑 蕊

(中央民族大学,北京 100081)

生物医学是极为依赖期刊文献的一门学科,生物医学文献阅读对提高学生对学科领域的认识,优化学生的实验设计、调整学生实验策略并最终提出更科学的医疗方案都起着极为关键的作用。随着高年级科研任务的逐渐加重,实验项目攻坚时的每一步策略调整都要参考大量的文献阅读和分析。但是现阶段,由于高校图书馆学科服务的局限性,学科服务更多针对人文社科,理科的文献检索课程开的少,深度有限。对比高校图书馆动辄百万千万的理科数据库投入,一定程度上,图书馆对于生物医学学科的文献推广和学科服务助力较少。另外,科研单位针对本硕博不同阶段学生的培养目标,课程设

置上很难科学系统地兼顾不同阶段学生的文献需求,做不到系统性地信息素养规划。

本研究立足“双一流”学科建设,强调图书馆学科服务在这种情况下的能动性,旨在利用生物医学学科最常用的文献集成平台PubMed,为图书馆推进生物医学检索课程进行系统性的规划设计,提出合理的分层嵌入式服务方案。

1 研究现状及发展动态分析

1.1 国内图书馆学科服务发展现状及趋势

学科服务又称嵌入式服务,起源于国外研究型大学图书馆,旨在为学习、教学、科研提供主动性、专业化、深层次的文献信息服务。在中国知网中检索“图书馆学科服务”可知,这一议题从2005年以来持续升温中。

近年来,在“双一流”学科建设的导向下,图书馆学科服务开始趋向精准的靶向服务。但是聚焦学科服务研究现状可知,学科服务研究偏重理论层面,学者普遍关注实现平台、服务质量评价、模式构建等问题。纵观近期新的研究成果,李志芳[1]关注新平台助力学科服务;赵丽芳[2]、付勃达[3]关注微信平台能够提供的学科服务;宋玲玲[4]关注学科服务质量评价;付玲玲[5]、郭春阳[6]、孙羽佳[7]关注新技术大数据新模型影响下的图书馆学科服务模式构建。依旧是理论层面的讨论居多。

在实践层面上,学科服务的开展有较大的局限性。郭淑艳,周丽晴等[8]学者的调查显示,现阶段图书馆学科服务深入学科教学的较少,多数学科馆员从事的是基础联络、资源配置等工作,少数图书馆则开展了面向学科的增值服务。

在现实层面上,新型冠状病毒的肆虐使得全社会前所未有地关注生物医学领域,推动科研医疗工作快速发展,以解决疫情下的全球困境。更高的生物医学文献检索和阅读水平,能够让生物医学学生更快更清晰地了解疫情前沿,知悉医疗案例,对比医疗方案,提升专业水平,具有深远的现实意义。

综上,高校图书馆学科服务深化应整合业务,提供务实的解决方案,设计立足学科发展和学生培养,与专业需求深度嵌合的文献检索课程。

1.2 生物医学检索课程研究情况概述

1.2.1 国内生物医学学科服务研究情况

生物医学学科对新文献依赖程度非常高,但由于图书馆服务水平的限制,服务偏重文献推广、信息咨询、技巧介绍,尚未有文献提供设计成熟的生物医疗信息素养教育课程案例。

截至2019 年12 月23 日,中国知网“生物医学+学科服务”两个关键词所检索出的文章仅有8 篇,具体偏向于学科资源共享平台的建立[9]、学科服务模式的探讨[10]等理论性问题。仅有两篇文章涉及PubMed 平台,但一篇偏重平台文献传递功能[11],一篇偏重热点分析[12],对学科检索课程没有系统整体的设计。尚没有介绍技巧之外、与学科贴合的分层嵌入式文献检索课程案例。

正方四角锥和斜放四角锥三层网架均由上弦杆、中弦杆、下弦杆以及上腹杆和下腹杆组成。由于屋面跨度太大,屋面排水如采用小立柱找坡,小立柱高度会超过2 m,很容易失稳,故考虑采用网架变高度找坡,上弦和中弦间变高度,中弦和下弦间等高度。网架支座设置在中弦层上,支座沿四周均匀布置。试算时荷载考虑阀厅屋面附加恒荷载、屋面活荷载、设备吊点以及吊车荷载。计算模型和计算结果分别如图5、图6和表1、表2所示。

在中国知网用“生物医学+检索”两个关键词检索,截至2019 年12 月23 日,可得到1 253 条结果。结果集中在技巧探讨、热点追踪、期刊收录等细节之中,针对学科的文献检索课程案例依旧很少,这些对人们检索课程内容有很大借鉴意义。

对比两次检索词的选用可以得出,在生物医学学科中,对于检索技巧、热点追踪、文献获取、深度阅读等问题都有所关注,缺乏整体的信息管理和学科信息素养理论的概括整合,更没有针对不同需求读者的分层教育方案。

1.2.2 国外生物医学学科服务开展情况

截至2019 年12 月23 日,在Web of science网站上检索“Biomedical+subject service”可得到2 239 条结果。同样,扩大范围利用“Biomedical+retrieval”两词则可得到27 068 条结果,有关“生物医学+检索”两个关键词的研究情况,分国别统计顺序依次是美国、英国、英格兰、德国,然后才是中国。在国际期刊上,也可以看出国内生物医学检索研究与一流水平有一定的差距。从文章语言分类分析,97%以上的文献使用的是英文发表,明显看出国外期刊更重视生物医学文献检索的探索。

从研究内容看,国外成果有两万多条,内容丰富,细分领域非常广,如生物信息学、放射医学成像、医学信息学、神经医学、分子生物学、内科、生物医学仪表仪器等。每一个生物医学细分领域都有大量深度的研究。

综上所述,国外对生物医学学科的检索研究,无论是深度还是广度都超过国内。

1.2.3 生物医学学科服务综合情况

检索中需要说明的是,上述检索结果可以清楚对比出国内外生物医学学科的研究差距悬殊,考虑到文献数据库的结果呈现逻辑,关键词选用“生物医学”“生物学”“医学”等词汇在数据库中会作为共现词共同出现,检索结果相近,故上面仅选取了“生物医学”和“检索”这一组关键词所呈现的结果。

通过上述结果可知,国内生物医学领域的学科服务检索课研究偏重理论探索和技术讨论,缺乏系统性的规划,在高校学生专业发展上,缺少具有指导意义的信息素养案例和操作指南。图书馆生物医学学科服务由于专业性强、壁垒高、实践性强等原因开展缓慢,亟待更专业的学科馆员参与规划和系统设计,并开设实践课程。

目前,国外生物医学学科发达,在学科服务、细分检索方面有大量细致的研究。高校图书馆应重视这一差距,针对国内生物医学学科服务存在的问题,设计有效的学科保障体系和文献检索课程。

2 PubMed 平台与学科服务研究

PubMed 是美国国家图书馆(NLM) 下属的国家生物技术信息中心(NCBI) 研发的文摘数据库,少数可查看全文。作为生物医学领域影响力最大的数据库之一,PubMed 以其数据更新快、可免费使用、查全率高等优势受到科研工作者的青睐。

2.1 选用原因

本研究选用PubMed 平台作为文献检索课的实践平台,因为PubMed 可以在公网系统使用,能够总览学术发展,并提供获取途径,适合作为不同层次的生物医学学科学生的检索基础进行培训。具体说来,选用PubMed 进行分层检索实践是由于以下4 个方面。

第一,PubMed 具有方便性、无IP 限制、随意访问、支持随时随地查找文献等。可以避免高校图书馆传统专业性数据库普遍存在的IP 限制、并发用户限制等问题。

第二,PubMed 有一站式检索和全文链接,可以全面完整地呈现研究现状,避免费时费力地跨库寻找,也可以弥补图书馆数据库购买不足的问题。

第三,PubMed 可以更全面揭示学科发展,避免因为数据库使用不全造成的检索结果不完全呈现。学生在不同学习阶段,不同科研单位所拥有的数字资源各不相同,比如常用的外文文献数据库有SpringerLink,EBSCO(asp/bsp),Wiley,JSTOR 等。数据库收录范围不同,检索结果也有差异。数据库商版权限制造成的知识壁垒,会造成仅仅呈现本数据库收录文献的问题;同时,高校图书馆文献资源投入差异不同,数据库购买量不一,也可能影响学生的查全率和查准率。PubMed 提供文章的索引,提供文章链接,没有购买的文章也可以引导学生通过文献求助或者文献传递多途径获取文献,将版权壁垒的影响降到了最低。

第四,紧急公共卫生事件情况下,为了更快速地分享科研成果,争分夺秒、治病救人,许多团队选择绕开投稿、同行评审等步骤,将生物医疗最新的成果先发表在预印本网站上,在分享信息的后期继续走完见刊流程,这类文章大多最终会二次发表在正规期刊中,在PubMed 中体现会有一定的延迟性。这需要在快速反应的疫情中出现影响PubMed查全率和权威性的一个变数,故本研究为了在当前新型冠状病毒突发的状况下体现生物医学检索课程的思路,也会兼引预印本网站的成果。

综上,选用PubMed 作为生物医学学科检索课的基础数据平台,并利用预印本网站进行信息补充,经过充分的考虑,利于检索课程的框架设计和内容的传达。

2.2 已有的关于PubMed 平台研究

目前,国内现有关于PubMed 的研究非常多,主要集中在行业热点研究的文献计量分析、生物医学期刊的收录和查找、平台发文统计和投稿技巧、数据库检索使用技巧等领域。

针对平台促进信息素养教育,检索课程的研究主要有南方医科大学图书馆的可检索介绍[13]、孙辉的检索技巧[14]、张昱的检索实践探索[15]等多种类型。

总的来说,对于这个平台的系统介绍非常少,对于平台的研究偏重检索技巧,缺乏基于学生不同需求的顶端课程设计。

3 生物医学检索本硕博分层框架设计

3.1 生物医学检索课程的设计方面

已有研究显示课程大多开设在本科大二、大三年级,形式为选修课。如:郑世仲、陈美霞等[16]认为“生物学本科专业在第六学期开设较为合适。”苏锐、韩泽洲[17]认为“可以将生物工程‘文献检索’课程设置为必修课,安排在本科大二、大三年级学习,尽早树立大学生的信息意识。并将‘文献检索’课程学时增加为36 学时,其中18 学时用于介绍各个数据库及生命科学专业的信息检索方法及技巧,18 学时用于上机实践。”秦盛[18]表示“江苏师范大学生命科学学院生物专业文献检索与论文写作课程开设在第五学期,共36 个学时,是一门选修课程。”由上可知,嵌入式分本、硕、博阶段的生物医学学生的文献检索课程开展得较少。本研究拟设计高等学校学制自然分层的本、硕、博3 个阶段的嵌入式检索课程。

3.2 本硕博3 个阶段的问题和课程设计

本研究将本、硕、博3 个阶段的学习分为知识学习、科研实践、科研探索3 个阶段。将大学本科规划为知识学习到科研实践过渡阶段,硕士阶段规划为科研实践到科研探索阶段,最后博士阶段规划为科研探索阶段。这样,本科学生应该掌握基本的生物医学知识以及科研基础,硕士则掌握科研实践和探索手段,博士则是科研探索为主。在不同的学习阶段,生物医学学生应该解决的问题不同,本科阶段是建立学科体系,掌握学科方法;硕士阶段是掌握实验方法,认识科研探索;博士阶段则是了解掌握科研探索所需要的检索技巧。初步预设图书馆针对不同阶段不同层级学生提供的生物医学检索课框架见第32 页表1。

3.3 以新型冠状病毒为例的文献查找方案设计

在上述设计中,主要分析了本、硕、博3 个阶段的文献查找需求和应该设计的课程内容,因为不同院校的课程设计有所不同,检索课开展的情况也各有特色,所以笔者认为,将这些内容嵌入不同阶段的专业课中,是比较合适的专业检索课程的实现形式。由于近期全球最大的生物医学事件就是新型冠状病毒的爆发,大众十分关心学界对病毒的认识了解,对临床治疗第一手资料的解读等新闻。故本设计将以新型冠状病毒为例,逐步举例,如何在PubMed 平台、预印本网站以及其他数据库中开展不同层次的嵌入式课程教学,具体细节如下。

本科大一、大二年级(知识学习阶段),需要懂得图书馆的基本资源情况、经典图书查找、综合阅读推广以及经典文献阅读这4 个方面。在讲课时,也可以设计这4 个层面的检索实践,如通过各种数据库了解病毒,同时了解数据库信息呈现的内容和形式;学会查找馆藏纸本图书、电子图书中与“病毒学”相关的内容,并精读。

表1 本科、硕士、博士各阶段生物医学检索课框架

本科大三、大四年级(知识学习到科研实践过渡阶段),需要对本专业重要纸本经典著作有所了解,讲课时,可以设计病毒学重要纸本经典著作阅读,如徐耀先等编著的《分子病毒学》[19],杨占秋、余宏主编的《临床病毒学》[20],张正主编的《检验与临床诊断病毒学分册》[21]等图书。这一阶段也需要对PubMed 数据库进行总体了解,在PubMed 平台认识方面,总体了解NCBI 数据库及各子数据库,如PubMed(包含来自MEDLINE、生命科学期刊和在线书籍的3 000 多万篇生物医学文献引文) 可追踪新型冠状病毒的最新研究成果(在其下搜索SARS-CoV-2 或COVID-19 等关键词)、Gene(整合了来自各种物种的基因信息)、GenBank(基因序列数据库,所有公开的DNA 序列的带注释集合) -可查阅各实验室解译的新型冠状病毒最新序列(如在其下搜索SARS-CoV-2 可获得目前已知500 余种新型冠状病毒基因序列)、Protein(包括来自多个来源的注释编码区域的翻译序列集合) 可查阅病毒相关蛋白序列和毒株形态等、PubChem(世界上最大的免费获取化学信息的数据库)、BLAST(发现生物学序列之间的相似区域) 可比较新型冠状病毒毒株之间以及与其他病毒的序列差异等。同时,这一阶段还需要对学科经典论文回溯性学习。以冠状病毒的经典文献为例,病毒传播初期一定是详细回顾SARS 和MERS 的研究情况,在PubMed 下搜索“SARS+MERS+Review” 得到的经典综述文献如SARS and MERS: recent insights into emerging coronaviruses[22]及 Pathogenic human coronavirus infections: causes and consequences of cytokine storm and immunopathology[23]等,可迅速获得前两次冠状病毒引发流行病的总体介绍和致病机理。

硕士阶段(科研实践到科研探索阶段),需要了解目标领域的热点文献,并能进行实验操作及重复文献中的同性试验,学会利用PubMed 进行文献查找和学习,再在文献阅读基础上尝试实验设计、操作、结果分析等工作。以此次新型冠状病毒肺炎疫情为例,相关最新最重要的科研成果一般会发表在生物医学最顶尖的期刊,如《The New England Journal of Medicine》 《The Lancet》 《JAMA》,自然科学最顶尖的期刊如《Nature》 《Science》等,如最早报道此次新型冠状病毒肺炎疫情的顶刊文章A Novel Coronavirus from Patients with Pneumonia in China, 2019[24]及Clinical features of patients infected with 2019 novel coronavirus in Wuhan, China[25]等。在PubMed 下搜索刊名,如" Lancet" [jour] 就可看到《The Lancet》期刊最新发表的所有文章,并可加搜SARS-CoV-2 等关键词。根据个人研究兴趣,可在搜索关键词后添加其他关键词或者期刊、作者、文章类型等信息定向搜索所需文献。如对新型冠状病毒起源感兴趣,搜索“SARS-CoV-2+Origin”可以找到最早报道新型冠状病毒序列的文章,如A pneumonia outbreak associated with a new coronavirus of probable bat origin[26]及A new coronavirus associated with human respiratory disease in China[27]等。如对新型冠状病毒临床特征感兴趣,搜索“SARS-CoV-2+Clinical Characteristics”可以找到相关重要文章如Clinical Characteristics of Coronavirus Disease 2019 in China[28]及Epidemiological and clinical characteristics of 99 cases of 2019 novel coronavirus pneumonia in Wuhan, China: a descriptive study[29]等。在了解新型冠状病毒及疫情的相关信息后,可根据研究兴趣和实际情况明确研究方向,进一步利用PubMed 完成早期实验调研及初步设计。如想在恒河猴上构建新型冠状病毒的非人灵长类动物模型,进一步进行相关药物和疫苗筛选的研究。由于建立最新模型无成例可循,因此可在PubMed 下搜索“SARS+rhesus macaque”或“MERS+rhesus macaque”,找到与新型冠状病毒类似的冠状病毒的恒河猴模型的建立及其药物筛选的文章,如Using siRNA in prophylactic and therapeutic regimens against SARS coronavirus in Rhesus macaque[30]及Middle East respiratory syndrome coronavirus (MERS-CoV) causes transient lower respiratory tract infection in rhesus macaques[31]等。

博士阶段(科研探索阶段),需要根据本人实验与科学方向对标PubMed 中具体研究方向、作者/实验室、期刊、原始数据集甚至科研单位,常规性地进行文献阅读,策略学习。为了进一步完善实验设计,需要时刻把握此领域最新发展动向。因此须在PubMed 中定期关注相关重点期刊及领域的前沿研究者,搜索相关关键词,不断深入优化,把握课题前沿信息。如在新型冠状病毒的恒河猴模型课题中需时刻关注《The New England Journal of Medicine》《The Lancet》 《Nature》 等 期 刊, 定 期 搜 索“SARS-CoV-2”“COVID-19”“Pathogenesis”“rhesus macaque”等关键词,重点追踪新型冠状病毒的动物模型领域国内外主要研究者(如中国医学科学院医学实验动物研究所秦川研究组、美国国立卫生研究院过敏与传染病研究所Emmie de Wit 研究组等)。由于新型冠状病毒肺炎疫情的特殊性和急迫性,还需要时刻关注生物医学领域预印本网站如bioRxiv, medRxiv, research square, ChemRxiv,preprints 等,以第一时间掌握领域最新动态,不断完善课题设计。博士阶段还需要文献阅读助力下进行实验课题策略改善或者设计推进,通过文献阅读可以调整具体实验推进节奏和处理策略。在新型冠状病毒的恒河猴模型课题中,笔者遵循以上原则,在PubMed 上定期关注重点期刊,搜索关键词,充分掌握了新型冠状病毒感染的发病机理和疾病进程,如Clinical course and risk factors for mortality of adult inpatients with COVID-19 in Wuhan, China: a retrospective cohort study[32]等重点文章。通过追踪本领域国内外主要研究者和预印本网站,掌握了最新的实验策略、标准及方法,如Age-related rhesus macaque models of COVID-19[33]及Respiratory disease and virus shedding in rhesus macaques inoculated with SARS-CoV-2[34]等文章。通过不断的文献追踪和总结,进一步完善了笔者的实验设计和策略,推进了课题进展。另外,博士阶段需要了解PubMed 上对标期刊的文章收录逻辑、论文撰写逻辑、成果呈现形式,开展科研论文的写作,并学会使用平台上的投稿辅助工具。在课题推进的同时,甚至在课题设计阶段,就需要开始思考最后论文的撰写和投稿。通过平时的文献搜索和积累,充分了解本领域期刊的收录逻辑和文章形式,明确论文的投稿方向及相应撰写方式。以新型冠状病毒的恒河猴模型课题为例,由于《The New England Journal of Medicine》《The Lancet》 等医学类期刊是以临床研究文章为主,而此课题主要是关于临床前动物模型建立和药物筛选,因此更适合投稿《Nature》 《Science》等综合类期刊和《The Journal of Infectious Diseases》等专业性期刊。以《Nature》为例,其研究类文章又可以细分为Article, Letter 等形式,可以在PubMed 上搜索相关类型文献(例如Prevention of tuberculosis in macaques after intravenous BCG immunization[35]),同时参考《Nature》的具体投稿要求,合理安排实验数据的呈现逻辑和方式,完成科研论文的写作和投稿。另外由于新型冠状病毒相关课题的竞争激烈,为了把科研成果第一时间呈现给相关科研人员作参考,在投稿时可以考虑把论文提前发表在bioRxiv,medRxiv 等预印本网站。

上述本硕博分层课程框架的设计与现行单纯的文献检索课程相比,在PubMed 和预印本网站检索中普及了基本检索课程文献查找的基本知识的同时更具有专业性和针对性。例如本科阶段基本数据库的认识了解、关键词检索与文献传递等知识,都融入了专业文献检索的讲授。更细致的课程设计可以让生物医学学生在不同学习阶段有明确的知识获取重点,以分层次分阶段提升专业知识的掌握程度。具有较强的操作性和实用性。在没有疫情的情况下充分了解PubMed 平台并按照不同阶段查找获取学习文献即可完成分层次的生物医学检索课程培训;在紧急状态下还可以利用预印本网站进行补充。

4 结束语

上述框架的建立,可为生物医学检索课程的教学实践提供一个分层次、目标明确的资源获取思路。生物医学学生检索水平、文献阅读水平的整体提高,在全球疫情仍旧肆虐的今天尤为迫切。因为每一篇医疗案例的获取、每一个治疗策略的实践、每一分新的病毒存在原理的探索,都关乎疫情的发展和控制,更好的生物医学文献检索水平就是生物医学工作者捍卫生命、保卫家园更强大的武器。在疫情依旧在某些地区肆虐的今天,对专业教育的深刻反思,也是对逝去生命的尊重和对未来更负责任的行动。

同时,本设计本科阶段的基础生物医学检索课程,也可以另外提炼成为“通识性生物医学检索课”。在新型冠状病毒肺炎疫情肆虐全球的今天,对这种病毒新研究成果的关注已经不仅仅局限于生物医学的学术圈内,越来越多的民众也希望获取更多的第一手专业知识。从长远看,后疫情时代的人们注定会更加关注和希望学习了解流行病的爆发、传统病症的突破等方面信息,通识性生物医学检索

课程在大学中甚至媒体中的广泛开设也成为可能。

猜你喜欢
生物医学检索数据库
广西医科大学生物医学工程一流学科建设成效
蝾螈的皮肤受伤后可快速愈合
灵长类生物医学前沿探索中的伦理思考
瑞典专利数据库的检索技巧
在IEEE 数据库中检索的一点经验
一种基于Python的音乐检索方法的研究
生物医学大数据的现状与发展趋势研究
数据库
数据库
数据库