基于27个Y-STR对贵州苗族群体遗传多态性的研究*

2022-03-31 08:28刘媛媛陈静张晗金珊珊刘顶浪罗雍兰周林季晶焱
贵州医科大学学报 2022年2期
关键词:等位基因苗族遗传

刘媛媛, 陈静, 张晗, 金珊珊, 刘顶浪, 罗雍兰, 周林, 季晶焱

(贵州医科大学 法医学院, 贵州 贵阳 550004)

贵州省是中国民族最多样化的省份之一,由于境内地形山脉众多,使得各民族人群在空间上得以独立存在,形成其独特的基因类型。苗族素有“世界民族”之称,不仅在中国境内有广泛的分布,在欧洲,美洲等地也有分布。作为贵州省内人口数量最多的少数民族,其遗传结构以及与其他人群间的遗传关系一直是研究热点[1]。人类Y染色体为正常男性所特有,其约95%的区域为非重组区,具有单倍型连锁遗传及父系遗传等特点;拟常染色体区约占5%,减数分裂时可以发生交换[2-3]。Y染色体上的遗传标记具有男性独特遗传、地域特异性等优势,使其广泛地运用于复杂亲缘关系识别、个体识别、群体遗传学以及人类起源、迁徙和进化的研究中[4],在法医鉴定中用于父系家族关系鉴定、混合斑男性个体检验等[5]。评估Y-STR鉴别能力的法医学参数是遗传差异度(genetic diversity, GD),对于连锁的遗传标记,不能采用乘积定律,需先计算单倍型频率,再计算个人识别率[6]。本研究使用Y filerTMPlus试剂盒,对贵州苗族的27个Y-STR基因座(DYS19,DYS385a/b,DYF387S1a/b,DYS389I/II,DYS390,DYS391,DYS392,DYS393,DYS437,DYS438,DYS439,DYS448,DYS449,DYS456,DYS458,DYS460,DYS481,DYS518,DYS533,DYS570,DYS576,DYS627,DYS635,Y_GATA_H4)进行群体遗传学调查,并结合已发表的其他17个人群数据分析贵州苗族与国内不同地区的人群之间的遗传距离和遗传关系,为后续法医父系鉴定建立法医Y-STR数据库,以及后续的群体遗传学研究提供科学的基础数据。

1 材料与方法

1.1 样本

本研究样品收集于贵州医科大学司法鉴定中心日常检案,所有样本采集均遵循知情同意原则。采集方式为采血卡采集,共收集贵州地区苗族418名健康无关男性个体血样,所有样本收集时已回溯三代内父母皆为苗族。本文研究由贵州医科大学伦理委员会审批并批准,伦理审批号为2020 伦审第(057)号。

1.2 PCR扩增及检测

根据Y filerTMPlus试剂盒(美国Applied Biosystems公司)说明书,用直接扩增法(免提取)[7-8]对前述样本进行PCR扩增,使用9700PCR仪(美国Applied Biosystems公司)进行PCR扩增。PCR反应体系为10 μL,具体为:PCR Master Mix 5.0 μL、Primer Mix 2.5 μL、ddH2O 2.5 μL,1.5mm直径血卡,PCR循环参数见表1,每次扩增均加入2800 M Control DNA做阳性对照和无菌双蒸水做阴性对照。PCR扩增产物均在ABI3500遗传分析仪上进行毛细管电泳检测,使用96孔板进行上样,每孔上样体系为扩增产物1μL、Hi-DiTM去离子甲酰胺10 μL、CC5IS500内标0.4 μL,每加入15个样品后加入一个等位基因分型标准物Allelic(ladder)(美国Promega公司)。电泳结束后,使用GeneMapper®ID-X1.3软件(美国Thermo Fisher Scientific公司)对STR反应产物进行等位基因片段分析和数据收集。

表1 Y filerTMPlusPCR扩增循环参数Tab.1 Parameters of Y filerTM PlusPCR amplified cycle

1.3 统计学分析

贵州苗族27个Y-STR基因座的遗传差异度(genetic diversity, GD)和单倍型多样性(haplotype diversity, HD)按公式GD/HD=(n/n-1) (1-ΣPi2)(Pi为等位基因或单倍型频率,n为样本数)计算,其中双拷贝基因座DYS385a/b和DYF387S1a/b作为单倍型计算。Y-STR基因座单倍型结构使用YHRD参考数据库(Y-STR haplotype reference database,http://www.yhrd.org/search)进行分析,应用 YHRD 在线工具进行分子方差分析(analysis of molecular variance,AMOVA),计算贵州苗族群体与其他17个民族(青海撒拉族[9]、克拉依玛维吾尔族[10]、甘肃藏族[11]、内蒙古达斡尔族[12]、湖南侗族[13-14]、海南黎族[15-16]、广西壮族[17-18]、湖南瑶族[19]、贵州仡佬族[20-21]、贵州布依族[22]、四川回族[23]、贵州汉族[24-25]、吉林白山满族[26]、北川羌族[27]、湖南苗族[13]、贵州土家族[28]、贵州贵阳彝族[29])的遗传距离RST值,分别采用MEGA 7.0[30-31](http://www.megasoftware.net/)软件,使用NJ法(neighbor-joining)对贵州苗族和其他参考群体的系统发育树,使用SPSSv18.0软件进行多维尺度分析(multi-dimensional scaling,MDS)。

2 结果

2.1 等位基因频率及群体遗传学参数

贵州苗族群体的27个Y-STR基因座的等位基因频率见表2。27个Y-STR基因座共观察到240个等位基因,各基因座分别检出3~12个等位基因。其中,本研究在DYS449基因座上检测到微变异,等位基因为30.2。在DYF387S1a/b上检出了9种三等位基因情况,在双拷贝基因座DYS385a/b共检出12个等位基因,49种单倍型。27个Y-STR基因座共观察到240个等位基因,等位基因频率为0.002 4~0.892 4。贵州苗族群体的27个Y-STR基因座的GD值见表3。23个单拷贝的Y-STR基因座的GD值为0.195 0~0.879 1,除了DYS390、DYS391、DYS437、DYS438、Y_GATA_H4五个基因座以外,其余基因座的GD值>0.5。

表2 贵州苗族27个Y-STR基因座等位基因频率(n=418)Tab.2 Allele frequencies of 27 Y-STR loci in Guizhou Miao group population(n=418)

续表2

续表2

表3 27个Y-STR基因座的GD值Tab.3 GD value of 27 Y-STR loci

2.2 贵州苗族人群与其它17个人群的比较分析

基于27个Y-STR基因座,计算贵州苗族和其他参考群体的RST值见表4。基于RST值使用邻接法构建了贵州苗族与其他17个参考群体的系统发育树,见图1。根据遗传距离对贵州苗族与其他17个参考群体的进行MDS分析,见图2。

3 讨论

本研究调查结果显示,27个Y-STR 基因座在贵州苗族群体中的GD值为0.195 0~0.912 8,其中23个单拷贝的Y-STR基因座的GD值为0.195 0~0.879 1。除了DYS390、DYS391、DYS437、DYS438、YGATAH4这5个基因座以外,其余基因座的GD值均大于0.5,其中基因座DYS390的GD值是0.4615,基因座YGATAH4的GD值是0.473 4均比较接近0.5。本研究发现DYS391、DYS437、DYS438基因座的遗传多态性较低,这与既往国内关于不同人群的研究报道基本一致[32-34],考虑所用商业试剂盒位点参考数据以欧美人群为主这一原因。两个多拷贝基因DYS385a/b和DYF387S1a/b的GD值分别是0.9128和0.9002。本次研究所得的27个Y-STR基因座GD值结果表明,Y filerTMPlus试剂盒中有24个Y-STR基因座在贵州苗族群体中显示出较高多态性。本次研究的27个Y-STR基因座中,DYS385a/b、DYF387S1a/b为多拷贝基因座,此类基因座的一对引物在Y染色体上有多个结合位点,因此会出现扩增出多个片段长度不同的PCR产物的情况,这可能和染色体结构有关[35]。本研究的418个样品中,在DYF387S1a/b基因座检出三等位基因9例,在DYS385a/b基因座中没有检出三等位基因,说明在DYF387S1a/b基因座上出现特殊型的情况更多,这一现象在之前的研究中也有报道[36]。本研究在DYS449基因座上检测到微变异,该等位基因为30.2,提示后续可对该基因座是否存在贵州苗族特殊的等位基因进行深入研究。

表4 贵州苗族和其他对比群体的遗传距离RstTab.4 Genetic distance Rst values among Guizhou Miao group and other populations

遗传距离是表示群体间或物种间遗传差异或遗传分化最重要的参数,本次研究基于群体的RST值构建了贵州苗族和其他民族群体的系统发育树。从该发育树上可以发现,贵州苗族与内蒙古达斡尔族、青海撒拉族、克拉依玛维吾尔族、甘肃藏族之间的遗传距离相对较远,推测原因是这些人群主要居住的地方处于高原地带,人群之间流动比较少。本研究还通过建立MDS图得到贵州苗族与其他人群更明显的地理和种族聚集特征,从MDS的结果可以看出,包含贵州苗族在内的18个人群大致可以划分为6个类群:第一类群,青海撒拉族、克拉依玛维吾尔族、甘肃藏族;第二类群,内蒙古达斡尔族、湖南侗族;第三类群,海南黎族、广西壮族、湖南瑶族、贵州仡佬族、贵州布依族;第四类群,四川回族、贵州汉族、吉林北山满族、北川羌族、贵州苗族;第五类群,湖南苗族、贵州土家族;第六类群,贵州贵阳彝族。贵州苗族与四川回族、北川羌族和吉林满族的遗传距离相对较近,与内蒙古达斡尔族、湖南侗族、海南黎族、克拉玛维吾尔族的遗传距离相对较远,这一结果与系统发育树所得的结果基本一致。从MDS可以发现,遗传距离与地域和民族群体都有着密不可分的联系。本研究中贵州苗族与地理位置相近的贵州其他人群也有一定的遗传差异,由此推测即使地理位置相近,但是不同民族群体之间的差异因素也会对群体遗传关系有较大的影响。从近期国内外研究来看苗族在群体遗传上是一个较为独特的群体。在利用全基因组SNP对贵州苗族人群的相关研究中指出,苗瑶语系的人群起源于长江流域中部的古百越,并经历了从四川和贵州向南迁移到越南和泰国的过程,在这个过程中苗族经历了非常复杂的人群混合历史。研究发现,作为国内主要苗族分支之一的湖南苗族与福建的畲族及南方汉族群体有更多的遗传同源性,而贵州苗族与壮侗语系的人群有更多的共享基因,更具遗传亲和力,且与东南亚的人群也有混合的历史。因此对于贵州苗族的群体遗传结构需要使用更全面全基因组数据来进行进一步的研究与刻画[1,37]。

综上所述,本次研究中的27个Y-STR基因座组成的单倍型计算的遗传距离结果与各参考群体地域分布基本一致,表明Y染色体遗传标记在群体间的遗传距离和基因漂流的评价中起到了重要作用。该27个Y-STR基因座在贵州苗族人群中具有丰富的遗传多态性,可为贵州苗族父系亲缘关系的鉴定提供有价值的信息。同时,本次研究的数据可以为父系谱系在法医学应用和群体遗传学方面提供有用的信息。

猜你喜欢
等位基因苗族遗传
以歌为家——在沪苗族务工妇女的音乐生活
亲子鉴定中男性个体Amelogenin基因座异常1例
“85后”非遗传承人的旗袍梦
还有什么会遗传?
还有什么会遗传
还有什么会遗传?
用数学思维分析遗传的基本规律
苗族老照片
苗族芦笙制作师
漂亮的“银饰”