蚌埠地区汉族41 个Y-STR 基因座遗传多态性及法医学应用

2022-01-07 09:56何传锦张荣芳邹磊郑冰洁宋丹璐黄景峰兰江维
法医学杂志 2021年5期
关键词:蚌埠等位基因多态性

何传锦,张荣芳,邹磊,郑冰洁,宋丹璐,黄景峰,兰江维

1.蚌埠市公安局,安徽 蚌埠 233040;2.宁波海尔施基因科技有限公司,浙江 宁波 315040;3.西安交通大学医学部法医学院,陕西 西安 710061;4.南方医科大学法医学院,广东 广州510515

Y 染色体的非重组区呈严格的父系遗传,故在同一个父系家族中,其男性个体拥有完全相同的Y 染色体单倍型(除突变外)。由于父系遗传的特性,在一些特定案例中,如与男性有关的性犯罪、家系排查及父系亲缘关系鉴定实践中,Y 染色体短串联重复(YSTR)遗传标记分析具有重要作用。同时,Y-STR 重组率低、对遗传漂变敏感,其等位基因多态性的分布具有明显的群体差异,可为法医遗传学研究提供特有的群体遗传学数据,并可用于家族起源、人类进化、迁徙等群体遗传学研究[1-3]。

本研究选取安徽蚌埠地区汉族人群的41 个YSTR 基因座进行群体遗传学研究,并探讨其与16 个群体间的遗传结构和群体遗传学关系,为在法医遗传学方面的研究提供基础数据支撑。

1 材料与方法

1.1 样本采集

采集安徽蚌埠345 例健康无关的汉族志愿者的外周血样本,血液保存在FTA 血卡上。在采样之前,对每位志愿者进行充分的告知,并获取了每位志愿者亲笔签署的书面知情同意书。所有志愿者均声称其本人为汉族并且其家族在当地居住了至少三代。本研究得到了南方医科大学和西安交通大学医学部伦理委员会的批准(审批号:XJTULAC201)。

1.2 PCR-STR 扩 增 和Y-STR 分 型

按照SureID®PathFinder Plus 试剂盒(宁波海尔施基因科技有限公司)说明书,对前述血样直接进行PCR 扩增。在9700 型PCR 仪(美国Thermo Fisher Scientific 公司)上进行复合扩增,反应体系为10 μL,其中PCR Master Mix 5 μL、Primer Mix 2.5 μL、一片直径约为1.2 mm的血斑,最后加纯水补足10 μL。热循环参数:95 ℃ 5 min;94 ℃ 10 s,60 ℃ 1 min,70 ℃30 s,共29 个循环;60 ℃15min;4 ℃保温。取1 μL 扩增产物与0.5 μL内标SIZE-580和8.5 μL HIDI 甲酰胺混合(美国Thermo Fisher Scientific 公司),95 ℃变性3 min 后,迅速放置于冰上冷却3 min,使用3500xL 基因分析仪(美国Thermo Fisher Scientific 公司)进行毛细管电泳分型检测,GeneMapper®ID-X软件(美国Thermo Fisher Scientific 公司)进行分型。每批次的检测均采用DNA 9948(宁波海尔施基因科技有限公司,5 ng/μL)和去离子水分别作为阳性对照和阴性对照。

1.3 统计学分析

通过直接计数法计算等位基因和单倍型频率。基因多态性(gene diversity,GD)、单倍型多样性(haplotype diversity,HD)、单倍型匹配概率(haplotype match probability,HMP)和分辨能力(discriminative capacity,DC)均按照既往文献[4]报道的公式进行计算。

为了评估不同Y-STR 基因座分型系统在蚌埠汉族中的法医学效能,本研究进一步对最小单倍型、常用的Y-STR 分型系统[AmpFℓSTRTMYfiler’ PCR 扩增试剂盒(美国Applied Biosystems 公司)、YfilerTMPlus PCR 扩增试剂盒(美国Thermo Fisher Scientific公司)、PowerPlex Y 试剂盒和PowerPlex Y23 试剂盒]、AmpFℓSTRTMYfilerTMPCR 扩增试剂盒中的YSTR位点+快速突变Y-STR(DYF387S1、DYS518、DYS449、DYS576、DYS570、DYS627和DYF404S1)、AmpFℓSTRTMYfilerTMPCR 扩增试剂盒中的Y-STR 位点+多拷贝Y-STR(DYF387S1、DYS527、DYF404S1)等多种Y-STR 基因座组合进行HD 计算。

为了研究蚌埠地区汉族和中国其他民族之间的群体遗传学关系,通过YHRD 数据库获得贵州布依族[5]、湖南侗族[6-7]、广东汉族[8-9]、贵州汉族[10-11]、江苏汉族[12-13]、江西汉族(登录号YA004080、YA004388、YA004570)、上海汉族[14-15]、广西玉林汉族(登录号YA004624)、新疆蒙古族(登录号YA004579)、北川地区羌族(登录号YA004633)、青海撒拉族(登录号YA003302)、四川阿坝地区藏族(登录号YA004616)、四川藏族[16]、湖南土家族[6]、湖南瑶族[6]、贵阳地区彝族(登录号YA004594)共16 个群体的Y-STR 基因座单倍型分布数据作为比对数据。利用YHRD 网站上的“AMOVA&MDS 工具”进行分子方差分析(analysis of molecular variance,AMOVA)和多维尺度分析(multidimensional scaling,MDS)并计算群体间遗传距离Rst及其P值,使用MEGA6.0 软件(https://www.megasoftware.net/)采用邻接(neighbor-joining,NJ)法构建蚌埠地区汉族与16 个比对群体的系统发育树。

2 结果

2.1 41 个Y-STR 基因座遗传多态性

345 例个体样本中共检出343 种单倍型,其中唯一单倍型共341 种,占总单倍型数的99.42%,HD 值为0.999 966 3。41 个Y-STR 基因座上共观察到386 个等位基因,其中DYS385a/b、DYF387S1、DYS527、DYF404S1为多拷贝基因座(附表1),分别检出50、39、34、25 种基因型,其余均为单拷贝基因座,各基因座分别检出4~15 个等位基因,等位基因频率分布在0.002 9~0.933 3,GD 值分布在0.126 7(DYS645)~0.963 8(DYS385a/b),详见表1。

表1 蚌埠地区汉族人群41 个Y-STR 基因座的基因多态性Tab.1 Genetic diversities of 41 Y-STR in Bengbu Han population(n=345)

本研究计算得到了最小单倍型、AmpFℓSTRTMYfilerTMPCR 扩增试剂盒、YfilerTMPlus PCR 扩增试剂盒、PowerPlex Y、PowerPlex Y23、AmpFℓSTRTMYfilerTMPCR 扩增试剂盒+快速突变Y-STR、AmpFℓSTRTMYfilerTMPCR扩增试剂盒+多拷贝Y-STR 7种Y-STR分型系统的HD 值,分别为0.998 533 873、0.999 477 587、0.999 915 74、0.999056286、0.999764071、0.99991574 和0.999764071。

2.2 各群体间的遗传距离与系统发育树的构建

选取获得的蚌埠地区汉族人群28 个Y-STR(DYS19、DYS389 Ⅰ、DYS389 Ⅱ、DYS390、DYS391、DYS392、DYS393、DYS385a/b、DYS438、DYS439、DYS437、DYS448、DYS456、DYS458、DYS635、YGATAH4、DYS481、DYS533、DYS549、DYS570、DYS576、DYS643、DYF387S1、DYS449、DYS460、DYS518和DYS627)基因座的分型结果,将其与贵州布依族、湖南侗族、广东汉族、贵州汉族、江苏汉族、江西汉族、上海汉族、广西玉林汉族、新疆蒙古族、北川地区羌族、青海撒拉族、四川阿坝地区藏族、四川藏族、湖南土家族、湖南瑶族、贵阳地区彝族的分型数据进行比较,通过AMOVA 得到17 个群体间的遗传距离并绘制MDS 图(图1)。

图1 基于Rst值的蚌埠地区汉族与其他16 个群体的多维尺度分析图Fig.1 Multidimensional scaling plot of Bengbu Han and other 16 reference populations based on Rst values

MDS 结果显示,蚌埠地区汉族与江苏汉族、上海汉族等中国东部汉族群体聚类在一起,与其他民族的遗传关系较远,此外也发现,湖南瑶族、湖南侗族、湖南土家族、北川地区羌族与南方汉族群体聚类在一起(图1)。

遗传距离的计算结果(表2)显示,蚌埠地区汉族与江苏汉族遗传距离最小(Rst=0.006 7),与广东汉族男性遗传距离最大(Rst=0.035 5)。基于28 个Y-STR 基因座组合的17 个群体之间的Rst值,采用NJ 法得到系统发育树(图2)。系统发育树中,不同的颜色代表不同群体的语系,系统发育分析的结果显示:整个系统发育树分为两个大支,藏族的两个群体聚类在一起,形成其中的一个分支,其余群体组成另一个分支。在第二个分支中,大部分汉藏语系的群体聚类在一起。本研究的蚌埠地区汉族首先与江苏汉族、上海汉族和江西汉族聚类在一起,然后再与广西玉林汉族聚类在一起。

表2 基于Maximal基因座组合28 个Y-STR 基因座计算蚌埠地区汉族与其他16 个群体的遗传距离(Rst)Tab.2 Genetic distances(Rst)between Bengbu Han and 16 reference populations based on 27 Y-STR

图2 基于群体配对Rst值构建蚌埠地区汉族与其他16 个群体的系统发育树Fig.2 Phylogenetic tree of the studied Bengbu Han and other 16 reference populations based on Rst values

3 讨论

3.1 蚌埠地区汉族41个Y-STR基因座的法医学效能

本研究所使用的SureID®PathFinder Plus 试剂盒是由宁波海尔施基因科技有限公司研发,包含41个Y-STR 基因座。该试剂盒采用六色荧光标记系统,除了包含YfilerTMPlus PCR 扩增试剂盒的基因座之外,还包含了其他12 个Y-STR 基因座(DYS645、DYS557、DYF387S1、DYS596、DYS518、DYS596、DYS518、DYS449、DYS593、DYS549、DYS576、DYS570、DYS627和DYF404S1)和3 个Y 染色体插入/缺失基因座(rs199815934、rs771783753 和rs759551978)。本研究中41 个Y-STR 基因座在345 例蚌埠地区汉族无关男性个体中共观察到343 种单倍型,41 个Y-STR 基因座所组成的HD 值为0.999 966 3。41 个Y-STR 基因座上共观察到386 个等位基因,等位基因频率分布在0.002 9~0.933 3,GD 值为0.126 7~0.963 8,除DYS388、DYS645、DYS438、DYS3914 个基因座GD 值小于0.5外,其余基因座GD 值均大于0.5,表明这些基因座在蚌埠地区汉族人群中具有较好的遗传多态性。此外,本研究对不同Y-STR 基因座组合的法医学效能评估进行了评估,结果表明,随着Y-STR 位点的增加,Y-STR基因座组合的鉴别效能进一步提升。同时,快速突变基因座及多拷贝基因座的引入进一步增加了整个YSTR 系统的鉴别能力。4 个多拷贝基因座DYS385a/b、DYF387S1、DYS527、DYF404S1的遗传多态性最高,分布在0.904 5(DYF404S1)~0.963 8(DYS385a/b)。DYS385a/b基因座GD 值最高与国内相关文献[17-19]报道的汉族遗传数据结果具有一致性。

345 例样本中,检测到4 个稀有等位基因DYS518(36.2)、DYS627(19.2)、DYF387S1(37.2)、DYF404S1(13.2)。稀有等位基因一般是指出现在等位基因分型标准品之外的等位基因,这些等位基因在群体中的频率较低。稀有等位基因属于微变异,该变异的出现与等位基因的突变引起重复序列中核苷酸的缺失、插入、转换或者颠换有关[20]。稀有等位基因的产生可以形成更多的单倍型,并且遵循孟德尔遗传定律,可以遗传给后代[21-22]。通过文献检索,发现4个稀有等位基因在金华地区汉族、山东汉族、广西汉族、湖南苗族和湖南土家族等群体中均有报道[6,23-25]。这些稀有等位基因的出现,在法医学应用实践中可以发挥重要的作用,尤其是在对同一家系的不同个体进行个体识别时有着重要的应用价值。

3.2 蚌埠地区汉族与其他16 个群体间遗传关系

为进一步评估蚌埠地区汉族与中国其他地区民族的遗传关系,本研究基于28 个Y-STR 基因座组合的Rst值,采用NJ 法构建了系统发育树。整个系统发育树明显分为两支:两个藏族群体聚类在一起成为一支,其他民族聚集在另一支。蚌埠地区汉族与中国大多数南方汉族群体聚类在一起,如江苏汉族、上海汉族、广西玉林汉族和江西汉族等群体,表明蚌埠汉族与大多数南方汉族群体具有较近的遗传关系,这一结果与安徽人口的移民历史是一致的。蚌埠位于安徽省北部,安徽的人口以外来汉族移民的后代为主,特别是江西人,以发生在明朝早期的洪武大移民为最大规模[26]。长期以来蚌埠汉族与南方其他地区汉族的混居、通婚可能导致蚌埠地区汉族与南方汉族有着较近的遗传关系。

汉族是我国、也是世界上人口最多的民族,分布最广,汉族的遗传结构对于研究大型民族的人口扩张有代表性意义。基于Rst矩阵构建的MDS 图显示,湖南瑶族、湖南侗族、湖南土家族、北川地区羌族与南方汉族群体聚类在一起,这和汉文化扩张引起的近期基因交流是密切相关的[27-30]。

本研究的41 个Y-STR 基因座在蚌埠地区汉族群体中有着较高的遗传多态性,适用于法医学个体识别、亲权关系鉴定,可以满足家系排查的需求,研究获得的数据可以为构建该地区民族Y-STR 数据库提供数据支撑。对蚌埠地区汉族及其他省份16 个群体的群体遗传学研究表明,蚌埠地区汉族与南方汉族群体有着更近的遗传关系。

猜你喜欢
蚌埠等位基因多态性
护骨素基因启动子区T950C多态性与2型糖尿病合并骨质疏松症的关系
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
亲子鉴定中男性个体Amelogenin基因座异常1例
四氢叶酸还原酶基因多态性与冠心病严重程度的相关性
妊娠期女性MTHFR 677C>T基因多态性分布特征及其与妊娠高血压疾病的相关性
小院系列之二
近现代蚌埠民族传统体育的流变研究
用数学思维分析遗传的基本规律
爱笑不爱笑,基因早知道