法医SNP系谱推断技术破获古汉墓被盗案1例

2021-12-07 03:05刘京郭志芳魏以梁李鹰翔管珊珊赵雯婷江丽李彩霞
法医学杂志 2021年4期
关键词:系谱烟蒂亲缘

刘京 ,郭志芳,魏以梁,李鹰翔,管珊珊,赵雯婷,江丽,李彩霞

1.公安部物证鉴定中心 法医遗传学公安部重点实验室 现场物证溯源技术国家工程实验室,北京 100038;2.中国政法大学 证据科学教育部重点实验室,北京 100088;3.大同市公安局刑事技术支队,山西 大同 037000;4.安澜智能(深圳)有限公司,广东 深圳 510630;5.江苏师范大学 江苏省系统发育与比较基因组学重点实验室,江苏 徐州 221116;6.陕西师范大学计算机科学学院,陕西 西安 710119

1 案 例

1.1 简要案情和前期检验

2016 年3 月,山西某镇古汉墓被盗,现场提取嫌疑人遗留烟蒂1 枚,检出嫌疑人常染色体STR 分型,但未比中人员。由于当地当时未建立男性家族排查库,故未对Y-STR 分型进行检验。2020 年7 月,检验烟蒂获得Y-STR 分型,录入男性家族排查系统,比中案发地附近刘姓、马姓等8 个家系共计17 人(其中3 人分型一致,3 人有2 个位点分型不一致,11 人有3 个位点分型不一致)。检验男性家族排查库中人员血样的常染色体STR,与嫌疑人未比中,故使用法医SNP系谱推断技术对家系进行排查。

1.2 检验过程

1.2.1 DNA提取与STR检验

用MagAttract® M48 DNA Manual 试剂盒(德国Qiagen 公司)提取烟蒂DNA,用NanoDrop 2000c 分光光度计(美国Thermo Scientific 公司)进行定量。使用GlobalFilerTMPCR 扩增试剂盒、YfilerTMPlus PCR 扩增试剂盒(美国Applied Biosystems 公司)分别对提取产物进行常染色体STR和Y-STR分型检测。

1.2.2 全基因组SNP检测

使用美国Infinium Global Screening Array(GSA)芯片[1](美国Illumina 公司)对烟蒂进行DNA 的全基因组SNP检测。检测结果经过数据格式转换、亲缘关系等级预测等生物信息分析后,用于法医SNP系谱推断。

1.3 数据分析及检验结果

1.3.1 基于状态一致性算法进行SNP系谱推断

状态一致性(identity by state,IBS)是指两个个体中共有的等位基因序列相同,被广泛应用于亲缘关系鉴定[2]。本项目组通过前期文献调研和算法参数优化[3-5],搭建了基于IBS 算法的系谱推断算法:首先将全基因组SNP 检测结果转换为指定格式,然后使用IBS 算法计算个体间亲缘关系系数,最后据此计算个体间亲缘关系等级。

亲缘关系系数Øij表示从个体i、j中随机抽取的两个等位基因来源于同一祖先的概率。

其中NAA,aa为个体i、j基因型都为纯合子的标记数,NAa,Aa为个体i、j基因型都为杂合子的标记数是个体x的基因型为杂合子的标记数。亲缘关系系数相关阈值参照MANICHAIKUL等[5]的研究。

1.3.2 使用SNP系谱推断锁定重点排查家系

由于该案嫌疑人Y-STR 比中的家系人员多数在外地,逐个家系排查采样需投入大量人力物力,故急需锁定重点排查家系。由于现场烟蒂在前期已检验多次,剩余检材用于全基因组SNP 芯片检测,位点的检出率为76.9%,共496 222 个SNP 位点。鉴于SNP位点检出率不高,本项目组决定使用IBS 算法计算现场检材与17 份比中样本间的亲缘关系等级。经分析,推断马甲与嫌疑人有2 级亲缘关系,马乙、马丙与嫌疑人有4级亲缘关系(马甲、马乙、马丙的Y-STR 分型结果与现场检材一致),其他家系与嫌疑人均无7 级以内亲缘关系。据此,马姓家族相关成员被确定为重点摸排对象。

1.4 根据常染色体STR分型确定嫌疑人

马姓家系有3 个分支(图1),若烟头为马甲或马丙分支所留,现场烟蒂应与马乙或马丙存在1~2 级亲缘关系,经分析,烟蒂为马丁分支成员所留。由于马丁的父亲已于2016 年年底病逝,故对现场烟蒂、马丁母亲和马丁进行三联体STR 亲缘关系分析,结果见表1。结果显示,现场烟蒂、马丁母亲和马丁的STR分型符合孟德尔遗传定律,确认现场烟蒂为马丁父亲所留,累积三联体亲权指数为2.18×1011。

图1 马姓家系图Fig.1 The family tree of Ma

表1 三联体STR分型结果Tab.1 Typing results of triplet STR

2 讨论

法医SNP 系谱推断[6-7]是基于生物大数据对复杂亲缘关系进行分析,并应用于司法鉴定。法医SNP系谱推断技术可用于Y-STR 比中的大家系中重点小家系的锁定,进而显著减少大规模摸排的样本检验量,加快案件侦破速度。法医SNP 系谱推断分析的主流算法[8]是基于血缘一致性(identity by descent,IBD)片段长度的算法和基于IBS比例的算法。IBD 算法的优点是可以较为准确地预测7 级以内亲缘关系,缺点为[8]:(1)计算时需要基于背景人群参考数据进行同源染色体分离,运行时间较长且占用较多计算资源;(2)微量降解DNA 的SNP 位点检出率不高,会造成共享片段缺失,导致预测准确性降低。IBS 算法虽只能预测4 级及以内的亲缘关系,但该算法运行速度较快且准确性受位点检出率影响较小,故适用于位点检出率不高的样本。

本例样本位点检出率为76.9%,故优先使用IBS算法进行系谱推断。嫌疑人与马甲真实亲缘关系等级是2 级,与预测等级一致;嫌疑人与马乙、马丙真实亲缘关系等级是3级,与预测等级均差1级,分析其原因可能是检出率较低导致绝对准确率(预测等级与实际等级完全一致)降低,但均在1 级以内波动。通过分析,从8 个家系中精准锁定马姓家系成员,避免了多家系多地域的逐一采样排查,节省了大量人力物力。法医SNP 系谱推断技术的应用,将突破传统STR技术实验密集型的研究模式,将全基因组SNP 检测、高通量数据分析等新技术引入法医DNA 领域,使法医DNA领域迈向数据驱动型的智慧化研究时代。

猜你喜欢
系谱烟蒂亲缘
谷子近缘野生种的亲缘关系及其利用研究
《论风格》文本系谱与论争
乱扔烟头或坐牢7年
菊科药用植物遗传多样性及亲缘关系的ISSR分析
哈萨克族系谱数字化平台建设研究
烟蒂
小白菜种质遗传多样性与亲缘关系的SRAP 和SSR分析
中国荷斯坦公牛系谱完整性研究
教你如何治好“遗传病”
浸爱的烟蒂