法庭科学DNA二代测序检验规范GB/T 1693-2020(20210101)
《法庭科学DNA二代测序检验规范GB/T 1693-2020》由中华人民共和国公安部于2020年8月1日发布,自2021年1月1日起施行。
目 次
1 范 围
2 规范性引用文件
3 术语和定义
4 缩略语
5 总则
6 原理
7 检验器材和试剂
8 检验流程
9 数据分析
10 遗传参数计算
附录A (资料性附录)法庭科学DNA二代测序检验记录表
1范 围
本标准规定了利用二代测序技术进行法庭科学人类DNA遗传标记靶向测序检验的术语和定义、原理、检验器材和试剂、检验流程,以及数据分析、遗传参数计算应遵守的基本要求。
本标准适用于针对各类法医学物证检材的STR,SNP、InDe1等遗传标记以及线粒体DNA进行二代测序检验分析,为法庭科学实践提供遗传学信息,适用于所有从事法庭科学检验的DNA实验室和产品制造商。
2 规范性引用文件
下列文件对于本文件的应用是必不可少的。凡是注日期的引用文件,仅注日期的版本适用于本文件。凡是不注日期的引用文件,其最新版本(包括所有的修改单)适用于本文件。
GB/T 27025-2019 检测和校准实验室能力的通用要求
GB/T 30989-2014 高通量基因测序技术规程
GB/T 35537-2017 高通量基因测序结果评价要求
3术语和定义
下列术语和定义适用于本文件
3.1 DNA测序DNA sequencing
对DNA分子的核苷酸排列顺序的测定,即测定组成核酸分子的腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和胸腺嘧啶(T)的排列顺序。
3.2 二代测序 second generation sequenc ing
区别于传统Sanger(双脱氧法)测序,能够一次并行对大量核酸分子进行序列测定的技术,通常一次测序反应能产出不低于100 Mb的测序数据。
3.3 靶向测序 targeted sequencing
针对特定基因集或基因组区域内已知和新型变异进行测序,有效降低测序成本,提高测序深度,更为有效地研究特定区域的遗传变异。
3.4 桥式 PCR bridge polymerase chain reaction
文库两端的DNA序列与芯片表面固定的引物序列特异性结合,以文库DNA为模板,进行桥形扩增。通过不断变性和扩增的循环过程使得每个DNA片段在各自的位置上复制集中成束,生成DNA簇。每个DNA簇包含成千上万单克隆扩增子,以每个DNA单链为模板,逐个合成DNA互补链,将碱基信号强度放大,进而达到测序所需信号的强度。
3.5 乳化 PCR emulsion polymerase chain reaction
将用于PCR反应的水相体系与油相体系混合,形成大量油包水的微乳液独立PCR反应空间,如果PCR反应体系中加入的核酸模板数量合适,每个独立反应空间中将只有一个模板分子。在形成的独立反应空间中进行相同模板的平行扩增,即可得到大量相同的扩增结果,实现基因扩增。
3.6 DNA纳米球 DNA nanoball
在二代测序的模板扩增过程中,先将DNA进行片段化处理,加接头序列和环化,形成单链环状DNA,然后通过滚环扩增将单链环状DNA扩增2~3个数量级最终产生的产物。
3.7 单次测序 single run sequenc ing
测序仪器运行一个测序流程,如一次单向测序或一次双向测序的行为。
[GB/T 30989-2014,定义3.20]
3.8 文库 library
通过生物来源的、人工合成的或克隆技术等所得到的一个重建分子群,如基因组文库、互补DNA文库、噬菌体展示肽文库等。
[GB/T 30989-2014,定义3.5]
3.9 接头 adapter
用于标记和固定待测序片段的一小段已知序列的DNA片段。
3.10 标签或条码 index:barcode
一段特征性的脱氧核苷酸短片段,在多样本混合检测时,充当识别特定样本来源的唯一标志。
3.11 测序通量 throughput of gene sequenc ing
单次测序可获得序列信息的基因片段数量或可测定的脱氧核糖核酸和核糖核酸(以碱基表示)数量
[GB/T 30989-2014,定义3.21]
3.12 测序读长 read length of gene sequencing
测序能测得的最长DNA片段的长度,通常以碱基数表示。
[GB/T 30989-2014,定义3.24]
3.13 测序深度 depth of sequencing
待测样本中某个指定的核苷酸被检测的次数。
[GB/T 30989-2014,定义3.31]
注:对于STR的二代测序,指待测样本中某条指定的序列被检测的次数。
3.14 测序准确率 accuracy of gene sequenc ing
对已知序列的基因进行测序,获得的正确碱基数占可识别的碱基数比例。
[GB/T 30989-2014,定义3.25]
3.15 碱基识别正确率 accuracy of base calling
单次测序正确碱基数占碱基总数的比例。
[GB/T 30989-2014,定义3.27]
3.16 碱基识别错误率 inaccuracy of base cal ling
单次测序错误碱基数占碱基总数的比例,与碱基识别正确率(3.15)相对。
[GB/T 30989-2014,定义3.28]
3.18 等位基因覆盖度比 allele coverage ratio
基因座分型为杂合子时,两个等位基因的测序深度的较低值与较高值的比值(0< ACR <1),常用于评估基因座内测序信号的均衡性。
3.19 有效序列 effective read
测序结果中,所有能比对到参考基因组的目标区域序列数占所有测序序列数的比例。
4缩略语
下列缩略语适用于本文件。
ACR:等位基因覆盖度比(Allele Coverage Ratio)
DNA:脱氧核糖核酸(Deoxyribonucleic Acid)
DNB:DNA纳米球(DNA Nanoball)
EPCR:乳化PCR(Emulsion Polymerase Chain Reaction)
InDel:插入缺失多态性(Insertion Deletion Polymorphism)
PCR:聚合酶链式反应(Polymerase Chain Reaction SNP:单核苷酸多态性(Single Nuc leotide Polymorphi sm)
STR:短串联重复序列(Short Tandem Repeat)
5总 则
5.1 鉴定人应具有法医物证鉴定执业资格,熟悉并掌握基于二代测序进行法庭科学遗传标记检验的原理和方法,并能正确使用分析软件对测序结果进行分析与评价。
5.2实验室应有完备的文书体系,准确、清晰、完整地记录实验流程和结果,相关格式参见附录A.
原始记录、报告等应归档留存,保证其具有可追溯性。
5.3实验室的环境与设施应符合GB/T 27025-2019的规定。为了有效防止DNA污染,实验室应设置分隔独立的工作区域进行PCR扩增前操作(试剂配制、样本制备等)和后续PCR扩增、测序分析等检验操作,并标识区分不同工作区,各区间不能直通。所有实验操作应在规定区域进行。
6原 理
将生物样本制备成待测样品,通过桥式PCR、乳化PCR或DNA纳米球扩增等PCR扩增技术,将待测样品放大收集成库,然后进行平行循环测序。利用边合成边测序的策略,加入一种或多种带标记或不带标记的底物核苷酸,在聚合酶的作用下,按照碱基互补配对原理,进行DNA链的延伸,延伸一轮则取一轮底物与模板结合后发出的信号,包括荧光信号、电信号或半导体芯片检测的离子信号等,收集该信号并确定所测位点的碱基信息。当上一轮测序完成后,重复测序过程,即实现大规模并行基因测序。
7检验器材和试剂
7.1 通则
7.1.1 对于采用的检验器材和试剂等产品需按照GB/T 27025-2019的要求经方法确认后方可使用于日常检案。
7.1.2 对于采用的商业化或自行开发的法庭科学遗传标记二代测序检测试剂需进行质量评价验证,包括但不限于准确性、灵敏度、稳定性、一致性、均衡性、种属特异性及遗传标记的群体遗传学参数调查。
7.2 器材
主要检验器材包括:
a)二代测序仪,基本参数要求包括:碱基识别质量大于20,Q值过滤之后的准确率大于等于99.9%;
b)PCR仪;
c)荧光定量PCR仪;
d)离心机;
e)低温冰箱;
f)移液器。
7.3 试剂
主要检验试剂包括:
a)DNA提取试剂,用于释放、分离获得各类生物样本中的所有DNA并进行纯化;
b)PCR复合扩增试剂,用于大规模平行复合扩增针对STR,SNP,InDel等遗传标记或线粒体DNA的各目标位点靶序列,试剂盒内至少应包含:扩增引物、高效扩增酶及缓冲液;
c)文库构建试剂,用于核酸样品的测序文库构建,试剂盒内至少应包含:接头、DNA连接酶或DNA聚合酶、缓冲液;
d)测序试剂,用于对测序文库进行二代测序,试剂盒内至少应包含:测序引物、高效测序反应酶及缓冲液。
8检验流程
8.1 通则
检验流程应符合相应试剂说明书和仪器操作规范要求,并进行实验室内部方法验证,制定相应的作业指导书,内容至少包括:
a)检验步骤:至少包括DNA提取与定量、测序文库构建、测序文库纯化与定量、测序检验等;
b)质量控制:至少包括DNA质量和浓度控制、文库浓度控制、测序原始数据质量控制、测序结果质量评价等。
8.2 DNA提取与纯化
按照GA/T 383-2014的方法开展实验,并对DNA提取的质量和浓度进行质量控制。宜采用荧光定量方法对DNA浓度进行定量并记录。
8.3 目标序列扩增
将适量的DNA加至引物混合液和PCR反应的预混体系中进行PCR扩增,扩增后选择合适的方式对PCR产物进行纯化。扩增反应体系及循环参数以相应试剂说明书为准。实验需设置阳性对照和阴性对照。
8.4 文库构建
主要步骤包括添加接头、文库纯化、文库质量控制和标准化文库。材料和方法以文库构建试剂说明书为准,其它注意事项包括:
a)清晰标记添加的标签接头,防止标签之间造成污染;
b)标签接头连接后采用磁珠法或相关文库纯化试剂对扩增产物进行纯化处理;
c)文库质量控制宜采用荧光定量方法检验文库浓度,可选择采用生物分析仪检测文库片段大小;
d)符合质量要求的文库进行均一化和混合,均一化浓度以测序试剂和测序仪器要求为准。
8.5 模板制备
测序文库均一化、混合后,宜采用桥式PCR、乳化PCR或DNA纳米球扩增等方法进行信号放大处理,使信号强度满足测序识别要求。材料和方法以模板制备试剂说明书为准。
8.6 测序
测序反应即加入底物核苷酸,在测序酶的作用下使底物核苷酸与测序文库中的待测样品进行结合,同时收集该过程中产生的信号,包括但不限于荧光信号、电信号或离子信号。材料和方法以二代测序试剂说明书为准,其它注意事项包括:
a)实验室应根据采用的检测试剂和二代测序平台摸索确定合适的文库上机浓度;
b)根据检测的法庭科学遗传标记特性选择合适的读长以保证测序结果的准确性和完整性;
c)根据不同测序平台的特性和检测样本量确定合适的测序覆盖度和深度以保证测序结果的准确性,并进行充分验证。
9数据分析
9.1 通则
9.1.1 软件的分析流程开放
应选用公开数据分析流程、算法和数据分析参数的生物信息学软件,进行法庭科学遗传标记二代测序数据分析,确保二代测序实验结果准确、可溯源。
9.1.2 测序原始数据质量控制
9.1.2.1 原始数据质量评估
宜评估的指标包括碱基质量、序列质量、序列长度、N(未测到或不确定碱基)的比例、接头含量等。
9.1.2.2 数据过滤
针对评估结果过滤去除原始数据中的接头、低质量或未检出的碱基及序列,宜过滤的内容包括(以下过滤参数应根据检测不同的法庭科学遗传标记或使用不同的二代测序平台进行调整):
a)检测接头序列并进行剪切;
b)去除含一定数目N碱基的序列;
c)设定低质量碱基的判定阈值,去除含一定比例以上低质量碱基的序列;
d)设定滑动窗口,去除序列平均碱基值低于阈值的序列;
e)去除剪切后低于一定长度的序列;
f)其他经过验证的剪切去除序列方式。
9.1.3 数据比对分析
采用二代测序平台推荐的商业化分析软件或者其他适合的分析软件,对过滤后的测序数据中的候选法庭科学遗传标记进行分型。统计测序通量、测序深度、遗传标记的等位基因覆盖度比、有效序列比例等测序结果质量评价指标。
9.2 STR分型
9.2.1 二代测序STR数据分析软件应支持将STR作为序列多态遗传标记进行分型,即长度相同而序列不同的STR等位基因可被识别为不同的等位基因。序列多态分型结果命名应与现有长度多态命名兼容,并具备序列唯一性。
9.2.2 以GRCh38作为比对参考序列,以其正向序列作为STR序列比对依据。
9.2.3 测序读长要足够覆盖STR扩增子长度,不可通过序列拼接的方式进行STR分型,未测通扩增子的数据要舍去。
9.2.4 STR分型可针对不同基因座设定合适的测序深度作为分析阈值。
9.3 SNP分型
9.3.1 以GRCh38作为比对参考序列
9.3.2 SNP位点的测序深度需大于等于100。
9.3.3 采用dbSNP中ID号码(rs#)的方式进行SNP位点命名。
9.4 InDel分型
9.4.1 以GRCh38作为比对参考序列,
9.4.2 InDel位点的测序深度需大于等于100。
9.4.3 插入等位基因以序列信息标示,缺失等位基因用“-”进行标示。
9.5 线粒体DNA测序
以人类线粒体DNA参考序列(NCBI Reference Sequence:NC 012920.1)作为比对参考序列,进行序列比对、拼接和定位,标出与之不同的碱基作为特征点,数据测序深度需大于等于100。
10遗传参数计算
10.1 将STR作为序列多态性遗传标记进行法庭科学参数和亲权指数计算,即长度相同而序列不同的STR等位基因是独立的不同等位基因,所采用的人群频率数据应是序列多态STR等位基因频率统计数据。
10.2 在进行法庭科学参数和亲权指数计算过程中,应充分考虑所检遗传标记间连锁关系的影响。
·附录A