混合DNA数据的示证中法官会问你什么问题?
混合DNA数据的法庭示证是个难题,面对威严、不容置疑的法官,作为一个理性、专业的技术人员,该如何回答哪些绝对不能出错的问题?顺利的将犯罪实施者定罪,维护法律的尊严,我们通过一个简单的案例,一起来看看,国外法庭示证过程中,法官是如何提问的,以及他们该是如何应对的。
案件信息
·QJ案,案件发生地点,甲的床上;
·精斑在甲的床上发现;
·DNA检验结果为两人混合:甲+嫌疑人;
·甲为主要贡献者,嫌疑人为次要贡献者;
·与嫌疑人对应的DNA结果中,在分子量较大的几个位点上由于降解造成位点没有分型。
在案件的调查过程中,LR值已经计算出来,如下:
*注:C-Complaint;POI-PersonOfInterest;U-Unknown;Hp-Hypothesis of the prosecution;Hd-Hypothesisofthedefense
Q1:在这起案件的报告中使用统计学计算,并计算了LR值,请解释下LR值是什么?
A:LR值表示的是两个假设,控方假设和辩方假设对证据的解释程度。控方假设和辩方假设是互斥性假设,LR为证据提供了一种基于术语“支持”的简单约定,根据一定的数据支持一种假设,排斥另一种假设。LR>1支持控方假设,LR<1支持辩方假设。
LR值是对证据权重解释的最新表达方式,已经在全球范围内的期刊和实验室得到了广泛的认可。
Q2: 在这起案件里,LR的假设是如何设置的?
A:LR的假设是建立在案件的相关背景信息上的,这些背景信息代表了对证据解释的方式;
我们假设甲在甲的床上;
控方假设:甲+嫌疑人;辩方假设:甲+未知个体
Q3: 这起案子LR值的计算结果是多少?
A:LR值为万亿, 10 15
混合DNA图谱来自甲和嫌疑人的可能性是来自甲和未知个体的1015次方倍。
Q4:这个值很大,比全世界的人数还多,意思是不是说,这就是嫌疑人的DNA?
A:不是。
这只是很强烈支持控方假设的证据,证明嫌疑人是其中的贡献者。但是,也有可能,这个DNA来自于其他的贡献者。
Q5: 你的意思是说,嫌疑人QJ受害人的可能性是其他人的1015次方倍么?
A:不是
这不是我要表达的意思。首先,我的证据只跟DNA有关,跟QJ这个犯罪行为无关。我的意思是,这个经DNA检验获得的混合图谱中的DNA,来自于甲和嫌疑人的可能性是高于甲和未知个体的,且是它的1015倍。
Q6: 在这起案件中,你还有其他的假设么?
A:有的,
根据案件的相关信息,可以列出合理的假设;
例如:POI+U/2U, C+POI/2U
Q7: 如果没有假设受害人甲在混合图谱中,那么你得出的LR值是不是要远远低于报告中的LR值?
A:不,或者说不一定,我们假设的贡献者数量越少,LR值会越高。
Q8:你计算LR值的方法改变了,现在你在使用云算GPM混合图谱分析软件进行LR值的计算,为什么要改变方法?
A:我们改变了方法,是因为云算GPM能够将DNA图谱的更多信息用于LR值的计算。
云算GPM DNA混合图谱分析软件具备更高的区分效能,能够将真实的贡献者从错误的贡献者中区分出来。
Q9:云算GPM 混合图谱分析软件是什么?
A:云算GPM是个软件工具,它可以帮助DNA检验人员进行DNA图谱的解释,并进行统计学计算。
云算GPM是全连续的DNA混合图谱分析软件。
(法官可能会继续问,什么是全连续法?)
Q10: 云算GPM是怎么工作的?
A:云算GPM利用STR图谱所提供的信息,对各个假设进行权重的计算,然后利用权重进行LR值的计算。
DNA图谱的原始数据可以直接导入云算GPM进行判读。然后云算GPM利用生物学模型和MCMC算法对DNA图谱进行统计学分析,并给出最佳的解释方式。
Q11: 云算GPM用的是什么生物学模型?
A:生物学模型基于DNA分析过程中已知的生物影响因素,将这些因素进行汇总,并按照其对DNA分析的影响方式,进行数理建模,以模拟DNA分析的整个过程。
例如,峰高的理论值和变异系数,模板量的核算,降解因子以及+1/-1 stutter等。
Q12: MCMC算法是什么?
A:MCMC全称,马尔科夫链-蒙特卡洛算法。简单理解是通过“拒绝-接受采样”算法寻找最佳答案的方法。
(法官可能会继续问,什么是马尔科夫链-蒙特卡洛算法?)
Q13:能不能简单的描述下云算GPM的分析过程?
A:云算GPM在计算过程中先根据STR图谱信息,计算出每个位点下每种可能的基因型,根据数学模型计算每个峰的总产物量,从而计算出无数个模拟图谱,然后将模拟图谱与原始图谱进行比较计算,得出该模拟图谱与原始图谱的计算数值,我们可将该数值理解为“相似度”,这个数值越大,表示模拟图谱与原始图谱越接近。然后通过MCMC运算,会计算出每种基因型的权重值。MCMC会尝试大量的可能性组合并且进行对比,最终找出最佳的组合。
Q14: 你所说的MCMC是专门用于云算GPM的么?
A:不是的,MCMC是一种通用的计算机分析方法,诞生于20世纪50年代,它在统计学领域有着广泛的应用,涉及多种学科。比如计量经济学、生物信息学、天气预报等领域都有应用。
Q15:如果重新分析一次,你可能会得到一个不同的数字,难道这个软件没有考虑到可重复性么?
A:不管测量什么,科学的方法总是存在一定程度的不确定性和可变性。在这起案件中,已经就这种不确定性进行科学的评估,并告知被告人。
Q16: 请列举出你在计算过程中不确定性的来源?
A:至少包括:sampling variation(取样不确定性),MCMC, Theta;
对所有不确定性来源都进行了评估,并做出了有利于被告的合理让步。
Q17: 报告中显示,混合的DNA来源于两个贡献者,为什么云算GPM确定是2个贡献者,而不是3个贡献者?
A:云算GPM没有确定贡献者的数量,它只是利用科学的方法进行计算和建议,这个需要DNA检验专家进行复核。
Q18: 大分子量片段的信号降低,是不是意味着结果会受到随机效应的影响,这样软件的分析就不可靠了,对吧?
A:不是,云算GPM已经充分考虑了随机效应,随着模板量的降低,允许方差越大。
Q19: 嫌疑人分子量大的片段没有信号,为什么就认为这些位点丢失(drop out)了,这会不会有偏见?
A:云算GPM 没有认为这些位点丢失(drop out)了,分子量大的片段位置没有信号的问题可能性很多,而丢失(drop out)只是其中的一种可能。