Parte del trabajo de análisis de DNA forense o medicolegal es la
creación de bases de datos de población para los loci STR
estudiados.
Los cálculos de probabilidad se basan en el conocimiento de las
frecuencias de los alelos en una población humana representativa,
para cada locus (y en mostrar el equilibrio de Hardy-Weinberg para la población
mediante pruebas estadísticas).
La frecuencia de un alelo se define como el número de copias del
alelo en la población, dividido por la suma de todos los alelos
en esa población.
Para un individuo heterocigótico, si los dos alelos tienen frecuencias
p y q en una población, la probabilidad (P) de que un individuo
tenga ambos alelos en un solo locus es
P = 2pq
Si un individuo es homocigótico para un alelo cuya frecuencia es
p, la probabilidad (P) del genotipo es
P = p2.
Vimos antes que Bob Blackett tiene el genotipo (15,18) en el locus D3S1358.
En una base de datos de referencia establecida a partir de 200 estadounidenses
caucásicos, la frecuencia de los alelos 15 y 18 era de 0.2825 y
0.1450, respectivamente. La frecuencia del genotipo (15,18) es, por tanto,
de
P = 2 (0.2825) (0.1450) = 0.0819, u 8.2%.
Probabilidad para un perfil de ADN de múltiples
loci
Si se demuestra mediante pruebas estadísticas adecuadas sobre las
bases de datos de frecuencia alélica que los alelos de varios loci
se heredan de forma independiente, entonces la probabilidad del genotipo
combinado se puede calcular multiplicando.
La probabilidad (P) para un perfil de ADN es el producto de las probabilidades
(P1, P2, ... Pn) para cada locus individual;
es decir:
Probabilidad del perfil = (P1) (P2) ... (Pn)
Las probabilidades pueden ser números extremadamente pequeños,
cuando se incluyen en el perfil los 13 marcadores STR del CODIS. Como ya
se ha mencionado, Bob Blackett calculó la probabilidad de su propio
perfil en 1.3 · 10-16, o no más frecuente que
1 de cada 7700 billones de personas, que es más de un millón
de veces la población total del planeta.