9.1 Estudio experimental de la complejidad en el genoma eucariótico

Definición

La “complejidad” de una secuencia de DNA se define como la secuencia más larga, no repetida, con la que se puede representar o describir. Puede comprenderse mejor esta definición con algunos ejemplos:

secuencia
(todas 14 nt)
secuencia representativa “complejidad” nº de
repeticiones
% de DNA
repetitivo
AAAAAAAAAAAAAA A 1 14 14/14 = 100%
AGAGAGAGAGAGAG AG 2 7 14/14 = 100%
AGCAGCAGCAGCAG AGC 3 4,7 14/14 = 100%
AGTCAGTCAGTCAG AGTC 4 3,5 14/14 = 100%
AGTCGGAGTCAGTC AGTC, GG 6 3 12/14 = 86%
AGTCGGATCAAGTC AGTC, GGATCA 10 2 8/14 = 57%
AGATCGACTTACGG AGATCGACTTACGG 14 0 0   

Aplicado al conjunto del genoma, este concepto de “complejidad” queda claramente relacionado con la presencia de DNA repetitivo. Más específicamente, el término se define como la suma de tamaños (pb) de todas sus secuencias diferentes (es decir, las secuencias repetidas se contabilizan sólo una vez). En consecuencia, para un tamaño de genoma dado, a mayor grado de repetición, menor “complejidad”.

Nota: La interpretación de este término se puede prestar a confusión, pues la acepción común de la palabra complejidad puede parecer contraria a la definición anterior. De hecho, en el texto ya se ha empleado con esa acepción común, al plantear que los genomas eucarióticos son complejos debido a la presencia de DNA repetitivo. Así, un genoma con gran número de secuencias repetidas es aparentemente más complejo, pero de acuerdo con esta definición su “complejidad” es menor. Para evitar confusiones, se usará entrecomillado cuando se refiera a la definición específica dada.

Estudio experimental

El descubrimiento y análisis del DNA repetitivo, característico del genoma eucariótico, se ha basado fundamentalmente en las técnicas de reasociación del DNA desnaturalizado (capítulo 12). Esquemáticamente, este estudio implica las siguientes etapas:

Para poder obtener conclusiones al comparar la renaturalización de distintos tipos de DNA es conveniente que las moléculas que se reasocian sean de longitud regular. Esto se consigue (etapa 2) fragmentando el DNA genómico mediante sonicación de la disolución (ultrasonidos de alta intensidad) o haciéndola pasar a presión a través de un orificio pequeño, lo que ejerce fuerzas de cizalla que fragmentan las largas moléculas de DNA. Igualmente, conviene partir de la misma concentración de DNA, o en caso contrario debe compensarse su valor incluyéndolo en la variable Cot, término que se define a continuación. La reasociación se analiza (etapa 5) midiendo la fracción numérica de fragmentos que se han reasociado, en función del tiempo de renaturalización. La proporción de DNA bicatenario se determina espectrofotométricamente (cap. 12), o por otras técnicas que diferencien el DNA monocatenario del bicatenario.

Ejemplo de ensayo de reasociación

Como ejemplo de este tipo de estudio, se muestra la escisión de tres genomas hipotéticos sencillos de tamaño diferente (A, B y C, con 1, 2 y 4 kb) en fragmentos de igual longitud (1 kb).

Curvas Cot

Para compensar el efecto que tendría la distinta concentración inicial de DNA en las muestras, se usa el producto C0 × t en lugar del tiempo de reasociación, t. Este producto se conoce normalmente como “variable Cot”. La representación gráfica de la cinética de reasociación se hace, por tanto, poniendo en ordenadas fracción o porcentaje reasociado y en abscisas logaritmo de Cot, y se habla coloquialmente de las “curvas Cot”.
La observación de una correlación inversa entre la posición de la curva de reasociación y la magnitud del genoma de partida permite el empleo de las curvas Cot para obtener información sobre el tamaño de un genoma:

Representación conjunta de las curvas de reasociación de tres genomas de especies diferentes (distinto tamaño), analizados individualmente.
Conclusión:
La proporcionalidad entre tamaño del genoma y tiempo de renaturalización permite usar las curvas Cot para estimar el tamaño de un genoma, a partir de otro conocido (siempre que ambos carezcan de secuencias repetidas).
En este caso, la concentración total de DNA, C0, se ha convertido de pg/mℓ a moles de pb / ℓ (masa molecular promedio de un par de bases: 610)

Además, y especialmente, las curvas Cot aportan información acerca del contenido en DNA repetitivo de un genoma. Esto es debido a que, para una misma concentración de DNA total (o, en su defecto, corregida usando la variable Cot), los fragmentos de secuencias repetidas existen en mayor concentración, por lo que se reasocian más rápidamente. Se ilustra primero esta dependencia con un ejemplo simplificado, que parte de los anteriores:

Si se mezclan las 3 muestras (genomas ejemplo A, B, C) y se mide su renaturalización, la medida observada (DNA total reasociado) describe una curva con 3 mesetas:
la reasociación tiene lugar en 3 fases, que reflejan la presencia de tres tipos de fragmentos con distinto nº de copias

De forma similar, cuando se analizan genomas reales las curvas Cot reflejan la presencia de secuencias con distinto número de repeticiones. Por ejemplo, para dos genomas típicos de un procariota (E. coli) y un eucariota (humano) se observa, de acuerdo con los criterios de interpretación explicados, que en el primero prácticamente todo el DNA es de copia única, mientras que el genoma humano posee un marcado componente repetitivo, que se agrupa bajo los términos “DNA altamente repetitivo” y “DNA moderadamente repetitivo”.