Tema 6. Diseño y síntesis de proteínas para modificación del DNA. Dedos de Zinc, Efectores TAL y CRISPR/Cas9 Flashcards

1
Q

¿Cuál es la estructura de los dedos de cinc?

A

Los dedos de Zinc son dominios característicos de factores de transcripción , reconocen una secuencia específica del DNA y activan la transcripción de genes

Cuando no se conocía la estructura 3D, alineando la secuencia de estos factores, se dieron cuenta que los dedos de zinc constaban de repeticiones de 25-30 aa con puntos comunes formando módulos (hay aa conservados en determinadas posiciones en todas las
repeticiones, como cisteínas o histidinas).

Esos grupos de Cys e His coordinan un ion zinc que ayuda a estabilizar la estructura 3D del dominio. La estructura también presenta Tyr, Phe y Leu que están formando una parte hidrofóbica para estabilizar el dominio. Se pensó que los aa que interaccionan con el DNA debían ser los situados en el extremo de los dedos según las representaciones que se hacían. Cuando se resolvió la estructura tridimensional se observó que las subunidades de 30 aa están formadas, de N-terminal a C-terminal, por dos cadenas beta antiparalelas seguidas de una hélice alfa (muy importante). Esta estructura se mantiene gracias al Zinc unido a 2 Cys y 2 His (*) . Las
cadenas laterales de la superficie están cargadas y se encargan de
interaccionar con las bases del DNA. Una misma proteína o factor de
transcripción tiene varios de estos módulos (secuencias de 30 aa).

Si mutamos la región de las Cys e His, vemos que el dedo de zinc ya no interacciona con el DNA, pero esto no es debido a que las Cys e His interaccionen con el DNA, sino porque tienen función estructural y al alterar la estructura, ya no se produce la interacción.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Cómo se da la interacción entre los dedos de cinc y el DNA?

A

El ZF interacciona con el DNA de forma muy específica . Los
residuos de la alfa hélice y el lazo son los participantes en el
reconocimiento del DNA. El -1 (porque no pertenece a la
hélice alfa), 3 y 6 interaccionan cada uno con un nucleótido
de la cadena principal (en dirección 5’-3’) , y el aa de la
posición 2 interacciona con el siguiente nucleótido , pero en la
cadena complementaria (en dirección 3’-5’).

En el dibujo horizontal, la cadena principal es la de abajo,
ya que los ZF interaccionan con ella 3 veces cada uno.
Como hay 3 módulos , esa proteína reconocería 9 pares de
bases . Si nos fijamos bien, el extremo 5’ de la cadena
principal coincide con el extremo C-t del ZF. En el dibujo
de la derecha, la cadena principal es la de la izquierda.

Tener en cuenta que cualquiera de las dos cadenas puede
ser principal o retardada , esto va a depender del gen con
el que trabajemos, y por lo tanto, es necesario un estudio
previo.

Zif-BASE es una base de datos que incluye todos los ZF del genoma junto a sus secuencias de reconocimiento . Podemos introducir una secuencia problema y nos dará el mejor ZF que se une a ella. Según la longitud de nuestra secuencia tendremos más o menos ZF.

Una vez que se secuenció y se determinó la estructura de los ZF se observó que existía un patrón de bases en el DNA que era bastante repetitivo , es decir, que un ZF con una secuencia determinada, siempre va a reconocer el mismo patrón en el DNA, se demostró
que los ZF son específicos , y por lo tanto, una pequeña variabilidad en estas 3 posiciones + 1 es la que determina el patrón de DNA a reconocer. Es más, como vemos en la imagen de arriba, esta especificidad está determinada, por ejemplo, por Arg, His y Thr, y reconocerá en la cadena principal el patrón GGT. Debido a esta característica, vemos que no es posible cubrir todas las combinaciones del genoma y este es el gran problema de este sistema, y razón por la cual este sistema no se ha desarrollado más y se ha quedado obsoleto ante los efectores TAL. Una vez descubierto este hecho los científicos se dedicaron a mutar estas 3+1
posiciones de los ZF para obtener toda la paleta de ZF existentes hoy en día que permitieran cubrir el mayor número de combinaciones de tripletes.

Con un ZF no hay estabilidad de unión al DNA ni especificidad, por lo que se hacen combinaciones de ZF. Si queremos reconocer una secuencia de 18 nucleótidos (tamaño mínimo para que haya cierta especificidad) usando 6 ZF, lo normal es hacer tándems de 3 en
3, o de 2 en 2. Debido a que hay tripletes los cuales no son reconocidos por los ZF existentes, es necesario añadir un linker de aa que no nos interfiera con nuestra función y que permita el reconocimiento de la secuencia.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Cuál es la estructura básica de un factor transcripcional artificial?

A

Una vez que tenemos un ZF que reconoce una determinada
secuencia en el DNA, podemos añadirle dominios al ZF, para
darle una aplicación funcional (editar el DNA, activar o inhibir
la transcripción de genes…). Para ello, es necesario:

  • Añadir una Señal de Localización Nuclear NLS
    en el N-t, para que se transporte el ZF al núcleo una vez haya
    sido sintetizado.
  • Añadir un dominio efector en el C-t, con la función que nos interese. Por ejemplo, un factor de transcripción que active o reprima la expresión de un gen, o la nucleasa FokI para cortar el DNA e inducir reparación homóloga o heteróloga, para reparar genes o introducir
    mutaciones.
  • Si queremos visualizar esta estructura mediante fluorescencia, también podremos añadirle GFP o Cherry o alguna proteína fluorescente. Esta no se suele colocar en partes funcionales porque podrían estropear la estructura, por eso se suele colocar, por ejemplo, detrás del NLS. Si la GFP es muy grande y queremos colocar algo más pequeño, podemos introducir un aa modificado (en cualquier lado no hay problema).

Todo esto se introduce en la célula mediante plásmidos: Transformamos bacterias con un plásmido que contenga un gen que codifique nuestro NLS-ZFP-Efector.

Una de las aplicaciones clínicas es la reversión de un proceso canceroso bloqueando la transcripción de una proteína maligna con la sobreexpresión celular de una ZFP artificial que compita con la endógena.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué aplicaciones le podemos dar a los dedos de cinc?

A

Combinando los ZF con distintos dominios efectores , podemos conseguir aplicaciones:

  • Screening de factores de transcripción . Fusionamos el ZF con un dominio de unión a un factor Transcripcional, para atraerlo a una determinada secuencia. Podemos hacer un cribado en placas multipocillo y ver qué factor de transcripción es el que mejor funciona (para ello, el factor, tras llegar, debe activar la transcripción de un reportero, por ejemplo, luciferasa).
  • Activación o represión de un gen . Fusionamos ZF con un activador o represor, que además podemos hacerlo modulable para activarla/reprimirla cuando queramos.
  • Edición de DNA. Fusionamos ZF con Fok1, que corta el DNA, para ello es necesario la presencia de los dos dímeros por lo que en un off target es muy complicado que corte.
  • Metilaciones, desacetilaciones… (activación o desactivación de la transcripción de genes)
  • Insertar fragmentos de DNA exógeno.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Cómo podemos usar los dedos de cinc para reprimir genes?

A

En este ejemplo se intenta controlar la expresión de un
oncogén. Determinadas leucemias se basan en una
reorganización de uno de los cromosomas. En este caso, el
gen ABL y el gen BCR están en dos cromosomas distintos,
pero si quedan juntos en el mismo cromosoma bajo el
mismo promotor y se sintetiza BCR-ABL como si fuera una
sola proteína. BCR-ABL es una quinasa no regulada
(oncogénica) responsable de muchas leucemias.

La reorganización cromosómica tiene como consecuencia
la existencia de distintas proteínas BCR-ABL con distinto peso molecular, pues se produce al azar.

Como control del experimento usaremos células oncogénicas que expresen un tamaño de proteína diferente: p210 . (los nº 190 y 210 son sus pesos moleculares).

El objetivo es bloquear la síntesis de BCR-ABL en células modelo de ratón BaF3. Estas células necesitan IL-3 para poder crecer y dividirse, pero las oncogénicas son independientes del IL3, pueden crecer en condiciones adversas.

En nuestra preparación tenemos células transfectadas con el gen BCR-ABL p190, y otras con p210. Intentaron crear un ZF tan específico, que sea capaz de reconocer tan solo a la p190.
Al introducir el ZF, que reconoce 9 pares de bases (3 módulos) de p190 y está fusionado con la enzima FokI, se produce el corte de p190 e inactiva el gen. Esto tiene la consecuencia de que estas células dejan de ser oncogénicas, y ahora son incapaces de sobrevivir sin la presencia de IL-3, además, el genoma queda fragmentado y se induce la apoptosis.

Comprobamos que las células con p190 mueren en ausencia
de IL3 (su núcleo se fragmenta, inicio del proceso de apoptosis). El control, células p210, siguen dividiéndose

En esta clase de experimentos es muy importante que una vez finalizados se realice una extracción del DNA y su secuenciación, para comprobar que realmente el fenotipo que se expresa procede de la actuación de los ZF. Es necesario pruebas de que el mecanismo con el que trabajemos ,sea cual sea, modifica

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cómo podemos usar los dedos de cinc contra HSV?

A

En este ejemplo cultivamos células HeLa infectadas con herpes virus. Se diseñó un ZF con 6 módulos que reconocen genes virales, y le fusionamos un inhibidor, que reprime la transcripción de genes tempranos, bloqueando así la multiplicación y expansión viral.

Se realizaron varios experimentos, en los cuales se determinaba la cantidad de partículas virales en el sobrenadante, vieron que un módulo con solo 3 ZF no es suficiente para inhibir al virus,
pues hay suficiente especificidad, que sí se consigue con el módulo de 6 ZF.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Cómo podemos utilizar los dedos de cinc para corregir mutaciones?

A

Utilizamos dos ZF de 3 módulos cada uno, unidos a la nucleasa Fok1, que cortará las cadenas del DNA (los ZF son complementarios, para que una Fok1 corte una cadena y el otro Fok1 la otra cadena, esto indica que aunque solo haya 3ZF la especificidad es bastante alta y por lo tanto los off-targets bajos). Tras el corte, puede haber:

  • Recombinación no homóloga: El organismo intenta reparar esa rotura de forma aleatoria. Algunas podrán restablecer el gen
    silvestre, pero habría que hacer una gran selección, pues estas nikasas (proteínas que provocan un “hueco” en el DNA, en cual falta
    una base, se puede producir en una o en las dos cadenas) tienen una tasa de reparación muy baja, sin embargo esto nos podrá servir
    para introducir mutaciones y romper el gen.
  • Recombinación homóloga : Si en el sistema introducimos un fragmento de DNA homólogo al que hemos roto, se produce un
    entrecruzamiento, y se usa ese fragmento como molde para reparar el roto. Si ese fragmento de DNA contiene la secuencia que nosotros queremos introducir o el “alelo bueno” , estaremos reparando el gen mutado. Este mecanismo solo ocurre en 1-2% de las veces, pero es importante porque podríamos corregir gran cantidad de enfermedades genéticas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿Qué otros usos le podemos dar a los dedos de cinc?

A

Minimizar síntesis de ErbB2. Deprimir la resistencia de las células
cancerosas a las drogas…

Uno de los inconvenientes de los zinc fingers : Las secuencias que queremos reconocer tienen que ser múltiplos de tres . La batería de secuencias que recogen son bastantes pero no son los suficientes como para cubrir todo el genoma . Además, hay que tener en cuenta
que los dos tipos de recombinación que existen, y también, que cada hay variabilidad entre distintos organismos, tejidos e incluso entre células de cada tejido . Todo esto sin tener en cuenta las células cancerosas , que poseen mecanismos de reparación del DNA bastante atrofiados, esto es un importante problema en todos los sistemas de edición del DNA que vayamos a estudiar, pues no conocemos con exactitud cómo actúan estos mecanismos y lo
que es clave para poder manipularlos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Qué son los efectores TAL?

A

Existen bacterias, como Xanthomonas , que infectan a plantas y poseen unas proteínas, las cuales son capaces de unirse a determinadas secuencias del genoma de la planta, activando
a un conjunto de factores de transcripción que llevan a esa región, a la formación de células cancerosas. Estas proteínas están compuestas de efectores TAL, formados por dominios de
30-35 aa repetidos en tándem (muchas más repeticiones que las que vimos en el ZF). Cada dominio o módulo es dos hélices alfa unidas por un loop (2 o 3 aa), y todos los dominios tienen la misma secuencia excepto dos aa situados en el lazo de unión entre las dos hélices. Estos dos aa forman el llamado Dominio variable de Repetición , y son los que intervienen en el reconocimiento del DNA, reconociendo 1 base determinada.

De tal forma que teniendo tan solo 4 módulos que reconozcan de manera específica una sola base, solucionaríamos el problema de los ZF, pues cualquier secuencia de DNA puede ser mi diana.

La flexibilidad de este sistema es muchísimo mayor que los ZF,
ya que cada módulo reconoce 1 nucleótido, mientras que los
ZF cada módulo reconoce 3 nucleótidos.

La prolina 27 está altamente conservada porque es la que se
une los distintos módulos TAL de la la proteína. Sirve para
hacer la conexión con el siguiente TAL. Además, la prolina se
caracteriza por cambiar un poco la dirección de la hélice alfa,
por lo que produce un giro con respecto al siguiente módulo, y,
tras varios módulos, observamos algo parecido a la imagen de abajo:
el efector acaba rodeando completamente la molécula de DNA , como una hélice que se amolda a la hélice de DNA (reconocen la hebra principal por el surco mayor).

Se vio que había un código aa-nt, aunque no se cumple siempre: Existe una tendencia de determinados pares de aa a reconocer preferentemente un determinado nucleótido. Por ejemplo, el par HD preferentemente interacciona con citosina, aunque hay un mínimo
porcentaje de casos donde también se puede unir a A o a T. Sin embargo, vemos como sí hay algunas combinaciones de aa como NA, las cuales reconocen tan solo una base en concreto. La peor base a la hora del reconocimiento es la adenina, pues no existe un reconocimiento de 100%.

A TAL también le podemos añadir las mismas funciones que para ZF:
activación o represión de genes, metilaciones, corte y edición del
genoma…

Se suelen utilizar entre 15/21 dominios TAL para un buen reconocimiento, eso multiplicado por 30 aa, y por 110, para calcular el peso molecular de la proteína.

Es un sistema de reconocimiento algo más sofisticado que los ZF. Posee una mayor versatilidad y éxito . La ventaja que tiene es el single nucleotide: cada módulo reconoce una base, no hay limitación a combinaciones de tres como en los ZF (no estamos restringidos a
que no exista un ZF para una determinada combinación de nucleótidos). La dificultad de este proceso es al fin y al cabo que se pueda formar todo el complejo entorno a nuestra secuencia, pues puede estar rodeada de histonas, o simplemente debemos tener en cuenta la complejidad del núcleo de una célula, por ejemplo, humana, pues nuestro sistema debe competir con el sistema endógeno de la célula, y su propia biología, conocida y desconocida.

Uno de sus primeros usos fue modificar la planta de arroz silvestre y mutar las zonas de reconocimiento por el TALE de las bacterias, para que las plantas se vuelvan resistentes a la infección por Xanthomonas. Para ello, diseñaron TALEs específicos para poder cortar los sitios que son reconocidos por los talen endógenos de la planta.

El síndrome de Rett se debe a una mutación del cromosoma X, en un gen llamado MECP2, que es una metilasa del DNA. Los niños nacen sin síntomas algunos y a la edad de 2-3 años comienzan a mostrar síntomas neurológicos. La enfermedad acaba por detener el desarrollo del cerebro y los niños quedan postrados en sillas de ruedas, es una enfermedad rara, y sin cura.

Un grupo de investigación ha estado trabajando en la creación de simios a los que se les ha inducido la anomalía genética de este síndrome, para poder tener un modelo de estudio que
no sean niños. Esto lo han conseguido mediante el uso de ovocitos de simios normales e introduciendo el sistema TALEN para poder modificar el gen MECP32, dando lugar a una reproducción bastante fiel de la enfermedad.

Estos científicos crearon dos secuencias TALEN las cuales reconocían cada una una hebra del DNA, a cada TALEN le fusionaron una enzima DNPI, que es una enzima de restricción que tan solo actúa en nuestra secuencia, pues es necesario la presencia de los dos monómeros para inducir el corte, esto disminuye la cantidad de off-targets que se pueden producir.

Al final dependemos siempre del sistema de reparación de la célula por mucho que podamos controlar la parte en la que modificamos el DNA, pues este sistema sigue siendo un gran desconocido. A pesar de esto, incluso en el caso de que se hayan producido las
mutaciones esperadas, se han dado casos de mosaicismos, pues no todas las células poseen la mutación o se expresa en unas y en otras no, la razón final de esto es la misma de antes, no conocemos el 100% de la biología de una célula, ni cada mecanismo, por lo que los
resultados pueden ser imprevisibles aún habiendo desarrollado estos sistemas queda mucho camino por recorrer. Esto es aplicable a todos los sistemas que se ven en este tema.

En el ejemplo de arriba, los simios seleccionados poseen un porcentaje de mutación suficientemente elevado para ser modelos de estudio.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿Cómo funciona el sistema CRISPR-Cas9?

A

Este sistema sirve para editar el DNA pero de una forma totalmente distinta. Realmente se descubrió hace muchos años (en los 80-90)
mientras unos investigadores estaban estudiando el mecanismo de regulación del genoma de la fosfatasa alcalina, y vieron que
había secuencias repetitivas de nucleótidos con 3 residuos fijos .

Poco a poco, estudiando esas repeticiones, vieron que era un sistema presente en bacterias y arqueobacterias para protegerse frente a una infección viral . Las endonucleasas como Cas9 reconocen secuencias de DNA específico de virus y los cortan para que las
partículas virales no puedan completar su ciclo.

Cas9 es una endonucleasa con distintos dominios:
- Unos dominios Rec de reconocimiento de DNA .
- Un dominio endonucleasa (Ruv I, II y III)
- Otro dominio endonucleasa (HNH)
- Una región para interaccionar con un RNA guía.
Tiene dos dominios endonucleasas porque Cas9 va a cortar las dos cadenas de DNA.

Este sistema es capaz de reconocer dsDNA que posea en su secuencia, una secuencia complementaria al RNA guía o tracrRNA.

Cas9 va a cortar las dos cadenas de DNA (por eso tiene dos dominios endonucleasa, en el que cada uno corta una cadena). Quien le aporta especificidad es un RNA guía , con una secuencia complementaria al punto de corte y una región en forma de horquilla de ensamblaje para unirse a Cas9).

Para cortar, Cas9 también necesita secuencias PAM , 3 nucleótidos, complementarios arriba y abajo, y que estén en la cadena complementaria a la secuencia target (a esta cadena se le
suele llamar no complementaria, pues no es complementaria de nuestro RNA guía). Si no tenemos la secuencia PAM, el DNA no va a ser cortado, pues no va a ser reconocido por Cas9.

En ingeniería de proteínas se usa una construcción completa donde colocamos en un RNA la zona de reconocimiento del DNA que yo quiero editar. Al diseñar el RNA guía, la secuencia que reconoce debe estar al lado de un triplete PAM en el DNA.

Algunos investigadores han creado un tetraloop llamado sgRNA, que lleva la las secuencias del crRNA unida al tracrRNA, separadas por un loop que hace de puente, esto es una simplificación del sistema que permite que el complejo se forme más rápidamente y sea más
sencillo de manipular.

La ventaja de este sistema es que la Cas9 se encuentra ya en la célula, pues la hemos introducidos nosotros, sea de forma manual o a través de un vector, el RNA guía también al igual que la Cas9, lo único que debemos introducir es el tetraloop con la secuencia
complementaria al fragmento que queremos manipular. Además de que este sistema es mucho más eficiente que los anteriores.

Como vemos en la imagen el sistema es sencillo, tenemos dos dominios nucleasa, el HNH 12 (histidine-aspargine-histidine, secuencia que se encuentra en el centro catalítico y que
interviene en el corte) y RuvC (pues es homóloga en secuencia al la RuvC de bacterias), el subdominio PI (PAM interacting domain), que es el encargado de reconocer la secuencia PAM (NGG, siendo N cualquier aa), esto permite la colocación del sistema para realizar el
corte correcto y el dominio BH (bridge helix) que comunica el dominio de reconocimiento con los de corte.

1º Entra el RNA guía, produciendo un cambio conformacional dejando el complejo preparado para aceptar la dsDNA.

2º Entra el dsDNA y se forma el complejo binario Cas9-sgRNA (que contiene el RNA guía o tracrRNA).

3º Es entonces cuando entra la secuencia target y se produce la interacción de PAM (que como hemos dicho se encuentra en la cadena no complementaria), es esta interacción la que da lugar a otro cambio conformacional en la HNH, que se acerca a la cadena complementaria para producir el corte. El dominio RuvC corta 3 nucleótidos a la izquierda de la secuencia PAM e igual el dominio HNH.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Cuál es la especificidad de Cas9 y qué relación tiene con los procesos de mutagénesis?

A

Como sabemos las cadenas de nucleótidos poseen carga negativa que se debe a los grupos fosfato, por lo que es de entender que los centros activos de las nucleasas posean aa cargados positivamente, esto crea un canal como vemos en la imagen que estabiliza la
unión. Uno de los grandes problemas que tiene Crispr-Cas, es que tiene a equivocarse, es decir es capaz de reconocer secuencias similares a la diana y ejercer su efecto en ellas, es decir, de la secuencia de 21 nucleótidos que va a reconocer va a haber 2 o 3 de ellos que no sea necesario una complementariedad del 100% para que se forme el ensamblado. Esto genera Off-targets, pues además de cortar mi gen corto otros de secuencia similar.

En el experimento que se muestra aquí arriba vemos como la edición del gen EMX1 posee 3 off-targets definidas, que se ve cuando amplificamos por PCR y secuenciamos por Sanger. Los científicos que realizaron este experimento realizaron mutagénesis dirigida para mutar los aa que forman parte del centro catalítico por alaninas, y comprobaron que había casos en los cuales disminuía notablemente la cantidad de off-targets como es el caso de R780A, K810A y H982A.

Por lo tanto, estos mutantes son candidatos a generar un mutante de Cas9 que sea funcional, que sea específico para la secuencia diana y que no produzca off-targets.

Ejemplo 1. Si diseñamos un RNA guía con una secuencia complementaria a una zona sin PAM, la Cas9 se une pero no va a ser capaz de cortar. Si fusionamos Cas9 con un represor o activador podemos reprimir o activar la transcripción de esa zona a la que se une Cas9.

Ejemplo 2. Podemos mutar hnh o loopC para cortar solamente una de las cadenas.

Ejemplo 3. Con este sistema podemos modificar hasta 5 genes de forma simultánea, ya que podemos introducir en una célula Cas9 y 5 RNA guías distintos.

Ejemplo 4. Tenemos un ratón enfermo. Introducimos Cas9, los RNA guía para cortar la mutación y que se arregle por recombinación no homóloga. También podríamos meter dos oligonucleótidos con la secuencia correcta del gen de interés, par que por recombinación
homóloga se repare. Aun así, la recombinación homóloga solo funciona en 1-2% de veces, así que necesitamos hacer miles de screenings.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly