Capítulo 1. Genética y Genómica
Introducción. 1.1 Estructura del ácido nucleico. 1.2 Genes. 1.3 Transcripción. 1.4 Proteínas. 1.5 Traducción. 1.6 Redes reguladoras genéticas: proceso transcripcional. 1.7 Genoma y Genómica. 1.8 Tecnología del Microarreglo.
Introducción. En este capítulo presentamos un resumen bastante detallado de los conceptos biológicos fundamentes que son necesarios para poder entender que es la Biología Computacional, y que es la Bioinformática. Hemos hecho una síntesis de todos los procesos genéticos, por lo que ellos son mucho más complejos que lo que aquí se presenta, y para profundizar en el tema sugerimos la bibliografía que al final de este capítulo damos.
La genética es la ciencia que estudia los genes, ya que en ellos están las características de la herencia. Los genes se forman de segmentos de ácido desoxirribonucleico (ADN), el cual es una doble hélice consistente de dos cadenas interrelacionadas y complementarias de nucleótidos. El conjunto entero del ADN es el genoma del organismo. El ADN controla la estructura, la función y el comportamiento de las células y puede crear copias casi o exactas de sí mismo. Las moléculas de ADN están ensambladas en cromosomas, y los genes son la región funcional del ADN.
En la historia de la genética, la herencia y la variación han constituido la base de la misma. En la investigación moderna, la Genética proporciona herramientas importantes para la investigación de la función de genes particulares, así como del análisis de interacciones genéticas. Los genes contienen la información necesaria para determinar la secuencia de aminoácidos de las proteínas. Éstas, a su vez, desempeñan una función importante en la determinación del fenotipo final, o apariencia física, del organismo.
Cada gen codifica información acerca de la estructura y funcionalidad de alguna proteína producida en la célula. Las proteínas son la maquinaria de la célula y la mayor determinante de sus propiedades. Ellas pueden realizar una gran cantidad de tareas en la célula, tales como reacciones catalizadoras, transportar oxigeno, regular la producción de otras proteínas, etc. Los genes y las proteínas están envueltos en dos grandes procesos: transcripción y traducción. Transcripción es el proceso de copiar la información codificada en el ADN en una molécula llamada mensajero ARN, (ARNm). Muchas copias del mismo ARN pueden ser producidas por solo una simple copia de ADN lo que permite a la célula producir una gran cantidad de proteínas. Esto ocurre en el proceso llamado traducción, el cual convierte el ARNm en cadenas de aminoácidos llamados polipéptidos. Los polipéptidos pueden combinarse con otros polipéptidos o actuar por su propia cuenta como las proteínas.
Figura 1.1 La doble hélice de ADN y su estructura química
El flujo de información del ADN al ARN y de ahí a las proteínas es conocido como el dogma central de la biología molecular.
El dogma central de la biología molecular es:
ADN ---------> ARN -------->PROTEINAS
replicación transcripción traducción
Asociados a este proceso existen otros: el proceso de transcripción inversa, edición de ARN, y replicación del ARN. La transcripción inversa se refiere a la conversión de una molécula con simple cadena de ARN en una molécula de doble cadena de ADN, con la ayuda de una enzima llamada transcriptasa inversa (reverse transcriptase). Por ejemplo el virus de HIV consiste de un genoma ARN que es convertido en ADN e insertado en el genoma del individuo receptor. La edición del ARN se refiere a la alteración del ARN después que este ha sido transcripto del ADN. Por lo que la última proteína producto del resultado de editar la molécula del ARN, no se corresponde con la que originariamente codificó el ADN. Finalmente, la replicación del ARN es un proceso donde el ARN es copiado en ARN sin la intervención del ADN. Varios virus como el de la Hepatitis C, utilizan este mecanismo.
1.1 Estructura del ácido nucleico.
Cada molécula de ADN está constituida por dos cadenas formadas por un gran número de compuestos químicos llamados nucleótidos. Estas cadenas forman una especie de trenza que parece una doble hélice. Cada nucleótido está formado por tres unidades: una molécula de azúcar llamada desoxirribosa, un grupo fosfato y uno de cuatro posibles compuestos nitrogenados llamados bases: adenina (abreviada como A), guanina (G), tiamina (T) y citosina (C). El azúcar tiene 5 átomos de carbonos que están numerados del 1' al 5'. El grupo fosfato está asociado al átomo 5'-carbono, mientras la base está asociada al átomo 1'-carbono. El átomo 3'-carbono también tiene un grupo hydroxyl (OH) asociado a él. La siguiente figura ilustra las tres unidades, en el dibujo que esta a la izquierda, la bolita roja es oxigeno, la violeta es fósforo, la verde es carbono, la blanca es hidrogeno y la azul es nitrógeno.
La molécula de desoxirribosa ocupa el centro del nucleótido y está flanqueada por un grupo fosfato a un lado y una base al otro. El grupo fosfato está a su vez unido a la desoxirribosa del nucleótido adyacente de la cadena, en el siguiente dibujo se ilustra la unión del grupo fosfato y la desoxirribosa, en esta ultima los átomos de carbono no fueron escritos para simplificar el dibujo.
Estas subunidades enlazadas desoxirribosa-fosfato forman los lados de una escalera; las bases están enfrentadas por parejas, mirando hacia el interior y forman los segmentos. Los nucleótidos de cada una de las dos cadenas que forman el ADN establecen una asociación específica con los correspondientes de la otra cadena. Las dos cadenas opuestas están unidas por hidrógeno entre las bases, formando los pares de bases. Los nucleótidos que contienen adenina se acoplan con los que contienen tiamina, (A • T par) y los que contienen citosina con los que contienen guanina, (G • C par).
Figura 1.2. La doble hélice con nucleótidos y con los cuatro compuestos nitrogenados, llamados bases.
Casi todas las células del organismo contienen el mismo ADN. Cada vez que la célula se divide este material se replica fielmente. La información guardada en el ADN es usada para codificar las proteínas en el proceso de transcripción-traducción.
El ácido ribonucleico es un polímero que es bastante cercano en estructura al ADN. Una de las diferencias es que en el ARN el azúcar es ribosa más que deoxirribosa, mientras que el ADN tiene un hidrógeno en la posición 2', la ribosa tiene un grupo hidroxyl en esta posición. Otra diferencia es que la base timina es sustituida por la estructura similar de base uracil (U) en un ribonucleótido.
Los deoxirribonucleótidos en el ADN y los ribonucleótidos en el ARN están unidos por un enlace de un grupo fosfato donde una adherencia es entre el fosfato y el 5'-carbón de deoxirribosa, y la otra adherencia es entre el fosfato y el 3'-carbón de deoxirribosa. Este arreglo da la polaridad o direccionalidad 5' 3' de la molécula, denotada así por convenio. Es decir, siempre se escribe la sucesión de nucleótidos comenzando con un 5' en la izquierda, por ejemplo, 5′-ATCGGCTC-3′. El ADN comúnmente aparece en la naturaleza como dos cadenas de nucleótidos enrollados en una doble hélice con la repetición del polímero de azúcar fosfato-deoxirribosa sirviendo como columna vertebral. Las cadenas opuestas están unidas mediante enlaces de hidrógeno entre las bases, formando pares de bases. Así una cadena está orientada de 5' 3', y la otra de 3' 5'. Cada base puede actuar con solamente otro tipo de base. Las bases en los pares de bases se dicen que son complementarias. El par A • T tiene dos enlaces de hidrógenos, mientras que G • C tiene tres enlaces de hidrógenos. Estos enlaces son responsables de mantener unidas las dos cadenas opuestas del ADN. Así si una molécula de ADN tiene muchos G • C pares, esta es mas estable que la que contiene muchos A • T pares. Esto implica que la que contiene mas G • C requiere mayor temperatura para separar las dos cadenas.
¿Cómo la molécula de ADN se duplica? A pesar de que las dos cadenas de la doble hélice son complementarias ellas llevan la misma información. Durante la replicación las dos cadenas se separan y cada una actúa como un patrón para la síntesis de una nueva cadena complementaria. Las nuevas moléculas de dobles cadenas pasan a las células hijas durante la división celular. La fase de replicación del ADN en la célula es llamada la fase de Síntesis. Después que las cadenas se separan las simples bases de cada lado están expuestas. Así ellas están libres para formar otro par de bases con otros nucleótidos complementarios. La enzima que es responsable de construir nuevas cadenas es llamada ADN-polimerasa.
1.2 Genes.
Los genes representan la parte funcional del ADN y ellos son los que pueden transcribirse y producir el ARN. Un gen contiene una región reguladora y en una terminal 5' puede ligarse con varias proteínas y así inicia la transcripción en la región codificadora del ARN. Esto esencialmente permite al gen recibir y entonces responder a otra señal de adentro o de afuera del genoma. En el extremo 3' del gen, hay otra región que indica la terminación de la transcripción.
En las células eucariotas (células que tienen núcleos), muchos genes contienen intrones, los cuales son segmentos del ADN que no tienen información o que no codifican para productos genéticos, tales como las proteínas. Los intrones son traducidos con la región codificadora llamada exones. Los exones entonces se unen para formar el funcional mensajero ARN que se va del núcleo para dirigir la síntesis de proteínas en el citoplasma. Los células procariotas (células sin núcleo) no tienen una estructura exon/nitron, y su región codificadora es contigua. Estos conceptos están ilustrados en la siguiente figura.
Figura 1.3 Sección del ADN de las células eucariotas. Las partes del ADN que no se corresponden con genes son en su mayoría de función desconocida. La cantidad de este tipo de inter-genes presente en el ADN depende de cada organismo. Por ejemplo, los mamíferos contienen enormes regiones inter-genes en el ADN.
Como hemos visto anteriormente, la mayoría de los ARNm son usados para producir proteínas vía el proceso de traducción. Sin embargo algunos ARNm son también útiles para ellos mismos ya que realizan un número de functiones. El ARN que es usado para hacer proteínas es llamado ARNm, los otros ARNs que realizan varias funciones nunca son traducidos, sin embargo estos ARNs también codifican para algunos genes. Uno de estos ARN es el transfer ARN (ARNt), el cual transporta amino ácidos al ARNm durante el proceso de traducción. Los ARNt pueden transportar amino ácidos al ARNm correspondiente a cualquier gen. Otros tipos de ARN son: el ARNr ribosomal , el cual está relacionado con diferentes proteínas llamadas ribosomas. Los ribosomas coordinan la transformación de amino ácidos en cadenas de proteínas. Los ARNr también pueden ser usados para traducir el ARNm de cualquier gen. Existen otros tipos de ARN envueltos en otras funciones.
Figura 1.4. Estructura química del ARN.
1.3 Transcripción
La Transcripción, que es la síntesis del ARN sobre el ADN, es el primer paso en el proceso de expresión genética, dirigido a la síntesis de proteínas. Semejante a la replicación del ADN, la transcripción cuenta con pares de bases complementarias. La transcrpción es catalizada por una polimerasa ARN, y la síntesis del ARN siempre ocurre desde un comienzo 5' a un final 3' de una molécula de ARN. Primero las dos cadenas de ADN se separan, y una de las cadenas actua como patrón para la síntesis del ARN. Del gen depende cual de las dos cadenas es usada como patrón. Después de la separación de las cadenas del ADN, ácidos ribonucleótidos están disponibles para asociarse a las bases complementarias del patrón de ADN. Un ARN uracil es usado en lugar de tiamina en las bases complementarias. La cadena de ARN es una copia exacta con U en vez de T de una de las cadenas del ADN, y es referida como la cadena con sentido (sense strand), y la otra, la que es usada como patrón es referida como la cadena de antisentido, (antisense strand).
La transcripción es iniciada cuando la polimerasa de ARN se acopla con la doble cadena de ADN. El sitio en el que la polimerasa se acopla es llamado un promotor, el cual es una secuencia de ADN al inicio del gen.
A partir de una cadena de ADN molde se forma una cadena de ARN monocatenario llamado ARNm o mensajero. El ARNm es un completo reflejo de las bases del ADN, es muy heterogéneo con respecto al tamaño, ya que las proteínas varían mucho en sus pesos moleculares, es capaz de asociarse con ribosomas para la síntesis de proteínas y poseen una alta velocidad de recambio, también contienen U en lugar de T.
Los productos de la transcripción no son sólo ARNm sino que también se forma ARNt y ARNr. Dentro del ADN hay genes que codifican para ARNt y ARNr.
La replicación y la transcripción difieren en un aspecto muy importante, durante la replicación se copia el cromosoma de ADN completo, pero la transcripción es selectiva, se puede regular así la transcripción del ADN. Secuencias reguladoras específicas indican el principio y el fin de los segmentos de ADN que se tienen que transcribir, así como que cadena se utiliza de molde.
La cadena que sirve como molde al ARN es la 3'-->5' y es con sentido y la otra es la antisentido cuya secuencia coincide con la del ARNm transcrito.
Figura 1.5. Modelo gráfico del proceso de transcripción-traducción -proteínas
Fases de la transcripción:
Se requiere una región promotora y otra de terminación. El factor sigma es el factor de la transcripción, la cadena ARN polimerasa se une al molde en los centros promotores, es decir, en secuencias específicas del ADN. Poseen una serie de características y reciben el nombre de secuencias consentido. Los promotores están alineados de acuerdo con sus homologías, o secuencias de bases similares que aparecen justo delante de la primera base transcrita llamada punto de iniciación. El factor sigma permite que la enzima reconozca y se una específicamente a las regiones promotoras.
Iniciación
Una vez que sigma se ha unido al promotor, se une el resto de la enzima y se forma una estructura llamada "complejo del promotor cerrado". A continuación se desenrolla un tramo de ADN con lo que queda al descubierto el sitio de iniciación. La ARN polimerasa se fija más fuertemente formando el "complejo del promotor abierto". Cuando entra el segundo nucleótido empieza a formarse el enlace fosfodiéster. Cuando la cadena ARN polimerasa, (ARN pol) se ha elongado un número pequeño de nucleótidos sigma se separa del núcleo.
Elongación
La cadena ARN pol debe sintetizar ARN. Se sintetiza siempre en dirección 5′ → 3′ . Pero para sintetizarlo se debe desenrollar el ADN una corta distancia llamada "burbuja de replicación". La elongación presenta dos problemas: el dúplex debe enrollarse por detrás y desenrollarse por delante. Así la ARN sigue el sentido de desenrollado y se enrolla alrededor del dúplex. El ARN se sintetiza por emparejamiento de bases con una de las cadenas de ADN en una región desenrollada transitoriamente. A medida que la región de desenrollamiento avanza, el ADN de doble cadena se reconstituye por detrás de ella, desplazando al ARN en forma de una cadena polinucleotida simple. Así, hay un momento en el que se forma un híbrido de ADN-ARN.
Terminación
La polimerasa de ARN reconoce también señales de terminación de la cadena. Se dan dos tipos de terminación: directa o mediada por proteínas. La terminación directa hace referencia a determinadas secuencias que cuando el ARN se transcribe se enrollan en forma de horquilla y pierden estabilidad con lo que la cadena se disocia. Después de la horquilla viene una región de poli(U) que parece actuar como señal para que se suelte la polimerasa de ARN y termine la transcripción. La terminación mediada por proteínas necesita de la proteína rho que reconoce la señal de terminación. No tienen la cadena de poli(U) cuando se produce este mecanismo. En primer lugar rho se une a un sitio específico del ARN llamado rut, tras unirse al rho viaja en dirección 5′ → 3′ hasta que encuentra a la ARN pol y desenrolla el segmento bicatenario ARN-ADN formado, por lo que se liberan el ARN y la ARN pol cesando la transcripción.
Como la molécula de ARN es sintetizada en la dirección 5′ → 3′ , los genes tambien se ven con la misma orientación por convención. De aquí que el promotor es siempre localizado hacia arriba en el lado 5' de la región codificadora. El ARN pol se une en las partes comunes de la sucesión con el fin de iniciar la transcripcón de los genes. En la mayoría de los procariotas el mismo ARN pol sirve para transcribir todos los tipos de ARN, mientras que en los procariotas, diferentes tipos de ARN pol son usados dependiendo de cual clase de ARN se produce (ARNm, ARNt, ARNr).
Con el fin de permitir que la cadena de antisentido sea usada la hélice debe ser localmente desenrrollada, como ya vimos. El lugar donde la cadena de ARN empieza a ser sintetizada es llamado el sitio de iniciación y se define como la posición +1 en el gen.
La cadena de ARN conoce que debe detenerse al sintetizar el ARN, por ciertas específicas sucesiones del ADN, llamadas terminales, que indican el final de la transcripción causando la liberación del ARN pol de la copia de ARN sintetizada. Existen varios mecanismos de terminación del proceso. Un mecanismo común en procariotas es una sucesión formada de tal manera que esta contenga regiones auto complementarias formando estructura de horquillas en el producto del ARN. Tales estructuras pueden detener a la polimerasa y así finalizar la transcripción.
La estructura de horquilla es frecuentemente rica en G.C pares haciéndola de esta forma mas estable ya que C.G tiene mayor estabilidad que el par A.U. Por otra parte las bases A.U están al final de la estructura lo que permite la disociación del ARN.
En eucariotas, la transcripción es mas complicada que en procariotas ya que la primera ARN transcripta (pre-ARNm) debe ser procesada antes de ser transportada fuera del núcleo (recordemos que los procariotas no tienen núcleo). Así que este proceso primero envuelve la adición de una molécula de 7-metilguanosina al final 5' de la transcripta, asociada por un enlace de trifosfato. Esto ocurre antes de que la cadena ARN sea de 30 nucleótidos de largo. Esta estructura de tapa sirve para estabilizar la transcripción pero es también importante para los demás procesos. Al final 3', una específica sucesión (por ejemplo, 5-AAUAAA-3′) es reconocida por una enzima la cual corta el ARN en aproximadamente 20 bases, y una cola poli(A) es añadida al final 3'. La cola poli(A) consiste de una corrida de 250 nucleótidos de adenina y se cree que ayuda en la traducción del ARNm en el citoplasma. Este proceso es llamado 3' segmentación y poliadenilación.
El paso final de convertir el pre-ARNm en ARNm maduro envuelve división (splicing), o eliminación de los intrones, y unión de los exones. Con este fin, ciertas sucesiones de nucleótidos deben estar presente. El final 5' de una sección de intrones debe mayormente contener una sucesión 5′-GU-3′ , y el final 3' debe contener una sucesión 5′-AG-3′ . La sucesión AG es precedida por una sucesión rica en pirimidina. Los sitios de división con los de la sucesión que se conservan se muestran en la fig .
En eucariotas es posible que un particular pre-ARNm produzca varios tipos de maduros ARNm mediante alternativas divisiones. Esto es, ciertos exones pueden ser removidos por la división y por lo que estos no son retenidos en el producto maduro ARNm. Estas alternativas formas de ARNm dan lugar a diferentes proteínas. Un buen ejemplo de esto es el gen fribonectina, el cual por alternativas divisiones puede producir dos diferentes proteínas isoformas Una de las proteínas es producida por fibroblastas, (son células que se encuentran debajo de la superficie de la piel) mientras que la otra es segregada por hepatocitos (los hepatocitos son la células parenquimatosas del hígado y desempeñan la mayor parte de las funciones propias del órgano). Dos exones que son los responsables de que la fibronectina se adhiera a la superficie de la célula se encuentran en el ARNm producido en la fibroblastas, mientras que en los hepatocitos ellos se encuentran divididos. En consecuencia, la fibronectina producida por los hepatocitos no puede adherirse a la superficie de la célula y puede facilmente ser transportada en el suero.

Escribe un comentario
Los comentarios están cerrados