Proyectos Universitarios
Desarrollo de metodologías robustas para el mapeo global de sitos de inicio de la transcripción en Escherichia coli y Geobacter sulfurreducens mediante secuenciación masiva de extremos 5´trifosfato de los mRNA
Juan Enrique Morett Sánchez
Instituto de Biotecnología
Área de las Ciencias Biológicas, Químicas y de la Salud

Datos curatoriales

Nombre de la colección

Proyectos Universitarios PAPIIT (PAPIIT)

Responsables de la colección

Ing. César Núñez Hernández; L.I. Ivonne García Vázquez

Colección asociada

@collection_name_full1@

Responsables de la colección asociada

@collection_responsible@

Dependencia

Dirección de Desarrollo Académico, Dirección General de Asuntos del Personal Académico (DGAPA)

Institución

Universidad Nacional Autónoma de México (UNAM)

Identificador único (URN)

DGAPA:PAPIIT:IN209312

Datos del proyecto

Nombre del proyecto

Desarrollo de metodologías robustas para el mapeo global de sitos de inicio de la transcripción en Escherichia coli y Geobacter sulfurreducens mediante secuenciación masiva de extremos 5´trifosfato de los mRNA

Responsables

Juan Enrique Morett Sánchez

Año de convocatoria

2012

Clave del proyecto

IN209312

Dependencia participante

Instituto de Biotecnología

Palabras clave

@keywords@

Área

Área de las Ciencias Biológicas, Químicas y de la Salud

Disciplina

Bioquímica, biología molecular, genética y genómica

Especialidad

Regulación de la expresión genética

Modalidad

a) Proyectos de investigación

Síntesis

La RNA polimerasa y algunos factores accesorios son requeridos para la iniciación, elongación y terminación de la transcripción. Para iniciar la RNAP se asocia al DNA en regiones adyacentes al gene, denominadas promotores. En bacterias existen diferentes tipos de promotores, reconocidos por factores sigma específicos; en E. coli se han identificado siete. El mapeo experimental del sitio de inicio de la transcripción (TSS) nos facilita identificar los promotores e inferir el tipo de factor sigma y nos ayuda a identificar otras regiones en el DNA responsables de la regulación de su expresión, como sitios de unión de proteínas reguladoras, o secuencias de RNA de control. Finalmente, el mapeo de los TSS provee información para determinar la organización física de los genes (operones). Por lo tanto, conocer los TSS es indispensable para entender la naturaleza del promotor, su regulación y organización._x000D_ Este proyecto tiene como objetivo desarrollar metodologías robustas para determinar experimentalmente la gran mayoría de los TSS mediante aislamiento selectivo de transcritos verdaderos (5´Trifosfatados; 5´T) en E. coli y G. sulfurreducens basadas en secuenciación con los equipos Illumina y Ion Torrent. Estos instrumentos generan millones de secuencias por corrida, de manera eficiente, rápida y económica. Propusimos que las metodologías de secuenciación masiva se podrían utilizar para la secuenciación de cDNA para determinar en pocas corridas la mayor parte de los TSS. Hemos desarrollado y comprobado la eficacia de la secuenciación masiva por pirosecuenciación en unos trabajos ya publicados. Con estos resultados hemos mapeado más de 1000 nuevos probables TSS en E. coli y demostrado la factibilidad de la metodología de secuenciación masiva para nuestros objetivos. Los métodos que hemos usado se basan en la eliminación selectiva de extremos 5´monofosfatados, que son productos de degradación del RNA. El primero mediante hidrólisis selectiva con una exonucleasa y la segunda por eliminación mediante ligación y remoción de un oligonucleótido biotinilado. Sin embargo, un gran número de productos de degradación permanecen y son confundidos con TSS. Ahora planteamos una estrategia alternativa basada en el aislamiento directo de los transcritos verdaderos 5´ trifosfatados y realizar las librerías con dichos transcritos utilizando la propiedad de la enzyma RppH de unirse específicamente a los mRNA 5´T. Lograr este objetivo nos permitirá conocer la gran mayoría de los transcritos en E. coli, mediante la generación de bibliotecas de cDNA de diversas condiciones de crecimiento para tener lo más completo posible los datos experimentales como un paso fundamental para que podamos entender globalmente la regulación en esta bacteria. El uso de cepas deletadas de seis de varios factores sigma de E. coli nos permitirá identificar con una alta precisión la naturaleza de cada promotor. Por último, mapearemos los inicios de transcripción en G. sulfurreducens, una bacteria muy interesante por su variedad de cadenas de transferencia de electrones y su posible utilización como generadora de electricidad y biorremediación de suelos y mantos acuíferos contaminados con metales pesados o radiactivos. Es importante destacar que contamos con recursos adicionales del NIH, USA (hasta jul. 2012, con posibilidad de renovar) y del CONACYT (hasta dic. 2012). Dada la magnitud del proyecto es necesaria la concurrencia de diversos fondos para alcanzar los objetivos propuestos._x000D_

Contribución

Esta propuesta se basa en el uso de dos metodología de secuenciación masiva muy novedosas para llevar a cabo análisis de expresión y mapeo de transcritos en E. coli y G. sulfurreducens. Es importante destacar que estas metodologías han desplazado a los microarreglos para determinar niveles de expresión de genes. Como se puede apreciar en las referencias sobre el uso de esta metodología mencionadas anteriormente, prácticamente todos los artículos han sido publicados en los últimos tres años. Por lo tanto, estamos ante una oportunidad muy valiosa, al contar con dos tecnologías de secuenciación masiva en la UNAM para poder ser de los primeros grupos en explotar las posibilidades de estas poderosas metodologías. Por otra parte, no conocemos de ninguna propuesta de mapeo global de inicios de transcripción en procariotes utilizando los métodos de selección de extremos 5´trifosfatados, como lo aquí propuesto usando afinidad con la enzima RppH. Lo que ya ha sido publicado es la eliminación de 5´monofosfatos por digestión enzimática, lo cual hemos demostrado que no es suficiente para validar verdaderos TSS. _x000D_ Nuestro grupo y los de nuestros colaboradores tenemos experiencia tanto en la parte experimental como en el análisis de la información producida. Hemos mapeado experimentalmente más de 300 probables TSS en E. coli por 5' RACE 500 por pirosecuenciación (Gama et al 2008; Mendoza-Vargas et al 2009) y más de 100 por Illumina (Gama et al 2011). Asimismo, hemos hecho contribuciones muy relevantes para entender la regulación global y el ordenamiento de esta basta información. Hemos reportado que en la gran mayoría de las bacterias que tienen genomas medianos o grandes, más no así los micobacteria y otras bacterias con genomas muy reducidos, tienen una gran densidad de probables sitios promotores en la vecindad de los TSS, mucho más alta que en las regiones intragénicas o en las regiones divergentes, donde no hay TSS (Huerta et al 2006). Proponemos que estos sitios sirven como anclas para la ARN polimerasa para que esté disponible en la vecindad del promotor verdadero. Adicionalmente, podrían servir como promotores alternos lo que conferiría mayor robustez ante posibles mutaciones en los promotores principales. Es de gran interés para nuestros grupos determinar si estos promotores pudieran ser funcionales y a qué nivel de expresión. Con las metodologías clásicas de mapeo de TSS sería muy difícil detectar expresión de promotores alternos que fuesen transcritos a bajos niveles. Con la tecnología de la secuenciación masiva de verdaderos TSS, como las reacciones son clonales, es posible detectar transcritos que representen una proporción pequeña del total para cierto gene u operón. Por lo tanto, estas metodologías son prácticamente las únicas que nos permitirá determinar la posible funcionalidad de dichas secuencias calificadas como probables promotores._x000D_ Esto sin duda motivará a un estudio más detallado de las presiones de selección que operan el las regiones regulatorias para mantener un alto número de secuencias que pudieran funcionar como promotores alternos._x000D_ La segunda parte del proyecto consiste en identificar los transcritos en otras enterobacterias, para conocer el grado de conservación de la regulación en organismos muy relacionados. Es un hecho comprobado que la evolución de la regulación ocurre mucho más rápidamente que la evolución de las funciones. Este trabajo nos permitirá determinar en organismos altamente relacionados filogenéticamente, que conservan un alto número de genes en común con una similitud de secuencia también muy alta, el grado de conservación de la regulación genética. El mapear múltiples promotores y compararlos entre especies, nos permitirá tener una mejor comprensión del nivel de la divergencia regulatoria de lo que hasta ahora conocemos. Adicionalmente, proponemos estudiar otros modelos interesantes por su potencial biotecnológico, como G sulfurreducens. Esta bacteria se caracteriza por poder producir electricidad a partir de ácido acético. Identificar un número considerable de promotores nos permitirá entender la complejidad de la regulación en estos organismos, así como abrir la posibilidad de manipular la expresión con fines biotecnológicos. Obviamente, esto sería materia de otros proyectos más específicos, pero esta propuesta abriría la posibilidad de llevar a cabo dichos trabajos._x000D_ Es de suma importancia destacar que este proyecto, como cualquier proyecto genómico, depende completamente del desarrollo e implementación de herramientas computacionales para poder analizar, almacenar, comparar, distribuir y hacer públicos el altísimo volumen de datos generados. Este matrimonio de la biología con las ciencias computacionales es indispensable para poder transformar los datos generados con las tecnologías de altísima productividad en conocimiento biológico. El grupo del Dr. Collado está formado por biólogos y informáticos y es un modelo a nivel internacional de trabajo multidisciplinario en genómica. Contamos además con la participación de dos excelentes informáticas del CCADET con experiencia de varios años de colaboración con experimentalistas en biología. _x000D_ Por lo anterior expuesto, consideramos que tenemos el grupo académico adecuado, las preguntas biológicas pertinentes y la capacidad de analizar la información para aprovechar la gran ventaja metodológica que nos brinda tener en la UNAM dos tecnologías de secuenciación masiva. _x000D_ Como se mencionó anteriormente, tenemos financiamiento internacional importante para llevar a cabo este proyecto y sin duda la contribución del PAPIIT será fundamental para lograr la mayor parte de los objetivos planteados así como la exitosa conclusión del mismo._x000D_ En caso de alcanzar los objetivos planteados habremos contribuido de manera muy significativa tanto a establecer las metodologías para la determinación de los TSS como a entender a nivel genómico la regulación de la expresión genética en nuestros organismos modelo. Finalmente, es importante destacar que este proyecto sentaría las bases de una nueva disciplina: la genómica comparativa de la regulación genética._x000D_ _x000D_

Información general

Cómo citar esta página

Dirección de Desarrollo Académico, Dirección General de Asuntos del Personal Académico (DGAPA). %%Desarrollo de metodologías robustas para el mapeo global de sitos de inicio de la transcripción en Escherichia coli y Geobacter sulfurreducens mediante secuenciación masiva de extremos 5´trifosfato de los mRNA%%, Proyectos Universitarios PAPIIT (PAPIIT). En %%Portal de datos abiertos UNAM%% (en línea), México, Universidad Nacional Autónoma de México.
Disponible en: http://datosabiertos.unam.mx/DGAPA:PAPIIT:IN209312
Fecha de actualización: 2017-03-13 00:00:00.0
Fecha de consulta:

Políticas de uso de los datos

@publication_policy@

Contacto de la colección

Para más información sobre los Proyectos PAPIIT, favor de escribir a: Dra. Claudia Cristina Mendoza Rosales, directora de Desarrollo Académico (DGAPA). Correo: ccmendoza #para# dgapa.unam.mx



* Descripción:



Correo electrónico: