Roderic Guigó, Bioinformática & Genoma

Roderic Guigó, Bioinformática & Genoma

<<<se recomienda imprimir para una atenta lectura >>>

 

 

 

Leader del Genome Bioinformatics Research Lab  de Barcelona, grupo que  alcanzó notoriedad mundial por su participación en la  secuenciación del genoma humano.

 

 

 

 

[Esta entrevista se publicó en una versión extendida en el número 30 de IF, diciembre 2004/ enero 2005]

 

 

Ramon Bori> Vuestro grupo,  el Genome Bioinformatics Research Lab  de Barcelona,  alcanzó notoriedad mundial a raiz de vuestra  participación en  el equipo que logró  la secuencia del genoma humano [más en J.C. Venter et al.  including J.F. Abril and R. Guigó. «The Sequence of the Human Genome.» Science 291(5507):1304-1351 (2001). 

 

¿Cuéntanos un poco vuestra trayectoria?

 

Roderic Guigo> Yo soy biólogo e hice mi tesis en la facultad de Biología [de la Universitat de Barcelona] sobre modelos computacionales en temas de ecología evolutiva,  competencia entre especies, dinámica de poblaciones.  Cuando terminé mi tesis  me fui a un grupo de Boston  que  trabajaba en métodos para el análisis de  la secuencia del genoma.  Esto era a finales de los ochenta,  desde entonces siempre he trabajado con problemas de análisis del genoma.

 

Al volver aquí — después de 5 años fuera — me incorporé al Grup de Recerca en Informática Biomédica (GRIB) que dirige el Dr. Ferran Sanz, e inicié mi línea de investigación en análisis del genoma. Primero estaba solo, después vinieron algunos estudiantes,  más tarde investigadores postdoctorales hasta que constituimos el grupo actual.  Ahora somos  una docena de personas.

 

 

Ramon Bori> Leyendo  alguno de tus artículos,  afirmas: la secuenciación del genoma humano es la confirmación de una intuición de Erwin Schröndinger.  En 1942 –antes del descubrimiento de la estructura del DNA — aventuró que el DNA debería ser un cristal aperiódico constituido por la sucesión de un número pequeño de elementos isoméricos, la secuencia precisa de los cuales,  y no tanto sus características fisicoquímicas, es la responsable de su funcionalidad.

 

Roderic Guigó>  Hoy cualquier disciplina científica utiliza la computación, no es una cosa única de la biología, pero lo cierto es que si vas a  Google y buscas  bioinformatics  salen más de dos millones de resultados,  mientras que si  entras econoinformatics, meteoinformatics o chemioinformatics los resultados son muy inferiores.  Hay una diferencia brutal. 

 

Mi opinión  es que no es sólo por el gran volumen de datos que hoy genera la  biología, sino por la naturaleza de estos datos. La secuencia del genoma tiene una alta componente simbólica, que la hace muy apropiada al análisis computacional.  La  genómica  es la ciencia del análisis de la información codificada del DNA,  y de cómo esta información permite generar los procesos y los seres vivos.

 

Un poco la idea es que el éxito de la computación en biología  se debe no sólo a la cantidad  sino a la calidad, a la naturaleza de los datos. Existe una relación muy intima entre biología y computación porque los fenómenos biológico más elementales pueden entenderse  como computaciones  sobre la secuencia del genoma.

 

Lo que nosotros hacemos es calcular sobre la secuencia del genoma aquellas regiones que son funcionalmente más importantes; en cierto modo, es esto lo que también  hace la célula.

 

 

Ramon Bori> Explícanos un poco más  vuestro proceso de trabajo.  A nivel de no iniciados, claro.

 

Roderic Guigó> Nuestro cuerpo tiene millones de células, cada una de nuestras células tiene  en su núcleo veintitrés parejas de cromosomas  –uno del padre, y uno de la madre.  Cada pareja de cromosomas está formada  por  la repetición de cuatro elementos diferentes que representamos por letras las  A, C, G, T  [Adenina, Citosina, Guanina y Timina]. Son  compuestos químicos que se pegan el uno al otro y forman una cadena.  

 

 

 

imagenes:  roderic guigó i serra-

grup de recerca en informàtica biomèdica IMIM/UPF/CRG, Barcelona

 

 

La secuencia del genoma se puede entender como  la secuencia  de letras que representa esta secuencia de elementos químicos. Todo nuestro genoma aproximadamente  tiene tres mil millones de letras que están  organizados en veintitrés cromosomas diferentes.

 

La función de los cromosomas que son secuencias de estas cuatro letras es dictar como es la secuencia de aminoácidos de las proteínas. Tenemos treinta mil proteínas diferentes,  las cuales  son también secuencias  de unas moléculas químicas que se llaman aminoácidos. Son de veinte tipos distintos y también las representamos por  otras veinte letras diferentes.

 

Pequeños fragmentos de la secuencia del genoma –los genes– se traducen en la secuencia de aminoácidos de las proteínas. Es a partir de la secuencia de las proteínas que podemos empezar a entender su función en el organismo vivo.

 

 

Ramon Bori> Secuencia del genoma en la  que participasteis con el equipo de Celera.

 

Roderic Guigó>  Entramos en la etapa final del análisis de la secuencia, cuando ésta ya había sido obtenida. Nosotros aportamos un programa de representación gráfica e hicimos el mapa visual de la posición de los genes en el genoma humano.

 

 

Ramon Bori> ¿Y ahora (diciembre 2004) cuáles son vuestras líneas de investigación?

 

Roderic Guigó>  El problema  en que nosotros trabajamos ahora es en la investigación de las características de las regiones qu dan lugar a los genes. Un proceso aún no está resuelto porque no entendemos bien como lo hace la célula.

 

Nuestras líneas de trabajo son dos: entender como se produce este proceso y  al mismo tiempo  desarrollar programas para intentar reproducir este proceso.

 
Trabajamos con otros grupos que secuencian el genoma de algunos organismos e intentamos contribuir con predicciones computacionales de los genes en estos genomas. Ahora estamos trabajando en la secuenciación del genoma del pez globo y del pollo. Hemos trabajado sobre todo en genomas de organismos vertebrados: humano, ratón, rata, etc.

 

 

 

 

 

 

Por otro lado, también realizamos una investigación más básica. Intentamos entender desde el punto de vista biológico como se produce la decodificación de la información en el genoma. Entender el proceso mediante el cual se pasa de la secuencia de nucleótidos del genoma a la secuencia de aminoácidos de las proteínas.

 

 

Ramon Bori>  ¿Y el futuro?

 

Roderic Guigó>  La visión que actualmente tenemos de este paso de los genes a través del genoma está muy desenfocada, poco precisa.

 

En estos momentos participamos en un consorcio  que dirige el  Instituto Nacional de la Salud  de los Estados Unidos que ha seleccionado un   uno por ciento del genoma humano, de diferentes regiones,  y durante tres años aplicarán todos los métodos  hoy disponibles para determinar con mucha precisión todo lo que realmente es importante  en esta secuencia del genoma.

 

Ramon Bori> Imagino que se trata ya de un trabajo muy automatizado.

 

Roderic Guigó>  La idea es   que en este uno por ciento del genoma  seamos capaces   al final de estos tres años  de establecer  algún tipo de protocolos automatizados que se puedan escalar a todo el genoma.

 

En estos momentos,  aún no es un proceso demasiado automatizado. De hecho lo que nosotros hacemos ahora es verificar de forma exhaustiva y  experimental  todas las predicciones computacionales porque no sabemos hasta que punto las predicciones computacionales corresponden a genes reales.

 

Quedan muchos campos por trabajar, por ejemplo las diferencias que existen entre individuos.

 

 

 

Predicción de estructuras y modelización de proteinas

 

 

Ramon Bori> Otro tema que me ha sorprendido de la bioinformática son los intentos de automatizar  la relación entre esta inmensa información resultante  de la  secuencia de los diferentes elementos genómicos con la inflación de   literatura científica  que  el día a día va generando.

 

 

Roderic Guigó>  La ?literature mining? es un tema que está muy de moda. Nosotros no trabajamos en este campo, aunque me interesa personalmente.

 

Hoy  la literatura que se publica es tan grande que no hay persona que pueda abarcar todo lo que se va publicando sobre un tema concreto, entonces se han desarrollado sistemas que puedan reconocer automáticamente los artículos científicos.

 

Uno de los problemas más simples. Sabemos  que unas proteínas interaccionan con otras, se producen unas determinadas  reacciones  químicas para construir una determinada molécula.  Entonces se trata de explorar la literatura científica, para determinar que artículos describen como unas proteínas interaccionan con otras, de esta forma se van estableciendo redes de interacción entre proteínas  Esto no puede hacerlo una persona, porque la cantidad de artículos que debería dominar es inabarcable.

 

Ramon Bori> O sea , el sistema experto te devuelve conocimiento biológico relevante sobre  la secuencia genómica concreta  en  la que estas trabajando.

 

Roderic Guigó> Sí,  tienes una nueva proteína que no sabes lo que es. Esta proteína tiene una determinada secuencia, entonces la comparas con la secuencia de todas las proteínas conocidas y averiguas que proteínas son similares, que interacciones tienen, sus funcionalidades. Introduces este conocimiento en la base de datos y se produce una generación automática de conocimiento.

 

 

 

Modelización 3D y relaciones estructura actividad

 

 

Hace muy poco leí un artículo sobre un robot  que hacía inferencias científicas. Automáticamente a partir del análisis de resultados proponía hipótesis y los experimentos para verificarlas.  Es decir toda la generación de conocimiento científico era autónoma de la persona.

 

 

Ramon Bori> Hace poco ?The Economist? presentaba el impacto  del proyecto del genoma humano  en la comprensión del cáncer y sus posibles tratamientos.  En el futuro mucho más precisos.

 

 

Roderic Guigó>  En la actualidad la investigación en biología no puede realizarse sin el concurso de la computación. De hecho,  en la intersección entre la biología y la computación va a construirse una de las tecnologías claves del siglo XXI.

 

 Una tecnología que nos va a capacitar de forma efectiva para actuar sobre la naturaleza, en particular sobre la naturaleza humana, y entender y luchar mejor contra las enfermedades. No debemos, sin embargo, esperar, resultados a corto plazo. La complejidad de los fenómenos biológicos hace que su comprensión sea costosa.

No Comments

Sorry, the comment form is closed at this time.