Caracterización estructural de proteínas por métodos evolutivos
Resumo
Si bien está bien establecido hace tiempo ya que la dinámica conformacional de una proteína es un factor esencial para entender su función y su evolución secuencial, los métodos y técnicas más difundidas para el estudio y estimación de parámetros a partir de la estructura proteica consideran el estado nativo de la proteína como una entidad rígida y única.
Es sabido que la estructura de una proteína condiciona su evolución, esto es, su divergencia secuencial. Por consiguiente, una comprensión integral del proceso evolutivo a nivel molecular debe estar en relación con un entendimiento profundo de la estructura funcional de la proteína. El presente trabajo presenta una contribución hacia una consideración más realista de la estructura proteica, tomando en cuenta la dinámica estructural asociada a su estado nativo. Consideramos que es necesario un punto de inflexión en lo referente a la información asociada a la estructura nativa de las proteínas. Con tal fin, desarrollamos aquí un estudio de la caracterización de la diversidad conformacional proteica y su impacto en la divergencia evolutiva.
Decidimos independizarnos de métodos teóricos para análisis de dinámica estructural, y utilizar en su lugar únicamente estructuras provenientes de cristalizaciones. Nos basamos en el premisa que estructuras de la misma proteína, cristalizadas en distintas instancias, pueden contener información acerca de su diversidad conformacional.
Como primer paso generamos una base de datos con la colección redundante de estructuras cristalográficas disponibles para cada dominio proteico: Protein Conformational Diversity DataBase (PCDB, (Juritz, Alberti, & Parisi, 2011), disponible en línea en http://www.pcdb.unq.edu.ar. El estudio de la diversidad conformacional fue efectuado utilizando estructuras cristalográficas de proteínas separadas en dominios, con el fin de sustraerse de los movimientos entre dominios que, al no representar necesariamente un reacomodo significativo entre los residuos que componen los núcleos funcionales proteico, dificultarían el análisis de las deformaciones estructurales intra-dominios. Estas estructuras, al pertenecer a la misma proteína, pueden ser consideradas instancias estructurales representativas del conjunto de confórmeros en equilibrio dinámico que define el estado nativo y sus diferencias estructurales, evaluadas a partir del cálculo de la raíz cuadrada de la desviación cuadrática media (RMSD, del inglés Root Mean Square Deviation) son una medida de la diversidad conformacional de la proteína.
Los análisis indican valores de diversidad conformacional significativos para gran parte de las proteínas estudiadas, que sugieren la importancia de tomar en consideración este factor en estudios que involucren la estructura proteica. Con tal fin se efectuaron estudios para evaluar la influencia de la diversidad conformacional en ciertas prácticas bioinformáticas.
Mediante la aplicación un modelo de evolución molecular que toma en cuenta explícitamente los condicionamientos estructurales de la proteína en estudio, y análisis estadísticos de máxima verosimilitud, evaluamos cuán adecuado condice cada confórmero estructural la divergencia secuencial observada en las familias proteicas. Hemos encontrado que en la mayoría de los casos, el confórmero que une el ligando, no necesariamente el de menor energía, es el que se condice mejor con la diversidad secuencial observada. Adicionalmente, al usar la información codificada en la totalidad de los confórmeros estudiados, es cuando se obtienen los mejores valores de máxima verosimilitud.
Estos resultados indican que las sustituciones aminoacídicas derivan en efectos específicos respecto al confórmero proteico estudiado. Basados en esta afirmación; en la asunción de que la estructura proteica condiciona la diversidad secuencial; y en que las diferencias estructurales entre los confórmeros pueden presentar valores significativos, decidimos estudiar la incidencia de la diversidad conformacional en la estimación de la perturbación estructural ante un evento mutacional. La medida más ampliamente difundida para estudiar este efecto en las proteínas es el valor de ΔΔG [Kcal mol-1]. Muchas líneas de investigación apuntan al desarrollo y a la mejora de algoritmos de predicción de ΔΔG. Presentamos aquí resultados que indican que tomar en consideración la diversidad conformacional de las proteínas se traduce en un incremento en la precisión de las estimaciones teóricas del valor de ΔΔG de una mutación en la secuencia proteica en todos los métodos predictivos estudiados.
La capacidad de estimación del ΔΔG de una mutación reviste de importancia en numerosos campos, entre los cuales destaca el de la salud humana. Una aplicación concreta es la mejora en la predicción referente a si una mutación puede desencadenar un cuadro patológico o no mediante la desestabilización de la estructura nativa proteica. Con tal fin, procedimos a estudiar la incidencia de la diversidad conformacional en la capacidad predictiva sobre el efecto patógeno o neutral de una mutación. Nuestros resultados indican que, si bien esta capacidad predictiva aún dista de ser precisa, la consideración de la diversidad conformacional deriva en un incremento.
Concluimos que la consideración de la diversidad conformacional es un elemento trascendental para una compresión integral de la estructura, la función y la evolución proteica. A su vez, son necesarios nuevos enfoques y aplicaciones con el fin de lograr un provecho de la información codificada en la diversidad conformacional.
Como continuación del presente trabajo, se encuentra en las últimas etapas de desarrollo, y disponible en línea a partir de Abril del 2012, una base de datos de diversidad conformacional de proteína enteras, derivadas de la base de datos PDB. Esta nueva de base de datos presenta una variedad de información acerca de las proteínas y las estructuras depositadas y permitirá efectuar nuevos análisis y correlaciones de la diversidad conformacional del estado nativo, asimismo como comparaciones entre la diversidad conformacional intra e inter dominios.