3.-+Resultados

Como introducción a este problema se realizó un BLAST para la proteína Q9RS44_DEIRA (ID o AC?) con una matriz de puntuación BLOSUM-45. De los resultados obtenidos, se escogieron los de mayor puntuación y diversidad (tabla 1). Las proteínas elegidas fueron dos del género //Deinococcus// (//D. geothermalis// y //D. deserti//), una del género //Thermus// (concretamente de la especie //Thermus thermophilus//) la cual presentaba una identidad del 37%, otras tres con unos valores de identidad aceptables del género //Listeria// (identidad del 41%), género //Haemophilus// (identidad del 40%) y del género //Bacillus// (identidad del 43%). Por último, para completar la búsqueda de secuencias homólogas más alejadas de nuestra secuencia original, se escogieron también una proteína de arqueas (concretamente de //M. marisnigri//) con una identidad del 38% y una presente en eucariotas (exactamente de //C. paradoxa//) con una identidad del 34%. De esta forma, se obtuvieron proteínas homólogas con bastante diversidad. Hay que mencionar que, a la hora de realizar la elección se valoró positivamente la presencia de dichas proteínas en la base de datos //**Swiss-Prot**//, lo que indica una revisión más exhaustiva de las mismas. Esta búsqueda de homología también se realizó para la proteína Q9RS43_DEIRA, obteniéndose de la misma forma proteínas homólogas las cuales se usaron en análisis posteriores.
 * 3.1. Búsqueda de homología**
 * //Tabla 1//**. Resultados seleccionados para la proteína Q9RS44_DEIRA tras una búsqueda de proteínas homólogas mediante la realización de un BLAST. Se muestra la información más relevante así como la filogenia de cada una de las proteínas resultantes escogidas para mostrar la diversidad de secuencias homólogas seleccionadas. Si son los resultados Blast, es importante poner el 'query coverage' o correspondiente, ya que estos e-values dependen de la longitud del alineamiento.

Para el contraste y comparación de las proteínas escogidas, en el caso del gen //DR_2283//, se realizaron diversos análisis de tipo matriz de puntos. Por una parte, los resultados con los CDS presentaron muchas inespecificidades (debido a repeticiones azarosas de secuencias con los cuatro nucleótidos). Sin embargo, los de secuencias proteicas sí fueron de mayor interés. Los llevados a cabo con las proteínas de los géneros //Deinococcus// no aportaron información interesante dado que se trata de proteínas no anotadas. Pero los realizados con la proteína escogida de //Bacillus// y con la de //Haemophilus// (ventana 15 y similitud mínima 5) (figura 2) resultaron en la presencia de dos dominios claramente diferenciados y coincidentes. Estas regiones se verifican a su vez con las anotaciones posicionales de dichas proteínas, siendo dominios transmembrana.
 * 3.2. Análisis de dot plots**


 * [Figura 2]** Dot-Plot de las proteínas de //D. radiodurans// Q9RS44_DEIRA y la homóloga escogida en el BLAST de //H. Influenzae//. Resultan dos regiones coincidentes, las cuales se observan a su vez en las anotaciones posicionales de dominios transmembrana de la ficha de Uniprot de la proteína de //H. Influenzae// (cuadro de la derecha).

Para la confirmación de dichos datos se realizó un dot plot entre las proteínas de //Bacillus// y //Haemophilu////s//; obteniéndose lo esperado, ambas proteínas poseían dominios coincidentes entre sí. Por otro lado, también se llevó a cabo un dot plot con la proteína escogida del género //Listeria//, de cuyo resultado se extrae la presencia de dos regiones transmembrana coincidentes con las anotadas en la información posicional obtenida de //**UniProt**//. En el caso del dot plot realizado con la proteína //Cyanophora paradoxa// (organismo eucariota), se encontró también un dominio similar, el cual correspondía a uno transmembrana presente en las anotaciones posicionales. Estos análisis no se realizaron con el gen //DR_2284// dado que la proteína que codifica está bastante conservada y, con el alineamiento múltiple, se pudo obtener toda la información que se necesitaba. Hubiera ayudado incluir otras matrices de puntos en la figura, para completar

Para la proteína Q9RS44_DEIRA se realizaron diversos alineamientos múltiples:
 * 3.3. Alineamientos múltiples y filogenias**
 * **Alineamiento global**. En primer lugar, se realizó un alineamiento con todas las proteínas homólogas escogidas. Además, se construyó un árbol filogenético (figura 3) a partir de las relaciones de distancia genética tomando como grupo externo la proteína eucariota. El árbol obtenido es consecuente con la filogenia de estos organismos (figura 1). También se observó que, lógicamente, las proteínas procedentes de la arquea y el eucariota no alineaban tan bien como las demás proteínas entre sí. Por ello, decidimos restringir el alineamiento a las secuencias bacterianas para poder inferir más fácilmente información dado que la proteína de //D. radiodurans// no presentaba ningún tipo de anotación.
 * [Figura 3]** Árbol filogenético enraizado con el organismo //C. paradoxa//.

Donde habéis comprobado que esta es la zona de interacción?
 * **Alineamiento de bacterias.** Se observó que las proteínas de //T. thermophilus// y de //M. silvanus//, a pesar de pertenecer al mismo phylum (//Deinococcus-Thermus)// que //D. radiodurans//, diferían más en secuencia de Q9RS44_DEIRA que el resto de bacterias escogidas. Dado que se trata de organismos muy especializados de ambientes que requieren una adaptación extrema, estos resultados son factibles. A raíz de esto, decidimos repetir de nuevo el alineamiento múltiple, pero esta vez eliminando esas dos proteínas. Muy bien, al exponer todo el procedimiento seguido y los resultados intermedios.
 * **Alineamiento de bacterias sin //Thermus thermophilus// y //Meiothermus silvanus//** (figura 4). En este último acercamiento, sólo se dispone de las tres proteínas del género //Deinococcus// y de la proteína de //L. monocytogenes//, de //H. influenziae// y de //B. halodurans//. Son tres especies alejadas dentro del dominio Bacteria pero que tienen numerosas anotaciones en su genoma, por lo que pueden servir para caracterizar dominios en Q9RS44_DEIRA. Concretamente, //H. influenziae// es uno de los microorganismos mejor anotados, siendo una buena referencia para la anotación y caracterización de Q9RS44_DEIRA.
 * [Figura 4].** Alineamiento generado por el programa //**ClustaIX**// para la proteína Q9RS44_DEIRA y las proteínas homólogas de bacterias seleccionadas sin las del género //Thermus//. Aparecen marcados dominios hidrofóbicos de alta conservación y el posible dominio de interacción con la proteína del gen //DR_2284//.

En el caso del gen //DR_2284// también se realizó un alineamiento múltiple (figura 5) pero en este caso, dado que es una proteína bastante conservada, dicho alineamiento se restringió a las proteínas homólogas con anotaciones posicionales con el objetivo de hallar regiones de alta conservación en Q9RS43_DEIRA. De esta forma, se pudieron caracterizar el dominio de unión a ATP o P-loop y el dominio C-loop, dominios ampliamente conservados en los transportadores ABC [21].
 * [Figura 5].** Alineamiento generado por el programa **//ClustaIX//** para la proteína Q9RS43_DEIRA y proteínas homólogas con anotaciones posicionales. Aparecen marcados dos dominos de alta conservación en los transportadores ABC (el de unión a ATP y el C-loop) además de la posible zona de interacción con la proteína Q9RS44_DEIRA.

Faltan las fuentes de anotación, aunque pueden deducirse.

Dado que la búsqueda de motivos en Q9RS44_DEIRA en la base de datos //**InterPro [12]**// no resultó concluyente, se usó directamente la herramienta **//Pfam//** para intentar localizar los dominios transmembrana (tabla 2) que supuestamente, como componente transmembrana del transportador ABC, debe presentar esta proteína.
 * 3.4. Búsqueda de motivos y dominios**
 * [Tabla 2]**. Resultados de //**Pfam**// con las localizaciones de los supuestos dominios transmembrana de Q9RS44_DEIRA.

Dado que los dominios transmembrana se caracterizan por su hidrofobicidad (y suelen ser regiones bastante variables), intentamos reproducir y contrastar los resultados del **//Pfam//** con una herramienta de predicción de este tipo se regiones, //**TopPredII**//. Debido a que los resultados de número de dominios transmembrana diferían de los predichos por Pfam, se realizó este análisis con tres programas más: //**Phobius**//, //**TMAP**// y **//TMHMM//**. Los resultados se muestran en la tabla 3.
 * Tabla 3**. Localización de dominios transmembrana de DR_2283 según //**TopPredII**//, //**Phobius**//, //**TMAP**// y //**TMHMM**//.

El hecho de que los resultados no sean idénticos no es significativo considerando que los dominios transmembrana son muy complejos de predecir, y con cierta facilidad se dan falsos positivos al concentrarse unos pocos aminoácidos hidrofóbicos. De todas formas, las zonas para las que se predicen éstos dominios son muy similares en todos los casos, y además, estas predicciones solo difieren en una hélice de más o de menos. Ok.

Como la proteína Q9RS44_DEIRA es una permeasa, debe dirigirse a la membrana de //D.radiodurans//. De esta forma, es problable que posea un péptido señal que dirija a la proteína ya traducida. Esta búsqueda se llevó a cabo con el programa **//SignalP//**, y se encontró una región de alta probabilidad de corte del posible péptido señal entre las posiciones 28 y 29 (figura 6). Así, resulta una secuencia señal de 28 aminoácidos. Muy bien, seguís un hilo conductor coherente.
 * [Figura 6]**. Resultados gráficos del SignalP. En verde, la probabilidad de ser un péptido señal. En rojo, la de ser un sitio de corte. En azul, la media de ambas.

En cuanto a la proteína Q9RS43_DEIRA, se realizaron búsquedas en las mismas bases de datos usadas para Q9RS44_DEIRA. Los resultados de //**InterPro**// confirmaron las regiones encontradas en el alineamiento múltiple (la zona de unión a ATP y el C-loop). Asimismo, los obtenidos en //**PredictProtein**// también avalaban las regiones encontradas. Además se le aplicó el mismo software para la predicción de regiones de hidrofobicidad y de posibles péptidos señal, pero en ninguno de los casos se obtuvieron resultados positivos.

Tanto para la proteína Q9RS44_DEIRA como para la Q9RS43_DEIRA la estructura obtenida con **Swiss-Model** estuvo predicha a partir de la ficha de PDB 2nq2 (curioso) (correspondiente a un transportador ABC de //H. influenziae// [21]). En el caso de la proteína Q9RS44_DEIRA resultó con un 17% de identidad y para Q9RS43_DEIRA con un 30%. Ambas estructuras se muestran en la figura 7. En la estructura de Q9RS44_DEIRA se marcan diferencialmente los residuos correspondientes a los dominios transmembrana predichos por **//Pfam (se corresponden bastante bien) //. ** Por el contrario, en Q9RS43_DEIRA están marcados los dominios P-loop (rojo) y C-loop (azul).
 * 3.5. Estructura 3D**
 * [Figura 7]**. Estructura 3D predicha con **Swiss-Model** de Q9RS44_DEIRA (izquierda) y de Q9RS44_DEIRA (derecha), con sus dominios más característicos.

Por comparación con la interacción que se produce en el transportador ABC modelo (//H. influenziae//) entre las dos subunidades, se acotó una zona de unos veinte residuos en la secuencia de cada proteína. Estudiando el alineamiento múltiple ya realizado de cada una de ellas, se observó que, en la zona supuesta de interacción entre ambas existían una serie de residuos altamente conservados en todas las especies estudiadas. Así, se llegó a la conclusión de que esos debían de ser los residuos implicados en la unión de Q9RS44_DEIRA con Q9RS43_DEIRA. En concreto, los resultados se resumen en la tabla 4:
 * Tabla 4**. Posibles residuos implicados en la interacción entre Q9RS44_DEIRA y Q9RS43_DEIRA.

Por último, se hizo una predicción de la interacción (figura 8) entre Q9RS44_DEIRA y Q9RS43_DEIRA por montaje de las estructuras obtenidas para ambas proteínas.
 * [Figura 8]**. Imagen de predicción de la interacción entre Q9RS44_DEIRA y Q9RS43_DEIRA. En la parte superior se encuentra Q9RS44_DEIRA y en la parte inferior Q9RS43_DEIRA. La figura de la izquierda representa un dímero, mientras que en la derecha se presenta una posible conformación del transportador ABC completo. En ambos casos se muesstra la estructura molecular detallada de los residuos importantes en la interacción. Os habéis basado en algún conocimiento previo para construir este modelo cuaternario?

Tras el estudio de las regiones upstream de ambos genes con la secuencias obtenidas de //**GenBank**// (//DR_2283// y //DR_2284//) se vió que, entre ambos, la separación existente era de sólo tres pares de bases. Esto sugiere que probablemente, estos genes se encuentren en forma de operón (lo cual es bastante común en los transportadores ABC de organismos procariotas)**.** De esta forma, se seleccionó la región upstream al gen //DR_2284// y se analizó con el software **//BPROM//.** Los resultados concluyeron con que, efectivamente se trataba de un promotor, y se caracterizaron los elementos -10 (caja Pribnow) y -35 (figura 9)**.**
 * 3.7. Búsqueda del promotor**
 * [Figura 9].** Promotor predicho para el operón del transportador ABC de los locus //DR_2283// y //DR_2284// de //D.radiodurans// por el software **//BPROM//**. Se indican tanto el elemento -35 como el -10 (caja Pribnow).

-- En general está muy bien, salvo por algunos detalles que especialmente afectan a la reproducibilidad. Lo que más me ha gustado es que mostráis un verdadero análisis bioinformático, usando herramientas que van corroborando hipótesis.