2.-+Materiales+y+Métodos

__//Búsqueda de proteínas homólogas//__
Las secuencias del organismo escogido como referencia, así como las de los candidatos para el estudio de similitud fueron obtenidas a partir de la base de datos //**GenBank [7]** por qué GenBank y no EMBL_Bank?,// a la cual se accedió a través de //**UniProt [13]**//. Porqué UniProt? Dado que nuestros genes de referencia pertenecen a un género bacteriano extremófilo, para encontrar posibles proteínas homólogas en otros organismos, realizamos directamente un análisis con la herramienta BLAST integrada en //**Uniprot**// con una BLOSUM-45. A continuación, se guardaron los CDS y las secuencias de aminoácidos de proteínas homólogas de varias bacterias, una arquea y un eucariota. Algunos de los organismos elegidos, entre ellos //Deinococcus radiodurans//, han sido secuenciados de forma relativamente reciente, razón por la cual sólo algunos de los homólogos están incluidos en //**SwissProt**//.

__//Búsqueda de similtud//__
Se realizaron varias matrices de puntos tanto con las secuencias codificantes como con las de aminoácidos con ventanas e identidades mínimas de 10-2 y 15-5 entre pares de secuencias con el programa **//BioEdit//** **//[10]//**, con el objetivo de identificar posibles regiones con alta similitud (análisis realizado sólo para el gen //DR_2283//). Por qué esos parámetros? Cuando usáis 10-2 y cuando 15-5?

__//Alineamientos múltiples y filogenias//__
Se llevaron a cabo con el software **//ClustalX [17] que implementa el algoritmo de alineamiento múltiple Clustal //. ** Se realizó el alineamiento múltiple a partir de un archivo multifasta con las secuencias proteicas de //D. radiodurans// y las secuecias homólogas escogidas. Para la edición y el estudio de los alineamientos se utilizó el programa //**BioEdit**//. Los archivos generados con **//ClustalX//** del alineamiento múltiple del gen //DR_2283// se trataron con el software **//TreeView [19]//**, programa que permite la visualización de un árbol filogenético entre distintas especies a partir de los datos obtenidos con un alineamiento múltiple. Para el enraizamiento del árbol se definió como grupo externo al organismo más alejado filogenéticamente de //D. radiodurans//, //C. paradoxa// //(eucariota)//. bien

__//Búsqueda de motivos//__
En primer lugar, se usó la base de datos //**Pfam [6]**//. Dado que no se obtuvieron resultados concluyentes, se procedió a la repetición del estudio en las bases de datos //**InterPro** **[12]**// y //**Prosite [11]**//. La primera de ellas es útil para la determinación de motivos y dominios de la secuencia a estudiar; la segunda se centra más en pequeños motivos de secuencia, ya sean fáciles de encontrar por azar o no. Sin embargo, para complementar más la información obtenida de estas bases de datos, se utilizó el programa //**TopPredII**// //**[5].**// Éste es un software dedicado a la predicción y localización de hélices transmembrana y se basa en patrones de hidrofobicidad. Para la contrastación y verificación de los resultados obtenidos, se usaron las herramientas //**Phobius [14]**//, //**TMAP [20]**// y //**TMHMM [16]**//, las cuales también predicen posibles dominios alfa-hélice. Muy completo, buscando algo que sabéis que tenía vuestra proteína: hélices transmembrana. Por otra parte, para la búsqueda de péptidos señal, usamos el software //**SignalP [2]**//. Este software usa modelos escondidos de Markov y redes neuronales para la predicción de posibles péptidos señal en diversos organismos. Como última contrastación de los resultados obtenidos y una posible caracterización de la estructura secundaria de nuestras proteínas, se usó el software **PredictProtein [22]**.

//__Predicción de estructuras 3D__//
Como ninguno de los genes de estudio presentaba ficha en la base de datos //**PDB** **[3]**// (datos experimentales), se procedió a la predicción automática de su estructura mediante el software //**Swiss-Model [15] de modelado por homología **//. Para la visualización de la estructura obtenida se usó el programa //**RasMol [23]**//. Este software permite una visualización en 3D de las estructuras proteicas, así como que permite destacar regiones concretas, como por ejemplo, dominios o motivos. El montaje de las interacciones de las proteínas Q9RS44_DEIRA y Q9RS43_DEIRA se llevó a cabo usando el programa **GIMP2 //[8]//**.

//__Búsqueda promotor__//
Para ello se usó la herramienta **//BPROM// //[4]//**, que reconoce secuencias consenso en promotores bacterianos. Utiliza un algoritmo LDF (linear discriminant funcion) y predice promotores del tipo sigma 70. Se tomó una región intergénica de 46pb (posiciones del genoma de //D.radiodurans// 2282123...2282167) upstream al locus //DR_2284//. Como los genes //DR_2284// y //DR_2283// están codificados en la hebra complementaria, para obtener la secuencia objetivo en sentido 5'-3', se usó el software //**BioEdit**// (opción de obtener la reversa complementaria). La secuencia resultante es la que se introdujo en //**BPROM**//. Esto me hace recordar que el año que viene debo incluir un criterio de evaluación adicional: uso de otras herramientas bioinformáticas o fuentes de datos.

-- Esta bien, pero falta más justificación de uso de bases de datos (especialmente en los primeros apartados) y herramientas.