presentacion.jpg

Estructura 3D de un cristal proteíco no tóxico de Bacillus thuringiensis (Akiba et al., 2006)

INICIO | HERRAMIENTAS I | HERRAMIENTAS II | APÉNDICE

APÉNDICE
 
En esta sección deseo presentar algunos documentos con conceptos nuevos que espero sean de utilidad para todos aquellos interesados en la bioinformática. Corresponden a un curso de extensión que tuve la oportunidad de realizar en el Centro de Bioinformática del Instituto de Biotecnología de la Universidad Nacional de Colombia (http://bioinf.ibun.unal.edu.co/cbib/)
 
OTROS CONCEPTOS
 
ALGORITMOS DE COMPARACIÓN DE SECUENCIAS
 
Por Pilar Eugenia Corredor (Biologa) y Gina Gutierrez (Lic. en Biología).
 
En la actualidad existe una gran cantidad de información disponible de secuencias de DNA y proteínas, a partir de las cuales es posible inferir mucho acerca, por ejemplo,  de la funcionalidad de moléculas no caracterizadas. La inferencia se basa en la capacidad de detectar homología, lo que ha motivado al desarrollo de metodologías para la comparación con aquellas secuencias bien estudiadas (Altschul, 1998). A pesar de su aparente simplicidad, los procedimientos de comparación de secuencias deben ser  considerados con la misma rigurosidad de los experimentos del laboratorio, teniendo el mismo cuidado en el diseño e interpretación de los resultados (Brenner, 1998).
 
Los alineamientos constituyen una herramienta adecuada para la comparación de secuencias, pudiendo extraer de ellos información variada. Las secuencias pueden ser  comparadas mediante alineamientos globales o locales dependiendo del objeto de la búsqueda. En el alineamiento global se trata de alinear la secuencia en su totalidad, mientras que en el local, se consideran solo los segmentos de mayor similaridad. La selección de una de estas estrategias puede depender del supuesto de relación de las  secuencias en toda su longitud o solo en parte de ella.
 
Fundamentalmente las búsquedas en bases de datos consisten en el alineamiento local de una secuencia de interés o query con cada una de las secuencias en la base de datos (llamadas blanco o target). Muchos programas implementan diferentes estrategias de búsqueda que permiten encontrar similitudes entre la secuencia query y las que  se encuentran reportadas en la base de datos (Brenner, 1998). El principio básico de cada uno de estos algoritmos es el mismo: la secuencia de interés es comparada con las  secuencias en la base de datos para establecer una lista de aquellas con las que se encuentra mayor similaridad (Sansom, 2000).
 
El método más tradicional para seleccionar un resultado en particular, entre todos los posibles resultados obtenidos tras el alineamiento, puede ser la escogencia de aquel  que posea el puntaje o score más alto. Existen diferentes formas para determinar el score, pero la más común y simple de ellas, consiste en la suma de los puntajes  individuales determinados para cada pareja de residuos comparados. En estas comparaciones se asignan valores positivos para uniones correctas y negativos para aquellas que no lo son. El score asignado a cada pareja depende del tipo de secuencia que se está comparando, por ejemplo, para secuencias de aminoácidos se han construido matrices de substitución en las cuales se ha asignado un valor diferente para las posibles parejas de aminoácidos comparados.
 
En el score total también se considera la aparición de un carácter adicional, denominado gap, el cual se incluye en las secuencias comparadas para maximizar su similitud. En un contexto biológico, la inclusión de un gap en una de las secuencias, podría ser equivalente por ejemplo, a la aparición de una inserción en la otra. La inclusión de este nuevo carácter tiene dos componentes. Por una parte se penaliza la aparición como tal del mismo, e independientemente se penaliza la extensión de un gap ya abierto a más de un residuo. No existe una teoría aceptada para la elección de los valores de penalización, y su escogencia depende principalmente de pruebas de ensayo y error.
 
Después de definir el score de un alineamiento determinado, el siguiente paso consiste en encontrar el alineamiento óptimo de la secuencia. Algoritmos como Smith-Waterman para alineamientos locales llevan a cabo esta tarea, siendo el tiempo consumido en ella proporcional al producto de la longitud de las secuencias comparadas. El tiempo invertido en la comparación de las secuencias, así como la capacidad de los equipos requeridos para llevar a cabo el alineamiento en el algoritmo de Smith-Waterman, lleva al desarrollo de métodos más rápidos de comparación.
 
Los programas de búsqueda en bases de datos difieren en el núcleo del algoritmo que usan. Esto tiene influencia sobre su velocidad y sensibilidad. Los algoritmos de alta velocidad usan principios simplificados para establecer la similitud de las secuencias. Es importante considerar al escoger uno de los posibles programas para búsqueda de similitud entre secuencias, que el tiempo que ésta tarda en llevarse a cabo depende de la sensibilidad del algoritmo, estando fuertemente influenciado por la longitud de la secuencia y el tamaño de la base de datos. En la tabla 1 se resumen algunos de los programas utilizados para búsqueda de secuencias en bases de datos.
 

Programa

Sensibilidad

Velocidad

Tipo de secuencia

BLAST

Medianamente sensitivo

Muy rápido

DNA, Proteína

FASTA

Sensitivo

Rápido

DNA, Proteína

Blitz

Muy sensitivo

Medianamente rápido

DNA, Proteína

SSEARCH

Muy sensitivo

Lento

DNA, Proteína

PSI-BLAST

Extremadamente sensitivo

Lento

Proteína

Tabla 1. Comparación de algunos programas utilizados para la búsqueda de secuencias en bases de datos (tomado de Sansom, 2000).
 

Entre los programas mencionados en la tabla 1, FASTA y BLAST fueron desarrollados como algoritmos de alta velocidad y baja sensibilidad, en comparación con Smith-Waterman, ya que se basan en estrategias heurísticas que concentran sus esfuerzos en las regiones de la secuencia más probablemente relacionadas. Procedimientos rápidos de unión-exacta identifican inicialmente las regiones promisorias, y solo hasta este momento se acude al algoritmo de Smith-Waterman, lo que permite que estos programas sean 10 a 100 veces más rápidos. Es posible ajustar algunos parámetros cuando se está utilizando FASTA y BLAST, los cuales hacen referencia al procedimiento heurístico y que al ser modificados, permiten establecer una relación velocidad/sensibilidad adecuada.

Una vez obtenido el alineamiento de dos secuencias surge un concepto importante que hace referencia a la relevancia biológica del resultado obtenido. El establecimiento de la similitud de dos secuencias con relación a su origen evolutivo, es decir, con la derivación a partir de un ancestro común (homología), puede ser una de las inquietudes de mayor relevancia biológica en el análisis de secuencias. Extraer esta información simplemente de un valor de similaridad obtenido resulta difícil, por lo cual se han establecido algunos parámetros de significancia estadística que permiten estimar la relevancia del resultado.

Para evaluar la relevancia biológica del alineamiento global o local de dos secuencias, es necesario tener una medida de los valores esperados de ocurrencia del score.  Una de las pocas posibilidades para evaluar la significancia de los puntajes obtenidos, consiste en generar una distribución empírica de los scores de los alineamientos de muchas secuencias aleatorias de la misma longitud de las secuencias comparadas. De esta distribución se deriva el Valor Z para el score del alineamiento de interés, que podría ser considerado como una medida de la probabilidad de encontrar este score simplemente por azar.

Para alineamientos locales puede evaluarse la significancia del score obtenido con base en la distribución de valores extremos. Los programas disponibles de FASTA y BLAST reportan el score del alineamiento así como su significancia, con base en la distribución de valores extremos. Estas pruebas de significancia incluyen el Valor E, el cual representa el número de alineamientos con un score equivalente o superior que se pueden presentarse por azar. De esta forma la interpretación del Valor E, indica que tan confiable es el alineamiento obtenido, siendo los valores cercanos a cero los que indican menor posibilidad de obtención del resultado por azar.

Muchas secuencias de DNA y proteínas contienen regiones altamente repetitivas, que pueden desviar los resultados conduciendo a valores altos de similaridad en el alineamiento. Muchas programas poseen herramientas que filtran estas regiones de baja complejidad, pudiendo ofrecer búsquedas con mayor utilidad.

Bibliografía.

Sansom, C. 2000. Database searching with DNA and Protein Sequences: An introduction. Briefings in Bioinformatics. Vol 1 (1): 22-32.

Altschul, S.F. 1998. Fundamentals of database searching. Trends Guide of Bioinformatics.

Brenner, S.E. 1998. Practical database searching. Trends Guide of Bioinformatics.

El Algoritmo FastA
 
Por Pilar Eugenia Corredor (Biologa) y Gina Gutierrez (Lic. en Biología).
 
El algoritmo FASTA para búsqueda de secuencias se basa en el método desarrollado por Pearson & Lipman. En el procedimiento se analizan parejas de secuencias para aquellos segmentos que presentan las mejores uniones, las uniones significativas se seleccionan con base en un umbral mínimo de similitud (threshold).
 
Conceptualmente el procedimiento se asimila a la búsqueda de diagonales significativas en un "dot-plot" de dos secuencias, en donde cada coordenada de la secuencia es comparada con sus elementos similares a lo largo de la otra secuencia. En el primer paso, la búsqueda en la base de datos encuentra aquellas secuencias que contienen el mayor número de alineamientos perfectos de secuencias cortas o palabras, con la secuencia query. Los score del alineamiento para toda la secuencia son reevaluados por alineamiento de las secuencias que rodean a las palabras que poseen los valores altos de score, previamente seleccionadas en el primer paso. La velocidad y sensibilidad de la búsqueda están determinadas por la longitud de la palabra usada en el primer paso. Entre más corta se seleccione la palabra inicial, la búsqueda se hace más lenta y sensitiva.
 
El usuario puede seleccionar la matrix de substitución que usará, así como las penalidades dadas a los gap y la longitud de la palabra, esta última mediante el parámetro ktup. Para proteínas un ktup de 2 puede hacer la búsqueda rápida y generar resultados más sensibles que los obtenidos con BLAST. Para DNA se utilizan palabras más largas, pero generalmente el valor de ktup utilizado es de 6.
 
Información adicional puede encontrarse en las siguientes direcciones:
 
Bibliografía.
Sansom, C. 2000. Database searching with DNA and proteins sequences: An introduction. Briefings in Bioinformatics Vol 1 (1): 22-32.
Altschul, S.F. 1998. Fundamentals of database searching. Trends Guide of Bioinformatics.
Brenner, S.E. 1998. Practical database searching. Trends Guide of Bioinformatics.

BLAST
 
Por Claudia Patricia Parra (Química Farmaceutica) y Jaqueline Ramirez (Ingeniera de Sistemas)
 
- Reseña historica: La necesidad de descifrar el genoma humano para un mejor entendimiento de los procesos moleculares que afectan la salud humana, conduce a crear entre otros en 1988 a la NCBI (National Center for Biotechnology Information), como una de las fuentes de información en biología molecular cuyo objetivo primordial es el de crear bases de datos publicos, investigación en biología computacional, desarrollo de herramientas de software para el análisis de datos del genoma y difusión de la información biomédica.
 
En el proyecto genoma humano también participaron la bases de datos de secuencias GenBank, un sistema de búsqueda y retroalimentación, Entrez (sistema de navegación entre las bases de datos, que permite un fácil acceso de toda la información relativa a determinada secuencia) y una herramienta de comparación y búsqueda de secuencias como BLAST.
 
- Por qué surgio la base de datos: Es un programa de investigación del Computational Biology Branch (CBB), realizado por investigadores y estudiantes del postdoctorado, encargados de investigar sobre las aplicaciones teóricas y analíticas para resolver problemas fundamentales en biología molecular. Tales como análisis de secuencia, análisis de función y estructura de proteínas, identificación de genes, incluyendo algoritmos para la búsqueda en bases de datos, secuencias de baja complejidad, modelos matemáticos de evolución, métodos estadísticos para virología, comportamiento dinámico para reacciones químicas, comparación de genomas, árboles taxonómicos, y genética de poblaciones. Muchas de estas investigaciones han contribuido a la aplicación de las bases de datos de la NCBI suministrando algoritmos innovadores como el BLAST,SEG,VAST COGs, entre otros.
 
-Qué significa BLAST?: BLAST es el acrónimo de Basic Local Alignment Search Tool. Fué desarrollado por Altschul en 1990 y es el algoritmo mas empleado por el NCBI. La principal característica del BLAST es su velocidad, pudiendo tomar pocos minutos cualquier búsqueda en la totalidad de la base de datos. De hecho, los resultados se presentan en pantalla inmediatamente después de calculados. El BLAST puede hacer búsquedas en una base de datos no redundante (nr) la cual tiene los registros no redundantes entre las dos bases de datos principales a nivel mundial: GenBank en USA y EMBL (European Molecular Biology Laboratories) en Europa. Además, el BLAST tiene cinco módulos de búsqueda que amplian las posibilidades:
 
* blastp compara una secuencia problema de aminoácidos contra una base de datos de secuencias de proteínas.
* blastn compara una secuencia problema de nucleótidos contra una base de datos de secuencia de nucleótidos.
* blastx compara una secuencia problema de nucleótidos traducida en sus seis posibles marcos de lectura contra una base de secuencias de proteínas.
* tblastn compara una secuencia problema de aminoácidos contra toda la base de datos de nucleótidos traducida en sus seis posibles marcos de lectura.
* tblastx compara las seis traducciones en sus marcos de lectura de la secuencia problema de nucleótidos, contra las seis traducciones en sus marcos de lectura de toda la base de datos de nucleótidos.
 
-Por qué es importante conocer BLAST?: BLAST resulta el algoritmo a escoger en una busqueda preliminar de similitud entre una secuencia problema y las bases de datos disponibles. Provee como primer resultado una medida cuantitativa de la similaridad de la secuencia problema contra cada una de las secuencias de la base de datos. Es una herramienta de alineamiento local por pares. Consiste en hacer coincidir un par de secuencias. Es decir, solo producen alineamientos por pares de la secuencia problema con cada una de las secuencia de la base de datos con las que muestra alta similitud.
 

- Análisis de secuencias. ¿Qué tipo de datos analiza? ¿Cómo se entran a la base? ¿Cuántas versiones de BLAST existen?: Las bases de datos de secuencias biológicas se encuentran instaladas en distintos centros del mundo, de cierta manera compiten, por lo cual no se debe esperar que sus interfaces de comunicación sean iguales, ni siquiera parecidas. Además, las páginas Web de estos servidores suelen ser modificadas frecuentemente, por lo cual es necesario habituarse a la estructura general de estos servicios.

 

El papel de las bases de datos es el de proveer libre acceso a las secuencias de ácidos nucléicos y de proteínas que han sido publicadas por la comunidad científica, con la información respecto al autor, fuente bibliográfica, organismo y demás características importantes.

 

La recuperación más útil es la que emplea palabras claves, en donde se cumple con un criterio de búsqueda, lo que indica la intensidad con la cual se están publicando secuencias del organismo de estudio que nos interesa. Con este tipo de criterio podemos realizar una búsqueda de similaridad la cual consiste en efectuar una comparación de una secuencia problema con la totalidad de secuencias existentes en una base de datos. Estas búsquedas se realizan con distintos programas que aplican algoritmos de comparación y generan un listado de organismos cuyas secuencias resultan similares a la de estudio. Uno de los algoritmos más comunes y disponible en la Internet es el BLAST, la búsqueda se realiza así: http://www.ncbi.nlm.nih.gov/cgi-bin/BLAST/

Es necesario especificar:

+ La secuencia problema

+ El programa a ejecutar, según sea el caso de las secuencias a comparar, entre blastp, blastn, blastx, tblastn, tblastx.

+ La base de datos contra la cual se desea hacer la comparación.

+ El formato en que se desean ver los resultados cuando estos esten listos.


De forma muy general los pasos a seguir son: 

+ Introduzca su secuencia

+ Configure los parámetros según sea su caso y pulse el botón Submitt Query.

+ En base a las especificaciones hechas en el formato del resultado, este podrá aparecer en pantalla o ser recibido por correo electrónico.

 

- Diferencia entre BLAST y FASTA: FASTA, desarrollado por Lipmann y Pearson 1985, es empleado por el EMBL-EBI (European Molecular Biology Laboratories- European Bioinformatics Institute), esnotablemente mas lento, empleando para búsquedas equivalentes hasta varias horas. Por esta razón, sus resultados sólo pueden recibirse vía correo electrónico. Sinembargo este algoritmo posee algunas ventajas:

+ Posibilidad de comparación contra secciones del GenBank como de secuencias de Mamíferos, Plantas, Bacterias, etc.

+ Mayor precisión bajo ciertas configuraciones iniciales de sus parámetros.
 
Una introducción a EMBOSS: The European Molecular Biology Open Software Suite

 

Por Julian Pulecio

 

EMBOSS (http://emboss.sourceforge.net/) es un conjunto de software  de carácter gratuito y de fuente abierta,  para el análisis de secuencias de ácidos nucleicos y/o proteínas especialmente desarrollado para las necesidades de la comunidad de biólogos moleculares. EMBOSS contiene un núcleo de grupos de programas licenciados bajo el GPL,  esto quiere decir que puede ser legalmente copiado o modificado según las necesidades del usuario.  El software automáticamente trabaja con datos en una variedad de formatos e incluso permite obtener  secuencias publicadas en  la web. Es una plataforma que permite a los científicos el desarrollo y realización de software personales,  gracias a su carácter de fuente abierta.

 

Los  programas  de EMBOSS trabajan bajo las mismas librerías (AJAX y NUCLEUS) y ha sido desarrollado principalmente por los creadores del ahora difunto EGCG. Muchos otros programas incluyendo PHYLIP y MSE, han sido incorporados dentro de EMBOSS para usar la misma interfaz pero son distribuidos bajo su propia licencia. EMBOSS y  el nodo EMBnet son actualizados diariamente, así que siempre se tiene la última versión de los programas.

 

En el presente se puede acceder a EMBOSS bajando la aplicación (http://emboss.sourceforge.net/apps/#list) y trabajando por  línea de comandos o vía web por medio de PISE (http://www.pasteur.fr/recherche/unites/sis/Pise/), pero las interfaces gráficas están aún bajo construcción, así que algunos programas no se encuentran. Para obtener una descripción de los programas de Pise y poder acceder a estos, visite http://www2.no.embnet.org/Pise/index.php3. Para aprender a manejar algunos programas de EMBOSS puede  aprender por medio del tutorial (http://emboss.sourceforge.net/docs/emboss_tutorial/emboss_tutorial.html)

 

EMBOSS es soportado todos las plataformas comunes de Unix incluyendo Linux, Digital Unix, Irix and Solaris.

 

En EMBOSS se encuentran alrededor de 100 programas (aplicaciones).

 

Estas son algunas áreas que cubre:

- Alineamiento de secuencias
- Búsqueda rápida de patrones de secuencias.
- Identificación de motivos de proteínas, incluyendo anàlisis de dominios.
- Análisis de  EST
- Análisis de patrones de secuencias nucleótidos.
- Uso de codones para análisis de pequeños genomas.
- Rápida identificación de patrones de secuencias para grupos de secuencias a gran escala.
- Herramientas de presentación  para publicación.

Y mucho más.
 
Links

The EMBOSS Administrators Guide (http://emboss.sourceforge.net/admin/)
Para obtener información acerca de la instalación de EMBOSS.

 

EMBOSS Home page (http://emboss.sourceforge.net/)
 

BioBox (http://www.csc.fi/molbio/progs/index.html)  
Información sobre las diferentes suites existentes.

OTROS RECURSOS

 

Quizás el objetivo más grande de la bioinformática es el desarrollo de software que sirva para la resolución de problemas de interés biológico. Para ello se necesita tener solidos conocimientos de programación en sistemas de computación, además del dominio de la biología y bioquímica. No esta contemplado, dentro del objetivo de esta página, ilustrar a fondo sobre la programación en bioinformática. Pero debo aconsejar, a todos los que deseen adentrarse en esta area de la ciencia, aprender a programar y a desarrollar software para aplicaciones bioinformáticas; sin este conocimiento solo se puede decir que se sabe manejar herramientas, pero no que sé es un investigador formal en bioinformática.

Uno de los lenguajes de programación más utilizado en bioinformática es PERL. Aquí coloco tres recursos que espero sean de utilidad para la iniciación en programación de bioinformática con PERL, uno corresponde a un archivo donde se dan las bases de PERL, el segundo archivo corresponde a una sencilla actividad para iniciarse en el entendimiento de los lenguajes de programación, el tercer archivo es una aplicación que se encuentra en carpeta comprimida zip con la cual se desarrolla la actividad del segundo archivo. Todo el material lo pueden bajar haciendo click aquí:

 

http://club.telepolis.com/silviolopez/PROGRAMACIONPERL.pdf

http://club.telepolis.com/silviolopez/programacionPer_IIl.pdf

http://club.telepolis.com/silviolopez/putty.zip

 

Otros recursos muy útiles en bioinformática existen en innumerables sitios de la web. Para todos (incluyendome) los que deseen conocer más de estos recursos es imprescindible navegar para descubrirlos, y utilizarlos para conocer sus ventajas y deficiencias, de acuerdo al interés particular. Destaco algunos a continuación:

 

 KEGG (http://www.genome.jp/kegg/): Kyoto Encyclopedia of Genes and Genomes: es una base de datos donde se encuentra una completa representación computacional de la célula, organismo y biosfera compilada desde información genómica y molecular (Figura 71).

- PlasmoDB (http://www.plasmodb.org/plasmo/home.jsp): es una base de datos especializada en todas las especies del eucariote causante de la Malaria: Plasmodium (Figura 72).

- HOMOPHILA (http://superfly.ucsd.edu/homophila/ ): en este sitio se combina la información extraida desde la base de datos OMIM (Herencia Mendeliana del Hombre) con la información de la base de datos FlyBase (base de datos de secuencias de Drosophila) por medio de BLAST, para determinar si existen genes homologos (Figura 73).

- TIGR (http://www.tigr.org/): es el sitio del Instituto de Investigación Genómica dedicado a descifrar y analizar genomas. Contiene varios recursos como bases de datos de varios organismos procariotes y eucariotes, y programas para análisis de microarreglos, comparación y anotación de secuencias (Figura 74).

- EisenLab (http://rana.lbl.gov/EisenSoftware.htm): en este sitio se ubican programas para el analisis de chips de microarreglos, como ScanAnalyze y Cluster entre otros (Figura 75).

imagen74.jpg

              Figura 71. KEGG

imagen76.jpg

                 Figura 72. PlasmoDB.

imagen75.jpg

                   Figura 73. HOMOPHILA

imagen77.jpg

               Figura 74. TIGR.

imagen78.jpg

              Figura 75. EisenLab.

 

RECURSOS GENERALES DE CIENCIA

 

Existe una gran variedad de páginas con muy buena información en las áreas relacionadas con las ciencias. La mayoría de ellas están en inglés, pero también existen algunas en español. He aquí como acceder a algunas de ellas:

 

En la barra de direcciones digitar http://science.nhmccd.edu/biol/rchute.html, con lo que se abrirá una pagina con sendos contenidos interactivos en las áreas de Química, Bioquímica, Biología Celular y Genética entre otras (Recurso en Inglés) (Figura 76).

imagen71.jpg

Figura 76. Pagina de actividades interactivas en Biología.

 

- La pagina www.cellsalive.com contiene animaciones y descripciones de las diferentes estructuras y funciones de todo tipo de células y organismos (Recurso en Inglés). Además posee varios enlaces con variada información y muchas animaciones (Figura 77).

imagen72.jpg

Figura 77. Pagina principal de Cells alive.

 

- En la pagina www.um.es/~molecula/ hay un aula virtual de Biología con recursos variados en los distintos temas de esta área (Recurso en Español) (Figura 78).

imagen73.jpg

Figura 78. Pagina principal del aula virtual de Biología.

PERSPECTIVAS

 

            A medida que las tecnologías para el manejo de la información y los avances en genómica, proteómica y biología molecular, entre otras ciencias, sigan su avance es imprescindible suponer que nuevas y mejores herramientas bioinformáticas serán desarrolladas. Las primeras aplicaciones de la bioinformática se basaban en la construcción y mantenimiento de bases de datos. Hoy tienen diversas aplicaciones para el estudio en diversas áreas, y su despliegue a permitido el análisis de la gran cantidad de información que los proyectos de secuenciación están arrojando.

            En esta revisión de algunas herramientas bioinformáticas en línea, el objetivo principal era dar a conocer su existencia, y explicar brevemente su manejo, como método para incentivar la curiosidad de explorar esta área tan importante de la investigación científica.

            En la actualidad el investigador debe ser capaz de desenvolverse en variados ámbitos, sin dejar de ser experto en un área concreta, como asimismo estar listo para trabajar en complejos grupos multidisciplinarios que permitan abordar una temática desde varios frentes, para conseguir así más y mejores avances, además de nuevas aplicaciones. Considero que el manejo de la bioinformática debe ser una obligación para todo investigador, ya que lo contrario seria una barrera para un análisis adecuado de los resultados logrados experimentalmente.

            Espero que estas pocas líneas sean de utilidad para muchos. Asimismo estaré pendiente de sus anotaciones y sugerencias.

nombre.jpg

BIBLIOGRAFÍA

 

Adobe Systems Incorporated. Adobe. [Recurso en línea]. <www.adobe.com> [Consulta: 8 agt. 2005]

 

Akiba, T.,  Higuchi, K.,  Mizuki, E.,  Ekino, K.,  Shin, T.,  Ohba, M.,  Kanai, R.,  Harata, K. Nontoxic crystal protein from Bacillus thuringiensis demonstrates a remarkable structural similarity to beta-pore-forming toxins Proteins v63 pp.243-248 , 2006

 

American Society for Microbiology. [Recurso en línea]. <www.asm.org> [Consulta: 21 agt. 2005]

 

Baker D., Kim D., Chivian D., Kortemme T., Campbell, G. Robetta. [Recurso en línea]. Howard Hughes Medical Institute, Structural Genomics of Pathogenic Protozoa Consortium, (SGPP) supported by the National Institute of General Medical Sciences (NIGMS) Protein Structure Initiative (PSI), Los Alamos National Laboratory, Richard Bonneau of the Institute for Systems Biology, and The National Center for Supercomputing Applications (NCSA).. <http://www.robetta.bakerlab.org > [Consulta: 21 nov. 2005]

 

Barreto, E., Pinzón, A. 2006. Introducción a la Bioinformática. Curso del Nodo colombiano de la Red Europea de Biología Molecular (EMBnet) a cargo del Centro de Bioinformática del Instituto de Biotecnología de La Universidad Nacional de Colombia. http://bioinf.ibun.unal.edu.co

 

Berman H.M., Westbrook J., Feng Z., Gilliland G., Bhat T.N., Weissig H., Shindyalov I.N., Bourne P.E. 2000.  The Protein Data Bank. Nucleic Acids Research. 28: 235-242.

 

Bowen, R. A.  Restriction Maps. [Recurso en línea].  Colorado State University. <http://arbl.cvmbs.colostate.edu/molkit/mapper/> [Consulta: 15 dic. 2005]

 

Cañedo Andalia R., Arencibia J. R. Bioinformática: en busca de los secretos moleculares de la vida. Acimed 2004;12(6). <http://bvs.sld.cu/revistas/aci/vol12_6_04/aci02604.htm> [Consulta: 3 sept. 2005]

 

Chien S, Reiter LT, Bier E, Gribskov M., "Homophila: human disease gene cognates in Drosophila", Nucleic Acids Research, 2002, Vol. 30, No. 1 149-151

 

Chivian D, Kim D.E., Malmstrom L., Bradley P., Robertson T., Murphy P., Strauss C.E.M., Bonneau R., Rohl C.A., Baker D. 2003. Automated prediction of CASP-5 structures using the Robetta server. Proteins 53: Suppl. 6:524-33

 

Chute, R.M. Biology Tutorials and Resources. [Recurso en línea]. <http://science.nhmccd.edu/biol/rchute.html > [Consulta:  29 dic. 2005]

 

Dinner A. R., Sali A., Smith L. J., Dobson C. M., Karplus M. 2000. Understanding protein folding via free-energy surfaces from theory and experiment. TIBS. 25:331-339

 

DNA Data Bank of Japan-DDBJ. [Recurso en línea]. 1986-2006. <http://www.ddbj.nig.ac.jp > [Consulta: 24 agt. 2005]

 

Eisen, M. EisenLab.[Recurso en línea] <http://rana.lbl.gov/EisenSoftware.htm > [Consulta: 21 Agt. 2006]

 

Elsevier. [Recurso en línea]. <www.elsevier.com> [Consulta: 7 sept. 2005]

 

European Molecular Biology Laboratory-EMBL. [Recurso en línea]. <http://www.embl.org/ > [Consulta: 23 agt. 2005]

 

European Molecular Biology Laboratory and European Bioinformatics Institute EMBL-EBI.  ClustalW. [Recurso en línea]. 1997-2005. <http://www.ebi.ac.uk/clustalw/> [Consulta: 28 jul. 2005]

 

European Molecular Biology Laboratory and European Bioinformatics Institute EMBL-EBI.  T-Coffee. [Recurso en línea]. 2005. <http://www.ebi.ac.uk/t-coffee/ > [Consulta: 28 jul. 2005]

 

Gallay, O., Chopra, R.,  Conti, E.,  Brick, P.,  Jackson, R.,  Hartley, B.,  Vieille, C.,  Zeikus, J.G.,  Blow, D. 1997. Crystal Structures of Class II Xylose Isomerases from Two Thermophiles and a Hyperthermophile. [Recurso en línea]. <http://www.rcsb.org/pdb/explore.do?structureId=1A0D> [Consulta: 2 ener. 2006]

 

García Carmona F., Sánchez Ferrer A., Ibáñez Mercader, J., Laveda Molina F. J., Martínez Pérez F., Moran Piñera A. Aula Virtual de Biología. [Recurso en línea]. Departamento de Bioquímica y Biología Molecular (A) de la Universidad de Murcia y por el Departamento de Biología y Geología del I.E.S. "Ramón y Cajal" de Murcia. 1998-1999. <www.um.es/~molecula/ > [Consulta:  23 nov. 2005]

 

Gasteiger E., Gattiker A., Hoogland C., Ivanyi I., Appel R.D., Bairoch A. 2003. ExPASy: the proteomics server for in-depth protein knowledge and analysis. Nucleic Acids Res. 31:3784-3788.

 

Ginalski K., Grishin N. V., Godzik A., Rychlewski L. 2005. Practical lessons from protein structure prediction. Nucleic Acids Research. 33:1874–1891

 

Guex N. Diemand A., Peitsch M.C., Schwede, T. DeepView-Swiss Pdb Viewer. [Recurso en línea]. Swiss Institute of Bioinformatics (SIB), GlaxoSmithKline R&D and the Structural Bioinformatics Group. <http://www.ebi.ac.uk/t-coffee/ > [Consulta: 18 dic. 2005]

 

Guex, N.  Peitsch, M.C. 1997. SWISS-MODEL and the Swiss-PdbViewer: An environment for comparative protein modeling. Electrophoresis. 18: 2714-2723.

 

Harte N., Silventoinen V., Quevillon E., Robinson S., Kallio K., Fustero X., Patel P., Jokinen P. López R. 2004. Public web-based services from the European Bioinformatics Institute. Nucleic Acids Research. 32: W3–W9.

 

Higgins D., Thompson J., Gibson T., Thompson J.D., Higgins D.G., Gibson T.J.1994.
CLUSTAL W: improving the sensitivity of progressive multiple sequence alignment through sequence weighting, position-specific gap penalties and weight matrix choice.
Nucleic Acids Res. 22:4673-4680.

 

Homophila: human disease to Drosophila Gene Database. [Recurso en línea] `<http://superfly.ucsd.edu/homophila/ > [Consulta: 21 Agt. 2006]

 

Kalendar, R. Fast PCR. [Recurso en línea]. University of Helsinki. 1998-2006.   <http://www.ebi.ac.uk/t-coffee/ > [Consulta: 18 Jul. 2005]

 

Kanehisa, M and his associates. Kyoto Encyclopedia of Genes and Genomes. [Recurso en línea] < http://www.genome.jp/kegg/> [Consulta: 21 Agt. 2006]

 

Kim D. E., Chivian D., Baker D. 2004. Protein structure prediction and analysis using the Robetta server. Nucleic Acids Res. 32: (Suppl.: 2) W526-31

 

Kubala M., Obsil T., Obsilova V., Lánsky Z., Amler E. 2004. Protein Modeling Combined with Spectroscopic Techniques: an Attractive Quick Alternative to Obtain Structural Information. Physiol. Res. 53: (Suppl. 1): S187-S197.

 

Lapid, C and Gao, Y. PrimerX. [Recurso en línea]. Bioinformatics.org. 2003-2005. <http://bioinformatics.org/primerx/> [Consulta: 10 nov. 2005]

 

Levitt M. 2001. The birth of computational structural biology. Nature Structural Biology. 8: 392-393.

 

Lewin, B. 2002. Genes VII. Oxford University Press, N.Y.

 

Lopez R., Services Programme and Lloyd A. The ClustalWWW server at the EBIembnet. 1997. ClustalW WWW Service at the European Bioinformatics Institute http://www.ebi.ac.uk/clustalw. News. 4.2 http://www2.ebi.ac.uk/embnet.news/vol4_3/clustalw1.html

 

Marti-Renom M. A. 2003. Protein Structure Modelling for Structural Genomics. Business briefing. 59-63.

 

Muñoz C., Zepeda, P., Alanis J.C., Gallardo, I., Contreras I., Reyes C. Características del Internet [Recurso en línea]. Monografías. com. 1997. <http://www.monografias.com/trabajos24/internet-caracteristicas/internet-caracteristicas.shtml> [Consulta: 10 oct. 2005]

 

National Center for Biotechnology Information-NCBI. [Recurso en línea]. 1988-2006. <http://www.ncbi.nlm.nih.gov> [Consulta: 5 sep. 2005]

 

Notredame C., Higgins D., Heringa J. 2000. T-Coffee: A novel method for multiple sequence alignments. Journal of Molecular Biology. 302:205-217.

 

Notredame C., Holme L., Higgins D.G. 1998. COFFEE: A New Objective Function For Multiple Sequence Alignment. Bioinformatics. 14: 407-422.

 

O'Sullivan O., Suhre K., Abergel C., Higgins D.G., Notredame C. 2004. 3DCoffee: Combining Protein Sequences and Structures within Multiple Sequence Alignments. Journal of Molecular Biology. 340:385-395.

 

PCR (Product extractor). [Recurso en línea]. ch. EMBnet.org. <http://www.ch.embnet.org/software/iPCR_form.html> [Consulta: 25 jul. 2005]

 

PlasmoDB. [Recurso en línea] <http://www.plasmodb.org/plasmo/home.jsp> [Consulta: 21 Agt. 2006]

 

Protein Data Bank-PDB. [Recurso en línea]. 1986-2006. <http://www.ddbj.nig.ac.jp > [Consulta: 24 agt. 2005]

 

Reiter LT, Potocki L, Chien S, Gribskov M, Bier E., "A Systematic Analysis of Human Disease-Associated Gene Sequences In Drosophila melanogaster," Genome Research 11:1114–1125, Cold Spring Harbor Labratory Press.

 

Rozen, S. Primer3. [Recurso en línea]. Howard Hughes Medical Institute, the National Institutes of Health, National Human Genome Research Institute, and Whitehead Institute for Biomedical Research. 1996-2004. <http://frodo.wi.mit.edu/primer3/primer3_code.html > [Consulta: 20 jul. 2005]

 

Rozen S., Skaletsky H. J. 2000. Primer3 on the WWW for general users and for biologist programmers. In: Krawetz S, Misener S (eds) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ. 365-386.

 

Sanchez R. and Sali A. 1997. Advances in comparative protein-structure modeling. Current Opinion in Structural Biology. 7:206–214.

 

ScienceDirect. . [Recurso en línea]. <www.sciencedirect.com> [Consulta: 8 sep. 2005]

 

Segarra Ríos, S.O. Introducción a la computadora. [Recurso en línea]. Descripción de las características de una computadora. <http://coqui.lce.org/cedu6320/ssegarra/>  [Consulta: 30 de oct. 2005].

 

Sullivan J.A. Cells Alive. [Recurso en línea]. 1994-2005. <http://science.nhmccd.edu/biol/rchute.html > [Consulta:  6 ene. 2006]

 

Swiss Institute of Bioinformatics. Expasy Proteomics server. [Recurso en línea]. <http://ca.expasy.org/ > [Consulta:  2 dic. 2005]

 

Technelysium Pty Ltd. Chromas. [Recurso en línea]. <http://www.technelysium.com.au/chromas.html> [Consulta: 5 jul. 2005]

 

TIGR. [Recurso en línea] <http://www.tigr.org/> [Consulta: 21 Agt. 2006

 

Valverde, J. R. International Course on Bioinformatics. [Recurso en línea]. Notas del curso de bioinformática del Instituto de Investigación Biomédica de Madrid-España. 1999. <http://www.embnet.cl/bio/madrid/Es.EMBnet.Org/manuals/bic99.html> [Consulta: 10 agt. 2005]

 

Whelan S., Liò P., Goldman N. 2001. Molecular phylogenetics: state-of-the art methods for looking into the past. TRENDS in Genetics. 17: 262-272.

 

Wikipedia. Computadora. [Recurso en línea]. Descripción de la computadora. 2001-2006. <http://es.wikipedia.org/wiki/Computadora> [Consulta: 10 oct. 2005]

 

Zepeda García, O. Bioinformática. [Recurso en línea]. Solociencia.com. 2003-2006. <http://www.solociencia.com/biologia/bioinformatica.htm> [Consulta: 20 sep. 2005]

presentacion.jpg