BioPerl
From Wikipedia, the free encyclopedia
BioPerl es un software de código abierto diseñado a partir de la colaboración entre bioinformáticos, biólogos y científicos del área de la computación, ante la necesidad de analizar y resolver problemas de la bioinformática.[1] BioPerl es un proyecto activo financiado por la Open Bioinformatics Foundation, basado en módulos de Perl con el fin de facilitar la administración y manipulación de información relacionada con ciencias de la vida .[1] Tales módulos son interfaces de tipos de datos de secuencias, alineamientos (BLAST, Clustal), características y localizaciones génicas y bases de datos (GenBank), entre otras. Con el fin de aprovechar BioPerl, el usuario necesita una comprensión básica del lenguaje de programación Perl que incluya una comprensión del uso de referencias, módulos, objetos y métodos.
| BioPerl | ||
|---|---|---|
| Información general | ||
| Tipo de programa | Bioinformática | |
| Lanzamiento inicial | 11 de junio de 2002 | |
| Licencia | Licencia artística y GPL | |
| Información técnica | ||
| Programado en | Perl | |
| Versiones | ||
| Última versión estable | 1.6.9 (14 de abril de 2011 (14 años, 10 meses y 29 días)) | |
| Última versión en pruebas | Nightly builds () | |
| Enlaces | ||
La primera versión estable fue lanzada el 11 de junio de 2002; la última estable (en términos de la API) es la 1.6.9, lanzada en abril de 2011. También hay lanzamientos periódicos producidos por desarrolladores. La versión 1.6.0 es considerada la más estable (en términos de errores) y la versión de BioPerl se recomienda para el uso diario, se basa en Nightly Builds, también estable.
BioPerl ha desempeñado un papel integral en el Proyecto Genoma Humano.[2]
Características
BioPerl provee de módulos de software para muchas tareas típicas de programación en bioinformática. Estas incluyen:
- Acceso a datos a secuencias de ADN y de aminoácidos de bases de datos locales y remotas.
- Transformación de formatos de bases de datos y archivos de registro.
- Manipulación de secuencias individuales.
- Búsqueda de secuencias similares.
- Creación y manipulación de alineamientos de secuencias.
- Búsqueda de genes y otras estructuras del ADN genómico.
- Desarrollo de anotaciones de secuencia legibles por máquina.
Aplicaciones
Además de ser usado directamente por usuarios finales,[3] BioPerl también ha provisto de una base para una variedad de herramientas bioinformáticas, incluyendo entre otras:
- Trinity[4]
- SynBrowse[5]
- GeneComber[6]
- TFBS[7]
- MIMOX[8]
- BioParser[9]
- Diseño de cebadores degenerados[10]
- Búsqueda en bases de datos públicas[11]
- Current Comparative Table[12]
Nuevas herramientas y algoritmos de desarrolladores externos son con frecuencia integrados directamente en BioPerl:
- Manejo de árboles filogenéticos y taxones anidados[13]
- Herramientas web FPC[14]
Instalación en UNIX
Requerimientos del Sistema
- Perl version 5.6.1 o superior. Se recomienda Perl version 5.8 o superior.
- External modules: BioPerl usa funciones provistas en otros módulos de Perl. Algunas de estas funciones están incluidas en el paquete estándar de Perl y otras se pueden descargar desde CPAN y son instaladas automáticamente si se instala BioPerl de manera fácil. Esta lista de módulos externos se puede encontrar en la página oficial de BioPerl.
Módulos más importantes
| Módulos | Descripción |
|---|---|
| Bio::Seq | Secuencias y sus propiedades |
| Bio::SeqIO | Entrada/Salida de datos de secuencias |
| Bio::Index | Indexación de archivos de secuencias |
| Bio::DB | Acceso remoto a bases de datos de secuencias y referencias por medio de conexión HTTP |
| Bio::Seq::Feature | Anotaciones y características que tiene la ubicación de una secuencia |
| Bio::Annotation | Anotaciones genéricas: comentarios y referencias |
| Bio::AlignIO, Bio::SimpleAlign | Alineamientos múltiples de secuencias |
| Bio::Search, Bio::SearchIO | Búsqueda en bases de datos de secuencias |
| Bio::Map, Bio::MapIO | Mapas Biológicos |
| Bio::LiveSeq, Bio::Variation | Mutaciones y variaciones de secuencia |
| Bio::Tree, Bio::Tree::IO | Árboles Filogenéticos |
| Bio::Structure | Datos estructurales de proteínas |
| Bio::Graphics | Visualización de secuencias |
Ejemplo de lectura de datos de secuencias
Los módulos IO (entrada/salida) leen datos formateados y crean representaciones en memoria de los datos llamados objetos.
#!/usr/bin/perl -w
use strict;
use Bio::SeqIO;
my $seqio = Bio::SeqIO->new(-format => "fasta", -file => "secuencias.fasta");
while(my $secuencia = $seqio->next_seq()){
print "Secuencia ", $secuencia->display_id, " tiene una longitud de ",
$secuencia->length, " nucleotidos\n";
}
