Experiencias de desarrollo en tareas de procesamiento y gestión de datos en bioinformática
Development experiences in processing and data management tasks on bioinformatics
En el presente documento se describen brevemente algunas experiencias de desarrollo relacionadas a tareas de procesamiento y gestión de datos para el área de bioinformática. En dicha área una de sus características es que los mismos suelen tener alta dimensionalidad, siendo esta una de las características que dificultan cualquier proceso de reconocimiento de patrones. Por otro lado en lo que respecta a tareas de gestión de datos, el profesional que trabaja en ámbitos de bioinformática usualmente necesita disponer de suficientes variantes en cuanto al manejo de diferentes formatos de almacenamiento y métodos de procesamiento, dada la naturaleza investigativa de su profesión que le requiere continuamente realizar ensayos in silico de manera no estandarizada. Este perfil de trabajo requiere herramientas con suficiente flexibilidad a fin de dar soporte a dichas tareas. Teniendo en cuenta estos dos aspectos en este trabajo se muestran en primer lugar una experiencia en relación a estrategias para la reducción dimensional. Por otro lado se muestra una experiencia en el diseño y desarrollo de un sistema flexible basado en pipeless y pipelines.
INTRODUCCIÓN
El creciente poder de procesamiento y sofisticación de las herramientas y técnicas analíticas ha dado como resultado, para la gestión y procesamiento de datos, la creación de estructuras y programas que proporcionan almacenamiento, funcionalidad y receptividad a las consultas, que van más allá de las posibilidades de las bases de datos destinadas a transacciones. A este poder en progresivo aumento se le ha unido una gran demanda para mejorar el rendimiento del acceso a datos que tienen las bases de datos. Muchos usuarios tan solo necesitan acceso de lectura a los datos, pero requieren un acceso muy rápido a un gran volumen de datos que puedan descargarse cómodamente en su computador personal. A menudo, esos datos proceden de varias bases de datos. Dado que muchos análisis realizados son concurrentes y predecibles, los vendedores de software y el personal de mantenimiento de sistemas han comenzado a diseñar sistemas para realizar estas funciones.
El área bioinformática se inscribe dentro de esta tendencia, pero presenta algunas particularidades; desde el punto de vista del procesamiento de datos, una de sus características es que estos suelen tener alta dimensionalidad, característica que dificulta cualquier proceso de reconocimiento de patrones.
Este documento es un artículo elaborado por Alejandro Hadad PhD (C) en Ingeniería, Mención en Sistemas de Información,UTN-FRSF, Argentina. Biongeniero, Profesor Investigador en la Facultad de Ingeniería, Universidad Nacional de Entre Ríos. Docente en Facultad de Ciencia y Tecnología, Universidad Autónoma de Entre Ríos, Franco Simonetti, Luisina Pocay y Walter Elias cenciados en Bioinformática, Facultad de Ingeniería,Universidad Nacional de Entre Ríos, Argentina. Para la Revista Facultad de Ingeniería Vol 20 , Núm 31. Publicación de la Universidad Pedagógica y Tecnológica de Colombia - UPTC. Colombia. Contacto: [email protected]
Recursos
-
Formatopdf
-
Idioma:español
-
Tamaño:614 kb