El ensamblaje de novo del genoma de una especie es esencial en ausencia de una secuencia genómica de referencia. Muchos algoritmos de ensamblaje escalables utilizan el paradigma del grafo de Bruijn (DBG) para reconstruir genomas, en el que se obtiene una tabla de subsecuencias de cierta longitud a partir de las lecturas y se analizan sus solapamientos para ensamblar secuencias. A pesar de que las subsecuencias más largas desbloquean características genómicas más largas para el ensamblaje, el aumento asociado de los recursos informáticos limita la viabilidad del DBG frente a otros arquetipos de ensamblaje ya diseñados para lecturas más largas. Aquí revisamos el paradigma DBG para adaptarlo al cambiante panorama de la tecnología de secuenciación e introducimos tres diseños de estructuras de datos para semillas espaciadas en forma de subsecuencias emparejadas. Estas estructuras de datos abordan las limitaciones de memoria y tiempo de ejecución impuestas por las lecturas más largas. Observamos que cuando una distancia fija separa pares de semillas, proporciona una mayor especificidad de secuencia con una mayor longitud de intervalo. Además, observamos que los filtros Bloom serían adecuados para almacenar implícitamente semillas espaciadas y ser tolerantes a los errores de secuenciación. Partiendo de este concepto, describimos una estructura de datos para rastrear las frecuencias de las semillas espaciadas observadas. Estos diseños de estructuras de datos tendrán aplicaciones en ensamblajes de genomas, transcriptomas y metagenomas, y en la corrección de errores de lectura.
Esta es una versión de prueba de citación de documentos de la Biblioteca Virtual Pro. Puede contener errores. Lo invitamos a consultar los manuales de citación de las respectivas fuentes.
Artículo:
Interacción entre las avispas sociales que visitan las flores y las plantas: Patrón de red y complejidad ambiental
Artículo:
Agallas de insectos del Jardín Botánico del Museo Nacional (Río de Janeiro, RJ, Brasil)
Artículo:
Evaluación de las actividades antimicrobianas y antibiofilm de las nanopartículas de óxido de cobre dentro de los revestimientos de las prótesis dentales blandas contra los patógenos orales
Artículo:
Efectos del IGF-1 sobre los canales IK e IK1 a través de la señalización PI3K/Akt en miocitos cardíacos neonatales
Artículo:
Técnicas de análisis multivariado, modelamiento factorial múltiple y PLS-PATH para estudio y clasificación de tipos de mieles venezolanas de los estados de Lara y Yaracuy
Artículo:
Medicina de la conservación ¿una disciplina para médicos veterinarios?
Libro:
Tratamiento de aguas para consumo humano : plantas de filtración rápida. Manual II : diseño de plantas de tecnología apropiada
Artículo:
Configuración de los valores de María, antes y después de la violación, en Satanás de Mario Mendoza
Showroom:
Panel fotovoltaico: Dimensionamiento y funcionamiento