MetodologÃa para el minado in silico de loci polimórficos en microsatélites
Resumen
Resumen
Antecedentes: Los polimorfismos con número variable de repeticiones en tándem (VNTR), particularmente los de microsatélites (SSR), constituyen marcadores genéticos ampliamente utilizados en múltiples áreas de la genómica como estudios evolutivos, epidemiológicos y de genética poblacional. El crecimiento exponencial de los bancos de secuencias genómicas y las herramientas computacionales como BLAST permiten actualmente el minado de estos marcadores sin necesidad de utilizar métodos experimentales, extendiéndolo a organismos no modelos de importancia médica o económica. No obstante, debido a la baja complejidad de estas secuencias y el elevado número de candidatos que se presentan al inspeccionar un genoma cuando el procedimiento es escalado, surgen serias dificultades para el procesamiento del enorme volumen de datos que se genera y la detección por inspección visual de los polimorfismos en los marcadores candidatos.
Métodos: Se describe una metodologÃa y sus especificidades algorÃtmicas, implementadas en varios software que, ejecutados en serie, permiten la identificación y extracción rápida y fiable de loci polimórficos de SSRs. El procesamiento global se hace por la concatenación de los programas MIDAS, BLAST, y el script PSSR-Extractor. Las entradas son rutas de directorios donde se encuentren múltiples archivos de secuencia en formato FASTA o GBFF y las salidas son los SSRs, códigos de acceso al GenBank, posiciones en el genoma, número de repeticiones y el grado de polimorfismo expresado como rango de variación, frecuencia alélica, cantidad de alelos y contenido de información polimórfica (PIC). Un script opcional, SSRMerge, permite la identificación de loci únicos (no redundantes) a nivel de especie, de género o en general del conjunto las secuencias que se desee procesar.
Resultados: Se procesaron 23 genomas completos (RefSeq del NCBI) pertenecientes a diversos aislamientos de Mycobacterium tuberculosis. Se detectaron 4433 SSRs y de ellos se extrajeron 414 loci no redundantes dentro de la especie. Se hizo el minado de polimorfismos en las salidas del servidor BLAST para estos SSRs y se reportan diferentes medidas que reflejan las variaciones que presentan estos loci.
Esta obra está bajo una licencia de Creative Commons Reconocimiento-NoComercial 4.0 Internacional.