Lección 1Análisis de expresión diferencial: DESeq2, edgeR, limma-voom — diseño de modelo, contrastes y corrección de pruebas múltiplesEsta sección detalla workflows de expresión diferencial usando DESeq2, edgeR y limma-voom, enfocándose en diseño de modelo, contrastes, estimación de dispersión y corrección de pruebas múltiples para obtener listas de genes confiables y estimaciones de tamaño de efecto.
Diseño de modelos experimentales y covariablesEstablecimiento de contrastes para comparaciones complejasEjecución de workflow DESeq2 end-to-endUso de pipelines edgeR y limma-voomCorrección de pruebas múltiples y control FDRInterpretación de cambios log2 fold y shrinkageLección 2Organización de datos y convenciones de nomenclatura de archivos: hojas de muestras, separación raw/procesado, identificadores consistentesEsta sección describe mejores prácticas para organizar archivos de proyectos RNA-seq, incluyendo hojas de muestras, layouts de directorios, separación de datos raw versus procesados e identificadores consistentes que simplifican scripting, seguimiento y reproducibilidad.
Diseño de jerarquía clara de directoriosSeparación de datos raw y procesadosCreación de hojas de muestras y metadatos robustosIdentificadores consistentes de muestra y libreríaVersionado de genomas de referencia e índicesRespaldo y archivo de datos del proyectoLección 3Estrategias de cuantificación a nivel de gen: featureCounts, htseq-count, tximport para summarización transcript-to-geneEsta sección explica cuantificación a nivel de gen desde lecturas alineadas o pseudo-alineadas, comparando featureCounts y htseq-count, y detallando cómo tximport agrega estimaciones a nivel de transcrito en matrices robustas a nivel de gen para análisis estadístico downstream.
Conteo de lecturas con opciones featureCountsUso de modos htseq-count y anotacionesManejo de strandedness y lecturas multimapeadasImportación de Salmon y kallisto con tximportConstrucción de matrices de conteos a nivel de genEvaluación de calidad de cuantificación y coberturaLección 4Herramientas para descarga y organización de datos: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, y entradas/salidas recomendadasEsta sección cubre estrategias confiables para descargar y organizar datos RNA-seq, enfocándose en SRA Toolkit, acceso ENA, herramientas de transferencia command-line y definición de estructuras consistentes de entrada y salida que soportan automatización y reproducibilidad.
Uso de SRA Toolkit prefetch y fasterq-dumpAcceso a ENA vía FTP y AsperaDescarga segura con wget y rsyncElección de formatos de archivos raw y procesadosDocumentación de metadatos de descarga y checksumsAutomatización de descargas con scripts y logsLección 5Herramientas y salidas de control de calidad: FastQC, MultiQC, métricas clave a inspeccionar (calidad por base, contenido de adaptadores, duplicación, GC)Esta sección se enfoca en control de calidad RNA-seq, usando FastQC y MultiQC para resumir métricas clave como calidad por base, contaminación de adaptadores, duplicación y contenido GC, y decidir si se requiere trimming o resecuenciación.
Ejecución de FastQC en lecturas raw y trimmedInterpretación de perfiles de calidad por baseDetección de adaptadores y secuencias sobre-representadasEvaluación de duplicación y contenido GCAgregación de reportes con MultiQCDefinición de umbrales QC y accionesLección 6Trimming y filtrado de lecturas: cuándo trimar, herramientas (Trim Galore/Cutadapt/fastp), parámetros principales y salidasEsta sección explica cuándo y cómo trimar lecturas RNA-seq, cubriendo trimming de adaptadores y calidad, filtrado de longitud, y parámetros clave en herramientas como Trim Galore, Cutadapt y fastp, evitando sobre-trimming que daña análisis downstream.
Decisión de si el trimming es necesarioEstrategias de detección y remoción de adaptadoresUmbrales de trimming basados en calidadFiltros de longitud mínima y complejidadUso de opciones Trim Galore y CutadaptFastp para QC y trimming integradoLección 7Análisis downstream básicos: enriquecimiento GO/KEGG (clusterProfiler), GSEA preranked, visualización de vías, y selección de conjunto de genesEsta sección introduce análisis funcionales downstream después de expresión diferencial, incluyendo enriquecimiento GO y KEGG con clusterProfiler, GSEA preranked, visualización de vías y estrategias principled para seleccionar y filtrar conjuntos de genes.
Preparación de listas de genes rankeados para GSEAEnriquecimiento GO y KEGG con clusterProfilerElección de bases de datos de conjunto de genes apropiadasVisualización de vías y redes enriquecidasFiltrado y priorización de conjuntos de genesReporte de resultados funcionales de manera reproducibleLección 8Layout de alto nivel del pipeline: descarga de datos, QC, trimming, alineamiento/pseudo-alineamiento, cuantificación, expresión diferencial, análisis downstreamEsta sección presenta la estructura general del pipeline RNA-seq, desde adquisición de datos y QC a través de trimming, alineamiento o pseudo-alineamiento, cuantificación, normalización, expresión diferencial y análisis funcional downstream, enfatizando workflows modulares y scriptados.
Definición de etapas de pipeline y dependenciasPlanificación de entradas, salidas y flujo de archivosIntegración de QC, trimming y alineamientoEnlace de cuantificación a análisis DEConexión de DE a workflows de enriquecimientoDocumentación del pipeline con diagramasLección 9Normalización y análisis exploratorio de datos: límites TPM/FPKM, normalización DESeq2, PCA, heatmaps de distancia muestra-muestraEsta sección cubre normalización y análisis exploratorio de datos RNA-seq, discutiendo limitaciones de TPM y FPKM, normalización basada en DESeq2, estabilización de varianza, análisis de componentes principales y heatmaps de distancia de muestra para detectar efectos de batch.
Limitaciones de medidas TPM y FPKMFactores de tamaño DESeq2 y normalizaciónTransformaciones estabilizadoras de varianza y rlogAnálisis de componentes principales de muestrasHeatmaps de distancia muestra-muestraDetección de efectos de batch y outliersLección 10Mejores prácticas de visualización básica: gráficos MA, volcano plots, heatmaps, dotplots de vías, y opciones de reportes interactivos (R Markdown, Jupyter)Esta sección introduce estrategias efectivas de visualización para resultados RNA-seq, enfatizando comunicación clara de expresión diferencial, estructura de muestra y cambios de vía usando gráficos estáticos y reportes interactivos, reproducibles construidos en R Markdown o Jupyter.
Construcción e interpretación de gráficos MADiseño de volcano plots claros para genes DEConstrucción de heatmaps de calidad de publicaciónDotplots de vías para resultados de enriquecimientoReportes RNA-seq interactivos R MarkdownVisualización exploratoria basada en JupyterLección 11Alineamiento vs pseudo-alineamiento: STAR, HISAT2, Salmon, kallisto — compensaciones y salidas (BAM, conteos transcrito/gen)Esta sección compara herramientas basadas en alineamiento como STAR y HISAT2 con herramientas de pseudo-alineamiento como Salmon y kallisto, destacando compensaciones en velocidad, precisión, uso de recursos y salidas incluyendo archivos BAM y conteos a nivel de transcrito o gen.
Cuándo elegir alineadores STAR o HISAT2Configuración de índices de genoma y anotacionesUso de Salmon en modo quasi-mappingEjecución de kallisto para cuantificación rápidaComparación de salidas BAM y quant.sf styleBenchmarking de velocidad, memoria y precisión