Lección 1Análisis de expresión diferencial: DESeq2, edgeR, limma-voom — diseño de modelo, contrastes y corrección de pruebas múltiplesEsta sección detalla workflows de expresión diferencial usando DESeq2, edgeR y limma-voom, enfocándose en diseño de modelo, contrastes, estimación de dispersión y corrección de pruebas múltiples para obtener listas de genes confiables y estimaciones de tamaño de efecto.
Diseño de modelos experimentales y covariablesConfiguración de contrastes para comparaciones complejasEjecución de workflow DESeq2 end-to-endUso de pipelines edgeR y limma-voomCorrección de pruebas múltiples y control FDRInterpretación de cambios log2 fold y shrinkageLección 2Organización de datos y convenciones de nomenclatura de archivos: hojas de muestras, separación raw/procesado, identificadores consistentesEsta sección describe mejores prácticas para organizar archivos de proyectos RNA-seq, incluyendo hojas de muestras, layouts de directorios, separación de datos raw versus procesados, e identificadores consistentes que simplifican scripting, tracking y reproducibilidad.
Diseño de jerarquía clara de directoriosSeparación de datos raw y procesadosCreación de hojas de muestras y metadatos robustosIdentificadores consistentes de muestras y libreríasVersionado de genomas de referencia e índicesBackup y archivo de datos del proyectoLección 3Estrategias de cuantificación a nivel gen: featureCounts, htseq-count, tximport para summarización transcript-to-geneEsta sección explica cuantificación a nivel gen desde lecturas alineadas o pseudo-alineadas, comparando featureCounts y htseq-count, y detallando cómo tximport agrega estimaciones a nivel transcrito en matrices robustas a nivel gen para análisis estadístico downstream.
Conteo de lecturas con opciones featureCountsUso de modos htseq-count y anotacionesManejo de strandedness y lecturas multimapeantesImportación de Salmon y kallisto con tximportConstrucción de matrices de conteos a nivel genEvaluación de calidad de cuantificación y coberturaLección 4Herramientas para descarga y organización de datos: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, y inputs/outputs recomendadosEsta sección cubre estrategias confiables para descargar y organizar datos RNA-seq, enfocándose en SRA Toolkit, acceso ENA, herramientas de transferencia command-line, y definición de estructuras consistentes de input y output que soportan automatización y reproducibilidad.
Uso de SRA Toolkit prefetch y fasterq-dumpAcceso a ENA vía FTP y AsperaDescarga segura con wget y rsyncElección de formatos de archivos raw y procesadosDocumentación de metadatos de descarga y checksumsAutomatización de descargas con scripts y logsLección 5Herramientas y outputs de control de calidad: FastQC, MultiQC, métricas clave a inspeccionar (calidad per-base, contenido adapter, duplicación, GC)Esta sección se enfoca en control de calidad RNA-seq, usando FastQC y MultiQC para resumir métricas clave como calidad per-base, contaminación adapter, duplicación y contenido GC, y decidir si se requiere trimming o resecuenciación.
Ejecución de FastQC en lecturas raw y trimmedInterpretación de perfiles de calidad per-baseDetección de adapters y secuencias sobre-representadasEvaluación de duplicación y contenido GCAgregación de reportes con MultiQCDefinición de umbrales QC y accionesLección 6Trimming y filtrado de lecturas: cuándo trimar, herramientas (Trim Galore/Cutadapt/fastp), parámetros principales y outputsEsta sección explica cuándo y cómo trimar lecturas RNA-seq, cubriendo trimming de adapters y calidad, filtrado de longitud, y parámetros clave en herramientas como Trim Galore, Cutadapt y fastp, evitando over-trimming que daña análisis downstream.
Decisión de si el trimming es necesarioEstrategias de detección y remoción de adaptersUmbrales de trimming basados en calidadFiltros de longitud mínima y complejidadOpciones de Trim Galore y CutadaptFastp para QC y trimming integradoLección 7Análisis downstream básicos: enriquecimiento GO/KEGG (clusterProfiler), GSEA preranked, visualización de pathways, y selección de gene setsEsta sección introduce análisis funcionales downstream después de expresión diferencial, incluyendo enriquecimiento GO y KEGG con clusterProfiler, GSEA preranked, visualización de pathways, y estrategias principled para seleccionar y filtrar gene sets.
Preparación de listas de genes rankeados para GSEAEnriquecimiento GO y KEGG con clusterProfilerElección de bases de datos de gene sets apropiadasVisualización de pathways y redes enriquecidosFiltrado y priorización de gene setsReporte reproducible de resultados funcionalesLección 8Layout de alto nivel del pipeline: descarga de datos, QC, trimming, alineamiento/pseudo-alineamiento, cuantificación, expresión diferencial, análisis downstreamEsta sección presenta la estructura general del pipeline RNA-seq, desde adquisición de datos y QC hasta trimming, alineamiento o pseudo-alineamiento, cuantificación, normalización, expresión diferencial y análisis funcional downstream, enfatizando workflows modulares y scriptados.
Definición de etapas del pipeline y dependenciasPlanificación de inputs, outputs y flujo de archivosIntegración de QC, trimming y alineamientoVinculación de cuantificación a análisis DEConexión de DE a workflows de enriquecimientoDocumentación del pipeline con diagramasLección 9Normalización y análisis exploratorio de datos: límites TPM/FPKM, normalización DESeq2, PCA, heatmaps de distancia sample-sampleEsta sección cubre normalización y análisis exploratorio de datos RNA-seq, discutiendo limitaciones de TPM y FPKM, normalización basada en DESeq2, estabilización de varianza, análisis de componentes principales y heatmaps de distancia de muestras para detectar efectos de batch.
Limitaciones de medidas TPM y FPKMFactores de tamaño DESeq2 y normalizaciónTransformaciones variance-stabilizing y rlogAnálisis de componentes principales de muestrasHeatmaps de distancia sample-sampleDetección de efectos de batch y outliersLección 10Mejores prácticas de visualización básica: plots MA, volcano plots, heatmaps, dotplots de pathways, y opciones de reportes interactivos (R Markdown, Jupyter)Esta sección introduce estrategias efectivas de visualización para resultados RNA-seq, enfatizando comunicación clara de expresión diferencial, estructura de muestras y cambios de pathway usando plots estáticos y reportes interactivos, reproducibles construidos en R Markdown o Jupyter.
Construcción e interpretación de plots MADiseño de volcano plots claros para genes DEConstrucción de heatmaps de calidad publicaciónDotplots de pathway para resultados de enriquecimientoReportes RNA-seq interactivos R MarkdownVisualización exploratoria basada en JupyterLección 11Alineamiento vs pseudo-alineamiento: STAR, HISAT2, Salmon, kallisto — tradeoffs y outputs (BAM, transcript/genecounts)Esta sección compara herramientas basadas en alineamiento como STAR y HISAT2 con herramientas de pseudo-alineamiento como Salmon y kallisto, destacando tradeoffs en velocidad, precisión, uso de recursos y outputs incluyendo archivos BAM y conteos a nivel transcrito o gen.
Cuándo elegir alineadores STAR o HISAT2Configuración de índices de genoma y anotacionesUso de Salmon en modo quasi-mappingEjecución de kallisto para cuantificación rápidaComparación de outputs BAM y quant.sf styleBenchmarking de velocidad, memoria y precisión