Lección 1Análisis de expresión diferencial: DESeq2, edgeR, limma-voom — diseño de modelo, contrastes y corrección de pruebas múltiplesEsta sección detalla workflows de expresión diferencial usando DESeq2, edgeR y limma-voom, centrándose en diseño de modelo, contrastes, estimación de dispersión y corrección de pruebas múltiples para obtener listas de genes y estimaciones de tamaño de efecto fiables.
Diseño de modelos experimentales y covariablesEstablecimiento de contrastes para comparaciones complejasEjecución de workflow DESeq2 end-to-endUso de pipelines edgeR y limma-voomCorrección de pruebas múltiples y control FDRInterpretación de cambios log2 fold y shrinkageLección 2Organización de datos y convenciones de nomenclatura de archivos: hojas de muestras, separación raw/procesados, identificadores consistentesEsta sección describe mejores prácticas para organizar archivos de proyectos RNA-seq, incluyendo hojas de muestras, layouts de directorios, separación de datos raw versus procesados e identificadores consistentes que simplifican scripting, seguimiento y reproducibilidad.
Diseño de jerarquía clara de directoriosSeparación de datos raw y procesadosCreación de hojas de muestras y metadatos robustosIdentificadores consistentes de muestra y libreríaVersionado de genomas de referencia e índicesRespaldo y archivo de datos del proyectoLección 3Estrategias de cuantificación a nivel gen: featureCounts, htseq-count, tximport para summarización transcrito-a-genEsta sección explica cuantificación a nivel gen desde lecturas alineadas o pseudo-alineadas, comparando featureCounts y htseq-count, y detallando cómo tximport agrega estimaciones a nivel transcrito en matrices robustas a nivel gen para análisis estadístico downstream.
Conteo de lecturas con opciones featureCountsUso de modos htseq-count y anotacionesManejo de strandedness y lecturas multimapeantesImportación de Salmon y kallisto con tximportConstrucción de matrices de conteos a nivel genEvaluación de calidad de cuantificación y coberturaLección 4Herramientas para descarga y organización de datos: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync e inputs/outputs recomendadosEsta sección cubre estrategias fiables para descargar y organizar datos RNA-seq, centrándose en SRA Toolkit, acceso ENA, herramientas de transferencia command-line y definición de estructuras de input y output consistentes que soportan automatización y reproducibilidad.
Uso de SRA Toolkit prefetch y fasterq-dumpAcceso a ENA vía FTP y AsperaDescarga segura con wget y rsyncElección de formatos de archivo raw y procesadosDocumentación de metadatos de descarga y checksumsAutomatización de descargas con scripts y logsLección 5Herramientas y outputs de control de calidad: FastQC, MultiQC, métricas clave a inspeccionar (calidad por base, contenido adaptador, duplicación, GC)Esta sección se centra en control de calidad RNA-seq, usando FastQC y MultiQC para resumir métricas clave como calidad por base, contaminación de adaptadores, duplicación y contenido GC, y decidir si se requiere trimming o resecuenciación.
Ejecución de FastQC en lecturas raw y trimmedInterpretación de perfiles de calidad por baseDetección de adaptadores y secuencias sobre-representadasEvaluación de duplicación y contenido GCAgregación de informes con MultiQCDefinición de umbrales QC y accionesLección 6Trimming y filtrado de lecturas: cuándo trimar, herramientas (Trim Galore/Cutadapt/fastp), parámetros principales y outputsEsta sección explica cuándo y cómo trimar lecturas RNA-seq, cubriendo trimming de adaptadores y calidad, filtrado de longitud, y parámetros clave en herramientas como Trim Galore, Cutadapt y fastp, evitando sobre-trimming que perjudica análisis downstream.
Decisión de si el trimming es necesarioEstrategias de detección y remoción de adaptadoresUmbrales de trimming basados en calidadFiltros de longitud mínima y complejidadUso de opciones Trim Galore y CutadaptFastp para QC y trimming integradoLección 7Análisis downstream básicos: enriquecimiento GO/KEGG (clusterProfiler), GSEA preranked, visualización de vías y selección de conjuntos génicosEsta sección introduce análisis funcionales downstream tras expresión diferencial, incluyendo enriquecimiento GO y KEGG con clusterProfiler, GSEA preranked, visualización de vías y estrategias principios para seleccionar y filtrar conjuntos génicos.
Preparación de listas de genes rankeados para GSEAEnriquecimiento GO y KEGG con clusterProfilerElección de bases de datos de conjuntos génicos apropiadasVisualización de vías y redes enriquecidasFiltrado y priorización de conjuntos génicosReporteo reproducible de resultados funcionalesLección 8Layout de alto nivel del pipeline: descarga datos, QC, trimming, alineamiento/pseudo-alineamiento, cuantificación, expresión diferencial, análisis downstreamEsta sección presenta la estructura general del pipeline RNA-seq, desde adquisición de datos y QC a través de trimming, alineamiento o pseudo-alineamiento, cuantificación, normalización, expresión diferencial y análisis funcional downstream, enfatizando workflows modulares y scriptados.
Definición de etapas de pipeline y dependenciasPlanificación de inputs, outputs y flujo de archivosIntegración de QC, trimming y alineamientoVinculación de cuantificación a análisis DEConexión de DE a workflows de enriquecimientoDocumentación del pipeline con diagramasLección 9Normalización y análisis exploratorio de datos: límites TPM/FPKM, normalización DESeq2, PCA, mapas de calor de distancia muestra-muestraEsta sección cubre normalización y análisis exploratorio de datos RNA-seq, discutiendo limitaciones de TPM y FPKM, normalización basada en DESeq2, estabilización de varianza, análisis de componentes principales y mapas de calor de distancia de muestras para detectar efectos batch.
Limitaciones de medidas TPM y FPKMFactores de tamaño DESeq2 y normalizaciónTransformaciones estabilizadoras de varianza y rlogAnálisis de componentes principales de muestrasMapas de calor de distancia muestra-muestraDetección de efectos batch y outliersLección 10Mejores prácticas básicas de visualización: gráficos MA, volcano plots, mapas de calor, dotplots de vías y opciones de informes interactivos (R Markdown, Jupyter)Esta sección introduce estrategias efectivas de visualización para resultados RNA-seq, enfatizando comunicación clara de expresión diferencial, estructura de muestras y cambios de vías usando gráficos estáticos e informes interactivos, reproducibles construidos en R Markdown o Jupyter.
Construcción e interpretación de gráficos MADiseño de volcano plots claros para genes DEConstrucción de mapas de calor de calidad publicaciónDotplots de vías para resultados de enriquecimientoInformes RNA-seq interactivos R MarkdownVisualización exploratoria basada en JupyterLección 11Alineamiento vs pseudo-alineamiento: STAR, HISAT2, Salmon, kallisto — compensaciones y outputs (BAM, conteos transcrito/gen)Esta sección compara herramientas basadas en alineamiento como STAR y HISAT2 con herramientas de pseudo-alineamiento como Salmon y kallisto, destacando compensaciones en velocidad, precisión, uso de recursos y outputs incluyendo archivos BAM y conteos a nivel transcrito o gen.
Cuándo elegir alineadores STAR o HISAT2Configuración de índices de genoma y anotacionesUso de Salmon en modo quasi-mappingEjecución de kallisto para cuantificación rápidaComparación de outputs BAM y quant.sfBenchmarking de velocidad, memoria y precisión