Lección 1Análisis de expresión diferencial: DESeq2, edgeR, limma-voom — diseño de modelo, contrastes y corrección de pruebas múltiplesEsta sección detalla workflows de expresión diferencial usando DESeq2, edgeR y limma-voom, enfocándose en diseño de modelo, contrastes, estimación de dispersión y corrección de pruebas múltiples para obtener listas de genes confiables y estimados de tamaño de efecto.
Diseñando modelos experimentales y covariablesEstableciendo contrastes para comparaciones complejasEjecutando workflow completo DESeq2Usando pipelines edgeR y limma-voomCorrección de pruebas múltiples y control FDRInterpretando cambios log2 fold y shrinkageLección 2Organización de datos y convenciones de nomenclatura de archivos: hojas de muestras, separación raw/procesado, identificadores consistentesEsta sección describe mejores prácticas para organizar archivos de proyectos RNA-seq, incluyendo hojas de muestras, layouts de directorios, separación de datos raw versus procesados, e identificadores consistentes que simplifican scripting, tracking y reproducibilidad.
Diseñando jerarquía clara de directoriosSeparando datos raw y procesadosCreando hojas de muestras y metadatos robustosIdentificadores consistentes de muestra y libreríaVersionando genomas de referencia e índicesRespaldando y archivando datos del proyectoLección 3Estrategias de cuantificación a nivel gen: featureCounts, htseq-count, tximport para summarización transcrito-a-genEsta sección explica cuantificación a nivel gen desde lecturas alineadas o pseudo-alineadas, comparando featureCounts y htseq-count, y detallando cómo tximport agrega estimados a nivel transcrito en matrices robustas a nivel gen para análisis estadístico downstream.
Contando lecturas con opciones featureCountsUsando modos htseq-count y anotacionesManejando strandedness y lecturas multimapeantesImportando Salmon y kallisto con tximportConstruyendo matrices de conteos a nivel genEvaluando calidad de cuantificación y coberturaLección 4Herramientas para descarga y organización de datos: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, y entradas/salidas recomendadasEsta sección cubre estrategias confiables para descargar y organizar datos RNA-seq, enfocándose en SRA Toolkit, acceso ENA, herramientas de transferencia command-line, y definiendo estructuras consistentes de entrada y salida que soportan automatización y reproducibilidad.
Usando SRA Toolkit prefetch y fasterq-dumpAccediendo ENA vía FTP y AsperaDescargando con wget y rsync de forma seguraElegiendo formatos de archivos raw y procesadosDocumentando metadatos de descarga y checksumsAutomatiizando descargas con scripts y logsLección 5Herramientas y salidas de control de calidad: FastQC, MultiQC, métricas clave a inspeccionar (calidad por base, contenido de adaptadores, duplicación, GC)Esta sección se enfoca en control de calidad RNA-seq, usando FastQC y MultiQC para resumir métricas clave como calidad por base, contaminación de adaptadores, duplicación y contenido GC, y decidir si se requiere trimming o resecuenciación.
Ejecutando FastQC en lecturas raw y trimmedInterpretando perfiles de calidad por baseDetectando adaptadores y secuencias sobre-representadasEvaluando duplicación y contenido GCAgregando reportes con MultiQCDefiniendo umbrales QC y accionesLección 6Trimming y filtrado de lecturas: cuándo trimar, herramientas (Trim Galore/Cutadapt/fastp), parámetros principales y salidasEsta sección explica cuándo y cómo trimar lecturas RNA-seq, cubriendo trimming de adaptadores y calidad, filtrado de longitud, y parámetros clave en herramientas como Trim Galore, Cutadapt y fastp, evitando sobre-trimming que daña análisis downstream.
Decidiendo si el trimming es necesarioEstrategias de detección y remoción de adaptadoresUmbrales de trimming basados en calidadFiltros mínimos de longitud y complejidadUsando opciones Trim Galore y CutadaptFastp para QC y trimming integradoLección 7Análisis downstream básicos: enriquecimiento GO/KEGG (clusterProfiler), GSEA preranked, visualización de vías, y selección de conjunto de genesEsta sección introduce análisis funcionales downstream después de expresión diferencial, incluyendo enriquecimiento GO y KEGG con clusterProfiler, GSEA preranked, visualización de vías, y estrategias principled para seleccionar y filtrar conjuntos de genes.
Preparando listas de genes rankeados para GSEAEnriquecimiento GO y KEGG con clusterProfilerElegiendo bases de datos apropiadas de conjuntos de genesVisualizando vías y redes enriquecidasFiltrando y priorizando conjuntos de genesReportando resultados funcionales de forma reproducibleLección 8Layout de alto nivel del pipeline: descarga de datos, QC, trimming, alineamiento/pseudo-alineamiento, cuantificación, expresión diferencial, análisis downstreamEsta sección presenta la estructura general del pipeline RNA-seq, desde adquisición de datos y QC hasta trimming, alineamiento o pseudo-alineamiento, cuantificación, normalización, expresión diferencial y análisis funcional downstream, enfatizando workflows modulares y scriptados.
Definiendo etapas del pipeline y dependenciasPlanificando entradas, salidas y flujo de archivosIntegrando QC, trimming y alineamientoEnlazando cuantificación a análisis DEConectando DE a workflows de enriquecimientoDocumentando el pipeline con diagramasLección 9Normalización y análisis exploratorio de datos: límites TPM/FPKM, normalización DESeq2, PCA, heatmaps de distancia muestra-muestraEsta sección cubre normalización y análisis exploratorio de datos RNA-seq, discutiendo limitaciones de TPM y FPKM, normalización basada en DESeq2, estabilización de varianza, análisis de componentes principales y heatmaps de distancia de muestras para detectar efectos de batch.
Limitaciones de medidas TPM y FPKMFactores de tamaño DESeq2 y normalizaciónTransformaciones variance-stabilizing y rlogAnálisis de componentes principales de muestrasHeatmaps de distancia muestra-muestraDetectando efectos de batch y outliersLección 10Mejores prácticas de visualización básica: plots MA, volcano plots, heatmaps, dotplots de vías, y opciones de reportes interactivos (R Markdown, Jupyter)Esta sección introduce estrategias efectivas de visualización para resultados RNA-seq, enfatizando comunicación clara de expresión diferencial, estructura de muestras y cambios de vías usando plots estáticos y reportes interactivos, reproducibles construidos en R Markdown o Jupyter.
Construyendo e interpretando plots MADiseñando volcano plots claros para genes DEConstruyendo heatmaps de calidad publicaciónDotplots de vías para resultados de enriquecimientoReportes RNA-seq interactivos R MarkdownVisualización exploratoria basada en JupyterLección 11Alineamiento vs pseudo-alineamiento: STAR, HISAT2, Salmon, kallisto — compensaciones y salidas (BAM, conteos transcrito/gen)Esta sección compara herramientas basadas en alineamiento como STAR y HISAT2 con herramientas de pseudo-alineamiento como Salmon y kallisto, destacando compensaciones en velocidad, precisión, uso de recursos y salidas incluyendo archivos BAM y conteos a nivel transcrito o gen.
Cuándo elegir alineadores STAR o HISAT2Configurando índices de genoma y anotacionesUsando Salmon en modo quasi-mappingEjecutando kallisto para cuantificación rápidaComparando salidas BAM y quant.sf styleBenchmarking velocidad, memoria y precisión