Lezione 1Analisi espressione differenziale: DESeq2, edgeR, limma-voom — design modello, contrasti e correzione test multipliQuesta sezione dettagli workflow espressione differenziale usando DESeq2, edgeR e limma-voom, focalizzandosi su design modello, contrasti, stima dispersione e correzione test multipli per ottenere liste geni affidabili e stime dimensioni effetto.
Progettazione modelli sperimentali e covariateImpostazione contrasti per confronti complessiEsecuzione workflow DESeq2 end-to-endUso pipeline edgeR e limma-voomCorrezione test multipli e controllo FDRInterpretazione log2 fold changes e shrinkageLezione 2Organizzazione dati e convenzioni naming file: fogli campioni, separazione raw/processati, identificatori consistentiQuesta sezione descrive best practice per organizzare file progetto RNA-seq, inclusi fogli campioni, layout directory, separazione dati raw versus processati e identificatori consistenti che semplificano scripting, tracciamento e riproducibilità.
Progettazione gerarchia directory chiaraSeparazione dati raw e processatiCreazione fogli campioni e metadati robustiIdentificatori campione e libreria consistentiVersioning genomi riferimento e indiciBackup e archiviazione dati progettoLezione 3Strategie quantificazione gene-level: featureCounts, htseq-count, tximport per summarizzazione transcript-to-geneQuesta sezione spiega quantificazione gene-level da read allineati o pseudo-allineati, confrontando featureCounts e htseq-count, e dettagliando come tximport aggrega stime transcript-level in matrici gene-level robuste per analisi statistiche downstream.
Conteggio read con opzioni featureCountsUso modalità e annotazioni htseq-countGestione strandedness e read multimappantiImport Salmon e kallisto con tximportCostruzione matrici conteggi gene-levelValutazione qualità quantificazione e coperturaLezione 4Strumenti download e organizzazione dati: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync e input/output raccomandatiQuesta sezione copre strategie affidabili per download e organizzazione dati RNA-seq, focalizzandosi su SRA Toolkit, accesso ENA, tool transfer command-line e definizione strutture input/output consistenti che supportano automazione e riproducibilità.
Uso SRA Toolkit prefetch e fasterq-dumpAccesso ENA via FTP e AsperaDownload sicuro con wget e rsyncScelta formati file raw e processatiDocumentazione metadati download e checksumAutomazione download con script e logLezione 5Strumenti controllo qualità e output: FastQC, MultiQC, metriche chiave da ispezionare (qualità per-base, contenuto adapter, duplicazione, GC)Questa sezione si focalizza su controllo qualità RNA-seq, usando FastQC e MultiQC per riassumere metriche chiave come qualità per-base, contaminazione adapter, duplicazione e contenuto GC, e decidere se trimming o resequenziamento è richiesto.
Esecuzione FastQC su read raw e trimmatiInterpretazione profili qualità per-baseRilevamento adapter e sequenze overrepresentedValutazione duplicazione e contenuto GCAggregazione report con MultiQCDefinizione soglie QC e azioniLezione 6Trimming e filtraggio read: quando trimmare, strumenti (Trim Galore/Cutadapt/fastp), parametri principali e outputQuesta sezione spiega quando e come trimmare read RNA-seq, coprendo trimming adapter e qualità, filtraggio lunghezza, e parametri chiave in tool come Trim Galore, Cutadapt e fastp, evitando over-trimming che danneggia analisi downstream.
Decisione se trimming è necessarioStrategie rilevamento e rimozione adapterSoglie trimming basate su qualitàFiltri lunghezza minima e complessitàUso opzioni Trim Galore e CutadaptFastp per QC e trimming integratoLezione 7Analisi downstream base: arricchimento GO/KEGG (clusterProfiler), GSEA preranked, visualizzazione pathway e selezione gene setQuesta sezione introduce analisi funzionali downstream dopo espressione differenziale, inclusi arricchimento GO e KEGG con clusterProfiler, GSEA preranked, visualizzazione pathway e strategie principled per selezionare e filtrare gene set.
Preparazione liste geni ranked per GSEAArricchimento GO e KEGG con clusterProfilerScelta database gene set appropriatiVisualizzazione pathway e reti arricchitiFiltraggio e prioritizzazione gene setReport risultati funzionali riproducibiliLezione 8Layout pipeline high-level: download dati, QC, trimming, allineamento/pseudo-allineamento, quantificazione, espressione differenziale, analisi downstreamQuesta sezione presenta struttura generale pipeline RNA-seq, da acquisizione dati e QC attraverso trimming, allineamento o pseudo-allineamento, quantificazione, normalizzazione, espressione differenziale e analisi funzionale downstream, enfatizzando workflow modulari e scripted.
Definizione stadi pipeline e dipendenzePianificazione input, output e flusso fileIntegrazione QC, trimming e allineamentoCollegamento quantificazione ad analisi DEConnessione DE a workflow arricchimentoDocumentazione pipeline con diagrammiLezione 9Normalizzazione e analisi dati esplorativa: limiti TPM/FPKM, normalizzazione DESeq2, PCA, heatmap distanze campione-campioneQuesta sezione copre normalizzazione e analisi esplorativa dati RNA-seq, discutendo limiti TPM e FPKM, normalizzazione DESeq2-based, stabilizzazione varianza, analisi componenti principali e heatmap distanze campione per rilevare effetti batch.
Limitazioni misure TPM e FPKMFattori size DESeq2 e normalizzazioneTrasformate variance-stabilizing e rlogAnalisi componenti principali campioniHeatmap distanze campione-campioneRilevamento effetti batch e outlierLezione 10Best practice visualizzazione base: grafici MA, volcano plot, heatmap, dotplot pathway e opzioni report interattivi (R Markdown, Jupyter)Questa sezione introduce strategie visualizzazione efficaci per risultati RNA-seq, enfatizzando comunicazione chiara espressione differenziale, struttura campione e cambiamenti pathway usando plot statici e report interattivi riproducibili in R Markdown o Jupyter.
Costruzione e interpretazione grafici MAProgettazione volcano plot chiari per geni DECostruzione heatmap qualità pubblicazioneDotplot pathway per risultati arricchimentoReport RNA-seq interattivi R MarkdownVisualizzazione esplorativa basata JupyterLezione 11Allineamento vs pseudo-allineamento: STAR, HISAT2, Salmon, kallisto — tradeoff e output (BAM, conteggi transcript/gene)Questa sezione confronta tool alignment-based come STAR e HISAT2 con tool pseudo-alignment come Salmon e kallisto, evidenziando tradeoff in velocità, accuratezza, uso risorse e output inclusi file BAM e conteggi transcript o gene-level.
Quando scegliere aligner STAR o HISAT2Configurazione indici genoma e annotazioniUso Salmon in modalità quasi-mappingEsecuzione kallisto per quantificazione rapidaConfronto output BAM e quant.sf styleBenchmark velocità, memoria e accuratezza