Lekce 1Analýza diferenciální exprese: DESeq2, edgeR, limma-voom — design modelu, kontrasty a korekce vícenásobného testováníTato sekce detailně popisuje workflowy diferenciální exprese pomocí DESeq2, edgeR a limma-voom, s důrazem na design modelu, kontrasty, odhad disperze a korekci vícenásobného testování pro získání spolehlivých seznamů genů a odhadů velikosti efektu.
Návrh experimentálních modelů a kovariátůNastavení kontrastů pro komplexní porovnáníSpuštění end-to-end workflowu DESeq2Použití pipeline edgeR a limma-voomKorekce vícenásobného testování a kontrola FDRInterpretace log2 fold changes a shrinkageLekce 2Organizace dat a konvence pojmenování souborů: tabulky vzorků, oddělení surových/zpracovaných, konzistentní identifikátoryTato sekce popisuje nejlepší postupy pro organizaci souborů projektu RNA-seq, včetně tabulek vzorků, rozložení adresářů, oddělení surových versus zpracovaných dat a konzistentních identifikátorů, které zjednodušují skriptování, sledování a reprodukovatelnost.
Návrh jasné hierarchie adresářůOddělení surových a zpracovaných datVytváření robustních tabulek vzorků a metadatKonzistentní identifikátory vzorků a knihovenVerzování referenčních genomů a indexůZálohování a archivace dat projektuLekce 3Strategie kvantifikace na úrovni genů: featureCounts, htseq-count, tximport pro sumarizaci transkript-genTato sekce vysvětluje kvantifikaci na úrovni genů ze zarovnaných nebo pseudo-zarovnaných čtení, porovnává featureCounts a htseq-count a detailně popisuje, jak tximport agreguje odhady na úrovni transkriptů do robustních matic na úrovni genů pro následnou statistickou analýzu.
Počítání čtení s možnostmi featureCountsRežimy a anotace htseq-countZpracování strandedness a multimappingových čteníImport Salmon a kallisto s tximportBudování matic počtů na úrovni genůHodnocení kvality kvantifikace a pokrytíLekce 4Nástroje pro stahování a organizaci dat: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync a doporučené vstupy/výstupyTato sekce pokrývá spolehlivé strategie pro stahování a organizaci dat RNA-seq, s důrazem na SRA Toolkit, přístup ENA, nástroje přenosu příkazového řádku a definování konzistentních vstupních a výstupních struktur podporujících automatizaci a reprodukovatelnost.
Použití SRA Toolkit prefetch a fasterq-dumpPřístup ENA přes FTP a AsperaBezpečné stahování s wget a rsyncVýběr formátů surových a zpracovaných souborůDokumentace metadat stahování a checksumůAutomatizace stahování se skripty a logyLekce 5Nástroje kontroly kvality a výstupy: FastQC, MultiQC, klíčové metriky k prohlédnutí (kvalita na bázi, obsah adaptérů, duplikace, GC)Tato sekce se zaměřuje na kontrolu kvality RNA-seq pomocí FastQC a MultiQC k sumarizaci klíčových metrik jako kvalita na bázi, kontaminace adaptéry, duplikace a obsah GC a k rozhodnutí, zda je nutné ořezávání nebo resekvencování.
Spuštění FastQC na surových a ořezaných čteníchInterpretace profilů kvality na báziDetekce adaptérů a představovaných sekvencíHodnocení duplikace a obsahu GCAgregace zpráv s MultiQCDefinice QC prahů a akcíLekce 6Ořezávání a filtrování čtení: kdy ořezávat, nástroje (Trim Galore/Cutadapt/fastp), hlavní parametry a výstupyTato sekce vysvětluje, kdy a jak ořezávat čtení RNA-seq, pokrývá ořezávání adaptérů a kvality, filtrování délky a klíčové parametry v nástrojích jako Trim Galore, Cutadapt a fastp, přičemž se vyhýbá přeořezávání škodícímu následným analýzám.
Rozhodnutí, zda je ořezávání nutnéStrategie detekce a odstranění adaptérůPrahové hodnoty ořezávání na bázi kvalityMinimální délka a filtry složitostiMožnosti Trim Galore a CutadaptFastp pro integrovanou QC a ořezáváníLekce 7Základní následné analýzy: obohacení GO/KEGG (clusterProfiler), GSEA preranked, vizualizace cest a výběr genových sadTato sekce uvádí následné funkční analýzy po diferenciální exprese, včetně obohacení GO a KEGG s clusterProfiler, preranked GSEA, vizualizace cest a principálních strategií pro výběr a filtrování genových sad.
Příprava seřazených seznamů genů pro GSEAObohacení GO a KEGG s clusterProfilerVýběr vhodných databází genových sadVizualizace obohacených cest a sítíFiltrování a prioritizace genových sadReprodukovatelné reportování funkčních výsledkůLekce 8Vysokoúrovňové rozložení pipeline: stahování dat, QC, ořezávání, zarovnání/pseudo-zarovnání, kvantifikace, diferenciální exprese, následná analýzaTato sekce prezentuje celkovou strukturu pipeline RNA-seq, od získávání dat a QC přes ořezávání, zarovnání nebo pseudo-zarovnání, kvantifikaci, normalizaci, diferenciální expresi a následnou funkční analýzu, s důrazem na modulární, skriptované workflowy.
Definice fází pipeline a závislostíPlánování vstupů, výstupů a toku souborůIntegrace QC, ořezávání a zarovnáníPropojení kvantifikace s DE analýzouPropojení DE s workflowy obohaceníDokumentace pipeline diagramyLekce 9Normalizace a průzkumná analýza dat: limity TPM/FPKM, normalizace DESeq2, PCA, heatmapy vzdáleností mezi vzorkyTato sekce pokrývá normalizaci a průzkumnou analýzu dat RNA-seq, diskutuje limity TPM a FPKM, normalizaci založenou na DESeq2, stabilizaci variance, analýzu hlavních komponent a heatmapy vzdáleností vzorků pro detekci batchových efektů.
Limity metrik TPM a FPKMFaktory velikosti DESeq2 a normalizaceTransformace variance-stabilizující a rlogAnalýza hlavních komponent vzorkůHeatmapy vzdáleností mezi vzorkyDetekce batchových efektů a outlierůLekce 10Nejlepší postupy základní vizualizace: MA ploty, vulkanické ploty, heatmapy, bodové ploty cest a interaktivní možnosti reportů (R Markdown, Jupyter)Tato sekce uvádí efektivní strategie vizualizace výsledků RNA-seq, s důrazem na jasnou komunikaci diferenciální exprese, struktury vzorků a změn cest pomocí statických plotů a interaktivních, reprodukovatelných reportů vytvořených v R Markdown nebo Jupyter.
Konstrukce a interpretace MA plotůNávrh jasných vulkanických plotů pro DE genyBudování heatmapů publikační kvalityBodové ploty cest pro výsledky obohaceníInteraktivní RNA-seq reporty R MarkdownPrůzkumná vizualizace založená na JupyterLekce 11Zarovnání vs pseudo-zarovnání: STAR, HISAT2, Salmon, kallisto — kompromisy a výstupy (BAM, počty transkript/gen)Tato sekce porovnává nástroje založené na zarovnání jako STAR a HISAT2 s nástroji pseudo-zarovnání jako Salmon a kallisto, zdůrazňuje kompromisy v rychlosti, přesnosti, využití zdrojů a výstupech včetně BAM souborů a počtů na úrovni transkriptů nebo genů.
Kdy vybrat alignery STAR nebo HISAT2Konfigurace genomových indexů a anotacíPoužití Salmon v quasi-mapping móduSpuštění kallisto pro rychlou kvantifikaciPorovnání výstupů BAM a quant.sf styluBenchmarking rychlosti, paměti a přesnosti