1. leckeDifferenciális expresszió elemzés: DESeq2, edgeR, limma-voom — modellterv, kontrasztok és többszörös-tesztelési korrekcióEz a rész részletezi a DESeq2, edgeR és limma-voom differenciális expresszió munkafolyamatokat, fókuszálva a modelltervre, kontrasztokra, diszperzió becslésre és többszörös-tesztelési korrekcióra megbízható génlisták és effektusméret becslések megszerzéséhez.
Kísérleti modellek és kovariánsok tervezéseKomplex összehasonlításokhoz kontrasztok beállításaDESeq2 végpontok közötti munkafolyamat futtatásaedgeR és limma-voom pipeline-ok használataTöbbszörös-tesztelési korrekció és FDR kontrolllog2 fold változások és zsugorítás értelmezése2. leckeAdatszervezés és fájlelnevezési konvenciók: mintalapok, nyers/feldolgozott szeparáció, konzisztens azonosítókEz a rész leírja a RNA-seq projektfájlok legjobb gyakorlatait, beleértve mintalapokat, könyvtár elrendezéseket, nyers vs feldolgozott adat szeparációt és konzisztens azonosítókat, amelyek egyszerűsítik a szkriptelést, követést és reprodukálhatóságot.
Tiszta könyvtárhierarchia tervezéseNyers és feldolgozott adatok szeparációjaRobusztus mintalapok és metaadatok létrehozásaKonzisztens minta és könyvtár azonosítókReferencia genomok és indexek verziózásaProjektadatok biztonsági mentése és archiválása3. leckeGén-szintű kvantifikációs stratégiák: featureCounts, htseq-count, tximport transzkript-gén összefoglaláshozEz a rész elmagyarázza a gén-szintű kvantifikációt illesztett vagy pszeudo-illeszett olvasásokból, összehasonlítva featureCounts és htseq-count-ot, és részletezi, hogyan aggregálja tximport a transzkript-szintű becsléseket robusztus gén-szintű mátrixokba downstream statisztikai elemzéshez.
Olvasások számlálása featureCounts opciókkalhtseq-count módok és annotációk használataSzálirányosság és multimapping olvasások kezeléseSalmon és kallisto importálása tximport-talGén-szintű számlamátrixok építéseKvantifikáció minőség és fedettség értékelése4. leckeEszközök adatletöltéshez és szervezéshez: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync és ajánlott bemenetek/kimenetekEz a rész megbízható stratégiákat tárgyal RNA-seq adatok letöltésére és szervezésére, fókuszálva SRA Toolkit-re, ENA hozzáférésre, parancssori átviteli eszközökre és konzisztens bemeneti kimeneti struktúrák definíciójára az automatizálás és reprodukálhatóság támogatására.
SRA Toolkit prefetch és fasterq-dump használataENA hozzáférés FTP és Aspera segítségévelBiztonságos letöltés wget és rsync-kelNyers és feldolgozott fájlformátumok kiválasztásaLetöltési metaadatok és ellenőrzőösszegek dokumentálásaLetöltések automatizálása szkriptekkel és naplókkal5. leckeMinőségellenőrzési eszközök és kimenetek: FastQC, MultiQC, kulcs metrikák vizsgálata (bázis-szerinti minőség, adapter tartalom, duplikáció, GC)Ez a rész az RNA-seq minőségellenőrzésre fókuszál, FastQC és MultiQC használatával kulcs metrikák összefoglalására, mint bázis-szerinti minőség, adapter szennyeződés, duplikáció és GC tartalom, eldöntve, szükséges-e vágás vagy újraszekvenálás.
FastQC futtatása nyers és vágott olvasásokonBázis-szerinti minőségprofilok értelmezéseAdapterek és túprezentált szekvenciák detektálásaDuplikáció és GC tartalom értékeléseJelentések aggregálása MultiQC-velQC küszöbök és akciók definíciója6. leckeOlvasásvágás és szűrés: mikor kell vágni, eszközök (Trim Galore/Cutadapt/fastp), fő paraméterek és kimenetekEz a rész elmagyarázza, mikor és hogyan kell RNA-seq olvasásokat vágni, adapter és minőségvágást, hosszszűrést fedve, kulcs paraméterekkel Trim Galore, Cutadapt és fastp eszközökben, miközben elkerülve a túlvágást, ami károsítja a downstream elemzéseket.
Vágás szükségességének eldöntéseAdapter detektálás és eltávolítás stratégiáiMinőség alapú vágási küszöbökMinimális hossz és komplexitás szűrőkTrim Galore és Cutadapt opciók használataFastp integrált QC és vágáshoz7. leckeAlapvető downstream elemzések: GO/KEGG dúsulás (clusterProfiler), GSEA előre rangsorolt, út vizualizáció és génkészlet kiválasztásEz a rész bemutatja a differenciális expresszió utáni downstream funkcionális elemzéseket, beleértve GO és KEGG dúsulást clusterProfiler-rel, előre rangsorolt GSEA-t, út vizualizációt és elvi stratégiákat génkészletek kiválasztására és szűrésére.
Rangsorolt génlisták előkészítése GSEA-hezGO és KEGG dúsulás clusterProfiler-relMegfelelő génkészlet adatbázisok kiválasztásaDúsult utak és hálózatok vizualizálásaGénkészletek szűrése és priorizálásaFunkcionális eredmények reprodukálható jelentése8. leckeMagas-szintű pipeline elrendezés: adatletöltés, QC, vágás, illesztés/pszeudo-illeszés, kvantifikáció, differenciális expresszió, downstream elemzésEz a rész bemutatja az általános RNA-seq pipeline struktúrát, adatbeszerzéstől és QC-től vágáson, illesztésen vagy pszeudo-illeszésen, kvantifikáción, normalizáción, differenciális expresszión és downstream funkcionális elemzésen át, hangsúlyozva moduláris, szkriptelt munkafolyamatokat.
Pipeline szakaszok és függőségek definíciójaBemenetek, kimenetek és fájlflow tervezéseQC, vágás és illesztés integrálásaKvantifikáció DE elemzéshez kapcsolásaDE dúsulási munkafolyamatokhoz kapcsolásaPipeline dokumentálása diagramokkal9. leckeNormalizáció és exploratív adat elemzés: TPM/FPKM korlátok, DESeq2 normalizáció, PCA, minta-minta távolság heatmapekEz a rész a RNA-seq adatok normalizációját és exploratív elemzését fedi le, megvitatva TPM és FPKM korlátait, DESeq2-alapú normalizációt, variancia stabilizációt, főkomponens elemzést és minta távolság heatmapeket tételhatások detektálására.
TPM és FPKM mérések korlátaiDESeq2 méretfaktorok és normalizációVariancia-stabilizáló és rlog transzformációkMinták főkomponens elemzéseMinta-minta távolság heatmapekTételhatások és kiugrók detektálása10. leckeAlapvető vizualizációs legjobb gyakorlatok: MA plotok, vulkán plotok, heatmapek, út dotplotok és interaktív jelentés opciók (R Markdown, Jupyter)Ez a rész hatékony vizualizációs stratégiákat mutat be RNA-seq eredményekhez, hangsúlyozva a differenciális expresszió, minta struktúra és út változások tiszta kommunikációját statikus plotokkal és interaktív, reprodukálható jelentésekkel R Markdown vagy Jupyter használatával.
MA plotok felépítése és értelmezéseTiszta vulkán plotok tervezése DE génekhezPublikáció-minőségű heatmapek építéseÚt dotplotok dúsulási eredményekhezInteraktív R Markdown RNA-seq jelentésekJupyter-alapú exploratív vizualizáció11. leckeIllesztés vs pszeudo-illeszés: STAR, HISAT2, Salmon, kallisto — kompromisszumok és kimenetek (BAM, transzkript/génszámlák)Ez a rész összehasonlítja az illesztés-alapú eszközöket mint STAR és HISAT2 pszeudo-illeszés eszközökkel mint Salmon és kallisto, kiemelve kompromisszumokat sebességben, pontosságban, erőforrás használatban és kimenetekben beleértve BAM fájlokat és transzkript vagy gén-szintű számlákat.
STAR vagy HISAT2 illesztők kiválasztásának időpontjaGenom indexek és annotációk konfigurálásaSalmon quasi-mapping mód használataKallisto futtatása gyors kvantifikációraBAM és quant.sf stílusú kimenetek összehasonlításaSebesség, memória és pontosság benchmarkolása