Lektion 1Differentieringsuttrycksanalys: DESeq2, edgeR, limma-voom — moddesign, kontraster och multipeltestkorrigeringDenna sektion detaljerar differentieringsuttrycksarbetsflöden med DESeq2, edgeR och limma-voom, med fokus på moddesign, kontraster, dispersionsuppskattning och multipeltestkorrigering för att erhålla pålitliga genlistor och effektstorleksskattningar.
Designa experimentella modeller och kovariaterStälla in kontraster för komplexa jämförelserKöra DESeq2 ända till slut arbetsflödeAnvända edgeR och limma-voom pipelinesMultipeltestkorrigering och FDR-kontrollTolka log2-faldändringar och krympningLektion 2Dataorganisering och filnamngivningskonventioner: provblad, rå/processad separation, konsekventa identifierareDenna sektion beskriver bästa praxis för att organisera RNA-sekvenseringsprojektfiler, inklusive provblad, katalogstrukturer, separation av rå kontra processad data och konsekventa identifierare som förenklar skriptning, spårning och reproducerbarhet.
Designa en klar kataloghierarkiSeparera rå och processad dataSkapa robusta provblad och metadataKonsekventa prov- och bibliotekidentifierareVersionshantering av referensgenomer och indexSäkerhetskopiering och arkivering av projekt dataLektion 3Gen-nivå kvantifieringsstrategier: featureCounts, htseq-count, tximport för transkript-till-gen sammanfattningDenna sektion förklarar gen-nivå kvantifiering från justerade eller pseudo-justerade läsningar, jämför featureCounts och htseq-count, och detaljerar hur tximport aggregerar transkript-nivå uppskattningar till robusta gen-nivå matriser för nedströms statistisk analys.
Räkna läsningar med featureCounts alternativAnvända htseq-count lägen och annotationerHantera strandning och multimappande läsningarImportera Salmon och kallisto med tximportBygga gen-nivå räkningmatriserBedöma kvantifieringskvalitet och täckningLektion 4Verktyg för datanedladdning och organisering: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync och rekommenderade in/utdataDenna sektion täcker pålitliga strategier för att ladda ner och organisera RNA-sekvenseringsdata, med fokus på SRA Toolkit, ENA-tillgång, kommandoradsöverföringsverktyg och definiering av konsekventa indata- och utdatastrukturer som stödjer automatisering och reproducerbarhet.
Använda SRA Toolkit prefetch och fasterq-dumpTillgå ENA via FTP och AsperaLadda ner med wget och rsync säkertVälja rå och processade filformatDokumentera nedladdningsmetadata och kontrollsummorAutomatisera nedladdningar med skript och loggarLektion 5Kvalitetskontrollverktyg och utdata: FastQC, MultiQC, nyckelmått att inspektera (per-bas kvalitet, adapterinnehåll, duplikation, GC)Denna sektion fokuserar på RNA-sekvenseringskvalitetskontroll, med FastQC och MultiQC för att sammanfatta nyckelmått såsom per-bas kvalitet, adapterkontaminering, duplikation och GC-innehåll, och besluta om trimmning eller omsekvensering krävs.
Köra FastQC på råa och trimmade läsningarTolka per-bas kvalitetsprofilerUpptäcka adaptrar och överrepresenterade sekvenserUtvärdera duplikation och GC-innehållAggregera rapporter med MultiQCDefiniera QC-trösklar och åtgärderLektion 6Läs-trimmning och filtrering: när trimma, verktyg (Trim Galore/Cutadapt/fastp), huvudparametrar och utdataDenna sektion förklarar när och hur man trimmar RNA-sekvenseringsläsningar, täcker adapter- och kvalitets trimmning, längdfiltrering och nyckelparametrar i verktyg som Trim Galore, Cutadapt och fastp, samtidigt som man undviker övertrimmning som skadar nedströmsanalyser.
Besluta om trimmning är nödvändigAdapterdetektering och borttagningsstrategierKvalitetsbaserade trimmningströsklarMinimilängd och komplexitetsfilterAnvända Trim Galore och Cutadapt alternativFastp för integrerad QC och trimmningLektion 7Grundläggande nedströmsanalyser: GO/KEGG-berikning (clusterProfiler), GSEA förberäknad, vägvisualisering och genuppsättningvalDenna sektion introducerar nedströms funktionella analyser efter differentieringsuttryck, inklusive GO och KEGG-berikning med clusterProfiler, förberäknad GSEA, vägvisualisering och principerade strategier för att välja och filtrera genuppsättningar.
Förbereda rankade genlistor för GSEAGO och KEGG-berikning med clusterProfilerVälja lämpliga genuppsättningsdatabaserVisualisera berikade vägar och nätverkFiltrera och prioritera genuppsättningarRapportera funktionella resultat reproducerbartLektion 8Högnivå pipeline-layout: datanedladdning, QC, trimmning, justering/pseudo-justering, kvantifiering, differentieringsuttryck, nedströmsanalysDenna sektion presenterar den övergripande RNA-sekvenseringspipelinen struktur, från dataförvärv och QC genom trimmning, justering eller pseudo-justering, kvantifiering, normalisering, differentieringsuttryck och nedströms funktionell analys, med betoning på modulära, skriptade arbetsflöden.
Definiera pipelinestadier och beroendenPlanera inmatningar, utdata och filflödeIntegrera QC, trimmning och justeringLänka kvantifiering till DE-analysKoppla DE till berikningsarbetsflödenDokumentera pipelinen med diagramLektion 9Normalisering och explorativ dataanalys: TPM/FPKM-begränsningar, DESeq2-normalisering, PCA, prov-prov avstånd värmekartorDenna sektion täcker normalisering och explorativ analys av RNA-sekvenseringsdata, diskuterar begränsningar av TPM och FPKM, DESeq2-baserad normalisering, variansstabilisering, huvudkomponentanalys och provavståndsvärmekartor för att detektera batch-effekter.
Begränsningar av TPM och FPKM-måttDESeq2 storleksfaktorer och normaliseringVariansstabiliserande och rlog-transformerHuvudkomponentanalys av proverProv-prov avståndsvärmekartorDetektera batch-effekter och avvikareLektion 10Grundläggande visualiseringsbästa praxis: MA-plotter, vulkanplotter, värmekartor, vägprickplotter och interaktiva rapportalternativ (R Markdown, Jupyter)Denna sektion introducerar effektiva visualiseringsstrategier för RNA-sekvenseringsresultat, med betoning på klar kommunikation av differentieringsuttryck, provstruktur och vägförändringar med statiska plotter och interaktiva, reproducerbara rapporter byggda i R Markdown eller Jupyter.
Konstruera och tolka MA-plotterDesigna klara vulkanplotter för DE-generBygga publikationskvalitets värmekartorVägprickplotter för berikningsresultatInteraktiva R Markdown RNA-sekvenseringsrapporterJupyter-baserad explorativ visualiseringLektion 11Justering vs pseudo-justering: STAR, HISAT2, Salmon, kallisto — avvägningar och utdata (BAM, transkript/genräkningar)Denna sektion jämför justeringsbaserade verktyg som STAR och HISAT2 med pseudo-justeringsverktyg som Salmon och kallisto, belyser avvägningar i hastighet, noggrannhet, resursanvändning och utdata inklusive BAM-filer och transkript- eller gen-nivå räkningar.
När välja STAR eller HISAT2 justerareKonfigurera genomonindex och annotationerAnvända Salmon i quasi-mappningslägeKöra kallisto för snabb kvantifieringJämföra BAM och quant.sf-stil utdataBenchmarking hastighet, minne och noggrannhet