Aralin 1Analysis ng differential expression: DESeq2, edgeR, limma-voom — disenyo ng model, contrasts, at multiple-testing correctionTinutukoy ng seksyong ito ang mga workflow ng differential expression gamit ang DESeq2, edgeR, at limma-voom, na nakatuon sa disenyo ng model, contrasts, dispersion estimation, at multiple-testing correction upang makakuha ng maaasahang listahan ng gene at sukat ng epekto.
Pagdidisenyo ng mga model ng eksperimento at covariatePagtakda ng contrasts para sa komplikadong paghahambingPaggawa ng DESeq2 end-to-end workflowPaggamit ng edgeR at limma-voom pipelinesMultiple-testing correction at FDR controlPag-interpret ng log2 fold changes at shrinkageAralin 2Pag-oorganisa ng data at mga konbensyon sa pag-name ng file: sample sheets, paghihiwalay ng raw/processed, consistent na identifierInilalarawan ng seksyong ito ang best practices para sa pag-oorganisa ng mga file ng proyekto ng RNA-seq, kabilang ang sample sheets, layout ng directory, paghihiwalay ng raw laban sa processed data, at consistent na identifier na nagpapasimple sa scripting, tracking, at reproducibility.
Pagdidisenyo ng malinaw na hierarchy ng directoryPaghihiwalay ng raw at processed dataPaggawa ng matibay na sample sheets at metadataConsistent na identifier ng sample at libraryPagve-version ng reference genomes at indicesPagba-backup at pag-arkibo ng data ng proyektoAralin 3Mga estratehiya sa gene-level quantification: featureCounts, htseq-count, tximport para sa transcript-to-gene summarizationIpapaliwanag ng seksyong ito ang gene-level quantification mula sa aligned o pseudo-aligned reads, na naghahambing ng featureCounts at htseq-count, at nagdidetalye kung paano nag-aaggregate ang tximport ng transcript-level estimates sa matibay na gene-level matrices para sa downstream statistical analysis.
Pagbibilang ng reads gamit ang featureCounts optionsPaggamit ng htseq-count modes at annotationsPaghawak ng strandedness at multimapping readsPag-import ng Salmon at kallisto gamit ang tximportPaggawa ng gene-level count matricesPagsusuri ng kalidad ng quantification at coverageAralin 4Mga tool para sa pag-download at pag-oorganisa ng data: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, at recommended inputs/outputsTinutakpan ng seksyong ito ang maaasahang estratehiya para sa pag-download at pag-oorganisa ng data ng RNA-seq, na nakatuon sa SRA Toolkit, access sa ENA, command-line transfer tools, at paglilinaw ng consistent na input at output structures na sumusuporta sa automation at reproducibility.
Paggamit ng SRA Toolkit prefetch at fasterq-dumpPag-access sa ENA sa pamamagitan ng FTP at AsperaPag-download gamit ang wget at rsync nang ligtasPagpili ng raw at processed file formatsPagdokumento ng metadata sa pag-download at checksumsPag-automate ng mga pag-download gamit ang scripts at logsAralin 5Mga tool at output sa quality control: FastQC, MultiQC, mga pangunahing metric na susuriin (per-base quality, adapter content, duplication, GC)Nakatuon ang seksyong ito sa quality control ng RNA-seq, gamit ang FastQC at MultiQC upang buod ang mga pangunahing metric tulad ng per-base quality, adapter contamination, duplication, at GC content, at magdesisyon kung kailangan ng trimming o resequencing.
Paggawa ng FastQC sa raw at trimmed readsPag-interpret ng per-base quality profilesPag-detect ng adapters at overrepresented sequencesPagsusuri ng duplication at GC contentPag-aggregate ng reports gamit ang MultiQCPaglilinaw ng mga threshold at aksyon sa QCAralin 6Read trimming at filtering: kailan mag-trim, mga tool (Trim Galore/Cutadapt/fastp), pangunahing parameters at outputsIpapaliwanag ng seksyong ito kung kailan at paano mag-trim ng reads ng RNA-seq, na tinutakpan ang adapter at quality trimming, length filtering, at mga pangunahing parameter sa mga tool tulad ng Trim Galore, Cutadapt, at fastp, habang iniiwasan ang over-trimming na sumisira sa downstream analyses.
Pagdedesisyon kung kinakailangan ang trimmingMga estratehiya sa adapter detection at removalQuality-based trimming thresholdsMinimum length at complexity filtersPaggamit ng Trim Galore at Cutadapt optionsFastp para sa integrated QC at trimmingAralin 7Basic downstream analyses: GO/KEGG enrichment (clusterProfiler), GSEA preranked, pathway visualization, at gene set selectionIpinapakilala ng seksyong ito ang downstream functional analyses pagkatapos ng differential expression, kabilang ang GO at KEGG enrichment gamit ang clusterProfiler, preranked GSEA, pathway visualization, at principled na estratehiya para sa pagpili at pag-filter ng gene sets.
Paghahanda ng ranked gene lists para sa GSEAGO at KEGG enrichment gamit ang clusterProfilerPagpili ng angkop na gene set databasesPag-visualize ng enriched pathways at networksPag-filter at pagbibigay prayoridad sa gene setsPag-report ng functional results nang reproducibleAralin 8High-level layout ng pipeline: data download, QC, trimming, alignment/pseudo-alignment, quantification, differential expression, downstream analysisIpapakita ng seksyong ito ang pangkalahatang istraktura ng pipeline ng RNA-seq, mula sa pagkuha ng data at QC sa pamamagitan ng trimming, alignment o pseudo-alignment, quantification, normalization, differential expression, at downstream functional analysis, na nagbibigay-diin sa modular, scripted workflows.
Paglilinaw ng mga yugto ng pipeline at dependenciesPagpaplano ng inputs, outputs, at file flowPag-integrate ng QC, trimming, at alignmentPag-link ng quantification sa DE analysisPagkonekta ng DE sa enrichment workflowsPagdokumento ng pipeline gamit ang diagramsAralin 9Normalization at exploratory data analysis: limitasyon ng TPM/FPKM, normalization ng DESeq2, PCA, sample-sample distance heatmapsTinutakpan ng seksyong ito ang normalization at exploratory analysis ng data ng RNA-seq, na talakayin ang mga limitasyon ng TPM at FPKM, normalization batay sa DESeq2, variance stabilization, principal component analysis, at sample distance heatmaps para sa pag-detect ng batch effects.
Mga limitasyon ng sukat ng TPM at FPKMSize factors at normalization ng DESeq2Variance-stabilizing at rlog transformsPrincipal component analysis ng samplesSample-sample distance heatmapsPag-detect ng batch effects at outliersAralin 10Basic best practices sa visualization: MA plots, volcano plots, heatmaps, pathway dotplots, at interactive report options (R Markdown, Jupyter)Ipinapakilala ng seksyong ito ang epektibong estratehiya sa visualization para sa mga resulta ng RNA-seq, na nagbibigay-diin sa malinaw na komunikasyon ng differential expression, istraktura ng sample, at mga pagbabago sa pathway gamit ang static plots at interactive, reproducible reports na binuo sa R Markdown o Jupyter.
Paggawa at pag-interpret ng MA plotsPagdidisenyo ng malinaw na volcano plots para sa DE genesPaggawa ng publication-quality heatmapsPathway dotplots para sa enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationAralin 11Alignment laban sa pseudo-alignment: STAR, HISAT2, Salmon, kallisto — tradeoffs at outputs (BAM, transcript/genecounts)Naghahambing ang seksyong ito ng mga tool batay sa alignment tulad ng STAR at HISAT2 sa mga tool ng pseudo-alignment tulad ng Salmon at kallisto, na nagbibigay-diin sa mga trade-off sa bilis, katumpakan, paggamit ng resource, at outputs kabilang ang BAM files at transcript o gene-level counts.
Kailan pipiliin ang STAR o HISAT2 alignersPag-configure ng genome indexes at annotationsPaggamit ng Salmon sa quasi-mapping modePaggawa ng kallisto para sa mabilis na quantificationPaghahambing ng BAM at quant.sf style outputsPag-benchmark ng bilis, memory, at katumpakan