పాఠం 1డిఫరెన్షియల్ ఎక్స్ప్రెషన్ విశ్లేషణ: DESeq2, edgeR, limma-voom — మోడల్ డిజైన్, కాంట్రాస్ట్లు, మల్టిపుల్-టెస్టింగ్ కరెక్షన్DESeq2, edgeR, limma-voom ఉపయోగించి డిఫరెన్షియల్ ఎక్స్ప్రెషన్ వర్క్ఫ్లోల వివరాలు, మోడల్ డిజైన్, కాంట్రాస్ట్లు, డిస్పర్షన్ అంచనా, మల్టిపుల్-టెస్టింగ్ కరెక్షన్పై దృష్టి పెట్టి, విశ్వసనీయ జీన్ లిస్ట్లు మరియు ఎఫెక్ట్ సైజ్ అంచనాలను పొందడం.
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageపాఠం 2డేటా ఆర్గనైజేషన్ మరియు ఫైల్ నేమింగ్ కన్వెన్షన్లు: సామ్పుల్ షీట్లు, రా/ప్రాసెస్డ్ సెపరేషన్, కన్సిస్టెంట్ ఐడెంటిఫైర్లుRNA-seq ప్రాజెక్ట్ ఫైల్స్ను ఆర్గనైజ్ చేయడానికి బెస్ట్ ప్రాక్టీస్లను వివరిస్తుంది, సామ్పుల్ షీట్లు, డైరెక్టరీ లేఅవుట్లు, రా vs ప్రాసెస్డ్ డేటా సెపరేషన్, స్క్రిప్టింగ్, ట్రాకింగ్, పునరావృతత్వాన్ని సరళీకరించే కన్సిస్టెంట్ ఐడెంటిఫైర్లతో సహా.
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataపాఠం 3జీన్-లెవెల్ క్వాంటిఫికేషన్ వ్యూహాలు: featureCounts, htseq-count, tximport ట్రాన్స్క్రిప్ట్-టు-జీన్ సమరైజేషన్ కోసంఅలైన్డ్ లేదా పసిడో-అలైన్డ్ రీడ్ల నుండి జీన్-లెవెల్ క్వాంటిఫికేషన్ను వివరిస్తుంది, featureCounts మరియు htseq-countను పోల్చి, tximport ట్రాన్స్క్రిప్ట్-లెవెల్ అంచనాలను బలమైన జీన్-లెవెల్ మ్యాట్రిక్స్లుగా ఏకీకృతం చేస్తుంది, డౌన్స్ట్రీమ్ గణాంక విశ్లేషణ కోసం.
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageపాఠం 4డేటా డౌన్లోడ్ మరియు ఆర్గనైజేషన్ కోసం టూల్స్: SRA టూల్కిట్ (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, రికమెండెడ్ ఇన్పుట్లు/అవుట్పుట్లుRNA-seq డేటాను డౌన్లోడ్ చేయడం మరియు ఆర్గనైజ్ చేయడానికి విశ్వసనీయ వ్యూహాలను కవర్ చేస్తుంది, SRA టూల్కిట్, ENA యాక్సెస్, కమాండ్-లైన్ ట్రాన్స్ఫర్ టూల్స్, ఆటోమేషన్ మరియు పునరావృతత్వాన్ని సపోర్ట్ చేసే కన్సిస్టెంట్ ఇన్పుట్ మరియు అవుట్పుట్ నిర్మాణాలపై దృష్టి పెట్టి.
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsపాఠం 5క్వాలిటీ కంట్రోల్ టూల్స్ మరియు అవుట్పుట్లు: FastQC, MultiQC, చెక్ చేయాల్సిన కీలక మెట్రిక్లు (పెర్-బేస్ నాణ్యత, అడాప్టర్ కంటెంట్, డూప్లికేషన్, GC)RNA-seq క్వాలిటీ కంట్రోల్పై దృష్టి పెడుతుంది, FastQC మరియు MultiQCను ఉపయోగించి పెర్-బేస్ నాణ్యత, అడాప్టర్ కంటామినేషన్, డూప్లికేషన్, GC కంటెంట్ వంటి కీలక మెట్రిక్లను సమరైజ్ చేసి, ట్రిమ్మింగ్ లేదా రీసీక్వెన్సింగ్ అవసరమో లేదో నిర్ణయించడం.
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsపాఠం 6రీడ్ ట్రిమ్మింగ్ మరియు ఫిల్టరింగ్: ట్రిమ్ చేయాల్సినప్పుడు, టూల్స్ (Trim Galore/Cutadapt/fastp), ప్రధాన పారామీటర్లు మరియు అవుట్పుట్లుRNA-seq రీడ్లను ట్రిమ్ చేయాల్సినప్పుడు మరియు ఎలా చేయాలో వివరిస్తుంది, అడాప్టర్ మరియు నాణ్యత ట్రిమ్మింగ్, లెంగ్త్ ఫిల్టరింగ్, Trim Galore, Cutadapt, fastp వంటి టూల్స్లో కీలక పారామీటర్లు కవర్ చేస్తూ, డౌన్స్ట్రీమ్ విశ్లేషణలకు హాని చేసే ఓవర్-ట్రిమ్మింగ్ను నివారిస్తూ.
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingపాఠం 7ప్రాథమిక డౌన్స్ట్రీమ్ విశ్లేషణలు: GO/KEGG ఎన్రిచ్మెంట్ (clusterProfiler), GSEA ప్రీర్యాంక్డ్, పాత్వే విజువలైజేషన్, జీన్ సెట్ ఎంపికడిఫరెన్షియల్ ఎక్స్ప్రెషన్ తర్వాత డౌన్స్ట్రీమ్ ఫంక్షనల్ విశ్లేషణలను పరిచయం చేస్తుంది, clusterProfilerతో GO మరియు KEGG ఎన్రిచ్మెంట్, ప్రీర్యాంక్డ్ GSEA, పాత్వే విజువలైజేషన్, జీన్ సెట్లను ఎంచుకోవడానికి మరియు ఫిల్టర్ చేయడానికి సూత్రాలతో సహా.
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyపాఠం 8హై-లెవెల్ పైప్లైన్ లేఅవుట్: డేటా డౌన్లోడ్, QC, ట్రిమ్మింగ్, అలైన్మెంట్/పసిడో-అలైన్మెంట్, క్వాంటిఫికేషన్, డిఫరెన్షియల్ ఎక్స్ప్రెషన్, డౌన్స్ట్రీమ్ విశ్లేషణడేటా అక్విజిషన్ మరియు QC నుండి ట్రిమ్మింగ్, అలైన్మెంట్ లేదా పసిడో-అలైన్మెంట్, క్వాంటిఫికేషన్, నార్మలైజేషన్, డిఫరెన్షియల్ ఎక్స్ప్రెషన్, డౌన్స్ట్రీమ్ ఫంక్షనల్ విశ్లేషణ వరకు మొత్తం RNA-seq పైప్లైన్ నిర్మాణాన్ని ప్రదర్శిస్తుంది, మాడ్యులర్, స్క్రిప్టెడ్ వర్క్ఫ్లోలపై ఒత్తిడి ఇస్తూ.
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsపాఠం 9నార్మలైజేషన్ మరియు ఎక్స్ప్లోరేటరీ డేటా విశ్లేషణ: TPM/FPKM లిమిట్లు, DESeq2 నార్మలైజేషన్, PCA, సామ్పుల్-సామ్పుల్ డిస్టెన్స్ హీట్మ్యాప్లుRNA-seq డేటా నార్మలైజేషన్ మరియు ఎక్స్ప్లోరేటరీ విశ్లేషణను కవర్ చేస్తుంది, TPM మరియు FPKM లిమిటేషన్లు, DESeq2 ఆధారిత నార్మలైజేషన్, వేరియన్స్ స్టెబిలైజేషన్, ప్రిన్సిపల్ కాంపోనెంట్ విశ్లేషణ, సామ్పుల్ డిస్టెన్స్ హీట్మ్యాప్లను చర్చిస్తూ, బ్యాచ్ ఎఫెక్ట్లను డిటెక్ట్ చేయడానికి.
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersపాఠం 10ప్రాథమిక విజువలైజేషన్ బెస్ట్ ప్రాక్టీస్లు: MA ప్లాట్లు, వోల్కానో ప్లాట్లు, హీట్మ్యాప్లు, పాత్వే డాట్ప్లాట్లు, ఇంటరాక్టివ్ రిపోర్ట్ ఆప్షన్లు (R Markdown, Jupyter)RNA-seq ఫలితాల కోసం ప్రభావవంతమైన విజువలైజేషన్ వ్యూహాలను పరిచయం చేస్తుంది, డిఫరెన్షియల్ ఎక్స్ప్రెషన్, సామ్పుల్ నిర్మాణం, పాత్వే మార్పులను స్పష్టంగా కమ్యూనికేట్ చేయడంపై ఒత్తిడి ఇస్తూ, R Markdown లేదా Jupyterలో బిల్ట్ చేసిన స్టాటిక్ ప్లాట్లు మరియు ఇంటరాక్టివ్, పునరావృతమైన రిపోర్ట్లను ఉపయోగించి.
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationపాఠం 11అలైన్మెంట్ vs పసిడో-అలైన్మెంట్: STAR, HISAT2, Salmon, kallisto — ట్రేడాఫ్లు మరియు అవుట్పుట్లు (BAM, ట్రాన్స్క్రిప్ట్/జీన్కౌంట్లు)STAR మరియు HISAT2 వంటి అలైన్మెంట్-ఆధారిత టూల్స్ను Salmon మరియు kallisto వంటి పసిడో-అలైన్మెంట్ టూల్స్తో పోల్చి, స్పీడ్, ఖచ్చితత్వం, వనరు ఉపయోగం, BAM ఫైల్స్ మరియు ట్రాన్స్క్రిప్ట్ లేదా జీన్-లెవెల్ కౌంట్లతో సహా అవుట్పుట్లలో ట్రేడాఫ్లను హైలైట్ చేస్తుంది.
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy