पाठ 1भिन्न अभिव्यक्ती विश्लेषण: DESeq2, edgeR, limma-voom — मॉडेल डिझाइन, कॉन्ट्रास्ट्स, आणि बहुपरीक्षण सुधारणाDESeq2, edgeR, आणि limma-voom वापरून भिन्न अभिव्यक्ती वर्कफ्लोजची तपशीलवार माहिती, मॉडेल डिझाइन, कॉन्ट्रास्ट्स, डिस्पर्शन अंदाज, आणि बहुपरीक्षण सुधारणेवर लक्ष केंद्रित करत, विश्वसनीय जीन यादी आणि प्रभाव आकार अंदाज मिळवण्यासाठी.
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageपाठ 2डेटा संघटना आणि फाइल नावकरण परंपरा: नमुना शीट्स, कच्चे/प्रोसेस्ड वेगळे करणे, सुसंगत ओळखदातेRNA-seq प्रकल्प फाइल्स संघटित करण्यासाठी सर्वोत्तम पद्धतींचे वर्णन, नमुना शीट्स, डिरेक्टरी लेआउट्स, कच्चे विरुद्ध प्रोसेस्ड डेटा वेगळे करणे, आणि स्क्रिप्टिंग, ट्रॅकिंग, आणि पुनरुत्पादन सुलभ करणारे सुसंगत ओळखदाते यांचा समावेश.
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataपाठ 3जीन-स्तरीय क्वांटिफिकेशन धोरणे: featureCounts, htseq-count, tximport ट्रान्सक्रिप्ट-टू-जीन सारांशासाठीअलाइन केलेल्या किंवा प्सूडो-अलाइन केलेल्या वाचनांमधून जीन-स्तरीय क्वांटिफिकेशन स्पष्ट करते, featureCounts आणि htseq-count ची तुलना करते, आणि tximport कसा ट्रान्सक्रिप्ट-स्तरीय अंदाजांना मजबूत जीन-स्तरीय मॅट्रिक्समध्ये एकत्रित करतो याचे तपशील देते.
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageपाठ 4डेटा डाउनलोड आणि संघटनेसाठी साधने: SRA टूलकिट (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, आणि शिफारस केलेले इनपुट्स/आउटपुट्सRNA-seq डेटा डाउनलोड आणि संघटनेसाठी विश्वसनीय धोरणे, SRA टूलकिट, ENA प्रवेश, कमांड-लाइन ट्रान्सफर साधनांवर लक्ष केंद्रित करत, आणि ऑटोमेशन आणि पुनरुत्पादन समर्थन करणाऱ्या सुसंगत इनपुट आणि आउटपुट संरचनांचे व्याख्या.
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsपाठ 5गुणवत्ता नियंत्रण साधने आणि आउटपुट्स: FastQC, MultiQC, तपासण्यासाठी मुख्य मेट्रिक्स (प्रति-बेस गुणवत्ता, अॅडॉप्टर सामग्री, डुप्लिकेशन, GC)RNA-seq गुणवत्ता नियंत्रणावर लक्ष केंद्रित, FastQC आणि MultiQC वापरून प्रति-बेस गुणवत्ता, अॅडॉप्टर दूषितता, डुप्लिकेशन, आणि GC सामग्री सारख्या मुख्य मेट्रिक्स सारांशित करणे, आणि ट्रिमिंग किंवा पुनर्क्रमण आवश्यक आहे की नाही ठरवणे.
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsपाठ 6वाचन ट्रिमिंग आणि फिल्टरिंग: कधी ट्रिम करावे, साधने (Trim Galore/Cutadapt/fastp), मुख्य पॅरामीटर्स आणि आउटपुट्सRNA-seq वाचने कधी आणि कशी ट्रिम करावीत हे स्पष्ट करते, अॅडॉप्टर आणि गुणवत्ता ट्रिमिंग, लांबी फिल्टरिंग कव्हर करत, आणि Trim Galore, Cutadapt, आणि fastp सारख्या साधनांमध्ये मुख्य पॅरामीटर्स, खालील विश्लेषणांना हानी पोहोचवणाऱ्या अतिरिक्त ट्रिमिंग टाळत.
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingपाठ 7मूलभूत खालील प्रवाह विश्लेषण: GO/KEGG समृद्धी (clusterProfiler), GSEA preranked, पाथवे दृश्यमान, आणि जीन सेट निवडभिन्न अभिव्यक्तीनंतर खालील प्रवाह कार्यात्मक विश्लेषणांचा परिचय, clusterProfiler सह GO आणि KEGG समृद्धी, preranked GSEA, पाथवे दृश्यमान, आणि जीन सेट्स निवडण्यासाठी आणि फिल्टर करण्यासाठी तत्त्वाधारित धोरणांचा समावेश.
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyपाठ 8उच्च-स्तरीय पाइपलाइन लेआउट: डेटा डाउनलोड, QC, ट्रिमिंग, अलाइनमेंट/प्सूडो-अलाइनमेंट, क्वांटिफिकेशन, भिन्न अभिव्यक्ती, खालील प्रवाह विश्लेषणएकूण RNA-seq पाइपलाइन संरचना सादर करते, डेटा अधिग्रहण आणि QC पासून ट्रिमिंग, अलाइनमेंट किंवा प्सूडो-अलाइनमेंट, क्वांटिफिकेशन, नॉर्मलायझेशन, भिन्न अभिव्यक्ती, आणि खालील प्रवाह कार्यात्मक विश्लेषणापर्यंत, मॉड्युलर, स्क्रिप्टेड वर्कफ्लोजवर भर देऊन.
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsपाठ 9नॉर्मलायझेशन आणि शोधक डेटा विश्लेषण: TPM/FPKM मर्यादा, DESeq2 नॉर्मलायझेशन, PCA, नमुना-नमुना अंतर हीटमॅप्सRNA-seq डेटाची नॉर्मलायझेशन आणि शोधक विश्लेषण कव्हर करते, TPM आणि FPKM च्या मर्यादांचा चर्चा, DESeq2-आधारित नॉर्मलायझेशन, व्हेरिएन्स स्थिरीकरण, प्रिन्सिपल कॉम्पोनेंट विश्लेषण, आणि बॅच प्रभाव शोधण्यासाठी नमुना अंतर हीटमॅप्स.
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersपाठ 10मूलभूत दृश्यमान सर्वोत्तम पद्धती: MA प्लॉट्स, व्होल्कॅनो प्लॉट्स, हीटमॅप्स, पाथवे डॉटप्लॉट्स, आणि इंटरॅक्टिव्ह अहवाल पर्याय (R Markdown, Jupyter)RNA-seq निकालांसाठी प्रभावी दृश्यमान धोरणांचा परिचय, भिन्न अभिव्यक्ती, नमुना संरचना, आणि पाथवे बदल स्पष्ट संप्रेषणावर भर देत, R Markdown किंवा Jupyter मध्ये तयार केलेल्या स्थिर प्लॉट्स आणि इंटरॅक्टिव्ह, पुनरुत्पादनीय अहवालांचा वापर.
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationपाठ 11अलाइनमेंट विरुद्ध प्सूडो-अलाइनमेंट: STAR, HISAT2, Salmon, kallisto — व्यापार आणि आउटपुट्स (BAM, ट्रान्सक्रिप्ट/जीनकाउंट्स)STAR आणि HISAT2 सारख्या अलाइनमेंट-आधारित साधनांची Salmon आणि kallisto सारख्या प्सूडो-अलाइनमेंट साधनांशी तुलना करते, वेग, अचूकता, संसाधन वापर, आणि BAM फाइल्स आणि ट्रान्सक्रिप्ट किंवा जीन-स्तरीय धांदा यांचा समावेश असलेल्या आउटपुट्समध्ये व्यापार हायलाइट करते.
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy