पाठ 1विभेदी अभिव्यक्ति विश्लेषण: DESeq2, edgeR, limma-voom — मोडेल डिजाइन, कन्ट्रास्ट र बहु-परीक्षण सुधारयो खण्डले DESeq2, edgeR र limma-voom प्रयोग गरेर विभेदी अभिव्यक्ति कार्यप्रवाहहरूको विस्तृत विवरण दिन्छ, जसमा मोडेल डिजाइन, कन्ट्रास्ट, फैलावट अनुमान र बहु-परीक्षण सुधारमा केन्द्रित छ जसले विश्वसनीय जीन सूची र प्रभाव आकार अनुमान प्राप्त गर्दछ।
प्रयोगात्मक मोडेल र सहभागीहरू डिजाइन गर्नेजटिल तुलना लागि कन्ट्रास्ट सेट गर्नेDESeq2 अन्त-देखि-अन्त कार्यप्रवाह चलाउनेedgeR र limma-voom पाइपलाइनहरू प्रयोग गर्नेबहु-परीक्षण सुधार र FDR नियन्त्रणlog2 फोल्ड चेन्ज र संकुचन व्याख्या गर्नेपाठ 2डाटा व्यवस्थापन र फाइल नामकरण अभिसन्धि: नमूना शीटहरू, कच्चा/प्रशोधित विभाजन, सुसंगत पहिचानकर्ताहरूयो खण्डले RNA-seq परियोजना फाइलहरू व्यवस्थापन गर्ने उत्तम अभ्यासहरू वर्णन गर्दछ, जसमा नमूना शीटहरू, निर्देशिका संरचना, कच्चा बनाम प्रशोधित डाटा विभाजन र स्क्रिप्टिङ, ट्र्याकिङ र पुनरावृत्तीयता सरल बनाउने सुसंगत पहिचानकर्ताहरू समावेश छन्।
स्पष्ट निर्देशिका पदानुक्रम डिजाइन गर्नेकच्चा र प्रशोधित डाटा विभाजन गर्नेमजबुत नमूना शीट र मेटाडाटा निर्माण गर्नेसुसंगत नमूना र लाइब्रेरी पहिचानकर्ताहरूसन्दर्भ जीनोम र सूचकांकहरूको संस्करण नियन्त्रणपरियोजना डाटा ब्याकअप र संग्रहपाठ 3जीन-स्तरीय परिमाणीकरण रणनीतिहरू: featureCounts, htseq-count, tximport ट्रान्सक्रिप्ट-देखि-जीन सारांशयो खण्डले संरेखित वा छद्म-संरेखित पढाइहरूबाट जीन-स्तरीय परिमाणीकरण व्याख्या गर्दछ, featureCounts र htseq-count तुलना गर्दछ, र tximport ले कसरी ट्रान्सक्रिप्ट-स्तरीय अनुमानहरूलाई मजबुत जीन-स्तरीय म्याट्रिक्सहरूमा एकत्रित गर्दछ भन्ने विस्तृत गर्दछ।
featureCounts विकल्पहरूसँग पढाइहरू गणना गर्नेhtseq-count मोड र एनोटेसनहरू प्रयोग गर्नेस्ट्रान्डेडनेस र बहु-म्यापिङ पढाइहरू ह्यान्डल गर्नेtximport सँग Salmon र kallisto आयात गर्नेजीन-स्तरीय गणना म्याट्रिक्सहरू निर्माण गर्नेपरिमाणीकरण गुणस्तर र कभरेज मूल्यांकन गर्नेपाठ 4डाटा डाउनलोड र व्यवस्थापन उपकरणहरू: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, र सिफारिस गरिएका इनपुट/आउटपुटहरूयो खण्डले RNA-seq डाटा डाउनलोड र व्यवस्थापन गर्ने विश्वसनीय रणनीतिहरू समेट्छ, SRA Toolkit, ENA पहुँच, कमान्ड-लाइन स्थानान्तरण उपकरणहरू र स्वचालन र पुनरावृत्तीयता समर्थन गर्ने सुसंगत इनपुट र आउटपुट संरचनाहरू परिभाषित गर्दै केन्द्रित छ।
SRA Toolkit prefetch र fasterq-dump प्रयोग गर्नेFTP र Aspera मार्फत ENA पहुँच गर्नेwget र rsync सुरक्षित रूपमा डाउनलोड गर्नेकच्चा र प्रशोधित फाइल ढाँचाहरू छनोट गर्नेडाउनलोड मेटाडाटा र चेकसमहरू कागजात गर्नेस्क्रिप्ट र लगहरू सहित डाउनलोड स्वचालित गर्नेपाठ 5गुणस्तर नियन्त्रण उपकरणहरू र आउटपुटहरू: FastQC, MultiQC, जाँच गर्नुपर्ने मुख्य मेट्रिकहरू (प्रति-आधार गुणस्तर, एडाप्टर सामग्री, डुप्लिकेसन, GC)यो खण्डले RNA-seq गुणस्तर नियन्त्रणमा केन्द्रित छ, FastQC र MultiQC प्रयोग गरेर प्रति-आधार गुणस्तर, एडाप्टर दूषितता, डुप्लिकेसन र GC सामग्री जस्ता मुख्य मेट्रिकहरू सारांशित गर्दै, र ट्रिमिङ वा पुन:क्रमबद्धन आवश्यक छ कि छैन निर्णय गर्ने।
कच्चा र ट्रिम गरिएका पढाइहरूमा FastQC चलाउनेप्रति-आधार गुणस्तर प्रोफाइलहरू व्याख्या गर्नेएडाप्टर र अतिरिक्त प्रतिनिधित्व गरिएका अनुक्रमहरू पत्ता लगाउनेडुप्लिकेसन र GC सामग्री मूल्यांकन गर्नेMultiQC सँग रिपोर्टहरू एकत्रित गर्नेQC थ्रेसहोल्ड र कार्यहरू परिभाषित गर्नेपाठ 6पढाइ ट्रिमिङ र फिल्टरिङ: कहिले ट्रिम गर्ने, उपकरणहरू (Trim Galore/Cutadapt/fastp), मुख्य प्यारामिटर र आउटपुटहरूयो खण्डले RNA-seq पढाइहरू कहिले र कसरी ट्रिम गर्ने व्याख्या गर्दछ, एडाप्टर र गुणस्तर ट्रिमिङ, लम्बाइ फिल्टरिङ समेट्दै, र Trim Galore, Cutadapt र fastp जस्ता उपकरणहरूमा मुख्य प्यारामिटरहरू, तलका विश्लेषणहरूलाई हानि नपुर्याउने गरी अति-ट्रिमिङबाट बच्दै।
ट्रिमिङ आवश्यक छ कि छैन निर्णय गर्नेएडाप्टर पत्ता लगाउने र हटाउने रणनीतिहरूगुणस्तर-आधारित ट्रिमिङ थ्रेसहोल्डहरून्यूनतम लम्बाइ र जटिलता फिल्टरहरूTrim Galore र Cutadapt विकल्पहरू प्रयोग गर्नेएकीकृत QC र ट्रिमिङको लागि fastpपाठ 7आधारभूत तलका विश्लेषणहरू: GO/KEGG समृद्धि (clusterProfiler), GSEA preranked, मार्ग दृश्यीकरण, र जीन सेट छनोटयो खण्डले विभेदी अभिव्यक्तिपछि तलका कार्यात्मक विश्लेषणहरू परिचय गर्दछ, clusterProfiler सहित GO र KEGG समृद्धि, preranked GSEA, मार्ग दृश्यीकरण, र जीन सेटहरू छनोट र फिल्टर गर्ने सैद्धान्तिक रणनीतिहरू समावेश गर्दै।
GSEA को लागि र्याङ्क गरिएका जीन सूचीहरू तयार गर्नेclusterProfiler सहित GO र KEGG समृद्धिउपयुक्त जीन सेट डाटाबेसहरू छनोट गर्नेसमृद्ध मार्ग र नेटवर्कहरू दृश्यीकरण गर्नेजीन सेटहरू फिल्टर र प्राथमिकता दिनेकार्यात्मक परिणामहरू पुनरावृत्तीय रूपमा रिपोर्ट गर्नेपाठ 8उच्च-स्तरीय पाइपलाइन संरचना: डाटा डाउनलोड, QC, ट्रिमिङ, संरेखण/छद्म-संरेखण, परिमाणीकरण, विभेदी अभिव्यक्ति, तलका विश्लेषणयो खण्डले डाटा प्राप्ति र QC बाट ट्रिमिङ, संरेखण वा छद्म-संरेखण, परिमाणीकरण, सामान्यीकरण, विभेदी अभिव्यक्ति र तलका कार्यात्मक विश्लेषण सम्मको समग्र RNA-seq पाइपलाइन संरचना प्रस्तुत गर्दछ, मोडुलर, स्क्रिप्टेड कार्यप्रवाहहरूमा जोड दिँदै।
पाइपलाइन चरणहरू र निर्भरताहरू परिभाषित गर्नेइनपुट, आउटपुट र फाइल प्रवाह योजना गर्नेQC, ट्रिमिङ र संरेखण एकीकृत गर्नेपरिमाणीकरणलाई DE विश्लेषणसँग जोड्नेDE लाई समृद्धि कार्यप्रवाहहरूसँग जोड्नेडायग्रामहरूसँग पाइपलाइन कागजात गर्नेपाठ 9सामान्यीकरण र अन्वेषणात्मक डाटा विश्लेषण: TPM/FPKM सीमाहरू, DESeq2 सामान्यीकरण, PCA, नमूना-नमूना दूरी हिटम्यापहरूयो खण्डले RNA-seq डाटाको सामान्यीकरण र अन्वेषणात्मक विश्लेषण समेट्छ, TPM र FPKM को सीमाहरू छलफल गर्दै, DESeq2-आधारित सामान्यीकरण, भेरियन्स स्थिरीकरण, मुख्य घटक विश्लेषण र ब्याच प्रभावहरू पत्ता लगाउन नमूना दूरी हिटम्यापहरू।
TPM र FPKM मापनहरूको सीमाहरूDESeq2 आकार कारकहरू र सामान्यीकरणभेरियन्स-स्थिरीकरण र rlog रूपान्तरणहरूनमूनाहरूको मुख्य घटक विश्लेषणनमूना-नमूना दूरी हिटम्यापहरूब्याच प्रभाव र असामान्य नमूनाहरू पत्ता लगाउनेपाठ 10आधारभूत दृश्यीकरण उत्तम अभ्यासहरू: MA प्लटहरू, भल्कानो प्लटहरू, हिटम्यापहरू, मार्ग डटप्लटहरू, र अन्तरक्रियात्मक रिपोर्ट विकल्पहरू (R Markdown, Jupyter)यो खण्डले RNA-seq परिणामहरूको लागि प्रभावकारी दृश्यीकरण रणनीतिहरू परिचय गर्दछ, विभेदी अभिव्यक्ति, नमूना संरचना र मार्ग परिवर्तनहरू स्पष्ट सञ्चारमा जोड दिँदै स्थिर प्लटहरू र R Markdown वा Jupyter मा निर्मित अन्तरक्रियात्मक, पुनरावृत्तीय रिपोर्टहरू प्रयोग गर्दै।
MA प्लटहरू निर्माण र व्याख्या गर्नेDE जीनहरूको लागि स्पष्ट भल्कानो प्लटहरू डिजाइन गर्नेप्रकाशन-गुणस्तर हिटम्यापहरू निर्माण गर्नेसमृद्धि परिणामहरूको लागि मार्ग डटप्लटहरूअन्तरक्रियात्मक R Markdown RNA-seq रिपोर्टहरूJupyter-आधारित अन्वेषणात्मक दृश्यीकरणपाठ 11संरेखण बनाम छद्म-संरेखण: STAR, HISAT2, Salmon, kallisto — व्यापार-offs र आउटपुटहरू (BAM, ट्रान्सक्रिप्ट/जीनगणना)यो खण्डले STAR र HISAT2 जस्ता संरेखण-आधारित उपकरणहरूलाई Salmon र kallisto जस्ता छद्म-संरेखण उपकरणहरूसँग तुलना गर्दछ, गति, शुद्धता, स्रोत प्रयोग र BAM फाइलहरू र ट्रान्सक्रिप्ट वा जीन-स्तरीय गणनाहरू समावेश आउटपुटहरूमा व्यापार-offs हाइलाइट गर्दै।
STAR वा HISAT2 संरेखकहरू कहिले छनोट गर्नेजीनोम सूचकांक र एनोटेसनहरू कन्फिगर गर्नेक्वासी-म्यापिङ मोडमा Salmon प्रयोग गर्नेद्रुत परिमाणीकरणको लागि kallisto चलाउनेBAM र quant.sf शैली आउटपुटहरू तुलना गर्नेगति, स्मृति र शुद्धताको बेन्चमार्किङ