পাঠ 1ডিফারেনশিয়াল এক্সপ্রেশন বিশ্লেষণ: DESeq2, edgeR, limma-voom — মডেল ডিজাইন, কনট্রাস্ট, এবং একাধিক-পরীক্ষা সংশোধনএই বিভাগটি DESeq2, edgeR এবং limma-voom ব্যবহার করে ডিফারেনশিয়াল এক্সপ্রেশন ওয়ার্কফ্লো বিশদ করে, মডেল ডিজাইন, কনট্রাস্ট, ডিসপারশন অনুমান এবং একাধিক-পরীক্ষা সংশোধনের উপর ফোকাস করে নির্ভরযোগ্য জিন তালিকা এবং প্রভাবের আকার অনুমান পেতে।
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageপাঠ 2ডেটা সংগঠন এবং ফাইল নামকরণ কনভেনশন: নমুনা শীট, কাঁচা/প্রসেসড পৃথকীকরণ, সামঞ্জস্যপূর্ণ আইডেন্টিফায়ারএই বিভাগটি RNA-seq প্রজেক্ট ফাইল সংগঠিত করার সেরা অনুশীলন বর্ণনা করে, যার মধ্যে নমুনা শীট, ডিরেক্টরি লেআউট, কাঁচা বনাম প্রসেসড ডেটা পৃথকীকরণ এবং স্ক্রিপ্টিং, ট্র্যাকিং এবং পুনরুত্পাদনশীলতা সরলীকরণকারী সামঞ্জস্যপূর্ণ আইডেন্টিফায়ার অন্তর্ভুক্ত।
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataপাঠ 3জিন-লেভেল কোয়ান্টিফিকেশন কৌশল: featureCounts, htseq-count, tximport ট্রান্সক্রিপ্ট-টু-জিন সামারাইজেশনের জন্যএই বিভাগটি অ্যালাইন্ড বা পসিউডো-অ্যালাইন্ড রিড থেকে জিন-লেভেল কোয়ান্টিফিকেশন ব্যাখ্যা করে, featureCounts এবং htseq-count তুলনা করে, এবং tximport কীভাবে ট্রান্সক্রিপ্ট-লেভেল অনুমানগুলিকে শক্তিশালী জিন-লেভেল ম্যাট্রিক্সে একত্রিত করে ডাউনস্ট্রিম পরিসংখ্যানগত বিশ্লেষণের জন্য বিশদ করে।
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageপাঠ 4ডেটা ডাউনলোড এবং সংগঠনের টুল: SRA টুলকিট (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, এবং প্রস্তাবিত ইনপুট/আউটপুটএই বিভাগটি RNA-seq ডেটা ডাউনলোড এবং সংগঠনের নির্ভরযোগ্য কৌশল কভার করে, SRA টুলকিট, ENA অ্যাক্সেস, কমান্ড-লাইন ট্রান্সফার টুল এবং অটোমেশন এবং পুনরুত্পাদনশীলতা সমর্থনকারী সামঞ্জস্যপূর্ণ ইনপুট এবং আউটপুট কাঠামো সংজ্ঞায়িত করার উপর ফোকাস করে।
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsপাঠ 5গুণমান নিয়ন্ত্রণ টুল এবং আউটপুট: FastQC, MultiQC, পরিদর্শন করার মূল মেট্রিক্স (প্রতি-বেস গুণমান, অ্যাডাপ্টার কনটেন্ট, ডুপ্লিকেশন, GC)এই বিভাগটি RNA-seq গুণমান নিয়ন্ত্রণের উপর ফোকাস করে, FastQC এবং MultiQC ব্যবহার করে প্রতি-বেস গুণমান, অ্যাডাপ্টার দূষণ, ডুপ্লিকেশন এবং GC কনটেন্টের মতো মূল মেট্রিক্স সারাংশ করে, এবং ট্রিমিং বা রি-সিকোয়েন্সিং প্রয়োজন কিনা তা সিদ্ধান্ত নেয়।
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsপাঠ 6রিড ট্রিমিং এবং ফিল্টারিং: কখন ট্রিম করতে হবে, টুল (Trim Galore/Cutadapt/fastp), মূল প্যারামিটার এবং আউটপুটএই বিভাগটি RNA-seq রিড কখন এবং কীভাবে ট্রিম করতে হবে তা ব্যাখ্যা করে, অ্যাডাপ্টার এবং গুণমান ট্রিমিং, দৈর্ঘ্য ফিল্টারিং কভার করে, এবং Trim Galore, Cutadapt এবং fastp-এর মতো টুলে মূল প্যারামিটার, ডাউনস্ট্রিম বিশ্লেষণের ক্ষতি না করে ওভার-ট্রিমিং এড়ানো।
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingপাঠ 7মৌলিক ডাউনস্ট্রিম বিশ্লেষণ: GO/KEGG এনরিচমেন্ট (clusterProfiler), GSEA প্রির্যাঙ্কড, পাথওয়ে ভিজ্যুয়ালাইজেশন, এবং জিন সেট নির্বাচনএই বিভাগটি ডিফারেনশিয়াল এক্সপ্রেশনের পর ডাউনস্ট্রিম কার্যকরী বিশ্লেষণ পরিচয় করায়, যার মধ্যে clusterProfiler সহ GO এবং KEGG এনরিচমেন্ট, প্রির্যাঙ্কড GSEA, পাথওয়ে ভিজ্যুয়ালাইজেশন এবং জিন সেট নির্বাচন এবং ফিল্টারিংয়ের নীতিগত কৌশল অন্তর্ভুক্ত।
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyপাঠ 8উচ্চ-লেভেল পাইপলাইন লেআউট: ডেটা ডাউনলোড, QC, ট্রিমিং, অ্যালাইনমেন্ট/পসিউডো-অ্যালাইনমেন্ট, কোয়ান্টিফিকেশন, ডিফারেনশিয়াল এক্সপ্রেশন, ডাউনস্ট্রিম বিশ্লেষণএই বিভাগটি ডেটা অধিগ্রহণ এবং QC থেকে ট্রিমিং, অ্যালাইনমেন্ট বা পসিউডো-অ্যালাইনমেন্ট, কোয়ান্টিফিকেশন, নরমালাইজেশন, ডিফারেনশিয়াল এক্সপ্রেশন এবং ডাউনস্ট্রিম কার্যকরী বিশ্লেষণ পর্যন্ত সামগ্রিক RNA-seq পাইপলাইন কাঠামো উপস্থাপন করে, মডুলার, স্ক্রিপ্টেড ওয়ার্কফ্লো জোর দেয়।
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsপাঠ 9নরমালাইজেশন এবং অন্বেষণীয় ডেটা বিশ্লেষণ: TPM/FPKM সীমা, DESeq2 নরমালাইজেশন, PCA, নমুনা-নমুনা দূরত্ব হিটম্যাপএই বিভাগটি RNA-seq ডেটার নরমালাইজেশন এবং অন্বেষণীয় বিশ্লেষণ কভার করে, TPM এবং FPKM-এর সীমাবদ্ধতা আলোচনা করে, DESeq2-ভিত্তিক নরমালাইজেশন, ভ্যারিয়েন্স স্থিতিশীলকরণ, প্রিন্সিপাল কম্পোনেন্ট বিশ্লেষণ এবং ব্যাচ ইফেক্ট সনাক্তকরণের জন্য নমুনা দূরত্ব হিটম্যাপ।
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersপাঠ 10ভিজ্যুয়ালাইজেশনের সেরা অনুশীলন: MA প্লট, ভলক্যানো প্লট, হিটম্যাপ, পাথওয়ে ডটপ্লট, এবং ইন্টারেক্টিভ রিপোর্ট অপশন (R Markdown, Jupyter)এই বিভাগটি RNA-seq ফলাফলের জন্য কার্যকরী ভিজ্যুয়ালাইজেশন কৌশল পরিচয় করায়, ডিফারেনশিয়াল এক্সপ্রেশন, নমুনা কাঠামো এবং পাথওয়ে পরিবর্তনের স্পষ্ট যোগাযোগ জোর দেয় স্ট্যাটিক প্লট এবং R Markdown বা Jupyter-এ তৈরি ইন্টারেক্টিভ, পুনরুত্পাদনযোগ্য রিপোর্ট ব্যবহার করে।
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationপাঠ 11অ্যালাইনমেন্ট বনাম পসিউডো-অ্যালাইনমেন্ট: STAR, HISAT2, Salmon, kallisto — ট্রেডঅফ এবং আউটপুট (BAM, ট্রান্সক্রিপ্ট/জিনকাউন্টস)এই বিভাগটি STAR এবং HISAT2-এর মতো অ্যালাইনমেন্ট-ভিত্তিক টুলগুলিকে Salmon এবং kallisto-এর মতো পসিউডো-অ্যালাইনমেন্ট টুলের সাথে তুলনা করে, গতি, নির্ভুলতা, সম্পদ ব্যবহার এবং BAM ফাইল এবং ট্রান্সক্রিপ্ট বা জিন-লেভেল কাউন্ট সহ আউটপুটে ট্রেডঅফ হাইলাইট করে।
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy