Ders 1Farklı ifade analizi: DESeq2, edgeR, limma-voom — model tasarımı, kontrastlar ve çoklu test düzeltmesiBu bölüm, DESeq2, edgeR ve limma-voom kullanarak farklı ifade iş akımlarını detaylandırır; model tasarımı, kontrastlar, dispersiyon tahmini ve çoklu test düzeltmesine odaklanarak güvenilir gen listeleri ve etki boyutu tahminleri elde eder.
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageDers 2Veri organizasyonu ve dosya adlandırma kuralları: numune sayfaları, ham/işlenmiş ayrımı, tutarlı tanımlayıcılarBu bölüm, RNA-seq proje dosyalarını organize etme en iyi uygulamalarını tanımlar; numune sayfaları, dizin düzenleri, ham ile işlenmiş veri ayrımı ve betikleme, izleme ve tekrarlanabilirliği basitleştiren tutarlı tanımlayıcılar dahil.
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataDers 3Gen düzeyinde nicelendirme stratejileri: featureCounts, htseq-count, tximport ile transkript-den-gen özetlemeBu bölüm, hizalanmış veya sahte hizalanmış okuma'dan gen düzeyinde nicelendirmeyi açıklar; featureCounts ve htseq-count'u karşılaştırır ve tximport'un transkript düzeyinde tahminleri sağlam gen düzeyinde matrislere nasıl topladığını detaylandırır.
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageDers 4Veri indirme ve organizasyon araçları: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync ve önerilen giriş/çıkışlarBu bölüm, RNA-seq verilerini indirme ve organize etme güvenilir stratejilerini kapsar; SRA Toolkit, ENA erişimi, komut satırı transfer araçları ve otomasyon ile tekrarlanabilirliği destekleyen tutarlı giriş/çıkış yapılarını tanımlamaya odaklanır.
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsDers 5Kalite kontrol araçları ve çıktıları: FastQC, MultiQC, incelenecek ana metrikler (baz başına kalite, adaptör içeriği, çoğaltma, GC)Bu bölüm, FastQC ve MultiQC kullanarak RNA-seq kalite kontrolüne odaklanır; baz başına kalite, adaptör kontaminasyonu, çoğaltma ve GC içeriği gibi ana metrikleri özetler ve budama veya yeniden sıralamanın gerekip gerekmediğine karar verir.
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsDers 6Okuma budama ve filtreleme: ne zaman budama, araçlar (Trim Galore/Cutadapt/fastp), ana parametreler ve çıktılarBu bölüm, RNA-seq okumalarını ne zaman ve nasıl budayacağınızı açıklar; adaptör ve kalite budama, uzunluk filtreleme ve Trim Galore, Cutadapt, fastp gibi araçlarda ana parametreleri kapsar, aşağı akış analizlere zarar verecek aşırı budamadan kaçınarak.
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingDers 7Temel aşağı akış analizleri: GO/KEGG zenginleştirmesi (clusterProfiler), ön sıralı GSEA, yol görselleştirmesi ve gen seti seçimiBu bölüm, farklı ifadenin ardından aşağı akış fonksiyonel analizleri tanıtır; clusterProfiler ile GO ve KEGG zenginleştirmesi, ön sıralı GSEA, yol görselleştirmesi ve gen setlerini seçme ile filtreleme için ilkel stratejiler içerir.
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyDers 8Üst düzey hat düzeni: veri indirme, QC, budama, hizalama/sahte hizalama, nicelendirme, farklı ifade, aşağı akış analiziBu bölüm, veri ediniminden QC'ye, budamadan hizalamaya veya sahte hizalamaya, nicelendirmeye, normalleştirmeye, farklı ifadeye ve aşağı akış fonksiyonel analize kadar genel RNA-seq hattı yapısını sunar; modüler, betikli iş akışlarını vurgular.
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsDers 9Normalleştirme ve keşifsel veri analizi: TPM/FPKM sınırlılıkları, DESeq2 normalleştirmesi, PCA, numune-numune mesafe ısı haritalarıBu bölüm, RNA-seq verilerinin normalleştirilmesi ve keşifsel analizini kapsar; TPM ve FPKM sınırlılıklarını tartışır, DESeq2 temelli normalleştirme, varyans stabilizasyonu, ana bileşen analizi ve parti etkilerini tespit için numune mesafe ısı haritalarını içerir.
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersDers 10Temel görselleştirme en iyi uygulamaları: MA grafikleri, volkan grafikleri, ısı haritaları, yol nokta grafikleri ve etkileşimli rapor seçenekleri (R Markdown, Jupyter)Bu bölüm, RNA-seq sonuçları için etkili görselleştirme stratejilerini tanıtır; farklı ifade, numune yapısı ve yol değişikliklerini net iletim için statik grafikler ve R Markdown veya Jupyter'da oluşturulan etkileşimli, tekrarlanabilir raporlar kullanarak vurgular.
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationDers 11Hizalama vs sahte hizalama: STAR, HISAT2, Salmon, kallisto — ödünleşmeler ve çıktılar (BAM, transkript/gen sayımları)Bu bölüm, STAR ve HISAT2 gibi hizalama temelli araçları Salmon ve kallisto gibi sahte hizalama araçlarıyla karşılaştırır; hız, doğruluk, kaynak kullanımı ve BAM dosyaları ile transkript veya gen düzeyinde sayımlar dahil çıktılardaki ödünleşmeleri vurgular.
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy