Pelajaran 1Analisis ekspresi berbeza: DESeq2, edgeR, limma-voom — reka bentuk model, kontras, dan pembetulan ujian bergandaBahagian ini memperincikan aliran kerja ekspresi berbeza menggunakan DESeq2, edgeR, dan limma-voom, memberi tumpuan kepada reka bentuk model, kontras, anggaran dispersi, dan pembetulan ujian berganda untuk mendapatkan senarai gen yang boleh dipercayai dan anggaran saiz kesan.
Mereka bentuk model eksperimen dan kovariatMenetapkan kontras untuk perbandingan kompleksMenjalankan aliran kerja DESeq2 hujung ke hujungMenggunakan saluran edgeR dan limma-voomPembetulan ujian berganda dan kawalan FDRMentafsir perubahan lipat log2 dan pengecutanPelajaran 2Organisasi data dan konvensyen penamaan fail: lembaran sampel, pemisahan mentah/proses, pengenalan konsistenBahagian ini menerangkan amalan terbaik untuk mengatur fail projek RNA-seq, termasuk lembaran sampel, susun atur direktori, pemisahan data mentah berbanding proses, dan pengenalan konsisten yang memudahkan pengaturcaraan, penjejakan, dan kebolehulang.
Mereka bentuk hierarki direktori yang jelasMemisahkan data mentah dan prosesMencipta lembaran sampel dan metadata yang kukuhPengenalan sampel dan perpustakaan konsistenVersi genom rujukan dan indeksSandaran dan arkib data projekPelajaran 3Strategi kuantifikasi tahap gen: featureCounts, htseq-count, tximport untuk ringkasan transkrip-ke-genBahagian ini menerangkan kuantifikasi tahap gen dari baca yang dijejari atau pseudo-d jejari, membandingkan featureCounts dan htseq-count, dan memperincikan bagaimana tximport mengumpulkan anggaran tahap transkrip kepada matriks tahap gen yang kukuh untuk analisis statistik hilir.
Mengira baca dengan pilihan featureCountsMenggunakan mod dan anotasi htseq-countMengendalikan baca berarah dan multimappingMengimport Salmon dan kallisto dengan tximportMembina matriks kiraan tahap genMenilai kualiti kuantifikasi dan liputanPelajaran 4Alat untuk muat turun data dan organisasi: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, dan input/output yang disyorkanBahagian ini meliputi strategi boleh dipercayai untuk memuat turun dan mengatur data RNA-seq, memberi tumpuan kepada SRA Toolkit, akses ENA, alat pemindahan baris arahan, dan mentakrifkan struktur input dan output konsisten yang menyokong automasi dan kebolehulang.
Menggunakan prefetch dan fasterq-dump SRA ToolkitAkses ENA melalui FTP dan AsperaMemuat turun dengan wget dan rsync selamatMemilih format fail mentah dan prosesMendokumentasikan metadata muat turun dan checksumMengautomasikan muat turun dengan skrip dan logPelajaran 5Alat kawalan kualiti dan output: FastQC, MultiQC, metrik utama untuk diperiksa (kualiti per-basa, kandungan adapter, penduaan, GC)Bahagian ini memberi tumpuan kepada kawalan kualiti RNA-seq, menggunakan FastQC dan MultiQC untuk merumuskan metrik utama seperti kualiti per-basa, pencemaran adapter, penduaan, dan kandungan GC, dan memutuskan sama ada pemangkasan atau penjujukan semula diperlukan.
Menjalankan FastQC pada baca mentah dan dipangkasMentafsir profil kualiti per-basaMengesan adapter dan urutan berlebihanMenilai penduaan dan kandungan GCMengumpulkan laporan dengan MultiQCMendefinisikan ambang QC dan tindakanPelajaran 6Pemangkasan dan penapisan baca: bila untuk memangkas, alat (Trim Galore/Cutadapt/fastp), parameter utama dan outputBahagian ini menerangkan bila dan bagaimana memangkas baca RNA-seq, meliputi pemangkasan adapter dan kualiti, penapisan panjang, dan parameter utama dalam alat seperti Trim Galore, Cutadapt, dan fastp, sambil mengelakkan pemangkasan berlebihan yang merosakkan analisis hilir.
Memutuskan sama ada pemangkasan diperlukanStrategi pengesanan dan penyingkiran adapterAmbang pemangkasan berdasarkan kualitiPenapis panjang minimum dan kerumitanMenggunakan pilihan Trim Galore dan CutadaptFastp untuk QC dan pemangkasan bersepaduPelajaran 7Analisis hilir asas: pengayaan GO/KEGG (clusterProfiler), GSEA preranked, visualisasi laluan, dan pemilihan set genBahagian ini memperkenalkan analisis fungsional hilir selepas ekspresi berbeza, termasuk pengayaan GO dan KEGG dengan clusterProfiler, GSEA preranked, visualisasi laluan, dan strategi prinsip untuk memilih dan menapis set gen.
Menyediakan senarai gen berperingkat untuk GSEAPengayaan GO dan KEGG dengan clusterProfilerMemilih pangkalan data set gen yang sesuaiMemvisualkan laluan dan rangkaian yang diayakanMenapis dan mengutamakan set genMelaporkan hasil fungsional dengan boleh dihulangPelajaran 8Susun atur saluran tahap tinggi: muat turun data, QC, pemangkasan, penjajaran/pseudo-penjajaran, kuantifikasi, ekspresi berbeza, analisis hilirBahagian ini membentangkan struktur saluran RNA-seq secara keseluruhan, dari pemerolehan data dan QC melalui pemangkasan, penjajaran atau pseudo-penjajaran, kuantifikasi, normalisasi, ekspresi berbeza, dan analisis fungsional hilir, menekankan aliran kerja modular dan berskrip.
Mendefinisikan peringkat saluran dan pergantunganMerancang input, output, dan aliran failMengintegrasikan QC, pemangkasan, dan penjajaranMenghubungkan kuantifikasi kepada analisis DEMenghubungkan DE kepada aliran kerja pengayaanMendokumentasikan saluran dengan rajahPelajaran 9Normalisasi dan analisis data penerokaan: had TPM/FPKM, normalisasi DESeq2, PCA, peta jarak sampel-sampelBahagian ini meliputi normalisasi dan analisis penerokaan data RNA-seq, membincangkan had TPM dan FPKM, normalisasi berdasarkan DESeq2, penstabilan varians, analisis komponen utama, dan peta jarak sampel untuk mengesan kesan batch.
Had ukuran TPM dan FPKMFaktor saiz DESeq2 dan normalisasiTransformasi penstabil varians dan rlogAnalisis komponen utama sampelPeta jarak sampel-sampelMengesan kesan batch dan nilai luarPelajaran 10Amalan terbaik visualisasi asas: plot MA, plot vulkan, peta haba, dotplot laluan, dan pilihan laporan interaktif (R Markdown, Jupyter)Bahagian ini memperkenalkan strategi visualisasi efektif untuk hasil RNA-seq, menekankan komunikasi jelas ekspresi berbeza, struktur sampel, dan perubahan laluan menggunakan plot statik dan laporan interaktif, boleh dihulang yang dibina dalam R Markdown atau Jupyter.
Membina dan mentafsir plot MAMereka bentuk plot vulkan jelas untuk gen DEMembina peta haba berkualiti penerbitanDotplot laluan untuk hasil pengayaanLaporan RNA-seq R Markdown interaktifVisualisasi penerokaan berasaskan JupyterPelajaran 11Penjajaran vs pseudo-penjajaran: STAR, HISAT2, Salmon, kallisto — pertukaran dan output (BAM, kiraan transkrip/gen)Bahagian ini membandingkan alat berasaskan penjajaran seperti STAR dan HISAT2 dengan alat pseudo-penjajaran seperti Salmon dan kallisto, menyerlahkan pertukaran dalam kelajuan, ketepatan, penggunaan sumber, dan output termasuk fail BAM dan kiraan tahap transkrip atau gen.
Bila memilih penjajar STAR atau HISAT2Mengkonfigurasi indeks genom dan anotasiMenggunakan Salmon dalam mod quasi-mappingMenjalankan kallisto untuk kuantifikasi cepatMembandingkan output gaya BAM dan quant.sfPenanda aras kelajuan, ingatan, dan ketepatan