Pelajaran 1Analisis ekspresi diferensial: DESeq2, edgeR, limma-voom — desain model, kontras, dan koreksi pengujian bergandaBagian ini merinci alur kerja ekspresi diferensial menggunakan DESeq2, edgeR, dan limma-voom, dengan fokus pada desain model, kontras, estimasi dispersi, dan koreksi pengujian berganda untuk mendapatkan daftar gen yang andal dan estimasi ukuran efek.
Merancang model eksperimental dan kovariatMenetapkan kontras untuk perbandingan kompleksMenjalankan alur kerja DESeq2 secara end-to-endMenggunakan pipeline edgeR dan limma-voomKoreksi pengujian berganda dan kontrol FDRMenginterpretasikan perubahan lipat log2 dan shrinkagePelajaran 2Pengorganisasian data dan konvensi penamaan file: lembar sampel, pemisahan mentah/terproses, identifikasi konsistenBagian ini menggambarkan praktik terbaik untuk mengorganisasi file proyek RNA-seq, termasuk lembar sampel, tata letak direktori, pemisahan data mentah versus terproses, dan identifikasi konsisten yang mempermudah scripting, pelacakan, dan reproduktibilitas.
Merancang hierarki direktori yang jelasMemisahkan data mentah dan terprosesMembuat lembar sampel dan metadata yang kuatIdentifikasi sampel dan perpustakaan yang konsistenPemberian versi genom referensi dan indeksCadangan dan pengarsipan data proyekPelajaran 3Strategi kuantifikasi tingkat gen: featureCounts, htseq-count, tximport untuk ringkasan transkrip-ke-genBagian ini menjelaskan kuantifikasi tingkat gen dari baca yang disejajarkan atau pseudo-disejajarkan, membandingkan featureCounts dan htseq-count, serta merinci bagaimana tximport mengagregasi estimasi tingkat transkrip menjadi matriks tingkat gen yang kuat untuk analisis statistik lanjutan.
Menghitung baca dengan opsi featureCountsMenggunakan mode dan anotasi htseq-countMenangani strandedness dan baca multimappingMengimpor Salmon dan kallisto dengan tximportMembangun matriks hitungan tingkat genMenilai kualitas dan cakupan kuantifikasiPelajaran 4Alat untuk pengunduhan dan pengorganisasian data: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, dan input/output yang direkomendasikanBagian ini membahas strategi andal untuk mengunduh dan mengorganisasi data RNA-seq, dengan fokus pada SRA Toolkit, akses ENA, alat transfer baris perintah, dan mendefinisikan struktur input dan output konsisten yang mendukung otomatisasi dan reproduktibilitas.
Menggunakan prefetch dan fasterq-dump SRA ToolkitMengakses ENA melalui FTP dan AsperaMengunduh dengan wget dan rsync secara amanMemilih format file mentah dan terprosesMendokumentasikan metadata unduhan dan checksumMengotomatisasi unduhan dengan skrip dan logPelajaran 5Alat pengendalian kualitas dan output: FastQC, MultiQC, metrik kunci untuk diperiksa (kualitas per-basa, konten adapter, duplikasi, GC)Bagian ini berfokus pada pengendalian kualitas RNA-seq, menggunakan FastQC dan MultiQC untuk merangkum metrik kunci seperti kualitas per-basa, kontaminasi adapter, duplikasi, dan konten GC, serta memutuskan apakah pemangkasan atau pengurutan ulang diperlukan.
Menjalankan FastQC pada baca mentah dan terpangkasMenginterpretasikan profil kualitas per-basaMendeteksi adapter dan urutan berlebihanMenilai duplikasi dan konten GCMerangkum laporan dengan MultiQCMendefinisikan ambang QC dan tindakanPelajaran 6Pemangkasan dan penyaringan baca: kapan memangkas, alat (Trim Galore/Cutadapt/fastp), parameter utama dan outputBagian ini menjelaskan kapan dan bagaimana memangkas baca RNA-seq, mencakup pemangkasan adapter dan kualitas, penyaringan panjang, dan parameter kunci dalam alat seperti Trim Galore, Cutadapt, dan fastp, sambil menghindari pemangkasan berlebihan yang merugikan analisis lanjutan.
Memutuskan apakah pemangkasan diperlukanStrategi deteksi dan penghapusan adapterAmbang pemangkasan berbasis kualitasFilter panjang minimum dan kompleksitasMenggunakan opsi Trim Galore dan CutadaptFastp untuk QC dan pemangkasan terintegrasiPelajaran 7Analisis lanjutan dasar: pengayaan GO/KEGG (clusterProfiler), GSEA preranked, visualisasi jalur, dan pemilihan set genBagian ini memperkenalkan analisis fungsional lanjutan setelah ekspresi diferensial, termasuk pengayaan GO dan KEGG dengan clusterProfiler, GSEA preranked, visualisasi jalur, dan strategi prinsip untuk memilih dan menyaring set gen.
Mempersiapkan daftar gen berperingkat untuk GSEAPengayaan GO dan KEGG dengan clusterProfilerMemilih basis data set gen yang tepatMemvisualisasikan jalur dan jaringan yang diperkayaMenyaring dan memprioritaskan set genMelaporkan hasil fungsional secara reproduktifPelajaran 8Tata letak pipeline tingkat tinggi: unduh data, QC, pemangkasan, penjajaran/pseudo-penjajaran, kuantifikasi, ekspresi diferensial, analisis lanjutanBagian ini menyajikan struktur pipeline RNA-seq secara keseluruhan, dari akuisisi data dan QC melalui pemangkasan, penjajaran atau pseudo-penjajaran, kuantifikasi, normalisasi, ekspresi diferensial, dan analisis fungsional lanjutan, menekankan alur kerja modular dan berbasis skrip.
Mendefinisikan tahap pipeline dan ketergantunganMerencanakan input, output, dan alur fileMengintegrasikan QC, pemangkasan, dan penjajaranMenghubungkan kuantifikasi ke analisis DEMenghubungkan DE ke alur kerja pengayaanMendokumentasikan pipeline dengan diagramPelajaran 9Normalisasi dan analisis data eksploratori: batas TPM/FPKM, normalisasi DESeq2, PCA, heatmap jarak sampel-sampelBagian ini membahas normalisasi dan analisis eksploratori data RNA-seq, membahas keterbatasan TPM dan FPKM, normalisasi berbasis DESeq2, stabilisasi varians, analisis komponen utama, dan heatmap jarak sampel untuk mendeteksi efek batch.
Keterbatasan ukuran TPM dan FPKMFaktor ukuran DESeq2 dan normalisasiTransformasi variance-stabilizing dan rlogAnalisis komponen utama sampelHeatmap jarak sampel-sampelMendeteksi efek batch dan outlierPelajaran 10Praktik terbaik visualisasi dasar: plot MA, plot vulkan, heatmap, dotplot jalur, dan opsi laporan interaktif (R Markdown, Jupyter)Bagian ini memperkenalkan strategi visualisasi efektif untuk hasil RNA-seq, menekankan komunikasi yang jelas tentang ekspresi diferensial, struktur sampel, dan perubahan jalur menggunakan plot statis dan laporan interaktif, reproduktif yang dibuat di R Markdown atau Jupyter.
Membuat dan menginterpretasikan plot MAMerancang plot vulkan yang jelas untuk gen DEMembangun heatmap berkualitas publikasiDotplot jalur untuk hasil pengayaanLaporan RNA-seq R Markdown interaktifVisualisasi eksploratori berbasis JupyterPelajaran 11Penjajaran vs pseudo-penjajaran: STAR, HISAT2, Salmon, kallisto — trade-off dan output (BAM, hitungan transkrip/gen)Bagian ini membandingkan alat berbasis penjajaran seperti STAR dan HISAT2 dengan alat pseudo-penjajaran seperti Salmon dan kallisto, menyoroti trade-off dalam kecepatan, akurasi, penggunaan sumber daya, dan output termasuk file BAM dan hitungan tingkat transkrip atau gen.
Kapan memilih penjajar STAR atau HISAT2Mengonfigurasi indeks genom dan anotasiMenggunakan Salmon dalam mode quasi-mappingMenjalankan kallisto untuk kuantifikasi cepatMembandingkan output gaya BAM dan quant.sfBenchmarking kecepatan, memori, dan akurasi