Somo 1Uchambuzi wa utofautishaji wa gene: DESeq2, edgeR, limma-voom — muundo wa modeli, kontrasti, na marekebisho ya majaribio mengiSehemu hii inaelezea mbinu za utofautishaji wa gene kwa kutumia DESeq2, edgeR, na limma-voom, ikilenga muundo wa modeli, kontrasti, makadirio ya mgawanyiko, na marekebisho ya majaribio mengi ili kupata orodha za gene zenye kuaminika na makadirio ya saizi ya athari.
Kubuni modeli za majaribio na covariatesKuweka kontrasti kwa ulinganisho mgumuKuendesha mtiririko wa kazi wa DESeq2 mwisho hadi mwishoKutumia mifumo ya edgeR na limma-voomMarekebisho ya majaribio mengi na udhibiti wa FDRKutafsiri mabadiliko ya log2 fold na kupunguzaSomo 2Upangaji wa data na mbinu za kutaja faili: karatasi za sampuli, kutenganisha ghafi/ilichakatwa, vitambulisho thabitiSehemu hii inaelezea mazoea bora ya kupanga faili za mradi wa RNA-seq, ikijumuisha karatasi za sampuli, mpangilio wa saraka, kutenganisha data ghafi dhidi ya ilichakatwa, na vitambulisho thabiti vinavyorahisisha scripting, ufuatiliaji, na kurudiwa.
Kubuni uongozi wa saraka waziKutenganisha data ghafi na ilichakatwaKuunda karatasi za sampuli na metadata zenye nguvuVitambulisho vya sampuli na maktaba thabitiKutoa toleo la jenome za marejeo na indicesHifadhi na kuhifadhi data ya mradiSomo 3Mkakati wa ukadiriaji wa kiwango cha gene: featureCounts, htseq-count, tximport kwa muhtasari wa transcript-to-geneSehemu hii inaelezea ukadiriaji wa kiwango cha gene kutoka kwa reads zilizopangwa au zilizopangwa-bandia, ikilinganisha featureCounts na htseq-count, na inaelezea jinsi tximport inavyokusanya makadirio ya kiwango cha transcript kuwa matriks thabiti za kiwango cha gene kwa uchambuzi wa takwimu wa chini.
Kuhesabu reads kwa chaguo za featureCountsKutumia hali za htseq-count na maelezoKushughulikia strandedness na reads za multimappingKuagiza Salmon na kallisto kwa tximportKujenga matriks za hesabu za kiwango cha geneKupima ubora wa ukadiriaji na ufikajiSomo 4Zana za kupakua data na kupanga: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, na inpoti/otpoti zinazopendekezwaSehemu hii inashughulikia mikakati thabiti ya kupakua na kupanga data za RNA-seq, ikilenga SRA Toolkit, upatikanaji wa ENA, zana za uhamisho wa amri, na kufafanua miundo thabiti ya inpoti na otpoti inayounga mkono automation na kurudiwa.
Kutumia SRA Toolkit prefetch na fasterq-dumpKupata ENA kupitia FTP na AsperaKupakua kwa wget na rsync kwa usalamaKuchagua miundo ya faili ghafi na ilichakatwaKuandika metadata ya upakuaji na checksumsKupakia kiotomatiki na logSomo 5Zana za udhibiti wa ubora na otpoti: FastQC, MultiQC, takwimu kuu za kukagua (ubora wa kila-base, maudhui ya adapter, nakili, GC)Sehemu hii inalenga udhibiti wa ubora wa RNA-seq, ikitumia FastQC na MultiQC kufupisha takwimu kuu kama ubora wa kila-base, uchafuzi wa adapter, nakili, na maudhui ya GC, na kuamua ikiwa kunahitaji trimming au kupanga upya.
Kuendesha FastQC kwenye reads ghafi na zilizokatwaKutafsiri profile za ubora wa kila-baseKugundua adapters na mifuatano iliyojaa kupita kiasiKupima nakili na maudhui ya GCKukusanya ripoti kwa MultiQCKufafanua viwango vya QC na hatuaSomo 6Trimming na kuchuja reads: lini ya trimming, zana (Trim Galore/Cutadapt/fastp), vigezo kuu na otpotiSehemu hii inaelezea lini na jinsi ya kutrimma reads za RNA-seq, ikishughulikia trimming ya adapter na ubora, kuchuja urefu, na vigezo muhimu katika zana kama Trim Galore, Cutadapt, na fastp, huku ikiepuka over-trimming inayoharibu uchambuzi wa chini.
Kuamua ikiwa trimming ni muhimuMkakati wa kugundua na kuondoa adapterViwango vya trimming vya msingi wa uboraChujio cha urefu wa chini na ugumuKutumia chaguo za Trim Galore na CutadaptFastp kwa QC na trimming iliyounganishwaSomo 7Uchambuzi wa chini msingi: utajiri wa GO/KEGG (clusterProfiler), GSEA preranked, uchora wa njia, na uchaguzi wa seti za geneSehemu hii inatanguliza uchambuzi wa utendaji wa chini baada ya utofautishaji wa gene, ikijumuisha utajiri wa GO na KEGG kwa clusterProfiler, GSEA preranked, uchora wa njia, na mikakati yenye kanuni ya kuchagua na kuchuja seti za gene.
Kuandaa orodha za gene zilizopangwa kwa GSEAUtajiri wa GO na KEGG kwa clusterProfilerKuchagua hifadhi za seti za gene zinazofaaKuchora njia zilizotajirika na mitandaoKuchuja na kuwatanguliza seti za geneKuripoti matokeo ya utendaji kwa kurudiwaSomo 8Mpangilio wa kiwango cha juu cha bomba: kupakua data, QC, trimming, upangaji/pseudo-alignment, ukadiriaji, utofautishaji wa gene, uchambuzi wa chiniSehemu hii inawasilisha muundo wa jumla wa bomba la RNA-seq, kutoka upataji wa data na QC kupitia trimming, upangaji au pseudo-alignment, ukadiriaji, usawazishaji, utofautishaji wa gene, na uchambuzi wa utendaji wa chini, ikisisitiza mtiririko wa kazi wa moduli, ulioandikwa.
Kufafanua hatua za bomba na utegemeziKupanga inpoti, otpoti, na mtiririko wa failiKuunganisha QC, trimming, na upangajiKuunganisha ukadiriaji na uchambuzi wa DEKuunganisha DE na mifumo ya utajiriKuandika bomba kwa michoroSomo 9Usawazishaji na uchambuzi wa data wa uchunguzi: mipaka ya TPM/FPKM, usawazishaji wa DESeq2, PCA, heatmaps za umbali wa sampuli-sampuliSehemu hii inashughulikia usawazishaji na uchambuzi wa uchunguzi wa data za RNA-seq, ikijadili mipaka ya TPM na FPKM, usawazishaji unaotegemea DESeq2, utulivu wa tofauti, uchambuzi wa kinadharia kuu cha vipengele, na heatmaps za umbali wa sampuli kwa kugundua athari za kundi.
Mipaka ya vipimo vya TPM na FPKMVipengele vya saizi vya DESeq2 na usawazishajiMabadiliko ya utulivu wa tofauti na rlogUchambuzi wa kinadharia kuu cha sampuliHeatmaps za umbali wa sampuli-sampuliKugundua athari za kundi na outliersSomo 10Mazoea bora ya uchora msingi: grafu za MA, grafu za volcano, heatmaps, dotplots za njia, na chaguo za ripoti zinazoingiliana (R Markdown, Jupyter)Sehemu hii inatanguliza mikakati bora ya kuchora matokeo ya RNA-seq, ikisisitiza mawasiliano wazi ya utofautishaji wa gene, muundo wa sampuli, na mabadiliko ya njia kwa kutumia grafu za tuli na ripoti zinazoingiliana, zinazoweza kurudiwa zilizojengwa katika R Markdown au Jupyter.
Kujenga na kutafsiri grafu za MAKubuni grafu za volcano wazi kwa gene za DEKujenga heatmaps za ubora wa kuchapishaDotplots za njia kwa matokeo ya utajiriRipoti za RNA-seq za R Markdown zinazoingilianaUchora wa uchunguzi unaotegemea JupyterSomo 11Upangaji dhidi ya pseudo-alignment: STAR, HISAT2, Salmon, kallisto — makubaliano na otpoti (BAM, transcript/genecounts)Sehemu hii inalinganisha zana za msingi za upangaji kama STAR na HISAT2 na zana za pseudo-alignment kama Salmon na kallisto, ikiangazia makubaliano katika kasi, usahihi, matumizi ya rasilimali, na otpoti ikijumuisha faili za BAM na hesabu za kiwango cha transcript au gene.
Lini ya kuchagua STAR au HISAT2 alignersKupanga indices za jenome na maelezoKutumia Salmon katika hali ya quasi-mappingKuendesha kallisto kwa ukadiriaji wa harakaKulinganisha otpoti za mtindo wa BAM na quant.sfKupima kasi, kumbukumbu, na usahihi