Lecția 1Analiza expresiei diferențiale: DESeq2, edgeR, limma-voom — design model, contraste și corecție testări multipleAceastă secțiune detaliază fluxurile de lucru pentru expresie diferențială folosind DESeq2, edgeR și limma-voom, concentrându-se pe design model, contraste, estimare dispersie și corecție testări multiple pentru obținerea listelor de gene fiabile și estimări de mărime efect.
Proiectarea modelelor experimentale și covariabilelorSetarea contrastelor pentru comparații complexeRulează fluxul DESeq2 end-to-endFolosirea pipeline-urilor edgeR și limma-voomCorecție testări multiple și control FDRInterpretarea schimbărilor log2 fold și contracțieLecția 2Organizarea datelor și convenții de denumire fișiere: foi probe, separare raw/procesate, identificatori consistențiAceastă secțiune descrie cele mai bune practici pentru organizarea fișierelor proiect RNA-seq, inclusiv foi probe, structuri directoare, separare date raw versus procesate și identificatori consistenți care simplifică scriptarea, urmărirea și reproductibilitatea.
Proiectarea unei ierarhii clare de directoareSepararea datelor raw și procesateCrearea foilor robuste de probe și metadateIdentificatori consistenți de probe și biblioteciVersiuni genom referință și indecșiBackup și arhivare date proiectLecția 3Strategii de cuantificare la nivel de gen: featureCounts, htseq-count, tximport pentru sumarizare transcript-la-genAceastă secțiune explică cuantificarea la nivel de gen din citiri aliniate sau pseudo-aliate, comparând featureCounts și htseq-count și detaliind cum tximport agregă estimările la nivel de transcript în matrici robuste la nivel de gen pentru analiza statistică ulterioară.
Contorizarea citirilor cu opțiuni featureCountsFolosirea modurilor htseq-count și adnotăriGestionarea strandedness și citiri multimappingImport Salmon și kallisto cu tximportConstruirea matricelor de conturi la nivel de genEvaluarea calității cuantificării și acopeririiLecția 4Instrumente pentru descărcare și organizare date: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync și intrări/ieșiri recomandateAceastă secțiune acoperă strategii fiabile pentru descărcarea și organizarea datelor RNA-seq, concentrându-se pe SRA Toolkit, acces ENA, instrumente de transfer linie de comandă și definirea structurilor consistente de intrare și ieșire care susțin automatizarea și reproductibilitatea.
Folosirea SRA Toolkit prefetch și fasterq-dumpAcces ENA via FTP și AsperaDescărcare sigură cu wget și rsyncAlegerea formatelor de fișiere raw și procesateDocumentarea metadatelor de descărcare și checksum-urilorAutomatizarea descărcărilor cu scripturi și loguriLecția 5Instrumente control calitate și ieșiri: FastQC, MultiQC, metrici cheie de inspectat (calitate per-bază, conținut adaptor, duplicare, GC)Această secțiune se concentrează pe controlul calității RNA-seq, folosind FastQC și MultiQC pentru a sumariza metrici cheie precum calitatea per-bază, contaminare adaptor, duplicare și conținut GC și pentru a decide dacă este necesară tăierea sau resecvențierea.
Rulează FastQC pe citiri raw și tăiateInterpretarea profilurilor de calitate per-bazăDetectarea adaptorilor și secvențelor supra-reprezentateEvaluarea duplicării și conținutului GCAgregarea rapoartelor cu MultiQCDefinirea pragurilor QC și acțiunilorLecția 6Tăierea și filtrarea citirilor: când să tai, instrumente (Trim Galore/Cutadapt/fastp), parametri principali și ieșiriAceastă secțiune explică când și cum să tai citirile RNA-seq, acoperind tăierea adaptorilor și calității, filtrarea lungimii și parametrii cheie în instrumente precum Trim Galore, Cutadapt și fastp, evitând supra-tăierea care dăunează analizelor ulterioare.
Deciderea dacă tăierea este necesarăStrategii de detectare și eliminare adaptoriPraguri de tăiere bazate pe calitateFiltre minim lungime și complexitateFolosirea opțiunilor Trim Galore și CutadaptFastp pentru QC integrat și tăiereLecția 7Analize ulterioare de bază: îmbogățire GO/KEGG (clusterProfiler), GSEA preranked, vizualizare căi, selecție seturi geneAceastă secțiune introduce analize funcționale ulterioare după expresia diferențială, inclusiv îmbogățire GO și KEGG cu clusterProfiler, GSEA preranked, vizualizare căi și strategii principiale pentru selectarea și filtrarea seturilor de gene.
Pregătirea listelor de gene clasate pentru GSEAÎmbogățire GO și KEGG cu clusterProfilerAlegerea bazelor de date adecvate de seturi geneVizualizarea căilor îmbogățite și rețelelorFiltrarea și prioritizarea seturilor de geneRaportarea reproductibilă a rezultatelor funcționaleLecția 8Structura generală a pipeline-ului: descărcare date, QC, tăiere, aliniere/pseudo-aliniere, cuantificare, expresie diferențială, analiză ulterioarăAceastă secțiune prezintă structura generală a pipeline-ului RNA-seq, de la achiziția datelor și QC prin tăiere, aliniere sau pseudo-aliniere, cuantificare, normalizare, expresie diferențială și analiză funcțională ulterioară, subliniind fluxuri modulare, scriptate.
Definirea etapelor pipeline și dependențelorPlanificarea intrărilor, ieșirilor și fluxului fișierelorIntegrarea QC, tăierii și alinieriiLegarea cuantificării de analiza DEConectarea DE la fluxurile de îmbogățireDocumentarea pipeline-ului cu diagrameLecția 9Normalizare și analiză exploratorie date: limite TPM/FPKM, normalizare DESeq2, PCA, hărți distanță eșantion-eșantionAceastă secțiune acoperă normalizarea și analiza exploratorie a datelor RNA-seq, discutând limitările TPM și FPKM, normalizarea bazată pe DESeq2, stabilizarea variaței, analiza componentelor principale și hărți de distanță eșantion pentru detectarea efectelor de lot.
Limitările măsurătorilor TPM și FPKMFactori de mărime DESeq2 și normalizareTransformări variance-stabilizing și rlogAnaliza componentelor principale a eșantioanelorHărți distanță eșantion-eșantionDetectarea efectelor de lot și outlier-ilorLecția 10Cele mai bune practici vizualizare de bază: grafice MA, volcano plots, heatmaps, dotplots căi, opțiuni rapoarte interactive (R Markdown, Jupyter)Această secțiune introduce strategii eficiente de vizualizare pentru rezultatele RNA-seq, subliniind comunicarea clară a expresiei diferențiale, structurii eșantioanelor și schimbărilor de căi folosind grafice statice și rapoarte interactive, reproductibile construite în R Markdown sau Jupyter.
Construirea și interpretarea graficelor MAProiectarea volcano plots clare pentru gene DEConstruirea heatmaps de calitate publicațieDotplots căi pentru rezultate îmbogățireRapoarte RNA-seq interactive R MarkdownVizualizare exploratorie bazată pe JupyterLecția 11Aliniere vs pseudo-aliniere: STAR, HISAT2, Salmon, kallisto — compromisuri și ieșiri (BAM, conturi transcript/gen)Această secțiune compară instrumentele bazate pe aliniere precum STAR și HISAT2 cu instrumentele de pseudo-aliniere precum Salmon și kallisto, evidențiind compromisurile în viteză, acuratețe, utilizare resurse și ieșiri inclusiv fișiere BAM și conturi la nivel de transcript sau gen.
Când să alegi aliniere STAR sau HISAT2Configurarea indecșilor genom și adnotărilorFolosirea Salmon în mod quasi-mappingRulează kallisto pentru cuantificare rapidăCompararea ieșirilor BAM și quant.sfBenchmarking viteză, memorie și acuratețe