Lekcija 1Analiza diferencialnega izražanja: DESeq2, edgeR, limma-voom — dizajn modela, kontrasti in korekcija večkratnega testiranjaTa razdelek podrobno opisuje delovne tokove diferencialnega izražanja z uporabo DESeq2, edgeR in limma-voom, s poudarkom na dizajnu modela, kontrastih, oceni disperzije in korekciji večkratnega testiranja za pridobitev zanesljivih seznamov genov in ocen velikosti učinkov.
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageLekcija 2Organizacija podatkov in konvencije poimenovanja datotek: liste vzorcev, ločitev surovih/obdelanih, dosledni identifikatorjiTa razdelek opisuje najboljše prakse za organizacijo datotek projekta RNA-seq, vključno s listami vzorcev, postavitvami imenikov, ločitvijo surovih od obdelanih podatkov in doslednimi identifikatorji, ki poenostavijo skriptiranje, sledenje in ponovljivost.
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataLekcija 3Strategije kvantifikacije na ravni gena: featureCounts, htseq-count, tximport za sumarizacijo transkript-do-genaTa razdelek pojasnjuje kvantifikacijo na ravni gena iz poravnavanih ali psevdo-poravnavanih branj, primerja featureCounts in htseq-count ter podrobno opisuje, kako tximport agregira ocene na ravni transkripta v robustne matrike na ravni gena za navzdolno statistično analizo.
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageLekcija 4Orodja za prenos podatkov in organizacijo: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync in priporočeni vhodi/izhodiTa razdelek obravnava zanesljive strategije za prenos in organizacijo podatkov RNA-seq, s poudarkom na SRA Toolkit, dostopu ENA, orodjih za prenos po ukazni vrstici in definiciji doslednih struktur vhodov in izhodov, ki podpirajo avtomatizacijo in ponovljivost.
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsLekcija 5Orodja in izhodi nadzora kakovosti: FastQC, MultiQC, ključne metrike za pregled (kakovost na bazo, vsebnost adapterjev, podvajanja, GC)Ta razdelek se osredotoča na nadzor kakovosti RNA-seq, uporabo FastQC in MultiQC za povzemanje ključnih metrik, kot so kakovost na bazo, onesnaženje adapterjev, podvajanja in vsebnost GC, ter odločanje, ali je potrebno obrezovanje ali ponovno sekvenciranje.
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsLekcija 6Obrezovanje in filtriranje branj: kdaj obrezati, orodja (Trim Galore/Cutadapt/fastp), glavni parametri in izhodiTa razdelek pojasnjuje, kdaj in kako obrezati branja RNA-seq, obravnava obrezovanje adapterjev in kakovosti, filtriranje dolžine in ključne parametre v orodjih, kot so Trim Galore, Cutadapt in fastp, pri čemer se izogiba prekomernemu obrezovanju, ki škoduje navzdolnim analizam.
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingLekcija 7Osnovne navzdolne analize: obogatitev GO/KEGG (clusterProfiler), predrangirano GSEA, vizualizacija poti in izbira genskega naboraTa razdelek uvaja navzdolne funkcionalne analize po diferencialnem izražanju, vključno z obogatitvijo GO in KEGG s clusterProfiler, predrangiranim GSEA, vizualizacijo poti in načelnimi strategijami za izbiro in filtriranje genskih naborov.
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyLekcija 8Višegnivna postavitev cevi: prenos podatkov, QC, obrezovanje, poravnava/psevdo-poravnava, kvantifikacija, diferencialno izražanje, navzdolna analizaTa razdelek predstavlja splošno strukturo cevi RNA-seq, od pridobivanja podatkov in QC prek obrezovanja, poravnave ali psevdo-poravnave, kvantifikacije, normalizacije, diferencialnega izražanja in navzdolne funkcionalne analize, s poudarkom na modularnih, skriptiranih delovnih tokovih.
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsLekcija 9Normalizacija in raziskovalna analiza podatkov: omejitve TPM/FPKM, normalizacija DESeq2, PCA, toplotne karte razdalj vzorec-vzorecTa razdelek obravnava normalizacijo in raziskovalno analizo podatkov RNA-seq, razpravlja o omejitvah TPM in FPKM, normalizaciji na osnovi DESeq2, stabilizaciji variance, analizi glavnih komponent in toplotnih kartah razdalj vzorcev za zaznavanje učinkov serije.
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersLekcija 10Najboljše prakse osnovne vizualizacije: MA grafi, vulkanski grafi, toplotne karte, točkovni grafi poti in možnosti interaktivnih poročil (R Markdown, Jupyter)Ta razdelek uvaja učinkovite strategije vizualizacije za rezultate RNA-seq, poudarja jasno komuniciranje diferencialnega izražanja, strukture vzorcev in sprememb poti z uporabo statičnih grafov in interaktivnih, ponovljivih poročil, zgrajених v R Markdown ali Jupyter.
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationLekcija 11Poravnava proti psevdo-poravnavi: STAR, HISAT2, Salmon, kallisto — kompromise in izhodi (BAM, transkript/gen štetja)Ta razdelek primerja orodja za poravnavo, kot sta STAR in HISAT2, s psevdo-poravnavnimi orodji, kot sta Salmon in kallisto, izpostavlja kompromise v hitrosti, natančnosti, uporabi virov in izhodih, vključno z datotekami BAM in štetji transkriptov ali genov.
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy