Μάθημα 1Ανάλυση διαφορικής έκφρασης: DESeq2, edgeR, limma-voom — σχεδιασμός μοντέλου, αντιθέσεις και διόρθωση πολλαπλών δοκιμώνΑυτή η ενότητα περιγράφει ροές εργασίας διαφορικής έκφρασης χρησιμοποιώντας DESeq2, edgeR και limma-voom, εστιάζοντας σε σχεδιασμό μοντέλου, αντιθέσεις, εκτίμηση διασποράς και διόρθωση πολλαπλών δοκιμών για αξιόπιστες λίστες γονιδίων και εκτιμήσεις μεγέθους εφέ.
Σχεδιασμός πειραματικών μοντέλων και covariatesΟρισμός αντιθέσεων για σύνθετες συγκρίσειςΕκτέλεση πλήρους ροής εργασίας DESeq2Χρήση αγωγών edgeR και limma-voomΔιόρθωση πολλαπλών δοκιμών και έλεγχος FDRΕρμηνεία log2 αλλαγών πτυχής και συρρίκνωσηςΜάθημα 2Οργάνωση δεδομένων και συμβάσεις ονοματοδοσίας αρχείων: φύλλα δειγμάτων, διαχωρισμός raw/επεξεργασμένων, συνεπή αναγνωριστικάΑυτή η ενότητα περιγράφει βέλτιστες πρακτικές για οργάνωση αρχείων έργου RNA-seq, συμπεριλαμβανομένων φύλλων δειγμάτων, διατάξεων καταλόγων, διαχωρισμού ακατέργαστων έναντι επεξεργασμένων δεδομένων και συνεπών αναγνωριστικών που απλοποιούν scripting, παρακολούθηση και αναπαραγωγικότητα.
Σχεδιασμός σαφούς ιεραρχίας καταλόγουΔιαχωρισμός ακατέργαστων και επεξεργασμένων δεδομένωνΔημιουργία ισχυρών φύλλων δειγμάτων και μεταδεδομένωνΣυνεπή αναγνωριστικά δειγμάτων και βιβλιοθήκηςΈκδοση αναφορών γονιδιωμάτων και ευρετηρίωνBackup και αρχειοθέτηση δεδομένων έργουΜάθημα 3Στρατηγικές ποσοτικοποίησης επιπέδου γονιδίου: featureCounts, htseq-count, tximport για σύνοψη μεταγραφής-σε-γονίδιοΑυτή η ενότητα εξηγεί ποσοτικοποίηση επιπέδου γονιδίου από ευθυγραμμισμένες ή ψευδοευθυγραμμισμένες αναγνώσεις, συγκρίνοντας featureCounts και htseq-count, και περιγράφοντας πώς το tximport συγκεντρώνει εκτιμήσεις επιπέδου μεταγραφής σε ισχυρές πίνακες επιπέδου γονιδίου για στατιστική ανάλυση περαιτέρω.
Μέτρηση αναγνώσεων με επιλογές featureCountsΧρήση λειτουργιών και σχολιασμών htseq-countΔιαχείριση προσανατολισμού και πολυχαρτογράφησης αναγνώσεωνΕισαγωγή Salmon και kallisto με tximportΔημιουργία πινάκων μετρήσεων επιπέδου γονιδίουΑξιολόγηση ποιότητας και κάλυψης ποσοτικοποίησηςΜάθημα 4Εργαλεία λήψης και οργάνωσης δεδομένων: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync και συνιστώμενες εισόδους/εξόδουςΑυτή η ενότητα καλύπτει αξιόπιστες στρατηγικές λήψης και οργάνωσης δεδομένων RNA-seq, εστιάζοντας σε SRA Toolkit, πρόσβαση ENA, εργαλεία μεταφοράς γραμμής εντολών και ορισμό συνεπών δομών εισόδου και εξόδου που υποστηρίζουν αυτοματισμό και αναπαραγωγικότητα.
Χρήση SRA Toolkit prefetch και fasterq-dumpΠρόσβαση ENA μέσω FTP και AsperaΑσφαλής λήψη με wget και rsyncΕπιλογή μορφών αρχείων ακατέργαστων και επεξεργασμένωνΤεκμηρίωση μεταδεδομένων λήψης και checksumsΑυτοματισμός λήψεων με scripts και logsΜάθημα 5Εργαλεία ελέγχου ποιότητας και εξόδους: FastQC, MultiQC, βασικά μετρήματα προς επιθεώρηση (ποιότητα ανά βάση, περιεχόμενο adapter, διπλασιασμός, GC)Αυτή η ενότητα εστιάζει σε έλεγχο ποιότητας RNA-seq, χρησιμοποιώντας FastQC και MultiQC για σύνοψη βασικών μετρημάτων όπως ποιότητα ανά βάση, μόλυνση adapter, διπλασιασμό και περιεχόμενο GC, και απόφαση αν απαιτείται κλάδεμα ή επανααλληλούχιση.
Εκτέλεση FastQC σε ακατέργαστες και κλαδευμένες αναγνώσειςΕρμηνεία προφίλ ποιότητας ανά βάσηΕντοπισμός adapters και υπερεκπροσωποποιημένων ακολουθιώνΑξιολόγηση διπλασιασμού και περιεχομένου GCΣυγκέντρωση εκθέσεων με MultiQCΟρισμός ορίων QC και ενεργειώνΜάθημα 6Κλάδεμα και φιλτράρισμα αναγνώσεων: πότε να κλαδέψετε, εργαλεία (Trim Galore/Cutadapt/fastp), κύριες παράμετροι και εξόδουςΑυτή η ενότητα εξηγεί πότε και πώς να κλαδέψετε αναγνώσεις RNA-seq, καλύπτοντας κλάδεμα adapter και ποιότητας, φιλτράρισμα μήκους και βασικές παραμέτρους σε εργαλεία όπως Trim Galore, Cutadapt και fastp, αποφεύγοντας υπερβολικό κλάδεμα που βλάπτει αναλύσεις περαιτέρω.
Απόφαση αν είναι απαραίτητο κλάδεμαΣτρατηγικές εντοπισμού και αφαίρεσης adapterΌρια κλαδέματος βάσει ποιότηταςΕλάχιστα φίλτρα μήκους και πολυπλοκότηταςΧρήση επιλογών Trim Galore και CutadaptFastp για ολοκληρωμένο QC και κλάδεμαΜάθημα 7Βασικές αναλύσεις περαιτέρω: εμπλουτισμός GO/KEGG (clusterProfiler), GSEA προετοιμασμένο, οπτικοποίηση μονοπατιού και επιλογή συνόλου γονιδίωνΑυτή η ενότητα εισάγει λειτουργικές αναλύσεις περαιτέρω μετά διαφορική έκφραση, συμπεριλαμβανομένου εμπλουτισμού GO και KEGG με clusterProfiler, προετοιμασμένη GSEA, οπτικοποίηση μονοπατιού και ορθές στρατηγικές επιλογής και φιλτραρίσματος συνόλων γονιδίων.
Προετοιμασία ταξινομημένων λιστών γονιδίων για GSEAΕμπλουτισμός GO και KEGG με clusterProfilerΕπιλογή κατάλληλων βάσεων δεδομένων συνόλων γονιδίωνΟπτικοποίηση εμπλουτισμένων μονοπατιών και δικτύωνΦιλτράρισμα και προτεραιοποίηση συνόλων γονιδίωνΑναφορά λειτουργικών αποτελεσμάτων αναπαραγωγικάΜάθημα 8Γενική διάταξη αγωγού υψηλού επιπέδου: λήψη δεδομένων, QC, κλάδεμα, ευθυγράμμιση/ψευδοευθυγράμμιση, ποσοτικοποίηση, διαφορική έκφραση, ανάλυση περαιτέρωΑυτή η ενότητα παρουσιάζει τη συνολική δομή αγωγού RNA-seq, από απόκτηση και QC δεδομένων μέσω κλαδέματος, ευθυγράμμισης ή ψευδοευθυγράμμισης, ποσοτικοποίησης, ομαλοποίησης, διαφορικής έκφρασης και λειτουργικής ανάλυσης περαιτέρω, τονίζοντας modular, scripted ροές εργασίας.
Ορισμός σταδίων αγωγού και εξαρτήσεωνΣχεδιασμός εισόδων, εξόδων και ροής αρχείωνΕνσωμάτωση QC, κλαδέματος και ευθυγράμμισηςΣύνδεση ποσοτικοποίησης με ανάλυση DEΣύνδεση DE με ροές εμπλουτισμούΤεκμηρίωση αγωγού με διαγράμματαΜάθημα 9Ομαλοποίηση και εκρευγητική ανάλυση δεδομένων: όρια TPM/FPKM, ομαλοποίηση DESeq2, PCA, θερμικούς χάρτες απόστασης δείγματος-δείγματοςΑυτή η ενότητα καλύπτει ομαλοποίηση και εκρευγητική ανάλυση δεδομένων RNA-seq, συζητώντας περιορισμούς TPM και FPKM, ομαλοποίηση βάσει DESeq2, σταθεροποίηση διακύμανσης, ανάλυση κύριων συστατικών και θερμικούς χάρτες απόστασης δείγματος για εντοπισμό εφέ batch.
Περιορισμοί μετρήσεων TPM και FPKMΠαράγοντες μεγέθους DESeq2 και ομαλοποίησηΜετασχηματισμοί σταθεροποίησης διακύμανσης και rlogΑνάλυση κύριων συστατικών δειγμάτωνΘερμικοί χάρτες απόστασης δείγματος-δείγματοςΕντοπισμός εφέ batch και ακραίων τιμώνΜάθημα 10Βασικές βέλτιστες πρακτικές οπτικοποίησης: MA plots, ηφαίστειο plots, θερμικούς χάρτες, dotplots μονοπατιού και επιλογές διαδραστικής αναφοράς (R Markdown, Jupyter)Αυτή η ενότητα εισάγει αποτελεσματικές στρατηγικές οπτικοποίησης για αποτελέσματα RNA-seq, τονίζοντας σαφή επικοινωνία διαφορικής έκφρασης, δομής δείγματος και αλλαγών μονοπατιού χρησιμοποιώντας στατικές γραφικές και διαδραστικές, αναπαραγωγικές αναφορές φτιαγμένες σε R Markdown ή Jupyter.
Κατασκευή και ερμηνεία MA plotsΣχεδιασμός σαφών ηφαίστειο plots για γονίδια DEΔημιουργία θερμικών χαρτών δημοσίευσηςDotplots μονοπατιού για αποτελέσματα εμπλουτισμούΔιαδραστικές αναφορές RNA-seq R MarkdownΟπτικοποίηση εκρευγητικής βάσει JupyterΜάθημα 11Ευθυγράμμιση vs ψευδοευθυγράμμιση: STAR, HISAT2, Salmon, kallisto — συμβιβασμοί και εξόδους (BAM, μετρήσεις μεταγραφής/γονιδίου)Αυτή η ενότητα συγκρίνει εργαλεία βάσει ευθυγράμμισης όπως STAR και HISAT2 με εργαλεία ψευδοευθυγράμμισης όπως Salmon και kallisto, τονίζοντας συμβιβασμούς σε ταχύτητα, ακρίβεια, χρήση πόρων και εξόδους συμπεριλαμβανομένων αρχείων BAM και μετρήσεων επιπέδου μεταγραφής ή γονιδίου.
Πότε να επιλέξετε ευθυγραμμιστές STAR ή HISAT2Ρύθμιση ευρετηρίων γονιδιώματος και σχολιασμώνΧρήση Salmon σε λειτουργία quasi-mappingΕκτέλεση kallisto για ταχεία ποσοτικοποίησηΣύγκριση εξόδων στυλ BAM και quant.sfBenchmarking ταχύτητας, μνήμης και ακρίβειας