שיעור 1ניתוח ביטוי דיפרנציאלי: DESeq2, edgeR, limma-voom — עיצוב מודל, ניגודים ותיקון בדיקות מרובותקטע זה מפרט זרימות עבודה לביטוי דיפרנציאלי באמצעות DESeq2, edgeR ו-limma-voom, עם דגש על עיצוב מודל, ניגודים, הערכת פיזור ותיקון בדיקות מרובות לקבלת רשימות גנים אמינות והערכות גודל אפקט.
Designing experimental models and covariatesSetting contrasts for complex comparisonsRunning DESeq2 end-to-end workflowUsing edgeR and limma-voom pipelinesMultiple-testing correction and FDR controlInterpreting log2 fold changes and shrinkageשיעור 2ארגון נתונים ומוסכמות שמות קבצים: גיליונות דגימות, הפרדה גולמי/מעובד, מזהים עקבייםקטע זה מתאר שיטות עבודה מומלצות לארגון קבצי פרויקט RNA-seq, כולל גיליונות דגימות, פריסות ספריות, הפרדה בין נתונים גולמיים לעובדים, ומזהים עקביים המפשטים כתיבת סקריפטים, מעקב ושחזור.
Designing a clear directory hierarchySeparating raw and processed dataCreating robust sample sheets and metadataConsistent sample and library identifiersVersioning reference genomes and indicesBacking up and archiving project dataשיעור 3אסטרטגיות כימות רמת גן: featureCounts, htseq-count, tximport לסיכום טרנסקריפט-לגןקטע זה מסביר כימות רמת גן מקריאות מיושרות או מדומות יישור, משווה featureCounts ו-htseq-count, ומפרט כיצד tximport מאגד הערכות רמת טרנסקריפט למטריצות רמת גן חזקות לניתוח סטטיסטי למטה.
Counting reads with featureCounts optionsUsing htseq-count modes and annotationsHandling strandedness and multimapping readsImporting Salmon and kallisto with tximportBuilding gene-level count matricesAssessing quantification quality and coverageשיעור 4כלים להורדת נתונים וארגון: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, וקלטים/פלטים מומלציםקטע זה מכסה אסטרטגיות אמינות להורדת וארגון נתוני RNA-seq, עם דגש על SRA Toolkit, גישה ENA, כלי העברה שורת פקודה, והגדרת מבנים קלט ופלט עקביים התומכים באוטומציה ושחזור.
Using SRA Toolkit prefetch and fasterq-dumpAccessing ENA via FTP and AsperaDownloading with wget and rsync safelyChoosing raw and processed file formatsDocumenting download metadata and checksumsAutomating downloads with scripts and logsשיעור 5כלי בקרת איכות ופלטים: FastQC, MultiQC, מדדים מרכזיים לבדיקה (איכות לבסיס, תכולת מתאמים, כפילות, GC)קטע זה מתמקד בבקרת איכות RNA-seq, באמצעות FastQC ו-MultiQC לסיכום מדדים מרכזיים כגון איכות לבסיס, זיהום מתאמים, כפילות ותכולת GC, ולקבוע אם נדרש גזירה או ריצוף מחדש.
Running FastQC on raw and trimmed readsInterpreting per-base quality profilesDetecting adapters and overrepresented sequencesEvaluating duplication and GC contentAggregating reports with MultiQCDefining QC thresholds and actionsשיעור 6גזירת קריאות וסינון: מתי לגזור, כלים (Trim Galore/Cutadapt/fastp), פרמטרים ופלטים עיקרייםקטע זה מסביר מתי וכיצד לגזור קריאות RNA-seq, מכסה גזירת מתאמים ואיכות, סינון אורך, ופרמטרים מרכזיים בכלים כגון Trim Galore, Cutadapt ו-fastp, תוך הימנעות מגזירה יתר הפוגעת בניתוחים למטה.
Deciding whether trimming is necessaryAdapter detection and removal strategiesQuality-based trimming thresholdsMinimum length and complexity filtersUsing Trim Galore and Cutadapt optionsFastp for integrated QC and trimmingשיעור 7ניתוחים למטה בסיסיים: העשרת GO/KEGG (clusterProfiler), GSEA מדורגת מראש, הדמיית מסלולים, ובחירת קבוצת גניםקטע זה מציג ניתוחים פונקציונליים למטה לאחר ביטוי דיפרנציאלי, כולל העשרת GO ו-KEGG עם clusterProfiler, GSEA מדורגת מראש, הדמיית מסלולים, ואסטרטגיות עקרוניות לבחירה וסינון קבוצות גנים.
Preparing ranked gene lists for GSEAGO and KEGG enrichment with clusterProfilerChoosing appropriate gene set databasesVisualizing enriched pathways and networksFiltering and prioritizing gene setsReporting functional results reproduciblyשיעור 8פריסת צינור רמה גבוהה: הורדת נתונים, QC, גזירה, יישור/יישור מדומה, כימות, ביטוי דיפרנציאלי, ניתוח למטהקטע זה מציג את מבנה צינור ה-RNA-seq הכללי, מרכישת נתונים ו-QC דרך גזירה, יישור או יישור מדומה, כימות, נורמליזציה, ביטוי דיפרנציאלי וניתוח פונקציונלי למטה, עם דגש על זרימות עבודה מודולריות ומתוסרטות.
Defining pipeline stages and dependenciesPlanning inputs, outputs, and file flowIntegrating QC, trimming, and alignmentLinking quantification to DE analysisConnecting DE to enrichment workflowsDocumenting the pipeline with diagramsשיעור 9נורמליזציה וניתוח נתונים חקרני: מגבלות TPM/FPKM, נורמליזציה DESeq2, PCA, מפות חום מרחק דגימה-דגימהקטע זה מכסה נורמליזציה וניתוח חקרני של נתוני RNA-seq, דן במגבלות TPM ו-FPKM, נורמליזציה מבוססת DESeq2, ייצוב שונות, ניתוח רכיב עיקרי ומפות מרחק דגימה-דגימה לזיהוי השפעות אצווה.
Limitations of TPM and FPKM measuresDESeq2 size factors and normalizationVariance-stabilizing and rlog transformsPrincipal component analysis of samplesSample-sample distance heatmapsDetecting batch effects and outliersשיעור 10שיטות עבודה מומלצות להדמיה בסיסית: גרפי MA, גרפי הר געש, מפות חום, נקודות מסלול, ואפשרויות דוח אינטראקטיבי (R Markdown, Jupyter)קטע זה מציג אסטרטגיות הדמיה יעילות לתוצאות RNA-seq, מדגיש תקשורת ברורה של ביטוי דיפרנציאלי, מבנה דגימה ושינויי מסלול באמצעות גרפים סטטיים ודוחות אינטראקטיביים, ניתנים לשחזור שנבנו ב-R Markdown או Jupyter.
Constructing and interpreting MA plotsDesigning clear volcano plots for DE genesBuilding publication-quality heatmapsPathway dotplots for enrichment resultsInteractive R Markdown RNA-seq reportsJupyter-based exploratory visualizationשיעור 11יישור לעומת יישור מדומה: STAR, HISAT2, Salmon, kallisto — פשרות ופלטים (BAM, ספירות טרנסקריפט/גן)קטע זה משווה כלי מבוססי יישור כגון STAR ו-HISAT2 עם כלי יישור מדומה כמו Salmon ו-kallisto, מדגיש פשרות במהירות, דיוק, שימוש במשאבים ופלטים כולל קבצי BAM וספירות רמת טרנסקריפט או גן.
When to choose STAR or HISAT2 alignersConfiguring genome indexes and annotationsUsing Salmon in quasi-mapping modeRunning kallisto for rapid quantificationComparing BAM and quant.sf style outputsBenchmarking speed, memory, and accuracy