Aula 1Análise de expressão diferencial: DESeq2, edgeR, limma-voom — design de modelo, contrastes e correção para múltiplos testesEsta seção detalha fluxos de trabalho de expressão diferencial usando DESeq2, edgeR e limma-voom, focando em design de modelo, contrastes, estimação de dispersão e correção para múltiplos testes para obter listas confiáveis de genes e estimativas de tamanho de efeito.
Projeto de modelos experimentais e covariáveisDefinição de contrastes para comparações complexasExecução do workflow completo do DESeq2Uso dos pipelines edgeR e limma-voomCorreção para múltiplos testes e controle de FDRInterpretação de mudanças log2 fold e shrinkageAula 2Organização de dados e convenções de nomenclatura de arquivos: planilhas de amostras, separação raw/processado, identificadores consistentesEsta seção descreve as melhores práticas para organizar arquivos de projetos RNA-seq, incluindo planilhas de amostras, layouts de diretórios, separação entre dados brutos e processados, e identificadores consistentes que simplificam scripts, rastreamento e reprodutibilidade.
Projeto de hierarquia clara de diretóriosSeparação de dados brutos e processadosCriação de planilhas robustas de amostras e metadadosIdentificadores consistentes de amostras e bibliotecasVersionamento de genomas de referência e índicesBackup e arquivamento de dados do projetoAula 3Estratégias de quantificação em nível gênico: featureCounts, htseq-count, tximport para sumarização de transcrito-para-gêneEsta seção explica a quantificação em nível gênico a partir de leituras alinhadas ou pseudo-alinhadas, comparando featureCounts e htseq-count, e detalhando como o tximport agrega estimativas em nível de transcrito em matrizes robustas em nível gênico para análise estatística downstream.
Contagem de leituras com opções do featureCountsUso dos modos e anotações do htseq-countTratamento de strandedness e leituras multimapeadasImportação de Salmon e kallisto com tximportConstrução de matrizes de contagens em nível gênicoAvaliação da qualidade e cobertura da quantificaçãoAula 4Ferramentas para download e organização de dados: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync e entradas/saídas recomendadasEsta seção cobre estratégias confiáveis para download e organização de dados RNA-seq, focando no SRA Toolkit, acesso ao ENA, ferramentas de transferência em linha de comando e definição de estruturas consistentes de entrada e saída que suportam automação e reprodutibilidade.
Uso do prefetch e fasterq-dump do SRA ToolkitAcesso ao ENA via FTP e AsperaDownload seguro com wget e rsyncEscolha de formatos de arquivos brutos e processadosDocumentação de metadados de download e checksumsAutomação de downloads com scripts e logsAula 5Ferramentas e saídas de controle de qualidade: FastQC, MultiQC, métricas chave para inspecionar (qualidade por base, conteúdo de adaptadores, duplicação, GC)Esta seção foca no controle de qualidade de RNA-seq, usando FastQC e MultiQC para resumir métricas chave como qualidade por base, contaminação por adaptadores, duplicação e conteúdo de GC, e decidir se é necessário trimming ou resequenciamento.
Execução do FastQC em leituras brutas e trimadasInterpretação de perfis de qualidade por baseDetecção de adaptadores e sequências sobre-representadasAvaliação de duplicação e conteúdo de GCAgregação de relatórios com MultiQCDefinição de limiares e ações de QCAula 6Trimming e filtragem de leituras: quando fazer trim, ferramentas (Trim Galore/Cutadapt/fastp), parâmetros principais e saídasEsta seção explica quando e como fazer trim de leituras RNA-seq, cobrindo trimming de adaptadores e qualidade, filtragem de comprimento, e parâmetros chave em ferramentas como Trim Galore, Cutadapt e fastp, evitando over-trimming que prejudica análises downstream.
Decisão sobre necessidade de trimmingEstratégias de detecção e remoção de adaptadoresLimiares de trimming baseados em qualidadeFiltros de comprimento mínimo e complexidadeUso das opções Trim Galore e CutadaptFastp para QC e trimming integradosAula 7Análises downstream básicas: enriquecimento GO/KEGG (clusterProfiler), GSEA preranked, visualização de vias, seleção de conjuntos gênicosEsta seção introduz análises funcionais downstream após expressão diferencial, incluindo enriquecimento GO e KEGG com clusterProfiler, GSEA preranked, visualização de vias e estratégias principistas para seleção e filtragem de conjuntos gênicos.
Preparação de listas de genes rankeados para GSEAEnriquecimento GO e KEGG com clusterProfilerEscolha de bancos de dados de conjuntos gênicos apropriadosVisualização de vias e redes enriquecidasFiltragem e priorização de conjuntos gênicosRelatório de resultados funcionais de forma reprodutívelAula 8Layout de alto nível do pipeline: download de dados, QC, trimming, alinhamento/pseudo-alinhamento, quantificação, expressão diferencial, análise downstreamEsta seção apresenta a estrutura geral do pipeline RNA-seq, desde aquisição de dados e QC através de trimming, alinhamento ou pseudo-alinhamento, quantificação, normalização, expressão diferencial e análise funcional downstream, enfatizando workflows modulares e scriptados.
Definição de estágios e dependências do pipelinePlanejamento de entradas, saídas e fluxo de arquivosIntegração de QC, trimming e alinhamentoLigação de quantificação à análise DEConexão de DE a workflows de enriquecimentoDocumentação do pipeline com diagramasAula 9Normalização e análise exploratória de dados: limites TPM/FPKM, normalização DESeq2, PCA, mapas de calor de distância amostra-amostraEsta seção cobre normalização e análise exploratória de dados RNA-seq, discutindo limitações de TPM e FPKM, normalização baseada em DESeq2, estabilização de variância, análise de componentes principais e mapas de calor de distância de amostras para detecção de efeitos de batch.
Limitações das medidas TPM e FPKMFatores de tamanho e normalização DESeq2Transformações variance-stabilizing e rlogAnálise de componentes principais de amostrasMapas de calor de distância amostra-amostraDetecção de efeitos de batch e outliersAula 10Melhores práticas de visualização básica: gráficos MA, volcano plots, mapas de calor, dotplots de vias e opções de relatórios interativos (R Markdown, Jupyter)Esta seção introduz estratégias efetivas de visualização para resultados RNA-seq, enfatizando comunicação clara de expressão diferencial, estrutura de amostras e mudanças de vias usando gráficos estáticos e relatórios interativos e reprodutíveis construídos em R Markdown ou Jupyter.
Construção e interpretação de gráficos MADesign de volcano plots claros para genes DEConstrução de mapas de calor de qualidade publicacionalDotplots de vias para resultados de enriquecimentoRelatórios RNA-seq interativos em R MarkdownVisualização exploratória baseada em JupyterAula 11Alinhamento vs pseudo-alinhamento: STAR, HISAT2, Salmon, kallisto — tradeoffs e saídas (BAM, contagens transcrito/gêne)Esta seção compara ferramentas baseadas em alinhamento como STAR e HISAT2 com ferramentas de pseudo-alinhamento como Salmon e kallisto, destacando tradeoffs em velocidade, precisão, uso de recursos e saídas incluindo arquivos BAM e contagens em nível de transcrito ou gênico.
Quando escolher alinhadores STAR ou HISAT2Configuração de índices de genoma e anotaçõesUso do Salmon em modo quasi-mappingExecução do kallisto para quantificação rápidaComparação de saídas BAM e quant.sfBenchmark de velocidade, memória e precisão