Aula 1Análise de expressão diferencial: DESeq2, edgeR, limma-voom — desenho do modelo, contrastes e correção de testes múltiplosEsta seção detalha fluxos de trabalho de expressão diferencial usando DESeq2, edgeR e limma-voom, focando em desenho do modelo, contrastes, estimação de dispersão e correção de testes múltiplos para obter listas de genes confiáveis e estimativas de tamanho de efeito.
Projetando modelos experimentais e covariáveisDefinindo contrastes para comparações complexasExecutando fluxo de trabalho DESeq2 de ponta a pontaUsando pipelines edgeR e limma-voomCorreção de testes múltiplos e controle FDRInterpretando mudanças log2 fold e shrinkageAula 2Organização de dados e convenções de nomenclatura de arquivos: planilhas de amostra, separação raw/processado, identificadores consistentesEsta seção descreve melhores práticas para organizar arquivos de projetos RNA-seq, incluindo planilhas de amostra, layouts de diretórios, separação de dados raw versus processados e identificadores consistentes que simplificam scriptagem, rastreamento e reprodutibilidade.
Projetando hierarquia clara de diretóriosSeparando dados raw e processadosCriando planilhas robustas de amostra e metadadosIdentificadores consistentes de amostra e bibliotecaVersionando genomas de referência e índicesFazendo backup e arquivando dados do projetoAula 3Estratégias de quantificação em nível gênico: featureCounts, htseq-count, tximport para sumarização transcrito-para-gêneEsta seção explica quantificação em nível gênico a partir de leituras alinhadas ou pseudo-alinhadas, comparando featureCounts e htseq-count, e detalhando como tximport agrega estimativas em nível de transcrito em matrizes robustas em nível gênico para análise estatística downstream.
Contando leituras com opções featureCountsUsando modos htseq-count e anotaçõesTratando strandedness e leituras multimapeadasImportando Salmon e kallisto com tximportConstruindo matrizes de contagem em nível gênicoAvaliando qualidade de quantificação e coberturaAula 4Ferramentas para download e organização de dados: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, e entradas/saídas recomendadasEsta seção cobre estratégias confiáveis para baixar e organizar dados RNA-seq, focando em SRA Toolkit, acesso ENA, ferramentas de transferência em linha de comando e definindo estruturas consistentes de entrada e saída que suportam automação e reprodutibilidade.
Usando SRA Toolkit prefetch e fasterq-dumpAcessando ENA via FTP e AsperaBaixando com wget e rsync com segurançaEscolhendo formatos de arquivo raw e processadoDocumentando metadados de download e checksumsAutomatizando downloads com scripts e logsAula 5Ferramentas e saídas de controle de qualidade: FastQC, MultiQC, métricas chave a inspecionar (qualidade por base, conteúdo de adaptador, duplicação, GC)Esta seção foca em controle de qualidade RNA-seq, usando FastQC e MultiQC para resumir métricas chave como qualidade por base, contaminação por adaptadores, duplicação e conteúdo GC, e decidir se trimming ou resequenciamento é necessário.
Executando FastQC em leituras raw e trimmedInterpretando perfis de qualidade por baseDetectando adaptadores e sequências sobre-representadasAvaliando duplicação e conteúdo GCAgregando relatórios com MultiQCDefinindo limiares QC e açõesAula 6Trimming e filtragem de leituras: quando fazer trim, ferramentas (Trim Galore/Cutadapt/fastp), parâmetros principais e saídasEsta seção explica quando e como fazer trim de leituras RNA-seq, cobrindo trimming de adaptadores e qualidade, filtragem de comprimento, e parâmetros chave em ferramentas como Trim Galore, Cutadapt e fastp, evitando over-trimming que prejudica análises downstream.
Decidindo se trimming é necessárioEstratégias de detecção e remoção de adaptadoresLimiares de trimming baseados em qualidadeFiltros de comprimento mínimo e complexidadeUsando opções Trim Galore e CutadaptFastp para QC e trimming integradosAula 7Análises downstream básicas: enriquecimento GO/KEGG (clusterProfiler), GSEA preranked, visualização de vias, e seleção de conjunto gênicoEsta seção introduz análises funcionais downstream após expressão diferencial, incluindo enriquecimento GO e KEGG com clusterProfiler, GSEA preranked, visualização de vias e estratégias principistas para selecionar e filtrar conjuntos gênicos.
Preparando listas de genes rankeados para GSEAEnriquecimento GO e KEGG com clusterProfilerEscolhendo bancos de dados de conjunto gênico apropriadosVisualizando vias e redes enriquecidasFiltrando e priorizando conjuntos gênicosReportando resultados funcionais de forma reprodutívelAula 8Layout de alto nível do pipeline: download de dados, QC, trimming, alinhamento/pseudo-alinhamento, quantificação, expressão diferencial, análise downstreamEsta seção apresenta a estrutura geral do pipeline RNA-seq, desde aquisição de dados e QC através de trimming, alinhamento ou pseudo-alinhamento, quantificação, normalização, expressão diferencial e análise funcional downstream, enfatizando fluxos de trabalho modulares e scriptados.
Definindo estágios do pipeline e dependênciasPlanejando entradas, saídas e fluxo de arquivosIntegrando QC, trimming e alinhamentoLigando quantificação à análise DEConectando DE a fluxos de enriquecimentoDocumentando o pipeline com diagramasAula 9Normalização e análise exploratória de dados: limites TPM/FPKM, normalização DESeq2, PCA, mapas de calor de distância amostra-amostraEsta seção cobre normalização e análise exploratória de dados RNA-seq, discutindo limitações de TPM e FPKM, normalização baseada em DESeq2, estabilização de variância, análise de componentes principais e mapas de calor de distância de amostra para detectar efeitos de lote.
Limitações das medidas TPM e FPKMFatores de tamanho DESeq2 e normalizaçãoTransformações estabilizadoras de variância e rlogAnálise de componentes principais de amostrasMapas de calor de distância amostra-amostraDetectando efeitos de lote e outliersAula 10Melhores práticas de visualização básica: gráficos MA, volcano plots, mapas de calor, dotplots de vias, e opções de relatório interativo (R Markdown, Jupyter)Esta seção introduz estratégias efetivas de visualização para resultados RNA-seq, enfatizando comunicação clara de expressão diferencial, estrutura de amostra e mudanças de vias usando gráficos estáticos e relatórios interativos e reprodutíveis construídos em R Markdown ou Jupyter.
Construindo e interpretando gráficos MAProjetando volcano plots claros para genes DEConstruindo mapas de calor de qualidade para publicaçãoDotplots de vias para resultados de enriquecimentoRelatórios RNA-seq interativos em R MarkdownVisualização exploratória baseada em JupyterAula 11Alinhamento vs pseudo-alinhamento: STAR, HISAT2, Salmon, kallisto — tradeoffs e saídas (BAM, contagens transcrito/gêne)Esta seção compara ferramentas baseadas em alinhamento como STAR e HISAT2 com ferramentas de pseudo-alinhamento como Salmon e kallisto, destacando tradeoffs em velocidade, precisão, uso de recursos e saídas incluindo arquivos BAM e contagens em nível de transcrito ou gênico.
Quando escolher alinhadores STAR ou HISAT2Configurando índices de genoma e anotaçõesUsando Salmon em modo quasi-mappingExecutando kallisto para quantificação rápidaComparando saídas BAM e quant.sfBenchmarking velocidade, memória e precisão