Aula 1Análise de expressão diferencial: DESeq2, edgeR, limma-voom — desenho do modelo, contrastes e correção de testes múltiplosEsta seção detalha fluxos de trabalho de expressão diferencial usando DESeq2, edgeR e limma-voom, focando em desenho do modelo, contrastes, estimação de dispersão e correção de testes múltiplos para obter listas confiáveis de genes e estimativas de tamanho de efeito.
Projetando modelos experimentais e covariáveisDefinindo contrastes para comparações complexasExecutando fluxo de trabalho DESeq2 de ponta a pontaUsando pipelines edgeR e limma-voomCorreção de testes múltiplos e controle FDRInterpretando mudanças log2 fold e encolhimentoAula 2Organização de dados e convenções de nomenclatura de arquivos: planilhas de amostras, separação bruto/processado, identificadores consistentesEsta seção descreve melhores práticas para organizar arquivos de projetos RNA-seq, incluindo planilhas de amostras, layouts de diretórios, separação de dados brutos versus processados e identificadores consistentes que simplificam scriptagem, rastreamento e reprodutibilidade.
Projetando hierarquia clara de diretóriosSeparando dados brutos e processadosCriando planilhas robustas de amostras e metadadosIdentificadores consistentes de amostra e bibliotecaVersionando genomas de referência e índicesFazendo backup e arquivando dados do projetoAula 3Estratégias de quantificação em nível gênico: featureCounts, htseq-count, tximport para sumarização transcrito-para-gêneEsta seção explica quantificação em nível gênico a partir de leituras alinhadas ou pseudo-alinhadas, comparando featureCounts e htseq-count, e detalhando como tximport agrega estimativas em nível de transcrito em matrizes robustas em nível gênico para análise estatística downstream.
Contando leituras com opções featureCountsUsando modos htseq-count e anotaçõesLidando com polaridade e leituras multimapeadasImportando Salmon e kallisto com tximportConstruindo matrizes de contagem em nível gênicoAvaliando qualidade de quantificação e coberturaAula 4Ferramentas para download e organização de dados: SRA Toolkit (prefetch/fastq-dump), ENA FTP/Aspera, wget/rsync, e entradas/saídas recomendadasEsta seção aborda estratégias confiáveis para baixar e organizar dados RNA-seq, focando em SRA Toolkit, acesso ENA, ferramentas de transferência em linha de comando e definindo estruturas consistentes de entrada e saída que suportam automação e reprodutibilidade.
Usando SRA Toolkit prefetch e fasterq-dumpAcessando ENA via FTP e AsperaBaixando com wget e rsync com segurançaEscolhendo formatos de arquivo bruto e processadoDocumentando metadados de download e checksumsAutomatizando downloads com scripts e logsAula 5Ferramentas e saídas de controle de qualidade: FastQC, MultiQC, métricas chave a inspecionar (qualidade por base, conteúdo de adaptador, duplicação, GC)Esta seção foca no controle de qualidade de RNA-seq, usando FastQC e MultiQC para resumir métricas chave como qualidade por base, contaminação de adaptadores, duplicação e conteúdo GC, e decidir se trimming ou resequenciamento é necessário.
Executando FastQC em leituras brutas e aparadasInterpretando perfis de qualidade por baseDetectando adaptadores e sequências sobre-representadasAvaliando duplicação e conteúdo GCAgregando relatórios com MultiQCDefinindo limiares QC e açõesAula 6Aparagem e filtragem de leituras: quando aparar, ferramentas (Trim Galore/Cutadapt/fastp), parâmetros principais e saídasEsta seção explica quando e como aparar leituras RNA-seq, cobrindo aparagem de adaptadores e qualidade, filtragem de comprimento, e parâmetros chave em ferramentas como Trim Galore, Cutadapt e fastp, evitando super-aparagem que prejudica análises downstream.
Decidindo se aparagem é necessáriaEstratégias de detecção e remoção de adaptadoresLimiares de aparagem baseados em qualidadeFiltros de comprimento mínimo e complexidadeUsando opções Trim Galore e CutadaptFastp para QC e aparagem integradosAula 7Análises downstream básicas: enriquecimento GO/KEGG (clusterProfiler), GSEA pré-rank, visualização de vias, e seleção de conjunto gênicoEsta seção introduz análises funcionais downstream após expressão diferencial, incluindo enriquecimento GO e KEGG com clusterProfiler, GSEA pré-rank, visualização de vias e estratégias principescas para selecionar e filtrar conjuntos gênicos.
Preparando listas de genes rankeados para GSEAEnriquecimento GO e KEGG com clusterProfilerEscolhendo bancos de dados de conjunto gênico apropriadosVisualizando vias e redes enriquecidasFiltrando e priorizando conjuntos gênicosReportando resultados funcionais de forma reprodutívelAula 8Layout de alto nível do pipeline: download de dados, QC, aparagem, alinhamento/pseudo-alinhamento, quantificação, expressão diferencial, análise downstreamEsta seção apresenta a estrutura geral do pipeline RNA-seq, desde aquisição de dados e QC através de aparagem, alinhamento ou pseudo-alinhamento, quantificação, normalização, expressão diferencial e análise funcional downstream, enfatizando fluxos de trabalho modulares e scriptados.
Definindo estágios do pipeline e dependênciasPlanejando entradas, saídas e fluxo de arquivosIntegrando QC, aparagem e alinhamentoLigando quantificação à análise DEConectando DE a fluxos de enriquecimentoDocumentando o pipeline com diagramasAula 9Normalização e análise exploratória de dados: limites TPM/FPKM, normalização DESeq2, PCA, mapas de calor de distância amostra-amostraEsta seção aborda normalização e análise exploratória de dados RNA-seq, discutindo limitações de TPM e FPKM, normalização baseada em DESeq2, estabilização de variância, análise de componentes principais e mapas de calor de distância de amostra para detectar efeitos de lote.
Limitações das medidas TPM e FPKMFatores de tamanho DESeq2 e normalizaçãoTransformações estabilizadoras de variância e rlogAnálise de componentes principais de amostrasMapas de calor de distância amostra-amostraDetectando efeitos de lote e outliersAula 10Melhores práticas de visualização básica: gráficos MA, volcano plots, mapas de calor, dotplots de vias, e opções de relatório interativo (R Markdown, Jupyter)Esta seção introduz estratégias efetivas de visualização para resultados RNA-seq, enfatizando comunicação clara de expressão diferencial, estrutura de amostra e mudanças de vias usando gráficos estáticos e relatórios interativos e reprodutíveis construídos em R Markdown ou Jupyter.
Construindo e interpretando gráficos MAProjetando volcano plots claros para genes DEConstruindo mapas de calor de qualidade para publicaçãoDotplots de vias para resultados de enriquecimentoRelatórios RNA-seq interativos em R MarkdownVisualização exploratória baseada em JupyterAula 11Alinhamento vs pseudo-alinhamento: STAR, HISAT2, Salmon, kallisto — compensações e saídas (BAM, contagens transcrito/gêne)Esta seção compara ferramentas baseadas em alinhamento como STAR e HISAT2 com ferramentas de pseudo-alinhamento como Salmon e kallisto, destacando compensações em velocidade, precisão, uso de recursos e saídas incluindo arquivos BAM e contagens em nível de transcrito ou gênico.
Quando escolher alinhadores STAR ou HISAT2Configurando índices de genoma e anotaçõesUsando Salmon em modo quasi-mapeamentoExecutando kallisto para quantificação rápidaComparando saídas estilo BAM e quant.sfBenchmarking velocidade, memória e precisão