Bioinformática Aplicada à Transcriptômica: uma introdução prática ao RNA-Seq e análise de expressão diferencial
0.1 Lesson overview 📚
| Licença | Creative Commons Attribution Share Alike 4.0 International License |
| Público-alvo | Bioinformática, Biologia Molecular, Pesquisadores e estudantes de pós-graduação. |
| Nível | Iniciante/Intermediário |
| Tempo estimado | 240 minutos (4 horas) |
0.2 📖 Descrição do Curso
Este repositório contém o material prático e scripts de R para o curso “Análise de Expressão Diferencial e Funcional (RNA-seq)”. Esta análise utiliza dados de expressão gênica (GSE60450) para demonstrar um pipeline de análise de RNA-seq.
O curso cobre as seguintes etapas essenciais em bioinformática:
- Sanidade e Exploração de Dados: Importação, transformação VST e análise exploratória (PCA e Clusterização Hierárquica) para avaliar a qualidade e a estrutura dos dados.
- Análise de Expressão Diferencial (DGE): Aplicação do modelo Binomial Negativo com o pacote DESeq2 e interpretação dos contrastes de interesse.
- Representações Gráficas: Criação de visualizações de alta qualidade para publicação, incluindo Heatmaps e Volcano Plots customizados.
- Interpretação Funcional: Análise de Enriquecimento Funcional (KEGG Pathways) usando
clusterProfilerpara identificar vias biológicas alteradas. - Análise de Redes: Construção e visualização de Redes de Interação Proteína-Proteína (PPI) a partir da API do STRINGdb.
0.3 ➡ Resultados de Aprendizagem
Ao final do curso, os alunos serão capazes de:
- Processar e explorar dados de contagem de RNA-seq usando pacotes essenciais como
DESeq2ePCAtools. - Executar o pipeline completo do DESeq2, testando contrastes de interesse e interpretando as métricas (\(\text{LFC}\) e \(\text{padj}\)).
- Gerar gráficos de qualidade de publicação, como Volcano Plots e Heatmaps, aplicando temas profissionais.
- Realizar Análise de Enriquecimento Funcional (KEGG) e interpretar as vias biológicas significativas.
- Construir Redes de Interação Proteína-Proteína (PPI) utilizando a API do STRINGdb e ferramentas de visualização como
igrapheRedeR.
0.4 ⚙ Requisitos de Software
Participantes devem ter um laptop com uma versão recente do R (\(\ge 4.0\)) e RStudio instalados.
0.4.1 📦 Principais Dependências de Pacotes (R/Bioconductor):
| Categoria | Pacotes |
|---|---|
| DGE | DESeq2 |
| Exploração/Visualização | tidyverse (dplyr, ggplot2), PCAtools, pheatmap, ggrepel |
| Anotação/Funcional | clusterProfiler, AnnotationDbi, org.Mm.eg.db |
| Redes | RCurl, igraph, RedeR |
0.5 🙏 Agradecimentos
- Bioinformatics Multidisciplinary Environment (BioME - IMD/UFRN)
- Postgraduate Program in Bioinformatics (PPg-Bioinfo - UFRN)
- Agradecimento especial: O material prático utiliza dados públicos do estudo GSE60450 (Assay et al., 2014) sobre a glândula mamária de camundongos.