Classificação Taxonômica¶
A classificação taxonômica é o processo de identificar quais organismos (bactérias, arquéias, vírus, fungos, etc.) estão presentes em nossas amostras de metagenoma e em que abundância relativa.
Pipeline Geral¶
Nosso fluxo de trabalho padrão para a classificação taxonômica envolve as seguintes etapas:
- Controle de Qualidade (QC): Remoção de reads de baixa qualidade e adaptadores usando ferramentas como
fastp
ouTrimmomatic
. - Remoção de Contaminação do Hospedeiro: (Se aplicável) Alinhamento das reads contra o genoma do hospedeiro (ex: plantas de restinga ou mangue) para remover sequências não-microbianas.
- Classificação: Utilização de ferramentas como
Kraken2
,Kaiju
ouMetaPhlAn
para atribuir taxonomia às reads.
Ferramentas Utilizadas¶
Kraken2¶
- Descrição: Kraken2 é um classificador taxonômico ultrarrápido que usa k-mers para mapear reads contra um banco de dados de genomas microbianos.
- Banco de Dados Padrão: Utilizamos o banco de dados padrão do Kraken2, que inclui genomas completos de bactérias, arquéias e vírus do RefSeq.
- Comando Exemplo:
kraken2 --db /path/to/krakendb --threads 8 --report report.txt --output kraken.out paired_reads_1.fastq paired_reads_2.fastq
Bracken¶
- Descrição: Bracken (Bayesian Reestimation of Abundance with KrakEN) é usado para reestimar a abundância em nível de espécie a partir dos resultados do Kraken2.
- Comando Exemplo: