Ir para o conteúdo

Classificação Taxonômica

A classificação taxonômica é o processo de identificar quais organismos (bactérias, arquéias, vírus, fungos, etc.) estão presentes em nossas amostras de metagenoma e em que abundância relativa.

Pipeline Geral

Nosso fluxo de trabalho padrão para a classificação taxonômica envolve as seguintes etapas:

  • Controle de Qualidade (QC): Remoção de reads de baixa qualidade e adaptadores usando ferramentas como fastp ou Trimmomatic.
  • Remoção de Contaminação do Hospedeiro: (Se aplicável) Alinhamento das reads contra o genoma do hospedeiro (ex: plantas de restinga ou mangue) para remover sequências não-microbianas.
  • Classificação: Utilização de ferramentas como Kraken2, Kaiju ou MetaPhlAn para atribuir taxonomia às reads.

Ferramentas Utilizadas

Kraken2

  • Descrição: Kraken2 é um classificador taxonômico ultrarrápido que usa k-mers para mapear reads contra um banco de dados de genomas microbianos.
  • Banco de Dados Padrão: Utilizamos o banco de dados padrão do Kraken2, que inclui genomas completos de bactérias, arquéias e vírus do RefSeq.
  • Comando Exemplo:
kraken2 --db /path/to/krakendb --threads 8 --report report.txt --output kraken.out paired_reads_1.fastq paired_reads_2.fastq

Bracken

  • Descrição: Bracken (Bayesian Reestimation of Abundance with KrakEN) é usado para reestimar a abundância em nível de espécie a partir dos resultados do Kraken2.
  • Comando Exemplo:
bracken -d /path/to/krakendb -i report.txt -o bracken_species.txt -r 150 -l S