Quality Control : 생성된 read 서열에서 adaptor 추정 서열을 제거하고 낮은 quality score를 가진 read 들의 filtering 과정을 수행함.
Merging reads: Paired read(300bp)로 시퀀싱 되어있는 16s rRNA gene v3, v4 region을 하나의 read로 통합.
Feature table construction: 퀄리티 힐터링, 시퀀스간의 중복제거룰 통해 Sequence의 다양성의 지표인 feature를 제시함.
Diversity analysis: 샘플 내의 다양성의 정도를 나타내주는 alpha diverisy와 샘플 간의 다양성을 나타내주는 beta diversity를 분석함.
Taxonomy analysis: 각 taxonomy level 별 미생물 균총의 분포를 분석함.
Differential abundance test: 그룹 간 상대량의 차이가 있는 미생물을 분석함.
이때 사용되는 프로그램들은 아래와 같다. (대표적인 소프트 웨어만 언급을 하였고, 아주 여러 소프트웨어가 사용될 수 있으며 개발 중이니 참고바람.)
Merging reads: Pear
Quality Control: FastQC, DADA2(§DADA2 denoise option
Feature table: DADA2
Diversity Analysis: qiime diversity alpha-group-significance, qiime diversity beta-group-significance, qiime emperor plot
Taxonomy analysis: Vsearch / Blast (사용된 database
Silva 99% )
Analysis of differentially Abundant OTUs: differentially Abundant analysis – EdgeR, Normalization – TMM