다음 단계에서는 merge된 read들은 중복을 제외하고 representative sequence (Feature)로 선별되어, 추후 분석(diversity analysis, taxonomic assignment)에 활용하여야한다.
이때, Qiime2,1에 탑재되어 있는 Dada2 를 돌리면 된다. Dada2 를 돌리면 아래와 같은 표를 얻을 수있다.
아래 표에서는 Representative sequence의 총 빈도(Total frequency)와, 종류(number of frequency), 샘플 별 빈도(Frequency per sample)를 나타내었다.
자, 다이벌시티를 살펴보자. 이도 Qiime2혹은 1 에 탑재되어있는 프로그램을 돌리면 쉽게 얻어 낼 수 있다. 일단 Diversity의 개념을 알고가자. Diversity는 Alpha Diversity 와 Beta Diversity 가 있다.
Alpha diversity는 샘플 내의 다양성을 의미하며, Beta diversity는 샘플 간의 미생물 다양성을 의미한다.
Alpha diversity는 관찰된 sequence의 개수의 증가에 따른 OTU의 증가량으로 표현되며, 샘플 내에 다양한 Taxon이 존재할 수록, 그래프의 기울기가 더 가파르게 증가한다. 또한 관찰된 OTU수 대신에 Faith’s Phylogenetic Diversity (다양성에 관련된 지표)를 이용하여 시퀀스가 증가함에 따라 미생물의 다양성이 얼마나 증가하는지 보여준다. 그래프의 기울기가 더 가파를수록 더 다양한 미생물이 존재한다. 또 다른 지표로는 Faith’s Phylogenetic Diversity (생물 다양성에 관련된 지표)가 있으며 이 또한 시퀀스가 증가함에 따라 얼마나 증가하는지 보여준다. 그래프의 기울기가 더 가파를수록 더욱 다양한 미생물 커뮤니티가 존재한다.
Beta diversity중 Unweighted unifrac는 샘플 내의 미생물 종의 유무(unweighted)를 이용하여 Distance를 계산 한 후 이를 좌표 공간에 나타낸 것이다. 또 다른 지표로는 샘플들의 미생물 균총의 양(weighted)을 이용하여 Distance를 계산 한 후 이를 좌표공간에 나타낸 것도 있을 수 있다.
.
* 아래는 메타지놈 16S rRNA-seq 에대한 한국어 영상입니다.