Self Love is the Best Love

2. Phylogenetic tree and Average Nucleotide Identity (ANI) 본문

20211/생물정보학

2. Phylogenetic tree and Average Nucleotide Identity (ANI)

퍼플양 2021. 8. 16. 02:47
728x90

1. Purpose

  Phylogenetic tree 생물이 진화의 결과 여러 종이나 분류군 사이에서 나타나는 신체적이거나 유전적 특징의 유사성과 차이를 바탕으로 evolutionary relationshiptree diagram으로 나타낸 것이다[1]. 다양한 생물 종에 대해 진화적 관계를 있다.  

 Phylogenetic tree 구성하기 위해, 분자 진화에 대한 통계적 분석을 수행하는 Molecular Evolutionary Genetics Analysis (MEGA)이라는 컴퓨터 소프트웨어를 사용한다[2]. 또한 종의 재분류를 방지하기 위해 Average Nucleotide Identity (ANI) 이용해 유전체의 코딩된 부분 사이의 nucleotide수준의 Genomic Similarity 측정한다.

  실험에서는 MEGA 프로그램을 통해 주어진 미생물들의 Phylogenetic tree 그리고, ANI calulator 임의의 미생물의 Genomic Similarity 측정하려고 한다.

 


2. Materials & Methods

 

 

2.1 Phylogenetic tree그리기

 미생물의 염기 서열을 포함하는 text파일의 확장자를 .fasta 새로 저장한다.(Pic2) FASTA formatbase pair 혹은 amino acids 단일 문자 코드를 사용하여 표현되는 nucleotide sequences 혹은 peptide sequences 나타내는 텍스트 기반 형식이다. Text 파일에서 “>”sequence 시작을 의미한다.  Fasta file 공백 인식이 되지 않기 때문에 공백 대신 - 혹은 _ 사용해 띄어쓰기를 표시한다. (Pic1) 확장자를 .fasta 저장한다.


Pic1. 미생물의 염기 서열을 포함하는 text

 

 MEGA 프로그램을 실행시킨다. 상단의 Align에서 Edit/build alignment 클릭한다. Create a new alignment. DNA alignmentbuilding한다. Pic2.에서 저장한 fasta파일을 MEGAdrag and drop. (Pic3)


Pic3. MEGA 불러온 FASTA file

 

전체 서열을 선택하고 상단의W아이콘을 클릭한다. Align DNA. 설정을 바꾸지 않고 OK한다. 전체 서열에서 상동성이 있는 부분은 sequence위에 * mark 생긴다. (Pic4)


Pic4. * 표시된 sequences.

Sequence 앞과 뒤에 * mark 없는 부분을 삭제한다. (Pic5)


Pic5. * mark 없는 서열

이후 상단의 Data에서 Export alignment. MEGA format으로 저장한다. 이를 다시 MEGA프로그램으로 불러온다. 상단의 Phylogeny에서 Construct/Text Neighbor-Joining Tree 한다. (Pic6) 현재 파일을 사용할 것이냐는 안내 문구가 뜬다. Yes. (Pic6)


Pic6. MEGA 불러옴

 

Option Summary창에서 parameter 설정한다. Phylogeny TestTest of PhylogenyBootstrap method 하고 No. of Bootstrap Replication1000으로 설정한다. Substitution ModelSubstitutions TypeNucleotide 하고 Model/MethodJuke-Cantor model 설정한다. (Pic7) Compute.


Pic7. Set parameter

 2.2. Genomic Similarity 측정

  비교하고자 하는 whole genome sequencetext파일에서 FASTA파일로 따로 저장한다. EzTaxon site 통해 ANI Calculator 들어간다. 저장했던 FASTA파일을 업로드한다. (Pic8)


Pic8. 비교하고자 하는 미생물의 sequence FASTA파일 업로드

 

 


 

 3. Results & Discussions

 MEGA프로그램으로 그린 미생물들의 Phylogenetic tree 다음과 같다. (Pic9)


Pic9. Phylogenetic tree

ANI Calculator 계산한 Bacillus asahiiBacillus butanolivoransANI value97%이다. , 미생물은 97% Genomic Similarity 가지고 있다. (Pic10)


Pic10. Result of ANI calculator

 - OrthoANI value(%) : ANI percentage

 - Genome A length (bp) : genome size of A

 - Genome B length (bp) : genome size of B

 - Average aligned length (bp) : aligned sequence length from genome A and B

 - Genome A coverage (%) : percentage of covered sequence when genome A was put as query

 - Genome B coverage (%) : percentage of covered sequence when genome B was put as query

 


 4. References

 

[1] Pulves, 이광웅 , 생명 생물의 과학, 2006, 교보문고, ISBN 89-7085-516-5, 3 진화의 과정, 23 계통의 재구성과 활용

[2] Kumar,s., K. TamuraM. Nei (1993) MEGA : Molecular Evolutionary Genetics Analysis. Ver. 1.0, The Pennsylvania State University, University Park, PA.