A00201R:581:HC7JMDSX3:3:2278:22661:11397    81    chr1 51312    3 5M1D146M    chr9 116569571 0 ATAAGAAAAAACAGGATAGCGACAATGACTAAAAATTAAGTTTGCACTTACAGGAGAAACTGATTCATCTCTTCCATGTTGTTATACAGGTAGAGCAAAGCAGTCTTCCATTCGTCATTGGTGAAACAGTATGTTGTGTTGGGTCCTACAG FF:FFFF:FFF:,FF::F,,FF:F:FF,FF:F,FFF,FFFF,FFFFFF:FFFFFFFFFFFFF:FF:,FFFFFFFF:F:FFFFFFF:FFFFFFFFFFFFFFFFFF:FFFF:,F:FFFFFF:FFFFFFF:FF:FFFFFFFFFFFFFFFFFFFF

A00257:713:HNVFFDSX2:2:1213:17463:32643 147     chr2    3690437 60      151M    =       3690388 -200    GTAGACATGCAAATCTACATCTTGCATTGGTGATTTTTTCATAGGACTACAGGAACTCTCGCAGTGAGCTAAATTACTTTCAGAAGATCATGAGATTTCTCATGTTGCTCTCTGCACGAAGGATCATTATAGAAGGAACACTAAGTTTGGG F,FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF:FFFFFFFFFF:FFFFF:FFFFF:FFFFFFFFFFFFFFF:FF:FFFFF:FFFFFFFFFFFFFFFFFFFFFFFF

A00257:713:HNVFFDSX2:2:2265:26404:9236    83    chr2    3690475    60      72M    =    3690475    -72     TCATAGGACTACAGGAACTCTCGCAGTGAGCTAAATTACTTTCAGAAGATCATGAGATTTCTCATGTTGCTC        FFFFFFFFFFFFFFFF:FFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFFF


1.QNAME: Query name of the read or the read pair - 보통은 Read의 이름을 뜻합니다. 시퀀싱된 fasta파일에서 가장 윗줄에 각 Read마다 부여된 이름 입니다.

2.FLAG: Bitwise flag (pairing, strand, mate strand, etc.) - Flag는 숫자로 쓰여져 있어서 해석하기 어려운 정보 입니다. 이 숫자는 맵핑이 어떻게 되어있는지 설명해주는데, https://broadinstitute.github.io/picard/explain-flags.html 이 웹사이트에서 숫자를 입력하면 Paired read도 맵핑이 되었는지, PRC duplicate 로 마킹이 되어있는지 등의 정보를 나타내줍니다.

3.RNAME: Reference sequence name - 맵핑된 지놈의 Chromosome의 이름입니다. 

4.POS: 1-Based leftmost position of clipped alignment - 맵핑된 지놈의 포지션입니다. 위의 예에서 첫번째Read의 RNAME이 chr1이고 Pos가 51312이니깐 첫번째 Read는 chr1의 51312번째 서열에 맵핑이 되었다는 뜻입니다.

5.MAPQ: Mapping quality (Phred-scaled) - 맵핑 퀄리티를 의미합니다.

6.CIGAR: Extended CIGAR string (operations: MIDNSHP) - CIGAR String이 중요합니다! 이는 맵핑이 얼마나 Match, Insertion, Deletion, Mismatch가 있는지 알려주는 지표입니다. 위의 예에서 첫번째Read의 CIGAR은 5M1D146M라고 되어있는데, 이는 5개의 서열은 Match 1개의 Deletion그리고 다시 146bp 의 서열은 레퍼런스에 Match가 되게 맵핑이 되었다는 뜻입니다. 

7.MRNM: Mate reference name (‘=’ if same as RNAME) - 7번, 8번열은 Paired read가 어디에 맵핑되어있는지 알려줍니다. Paired read가 맵핑된 크로모좀의 이름인데, 잘 맵핑이 되어있다면 3번의 RNAME과 동일한 크로모좀에 맵핑이 되어야합니다. 그래서 만약 두개의 Paired reads가 같은 크로모좀에 맵핑되어있으면 "="로 표시 됩니다. 첫번째 Read는 맵핑이 제대로 안되어서 Paired Read두개가 다른 크로모좀에 맵핑이된 반면 두번째 Read는 Paired read가 같은 크로모좀에 잘 맵핑이 된것을 볼 수 있습니다.

8.MPOS: 1-based leftmost mate position - Paired read 가 맵핑되어있는 포지션 정보입니다.

9.ISIZE or TLEN: Inferred insert size or Observed Template LENgth - 맵핑된 paired read를 고려해 계산된 Fragment의 길이를 나타내줍니다. +,-는 paired read가 어디에 위치해있는지만을 알려주고, 절대값정보가 Fragment길이입니다. 

위의 2번째 Read의 예에서 해당 Read는 151bp이고, 151bp가 Match이기 때문에 아래 그림처럼  chr2:3690437-3690437+151 까지 잘 맵핑이 되었고 Paird read는 앞쪽부분인 chr2:3690388에 맵핑이 되어있습니다. 이때 Fragment size는 200이고 Paired read가 앞쪽에 위치하고 있으므로 "-"를 붙여준 것입니다.










10.SEQQuery: Sequence on the same strand as the reference - 맵핑된 시퀀스 A,T,G,C 서열 정보입니다.

11.QUAL: Query quality (ASCII-33=Phred base quality) -맵핑된 퀄리티 정보입니다.

더 많은 정보: https://samtools.github.io/hts-specs/SAMv1.pdf