예전부터 개념만 대충 알았지 sequencing에 이용되는 oligonucleotide sequences에 대한 정확한 원리는 몰랐었는데 이번 기회에 공부를 좀 해 보았음.
Genomic DNA oligonucleotide sequences Adapters 1
5' P-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG
5' ACACTCTTTCCCTACACGACGCTCTTCCGATCT
PCR Primers 1
5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
5' CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT
Genomic DNA Sequencing Primer
5' ACACTCTTTCCCTACACGACGCTCTTCCGATCT
5' P-GATCGGAAGAGCTCGTATGCCGTCTTCTGCTTG
5' ACACTCTTTCCCTACACGACGCTCTTCCGATCT
PCR Primers 1
5' AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCT
5' CAAGCAGAAGACGGCATACGAGCTCTTCCGATCT
Genomic DNA Sequencing Primer
5' ACACTCTTTCCCTACACGACGCTCTTCCGATCT
다음과 같이 주어졌을 때 도대체 library는 어떻게 만들어지는건가...
다음과 같이 주어졌을 때 도대체 library는 어떻게 만들어지는건가...
Adapter는 fragmentation 된 DNA의 양쪽 flanking한 지역에 붙인다. 당연히 DNA가 double strand 상태이니 double strand 형태의 adapter를 붙여야 할 터. 위에 언급된 두 개의 adapter가 double strand를 이루는 것이 아니라 각각의 adapter의 complement 한 sequence를 이용해 double strand를 만든다. 여기서 첫번 째 adapter 5'의 'P'는 무엇인가? 이것은 gap으로서 나중에 'A'가 overhang 된 DNA와 연결시키기 위해 존재한다. 우리가 관심있는 DNA에 adapter를 붙인 형태는 아래와 같다.
Adapter는 fragmentation 된 DNA의 양쪽 flanking한 지역에 붙인다. 당연히 DNA가 double strand 상태이니 double strand 형태의 adapter를 붙여야 할 터. 위에 언급된 두 개의 adapter가 double strand를 이루는 것이 아니라 각각의 adapter의 complement 한 sequence를 이용해 double strand를 만든다. 여기서 첫번 째 adapter 5'의 'P'는 무엇인가? 이것은 gap으로서 나중에 'A'가 overhang 된 DNA와 연결시키기 위해 존재한다. 우리가 관심있는 DNA에 adapter를 붙인 형태는 아래와 같다.
5' -------------------- -----ACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (DNA+) AGATCGGAAGAGCTCGTATG CCGTCTTCTGCTTG 3'
|
3' -------------------- -----TGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
여기서 DNA+는 관심있는 DNA의 + strand, DNA-는 관심있는 DNA의 - strand을 의미. 그 다음 위의 adapter-ligated double strand DNA를 denaturation을 하여 single strand 로 나눈다. 그리고 나서 각각의 single strand DNA가 어떤식으로 amplification 되고 sequencing 되는지 따라가 보기로 하자. 여기서는 (DNA+)의 single strand DNA만 따라가 보기로 한다(DNA- 도 해보면 유사).
Illumina sequencer flowcell에는 PCR primer들이 covalent linking 되어 있다(flow cell surface에 primer의 5' 연결). 자 우리는 아래의 sequence로 시작해 본다.
5' -------------------- -----ACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (DNA+) AGATCGGAAGAGCTCGTATG CCGTCTTCTGCTTG 3'
|
이 sequence는 두번 째 PCR primer와 binding 한다 (빨간색: 두번 째 PCR primer, 5' 쪽이 flowcell에 고정).
5' -------------------- -----ACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (DNA+) AGATCGGAAGAGCTCGTATG CCGTCTTCTGCTTG 3'
|
3' -------------------- -------------------- ------------------ (----) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
그리고 3' 쪽으로 extension 되어 다음과 같은 double strand가 된다.
5' -------------------- -----ACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (DNA+) AGATCGGAAGAGCTCGTATG CCGTCTTCTGCTTG 3'
|
3' -------------------- -----TGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
여기서 2nd PCR primer에서 만들어진 strand는 flow cell에 고정되어 있으므로 wash 과정을 거치면 flow cell에 covalent linking 된 다음과 같은 single strand만 남게 된다.
3' -------------------- -----TGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
자, 이제 소위 얘기하는 bridge amplification 과정을 살펴 보자.
지금까지의 single strand는 구부러져(bridging) 3' 쪽 sequence와 상보적인 PCR primer를 찾아 결합한다(파란색 sequence는 1st PCR primer, 5' 쪽이 flow cell과 고정).
5' AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (----) -------------------- -------------- 3'
|
3' -------------------- -----TGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
그리고 3' 쪽으로 extension.
5' AATGATACGGCGACCACCGA GATCTACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (DNA+) AGATCGGAAGAGCTCGTATG CCGTCTTCTGCTTG 3'
|
3' -------------------- -----TGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
그리고 denaturation을 하면 이제 5' 쪽이 flow cell에 고정된 두 개의 single strand가 된다. 그리고 각각의 strand가 같은 방법으로 반복하여 amplification 되어 cluster를 만든다.
그럼 sequencing primer는 어떻게 쓰여지는가? Cluster 중 일관되게 DNA+ sequence를 알기 위해 1st PCR primer가 있는 strand는 cleavage된다. 그리고 sequencing primer는 다음과 같이 binding 한다(녹색 sequence가 sequencing primer).
5' -------------------- -----ACACTCTTTCCCTAC ACGACGCTCTTCCGATCT (----) -------------------- -------------- 3'
|
3' TTACTATGCCGCTGGTGGCT GTCCATGTGAGAAAGGGATG TGCTGCGAGAAGGCTAGA (DNA-) TCTAGCCTTCTCGAGCATAC GGCAGAAGACGAAC 5'
|
그리고 sequencing primer를 시작으로 3' (=>) 방향으로 extension 되면서 DNA+ 를 읽게된다.
지금까지 제가 이해한 것을 바탕으로 끄적끄적 대 봤습니다. 혹시나 이 원리가 잘못되어 있다면 누구든지 덧글 달아주세요~ :)
댓글 없음:
댓글 쓰기