Dna sequencing 방법

  • Home
  • Delete
  • Suggest
  • Q&A
  • List
  • Changes
  • About

Sanger sequencing # Find similar titles

  • 2019-12-12 08:21:56 (rev. 12)
  • jhjeon

Structured data

CategoryBiology

Table of Contents

Sanger sequencing은 1977년에 Frederick Sanger에 의해 개발된 방법으로, 기본적으로 polymerase chain reaction (PCR) 과정에서 di-deoxynucleotide triphosphates (ddNTPs)에 의해 DNA strand가 합성되지 않는 chain termination의 원리와, 전기영동의 원리를 이용하여 염기서열을 확인하는 방법이다.

Sanger sequencing 원리 #

Sanger sequencing을 이해하기 위해서는 우선적으로 PCR 과정 대해 이해할 필요가 있다. DNA 서열 증폭을 위해서는 DNA를 구성하는 기본 단위인 deoxynucleotide triphosphate (dNTP)가 필요하다. DNA 서열에 dNTP가 중합될 때, DNA 서열 마지막 nucleotide 3번 탄소의 수산화기(-OH)와 새로운 dNTP 5번 탄소의 인산기가 반응하여 결합된다. Sanger sequencing 원리의 핵심은 ddNTPs에 있다. ddNTP는 dNTP의 3번 탄소에 산소(oxygen)이 존재하지 않는, 즉 수산화기(-OH) 대신 수소(-H)가 결합되어 있는 nucleotide 구조이다.

Fig1. ddNTP 구조

그림출처 : http://www.bio.davidson.edu/courses/molbio/molstudents/01licohen/sequencing.html

Sanger sequencing을 진행할 때는 dNTP에 추가적으로 소량의 ddNTP가 포함된 PCR을 우선 진행한다. 이 때, 4 가지의 ddNTP (핵산별로 ddATP (아데닌), ddGTP (구아닌), ddTTP (티민), ddCTP (사이토신))는 서로 다른 형광물질로 염색되어 있다. PCR 과정에서 DNA가 증폭되던 중 우연히 dNTP 대신 ddNTP가 결합된 경우, ddNTP의 3번 탄소에는 수산화기가 없으므로 더 이상 새로운 인산기가 결합될 수 없어 증폭이 중지된다 (chain termination). ddNTP의 결합은 무작위적으로 일어나게 되므로, 수 많은 증폭과정을 통해 거의 모든 염기서열 위치에서 chain termination이 일어나게 된다.

1차적으로 ddNTP를 포함한 PCR이 완료된 후에는, 염기서열을 크기에 따라 작은 순서대로 정렬할 수 있는 전기영동을 이용하여 증폭된 서열을 정렬한다. 크기순으로 정렬된 서열의 순서대로 형광 신호를 인식시키면, 염기서열 순서대로 해당 염기 서열에 해당하는 핵산 정보가 각 서열 끝에 마지막으로 결합된 ddNTP가 가지고 있던 형광물질 종류에 따라 읽히게 된다.

Fig2. Sanger sequencing 원리

그림출처 : http://dwb.unl.edu/Teacher/NSF/C08/C08Links/www.piopio.school.nz/molmed.htm

  • ITS
  • Sequencing
  • prediction of microRNA in malignant B cells

Suggested Pages #

  • 0.270 Metagenomics
  • 0.157 NHLBI GO ESP
  • 0.084 전사체
  • 0.065 antismash
  • 0.062 Pseudomonas 연구 동향2
  • 0.037 Metagenomic Software
  • 0.034 시퀀싱장비
  • 0.030 Greengenes
  • 0.023 티민
  • 0.022 디옥시리보스
  • More suggestions...

DNA Sequencing is the process of reading nucleotide bases in a DNA molecule. Unlock the genome and answer biology’s most challenging questions with our innovative and accessible sequencing solutions.

For over 25 years, our sequencers have contributed to significant scientific breakthroughs, including sequencing of the first human genome and the discovery of genes implicated in diseases like cystic fibrosis. Our ongoing innovation in sequencing technologies continues to drive new discoveries.

From whole genome sequencing to targeted sequencing of specific genomic regions, our sequencing portfolio supports a wide range of throughput and research application needs for DNA sequencing.

Sanger sequecing

  • 1977년 생거 등에 의해 개발된 염기서열 분석법
  • 1980년 생거가 2번째 노벨상을 받게 됨

일반적인 template DNA의 염기서열 분석

3'-ATGACTGAGC-5'와 같은 template DNA 서열 분석에서는
d{A,C,G,T}TP (dNTP)만 넣어주면 DNA polymerase는 이에 상보적인 DNA를 합성하게 된다

DNA polymerase가 상보적인 염기를 합성하려면, 소위 primer라는 DNA 조각이 결합된 이중나선 부위가 존재하여야 그 뒤의 단일가닥 부위에 상보적인 합성이 가능하다 (참고 그림). 우리가 시퀀싱하고자 하는 DNA는 일반적으로 그 서열을 모르는데, 어떻게 primer를 합성하여 반응에 사용할 수 있을까?


 

  • Single stranded ( 5말단 -> 3말단 )가 있다고 가정하고, T C A A C G - 순으로 염기서열이 있다고 가정하자.
    4배수 Primer(프라이머)를 연구자가 미리 넣어주면, 5말단->3말단순으로 (A-G-T-C에 대해) T-C-A-G 상보적으로 결합되면서, 해당 부분이 Double stranded가 된다.
  • 이 때, DNA 폴리머라아제는 나머지 Single Stranded 부분을 -> Double Stranded가 되도록 리액션 하게 된다.
    여기에 필요한 것이 dATP, dTTP, dCTP, dGTP이며, 이것을 따로 넣어줘야한다.
    - (T에 대해) dATP를 잘라서 A를 붙히고 , (A에 대해) dTTP를 잘라서 T를 붙히고... 이런식으로 Single-stranded를 메꾸도록 한다.

Sanger Sequencing 기본 원리

dNTP  + 소량의 dd{A,C,G,T}TP (ddNTP)를 섞어주게 되면, DNA polymerase가 template DNA에 상보적인 서열을 합성해 나가다가, 중간중간에 ddNTP가 끼어 들어간 DNA 분자가 합성되게 된다. 그러한 분자는 더 이상 길어지지 않고 합성이 중단되게 된다. 이들 ddNTP에는 각각을 구별할 수 있는 형광물질이 결합되어 있기에, 새로이 합성된 DNA 들의 마지막 염기 종류에 따라 서로 다른 형광을 띄게 된다. 여기에서 주목할 것은, 합성된 DNA 분자들은 모든 자리에서 4개 중의 어느 하나의 ddNTP가 끼어 들어간 것이기에, 정확히 한 염기씩 길이의 차이가 나는 것들이다. 이들은 전기영동법에 의해 크기 순으로 나열할 수 있으며, 레이저 빛을 각 전기영동 밴드에 쬐면, 형광물질에 따라 특이적인 파장의 빛을 발하게 되며, 이를 순서대로 읽으면 원래 염기서열(3'-ATGACTGAGC-5')과 상보적인 5'-TACTGACTCG-3'을 얻게 된다.

Dna sequencing 방법

  • DNA polymerase가 상보염기를 형성해 나가다가 ddNTP 4개 중 하나인 ddTTP가 섞여 들어가게 되면, 합성을 멈추게 된다.
    정상적인 dTTP가 들어올 때는 합성이 진행하다가 ddT가 합성되어버릴 경우 끝에 ddT로 멈추게 된다.
  • 이 때, 멈추게 되는 간격은 정확히 한 염기의 길이씩 차이가 날 수밖에 없다.
  • 종류는 3'-ATGACTGAGC-5' 에 대해서 총 10가지이다. size는 모두 제각각의 unique한 size를 갖는다.(끝나는 자리가 T,A,C,G 모두 다르므로)
    - T로 멈추는 경우 3 ( 1bp, 4bp, 8bp)
    - A로 멈추는 경우 2 ( 2bp, 6bp)
    - C로 멈추는 경우 3 ( 3bp, 7bp, 9bp)
    - G로 멈추는 경우 2 ( 5bp, 10bp)
  • 이 10가지를 한 well-plates에 넣은 다음(모두 음전하를 띄고있음), 전기영동으로 (양전하로 땡겨주면) 양전하쪽으로 이동시킨다.
    - 제일 가벼운 1bp가 가장 가까이 이동하고 size대로 순서대로 거리를 이루게 된다.
  • 이 때, ddT, ddA, ddG, ddC는 서로 다른 형광물질을 입혀넣았기 때문에, T로 끝나는 것들은 서로 같게 된다. 4가지 서로 다른 색을 가진다.
  • 여기에 Photomultiplier로 불빛을 켜서 비추면, 가장 가까운 곳에 1bp의 T가 보일 것이다.
    - 1배수 T(1bp - 빨간색), 2배수 A(2bp - 보라색) 등등으로 sequencing이 이루어진다.

ddNTP와 dNTP의 차이(과제)

  • ddNTP와 dNTP의 차이는 무엇인지. 왜 ddNTP합성을 멈추는 chain-terminating 반응을 하는지에 대해서 알아보자.
  • ddNTP는 어느 정도를 섞어줘야할지 비율도 알아보자.
  • 생거는 형광물질을 사용하지 않았다고 한다. 방사선 동위원소를 이용하여, 전기영동하면 나타나는 방사선을 X-선 필름에 감광시켜 위치를 알아냈다. 하지만 4가지 모두 동일한 방사선을 나타내기 때문에 어떻게 이것을 구분했을까?
  • Primer가 있어야 DNA sequencing이 가능한데, 우리가 sequencing하고 싶은 Single-stranded DNA는 순서를 모르니까 sequencing 하는 것인데 Primer를 어떻게 구성할지도 난감하다.

미국 인간게놈 연구소에서 만든 애니메이션 -  How to Sequence a Genome - part 6, 7, 8, 9 (강추!)

https://www.genome.gov/25019885/

https://www.genome.gov/edkit/flash/section6.html

https://www.genome.gov/edkit/flash/section7.html

https://www.genome.gov/edkit/flash/section8.html

https://www.genome.gov/edkit/flash/section9.html

  • 2001년 논문으로 publishing된 인간게놈 프로젝트 in Nature , 동시에 교육자료도 제공했음.
  • Part 6
  • Part 7
    Dna sequencing 방법

    - 한 base pair씩 차이나는 DNA 분자가 얻어지고 종류에 따라 다른 색의 DNA들이 500-800base 정도가 얻어진다.
    - 얻어진 products들은 위와 같은 자동화 기기에 삽입된다.

  • Part 8




    - 전기영동으로 분리되는 과정이다.
    - DNA들은 (-)전하를 띄고 있기 때문에, 전기영동 장치의 하단에 있는 (+)전하로 짧은 순으로 끌려간다.
  • Part 9




    - (+)전하쪽으로 빠져나올 때, Laser를 쏘면, 각 종류별 형광물질이 나오게 되면서, 기본적인 Sanger Sequencing이 완성된다.

    - 연속적으로 500번 ~ 800번의 전기영동을 통해서 최종적으로는 시퀀싱기계에 기록되어, 인간의 Single sequncing이 reveal된다.

    - 아래는 560번 정도의 생거 시퀀싱 결과의 크로마토그램

    Dna sequencing 방법

    - 각 자리별로 가장 높은 것이 명확하게 들어나고, 색도 명확하다(검은색 G, 초록색 A..) 이 하나하나가 DNA 분자이다.
    - 가장 앞과, 가장 나중에 뭉개지고 색이 겹쳐지는 경향이 있긴하다.

Base call quality score

위의 560base 전기영동 결과 중 색이나 peark가 겹친 부분이 있다. 이것을 확률적으로 나타내는 것base call quality score라고 한다.
예를 들어, T라고 얘기했는데, error율도 같이 이야기 해주는 것이다.

1% 이상의 error가 연속적으로 나타난다면 잘라내서 버리는 작업을 Trimming이라고 하며, 생거 시퀀싱을 한번 할 경우 560base 중 500base 정도가 남는다고 한다.

  • 뭉개지는 앞부분도 제거를 해야할까?
  • 1%이하의 에러율이 너무 작은 수로 표시되므로, Phred 라는 염기서열분석 소트트웨어를 통해  자체적으로 변환시킨 값인 phred score를 출력하게 되는데,
    Phred score :  [ 에러율 ] 에 로그를 취한 뒤 -10을 곱한 것
    - 1% error  : ( 0.01 -> Log ( ) -> -2  * -10 = 20 phred score
    - 0.1% error :  ? phred score 30
    - ?  error : 40 phred score ( -10^-4 )
  • my) 1% = 0.01 -> 20   /  0.1% -> 0.001 -> 30  /  0.01% -> 0.0001 -> 40

생각하기

  • 생거 시퀀싱은 자동화가 되므로, 처음에는 agarose gel plate에다가 여러 개의 샘플을 동시에 전기영동 분리 하였다. ( plate 당 32개 정도)
  • 이후에는 모세관을 이용한 capillary 전기영동을 함.  96개의 유리관을 사용. ( 유리관 1개당 1 sample)
    - 이러한 과정을 로버트 팔을 이용해서 자동화 하였음.(ABI 37000)
    - 하루에 10개 plate를 시퀀싱하였으니 10 * 96 well(유리관)   ->  10 * 384 well( 유리관) 개의 DNA sequencing  개의  sample
    - sample당 500 염기씩 읽음.
    - 500(DNA) * 384 well(sample) * 10 (하루당)   개의  염기 시퀀싱
    - 인간의 30억개 염기  -->  1번 읽는데 3000일 소요, /  평균 10번 읽어야하므로 30000일 소요
    - 기계 100대를 동시에 --> 300일 소요