유전자 발현과 관련된 새로운 논리와 합성생물학적 가치
1. 개요 유전자 수준에서 단백질 발현에 영향을 미치는 대표적인 요소로는 promoter, RBS, tranion factor binding site, terminators, UTR, aptamer (riboswitch) 등이 있으며, 이들은 모두 목적 단백질의 발현조절을 위해 합성생물학적으로 재설계가 가능한 부분으로, 상기 요소 전체를 통합해 발현모듈이라 불리기도 한다. 기존의 연구들은 자연적으로 존재하는 이들 요소의 개별적 선별과정 후에, 특성을 분석하여 목적 유전자의 발현을 위한 도구로서 단순접목(incorporation)을 시도하였다. 합성생물학의 발달은 이들 자원이 지닌 특성을 개량하거나 목적에 맞게 변형하기 위한 합리적인 설계법과 도구를 제시하였다. 프로모터를 예로 들면 기존방법의 경우, 상대적으로 강한 세기를 갖는 프로모터 또는 약한 세기를 갖는 프로모터를 그대로 사용하거나, 조절인자와의 결합을 위해 operator 부분을 도입하여 활용하는 것이 일반적인 방법이었다. 하지만 최근 연구결과를 살펴보면 하나의 프로모터 서열로부터 프로모터 세기에 주요한 영향을 미치는 -35와 -10 주위의 spacer sequence 를 합성생물학적 방법으로 재설계하여 연속적인 다양한 세기를 갖도록 프로모터 라이브러리를 제작하고, 원하는 세기의 프로모터를 적소에 활용함으로써 꼭 필요한 수준의 단백질 발현이 이루어질 수 있도록 설계가 가능해졌음을 알 수 있다 (Hammer, et al. 2006). 뿐만 아니라 RBS calculator, UTR designer 와 같은 번역수준을 예측할 수 있는 프로그램을 활용하여 원하는 수준의 발현세기를 갖도록 관련요소를 설계할 수도 있다 (Salis 2011, Seo, et al. 2013). 발현모듈에 포함된 조절인자 (cis-acting factor)의 재설계 외에도 목적 단백질의 ORF 서열을 변형하여 발현양을 늘리는 방법도 주목을 받고 있다. 특히 난 발현되는 외래 유전자를 특정숙주에서 발현시키고자 할 때, 발현 숙주의 codon usage 정보를 기반으로 codon 을 최적화해 유전자를 합성하는 방법으로 단백질 발현수준을 조절할 수 있는 것으로 알려져 있다. 연구결과에 따르면 codon optimization 과정을 통해 재설계할 경우 동일한 일차구조를 갖는 단백질의 발현율이 250 배까지 차이가 날 수 있다고 알려져 있다 (Kudla, et al. 2009). 하지만 codon bias가 단백질의 발현양을 결정하는 결정적인 요소가 아니라 유전자 서열에 담겨있는 다양한 정보 (초기번역속도, 희귀코돈 분포, 전사체의 구조 및 안정성, 전사체의 구획화, UTR 과 같은 번역인자와의 결합부위)가 단백질 발현에 복합적으로 작용한다는 결과가 다양한 연구과정에서 보고되어, 이들을 통합적으로 조절하는 것이 중요할 수 있음을 시사하고 있는 것에 주목할 필요가 있다. 본 논고에서는 합성생물학적 방법으로 조절 가능한 단백질 발현에 관련된 인자들 중, 비교적 최근에 이론이 정립되었거나 제안된 새로운 논리와 관련하여 이들의 연구방법과 적용점에 대해 간략히 서술하고자 한다. 1. N-말단 codon bias 와 번역속도가 유전자 발현에 미치는 영향 그림 1. N-말단 rare codon 의 유무와 단백질 발현 수준의 상관성 (A), 유전자의 앞 부분에 존재하는 rare codon 에 의해 모아진 tRNA 의 재사용을 통한 단백질 발현속도 유지원리 모식도 (B). 연구내용을 살펴보면, GFP 의 N-term 부위에 자연적으로 존재하는 다양한 codon 조합을 더하여 발현 수준을 비교하였을 때, 일반적으로 rare codon 을 갖는 GFP 가 common codon 을 갖는 GFP 에 비해 14배 이상의 높은 수준으로 발현된 것을 알 수 있으며, 이는 RBS 세기와 관계 없이 유지되는 특성인 것으로 나타났다 (그림 1A). 대장균의 rare codon 을 살펴보면 세 번째 염기에 A/T 가 주로 나타나는 것을 볼 수 있다. 결과적으로 A/T 가 좀더 약화된 RNA 구조를 형성하며, G/C 를 갖는 다른 synonymous codon 에서는 나타나지 않는 뚜렷한 발현 증가와의 상관관계를 확인하였다 (그림 1B). 이처럼 전사체의 구조는 유전자 발현에 많은 영향을 준다. 뿐만 아니라 유전자의 서열 정보는 번역시 elongation 속도를 늦추거나 일시적으로 멈춤으로써 (rare codon 에 의한 tRNA abundance와 관련) 단백질 발현에 큰 영향을 미친다. 특히 rare codon 이 유전자 내부에서 자주 나타날 경우, 리보솜의 elongation stalling을 유발하여 발현양을 극단적으로 떨어뜨리기도 한다. Codon bias 가 심한 이종숙주에서 외래유전자를 발현할 시 이러한 문제가 빈번하게 나타나며, 이를 해결하기 위해 codon optimization 방법이 도입되었다. 하지만 전체 서열을 대상으로 rare codon 을 치환하는 것은 경제적 측면에서 맞지 않을 뿐 아니라, 실제 기대만큼 효과가 나타나지 않는 경우가 빈번하게 관찰된다. 따라서 이러한 이론을 유전자 전체에 적용하기에는 문제가 있는 것으로 알려져 있다. 이를 보완할 수 있는 연구결과로써 다음과 같은 이론이 존재한다. 2010년 셀(Cell)에 보고된 가설에 따르면, 번역 과정 중 한번 사용된 tRNA는 단순히 유리되는 것이 아니라 ribosome 주위에 머무르며 aminoacyltransferase 에 의해 다시 충전되어 번역 중 재사용될 것으로 예측하였다 (Cannarozzi, et al. 2010). 따라서 N-말단에 rare codon 을 위치시키면 초기에 번역속도가 낮아 발현율의 저하가 예상되나, 이후에 나타나는 rare codon 에서는 초기에 recruit 된 rare codon tRNA 가 재사용됨으로 (그림 1C), 전체적인 단백질 발현에는 큰 문제가 없을 것으로 추정되었다. 실제 실험에서도 이러한 효과가 확인되어 짐으로써, 작은 DNA 조각 (tag 형태로 모아진 rare codon) 을 특정 유전자 앞에 위치시키거나 N-말단 부위를 deoptimize (commn codon 을 rare codon 으로 변경)하는 방법으로 외래 유전자의 발현을 조절할 수 있다는 새로운 발현 논리가 주목을 받고 있다. 합성생물학적 기법으로 새로운 요소들을 접목해 적용점을 넓히기 위해서는, 아직은 불확실하지만 새롭게 도입해야 할 다양한 변수 (약화된 전사체의 N-말단 구조, 가속 번역속도론, rare codon 분포와 tRNA 재사용)에 대한 심도 있는 이해는 반드시 필요한 선행과제이다. 앞으로의 연구는 이러한 이해를 바탕으로 유전자의 서열 (특히, N-말단 서열)을 합리적으로 설계하여 과발현의 유도는 물론, 발현된 단백질의 가용성과 활성을 원하는 수준으로 조절 가능한 규격화된 범용의 발현시스템을 구현하는 것이다. 2. 전사체의 subcellular
localization
그림 2. 살아있는 박테리아에서 단일 mRNA 의 추적 방법 (A), signal peptide 의존적인 방법과 mRNA 서열(구조)에 의존적인 세포 내 이동 방법 (B)의 비교.
3. 분비 단백질의 유전자 서열이 발현에 미치는 영향
그림 3. 신호서열을 갖는 단백질을 코딩하는 유전자에 특정 위치에서 번역효율의 일시적 감소가 일어나는 REST 서열의 유무와 SRP enrichment(binding) 정도의 상관관계. 관련된 연구내용을 간단히 살펴보면 다음과 같다. 먼저 signal peptide 를 갖는 단백질을 in-vivo 에서 SRP enrichment 정도에 따라 SRP-E(enriched), SRP-SE(strongly enriched) 로 구분하고 signal peptide 의 hydrophobicity, putative binding motif, 특이서열의 패턴을 분석하여 SRP enrichment 와의 상관관계를 분석하였으나 관련 변수를 확인할 수 없었다. 반면에 mRNA 의 번역 효율의 일시적 감소가 나타날 수 있는 서열 정보가 동종에서 보존되어있는 것을 확인하였으며, 이들 서열이 SRP recruitment 에 중요한 역할을 할 것으로 생각하였다. 실제 SRP-E 와 SRP-NC(noncognate) 에서는 이들의 서열이 발견되지 않았으나 SRP-SE 에서는 SRP 인식부위로부터 ~38-43 codon 부위에 nonoptimal codon 이 위치함을 확인하였다 (그림 3). 따라서 이러한 서열을 REST (mRNA-Encoded Slowdown of Translation) 라 명명하고 transmembrane motif 를 지닌 다른 단백질을 coding 하는 유전자에서도 동일한 서열이 확인되는지를 분석하였다. 그 결과 다른 단백질의 경우에도, SRP 인식부위로부터 약 ~55 codon 부위에 이러한 기능을 지닌 구조적 특성이 나타남을 확인하였으며, 이 외에 서열정보도 동종에서 보존되어 있는 것을 확인하였다. 결과적으로 signal peptide 의 hydrophobic 한 서열이 SRP 의 결합에 영향을 미치나, 최소 임계 값을 초과한 경우에 hydrophobicity 의 증가는 더 이상의 SRP binding strength 를 높일 수 없으며, 반면에 전사체의 번역과정 중 REST 에 의한 local slow down 효과가 SRP를 recruitment 함을 증명하였다. 따라서 분비 단백질을 연구할 때 REST 와 같은 유전자 서열의 추가 혹은 대체를 통해 발현과 분비 효율을 조절할 수 있을 것으로 생각된다. 좀더 많은 case study 가 필요하겠지만, 합성생물학 분야에서 분비 단백질을 효율적으로 발현시키고자 할 때 이러한 요소를 접목하여 유전자를 설계함으로써 관련 연구에 활용할 수 있을 것으로 기대된다. 고찰 참고 문헌 ※ 출처 : 지능형 바이오시스템 설계 및 합성
연구단(바로가기) |