20um에는 몇 dna ug ul

발명의 상세한 설명DETAILED DESCRIPTION OF THE INVENTION

세포 염색질의 표적화 절단 및, 예를 들어 표적화 절단에 이은 비-상동성 단부 잇기(사이에 외래 서열을 삽입하거나 삽입하지 않고) 또는 표적화 절단에 이은 외래 폴리뉴클레오티드(세포 뉴클레오티드 서열과 상동성인 하나 이상의 영역을 포함하는)와 게놈 서열 사이의 상동성 재조합에 의한, 세포 뉴클레오티드 서열의 표적화 변경에 유용한 조성물 및 방법이 본원에 개시된다. 게놈 서열은 염색체, 에피솜, 세포소기관 게놈(예를 들어, 미토콘드리아, 엽록체), 인공 염색체, 및 예를 들어, 증폭 서열, 이중 미세 염색체 및 내인성 또는 감염된 박테리아 및 바이러스의 게놈과 같은 세포에 존재하는 어떤 다른 종류의 핵산에 존재하는 것들을 포함한다. 게놈 서열은 정상 서열(즉, 야생형)일 수도 있고 돌연변이 서열일 수도 있으며, 돌연변이 서열은, 예를 들어 삽입, 결실, 전위, 재배열, 및/또는 점 돌연변이를 포함할 수 있다. 게놈 서열은 또한 여러 상이한 대립유전자들 중 하나를 포함할 수 있다.(E. G., One or more regions that are homologous to the nucleotide sequence of the cell), followed by targeted cleavage of the cell chromatin and, for example, targeted cleavage followed by non-homologous end joining (without inserting or inserting a foreign sequence in between) or targeted cleavage , And genomic sequences, by homologous recombination between genomic sequences (e. G., Including < / RTI > The genomic sequence may be present in a cell such as a chromosome, an episome, a cell organellar genome (e. G., Mitochondria, chloroplast), an artificial chromosome, and the genome of an amplified sequence, a double microchromosome and endogenous or infected bacteria and viruses, Including those present in any other kind of nucleic acid. The genomic sequence may be a normal sequence (i.e., wild type) or may be a mutant sequence, and the mutant sequence may include, for example, insertion, deletion, dislocation, rearrangement, and / or point mutation. The genomic sequence may also comprise one of several different alleles.

표적화 절단 및 재조합에 유용한 조성물은 절단 도메인(또는 절단 하프-도메인)과 징크핑거 결합 도메인을 포함하는 융합 단백질, 이 단백질을 암호화하는 폴리뉴클레오티드 및 폴리펩티드와 폴리펩티드-암호화 폴리뉴클레오티드의 조합을 포함한다. 징크핑거 결합 도메인은 1개 이상의 징크핑거(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9개 또는 그 이상의 징크핑거)를 포함할 수 있으며, 어떤 게놈 서열에 결합하도록 조작될 수 있다. 따라서, 절단이나 재조합을 원하는 해당 표적 게놈 영역을 확인함으로써, 본원에 개시된 방법에 따라서, 절단 도메인(또는 절단 하프-도메인)과 상기 게놈 영역 안의 표적 서열을 인식하도록 조작된 징크핑거 도메인을 포함하는 하나 이상의 융합 단백질을 구성할 수 있다. 세포 내에 이러한 융합 단백질(또는 단백질)의 존재는 융합 단백질(들)과 그것(그들)의 결합 부위(들)의 결합과 상기 게놈 영역 안이나 근처에서 절단을 가져올 것이다. 더욱이, 게놈 영역에 상동성인 외래 폴리뉴클레오티드가 또한 이러한 세포에 존재할 경우, 게놈 영역과 외래 폴리뉴클레오티드 사이에 높은 비율로 상동성 재조합이 일어난다.Compositions useful for targeted cleavage and recombination include fusion proteins comprising a cleavage domain (or cleavage half-domain) and a zinc finger binding domain, polynucleotides and polypeptides that encode the protein, and a combination of polypeptide-encoding polynucleotides. A zinc finger binding domain may comprise one or more zinc finger (e. G., 2, 3, 4, 5, 6, 7, 8, 9 or more zinc fingers) . Thus, by identifying the corresponding target genomic region for which it is desired to cut or recombine, one that comprises a cleavage domain (or cleavage half-domain) and a zinc finger domain engineered to recognize the target sequence in the genomic region, according to the methods disclosed herein The above fusion proteins can be constructed. The presence of such a fusion protein (or protein) in a cell will result in the binding of the fusion site (s) with the fusion protein (s) thereof and cleavage in or near the genomic region. Moreover, when exogenous polynucleotides homologous to the genomic region are also present in such cells, homologous recombination takes place at a high rate between the genomic region and the exogenous polynucleotide.

일반적인 내용General content

본 발명에서 조성물의 제조 및 사용과 더불어 본 방법의 실현은, 달리 지적한 바 없다면, 분자생물학, 생화학, 염색질 구조 및 분석학, 컴퓨터 방식 화학, 세포 배양학, DNA 재조합 및 일반 기술에 속하는 관련 분야 등의 전형적인 기술을 사용한다. 이러한 기술들은 논문의 형식으로 충분히 설명되어 있다. 참고문헌의 예로는, Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P. M. Wassarman and A.P. Wolffe, eds.), Academic Press, San Diego, 1999; 및 METHODS IN MOLECULAR BIOLOGY, Vol.119, "Chromatin Protocols"(P.B. Becker, ed.) Humana Press, Totowa, 1999 등이 있다.The realization of the present methods, together with the preparation and use of the compositions in the present invention, will be understood to include, without limitation, molecular biology, biochemistry, chromatin structure and analysis, computational chemistry, cell culture, DNA recombination, Use typical techniques. These techniques are fully described in the form of a paper. Examples of references include Sambrook et al. MOLECULAR CLONING: A LABORATORY MANUAL, Second edition, Cold Spring Harbor Laboratory Press, 1989 and Third edition, 2001; Ausubel et al., CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, John Wiley & Sons, New York, 1987 and periodic updates; the series METHODS IN ENZYMOLOGY, Academic Press, San Diego; Wolffe, CHROMATIN STRUCTURE AND FUNCTION, Third edition, Academic Press, San Diego, 1998; METHODS IN ENZYMOLOGY, Vol. 304, "Chromatin" (P. M. Wassarman and A. P. Wolffe, eds.), Academic Press, San Diego, 1999; And METHODS IN MOLECULAR BIOLOGY, Vol. 119, "Chromatin Protocols" (P. B. Becker, ed.) Humana Press, Totowa, 1999.

정의Justice

"핵산", "폴리뉴클레오티드," 및 "올리고뉴클레오티드" 등의 용어는 상호 교환적으로 사용되는데, 선형 또는 원형 배치와 단일-가닥 또는 이중-가닥 형태의 데옥시리보뉴클레오티드나 리보뉴클레오티드 폴리머를 일컫는다. 본 발명의 목적상, 이러한 용어들은 폴리머의 길이에 따른 제한적인 의미로 파악되어 지지는 않을 것이다. 그 용어들은 염기, 당류 및/또는 포스페이트 부분(예를 들어, 티오인산에스테르 백본)에서 변형된 뉴클레오티드는 물론 잘 알려진 천연 뉴클레오티드의 유사체을 포함할 수 있다. 일반적으로 특정 뉴클레오티드의 유사체는 같은 염기쌍 특이성을 갖는다; 예를 들어, A의 유사체는 T와 염기쌍을 이루게 될 것이다.The terms "nucleic acid," "polynucleotide," and "oligonucleotide" are used interchangeably and refer to deoxyribonucleotides or ribonucleotide polymers in either linear or circular configuration and single-stranded or double-stranded form. For purposes of the present invention, these terms will not be construed in a limiting sense depending on the length of the polymer. The terms may include nucleotides modified in bases, saccharides and / or phosphate moieties (e. G., Thiophosphate ester backbones) as well as analogs of well-known natural nucleotides. In general, analogs of particular nucleotides have the same base pair specificity; For example, analogs of A will be base-paired with T.

"폴리펩티드", "펩티드" 및 "단백질" 등의 용어는 상호 교환적으로 사용되는데, 아미노산 잔기 폴리머를 일컫는다. 또한, 그 용어는 하나 또는 수개의 아미노산이 자연적으로 생기는 해당 아미노산의 유사체이거나 변형된 유도체로 이루어진 아미노산 중합체에도 적용된다.The terms "polypeptide "," peptide ", and "protein" and the like are used interchangeably and refer to amino acid residue polymers. The term also applies to amino acid polymers consisting of analogs or modified derivatives of the corresponding amino acids in which one or several amino acids occur naturally.

"결합"이란 서열 특이성, 또는 단백질과 핵산 사이 등과 같은 고분자 간 비-공유 상호작용을 말한다. 상호작용이 전체적으로 보아 서열 특이성을 가지는 한, 상호작용의 모든 성분들이 서열 특이성(예를 들어, DNA 백본에서 인산염 잔기와 접촉하는 것)일 필요는 없다. 이러한 상호작용은 일반적으로 해리 상수(Kd)가 10-6 M-1 이하인 것을 특징으로 한다. "친화도"란 결합력을 의미하는데, 결합 친화도의 증가는 해리 상수(Kd)의 감소와 상관관계를 갖는다."Binding" refers to sequence-specific, or non-shared interactions between polymers, such as between protein and nucleic acid. Not all components of the interaction need to be sequence-specific (for example, in contact with phosphate residues in the DNA backbone), as long as the interaction has overall sequence specificity. These interactions are generally characterized by a dissociation constant (Kd) of 10 -6 M -1 or less. "Affinity" means binding force, and the increase in binding affinity is correlated with the decrease in dissociation constant (Kd).

"결합 단백질"이란 비공유적으로 다른 분자와 결합할 수 있는 단백질을 말한다. 결합 단백질은, 예를 들어 DNA 분자(DNA 결합 단백질), RNA 분자(RNA 결합 단백질) 및/또는 단백질 분자(단백질 결합 단백질)와 결합할 수 있다. 단백질-결합 단백질의 경우, 자신과의 결합도 가능하여 동형이량체 및 동형삼량체 등을 형성하기도 하고 또는 다른 단백질의 하나 또는 수개의 분자와의 결합도 가능하다. 결합 단백질은 하나 이상의 결합 활성 형태를 지닐 수 있다. 예를 들어, 징크핑거 단백질은 DNA 결합, RNA 결합 및 단백질 결합 활성을 지닌다."Binding protein" refers to a protein that can bind non-covalently to other molecules. The binding protein can bind to, for example, a DNA molecule (DNA binding protein), an RNA molecule (RNA binding protein) and / or a protein molecule (protein binding protein). In the case of a protein-binding protein, it is also possible to bind to itself to form homodimers and homotrimers, or to bind one or several molecules of another protein. A binding protein may have one or more binding active forms. For example, zinc finger proteins have DNA binding, RNA binding and protein binding activity.

"징크핑거 DNA 결합 단백질" (또는 결합 도메인)이란 하나 또는 수개의 징크핑거를 통하여 서열 특이성을 갖는 방식으로 DNA와 결합하는 단백질이나 더 큰 단백질 내부의 도메인을 말하는데, 이때 징크핑거란 아연 이온과 배위결합을 하는 동안에 구조가 안정적인 결합 도메인의 내부에 있는 아미노산 서열 부분을 말한다. 징크핑거 DNA 결합 단백질은 징크핑거 단백질 또는 ZFP로 간략히 표시되기도 한다. A "zinc finger DNA binding protein" (or binding domain) refers to a protein or a domain within a larger protein that binds to DNA in a manner that has sequence specificity through one or several zinc finger (s), wherein the zinc finger Refers to the amino acid sequence portion within the binding domain where the structure is stable during binding. Zinc finger DNA binding proteins may also be abbreviated as zinc finger proteins or ZFPs.

징크핑거 결합 도메인은 미리 정해진 뉴클레오티드 서열에 결합하도록 "가공"될 수 있다. 징크핑거 단백질 설계를 위한 방법의 예로, 이에 한정되지 않지만, 디자인과 선택이 있다. 디자인된 징크핑거 단백질은 자연적으로 발생하는 것이 아니라 합리적인 척도에 따라 순이론적으로 디자인 또는 조성된 것이다. 디자인을 위한 합리적인 척도에는 치환법칙의 응용과 현존하는 ZFP 디자인 및 결합에 관한 데이터베이스의 정보처리를 위한 컴퓨터 알고리즘을 포함한다. 그 예로, 미국특허 제 6,140,081; 6,453,242; 및 6,534, 261호, 또는 WO 98/53058; 98/53059; 98/53060; 02/016536 : 03/016496 등을 참조한다. The zinc finger binding domain can be "processed" to bind to a predetermined nucleotide sequence. Examples of methods for zinc finger protein design include, but are not limited to, design and selection. Designed zinc finger proteins are not naturally occurring but are purely theoretically designed or constructed according to a reasonable scale. Reasonable scales for design include computer algorithms for the application of substitution laws and information processing of databases on existing ZFP designs and combinations. For example, U.S. Patent Nos. 6,140,081; 6,453,242; And 6,534, 261, or WO 98/53058; 98/53059; 98/53060; 02/016536: 03/016496, and the like.

"선택된" 징크핑거 단백질이란 자연상태에서 발견되는 단백질이 아니라 주로 위상 표시, 상호작용 트랩 또는 혼성 선택과 같은 실험 과정을 통해 생산된 결과물을 말한다. 그 예로는, 미국특허 제 5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,200,759호; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 및 WO 02/099084 등을 참조한다.A "selected" zinc finger protein is not a protein found in nature, but rather an artifact produced primarily through experimental processes such as phase labeling, interaction trapping, or hybrid selection. Examples include U. S. Patent Nos. 5,789, 538; 5,925,523; 6,007,988; 6,013,453; 6,200,759; WO 95/19431; WO 96/06166; WO 98/53057; WO 98/54311; WO 00/27878; WO 01/60970; WO 01/88197 and WO 02/099084.

"서열"이란 그 길이와 무관하게 뉴클레오티드 서열을 의미하는데, 이는 직선형, 원형 또는 가지형의 DNA 또는 RNA가 될 수도 있고, 단일 나선형이거나 이중-나선형일 수도 있다. "도너 서열"이란 게놈에 삽입된 뉴클레오티드 서열을 말한다. 도너 서열은 어떠한 길이도 가능하다. 예를 들어, 길이가 2에서 10,000 뉴클레오티드 또는 그 사이의 어떤 정수 값도 가능하고 또한 이를 넘어설 수도 있다. 일반적으로 길이가 약 100에서 1,000 뉴클레오티드 사이(그 범위의 어떠한 정수 값도 가능)가 보통이나, 더 일반적으로는 길이가 약 200에서 500 뉴클레오티드 사이의 값을 가짐이 보통이다. "Sequence" means a nucleotide sequence, regardless of its length, which may be a linear, circular or branched DNA or RNA, or may be single-stranded or double-stranded. "Donor sequence" refers to the nucleotide sequence inserted into the genome. The donor sequence can be any length. For example, any integer value between 2 and 10,000 nucleotides in length, or any integer value in between, is possible or exceeded. Generally, it is common for lengths of between about 100 and 1,000 nucleotides (any integer value in the range is possible) to be moderate, but more generally between about 200 and 500 nucleotides in length.

"상동성이 있으나 동일하지 않은 서열"이란 두번째 서열과 어느 정도의 서열 특이성을 공유하지만 그 서열이 일치하지는 않는 첫 서열을 의미한다. 예를 들어, 변종 유전자의 자연형 서열을 구성하는 폴리뉴클레오티드는 그 변종 유전자의 서열과는 상동성을 지니고 비일치성을 갖는다. 어떤 구체예의 경우, 두 개의 서열간 상동성이, 정상 세포의 메커니즘을 이용하여 그 사이에 상동성 재조합이 가능하도록 함에 충분하다. 두 개의 상동성이 있으나 동일하지 않은 서열 서열은 어떠한 길이도 가능하고, 또 비상동성의 정도가 단일의 뉴클레오티드만큼 작을 수도 있고(예를 들어, 표적화된 상동성 재조합에 의한 게놈의 점돌연변이의 보정을 위한 경우) 또는 10 이상의 킬로베이스 만큼 클 수도 있다(예를 들어, 염색체의 미리 정해진 이소 부위에 유전자를 삽입하는 경우). 상동성, 비일치성 서열을 구성하는 두 개의 폴리뉴클레오티드는 같은 길이를 가질 필요는 없다. 예를 들어, 20에서 10,000 사이의 뉴클레오티드나 뉴클레오티드 쌍으로 이루어진 외래의 폴리뉴클레오티드(즉, 도너 폴리뉴클레오티드)도 사용될 수 있다. "Homologous but not identical sequence" means a first sequence that shares some degree of sequence specificity with the second sequence but does not match the sequence. For example, a polynucleotide constituting a naturally-occurring sequence of a variant gene has homology with the sequence of the variant gene and has inconsistency. In some embodiments, homology between two sequences is sufficient to allow for homologous recombination between them using normal cell mechanisms. Sequence sequences that are two homologous but not identical may be of any length and the degree of non-homology may be as small as a single nucleotide (e.g., the correction of a genomic point mutation by targeted homologous recombination Or 10 or more kilobases (for example, when inserting a gene into a predetermined iso site of a chromosome). The two polynucleotides constituting the homology, inconsistency sequence need not have the same length. For example, exogenous polynucleotides (i.e., donor polynucleotides) consisting of 20 to 10,000 nucleotides or pairs of nucleotides may be used.

핵산 및 아미노산 서열 특이성을 결정하기 위한 기술들은 이미 알려져 있다. 전형적으로 그러한 기술들은 유전자를 위한 mRNA의 뉴클레오티드 서열을 결정하는 것, 그리고/또는 그에 의하여 암호화된 아미노산 서열을 결정하는 것, 그리고 이러한 서열을 두 번째 뉴클레오티드 또는 아미노산 서열과 비교하는 것 등을 포함한다. 이러한 방식으로 또한 게놈 서열도 결정되고 비교될 수 있다. 일반적으로, 일치성이란 두 개의 폴리뉴클레오티드 또는 폴리펩티드 서열이 서로 상응하는 정확한 뉴클레오티드 쌍 또는 아미노산 쌍을 각각 의미한다. 둘 또는 그 이상의 폴리뉴클레오티드나 아미노산 서열은 그 일치성 백분율을 측정하여 비교될 수 있다. 일치성 백분율이란, 핵산이든 아미노산이든 간에, 정렬된 두 개 서열간에 서로 정확히 일치하는 서열수를 짧은 서열의 길이로 나누고 이에 100을 곱한 값을 말한다. 핵산 서열의 근사 정렬은 Advances in Applied Mathematics 2: 482489 (1981)에서 Smith와 Waterman의 국부 상동 알고리즘에 의하여 제공되고 있다. 이 알고리즘은 Atlas of Protain Sequence and Structure, M. O. Dayhoff ed., 5 suppl. 3: 353-358, National Biomedical Research Foundation, Washington, D. C. , USA 에서 Dayhoff에의해 개발되고, Nucl. Acids Res. 14 (6): 6745- 6763 (1986)에서 Gribskov에 의해 표준화된 측정 행렬을 이용함으로써 아미노산 서열에도 적용될 수 있다. 서열의 일치성 백분율을 결정하기 위한 이 알고리즘의 실시예가 Gentics Computer Group (Madison, WI)의 "BestFit" 유틸리티 응용 프로그램에 의해 제공되고 있다. 이 방법의 초기설정 변수는 Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995)에 기술되어 있다. 본 발명에 있어서 일치성 백분율을 확립하기 위한 보다 좋은 방법으로는, 에딘버러 대학교에 저작권이 있고, John F. Collins 및 Shane S. Sturrok이 개발하고, IntelliGentics, Inc.(Mountain View, CA)에서 유통하고 있는 MPSRCH 프로그램 패키지를 사용하는 것이다. 이 패키지 모음에 의하면 측정 행렬의 초기설정 변수가 사용되는 경우에 Smith Waterman 알고리즘이 적용될 수 있다. 그러한 변수의 초기설정의 예를 들면, 공백 생성 벌점 12, 공백 연장 벌점 1, 공백 6 등과 같다. "정합"값을 산출한 데이터를 통하여 이는 곧 서열 일치성을 반영한다는 것을 알 수 있다. 일치성 백분율이나 서열간의 유사성을 계산하기 위한 다른 적절한 프로그램은 해당 기술 분야에서 일반적으로 알려져 있는데, 예를 들어, 또 다른 정렬 프로그램으로 초기설정 변수를 이용하는 BLAST가 있다. 예를 들어, BLASTN 및 BLASTP 는 하기의 초기설정 변수를 이용하여 쓰인다. 유전 암호 = 표준, 필터 = 무, 나선 = 두 개, 차단 = 60, 예측 = 10 , 매트릭스 = BLOSUM62, 서술 = 50 서열, 정렬 = HIGH SCORE, 데이터베이스 = 비과잉, GenBank + EMBL + DDBJ + PDB + GenBank CDS 전사 + Swiss 단백질 + Spupdate + PIR. 이 프로그램의 상세한 부분은 인터넷상에서 찾을 수 있다. 본 발명에 기술된 서열에 관하여, 서열 일치성의 바람직한 범위는 대략 80%에서 100% 및 그 사이의 정수값이다. 전형적으로는 서열간의 일치성 백분율은 최소 70 ~ 75%, 바람직하게는 80 ~ 82%, 더 바람직하게는 85 ~ 90%, 한층 더 바람직하게는 92%, 더더욱 바람직하게는 95%, 가장 바람직하게는 98% 서열 일치성을 보인다. Techniques for determining nucleic acid and amino acid sequence specificity are already known. Typically, such techniques include determining the nucleotide sequence of the mRNA for the gene, and / or determining the amino acid sequence encoded thereby, and comparing the sequence to a second nucleotide or amino acid sequence. In this way also genome sequences can be determined and compared. Generally, correspondence means an exact pair of nucleotides or pairs of amino acids, each corresponding to two polynucleotide or polypeptide sequences. Two or more polynucleotides or amino acid sequences can be compared by measuring their percent identity. The percentage of correspondence is the number of sequences that exactly match each other between two aligned sequences, whether nucleic acid or amino acid, divided by the length of the short sequence and then multiplied by 100. Approximate alignment of nucleic acid sequences is provided by Smith and Waterman's local homology algorithm in Advances in Applied Mathematics 2: 482489 (1981). This algorithm is described in Atlas of Proc. Sequence and Structure , MO Dayhoff ed., 5 suppl. 3: 353-358, developed by Dayhoff in the National Biomedical Research Foundation, Washington, DC, USA, and Nucl. Acids Res . 14 (6): 6745-6763 (1986) by using a measurement matrix standardized by Gribskov. An embodiment of this algorithm for determining percent sequence identity is provided by the "BestFit" utility application of the Gentics Computer Group (Madison, Wis.). The initial parameters of this method are described in the Wisconsin Sequence Analysis Package Program Manual, Version 8 (1995). A better method for establishing a percentage of agreement in the present invention is copyrighted by the University of Edinburgh, developed by John F. Collins and Shane S. Sturrok, distributed by IntelliGentics, Inc. (Mountain View, CA) It uses the MPSRCH program package. According to this suite of packages, the Smith Waterman algorithm can be applied when the initialization parameters of the measurement matrix are used. An example of the initial setting of such a variable is the blank generation penalty of 12, the blank extension penalty of 1, the blank of 6, and so on. It can be seen from the data that the "match" value is calculated that this reflects the sequence correspondence. Other suitable programs for calculating similarity percentages or similarities between sequences are generally known in the art, for example BLAST, which uses initialization parameters as another sorting program. For example, BLASTN and BLASTP are used with the following initialization parameters. GenBank + EMBL + DDBJ + PDB + GenBank, Generic Encryption = Standard, Filter = No, Spiral = 2, Block = 60, Prediction = 10, Matrix = BLOSUM62, Description = 50 Sequence, Sort = HIGH SCORE, Database = CDS transcription + Swiss protein + Spupdate + PIR. Details of this program can be found on the Internet. With respect to the sequences described in the present invention, the preferred range of sequence conformity is approximately 80% to 100% and an integer value therebetween. Typically, the percent identity between sequences is at least 70-75%, preferably 80-82%, more preferably 85-90%, even more preferably 92%, even more preferably 95%, most preferably, Show 98% sequence identity.

또한, 상동성을 지닌 부분 사이에서 안정적인 중복체를 형성할 수 있는 조건에서 폴리뉴클레오티드 혼성체를 만든 후, 단일 나선 특이성 뉴클레아제로 분해한 후, 분해된 단편의 크기를 결정하는 방식을 통하여, 폴리뉴클레오티드 사이의 서열 유사성의 정도를 결정할 수 있다. 상기의 방법을 통하여 결정된 분자의 한정된 길이에 대한 서열 일치성이 최소 약 70%-75%를 나타내거나, 바람직한 결과로서 80% ~ 82%, 더 바람직한 결과로서 85% ~ 90%, 한층 더 바람직한 결과로서 92%, 더 더욱 바람직한 결과로서 95%, 가장 바람직한 결과로서 98%를 나타낸다면, 두 개의 핵산이나 두 개의 폴리펩티드 서열은 실질적으로 서로 상동성을 지닌다. 본 발명에서 사용되듯이, 실질적으로 상동성을 지닌다는 것은 또한 지정된 DNA 또는 폴리펩티드 서열과 완전한 일치성을 보이는 서열도 지칭한다. 실질적으로 상동성을 지닌 DNA 서열은, 예를 들어 엄격한 조건하에서 그 특별한 시스템에 한정되는, 서던 혼성화 실험으로 식별될 수 있다. 여기서 적절한 혼성화 조건의 한정은 일반 기술 분야에 속한다. 그 예로서는, Sambrook et al., supra; Nucleic Acid Hybridization: A Practical Approach, editors B. D. Hames and S. J. Higgins, (1985) Oxford; Washington, DC; IRL Press 등을 참조한다. Also, by preparing a polynucleotide hybridized under the condition that a stable duplex can be formed between the regions having homology, and then decomposing the polynucleotide into single-strand-specific nucleases and determining the size of the fragment, The degree of sequence similarity between nucleotides can be determined. Sequence correspondence for a defined length of molecule determined by the method described above exhibits a minimum of about 70% -75%, or as a preferred result 80% to 82%, more preferably 85% to 90% , 92% as a more preferred result, 95% as the most preferred result, 98% as the most preferred result, the two nucleic acid or two polypeptide sequences are substantially homologous to each other. As used herein, substantially homologous also refers to sequences that exhibit complete correspondence with a given DNA or polypeptide sequence. DNA sequences having substantial homology can be identified, for example, by Southern hybridization experiments, which are limited to that particular system under stringent conditions. Wherein the limitation of suitable hybridization conditions is within the general technical field. Examples include Sambrook et al., Supra; Nucleic Acid Hybridization: A Practical Approach, eds BD Hames and SJ Higgins, (1985) Oxford; Washington, DC; IRL Press, etc.

두 개의 핵산 단편의 표적화된 혼성화는 다음과 같이 측정될 수 있다. 두 개의 핵산 분자 사이의 서열 일치성의 정도는 그러한 분자간의 혼성화 야기의 효율 및 강도에 영향을 미친다. 부분적으로 일치성을 갖는 핵산 서열은 최소한 표적 분자에 대하여 완전히 일치성을 갖는 서열의 혼성화를 억제할 것이다. 완전히 일치성을 갖는 서열의 혼성화 억제 정도는 해당 기술 분야에서 잘 알려진 혼성 분석을 이용하여 평가될 수 있다. (예를 들어, 서던 (DNA) 블롯, 노던 (RNA) 블롯), 용액 혼성화 등, Sambrook, et al., Molecular Cloning: A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N.Y. 참조). 그러한 분석은 예를 들어, 낮은 엄격도에서 높은 엄격도로 변하는 조건을 이용하는 등으로 선택도를 변화시킴으로써 수행될 수 있다. 낮은 엄격도의 조건이 적용된다면, 예를 들어, 표적 분자와 약 30%의 서열 일치성도 갖지 않는 등 부분적인 서열 일치성도 갖지 않는 두번째의 프로브를 이용하여, 비특이성 결합이 존재하지 않음이 평가될 수 있고, 따라서 비특이성 결합의 부재는 두번째 프로브가 표적과 혼성화가 이루어지지 않는 결과를 낳을 것이다. Targeted hybridization of two nucleic acid fragments can be measured as follows. The degree of sequence correspondence between two nucleic acid molecules affects the efficiency and strength of the hybridization excitation between such molecules. A nucleic acid sequence with partial agreement will at least inhibit hybridization of the sequence with complete correspondence to the target molecule. The degree of inhibition of hybridization of a perfectly matched sequence can be assessed using hybrid analysis well known in the art. (1989) Cold Spring Harbor, N.Y., et al., Sambrook, et al., Molecular Cloning: A Laboratory Manual, Vol. Reference). Such an analysis can be performed, for example, by varying the selectivity, such as by using conditions that vary at high stringency to high stringency. If a low stringency condition is applied, the absence of nonspecific binding may be assessed using a second probe that does not also have partial sequence conformity, such as not having about 30% sequence identity with the target molecule And thus the absence of non-specific binding will result in the second probe not being hybridized with the target.

혼성화 기반 검출 시스템을 이용하는 경우, 핵산 프로브는 표준 핵산 서열과 보완적인 것을 선택하고, 그리고 나서 적절한 조건을 선택함으로써 프로브와 표준 서열이 선택적으로 서로 혼성화 또는 결합하여 중복체를 형성하게 한다. 적당하게 엄정한 혼성화 조건하에서 표준 서열에 선택적으로 혼성화가 가능한 핵산 분자는, 선택된 핵산 프로브의 서열과 적어도 약 70%의 서열 일치성을 가지고 최소 약 10 ~ 14 뉴클레오티드 길이가 검출되는 조건하에서는, 일반적으로 혼성화가 일어난다. 엄정한 혼성화 조건에서는 일반적으로, 선택된 핵산 프로브의 서열과 약 90 ~ 95% 보다 큰 서열 일치성을 가지고 최소 약 10 ~ 14 뉴클레오티드 길이의 표적 핵산 서열의 검출이 가능하다. 프로브 및 표준 서열이 뚜렷한 정도의 서열 일치성을 가지는 등 프로브/표준 서열 혼성화에 유용한 혼성화 조건은, 해당 기술 분야에서 알려진 바와 같이 결정될 수 있다. (그 예로서는, Nucleic Acid Hybridization: A Practical Approach, editors B. D. Hames and S. J. Higgins, (1985) Oxford; Washington, DC; IRL Press를 참조한다). When a hybridization-based detection system is used, the nucleic acid probe is selected from those complementary to the standard nucleic acid sequence, and then the probe and the standard sequence selectively hybridize or combine with each other to form a duplex by selecting appropriate conditions. A nucleic acid molecule capable of selectively hybridizing to a standard sequence under suitably stringent hybridization conditions will generally have a sequence identity of at least about 70% with a sequence of the selected nucleic acid probe and a length of at least about 10 to 14 nucleotides Hybridization occurs. Under stringent hybridization conditions it is generally possible to detect a target nucleic acid sequence of at least about 10 to 14 nucleotides in length with sequence identity greater than about 90 to 95% with the sequence of the selected nucleic acid probe. Hybridization conditions useful for probes / standard sequence hybridization with probe and standard sequence having significant degree of sequence conformity can be determined as known in the art. (See, for example, Nucleic Acid Hybridization: A Practical Approach , eds BD Hames and SJ Higgins, (1985) Oxford; Washington, DC; IRL Press).

혼성화의 조건들은 해당 기술 분야에서 잘 알려져 있다. 혼성화 엄격도란 부정합된 뉴클레오티드를 포함하여 혼성물의 형성을 방해하는 혼성화 조건의 정도를 말하는데, 높은 엄격도는 부정합된 혼성물에 대한 낮은 내성과 상관관계를 갖는다. 혼성화 엄격도에 영향을 미치는 요소들은 해당 기술 분야에서 잘 알려져 있는데, 이에 한정되지는 않지만, 온도, pH, 이온 세기, 그리고 포름아미드와 디메틸설폭사이드와 같은 유기 용매의 농도 등을 포함한다. 해당 기술 분야에서 잘 알려져 있듯이, 혼성화 엄격도는 높은 온도에서, 또 낮은 이온 세기에서, 또한 낮은 용매 농도에서 각각 증가한다. The conditions of hybridization are well known in the art. Hybridization Strictly refers to the degree of hybridization conditions, including mismatched nucleotides, that interfere with the formation of hybridization, with high stringency correlating with low resistance to unmated hybridization. Factors affecting hybridization stringency are well known in the art, including, but not limited to, temperature, pH, ionic strength, and concentrations of organic solvents such as formamide and dimethylsulfoxide. As is well known in the art, hybridization stringency increases at high temperatures, at low ionic strength, and at low solvent concentrations, respectively.

혼성화의 엄격도 조건과 관련하여, 잘 알려져 있듯이, 특수한 엄격도를 형성하기 위하여, 예를 들어, 다음의 요소(조건)들을 변경함에 의하여, 수많은 균등 조건들이 이용될 수 있다: 서열의 길이 및 특성, 다양한 서열의 염기 조성, 염 및 다른 혼성화 용액 구성물의 농도, 혼성화 용액내 차단물 존재여부 (예를 들어, 덱스트란 설페이트, 폴리에틸렌 글리콜 등), 혼성화 반응 온도 및 시간 변수, 세척 조건, 혼성화 조건의 특수한 설정의 선택은 해당 기술 분야의 표준적인 방법에 따라 선택된다 (그 예로, Sambrook, et al., Molecular Cloning : A Laboratory Manual, Second Edition, (1989) Cold Spring Harbor, N. Y.를 참조한다). As is well known in connection with the stringency conditions of hybridization, a number of equivalent conditions can be used, for example, by varying the following elements (conditions) to form a particular stringency: the length and nature of the sequence , The base composition of the various sequences, the concentration of salts and other hybridization solution components, the presence of blocking agents in the hybridization solution (e.g., dextran sulfate, polyethylene glycol, etc.), hybridization reaction temperature and time parameters, washing conditions, The selection of specific settings is selected according to standard methods in the art (see, for example, Sambrook, et al., Molecular Cloning: A Laboratory Manual , Second Edition, (1989) Cold Spring Harbor, NY).

"재조합"이란 두 개의 폴리뉴클레오티드 간에 유전 정보를 교환하는 과정을 말한다. 본 발명의 목적상, "상동성 재조합 (HR)"이란 예를 들어, 세포에서 이중-나선의 말단을 회복하는 동안에 발생하는 그러한 교환의 분화된 형태를 말한다. 이 과정은 뉴클레오티드 서열 상동성이 요구되고, 표적 분자의 주형 회복을 위하여 도너 분자를 이용하는데(예를 들어, 이중-나선 말단의 과정을 거친 분자를 이용), 도너에서 표적으로 유전 정보가 전달되는 점에서 "비교차 유전자 전환" 또는 "쇼트 트렉 유전자 전환"등 다양하게 형식으로 알려져 있다."Recombinant" refers to the process of exchanging genetic information between two polynucleotides. For the purposes of the present invention, "homologous recombination (HR)" refers to the differentiated form of such exchange that occurs during the recovery of the double-helix end in a cell, for example. This process requires nucleotide sequence homology and uses donor molecules (eg, molecules that have undergone a double-helix termination process) to recover the template of the target molecule, and genetic information is transferred from the donor to the target Quot; comparative gene switching "or" short-track gene switching ".

어느 특정 이론에 구애됨이 없이, 그러한 전달은 말단된 표적과 도너 사이에서 형성되는 이형중복체 DNA의 부정합 보정을 수반하고, 또는 표적의 일부가 될 유전 정보를 재합성하기 위하여 도너를 이용하는 "합성 의존성 나선 풀림"을 수반하기도 하고, 기타 관련된 과정을 수반하기도 한다. 그러한 분화된 HR은 표적 분자의 서열을 개조시키기도 하여, 도너 폴리뉴클레오티드 서열의 일부 또는 전부가 표적 폴리뉴클레오티드와 일체화되는 결과가 되기도 한다.Without wishing to be bound by any particular theory, such propagation entails "synthesis " using a donor to reconstitute the genetic information that is to be part of the target, or to accompany the mismatch correction of the heterologous duplicate DNA formed between the terminated target and the donor Dependency spiral loosening "and may involve other related processes. Such differentiated HR may also alter the sequence of the target molecule, resulting in some or all of the donor polynucleotide sequence being integrated with the target polynucleotide.

"절단"이란 DNA 분자의 공유 골격의 말단을 말한다. 절단은 다양한 방법에 의하여 개시될 수 있는데, 여기에는 포스포디에스테르 결합을 효소에 의한 또는 화학적인 가수분해 등의 방법과 기타 다른 방법이 있다. 단일 나선 절단 및 이중-나선 절단 모두가 가능한데, 이중-나선 절단은 두 개의 서로 다른 단일 나선 절단이 이루어짐으로써 발생될 수 있다. DNA 절단은 그 결과로 동일지점에서 절단 말단이나 엇갈리게 끊긴 엇갈림 말단의 생성물이 나올 수 있다. 어떤 구체예에서는, 표적이 된 이중-나선 DNA 절단을 위하여 융합 폴리펩티드가 이용된다. "Cleavage" refers to the end of the shared backbone of a DNA molecule. Cleavage can be initiated by a variety of methods, including phosphodiester linkage by enzymatic or chemical hydrolysis and other methods. Both single and double-spiral cuts are possible, and double-spiral cuts can occur by making two different single spiral cuts. DNA cleavage can result in cleavage ends at the same point or staggered ends that are staggered. In certain embodiments, fusion polypeptides are used for targeted double-helical DNA cleavage.

"절단 도메인"은 DNA 절단에 대한 촉매 활성을 가지는 하나 또는 수개의 폴리펩티드 서열로 구성된다. 절단 도메인은 하나의 폴리펩티드 사슬에 포함될 수 있고, 또는 두 개 내지 수개의 폴리펩티드의 결합으로부터 절단이 발생할 수도 있다. A "cleavage domain" consists of one or several polypeptide sequences that have catalytic activity for DNA cleavage. The cleavage domain may be included in a single polypeptide chain, or a cleavage may occur from a bond of two to several polypeptides.

"절단 하프-도메인"은 제2의 폴리펩티드(일치하든 불일치하든 간에)와 함께 결합하여 절단 활성(이중-나선 절단 활성)을 지닌 복합체를 형성하는 폴리펩티드 서열을 말한다. "Cleavage half-domain" refers to a polypeptide sequence that binds with a second polypeptide (either consistent or inconsistent) to form a complex with cleavage activity (double-helix cleavage activity).

"염색질"은 세포의 게놈을 구성하는 핵단백질 구조를 말한다. 세포의 염색질은 핵산, DNA(주성분), 히스톤 및 비히스톤계 염색체 단백질을 포함한 단백질로 구성된다. 대부분의 진핵 세포 염색질은 뉴클레오솜의 형태로 존재하는데, 뉴클레오솜 코어는, 히스톤 H2A, H2B, H3, H4의 각각 두 개로 구성된 8량체와 결합된 DNA의 대략 150 염기쌍으로 구성되어 있다. 그리고 유기체에 따라서 길이가 다양한 링커 DNA는 그 길이가 뉴클레오솜 코어 사이에 달한다. 히스톤 H1 분자는 일반적으로 링커 DNA와 결합하여 있다. 본 발명의 목적상, 용어 "염색질"은 모든 형태의 세포 핵단백질, 원핵 및 진핵 모두를 포함하는 의미로 쓰인다. 세포의 염색질은 염색체 및 에피솜의 염색질을 포함한다. "Chromatin" refers to the nuclear protein structure that constitutes the genome of a cell. The chromatin of the cell is composed of proteins including nucleic acid, DNA (principal component), histone and non-histone chromosomal proteins. Most eukaryotic chromosomes exist in the form of nucleosomes, which consist of approximately 150 base pairs of DNA linked to an octamer consisting of two histones H2A, H2B, H3 and H4, respectively. Linker DNA of varying length depending on the organism reaches its length between nucleosomes. Histone H1 molecules are usually associated with linker DNA. For purposes of the present invention, the term "chromatin" is used to include all forms of cellular nuclear proteins, both prokaryotic and eukaryotic. Chromosomes of the cells include the chromosomes and chromosomes of the episomes.

"염색체"는 세포의 게놈의 전부 또는 부분을 구성하는 염색질 복합체를 말한다. 세포의 게놈은 그를 구성하는 염색체 전부의 집합인 핵형에 의하여 종종 특징지워 진다. 세포의 게놈은 하나 또는 수개의 염색체로 구성될 수 있다. "Chromosome" refers to a chromatin complex that constitutes all or part of a cell's genome. The genome of a cell is often characterized by a karyotype that is a collection of all the chromosomes that make up it. The genome of a cell can consist of one or several chromosomes.

"에피솜"은 복제성 핵산, 핵단백질 복합체 또는 세포의 염색체 핵형의 일부가 아닌 핵산으로 구성된 다른 구조체를 말한다. 에피솜의 예로 플라스미드 및 바이러스성 게놈이 있다. "Episomal" refers to a replicative nucleic acid, a nuclear protein complex, or other construct consisting of a nucleic acid that is not part of the chromosomal karyotype of the cell. Examples of episomes are plasmids and viral genomes.

"접근 영역"이란 핵산의 표적 부위가 그 부위를 인식하는 외래 분자와 결합 가능한 세포의 염색질에 있는 영역을 말한다. 어느 특정 이론에 구애됨이 없이, 접근 영역은 뉴클레오솜 구조가 아닌 것으로 여겨진다. 접근 영역의 독특한 구조는 뉴클레아제 등과 같은 화학적 및 효소적 프로브에 대한 감도에 의하여 종종 탐지될 수 있다. "Access region" refers to a region in the chromatin of a cell capable of binding to a foreign molecule whose target site recognizes the site. Without wishing to be bound by any particular theory, it is believed that the access region is not a nucleosome structure. The unique structure of the access region can often be detected by sensitivity to chemical and enzymatic probes such as nuclease.

"표적 부위" 또는 "표적 서열"은 결합이 존재하기에 충분한 조건이 주어진다면 결합 분자가 결합할 수 있는 한정된 부분의 핵산 서열을 말한다. 예를 들어, 서열 5'-GAATTC-3'은 Eco RI 제한 엔도뉴클레아제의 표적 부위가 된다. A "target site" or "target sequence" refers to a nucleic acid sequence of a limited portion to which a binding molecule can bind, given sufficient conditions for the binding to exist. For example, sequence 5'-GAATTC-3 'is the target site for the Eco RI restriction endonuclease.

"외래" 분자란 세포에 존재하지 않는 것이 보통이지만, 하나 또는 수개의 유전적, 생화학적 기타 다른 방법에 의하여 세포에 삽입될 수 있는 분자를 말한다. "세포에 보통 존재한다는 것"은 세포의 특수한 발생 국면 및 환경 조건과 관련하여 결정된다. 따라서, 예를 들어, 근육의 배아기 성장 동안에만 존재하는 분자는 성인의 근육 세포에 대하여 외래 분자가 된다. 동일하게, 열 충격에 의하여 유도된 분자는 그렇지 않은 세포에 대하여 외래 분자가 된다. 외래 분자는, 예를 들어, 기능부전성 내인성 분자의 기능성 형태 또는 정상기능성 내인성 분자의 기능부전성 형태로 구성된다. A "foreign" molecule is a molecule that is usually not present in a cell, but can be inserted into a cell by one or several genetic, biochemical, or other methods. "Usually present in a cell" is determined in relation to the specific developmental phase and environmental conditions of the cell. Thus, for example, a molecule that exists only during the embryonic growth of a muscle becomes a foreign molecule to an adult muscle cell. Similarly, molecules induced by heat shock become foreign molecules to cells that are not. The exogenous molecule may, for example, consist of a functional form of a dysfunctional endogenous molecule or a dysfunctional form of a normal functional endogenous molecule.

외래 분자는, 무엇보다도, 조합 화학 과정에 의하여 생성되는 것처럼 작은 분자가 될 수 있고, 단백질, 핵산, 탄수화물, 지질, 당단백질, 지단백질, 다당류, 기타 이러한 분자들의 변형된 유도체와 같이 고분자가 될 수도 있으며, 또는 그러한 분자들로 구성되는 복합체가 될 수도 있다. 핵산은 DNA 및 RNA를 포함하고, 단일 또는 이중-나선이 될 수 있으며, 직선형, 가지형, 원형도 가능하며, 어떠한 길이도 가능하다. 핵산은 3중체의 핵산은 물론 이중체를 형성할 수 있는 그러한 것을 포함한다. 그 예로 미국특허 제 5,176, 996 및 5,422, 251 호를 참조한다. 단백질은, 이에 한정되지는 않지만, DNA 결합 단백질, 전사 인자, 염색질 리모델링 인자, 메틸화 DNA 결합 단백질, 폴리머라제, 메틸라제, 디메틸라제, 아세틸라제, 디아세틸라제, 키나제, 포스파타제, 인테그라제, 리콤비나제, 리가제, 토포이소머라제, 자이라제 및 헬리카제를 포함한다. Foreign molecules can, among other things, be small molecules as produced by the combinatorial chemistry process and can also be polymers such as proteins, nucleic acids, carbohydrates, lipids, glycoproteins, lipoproteins, polysaccharides, Or may be a complex composed of such molecules. Nucleic acid includes DNA and RNA, may be single or double-stranded, and may be linear, branched, circular, or any length. Nucleic acids include those which are capable of forming duplexes as well as nucleic acids of triplets. See, for example, U.S. Patent Nos. 5,176,996 and 5,422, 251. Proteins include, but are not limited to, DNA binding proteins, transcription factors, chromatin remodeling factors, methylated DNA binding proteins, polymerases, methylases, dimethys Niger, ligase, topoisomerase, zayirase, and helicase.

외래 분자는, 예를 들어, 외래 단백질이나 핵산처럼 내인성 분자와 같은 형태가 될 수 있다. 예를 들면, 외래 핵산은 전염성의 바이러스성 게놈, 세포 속으로 주입된 플라스미드 또는 에피솜, 세포에 보통 존재하지 않는 염색체 등으로 구성될 수 있다. 외래 분자를 세포 속으로 주입하는 방법은 해당 기술 분야에서 알려져 있는데, 여기에는, 이에 한정되는 것은 아니지만, 지질 매개 전사 기법(예를 들어, 중성 및 양 이온성 지질을 포함한 리포솜), 전기 영동법, 직접 주입법, 세포 융합법, 입자 충격법, 칼슘 인산 공침전법, DEAE-덱스트란 매개 전사법, 바이러스 벡터 매개 전사법이 포함된다. The exogenous molecule may be in the form of an endogenous molecule, such as, for example, an exogenous protein or nucleic acid. For example, the foreign nucleic acid may be comprised of a contagious viral genome, a plasmid or episome injected into the cell, a chromosome that is not normally present in the cell, and the like. Methods of injecting foreign molecules into cells are known in the art including, but not limited to, lipid-mediated transcription techniques (e. G., Liposomes including neutral and cationic lipids), electrophoresis, direct Injection method, cell fusion method, particle impact method, calcium phosphate coprecipitation method, DEAE-dextran mediated transcription method, viral vector mediated transcription method.

이에 비하여, "내인성" 분자란 특정한 환경적 조건 아래에서 특정한 성장 단계에서 특정한 세포에 보통 존재하는 것을 말한다. 예를 들면, 내인성인 핵산은 염색체, 미토콘드리아의 게놈, 엽록체 또는 다른 세포기관, 또는 자연적으로 생기는 에피솜 핵산으로 구성될 수 있다. 이에 추가한다면 내인성인 분자는 전사 인자 및 효소 등과 같은 단백질을 포함할 수도 있다. By contrast, an "endogenous" molecule is one that is usually present in a particular cell at a particular growth stage under certain environmental conditions. For example, an endogenous nucleic acid can be composed of a chromosome, a genome of mitochondria, a chloroplast or other cellular organelles, or a naturally occurring episomal nucleic acid. In addition, endogenous molecules may include proteins such as transcription factors and enzymes.

"융합 분자"란 두 개 또는 그 이상의 서브유닛 분자들이 연계되어 있는, 일반적으로 공유결합되어 있는 분자를 말한다. 서브유닛 분자들은 같은 화학 타입이거나, 다른 화학 타입일 수 있다. 전자의 예로는, 이에 한정된 것은 아니지만, 융합 단백질(예를 들어, ZFP DNA 결합 도메인과 절단 도메인 사이의 융합)과 융합 핵산(예를 들어, 상기 기술한 융합 단백질을 암호화하는 핵산이 포함된다. 후자의 예로는, 역시 이에 한정되지는 않지만, 3량체 형성 핵산과 폴리펩티드 사이의 융합, 그리고 마이너 그루브 바인더와 핵산 사이의 융합을 포함한다. "Fusion molecule" refers to a molecule that is generally covalently linked in which two or more subunit molecules are linked. The subunit molecules may be of the same chemical type or of different chemical types. Examples of electrons include, but are not limited to, a fusion protein (e.g., fusion between a ZFP DNA binding domain and a cleavage domain) and a fusion nucleic acid (e.g., a nucleic acid encoding the fusion protein described above. Examples include, but are not limited to, fusion between a trimer forming nucleic acid and a polypeptide, and fusion between a minor groove binder and a nucleic acid.

세포에서의 융합 단백질의 발현은 세포에 융합 단백질이 전달됨으로써 가능하고, 또는 융합 단백질을 암호화하는 폴리뉴클레오티드의 세포로의 전달을 통해서 가능한데, 여기서는 폴리뉴클레오티드가 전사되고, 전사된 유전 정보가 번역되어, 융합 단백질이 형성되기에 이른다. 폴리뉴클레오티드 및 폴리펩티드를 세포로 전달하는 방법은 본 발명의 다른 부분에 기술되어 있다. Expression of the fusion protein in the cell is possible by transferring the fusion protein to the cell or by transferring the polynucleotide encoding the fusion protein to the cell where the polynucleotide is transcribed and the transcribed genetic information is translated, Resulting in the formation of a fusion protein. Methods of delivering polynucleotides and polypeptides to cells are described elsewhere in the present invention.

"유전자"는, 본 발명의 목적상, 조절 서열이 코딩 서열 및/또는 전사 서열과 인접해 있든 그렇지 않든 간에, 유전자 산물을 조절하는 모든 DNA 영역은 물론 유전자 산물을 암호화하는 DNA 영역을 포함한다. 따라서, 유전자는, 이에 한정되지는 않지만, 프로모터 서열, 터미네이터, 리보솜 결합 부위와 내부 리보솜 점입 부위와 같은 번역 조절 서열, 인핸서, 사일런서, 인슐레이터, 경계 요소, 복제 기원, 매트릭스 부착 부위 및 유전자좌 제어 영역을 포함한다. "Gene" includes, for the purposes of the present invention, a DNA region that encodes a gene product, as well as all DNA regions that regulate gene products, whether the regulatory sequences are adjacent to the coding sequence and / or the transcription sequence or not. Thus, the gene may include, but is not limited to, promoter sequences, terminator, translation control sequences such as ribosome binding site and internal ribosome entry site, enhancer, silencer, insulator, boundary element, replication origin, .

"유전자 발현"이란 유전자에 담겨진 정보를 유전자 산물로 전환하는 것을 말한다. 유전자 산물은 유전자(예를 들어, mRNA, tRNA, rRNA, 안티센스 RNA, 리보자임, 구조 RNA 또는 다른 형태의 RNA)의 직접 전사물이거나 mRNA의 전사에 의해 생산된 단백질이 될 수 있다. 유전자 산물은 또한 캡핑, 폴리아데닐화, 메틸화, 편집 등의 과정에 의하여 변형된 RNA와, 메틸화, 아세틸화, 인산화, 유비퀴틴화, ADP-리보스화, 미리스틸화, 글리코실화 등의 방법에 의하여 변형된 단백질을 포함한다. "Gene expression" refers to the conversion of information contained in a gene into a gene product. A gene product can be a direct transcript of a gene (e.g., mRNA, tRNA, rRNA, antisense RNA, ribozyme, structural RNA or other forms of RNA) or a protein produced by transcription of mRNA. The gene product can also be modified by methods such as capping, polyadenylation, methylation, and editing, and by methods such as methylation, acetylation, phosphorylation, ubiquitination, ADP-ribosylation, myristylation, ≪ / RTI >

유전자 발현의 "조절"이란 유전자의 활성의 변화를 말한다. 발현 조절은, 이에 한정되지는 않지만, 유전자 활성화와 유전자 억제를 포함한다. "Modulation" of gene expression refers to a change in the activity of a gene. Expression modulation includes, but is not limited to, gene activation and gene suppression.

"진핵" 세포는, 이에 한정되지는 않지만, 진균 세포(효모), 식물 세포, 동물 세포, 포유류 세포, 인간 세포를 포함한다. "Eukaryotic" cells include, but are not limited to, fungal cells (yeast), plant cells, animal cells, mammalian cells, and human cells.

"관심 영역"이란, 외래 분자와 결합될 유전자 또는 그 내부나 그에 인접한 비-코딩 서열 등과 같은 세포 염색질의 어느 영역을 말한다. 결합은 표적화된 DNA 절단 및/또는 표적화된 재조합을 위한 목적을 가질 수 있다. 관심 영역은, 예를 들어, 염색체, 에피솜, 세포기관의 게놈(미토콘드리아, 엽록체 등), 또는 감염성의 바이러스성 게놈일 수 있다. 관심 영역은 유전자의 암호 영역 내부이거나, 예를 들어, 리더 서열, 트레일러 서열 또는 인트론 등과 같은 전사된 비-코딩 영역 내부이거나, 또는 비-전사 영역의 내부일 수 있다. 관심 영역은 길이가 하나의 뉴클레오티드 쌍만큼 작을 수도 있고, 또 2,000 뉴클레오티드 쌍까지도 가능하고, 또한 뉴클레오티드 쌍의 가능한 정수 값이 될 수도 있다. "Region of interest " refers to any region of a cell chromatin, such as a gene to be associated with a foreign molecule or a non-coding sequence within or adjacent to the gene. Binding can have the purpose of targeted DNA cleavage and / or targeted recombination. The region of interest can be, for example, a chromosome, an episome, a genome of a cell organ (mitochondria, chloroplast, etc.), or an infectious viral genome. The region of interest can be within the coding region of the gene or within the transcribed non-coding region, such as, for example, a leader sequence, trailer sequence or intron, or inside the non-transcription region. The region of interest may be as small as one nucleotide pair in length, or up to 2,000 nucleotide pairs, and may also be a possible integer number of nucleotide pairs.

"작동 연결" 및 "작동 연결된"이란 병렬로 놓인 두 개 또는 수개의 성분(서열 구성 요소)와 관련하여 상호 교환적으로 사용되는데, 여기서는 두 성분이 정상적으로 기능하여 최소한 하나의 성분이 적어도 하나의 다른 성분에 가한 기능을 매개하는 것이 가능한 정도로 성분들이 정렬되어야 한다. 예를 들어 설명하자면, 프로모터와 같은 전사 조절 서열의 경우, 하나 또는 수개의 전사 조절 인자의 존부에 감응을 하면서 전사 조절 서열이 코딩 서열의 전사 수준을 제어한다면, 전사 조절 서열은 코딩 서열과 작동 연결되어 있다. 전사 조절 서열은 일반적으로 코딩 서열과 시스(cis) 형태로 작동 연결되어 있지만, 그것과 직접적으로 인접해 있을 필요는 없다. 예를 들면, 심지어 서열들이 접촉하지 않고 있더라도, 코딩 서열과 작동 연결된 전사 조절 서열이 인핸서가 된다. "Operational connection" and "operatively connected" are used interchangeably in connection with two or several components (sequence components) placed in parallel, where both components function normally so that at least one component has at least one other The components must be aligned to the extent that it is possible to mediate the function that is added to the component. For example, in the case of transcription regulatory sequences such as promoters, transcriptional control sequences may be operably linked to coding sequences and transcriptional control sequences if the transcriptional control sequence controls the transcription level of the coding sequence while responding to the presence of one or several transcriptional regulatory factors . Transcriptional regulatory sequences are generally operatively linked to coding sequences and cis forms, but need not be directly contiguous thereto. For example, even if the sequences are not in contact, the coding sequence and the operably linked transcriptional control sequence become enhancers.

융합 폴리펩티드와 관련하여, "작동 연결된"이라는 용어는 각 성분이 다른 성분에 연결된 상태에서 연결되지 않은 상태에서의 기능과 똑같은 기능을 하는 것을 의미한다. 예를 들어, ZFP DNA 결합 도메인이 절단 도메인에 융합된 융합 폴리펩티드인 경우, 절단 도메인이 표적 부위의 근처에서 DNA를 절단할 수 있으면서, ZFP DNA 결합 도메인 부분이 그 표적 부위 및/또는 그 결합 부위와 결합할 수 있다면, ZFP DNA 결합 도메인과 절단 도메인은 작동 연결되어 있다. In the context of a fusion polypeptide, the term "operably linked" means that each component is functionally equivalent to a non-ligated state with other components connected. For example, if the ZFP DNA binding domain is a fusion polypeptide fused to a cleavage domain, the cleavage domain can cleave the DNA in the vicinity of the target site, while the ZFP DNA binding domain portion will bind to the target site and / If binding is possible, the ZFP DNA binding domain and the cleavage domain are operatively linked.

단백질, 폴리펩티드 또는 핵산의 "기능성 단편"이란 그 서열이 전체 구간에서는 일치하지 않지만 전체 구간의 단백질, 폴리펩티드, 핵산과 같은 기능을 가지는 단백질, 폴리펩티드 또는 핵산을 말한다. 기능성 단편은 해당되는 고유의 분자보다 더 많은, 더 적은, 또는 같은 수의 잔기를 가질 수 있고, 하나 또는 수개의 아미노산이나 뉴클레오티드 치환기를 가질 수 있다. 핵산의 기능(코딩 기능, 다른 핵산과의 혼성화 능력)을 측정하는 방법은 해당 기술 분야에서 잘 알려져 있다. 이와 동일하게, 단백질의 기능을 측정하는 방법도 잘 알려져 있다. 예를 들면, 폴리펩티드의 DNA 결합 기능은 여과 결합법, 전기영동 이동도 이전법, 면역침강법에 의하여 측정될 수 있다. DNA 절단은 겔 전기영동법에 의하여 측정될 수 있다. A "functional fragment" of a protein, polypeptide or nucleic acid refers to a protein, polypeptide, or nucleic acid having the same function as a whole region of a protein, polypeptide, or nucleic acid although its sequence does not coincide with the entire region. The functional fragment may have more, fewer, or the same number of residues as the unique molecule of interest, and may have one or several amino acid or nucleotide substituents. Methods for measuring the function of nucleic acids (coding function, ability to hybridize with other nucleic acids) are well known in the art. Similarly, methods for measuring the function of proteins are well known. For example, the DNA binding function of a polypeptide can be measured by a filtration method, an electrophoretic migration transfer method, or an immunoprecipitation method. DNA cleavage can be measured by gel electrophoresis.

참고문헌 Ausubel et al., supra. 참조한다. 단백질의 다른 단백질과의 상호작용 능력은, 예를 들어, 유전학적 및 생화학적 공면역침강법, 이혼성법 또는 상보성법에 의해 측정될 수 있다. 그 예로, Fields et al. (1989) Nature 340: 245-246; 미국특허 제 5,585, 245 호 및 PCT WO 98/44350.를 참조한다.References Ausubel et al., Supra. . The ability of a protein to interact with other proteins can be measured, for example, by genetic and biochemical co-precipitation, divorce, or complementarity. For example, Fields et al. (1989) Nature 340: 245-246; U. S. Patent Nos. 5,585, 245 and PCT WO 98/44350.

표적 부위Target site

본 발명의 방법 및 조성물에는 절단 도메인(또는 절단 하프-도메인)과 징크핑거 도메인으로 구성된 융합 단백질을 포함하는데, 여기서 징크핑거 도메인은 표적 부위나 결합 부위와 같은 세포 염색질의 서열에 결합함으로써 절단 도메인(또는 절단 하프-도메인)의 활동을 서열 부근으로 향하게 하고, 표적 서열의 부근에 절단을 유도한다. 본 발명의 다른 부분에서 밝혔듯이, 징크핑거 도메인은 사실상 어떠한 원하는 서열과도 결합할 수 있도록 설계될 수 있다. 따라서, 절단이나 재조합이 일어날 서열을 포함하는 관심 영역을 식별한 후, 하나 또는 수개의 징크핑거 결합 도메인은 관심 영역에 있는 하나 또는 수개의 서열에 결합하도록 설계될 수 있다. 징크핑거 결합 도메인과 절단 도메인으로 구성된 융합 단백질(또는 각각 징크핑거 결합 도메인과 절단 하프-도메인으로 구성된 두 개의 융합 단백질)의 발현은, 세포에서 관심 영역의 절단을 초래한다. The methods and compositions of the present invention comprise a fusion protein consisting of a cleavage domain (or truncated half-domain) and a zinc finger domain, wherein the zinc finger domain binds to a sequence of a cell chromatin, such as a target site or binding site, Or cleavage half-domain) is directed near the sequence, and cleavage is induced in the vicinity of the target sequence. As indicated elsewhere in the present invention, a zinc finger domain can be designed to bind virtually any desired sequence. Thus, one or several zinc finger binding domains can be designed to bind to one or several sequences in the region of interest, after identifying regions of interest that include sequences that will undergo cleavage or recombination. Expression of a fusion protein consisting of a zinc finger binding domain and a cleavage domain (or two fusion proteins, each consisting of a zinc finger binding domain and a cleavage half-domain, respectively) results in cleavage of the region of interest in the cell.

징크핑거 도메인(예를 들어, 표적 부위)의 결합을 위하여 세포 염색질의 서열은, 예를 들면, 공동 특허권을 가진 미국특허 제 6,453, 242 (Sept. 17,2002) 호에서 전개된 방법에 따라서 선택될 수 있는데, 여기에는 또한 선택된 서열에 결합하도록 ZFP를 디자인하는 방법도 전개되어 있다. 표적 부위 선택에 뉴클레오티드 서열의 단순 육안 검사법이 또한 사용될 수 있음이 잘 알려져 있다. 따라서, 청구항에 있어서 표적 부위 선택의 어떠한 방법도 사용될 수 있다. Sequences of cellular chromatin for binding of zinc finger domains (e. G., Target sites) are selected according to the method developed in, for example, U.S. Patent No. 6,453,242 (Sept. 17,2002) There is also a way to design the ZFP to bind to the selected sequence. It is well known that simple visual inspection of the nucleotide sequence can also be used for target site selection. Thus, any method of target site selection may be used in the claims.

표적 부위는 일반적으로 다수의 인접한 표적 하위부위로 구성된다. 표적 하위부위란 개개의 징크핑거에 결합한 서열(보통은 뉴클레오티드의 3중 서열이거나, 하나의 뉴클레오티드 서열에 의하여 인접한 4중 서열과 겹쳐질 수 있는 뉴클레오티드의 4중 서열)을 일컫는다. 그 예로, WO 02/077227를 참조한다. 만약에 징크핑거 단백질의 접촉이 가장 많아지는 나선이 표적 나선으로 "제1 인식 나선" 또는 "제1 접촉 나선"으로 지정된다면, 어떤 징크핑거 단백질은 표적 나선의 3중 서열 및 비-표적 나선의 4번째 염기에 결합한다. 표적 부위는 일반적으로 최소 9 뉴클레오티드의 길이를 가지고, 따라서 최소 3개의 징크핑거로 구성된 징크핑거 결합 도메인에 결합한다. The target site generally consists of a plurality of adjacent target sub-sites. A target sub-region refers to a sequence associated with an individual zinc finger (usually a triple sequence of nucleotides or a quaternary sequence of nucleotides that can overlap a quaternary sequence adjacent by one nucleotide sequence). As an example, see WO 02/077227. If the helix with the highest contact of the zinc finger protein is designated as the " first recognition helix "or the" first contact spiral "as the target helix, then some zinc finger protein will have a triple sequence of target spirals and a non- 4 < / RTI > base. The target site generally has a length of at least 9 nucleotides and thus binds to a zinc finger binding domain consisting of at least three zinc fingers.

그러나 예를 들어, 4 핑거 결합 도메인이 12 뉴클레오티드 표적 부위에 결합하거나, 5 핑거 결합 도메인이 15 뉴클레오티드 표적 부위에 결합하거나, 6 핑거 결합 도메인이 18 뉴틀레오티드 표적 부위에 결합하는 것도 또한 가능하다. 앞으로 밝혀지겠지만, 더 큰 결합 도메인(예를 들어, 7, 8, 9 핑거 및 그 이상)이 더 긴 표적 부위에 결합하는 것도 또한 가능하다. However, it is also possible, for example, that a 4 finger binding domain binds to a 12 nucleotide target site, a 5 finger binding domain binds to a 15 nucleotide target site, or a 6 finger binding domain binds to a 18 nucleotide target site. As will be seen, it is also possible for larger binding domains (e. G., 7, 8, 9 fingers and more) to bind to longer target sites.

표적 부위는 3개 뉴클레오티드의 배수일 필요는 없다. 예를 들어, 교차 나선 상호작용이 발생하는 경우에는(미국특허 제 6,453, 242 호 및 WO 02/077227 참조), 다중 핑거 결합 도메인에 있는 하나 또는 수개의 징크핑거는 4중 서열의 하위부위와 겹치면서 결합할 수 있다. 그 결과, 10번째 뉴클레오티드가 말단 핑거에 결합된 4중 서열의 일부가 되는 식으로 3 핑거 단백질은 10 뉴클레오티드 서열에 결합할 수 있고, 13번째 뉴클레오티드가 말단 핑거에 결합된 4중 서열의 일부가 되는 식으로 4 핑거 단백질은 13 뉴클레오티드 서열에 결합하는 등이 가능하다. The target site need not be a multiple of three nucleotides. For example, when cross-helical interactions occur (see U.S. Patent Nos. 6,453, 242 and WO 02/077227), one or several zinc fingers in the multiple finger binding domain overlap with the sub- Can be combined. As a result, a 3-finger protein can bind to a 10-nucleotide sequence such that the 10-th nucleotide is part of a quadruplicate bound to a terminal finger, and the 13-th nucleotide can be a part of a quadruple- The 4-finger protein can bind to a 13-nucleotide sequence, and so on.

다중 핑거 결합 도메인에 있는 개개의 징크핑거 사이의 아미노산 링커 서열의 길이 및 특성 또한 표적 서열에의 결합에 영향을 미친다. 예를 들어, 다중 핑거 결합 도메인에 있는 인접한 징크핑거 사이의 소위 "비정규 링커", "장 링커", 또는 "구조 링커"는 그러한 핑거들이 바로는 인접하지 않는 하위부위에 결합할 수 있도록 해준다. 그러한 링커의 예로는 미국특허 제6,479,626호 및 WO 01/53480에 기술되어 있다. 따라서, 징크핑거 결합 도메인의 표적 부위에 있는 하나 또는 수개의 하위부위는 1, 2, 3, 4, 5 또는 그 이상의 뉴클레오티드로 서로 분리될 수 있다. The length and nature of the amino acid linker sequence between individual zinc fingers in the multiple finger binding domain also affects binding to the target sequence. For example, the so-called " non-canonical linker ", "long linker ", or" structured linker "between adjacent zinc fingers in a multiple finger binding domain allows such fingers to join directly to non- Examples of such linkers are described in U.S. Patent No. 6,479,626 and WO 01/53480. Thus, one or several sub-sites in the target region of the zinc finger binding domain can be separated from one another by 1, 2, 3, 4, 5 or more nucleotides.

하나만 예를 들어 보면, 4 핑거 결합 도메인은, 차례대로 2개의 접촉한 3 뉴클레오티드 하위부위 및 개재성 뉴클레오티드 및 2개의 접촉한 3중 서열의 하위부위로 구성된, 13 뉴클레오티드 표적 부위에 결합할 수 있다. By way of example only, a four finger binding domain can bind to a 13 nucleotide target site, consisting of, in turn, two contacted 3 nucleotide sub-sites and an oligonucleotide and two contacting ternary sub-sites.

서열(예를 들어, 표적 부위) 간의 거리란 두 개의 서열 간에 개재된 뉴클레오티드나 뉴클레오티드 쌍의 개수를 말하는데, 서로 가장 가까운 서열의 가장자리에서 측정한 것을 말한다. The distance between sequences (eg, target sites) refers to the number of nucleotides or nucleotide pairs interposed between two sequences, measured at the edge of the sequence closest to each other.

어떤 구체예에서, 절단이 표적 부위의 분리를 위한 두 개의 징크핑거 도메인 및 절단 하프-도메인 융합 분자의 결합에 의존하는데, 이 경우 두 개의 표적 부위는 반대의 DNA 나선에 존재할 수 있다. 다른 구체예에서, 두 개의 표적 부위가 모두 같은 DNA 나선 절단에 존재하게 된다. In certain embodiments, the cleavage is dependent on the binding of two zinc finger domains and cleavage half-domain fusion molecules for cleavage of the target site, in which case two target sites can be present in the opposite DNA strand. In another embodiment, both target sites are present in the same DNA helix cleavage.

징크핑거 결합 도메인A zinc finger binding domain

징크핑거 결합 도메인은 하나 또는 수개의 징크핑거로 구성된다. Miller et al. (1985) EMBO J. 4: 1609-1614; Rhodes (1993) Scientific American Feb.: 56-65; 미국특허 제6,453, 242.호를 참조한다. 전형적으로, 하나의 징크핑거 도메인은 길이가 약 30 아미노산이다. 구조분석 연구에 의하면, 각 징크핑거 도메인(주된 기조)은 두 개의 베타 시트구조(고정적인 두 개의 시스틴 잔기를 함유하는 베타형을 형성)와 하나의 알파 나선구조(고정적인 두 개의 히스틴 잔기를 함유)로 되어 있는데, 이는 두 개의 시스틴 및 두 개의 히스틴에 의하여, 징크 원자의 배위 전반에 걸쳐 특정한 배좌를 유지한다. The zinc finger binding domain is composed of one or several zinc finger. Miller et al. (1985) EMBO J. 4: 1609-1614; Rhodes (1993) Scientific America n Feb .: 56-65; See U.S. Patent No. 6,453,242. Typically, one zinc finger domain is about 30 amino acids in length. According to structural analysis studies, each zinc finger domain (major key) has two beta-sheet structures (forming a beta-type containing two fixed cystine residues) and one alpha helical structure (two fixed histine residues Containing two cystines and two histines, which maintain a specific basis throughout the coordination of the zinc atoms.

징크핑거는 정규적인 C2H2 징크핑거(즉, 징크 이온이 두 개의 시스틴과 두 개의 히스틴 잔기와 배위결합)와 C3H 징크핑거(징크 이온이 3개의 시스틴 잔기와 하나의 히스틴 잔기와 배위결합)와 C4 징크핑거(징크 이온이 4개의 시스틴 잔기와 배위결합)와 같은 비정규적인 징크핑거 모두를 포함한다. 또한, WO 02/057293를 참조한다. Zinc fingers are characterized by the presence of regular C 2 H 2 zinc fingers (ie, the zinc ion coordinating with two cysteines and two histone residues) and the C 3 H zinc finger (the zinc ion containing three cystine residues and one histidine residue And coordinative zinc fingers such as the C 4 zinc finger (the zinc ion coordinating with the four cystine residues). See also WO 02/057293.

징크핑거 결합 도메인은 선택된 서열에 결합하도록 설계될 수 있다. 그 예로, Beerli et al. (2002) Nature Biotechnol. 20: 135-141; Pabo et al. (2001) Ann. Rev. Biochem. 70: 313-340 ; Isalan et al. (2001) Nature Biotechnol. 19: 656-660; Segal et al. (2001) Curr. Opin. Biotechnol. 12: 632637; Choo et al. (2000) Curr. Opin. Struct. Biol. 10: 411-416. 을 참조한다. 설계된 징크핑거 결합 도메인은 자연적으로 생성되는 징크핑거 단백질에 비하여 독특한 결합 특이성을 갖는다. 설계 방법으로는, 이에 한정되지 않지만, 합리적 디자인 및 선택가능한 다양한 형태가 포함된다. 합리적 디자인은, 예를 들어, 3중(또는 4중) 뉴클레오티드 서열 및 개개의 징크핑거 아미노산 서열을 구성하는 데이터베이스의 사용을 포함하는데, 이에는 각 3중 또는 4중 뉴클레오티드 서열이, 특정한 3중 또는 4중 서열과 결합하는 징크핑거에 있는 하나 또는 수개의 아미노산 서열과 합쳐진다. 그 예로, 공동 특허권인 미국특허 제6,453,242 및 6,534,261호를 참조한다.The zinc finger binding domain can be designed to bind to selected sequences. For example, Beerli et al. (2002) Natur e Biotechnol . 20: 135-141; Pabo et al . (2001) Ann. Rev. Biochem. 70: 313-340; Bake it al. (2001) Nature Biotechnol . 19: 656-660; Segal et al. (2001) Curr. Opin. Biotechnol . 12: 632637; Choo et al. (2000) Curr. Opin. Struct. Biol . 10: 411-416. . Designed zinc finger binding domains have unique binding specificities compared to naturally occurring zinc finger proteins. Design methods include, but are not limited to, rational design and various forms that can be selected. Rational design includes, for example, the use of a database comprising triple (or quadruple) nucleotide sequences and individual zinc finger amino acid sequences, wherein each triple or quadruple nucleotide sequence comprises a specific triple or quadruplet nucleotide sequence, It is combined with one or several amino acid sequences in a zinc finger that binds to a quadruple sequence. See, for example, co-patents U.S. Patent Nos. 6,453,242 and 6,534,261.

위상 표시 및 이혼성 시스템을 포함하여, 선택 방법의 대표적인 예는, 미국특허 제5,789,538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 6,242,568호 또한 WO 98/37186; WO 98/53057; WO 00/27878; WO 01/ 88197 및 GB 2,338,237에 개시되어 있다.Representative examples of selection methods, including phase representation and divorce systems, are described in U. S. Patent Nos. 5,789, 538; 5,925,523; 6,007,988; 6,013,453; 6,410,248; 6,140,466; 6,200,759; 6,242,568 also WO 98/37186; WO 98/53057; WO 00/27878; WO 01/88197 and GB 2,338,237.

징크핑거 결합 도메인의 결합 특이성의 촉진은, 예를 들어, 공동 특허권인 WO 02/077227에 기술되어 왔다. Promotion of binding specificity of zinc finger binding domains has been described, for example, in co-patents WO 02/077227.

개개의 징크핑거는 3 뉴클레오티드(즉, 3중) 서열(또는 하나의 뉴클레오티드에 의하여 징크핑거에 인접한 4 뉴클레오티드 결합 부위와 겹쳐짐이 가능한 4 뉴클레오티드 서열)에 결합하므로, 징크핑거 결합 도메인이 결합하도록(예, 표적 서열) 설계되는 서열의 길이는, 설계된 징크핑거 결합 도메인에 있는 징크핑거의 개수를 결정한다. 예를 들어, 겹쳐지는 하위부위에는 핑거의 주된 기조가 결합하지 않는 ZFP의 경우, 6 뉴클레오티드 표적 서열은 2 핑거 결합 도메인에 의해 결합되고, 9 뉴클레오티드 표적 서열은 3 핑거 결합 도메인에 의해 결합하는 등이 된다. 본 발명에서 언급되듯이, 표적 부위에 있는 개개의 징크핑거(즉, 하위부위)의 결합 부위는 접촉하여 있을 필요는 없고, 다중 핑거 결합 도메인의 징크핑거(즉, 핑거-간 링커) 사이에 있는 아미노산 서열의 길이와 특성에 의존하여, 그 징크핑거 결합 부위는 하나 또는 수개의 뉴클레오티드로 분리될 수 있다. Since individual zinc fingers bind to a 3 nucleotide (or triple) sequence (or a 4 nucleotide sequence capable of overlapping with a 4 nucleotide binding site adjacent to a zinc finger by one nucleotide), the zinc finger binding domain binds ( The length of the designed sequence determines the number of zinc fingers in the designed zinc finger binding domain. For example, in the case of a ZFP in which overlapping subregions do not incorporate the finger's key lineage, the 6 nucleotide target sequence is joined by the 2 finger binding domain, the 9 nucleotide target sequence is joined by the 3 finger binding domain, etc. do. As mentioned in the present invention, the binding sites of the individual zinc fingers (i.e., sub-sites) in the target site do not need to be in contact, and the binding sites between the zinc finger (i. E., Finger-linker) Depending on the length and nature of the amino acid sequence, the zinc finger binding site can be split into one or several nucleotides.

다중 핑거형 징크핑거 결합 도메인의 경우, 인접한 징크핑거는 아미노산 링커 서열로 약 5 아미노산으로 분리될 수 있고(이른바, 정규적 핑거-간 링커), 또는 그 대신에, 하나 또는 수개의 비정규적 링커의 형식으로 분리될 수 있다. 그 예로, 공동 특허권인 미국특허 제 6,453,242 및 6,534,261 호를 참조한다. 3개 이상의 핑거들로 구성되는 설계된 징크핑거 결합 도메인의 경우, 보다 긴(비정규적인) 핑거-간 링커를 어떤 징크핑거 사이에 삽입하는 것은, 결합 도메인에 의한 결합 친화도 및/또는 특이성을 증가함에 따라 수월해 진다. 그 예로, 미국특허 제 6,479,626 호 및 WO 01/53480를 참조한다.In the case of multiple finger-like zinc finger binding domains, adjacent zinc fingers can be separated into about five amino acids in the amino acid linker sequence (so-called regular finger-linker), or alternatively, in the form of one or several irregular linkers . ≪ / RTI > See, for example, co-patents U.S. Patent Nos. 6,453,242 and 6,534,261. In the case of a designed zinc finger binding domain consisting of three or more fingers, inserting a longer (irregular) finger-linker between any zinc finger increases binding affinity and / or specificity by the binding domain It becomes easy to follow. See, for example, U.S. Patent No. 6,479,626 and WO 01/53480.

따라서, 다중 핑거형 징크핑거 결합 도메인은 비정규적인 핑거-간 링커의 존재나 위치와 관련하여 또한 특징지워 질 수 있다. 예를 들어, 3개의 핑거(2개의 정규적인 핑거-간 링커 합류), 장 링커 및 2개의 추가적 핑거(두 개의 정규적인 핑거-간 링커와 합류)로 구성된 6 핑거 징크핑거 결합 도메인은, 2x3 배좌로 나타낸다. 유사하게, 2개의 핑거(그 사이는 정규적인 링커)와 장 링커 및 2개의 추가적 핑거(정규적인 링커와 합류)로 구성된 결합 도메인은, 2x2 단백질로 나타낸다. 3개의 2 핑거 단위(각각 2개의 핑거들이 정규적인 링커와 합류)로 구성되고, 장 링커에 의하여 각 2 핑거 단위가 인접한 두 개의 핑거 단위와 합류하는 단백질은, 3x2 단백질로 나타낸다. Thus, multiple finger-like zinc finger binding domains can also be characterized in terms of the presence or location of an irregular finger-linker. For example, a six finger finger finger combining domain consisting of three fingers (two regular finger-to-finger linker joins), a long linker and two additional fingers (joining two regular finger-to-finger linkers) Respectively. Similarly, a binding domain consisting of two fingers (regular linker in between) and a long linker and two additional fingers (joined with regular linkers) is represented by a 2x2 protein. A protein consisting of three 2 finger units (two fingers each merging with a regular linker) and two finger units each adjacent to two finger units joined by a long linker is represented by a 3x2 protein.

다중 핑거 결합 도메인의 인접한 두 개의 징크핑거 사이에 길이가 길거나 비정규적인 핑거-간 링커가 존재하는 것은, 표적 서열에서 바로 접촉하지 않는 하위부위들에 두 개의 핑거가 종종 결합하게 한다. The presence of a long or irregular finger-linker between two adjacent zinc fingers of a multiple finger binding domain allows the two fingers to often bind to sub-sites that are not directly in the target sequence.

따라서, 표적 부위의 하위부위 사이에는 하나 또는 수개의 뉴클레오티드의 간격이 존재할 수 있다. 즉, 표적 부위는 징크핑거와 접촉하지 않는 하나 이상의 뉴클레오티드를 포함할 수 있다. 예를 들어, 2x2 징크핑거 결합 도메인은 하나의 뉴클레오티드만큼 분리된 2개의 6 뉴클레오티드 서열에 결합할 수 있다. 즉, 그것은 13 뉴클레오티드 표적 부위에 결합한다. Moore et al. (2001a) Proc. Natl. Acad. Sci. USA 98: 14321436; Moore et al. (2001b) Proc. Natl. Acad. Sci. USA 98:1437-1441 및 WO 01/53480를 참조한다.Thus, there may be a gap of one or several nucleotides between the sub-regions of the target site. That is, the target site may comprise one or more nucleotides that are not in contact with the zinc finger. For example, a 2x2 zinc finger binding domain can bind two 6-nucleotide sequences separated by one nucleotide. That is, it binds to the 13 nucleotide target site. Moore et al. (2001a) Proc. Natl. Acad. Sci. USA 98: 14321436; Moore et al. (2001b) Proc. Natl. Acad. Sci. USA 98: 1437-1441 and WO 01/53480.

앞서 언급되었듯이, 표적 하위부위는 하나의 징크핑거와 결합하는 3 또는 4뉴클레오티드 서열을 말한다. 일정한 목적을 위하여, 2 핑거 단위는 결합 조절을 나타내기도 한다. 예를 들어, 특정한 6 뉴클레오티드 표적 서열과 결합하는 다중 핑거 단백질 (일반적으로 3 핑거)에서 두 개의 인접한 핑거의 선택으로 결합 조절이 가능하다. 다른 방도로, 개개의 징크핑거를 집합함으로써 조절이 가능하다. 또한, WO 98/53057 및 WO 01/53480를 참조한다.As mentioned earlier, the target sub-region refers to a 3 or 4 nucleotide sequence that combines with a zinc finger. For certain purposes, the two finger units may also indicate combining controls. For example, binding control is possible with the selection of two adjacent fingers in a multiple finger protein (typically 3 fingers) that binds a particular 6-nucleotide target sequence. In another way, adjustments can be made by collecting individual zinc fingers. See also WO 98/53057 and WO 01/53480.

절단 도메인Truncated domain

본 발명에서 개시된 융합 단백질의 절단 도메인 부분은 엔도 또는 엑소뉴클레아제로부터 얻을 수 있다. 절단 도메인을 얻어낼 수 있는 엔도뉴클레아제의 예로는, 이에 한정되지는 않지만, 제한 엔도뉴클레아제 및 귀소성 엔도뉴클레아제가 있다. 그 예로서는, 20022003 Catalogue, New England Biolabs, Beverly, MA; 및 Belfort et al. (1997) Nucleic Acids Res. 25: 3379-3388를 참조한다. DNA를 절단하는 또다른 효소는 알려져 있다(예를 들어, S1 뉴클레아제, 녹두 뉴클레아제, 췌장 DNA 분해효소 I, 구균 뉴클레아제, 효모 HO 엔도뉴클레아제, 또한, Linn et al. (eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993를 참조). 이러한 효소들은(또는 효소의 기작 부분) 절단 도메인 및 절단 하프-도메인의 재원으로 사용될 수 있다. The cleavage domain portion of the fusion proteins disclosed herein can be obtained from an endo or exonuclease. Examples of endonucleases that can yield cleavage domains include, but are not limited to, limiting endonucleases and endogenous endonuclease. Examples include 2002 2003 Catalog, New England Biolabs, Beverly, MA; And Belfort et al. (1997) Nucleic Acids Res. 25: 3379-3388. Another enzyme that cleaves DNA is known (e.g., S1 nuclease, mung bean nuclease, pancreatic DNA degradase I, streptococcal nuclease, yeast HO endonuclease, and Linn et al. eds.) Nucleases, Cold Spring Harbor Laboratory Press, 1993). These enzymes (or the machinery part of the enzyme) can be used as a source of cleavage domains and cleavage half-domains.

유사하게, 절단 하프-도메인(예를 들어, 징크핑거 결합 도메인 및 절단 하프-도메인으로 구성된 융합 단백질)은, 모든 뉴클레아제 또는 그 부분에서 얻어낼 수 있는데, 위에서 설명하였듯이 이는 절단 활성을 위한 이량체화가 요구된다. 일반적으로, 만약 융합 단백질이 절단 하프-도메인으로 구성된다면, 절단을 위하여 두 개의 융합 단백질이 필요하다. 두 개의 절단 하프-도메인은 같은 엔도뉴클레아제(또는 그 기능 단편)로부터 얻어낼 수 있고, 또는 각 절단 하프-도메인은 다른 엔도뉴클레아제(또는 그 기능 단편)로부터도 얻어낼 수 있다. 또한 두 개의 융합 단백질의 표적 부위는 서로 다음과 같은 기질을 보이는데, 즉 두 개의 융합 단백질의 결합으로 인한 절단 하프-도메인 두 개의 공간적 배치는, 예를 들어, 이량체화를 통하여, 절단 하프-도메인이 작용성 절단 도메인을 형성하게끔 한다. 따라서, 어떤 구체예에서, 표적 부위의 이웃한 가장자리는 5 ~ 8 뉴클레오티드나 15 ~ 18 뉴클레오티드만큼 분리되어 있다. 하지만 모든 정수 값의 뉴클레오티드 또는 뉴클레오티드 쌍이 두 개 표적 부위 사이에 개재할 수 있다(예, 2 ~ 50 뉴클레오티드 또는 그 이상). 일반적으로, 절단 지점은 표적 부위 사이에 놓여있다. Similarly, a cleavage half-domain (e. G., A fusion protein composed of a zinc finger binding domain and a cleavage half-domain) can be obtained in any nuclease or portion thereof, as described above, The embedding is required. Generally, if the fusion protein consists of cleavage half-domains, two fusion proteins are required for cleavage. Two cleavage half-domains can be obtained from the same endonuclease (or functional fragment thereof), or each cleavage half-domain can be obtained from another endonuclease (or functional fragment thereof). In addition, the target regions of the two fusion proteins exhibit mutual substrates with each other, i.e., two spatial arrangements of cleavage half-domains due to the binding of two fusion proteins, for example, through dimerization, the cleavage half- Resulting in the formation of functional cleavage domains. Thus, in some embodiments, the neighboring edges of the target site are separated by 5 to 8 nucleotides or 15 to 18 nucleotides. However, any integer number of nucleotides or nucleotide pairs can be interposed between two target sites (e.g., 2 to 50 nucleotides or more). Generally, the cleavage site lies between the target sites.

제한 엔도뉴클레아제(제한 효소)는 많은 부류의 종에 존재하고, DNA(인식 부위)와 서열 특이성 결합이 가능하며, 결합 부위의 근처에서 DNA를 절단할 수 있다. 어떤 제한 효소(예를 들어, IIS 타입)는 인식 부위가 제거된 부위에서도 DNA를 절단하여 분리된 결합 도메인과 절단 도메인을 가진다. 예를 들어, IIS 타입 효소인 FokI는, 하나의 나선에서 인식 부위와 9 뉴클레오티드 떨어진 곳 및 다른 하나의 나선에서 인식 부위에서 13 뉴클레오티드 떨어진 곳에서, DNA의 이중-나선 절단을 촉진한다. 그 예로, 미국특허 제 5,356,802; 5,436,150 및 5,487,994; Li et al. (1992) Proc. Natl. Acad. Sci. USA 89: 4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90: 2764- 2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91: 883-887; Kim et al. (1994b) J. Biol. Chem. 269: 31,978-31, 982를 참조한다. 따라서 하나의 구체예에서, 설계된 것이든 그렇지 않은 것이든 간에, 융합 단백질은 최소한 하나의 IIS 타입 제한 효소로부터의 절단 도메인(또는 절단 하프-도메인)과 하나 이상의 징크핑거 결합 도메인을 구성하게 된다. Restriction endonucleases (restriction enzymes) are present in many classes of species, capable of sequence-specific binding to DNA (recognition sites), and capable of cleaving DNA in the vicinity of the binding site. Some restriction enzymes (for example, the IIS type) have a cleaved binding domain and a cleavage domain by cleaving DNA at sites where recognition sites have been removed. For example, Fok I, an IIS type enzyme, promotes double-helix cleavage of DNA at a site that is 9 nucleotides apart from the recognition site in one spiral and 13 nucleotides away from the recognition site in the other spiral. For example, U.S. Patent Nos. 5,356,802; 5,436,150 and 5,487,994; Li et al. (1992) Proc. Natl. Acad. Sci. USA 89: 4275-4279; Li et al. (1993) Proc. Natl. Acad. Sci. USA 90: 2764-2768; Kim et al. (1994a) Proc. Natl. Acad. Sci. USA 91: 883-887; Kim et al. (1994b) J. Biol. Chem. 269: 31, 978-31, 982. Thus, in one embodiment, whether designed or not, the fusion protein will constitute at least one zinc finger binding domain with a cleavage domain (or cleavage half-domain) from at least one IIS type restriction enzyme.

절단 도메인이 결합 도메인으로부터 분리할 수 있는 IIS 타입 제한 효소의 예로 FokI 이 있다. 이 특수한 효소는 이량체로서 활성을 갖는다. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10,570-10, 575를 참조한다. 따라서, 본 발명의 목적상, 전개된 융합 단백질에 사용된 FokI 효소의 일부는 절단 하프-도메인으로 본다. 따라서, 징크핑거 FokI 융합을 이용한 표적화된 이중-나선 절단 및/또는 표적화된 세포 서열 교환의 경우, 촉매작용 활성 절단 도메인을 재구성하기 위하여 FokI 절단 하프-도메인으로 각각 구성된 두 개의 융합 단백질이 사용될 수 있다. 다른 방도로는, 징크핑거 결합 도메인을 포함하는 하나의 폴리펩티드 분자와 두 개의 FokI 절단 하프-도메인이 또한 사용될 수 있다. 징크핑거-FokI 융합을 이용한 표적화된 절단 및 표적화된 서열 변경의 변수들은 본 발명의 다른 부분에서 제공하기로 한다. An example of an IIS type restriction enzyme that a cleavage domain can separate from a binding domain is Fok I. This particular enzyme is active as a dimer. Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10, 570-10, 575. Thus, for the purposes of the present invention, some of the Fok I enzymes used in the developed fusion proteins are considered to be cleavage half-domains. Thus, in the case of targeted double-helical cleavage and / or targeted cell sequence exchange using zinc finger Fok I fusion, two fusion proteins each composed of a Fok I cleavage half-domain are used to reconstitute the catalytically active cleavage domain . Alternatively, one polypeptide molecule comprising a zinc finger binding domain and two Fok I cleavage half-domains may also be used. Variables of targeted cleavage and targeted sequence modification using zinc finger- Fok I fusion are provided in other parts of the invention.

절단 도메인 또는 절단 하프-도메인은 절단 활성을 보유한, 또는 다합체화하여(예를 들어, 이량체화) 기능 절단 도메인을 형성하는 능력을 보유한 단백질의 어떤 부분일 수 있다.The cleavage domain or cleavage half-domain may be any portion of a protein that possesses cleavage activity or that has the ability to form a functional cleavage domain by, for example, dimerization (e.g., dimerization).

IIS 타입 제한 효소의 예는 표 1에 열거되어 있다. 추가적인 제한효소는 또한 분리가능한 결합 및 절단 도메인을 포함하고, 이것들은 본 발명에서 고려의 대상이 될 것이다. 그 예로, Roberts et al. (2003) Nucleic acids Res. 31:418-420를 참조한다.Examples of IIS type restriction enzymes are listed in Table 1. Additional restriction enzymes also include separable binding and cleavage domains, which will be considered in the present invention. For example, Roberts et al. (2003) Nucleic acids Res. 31: 418-420.

20um에는 몇 dna ug ul

20um에는 몇 dna ug ul

징크핑거 도메인 절단 도메인 융합 Zinc finger domain cleavage domain fusion

융합 단백질(또는 융합 단백질을 암호화하는 폴리뉴클레오티드)을 디자인하고 구성하는 방법은 당해 기술분야에 널리 알려져 있다. 예를 들면, 징크핑거 단백질(또는 징크핑거 단백질을 암호화하는 폴리뉴클레오티드)을 포함하는 융합 단백질을 디자인하고 구성하는 방법은 미국특허 제6,453,242호와 제6,534,261호에 공동으로 기재되어 있다. 어떤 구체예에서, 융합 단백질을 암호화하는 폴리뉴클레오티드를 구성하였다. 상기 폴리뉴클레오티드는 벡터에 삽입될 수 있으며 삽입된 벡터는 세포 안으로 도입될 수 있다. (하기의 폴리뉴클레오티드를 세포 안으로 도입하는 벡터와 방법에 관한 추가적인 설명 참조)Methods for designing and constructing fusion proteins (or polynucleotides encoding the fusion proteins) are well known in the art. For example, a method for designing and constructing a fusion protein comprising a zinc finger protein (or a polynucleotide encoding a zinc finger protein) is described in US Patent Nos. 6,453,242 and 6,534,261. In some embodiments, a polynucleotide encoding a fusion protein has been constructed. The polynucleotide can be inserted into a vector and the inserted vector can be introduced into a cell. (See further description of vectors and methods for introducing polynucleotides into cells below)

본원에 설명된 방법의 어떤 구체예에서, 융합 단백질은 징크핑거 결합 단백질 도메인과 FokI 제한효소에 의해 절단된 절단 하프-도메인을 포함하고, 세포 안에서 두 융합 단백질을 발현한다. 세포 내에서 두 융합 단백질의 발현은 두 단백질의 세포 안으로 이동, 한 개의 단백질과 다른 단백질을 암호화하는 한 개의 핵산의 이동, 각각의 단백질을 암호화하는 두 개의 핵산의 이동 또는 두 개의 단백질을 모두 암호화하는 한 개의 핵산의 이동으로 가능하다. 추가적인 구체예에서, 융합 단백질이 두 개의 절단 하프-도메인과 한 개의 징크핑거 결합 도메인을 포함하는 하나의 폴리펩티드 사슬로 구성되어 있다. 이 경우에는 하나의 융합 단백질이 세포 내에서 발현되고 절단 하프-도메인의 분자내 이량체 형성의 결과로 DNA를 절단할 것이라 기대된다.In some embodiments of the methods described herein, the fusion protein comprises a zinc finger binding protein domain and a cleavage half-domain cleaved by a Fok I restriction enzyme, and expresses two fusion proteins within the cell. The expression of two fusion proteins within a cell is transferred into the cells of two proteins, the movement of one nucleic acid that encodes one protein and the other, the movement of two nucleic acids that encode each protein, or both proteins This is possible by moving one nucleic acid. In a further embodiment, the fusion protein consists of one polypeptide chain comprising two cleavage half-domains and one zinc finger binding domain. In this case, one fusion protein is expected to be expressed in the cell and cleave the DNA as a result of intramolecular dimerization of the cleavage half-domain.

어떤 구체예에서, 융합 단백질(예, ZFP-FokI 융합체)의 성분들은 징크핑거 도메인이 융합 단백질의 아미노 말단(N 말단) 근처에, 절단 하프-도메인이 카르복시 말단(C 말단) 근처에 위치하도록 배열된다. 이것은 FokI 제한효소에 의해 생성되는 자연적인 절단 도메인 이량체에서 절단 도메인의 상대적 위치를 반영하는데, 여기에서도 DNA 결합 도메인은 아미노 말단 근처에 절단 하프-도메인은 카르복시 말단 근처에 위치한다. 이들 구체예에서, 기능적 뉴클레아제를 형성하기 위한 절단 하프-도메인의 이량체화는 마주한 DNA 가닥들 상의 부위에 융합 단백질이 결합됨으로써 이루어지며, 이때 결합 부위들의 5' 단부는 서로 인접하게 된다. 도 43A 참조.In some embodiments, the components of the fusion protein (e. G., ZFP- Fok I fusions) are such that the zinc finger domain is located near the amino terminus (N terminus) of the fusion protein and the cleavage half-domain is located near the carboxy terminus . This reflects the relative position of the cleavage domain in the natural cleavage domain dimer produced by the Fok I restriction enzyme, wherein the DNA binding domain is located near the amino terminus and the cleavage half-domain is located near the carboxy terminus. In these embodiments, dimerization of cleavage half-domains to form functional nuclease is accomplished by binding a fusion protein to a site on opposing DNA strands, wherein the 5 'ends of the binding sites are adjacent to each other. See Figure 43A.

추가의 구체예에서, 융합 단백질(예를 들어, ZFP-FokI 융합체)의 성분들은 절단 하프-도메인이 융합 단백질의 아미노 말단 근처에, 징크핑거 도메인이 카르복시-말단 근처에 위치하도록 배열된다. 이들 구체예에서, 기능적 뉴클레아제를 형성하기 위한 절단 하프-도메인의 이량체화는 마주한 DNA 가닥들 상의 부위에 융합 단백질이 결합함으로써 이루어지며, 이때 결합 부위들의 3' 단부는 서로 인접하게 된다. 도 43B 참조.In a further embodiment, the components of the fusion protein (e. G., ZFP- Fok I fusions) are arranged such that the cleavage half-domain is located near the amino terminus of the fusion protein and the zinc finger domain is located near the carboxy-terminus. In these embodiments, dimerization of cleavage half-domains to form functional nuclease is accomplished by binding a fusion protein to a site on opposing DNA strands, wherein the 3 'ends of the binding sites are adjacent to each other. See Figure 43B.

다른 추가의 구체예에서, 제 1 융합 단백질은 융합 단백질의 아미노 말단 근처에 절단 하프-도메인을, 카르복시-말단 근처에 징크핑거 도메인을 함유하고, 제 2 융합 단백질은 징크핑거 도메인이 융합 단백질의 아미노 말단 근처에, 절단 하프-도메인이 카르복시-말단 근처에 위치하도록 배열된다. 이들 구체예에서, 두 융합 단백질은 동일한 DNA 가닥에 결합하며, 이때 제 1 융합 단백질의 결합 부위는 아미노 말단 근처에 징크핑거 도메인을 함유하는 제 2 융합 단백질의 결합 부위의 5' 쪽에 위치된 카르복시 말단 근처에서 징크핑거 도메인을 함유한다. 도 43C 참조.In another further embodiment, the first fusion protein comprises a cleavage half-domain near the amino terminus of the fusion protein, a zinc finger domain near the carboxy-terminus, and the second fusion protein comprises a zinc finger domain comprising amino Near the end, the cleavage half-domain is arranged to be located near the carboxy-terminus. In these embodiments, the two fusion proteins bind to the same DNA strand, wherein the binding site of the first fusion protein is a carboxyl terminal located at the 5 ' side of the binding site of the second fusion protein containing a zinc finger domain near the amino terminus It contains a zinc finger domain in the vicinity. See Figure 43C.

개시된 융합 단백질에서, 징크핑거 도메인과 절단 도메인(또는 절단 하프-도메인) 사이의 아미노산 서열은 "ZC 링커"로 표시된다. ZC 링커는 상기 논의된 핑거-간 링커와는 구별되어야 한다. ZC 링커의 길이를 측정하기 위해, Pabo et al. (2001) Ann. Rev. Biochem. 70:313-340에 의해 설명된 징크핑거 구조인 X-X-C-X2-4-C-X12-H-X3-5-H(SEQ ID NO:201)이 사용된다. In the disclosed fusion proteins, the amino acid sequence between the zinc finger domain and the cleavage domain (or cleavage half-domain) is denoted as "ZC linker ". The ZC linker should be distinguished from the finger-liver linker discussed above. To measure the length of the ZC linker, Pabo et al. (2001) Ann. Rev. Biochem. XXXX 2-4 -XX 12 -HX 3-5 -H (SEQ ID NO: 201), which is a zinc finger structure described by U.S.A. 70: 313-340, is used.

이 구조에서, 징크핑거의 제 1 잔기는 첫 번째의 보존된 시스테인 잔기 쪽의 아미노-말단의 2개 잔기에 위치하는 아미노산이다. 대부분의 자연-발생 징크핑거 단백질에서, 이 위치는 소수성 아미노산(보통 페닐알라닌 또는 티로신)에 의해 점유된다. 따라서, 개시된 융합 단백질에서, 징크핑거의 제 1 잔기는 대체로 소수성 잔기이지만, 어떤 아미노산일 수도 있다. 상기 나타낸 대로, 징크핑거의 마지막 아미노산 잔기는 두 번째의 보존된 히스티딘 잔기이다.In this structure, the first residue of a zinc finger is an amino acid located at two amino-terminal residues of the first conserved cysteine residue. In most naturally occurring zinc finger proteins, this position is occupied by hydrophobic amino acids (usually phenylalanine or tyrosine). Thus, in the disclosed fusion protein, the first residue of the zinc finger is a substantially hydrophobic residue, but may be any amino acid. As indicated above, the last amino acid residue of the zinc finger is the second conserved histidine residue.

따라서, 징크핑거 도메인이 절단 도메인(또는 절단 하프-도메인)에 대해 아미노-말단인 극성을 갖는 개시된 융합 단백질에서, ZC 링커는 징크핑거 C-말단의 두 번째 보존된 히스티딘 잔기와 절단 도메인(또는 절단 하프-도메인)의 N-말단 아미노산 사이의 아미노산 서열이다. 예를 들어, 실시예 부분에서 그 구성이 예시된 어떤 융합 단백질에서, 절단 하프-도메인의 N-말단 아미노산은 Looney et al. (1989) Gene 80:193-208의 FokI 서열의 아미노산 번호 384에 해당하는 글루타민(Q) 잔기이다.Thus, in the disclosed fusion protein, wherein the zinc finger domain has an amino-terminal polarity to the cleavage domain (or truncated half-domain), the ZC linker has a second conserved histidine residue at the zinc finger C- Half-domain). ≪ / RTI > For example, in some fusion proteins whose construction is exemplified in the Examples section, the N-terminal amino acid of the cleavage half-domain is described in Looney et al. (Q) residue corresponding to amino acid number 384 of the Fok I sequence of Gene 80 (193-208) (1989).

절단 도메인(또는 절단 하프-도메인)이 징크핑거 결합 도메인에 대해 아미노 말단인 극성을 갖는 융합 단백질에서, ZC 링커는 절단 도메인(하프-도메인)의 C-말단 아미노산 잔기와 징크핑거 결합 도메인의 징크핑거 N-말단의 제 1 잔기(즉, 첫 번째 보존된 시스테인 잔기 상류의 2개 잔기에 위치하는 잔기) 사이의 아미노산 서열이다. 어떤 전형적인 융합 단백질에서, 절단 하프-도메인의 C-말단 아미노산은 Looney et al. (1989) Gene 80:193-208의 FokI 서열의 아미노산 번호 579에 해당하는 페닐알라닌(F) 잔기이다.In a fusion protein in which the cleavage domain (or cleavage half-domain) has a polarity that is amino terminus to the zinc finger binding domain, the ZC linker has a zinc finger of the cleavage domain (half-domain) C- terminal amino acid residue and a zinc finger binding domain Is the amino acid sequence between the first residue at the N-terminus (i.e., the residue located at two residues upstream of the first conserved cysteine residue). In some typical fusion proteins, the C-terminal amino acid of the cleavage half-domain is described by Looney et al. (F) residue corresponding to amino acid number 579 of the Fok I sequence of Gene 80 (193-208) (1989).

ZC 링커는 어떤 아미노산 서열일 수 있다. 최적의 절단을 달성하기 위하여, ZC 링커의 길이와 표적 부위들(결합 부위들) 사이의 거리는 상관된다. 예를 들어, Smith et al. (2000) Nucleic Acids Res. 28:3361-3369; Bibikova et al. (2000) Mol. Cell. Biol. 21:289-297을 참조하며, 여기서는 링커 길이에 대한 표시가 본원에서 제공된 것과 다르다는 것을 유의한다. 예를 들어, 징크핑거 결합 도메인이 절단 하프-도메인에 대해 아미노-말단이고, 본원에 정의된 바에 따라 4개 아미노산 길이의 ZC 링커(다른 데서는 L0으로 표시된다)를 갖는 ZFP-FokI 융합체에서는, 융합 단백질의 결합 부위가 6 또는 16개 뉴클레오티드 떨어져서 위치할 때(각 결합 부위의 인접 가장자리에서 측정했을 때) 최적의 절단이 일어난다. 실시예 4를 참조한다.The ZC linker can be any amino acid sequence. In order to achieve optimal cleavage, the length of the ZC linker and the distance between the target sites (binding sites) are correlated. For example, Smith et al. (2000) Nucleic Acids Res. 28: 3361-3369; Bibikova et al. (2000) Mol. Cell. Biol. 21: 289-297, where it is noted that the indication for linker length is different from that provided herein. For example, in the ZFP- Fok I fusions having the zinc finger binding domain amino-terminated to the cleavage half-domain and having a ZC linker (denoted as L0 elsewhere) of four amino acid length as defined herein , Optimal cleavage occurs when the binding site of the fusion protein is located 6 or 16 nucleotides apart (measured at the proximal edge of each binding site). See Example 4.

표적화된 절단 방법Targeted cleavage method

기술된 방법과 조성물로 세포내 염색질에 있는 관심 영역, 예를 들어 게놈, 변종 또는 야생형 유전자의 관심 부위나 미리 계산된 부위의 DNA를 절단할 수 있다. 이와 같이 DNA를 표적화된 절단을 하기 위해서 징크핑거 결합 도메인을 미리 계산된 절단 부위의 표적 부위에 결합할 수 있도록 설계하고 설계된 징크핑거 결합 도메인과 절단 도메인을 포함하는 융합 단백질을 세포내에서 발현시킨다. 융합 단백질의 징크핑거 부분이 표적 부위에 결합하면 절단 도메인에 의해서 DNA가 표적 부위 근처에서 절단된다. 절단될 정확한 부위는 ZC 링커의 길이에 의존한다.The described methods and compositions can be used to cleave DNA of a region of interest in the intracellular chromatin, for example, a region of interest or a pre-calculated region of a genome, variant or wild-type gene. In order to perform targeted DNA cleavage, a fusion protein comprising a zinc finger binding domain and a cleavage domain designed and designed to bind a zinc finger binding domain to a target site of a cleavage site previously calculated is expressed in a cell. When the zinc finger portion of the fusion protein binds to the target site, the DNA is cleaved near the target site by the cleavage domain. The exact site to be cut depends on the length of the ZC linker.

한편, 각각 징크핑거 결합 도메인과 절단 하프-도메인을 포함하는 두 융합 단백질은 세포내에서 발현되고 기능성 절단 도메인이 재구성되고 표적 부위 근처의 DNA가 절단되는 방식으로 병렬된 표적 부위에 결합한다. 한 구체예에서, 두 개의 징크핑거 결합 도메인의 표적 부위들 사이에서 절단이 일어났다. 하나 또는 두 개의 징크핑거 결합 도메인의 설계가 가능하다.On the other hand, two fusion proteins, each containing a zinc finger binding domain and a cleavage half-domain, are expressed intracellularly, and the functional cleavage domain is reconstituted and bound to the target site in a parallel manner in such a manner that DNA near the target site is cleaved. In one embodiment, cleavage occurred between the target sites of two zinc finger binding domains. Design of one or two zinc finger binding domains is possible.

징크핑거 결합 도메인-절단 도메인 융합 폴리펩티드를 이용하여 표적을 절단하려면 결합 부위가 절단 부위를 둘러싸고 있거나 결합 부위의 끝이 절단 부위로부터 1, 2, 3, 4, 5, 6, 10, 25, 50 또는 그 이상의 뉴클레오티드(또는 1부터 50 사이의 정수)에 위치하여야 한다. 절단 부위에 대한 결합 부위의 정확한 위치는 절단 도메인의 특이성과 ZC 링커의 길이에 의존한다. 각각 징크핑거 결합 도메인과 절단 하프-도메인을 포함하는 두 융합 단백질을 사용하는 방법에서는 일반적으로 결합 부위가 절단 위치의 양끝에 위치한다. 따라서, 첫 번째 결합 위치의 끝은 절단 부위 한 끝 부분의 1, 2, 3, 4, 5, 6, 10, 25, 또는 그 이상의 뉴클레오티드에(또는 1부터 50 사이의 정수) 위치할 수 있으며 두 번째 결합 위치의 끝은 절단 부위 다른 끝 부분의 1, 2, 3, 4, 5, 6, 10, 25, 또는 그 이상의 뉴클레오티드에(또는 1부터 50 사이의 정수) 위치할 수 있다. 생체 외 및 생체 내 상에서 절단 부위를 맵핑하는 방법을 당해 기술분야에서 널리 알려져 있다.Zinc finger binding domain-cleavage domain To cleave a target using a fusion polypeptide, the binding site surrounds the cleavage site, or the end of the cleavage site is 1, 2, 3, 4, 5, 6, 10, 25, 50 It should be located at a further nucleotide (or an integer between 1 and 50). The exact position of the binding site for the cleavage site depends on the specificity of the cleavage domain and the length of the ZC linker. In methods using two fusion proteins, each containing a zinc finger binding domain and a cleavage half-domain, binding sites are generally located at both ends of the cleavage site. Thus, the end of the first binding site can be located at 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or an integer from 1 to 50) End of the first binding site may be located at 1, 2, 3, 4, 5, 6, 10, 25 or more nucleotides (or an integer between 1 and 50) at the other end of the cleavage site. Methods for mapping cleavage sites in vitro and in vivo are well known in the art.

따라서, 다음에 기술되는 방법은 절단 도메인에 결합된 징크핑거 도메인을 설계하는데 이용될 수 있다. 이 경우에 결합 도메인을 절단이 되도록 원하는 부위의 표적 서열에 결합하도록 설계하고 융합 단백질 또는 융합 단백질을 암호화하는 폴리뉴클레오티드를 세포 내에 도입한다. 일단 세포 내로 도입되어 발현이 되면 융합 단백질은 표적 서열에 결합하고 그 부위를 절단한다. 절단될 정확한 부위는 절단 도메인의 성질과 결합 도메인과 절단 도메인 사이 링커 서열의 성질과 존재 유무에 의해 결정된다. 각각 절단 하프-도메인을 포함하는 두 융합 단백질이 사용된 경우에는 결합 부위의 끝 사이의 거리가 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 25, 또는 그 이상의 뉴클레오티드가(또는 1부터 50 사이의 정수) 될 수 있다. 절단의 최적 범위는 두 융합 단백질의 결합 부위 사이의 거리 (Smith et al. (2000) Nucleic Acids Res. 28: 3361-3369; Bibikova et al. (2001) Mol. Cell. Biol. 21: 289-297), 그리고 각 융합 단백질의 ZC 링커의 길이에 의존한다.Thus, the method described below can be used to design a zinc finger domain coupled to a cleavage domain. In this case, the binding domain is designed to bind to the target sequence of the desired site to be cleaved, and a polynucleotide encoding the fusion protein or fusion protein is introduced into the cell. Once introduced into the cell and expressed, the fusion protein binds to the target sequence and cleaves the site. The exact site to be cleaved is determined by the nature of the cleavage domain and the nature and presence of the linker sequence between the cleavage domain and the cleavage domain. When two fusion proteins, each containing a cleavage half-domain, are used, the distance between the ends of the binding sites is 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 25 or more nucleotides (Or an integer between 1 and 50). The optimum range of the cut is the distance between the binding sites of both the fusion protein (Smith et al (2000) Nucleic Acids Res 28:...... 3361-3369; Bibikova et al (2001) Mol Cell Biol 21: 289-297 ), And the length of the ZC linker of each fusion protein.

ZFP FokI 융합 뉴클레아제의 경우, ZFP와 FokI 절단 하프-도메인, 즉 ZC 링커 사이 링커의 길이가 절단 효율에 영향을 미친다. 4 개 아미노산 잔기의 ZC 링커를 가진 ZFP FokI 융합 뉴클레아제를 이용한 한 실험에서 두 개의 ZFP FokI 뉴클레아제의 결합 부위의 끝이 6 개의 염기만큼 떨어져 있을 때 가장 잘 절단되었다. 상기의 특이한 융합 뉴클레아제는 징크핑거 부분과 뉴클레아제 하프-도메인 사이에 다음과 같은 아미노산 서열이 있다.For ZFP Fok I fused nuclease, the length of the linker between the ZFP and the Fok I cleavage half-domain, i.e. the ZC linker, affects cleavage efficiency. In one experiment with a ZFP Fok I fused nuclease with a ZC linker of 4 amino acid residues, the best cleavage was achieved when the ends of the binding sites of the two ZFP Fok I nuclease were spaced 6 bases apart. The above specific fusion nuclease has the following amino acid sequence between the zinc finger portion and the nuclease half-domain.

HQRTHQNKKOLV (SEQ ID NO : 26) H QRT H QNKK OLV (SEQ ID NO: 26)

상기 서열에서 밑줄 친 징크핑거 C 말단 부위의 두 개의 히스티딘과 FokI 절단 하프-도메인의 첫 번째 3 개의 잔기는 보존되어 있다. 따라서, 이 구성체에서 ZC 링커 서열은 QNKK이다. (Bibikova et al. (2001) Mol. Cell. Biol. 21: 289-297) 본 발명의 발명자들은 다양한 길이와 서열의 ZC 링커를 가지는 ZFP-FokI 융합 뉴클레아제를 대량으로 구성하였으며 상기 뉴클레아제의 절단 효율을 ZFP 결합 부위 간의 거리가 다른 기질을 사용하여 분석하였다. 실시예 4를 참조한다.Two histidine residues at the C-terminal region of the zinc finger underlined in the sequence and the first three residues of the Fok I cleavage half-domain are conserved. Thus, the ZC linker sequence in this construct is QNKK. (Bibikova et al (2001) Mol Cell Biol 21:.... 289-297) The inventors of the present invention have been configured in various lengths and sequences ZFP- Fok I nuclease fusion with the ZC linker of a large amount of the nuclease The cleavage efficiency was analyzed using substrates with different ZFP binding sites. See Example 4.

어떤 구체예에서, 절단 도메인은 절단 하프-도메인 두 개와 과 결합 도메인,첫번째 절단 하프-도메인 및 두 번째 절단 하프-도메인을 포함하는 하나의 폴리펩티드 두 개로 구성되어 있다. 절단 하프-도메인은 DNA를 절단하는 기능을 가진다면 동일한 아미노산 서열을 가질 필요는 없다.In certain embodiments, the cleavage domain is comprised of two polypeptides, including two cleavage half-domains and a hyperbinding domain, a first cleavage half-domain, and a second cleavage half-domain. The truncated half-domain does not need to have the same amino acid sequence if it has the function of cleaving DNA.

서로 분리된 분자들에서 절단 하프-도메인을 제공할 수도 있다. 예를 들면, 각각 결합 도메인과 절단 하프-도메인을 포함하는 두 개의 융합 폴리펩티드가 세포 내로 도입될 수 있다. 절단 하프-도메인은 DNA를 절단하는 기능을 가진다면 동일한 아미노산 서열을 가질 필요는 없다. 또한, 결합 도메인은 융합 폴리펩티드가 결합하자마자 두 개의 절단 하프-도메인이 절단 도메인의 재구성, 예를 들어 하프-도메인의 이량체화를 가능하게 하는 위치에 존재하고, 그로 인해 기능성 절단 도메인을 형성하도록 하프-도메인을 위치시키게 되고, 관심 영역의 세포 염색질을 절단하게 됨으로써 결합 도메인이 표적 부위에 결합한다. 일반적으로 재구성된 절단 도메인에 의한 절단은 두 표적 서열 사이에 위치한 부위에서 일어난다. 표적 부위에 결합하기 위해서 하나 또는 두 개의 단백질을 설계할 수 있다.And may provide a cleavage half-domain in molecules that are separated from each other. For example, two fusion polypeptides, each comprising a binding domain and a truncated half-domain, can be introduced into a cell. The truncated half-domain does not need to have the same amino acid sequence if it has the function of cleaving DNA. In addition, the binding domain is located at a position that allows for the cleavage of the cleavage domain, e. G., The half-domain of the two cleavage half-domains as soon as the fusion polypeptide binds, Domain and the binding domain binds to the target site by cleaving the cell chromatin of the region of interest. Generally, cleavage by a reconstructed cleavage domain occurs at sites located between two target sequences. One or two proteins can be designed to bind to the target site.

두 개의 융합 단백질은 관심 영역에 같거나 또는 다른 극성으로 결합할 수 있고 그 결합 부위, 즉 표적 부위는 몇 개(예를 들어, 0부터 200 사이의 정수)의 뉴클레오티드만큼 떨어져 있을 수 있다. 어떤 구체예에서, 각각 징크핑거 결합 도메인과 절단 도메인을 포함하는 두 개의 융합 단백질의 결합 부위들이 가장 가까운 다른 결합 부위의 끝으로부터 5에서 18 뉴클레오티드만큼, 예를 들면 5-8 뉴클레오티드, 15-18 뉴클레오티드, 6 뉴클레오티드 또는 16 뉴클레오티드 떨어져 위치할 수 있고 절단은 결합 부위 사이에서 일어난다.The two fusion proteins may bind to the region of interest at the same or different polarity and the binding site, i.e., the target site, may be as many as several nucleotides (e.g., an integer from 0 to 200). In some embodiments, the binding sites of two fusion proteins, each comprising a zinc finger binding domain and a cleavage domain, are 5 to 18 nucleotides from the end of the nearest other binding site, such as 5-8 nucleotides, 15-18 nucleotides , 6 nucleotides or 16 nucleotides apart and cleavage occurs between binding sites.

일반적으로 DNA가 절단되는 부위는 두 융합 단백질의 결합 부위 사이에 존재한다. DNA 이중-나선의 절단은 두 개의 단일 나선 각각의 절단 또는 1, 2, 3, 4, 5, 6, 또는 그 이상의 뉴클레오티드들로 시작하는 "닉"에 기인한다. 예를 들면 자연적인 Fok I 제한효소에 의한 이중-나선 DNA의 절단은 4 개의 뉴클레오티드로 시작된 단일 나선의 절단에 기인한다. 따라서, 절단은 반드시 각 나선의 DNA의 정확히 반대편에서 일어날 필요는 없다. 또한, 융합 단백질의 구조와 표적 부위 사이의 거리가 절단이 하나의 뉴클레오티드 쌍 근처에서, 아니면 여러 부위에서 일어날지에 영향을 미친다. 그러나, 표적화 재조합 및 표적화 돌연변이를 포함한 많은 경우에(아래 내용 참조), 일반적으로 뉴클레오티드 범위 내에서 절단되면 충분하고 특이한 염기 쌍 사이의 절단은 필요하지 않다.Generally, the site where the DNA is cleaved exists between the binding sites of the two fusion proteins. The cleavage of the DNA double-stranded is due to the cleavage of each of the two single strands, or the "nick" starting with 1, 2, 3, 4, 5, 6 or more nucleotides. For example, cleavage of double-stranded DNA by natural Fok I restriction enzymes is due to cleavage of a single helix, starting with four nucleotides. Therefore, the cleavage does not necessarily have to occur exactly on the opposite side of the DNA of each helix. Also, the distance between the structure of the fusion protein and the target site affects whether the cleavage occurs near a single pair of nucleotides or at multiple sites. However, in many cases, including targeted recombination and targeting mutations (see below), cleavage within the nucleotide range generally does not require cleavage between sufficient and specific base pairs.

상기에 기술한 바와 같이 융합 단백질은 폴리펩티드 및 폴리뉴클레오티드 형태로 도입될 수 있다. 예를 들면, 각각 전술한 폴리펩티드들 중 하나를 암호화하는 서열을 포함하는 두 개의 폴리뉴클레오티드는 세포 내로 도입될 수 있고 절단은 표적 서열 근처에서 일어난다. 한편, 두 개의 폴리펩티드를 암호화하는 서열을 포함하는 하나의 폴리뉴클레오티드도 세포 내로 도입될 수 있다. 폴리뉴클레오티드는 DNA, RNA, 또는 DNA나 RNA의 변형된 형태 및 유사체 모두 가능하다.As described above, fusion proteins may be introduced in the form of polypeptides and polynucleotides. For example, two polynucleotides, each containing a sequence encoding one of the aforementioned polypeptides, can be introduced into the cell and cleavage occurs near the target sequence. On the other hand, one polynucleotide comprising a sequence encoding two polypeptides can also be introduced into the cell. Polynucleotides can be DNA, RNA, or both modified forms and analogs of DNA or RNA.

절단 특이성을 증가시키기 위해서는 다음에 기술될 추가적인 조성물을 사용할 수 있다. 예를 들면, 하나로 된 절단 하프-도메인들은 이중-나선 절단 활성에 제한을 받는다. 각각 3 개의 핑거를 가진 징크핑거 도메인과 절단 하프-도메인이 세포내로 도입되는 방법에서 한 개의 도메인은 대략 9 개의 뉴클레오티드로 이루어진 표적 부위를 특정화한다. 포유류의 게놈에서는 18개의 뉴클레오티드로 이루어진 집합 표적 서열이 일반적이지만 인간 게놈에서는 평균적으로 약 23,000마다 한번 9개의 뉴클레오티드 표적 부위가 나타난다. 따라서, 하나의 하프-도메인의 특이적 결합에 의한 비특이적인 절단이 일어날 수 있다. 따라서, 다음에 기술될 방법은 두 개의 융합 단백질처럼 세포 내에서 발현되는 절단 하프-도메인,예를 들면 FokI 또는 절단 하프-도메인을 암호화하는 핵산의 우성 음성 돌연변이를 이용하였다. 우성 음성 돌연변이는 이량체는 될 수 있으나 절단은 하지 못하며, 또한 하프-도메인과 이량체를 형성하여 하프-도메인의 절단 활성을 방해한다. 융합 단백질에 우성 음성 돌연변이를 과량으로 투입함으로써 모두 융합 단백질로 결합한 영역에서만 이량체화가 가능할 정도로 충분한 기능성 절단 하프-도메인이 존재하게 되고 절단이 일어난다. 두 개의 융합 단백질 중에 하나만 결합한 부위에서는 절단 하프-도메인은 우성 음성 돌연변이 하프-도메인과 이량체를 형성하여 원하지 않는 비특이적 절단은 일어나지 않는다. Additional compositions to be described below may be used to increase cleavage specificity. For example, truncated half-domains in one are limited to double-helix cleavage activity. One domain in the manner of introducing a zinc finger domain with three fingers each and a cleavage half-domain into a cell characterizes a target site consisting of approximately nine nucleotides. In mammalian genomes, the collective target sequence of 18 nucleotides is common, but in the human genome an average of 9 nucleotide target sites appear once every 23,000 on average. Thus, non-specific cleavage by specific binding of one half-domain can occur. Thus, the methods described below utilized dominant negative mutations of the nucleic acid encoding a cleavage half-domain, such as Fok I or cleavage half-domain, expressed in the cell, such as two fusion proteins. Dominant negative mutations can be dimers but not cleaved and also form half-domains and dimers to interfere with the half-domain cleavage activity. By overexpressing a dominant negative mutation in the fusion protein, there is sufficient functional cleavage half-domain and cleavage occurs to such a degree that dimerization is possible only in the region bound to the fusion protein. In the region where only one of the two fusion proteins is bound, the cleavage half-domain forms a dimer with the dominant negative mutant half-domain, so that undesired nonspecific cleavage does not occur.

FokI 절단 하프-도메인의 3개의 촉매 아미노산 잔기가 Asp 450, Asp 467 및 Lys 469로 확인되었다. (Bitinaite et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10, 570-10, 575) 따라서, 이들 잔기에 하나 또는 두 개 이상의 돌연변이를 이용하여 우성 음성 돌연변이를 만들 수 있다. 또한, IIS 엔도뉴클레아제의 촉매 아미노산 잔기들이 많이 알려졌고 FokI 서열과 일치시킴으로써 또는 촉매 활성부위의 돌연변이 생성과 활성 시험을 통해 결정할 수도 있다.Three catalytic amino acid residues of the Fok I cleavage half-domain were identified as Asp 450, Asp 467 and Lys 469. (95: 10, 570-10, 575). Thus, one or more mutations can be used in these residues to create a dominant negative mutation (Bitinaite et al ., (1998) Proc. Natl. Acad . In addition, the catalytic amino acid residues of the IIS endonuclease can be determined by known methods, by matching with the Fok I sequence, or by mutagenesis and activity testing of catalytically active sites.

절단 하프-도메인의 이량체 도메인 돌연변이The dimeric domain mutation of the truncated half-domain

ZFP와 절단 하프-도메인 간의 융합,예를 들어 ZFP/FokI 융합을 통한 표적화된 절단방법은 각각 다른 표적 부위를 지시하는 융합 분자들의 이용이 필수적이다. 상기에 기술한 바처럼 두 융합 단백질은 게놈에서 표적화된 절단이 특정 부위를 지시하도록 선택될 수 있다. 절단 특이성을 감소시키는 중요한 요인은 두 ZFP/절단 하프도메인 융합 단백질들 중 하나의 동형이량체 때문이다. 예를 들어, 게놈에 두 ZFP/절단 하프도메인 융합 단백질들 중 하나에 대한 표적 서열의 역위 반복이 존재하면 같은 융합 단백질 두 개가 방향을 가지고 결합하여 기능성 이량체를 형성하게 되고 절단 특이성이 감소한다.Fusion between ZFPs and cleavage half-domains, for example targeted cleavage through ZFP / Fok I fusion, requires the use of fusion molecules, each indicating a different target site. As described above, both fusion proteins can be selected so that the cleavage targeted in the genome points to a particular site. An important factor in reducing cleavage specificity is due to the homodimer of one of the two ZFP / cleavage half domain fusion proteins. For example, if the genome contains inverted repeats of the target sequence for one of the two ZFP / truncated half-domain fusion proteins, the same two fusion proteins will bind with direction to form a functional dimer and reduce the specificity of the truncation.

목적한 표적 부위 이외의 서열에서 비정상적인 절단 가능성을 감소시키는 방법중 하나는 동형이량체화를 방해하거나 최소화시키는 절단 하프-도메인의 변종을 생성하는 것이다. 더욱 좋은 것은 이량체화에 관여하는 하프-도메인 부분의 아미노산들 중 하나 또는 두 개 이상을 치환하는 것이다. FokI 단백질 이량체의 결정 구조에서 절단 하프-도메인의 구조는 FokI에 의해 DNA가 절단되는 동안의 절단 하프-도메인의 정열과 유사하다고 보고되었다. (Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10564-10569) 이 구조에 의하면 483번, 487번 위치의 아마노산이 Fok I 절단 하프-도메인 이량화반응에 중요한 역할을 한다. 또한 446번, 447번, 479번, 483번, 484번, 486번, 487번, 490번, 491번, 496번, 498번, 499번, 500번, 531번, 534번, 537,번 및 538번 위치의 아미노산이 이량체화반응을 영향을 미칠 수 있을 만큼 충분히 가까이 있다. 따라서, 전술한 위치들 중 하나 또는 두 개 이상의 아미노산 서열을 바꿈으로써 절단 하프-도메인의 이량화반응 성질을 변화시킬 수 있다. 예를 들어, 상기 위치들에 다른 아미노산을 가지는 또는 암호화하는 라이브러리의 구성, 원하는 성질을 가진 변종의 선택, 또는 각각의 돌연변이를 합리적으로 설계함으로써 이런 변화를 도입할 수 있다. 상기한 변화들 중 일부는 동형이량체화반응을 방해할 뿐 아니라 두 개의 야생형 절단 하프-도메인보다 절단 효율을 증가시킬 수도 있다. One way of reducing the possibility of abnormal cleavage in sequences other than the desired target site is to generate a variant of the cleaved half-domain that interferes with or minimizes homodimerization. Even better, it is to substitute one or more of the amino acids of the half-domain portion involved in the dimerization. The structure of the cleavage half-domain in the crystal structure of the Fok I protein dimer has been reported to be similar to the cleavage half-domain cleavage during DNA cleavage by Fok I. (1998) Proc Natl Acad Sci USA 95: 10564-10569) According to this structure, ananoic acid at positions 483 and 487 plays an important role in the Fok I cleavage half-domain dimerization reaction (Wah et al . . Also, it is also possible to use one or more of 446, 447, 479, 483, 484, 486, 487, 490, 491, 496, 498, 499, 500, 531, 534, 537, The amino acid at position 538 is close enough to affect the dimerization reaction. Thus, by altering one or more of the amino acid sequences of the above positions, the dimerization reaction properties of the cleavage half-domain can be varied. For example, such changes can be introduced by constructing a library with or encoding different amino acids at the positions, by selecting a variant with the desired properties, or by rationally designing each mutation. Some of these changes not only hamper homodimerization reactions, but may also increase the cleavage efficiency over two wild-type cleavage half-domains.

따라서, FokI 절단 하프-도메인 내의 이량체화에 영향을 줄 수 있는 어떤 아미노산 잔기의 변화도 ZFP/FokI 융합 단백질의 쌍 중 하나가 동형이량체화반응을 하여 원하지 않는 서열에서 절단을 일으키지 않도록 하는데 사용할 수 있다. 따라서, ZFP/FokI 융합 단백질 쌍을 이용하여 표적화된 절단을 하기 위해서는 자체 이량체화반응을 방해하는 아미노산이 하나 또는 두 개 이상 변화된 융합 단백질들 중 하나 또는 두 개로 이루어져야 하고 반면에 원하는 표적 부위를 절단하는 두 개의 융합 단백질의 이형이량체화반응은 이루어져야 한다. 어떤 구체예에서, 변화가 두 개의 융합 단백질에 모두 존재하여 추가적인 영향, 즉 비정상적 절단을 일으키는 동형이량체화반응이 줄어들거나 제거되기도 하는 반면, 두 개의 융합 단백질의 이형이량체화반응은 야생형 절단 하프-도메인의 이형이량체화반응과 비교하여 비슷한 활성을 가진다.실시예 5를 참조한다.Thus, any change in amino acid residues that can affect dimerization within the Fok I cleavage half-domain ensures that one of the pairs of ZFP / Fok I fusion proteins does not undergo homodimerization to cause cleavage at the unwanted sequence Can be used. Thus, in order to perform targeted cleavage using a ZFP / Fok I fusion protein pair, one or two of the fusion proteins with one or more amino acids that interfere with the self-dimerization reaction must be composed of one or two, The two fusion proteins must be heterodimerized. In some embodiments, a change is present in both fusion proteins, so that the homodimerization reaction that results in a further effect, i.e., abnormal cleavage, is reduced or eliminated, while the heterodimerization reaction of the two fusion proteins is a wild- -Domain heterodimer has similar activity compared to the dimerization reaction. See Example 5.

게놈 서열의 표적화된 변환 방법 및 표적화된 재조합 방법 Targeted transformation methods of genomic sequences and targeted recombinant methods

다음에 기술하는 방법은 게놈 서열을(예를 들어, 세포 염색질 내의 관심 영역) 상동 비일치 서열로(예를 들어, 표적화된 재조합) 치환하는 방법이다. 특별한 서열을 치환하는 기존의 시도는 도너 DNA 분자가 게놈내로 상동성 재조합을 일으키는 세포를 선택한 후, 염색체 영역, 즉 도너 DNA와 유사성을 가지는 서열을 포함하는 폴리뉴클레오티드와 세포를 접촉시키는 것이었다. 상동성 재조합의 나쁜 효율과 높은 확률로 표적 부위 이외의 게놈 부위에 도너 DNA가 비특이적으로 삽입되기 때문에 이 방법의 성공확률은 낮다.The method described below is a method of substituting a genomic sequence (for example, a targeted recombination) with a homology mismatch sequence (e. G., A region of interest in a cell chromatin). Previous attempts to substitute a particular sequence have been to select cells for which homologous recombination of the donor DNA molecule into the genome has been selected and then to contact the cell with a polynucleotide containing a sequence that is similar to the chromosomal region, donor DNA. The success rate of this method is low because donor DNA is nonspecifically inserted into genomic sites other than the target site with bad efficiency and high probability of homologous recombination.

본 발명은 표적화된 재조합 효율을 높이고 비특이적인 삽입 빈도를 감소시키는 것을 특징으로 하는 표적 서열 변환 방법을 제공한다. 본 발명은 세포 DNA의 표적 이중-나선의 하나 또는 두 개 이상을 절단하기 위해서 절단 도메인(또는 절단 하프-도메인)과 융합된 설계된 징크핑거 결합 도메인을 생성하거나 사용하는 것을 포함한다. 상동성 재조합은 세포 DNA의 이중-나선 절단에 의해 절단 부위 근처에서 수천 배 정도 증폭되며 이런 표적화된 절단은 실질적으로 게놈의 어떤 부위에서나 상동성 재조합을 통하여 서열의 변경이나 치환(상동성-지정 수선에 의해)을 가능하게 한다. The present invention provides a target sequence transformation method characterized by enhancing targeted recombination efficiency and reducing non-specific insertion frequency. The present invention involves creating or using a designed zinc finger binding domain fused with a cleavage domain (or cleavage half-domain) to cleave one or more of the target double-spiral of cellular DNA. Homologous recombination is amplified thousands of times near the cleavage site by double-helix cleavage of cellular DNA, and this targeted cleavage can be accomplished by altering or replacing the sequence (homology-directed repair) by virtue of homologous recombination in virtually any part of the genome ). ≪ / RTI >

다음에 기술되는 융합 단백질뿐만 아니라 선택된 게놈 서열의 표적화된 치환도 치환(또는 도너) 서열의 도입을 필요로 한다. 도너 서열은 융합 단백질의 발현 이전이나 동시 또는 이후 언제든 세포 내로 도입될 수 있다. 자신과 유사성을 가진 게놈 서열 사이에 상동성 재조합(또는 상동성-지정 수선)을 하기 위해서 도너 폴리뉴클레오티드는 게놈 서열과 충분한 유사성을 가져야 한다. 도너와 게놈 서열 사이에는 대략 25, 50, 100, 200, 500, 750, 1,000, 1,500, 2,000개의 뉴클레오티드 또는 그 이상의 사열 유사성(또는 10 내지 2000 사이의 정수 또는 그 이상)을 가져야 상동성 재조합을 할 수 있다. 도너 서열의 길이는 10 - 5,000 뉴클레오티드(또는 그 사이 모든 정수)이거나 그 이상으로 되어 있다. 도너 서열은 명백히 치환될 게놈 서열과 전형적으로 일치하지는 않는다. 예를 들어, 염색체 서열과의 충분한 상동성이 존재하는 한, 도너 폴리뉴클레오티드 서열은 게놈 서열에 대하여 하나의 염기 변화, 삽입, 결실, 역전, 또는 재배열 중에서 하나 또는 두 개 이상을 포함할 수 있다. 또는 달리, 도너 서열은 두 상동성 영역이 측면에 위치한 비-상동성 서열을 함유할 수 있다. 또한, 도너 서열은 세포 염색질의 관심 영역과 비-상동성인 서열을 가질 수도 있다. 일반적으로 도너 서열의 상동성 영역은 재조합이 일어나기 원하는 게놈 서열과 적어도 50% 서열 일치를 보여야 한다. 어떤 구체예에는, 60%, 70%, 80%, 90%, 95%, 98%, 99%, 또는 99.9% 서열 일치가 존재한다. 도너 폴리뉴클레오티드의 길이에 따라 1% - 100% 서열 일치가 가능하다.(Or donor) sequences of the selected genomic sequence as well as the fusion proteins described below. The donor sequence may be introduced into the cell either before, simultaneously with or after the expression of the fusion protein. In order to perform homologous recombination (or homology-directed repairs) between homologous genomic sequences, the donor polynucleotide should have sufficient similarity to the genomic sequence. Between the donor and the genomic sequence, homologous recombination should be performed with approximately 25, 50, 100, 200, 500, 750, 1,000, 1,500, 2,000 nucleotides or more quadrature similarities (or integers between 10 and 2000 or more) . The length of the donor sequence is 10 - 5,000 nucleotides (or all integers between them) or more. The donor sequence is not typically matched to the genomic sequence to be substituted. For example, as long as there is sufficient homology with the chromosomal sequence, the donor polynucleotide sequence may comprise one or more of a base change, insertion, deletion, inversion, or rearrangement relative to the genomic sequence . Alternatively, the donor sequence may contain non-homologous sequences in which the two homologous regions are flanked. In addition, the donor sequence may have a sequence that is non-homologous to the region of interest of the cell chromatin. In general, the homologous region of the donor sequence should show at least 50% sequence identity with the genomic sequence for which recombination is desired to occur. In some embodiments, there is a sequence match of 60%, 70%, 80%, 90%, 95%, 98%, 99%, or 99.9%. Depending on the length of the donor polynucleotide, 1% to 100% sequence matching is possible.

도너 분자는 여러 개의 세포 염색질 유사 영역을 비연속적으로 가질 수 있다. 예를 들어, 일반적으로 관심 영역에 존재하지 않는 서열의 표적 삽입에서는 상기 서열이 도너 핵산 분자에 존재하고 관심 영역의 서열과 유사한 영역을 측면에 가질 수 있다. The donor molecule may have several cell chromatin-like regions discontinuously. For example, in a target insertion of a sequence that is not normally present in the region of interest, the sequence may be present in the donor nucleic acid molecule and have a region similar to the sequence of the region of interest.

도너 서열의 삽입을 확인하기 위한 검사(예를 들어, 혼성, PCR, 제한효소절단 등)를 간단히 하기 위해서 게놈 서열과 비교하여 도너 서열에는 특정 서열의 차이가 존재할 수도 있다. 더욱 좋게는, 암호화 영역에 존재하여 뉴클레오티드 서열 차이가 아미노산 서열을 바꾸지 않거나 또는 침묵 아미노산 변화,즉 뉴클레오티드 변화가 단백질의 구조나 기능에는 영향을 미치는 않는 변화시키는 것이다. 도너 폴리뉴클레오티드는 상동성 재조합에 의하여 세포 염색질로 도입되는 도너 서열의 절단을 방지하기 위하여 관심 영역의 징크핑거 도메인 결합 부위에 상응하는 서열을 추가로 가질 수 있다. In order to simplify the examination (for example, hybridization, PCR, restriction enzyme cleavage, etc.) for confirming the insertion of the donor sequence, there may be a difference in the specific sequence in the donor sequence compared with the genomic sequence. More preferably, the nucleotide sequence differences present in the coding region do not alter the amino acid sequence or that the silent amino acid changes, i.e., the nucleotide changes, do not affect the structure or function of the protein. The donor polynucleotide may further have a sequence corresponding to the zinc finger domain binding site of the region of interest to prevent cleavage of the donor sequence introduced into the cell chromatin by homologous recombination.

도너 폴리뉴클레오티드는 DNA 또는 RNA, 단일 나선 또는 이중-나선 모두 될 수 있고 직선형 또는 원형으로 세포내로 도입될 수 있다. 직선형으로 도입된다면 도너 서열의 끝은 당해 기술분야에서 널리 알려진 방법으로(예를 들면, 엑소뉴클레아제로 분해) 보호될 수 있다. 예를 들어, 직선형 분자의 3' 말단에 디데옥시뉴클레오티드를 하나 또는 두 개 이상 첨가하거나 자체 상보적인 올리고뉴클레오티드를 한쪽 또는 양쪽 끝에 결합시킨다. (Chang et al. (1987) Proc. Natl. Acad. Sci. USA 84: 4959- 4963; Nehls et al. (1996) Science 272: 886-889) 외래 폴리뉴클레오티드 분해를 보호하는 또 다른 방법은 말단 아미노기를 첨가하거나 포스포로티오에이트, 포스포라미데이트 및 O 메틸 리보스 또는 데옥시리보오스 잔기로 구성된 군에서 선택된 변성 분자 간 뉴클레오티드 링커를 첨가하는 것이지만 여기에 한정되지는 않는다. 폴리뉴클레오티드는 복제 원점, 프로모터, 및 항생제 내성 유전자로 구성된 군에서 선택된 서열을 가진 벡터 분자의 일부로서 세포에 도입될 수 있다. 더구나, 도너 폴리뉴클레오티드는 네이키드 형태로, 리포솜 또는 폴록사머와 결합한 형태로, 또는 바이러스에 의해(예를 들어, 아데노바이러스, AAV, 헤르페스바이러스, 레트로바이러스, 렌티바이러스) 세포 내로 도입될 수 있다.The donor polynucleotide can be either DNA or RNA, single-stranded or double-stranded, and can be introduced into cells linearly or circularly. If introduced linearly, the end of the donor sequence can be protected in a manner well known in the art (e. G., Degraded to exonuclease). For example, one or more dideoxynucleotides may be added to the 3 'end of a linear molecule, or a self-complementary oligonucleotide may be attached to one or both ends. (Chang et al (1987) Proc Natl Acad Sci USA 84:...... 4959- 4963; Nehls et al (1996) Science 272: 886-889) Another way to protect the foreign polynucleotide is disassembled terminal amino group , Or adding a modified intermolecular nucleotide linker selected from the group consisting of phosphorothioate, phosphoramidate, and O-methyl ribose or deoxyribose residues. The polynucleotide may be introduced into the cell as part of a vector molecule having a sequence selected from the group consisting of a replication origin, a promoter, and an antibiotic resistance gene. Furthermore, the donor polynucleotide can be introduced in a naked form, in association with a liposome or poloxamer, or into a cell (e.g., adenovirus, AAV, herpes virus, retrovirus, lentivirus) by a virus.

어떤 이론에 결부되지는 않지만, 세포 내 서열에서 절단 부위 근처 또는 둘러싼 영역과 유사성을 가지는 외래 DNA 분자가 존재하면 이중-나선의 절단이 나타나고, 도너 분자에서 세포 서열로(예를 들어, 게놈 또는 염색체 서열) 서열 정보를 전달하는, 즉 "유전자 보존"이라고 알려진 상동성-지정 수선 과정에 의하여 절단을 복구하는 세포 메커니즘이 활성화된다. 사용 방법은 설계된 ZFP의 강력한 표적 능력을 원하는 재조합이 일어나는 게놈 영역에 이중-나선 절단을 특이적으로 선택하는 절단 도메인(또는 절단 하프-도메인)에 결합하는 장점이 있다. Without being bound by any theory, the presence of exogenous DNA molecules in or near the cleavage site in the intracellular region, which have similarity to the surrounding region, will result in a double-helix cleavage and will occur in the donor molecule (e. G., As a genomic or chromosome Sequence) Cell mechanisms that restore sequence by homologous-directed repair, known as "gene conservation", are activated. The method of use has the advantage of binding to the cleavage domain (or cleavage half-domain) that specifically selects the double-helical cleavage in the genomic region in which the desired recombination occurs, the strong target capability of the designed ZFP.

염색체 서열의 변경은 원하는 서열 변경에 영향을 줄 정도로 충분하다면 도너의 모든 서열을 염색체에 복사할 필요는 없다.It is not necessary to copy all of the donor sequences to the chromosome if the chromosomal sequence change is sufficient to affect the desired sequence alteration.

상동성 재조합에 의한 도너 서열의 삽입 효율은 세포 DNA에서 이중-나선 절단과 재조합을 원하는 부위의 거리에 반비례 관계가 있다. 다시 말해서, 이중-나선 절단이 재조합을 원하는 부위와 가까울수록 높은 상동성 재조합 효율을 보인다. 재조합의 정확한 부위가 미리 계산되지 않은 경우, 예를 들어 원하는 재조합이 게놈 서열의 전 간격에서 일어날 수 있는 경우에는, 원하는 재조합을 얻기 위해서 절단 부위와 함께 도너 핵산의 길이와 서열을 선택하여야 한다. 원하는 재조합이 게놈 서열의 하나의 뉴클레오티드 쌍의 서열을 변화시키도록 디자인된 경우에는 세포 염색질이 뉴클레오티드 쌍 한편의 10,000개 뉴클레오티드 사이에서 절단된다. 어떤 구체예에서, 서열을 변환시키려는 뉴클레오티드 쌍 한편의 1,000개, 500개, 200개, 100개, 90개, 80개, 70개, 60개, 50개, 40개, 30개, 20개, 10개, 5개 또는 2개 뉴클레오티드 사이에서(또는 2부터 1,000 사이의 정수) 절단이 일어난다.The efficiency of insertion of the donor sequence by homologous recombination is inversely related to the distance of the desired site of double-helical cleavage and recombination in the cellular DNA. In other words, the closer to the site where the recombination is desired, the higher the homologous recombination efficiency. If the exact site of recombination is not pre-calculated, for example, if the desired recombination can occur at all intervals of the genome sequence, the length and sequence of the donor nucleic acid along with the cleavage site should be selected to obtain the desired recombination. If the desired recombination is designed to alter the sequence of one nucleotide pair of the genomic sequence, the cell chromatin is cleaved between 10,000 nucleotides on either side of the pair of nucleotides. In some embodiments, the number of nucleotides to be converted is greater than 1,000, 500, 200, 100, 90, 80, 70, 60, 50, 40, 30, (Or an integer between 2 and 1,000) between nucleotides, five, or two nucleotides.

이상에서 밝힌 바와 같이, 각각 징크핑거 결합 도메인과 절단 하프-도메인을 포함하는 융합 단백질의 결합 부위는 가장 가까운 결합 부위의 끝으로부터 5 ~ 8 또는 15 ~ 18 뉴클레오티드 떨어져 위치하고 결합 부위 사이에서 절단이 일어난다. 절단될 게놈 서열은 도너 서열에 의해 치환되기 때문에 절단이 하나의 부위에서 일어나는가 또는 여러 부위에서 일어나는가는 중요하지 않다. 따라서, 표적화된 재조합에 의한 하나의 뉴클레오티드 쌍 서열을 효율적으로 변환하기 위해서는 결합 주위 사이의 중간 영역이 표적 뉴클레오티드에서 10,000 뉴클레오티드 안에 있어야 한다. 바람직하게는, 1,000 뉴클레오티드, 500 뉴클레오티드, 200 뉴클레오티드, 100 뉴클레오티드, 50 뉴클레오티드, 20 뉴클레오티드, 10 뉴클레오티드, 5 뉴클레오티드, 2 뉴클레오티드, 1 뉴클레오티드, 또는 관심 뉴클레오티드 쌍에 있어야 한다.As described above, the binding sites of the fusion protein including the zinc finger binding domain and the cleavage half-domain are located 5 to 8 or 15 to 18 nucleotides from the end of the nearest binding site, respectively, and cleavage occurs between the binding sites. Since the genomic sequence to be cleaved is replaced by the donor sequence, the cleavage takes place at one site or at different sites is not important. Thus, in order to efficiently convert one nucleotide pair sequence by targeted recombination, the middle region between the binding sites must be within 10,000 nucleotides of the target nucleotide. Preferably it should be in a pair of 1,000 nucleotides, 500 nucleotides, 200 nucleotides, 100 nucleotides, 50 nucleotides, 20 nucleotides, 10 nucleotides, 5 nucleotides, 2 nucleotides, 1 nucleotide, or nucleotide of interest.

어떤 구체예에서, 상동 염색체가 도너 폴리뉴클레오티드로 작용할 수 있다. 따라서, 염색체에 결합하여 돌연변이 서열을 절단하지만 상동 염색체의 야생형 서열은 절단하지 않는 융합 단백질을 설계함으로써 이형접합체의 돌연변이를 교정할 수 있다. 돌연변이를 가진 염색체의 이중-나선 절단은 상동 염색체의 야생형 서열이 절단된 염색체로 복제되는 유사성 기반 "유전자 전환" 프로세스를 자극하여 야생형 서열 두 복제를 회복시킨다.In some embodiments, homologous chromosomes can act as donor polynucleotides. Thus, mutations in a heterozygote can be corrected by designing a fusion protein that binds to the chromosome and cleaves the mutant sequence but does not cleave the wild-type sequence of the homologous chromosome. Double-helical cleavage of mutant chromosomes restores two copies of the wild-type sequence by stimulating a similarity-based "gene transfer" process in which the wild-type sequence of the homologous chromosome is cloned into the truncated chromosome.

표적화된 재조합을 향상시키는 방법과 조성물은 또한 상동성 재조합에 관여하는 유전자 발현을 활성화하는 추가적인 ZFP 기능성 도메인 융합을 사용을 포함한다. 상기 유전자들은 RAD52 우세 그룹(예를 들어, RadS0, Rad5l, Rad5lB, Rad5 C, Rad5lD, Rad52, Rad54, Rad54B, Mrell, XRCC2, 및 XRCC3), 전술한 유전자 산물과 작용할 수 있는 산물을 생성하는 유전자(예를 들어, BRCA1 및 BRCA2), 및 NBS1 복합체의 유전자들이다. 비상동성 말단 결합에 관여하는 유전자(예를 들어, Ku70/80, XRCC4, 폴리(ADP 리보스) 폴리머라제, 및 DNA 리가제 4) 발현을 억제하기 위하여 기술하고 있는 방법 및 조성물과 병행하여 ZFP 기능성 도메인 융합을 유사하게 사용할 수 있다.(Yanez et al. (1998) Gene Therapy 5: 149-159; Hoeijmakers (2001) Nature 411: 366-374 ; Johnson et al. (2001) Biochem. Soc. Trans. 29: 196-201; Tauchi et al. (2002) Oncogene 21: 8967-8980) 징크핑거 결합 도메인과 기능성 도메인의 융합을 이용한 유전자 발현의 활성화와 억제 방법은, 예를 들어 공동 소유의 미국특허 제 6,534,261; 6,824,978 및 6,933,113에 명시되어 있다. 또 다른 억제 방법은 안티센스 올리고뉴클레오티드 또는 억제하려는 유전자 서열을 선택하는소형 간섭 RNA(siRNA 또는 RNAi)를 사용하는 것이다. Methods and compositions for enhancing targeted recombination also include the use of additional ZFP functional domain fusion to activate gene expression involved in homologous recombination. These genes include, but are not limited to, the RAD52 dominant group (e.g. RadS0, Rad5l, Rad5lB, Rad5c, Rad5lD, Rad52, Rad54, Rad54B, Mrell, XRCC2 and XRCC3), the gene For example, BRCA1 and BRCA2), and genes of the NBS1 complex. In parallel with the methods and compositions described for the inhibition of the expression of genes involved in non-homologous terminal binding (e.g., Ku70 / 80, XRCC4, poly (ADP ribose) polymerase and DNA ligase 4) Fusion can be similarly used (Yanez et al . (1998) Gene Therapy 5: 149-159; Hoeijmakers 2001 Nature 411: 366-374 Johnson et al 2001 Biochem Soc Trans. 29: 196-201; Tauchi et al . (2002) Oncogene 21: 8967-8980) Methods of activating and inhibiting gene expression using fusion of zinc finger binding domains and functional domains are described, for example, in commonly owned U.S. Patent Nos. 6,534,261; 6,824,978 and 6,933,113. Another method of inhibition is to use antisense oligonucleotides or small interfering RNAs (siRNA or RNAi) to select the gene sequence to inhibit.

상동성 재조합에 관여하는 유전자 발현과 기능성 단편과 관심 영역을 선택하는 징크핑거 결합 도메인의 융합을 활성화하는 다른 방법으로 관심 영역에 재조합 단백질을 추가하여 국소적으로 농도를 높임으로써 상동성 재조합 프로세스를 더욱 가속화시킬 수 있다. 한편, 상기에 기술한 것처럼 상동성 재조합에 관여하는 폴리펩티드 또는 폴리펩티드의 기능성 단편은 징크핑거 결합 도메인, 절단 도메인 또는 절단 하프-도메인, 및 재조합 단백질 또는 재조합 단백질의 기능성 단편을 포함하는 삼쌍 융합 단백질의 부분이 될 수 있다. 전술한 방법과 조성물에 사용할 수 있는 유전자 전환과 재조합 연관 염색질 리모델링에 관여하는 단백질은 히스톤 아세틸트랜스퍼라제(예를 들어, Esalp, Tip60), 히스톤 메틸트랜스퍼라제(예를 들어, Dotlp), 히스톤 키나제, 및 히스톤 포스파타제를 포함한다.Another method of activating the fusion of gene expression and functional fragments involved in homologous recombination and the zinc finger binding domain that selects the region of interest is to add a recombinant protein to the region of interest to increase the concentration locally to increase the homology recombination process Can be accelerated. On the other hand, as described above, the functional fragment of a polypeptide or polypeptide involved in homologous recombination is a portion of a three-pair fusion protein comprising a zinc finger binding domain, a truncation domain or truncation half-domain, and a functional fragment of a recombinant protein or recombinant protein . Proteins involved in gene transfer and recombinant chromatin remodeling that can be used in the above methods and compositions include, but are not limited to, histone acetyltransferases (e.g. Esalp, Tip60), histone methyltransferases (e.g., Dotlp), histone kinases, And histone phosphatase.

p53 단백질은 상동성 재조합(HR)을 억제하는데 중요한 역할을 한다고 보고되었다. (Valerie et al., (2003) Oncogene 22: 57925812; Janz, et al. (2002) Oncogene 21: 5929-5933) 예를 들면, p53 결핍 인간 종양 라인에서 HR 속도는 인간 섬유아세포에서 10,000 배 이상 크고 기능성 p53을 가진 종양 세포와 비교하여 비기능성 p53을 가진 종양 세포의 HR 속도가 100 배 정도 크다. (Mekeel et al. (1997) Oncogene 14: 1847- 1857) 또한, p53 우성 음성 돌연변이의 과발현은 자발적인 재조합을 20 배 정도 증가시킨다. (Bertrand et al. (1997) Oncogene 14: 1117-1122) 서로 다른 p53 돌연변이 분석을 통해서 p53의 전사 교차활성과 G1 세포 사이클 체크포인트 조절의 역할과 HR 관여 역할과는 별개임이 밝혀졌다. (Saintigny et al. (1999) Oncogene 18: 3553-3563; Boehden et al. (2003) Oncogene 22: 4111-4117) 따라서, p53 활성을 저하는 본 발명에서 기술하고 있는 방법과 조성물을 이용한 표적 상동성 재조합 효율을 증가시킬 수 있다. p53 활성을 저하시키는 방법은 p53 우성 음성 돌연변이의 공동감염 및 과발현 또는 본 발명 및 미국특허 제 6,534,261호에 기재된 방법에 의한 p53 유전자 발현의 억제를 포함하지만 이것으로 제한되는 것은 아니다.p53 protein has been reported to play an important role in inhibiting homologous recombination (HR). (2002) Oncogene 21: 5929-5933). For example, in the p53 deficient human tumor line, the HR rate is greater than 10,000 times in human fibroblasts (Valerie et al ., (2003) Oncogene 22: 57925812; Janz et al The HR rate of tumor cells with non-functional p53 is about 100 times larger than that of tumor cells with functional p53. (Mekeel et al Oncogene 14 (1997 ):. 1847- 1857) In addition, over-expression of dominant negative p53 mutation increases about 20 times the spontaneous recombination. (Bertrand et al . (1997) Oncogene 14: 1117-1122). Different p53 mutation analyzes revealed that transcriptional crossover activity of p53 and the role of G1 cell cycle checkpoint control and HR involvement were independent. (Saintigny et al (1999) Oncogene 18:.. 3553-3563; Boehden et al (2003) Oncogene 22: 4111-4117) Thus, the lower the p53 activity is targeted homologous with the methods and compositions that are described herein The recombination efficiency can be increased. Methods of lowering p53 activity include, but are not limited to, coinfection and overexpression of a p53 dominant negative mutation or inhibition of p53 gene expression by the methods of the present invention and U.S. Patent No. 6,534,261.

징크핑거/뉴클레아제 융합 분자 및 도너 DNA 분자를 포함하는 세포에서 유사성 유발 회복 프로세스 활성이 최대일 때 세포 사이클의 G2기에 정지시킴으로써 표적화된 재조합 효율을 더욱 높일 수 있다. 이런 정지는 여러 가지 방법으로 수행할 수 있다. 예를 들면, G2기에 세포를 정지시키기 위해서 세포 사이클 진행에 영향을 주는 약물, 화합물, 작은 분자로 세포를 처리할 수 있다. 이런 유형의 대표 분자로는 미세소관 중합반응에 영향을 미치는 화합물(예를 들어, 빈블라스틴, 노코다졸, 및 택솔), DNA와 작용하는 화합물(예를 들어, 시스-플라티늄(II), 디아민 디클로라이드, 시스플라스틴, 및 독소루비신), 및 DNA 합성에 영향을 주는 화합물(예를 들어, 티미딘, 히드록시우레아, L-미모신, 엑토포시드, 및 5-플로로우라실)을 포함하지만 여기에 제한되는 것은 아니다. 염색질 구조를 세포 재조합 기구에 보다 접근이 용이하도록 변화시키는 히스톤 디아세틸라제(HDAC) 억제제(예를 들어, 소디움 부티레이트 및 트리코스타틴 A)를 사용하여 재조합 효율을 증가시킬 수도 있다.Similarity-induced recovery in cells containing zinc finger / nuclease fusion molecules and donor DNA molecules The target recombination efficiency can be further enhanced by stopping at the G2 term of the cell cycle when the activity is at a maximum. This suspension can be done in several ways. For example, cells can be treated with drugs, compounds, or small molecules that affect cell cycle progression in order to stop the cells in the G2 phase. Representative molecules of this type include compounds that affect microtubule polymerization (e. G., Vinblastine, nocodazole, and taxol), compounds that interact with DNA (e. G., Cis-platinum Diaminodichloride, cisplastin, and doxorubicin), and compounds that affect DNA synthesis (such as thymidine, hydroxyurea, L-mimosin, etoposide, and 5-fluorouracil) However, it is not limited thereto. Histone deacetylase (HDAC) inhibitors (such as sodium butyrate and trichostatin A) may be used to increase recombination efficiency, which may alter the chromatin structure to make it more accessible to cellular recombination machinery.

세포 사이클을 정지시키는 방법은 CDK 세포 사이클 키나제의 활성을 억제하는 단백질의 과발현을 포함하는데, 예를 들면 단백질을 암호화하는 cDNA를 세포내로 도입하거나 단백질을 암호화하는 유전자 발현을 활성화하도록 설계된 ZFP를 세포내로 도입하는 것이다. 시클린 및 CDK의 활성을 억제함으로써 세포 사이클을 정지시킬 수 있는데, 예를 들면 RNAi 방법(미국특허 제 6,506,559호), 세포 사이클 진행에 관여하는 유전자 중 하나 또는 두 개 이상의 발현을 억제하도록 설계된 ZFP를 세포 내로 도입하는 것이다. 예를 들어, 미국특허 제 6,534,261호에 명시된 유전자 발현 억제를 위해 설계된 징크핑거 단백질의 합성 방법을 참조한다.The method of stopping the cell cycle includes overexpression of a protein that inhibits the activity of the CDK cell cycle kinase. For example, a ZFP designed to introduce a cDNA encoding a protein into a cell or to activate gene expression that encodes a protein is introduced into a cell . The cell cycle can be arrested by inhibiting the activity of cyclins and CDKs, for example, the RNAi method (US Patent No. 6,506,559), a ZFP designed to inhibit expression of one or more of the genes involved in cell cycle progression Into the cell. See, for example, the synthesis of zinc finger proteins designed for inhibition of gene expression as described in U.S. Patent No. 6,534,261.

한편, 어떤 경우에는 표적화된 절단이 도너 폴리뉴클레오티드가 없는 상태에서 일어나고(특히 S 단계 또는 G2 단계에서) 재조합이 상동 염색체 사이에서 일어난다.On the other hand, in some cases, the targeted cleavage takes place in the absence of the donor polynucleotide (especially in the S or G2 step) and recombination occurs between homologous chromosomes.

상동성 재조합을 일으키는 세포 인자를 확인하는 방법How to identify cellular factors that cause homologous recombination

상동성 재조합은 DNA 말단을 변형시키고 단백질 복합체에 여러 세포 인자를 도입하는 다단계 공정이기 때문에 표적 상동성 재조합을 수행하기 위해서는 징크핑거-절단 도메인 융합을 암호화하는 도너 DNA 및 벡터뿐만 아니라 하나 또는 두 개 이상의 외래 인자를 추가하여야 한다. Since homologous recombination is a multi-step process in which DNA ends are modified and several cell factors are introduced into the protein complex, in order to perform the target homologous recombination, one or more than two or more donor DNAs and vectors encoding zinc finger- You need to add an extrinsic parameter.

외래 인자를 확인하는 대표적인 방법은 서로 다른 세포의 mRNA 발현 양상을 비교하는 유전자 칩(예를 들어, Affymetrix Gene Chip® 분석법)을 이용한 유전자 발현 분석이다. 예를 들면, 유전자 보정 수준을 증가시키는 것으로알려진 조건의 유무에 상관없이 도너 DNA 및 징크핑거 절단 도메인 융합 존재하에서 이중-나선 말단 유발 상동성 재조합을 가속화시키는 능력이 큰 세포의 유전자 발현 양상을 상기 능력이 부족한 세포와 비교하여 분석할 수 있다. 직접 상동성 재조합 수준을 증가시키는 방법으로 조절 받는 유전자는 확인되어 많은 발현 벡터들 중 하나로 클로닝될 수 있다. 상기 발현 구성체는 상동성 재조합 효율을 높이기 위한 방편으로 징크핑거 절단 도메인 융합 및 도너 구성체와 같이 공동 감염될 수 있다. 한편, 상기 유전자 가운데 하나 또는 두 개 이상을 조절하도록(활성화 또는 억제) 설계된 징크핑거 단백질을 이용하여 유전자 발현을 조절할 수 있다. 예를 들어, 미국특허 제6,534,261호에 명시된 유전자 발현 억제를 위해 설계된 징크핑거 단백질의 합성 방법을 참조한다.A typical method for identifying exogenous factors is gene expression analysis using a gene chip (for example, Affymetrix Gene Chip® assay) that compares mRNA expression patterns of different cells. For example, by increasing the level of gene correction Regardless of known conditions, the gene expression pattern of cells capable of accelerating the double-helix-terminal induced homologous recombination in the presence of donor DNA and zinc finger cleavage domain fusion can be analyzed in comparison with cells lacking the ability. Directly regulated genes can be identified and cloned into one of many expression vectors by increasing the level of homologous recombination. The expression construct may be co-infected with zinc finger cleavage domain fusion and donor constructs as a means to enhance homologous recombination efficiency. On the other hand, gene expression can be regulated using zinc finger proteins designed to regulate (activate or inhibit) one or more of the genes. See, for example, the synthesis of zinc finger proteins designed for inhibition of gene expression as described in U.S. Patent No. 6,534,261.

예를 들면, 실시예 9와 도 27에 기술된 실험에서 얻어진 서로 다른 클론들은 징크핑거-절단 도메인 융합을 암호화하는 도너 DNA 및 플라스미드를 감염시킬 때 폭넓은 상동성 재조합 빈도를 보인다. 고효율 표적화된 재조합을 가지는 클론의 유전자 발현은 저효율을 보이는 클론의 유전자 발현과 비교될 수 있고 이런 독특한 유전자 발현 양상을 확인에 이용할 수 있다.For example, the different clones obtained in Example 9 and the experiment described in Figure 27 show broad homologous recombination frequencies when infecting donor DNA and plasmids encoding zinc finger-cleavage domain fusion. Gene expression of clones with highly efficient targeted recombination can be compared to gene expression of clones with low efficiency and this unique gene expression pattern can be used for confirmation.

또 다른 예를 들면, 세포 사이클 억제제를(예를 들어, 노코다졸 또는 빈블라스틴, 실시예 11, 14, 및 15 참조) 이용한 연구로 세포 사이클의 G2 단계에 정지된 세포의 상동성 재조합 속도가 더욱 높아서 G2기에 발현되거나 활성이 높은 세포 인자가 상동성 재조합애 중요하다는 것을 알 수 있다. 상기 인자를 확인하는 방법은 높은 수준과 낮은 수준으로 유전자 보정을 하는 안정하게 감염된 HEK 293 세포 클론들(예를 들어, T18 클론 대 T7 클론) 사이의 mRNA 발현 양상을 비교하는 것이다. G2기에 세포를 정지시키는 화합물에 대하여 세포 라인들 사이에서 유사한 비교를 할 수 있다. G2기에 세포를 정지시킨다고 알려진 화합물의 유무와 관계없이 높은 속도로 상동성 재조합을 수행하는 세포에서 발현되는 후보 유전자를 확인하고 클로닝하여 향상된 속도를 재현하기에 충분한지를 확인하기 위하여 세포로 재도입한다. 한편, 상술한 바로 설계된 징크핑거 전사 인자를 이용하면 상기 후보 유전자의 발현이 활성화되었다. 예를 들어, 미국특허 제6,534,261호를 참조한다.As another example, studies using cell cycle inhibitors (e.g., nocodazole or vinblastine, see Examples 11, 14, and 15) have shown that the homologous recombination rate of cells suspended in the G2 stage of the cell cycle Is higher, indicating that cell factors expressed or highly active in the G2 phase are important for homologous recombination. The method of confirming these factors is to compare the mRNA expression patterns between stably infected HEK 293 cell clones (e.g., T18 clones versus T7 clones) that are genetically modified to high and low levels. Similar comparisons can be made between cell lines for compounds that arrest cells at G2. Regardless of the presence or absence of a compound known to stop the cell in the G2 phase, candidate genes expressed in cells that perform homologous recombination at high rates are identified and cloned and reintroduced into cells to ensure that they are sufficient to reproduce the improved rate. On the other hand, the expression of the candidate gene was activated using the zinc finger transcription factor directly designed. See, for example, U.S. Patent No. 6,534,261.

발현 벡터Expression vector

하나 또는 두 개 이상의 ZFP 또는 ZFP 융합 단백질을 암호화하는 핵산은 복제 및 발현을 위해서 원핵세포 또는 진핵세포로 형질전환시키는 벡터로 클로닝될 수 있다. 벡터는 진핵 벡터로 예를 들면, 플라스미드, 셔틀 벡터, 곤충 벡터, 또는 원핵 벡터를 포함한다. 식물 세포, 동물 세포, 바람직하게는 포유류 세포 또는 인간 세포, 균류 세포, 세균 세포, 또는 원생동물 세포에 도입하기 위하여 ZFP를 암호화하는 핵산도 발현 벡터에 클로닝될 수 있다. The nucleic acid encoding one or more ZFP or ZFP fusion proteins can be cloned into a vector that transforms into prokaryotic or eukaryotic cells for replication and expression. The vector includes, for example, a plasmid, a shuttle vector, an insect vector, or an eukaryotic vector as a eukaryotic vector. Nucleic acids encoding ZFPs for introduction into plant cells, animal cells, preferably mammalian cells or human cells, fungal cells, bacterial cells, or protozoan cells may also be cloned into an expression vector.

클론된 유전자 또는 핵산을 발현시키기 위해 ZFP 또는 ZFP 융합 단백질을 암호화하는 서열은 보통 직접 전사를 위한 프로모터를 가진 벡터에 서브클로닝된다. 적당한 세균 프로모터 또는 원핵 프로모터는 당해 업계에 널리 알려져 있다. (Sambrook et al., Molecular Cloning, A Laboratory Manual (2nd ed. 1989; 3rd ed., 2001); Kriegler, Gene Transfer and Expression. A Laboratory Manual (1990); 상기의 Current Protocols in Molecular Biology (Ausubel et al.) ZFP 발현을 위한 세균 발현 시스템은, 예를 들어 E. coli, Bacillus sp., 및 Salmonella가(Palva et al., Gene 22: 229- 235 (1983)) 유용하다. 상기 발현 시스템 키트는 상업적으로 이용 가능하다. 포유류 세포, 효모, 및 곤충 세포 발현을 위한 진핵 발현 시스템은 당해 업계에 널리 알려져 있으며 상업적으로 이용 가능하다.Sequences encoding ZFP or ZFP fusion proteins to express the cloned gene or nucleic acid are usually subcloned into a vector having a promoter for direct transcription. Suitable bacterial promoters or prokaryotic promoters are well known in the art. . (Sambrook et al, Molecular Cloning , A Laboratory Manual (2nd ed 1989;.. 3 rd ed, 2001); Kriegler, Gene Transfer and Expression A Laboratory Manual (1990);. The in Current Protocols in Molecular Biology (Ausubel et The expression system kit for E. coli, Bacillus sp. , and Salmonella (Palva et al ., Gene 22: 229-235 (1983)) is useful, for example, Eukaryotic expression systems for mammalian cell, yeast, and insect cell expression are well known and commercially available in the art.

ZFP를 암호화하는 핵산의 직접 발현에 사용되는 프로모터는 응용분야에 따라 다르다. 예를 들면, ZFP 발현과 정제를 위해서는 보통 강력한 구조 프로모터를 사용한다. 반면, 유전자 조절을 위하여 ZFP를 생체 내 상에 도입할 때는 ZFP의 용도에 따라 구조 프로모터 또는 유도 프로모터를 사용한다. ZFP 도입을 위한 바람직한 프로모터는 약한 프로모터인데 예를 들면, HSV TK 또는 유사한 활성을 가지는 프로모터가 가능하다.The promoters used for the direct expression of the nucleic acid encoding the ZFP differ depending on the application. For example, strong expression promoters are usually used for ZFP expression and purification. On the other hand, when introducing ZFP into an in vivo image for gene regulation, a structural promoter or inducible promoter is used depending on the use of ZFP. A preferred promoter for ZFP introduction is a weak promoter, for example, a promoter having HSV TK or similar activity is possible.

프로모터는 보통 전사 촉진에 관계하는 요소, 예를 들어 저산소증 대응 요소, Gal4 대응 요소, 락 억제자 대응 요소 및 소형 분자 조절 시스템(예를 들어, tet 조절 시스템과 RU 486 시스템)를 포함한다. (Gossen & Bujard, PNAS 89: 5547 (1992); Oligino et al., Gene Ther. 5: 491-496 (1998); Wang et al., Gene Ther. 4: 432441 (1997); Neering et al., Blood 88: 1147-1155 (1996); Rendahl et al., Nat. Biotechnol. 16: 757-761 (1998)) MNDU3 프로모터도 사용 가능한데 특히 CD34+ 조혈 줄기 세포에서 활성이 높다. Promoters typically include elements involved in promoting transcription, such as hypoxic response elements, Gal4 counterparts, lock inhibitor counterparts, and small molecule regulatory systems (e.g., the tet regulatory system and the RU 486 system). (Gossen & Bujard, PNAS 89: . 5547 (1992); Oligino et al, Gene Ther 5: 491-496 (1998); Wang et al, Gene Ther 4:... 432441 (1997); Neering et al,. Blood 88: 1147-1155 (1996); Rendahl et al, Nat Biotechnol 16:... 757-761 (1998)) is also possible using MNDU3 promoter is highly active, especially in the CD34 + hematopoietic stem cells.

프로모터뿐만 아니라, 발현 벡터도 보통 숙주 세포에서(원핵 또는 진핵) 핵산이 발현되는데 필요한 모든 요소를 다 가지고 있는 전사 단위 또는 발현 카세트가 있다. 전형적인 발현 카세트는 전사된 유전정보, 전사 종결, 리보솜 결합 부위 또는 번역 종결의 효율적인 폴리아데닐화를 위하여 ZFP을 암호화하는 핵산 서열과 신호와 작동 연결된 프로모터를 포함한다. 카세트는 또한 인핸서 및 비상동성 스플라이싱 신호를 포함한다.Not only the promoter, but also the expression vector usually contains a transcription unit or expression cassette that has all the necessary elements for expression of the (prokaryotic or eukaryotic) nucleic acid in the host cell. Typical expression cassettes include a promoter linked to a signal sequence and a nucleic acid sequence encoding the ZFP for efficient polyadenylation of transcribed genetic information, transcription termination, ribosome binding site or translation termination. The cassette also includes an enhancer and a non-invasive splicing signal.

식물, 동물, 세균, 균류, 원생동물 등에서 ZFP 발현을 위해서는 유전자 정보를 세포로 도입하기 위하여 특별한 발현 벡터를 사용한다. (아래에 기술되는 발현 벡터 참조) 표준 세균 발현 벡터는 pBR322기반 플라스미드, pSKF, pET23D, 및 GST 와 LacZ같은 상업적으로 이용가능한 융합 발현 시스템으로 구성된 군 중에서 선택된 플라스미드를 포함한다. 대표적인 융합 단백질은 말토스 결합 단백질(MBP)이다. 상기 융합 단백질은 ZFP 정제를 위해서 사용된다. 분리를 용이하게 하고 발현 정도 및 세포내 위치를 확인하기 위해서 재조합 단백질에 에피토프 꼬리표, 예를 들어 c-myc 또는 FLAG을 첨가하였다. For the expression of ZFP in plants, animals, bacteria, fungi, protozoa, etc., a special expression vector is used to introduce gene information into cells. (See expression vectors described below.) Standard bacterial expression vectors include plasmids selected from the group consisting of pBR322-based plasmids, pSKF, pET23D, and commercially available fusion expression systems such as GST and LacZ. A representative fusion protein is maltose binding protein (MBP). The fusion protein is used for ZFP purification. An epitope tag, e. G. C-myc or FLAG, was added to the recombinant protein to facilitate separation and confirm the degree of expression and intracellular location.

진핵 바이러스의 조절 요소를 가진 발현 벡터는 보통 원핵 발현 벡터, 예를 들어 SV40 벡터, papilloma 바이러스 벡터 및 Epstein Barr 바이러스에서 기인한 벡터에 사용된다. 다른 대표적인 진핵 벡터로는 pMSG, pAV009/A+, pMT010/A+, pMAMneo-5, baculovirus pDSVE, 및 SV40 전반부 프로모터, SV40 후반부 프로모터, 메탈로티오네인 프로모터, 쥐 유선 종양 바이러스 프로모터, 라우스 살코마 바이러스 프로모터, 폴리헤드린 프로모터, 또는 진핵 세포에서 효과적으로 발현되는 프로모터의 지시로 단백질을 발현시킬 수 있는 모든 벡터를 포함한다.Expression vectors with regulatory elements of eukaryotic viruses are usually used in prokaryotic expression vectors, such as the SV40 vector, the papilloma virus vector, and the vector derived from the Epstein Barr virus. Other exemplary eukaryotic vectors include pMSG, pAV009 / A +, pMT010 / A +, pMAMneo-5, baculovirus pDSVE, and SV40 full-length promoter, SV40 trailing promoter, metallothionein promoter, murine mammary tumor virus promoter, Roussacomavirus promoter, A polyhedrin promoter, or any vector capable of expressing a protein under the direction of a promoter that is effectively expressed in eukaryotic cells.

어떤 발현 시스템은 안전하게 감염된 세포 라인을 선택하는 마커, 예를 들어 티미딘 키나제, 히그로마이신 B 포스포트랜스퍼라제 및 다하드로폴레이트 리덕타제를 가지고 있다. 폴리헤드린 프로모터 또는 강력한 발쿨로바이러스 프로모터의 지시로 ZFP 암호화 서열을 고효율 발현시키는 것은 곤충 세포에서 발쿨로바이러스벡터를사용하면 된다. Some expression systems have markers that select safely infected cell lines, such as thymidine kinase, hygromycin B phosphotransferase, and dahydrofolate reductase. Highly efficient expression of the ZFP coding sequence by a directed polyhedrin promoter or by a strong valproovirus promoter can be achieved in insect cells by the expression of Baculovirus Vector You can use it.

보통 발현 벡터를 구성하는 요소는 E. coli에서 작용하는 복제원점, 삽입된 플라스미드를 가진 세균의 선택을 위한 항생제 내성 유전자 및 재조합 서열의 삽입을 위한 제한 효소 자리를 포함한다. The elements that usually constitute expression vectors include the origin of replication in E. coli , antibiotic resistance genes for selection of bacteria with inserted plasmids, and restriction enzyme sites for insertion of recombination sequences.

대량으로 단백질을 발현하는 세균, 포유류, 효모 또는 곤충 세포 라인을 생성하기 위해 표준 감염 방법이 사용된 후 표준 방법에 의해 정제된다. (Colley et al., J. Biol. Chem. 264: 17619- 17622 (1989); Guide to Protein Purification, in Methods in Enzymology, vol. 182 (Deutscher, ed. , 1990)) 진핵 세포 및 원핵 세포의 형질전환은 표준 방법에 의해 수행된다. (Morrison, J. Bact. 132: 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 (Wu et al., eds, 1983)Standard infectious methods are used to generate bacterial, mammalian, yeast or insect cell lines that express large amounts of protein and then purified by standard methods. 182 (Deutscher, ed., 1990)). The expression of eukaryotic cells and prokaryotic cells was determined by the method described in Colley et al. , J. Biol. Chem. 264: 17619-17622 Conversion is performed by standard methods. (Morrison, J. Bact 132:. 349-351 (1977); Clark-Curtiss & Curtiss, Methods in Enzymology 101: 347-362 (Wu et al, eds, 1983).

당해 업계에 잘 알려진 어떤 방법으로도 외부 핵산을 숙주 세포로 도입할 수 있다. 상기 방법은 칼슘 포스페이트 감염, 폴리브린, 원형질체 융합, 전기영동법, 초음파 방법(예를 들어, 소노포레이션), 리포솜, 미세주사, 네이키드 DNA, 플라스미드 벡터, 바이러스 벡터, 에피솜 및 통합 게놈및 클론된 게놈 DNA, cDNA, 합성 DNA, 또는 외부 유전 물질을 숙주세포로 도입하는 방법으로 알려진 모든 방법을 포함한다. (상기의 Sambrook et al.참조) 선택된 단백질을 성공적으로 발현할 수 있는 숙주 세포로 하나 또는 두 개 이상의 유전자를 도입할 때만 특별한 유전 공학 공정이 필요하다.External nucleic acids can be introduced into host cells by any method well known in the art. Such methods include, but are not limited to, calcium phosphate infectivity, polybrene, protoplast fusion, electrophoresis, ultrasound (e.g., sonophoresis), liposomes, microinjection, naked DNA, plasmid vectors, viral vectors, And cloned genomic DNA, cDNA, synthetic DNA, or external genetic material into a host Lt; RTI ID = 0.0 > cell. ≪ / RTI > (See Sambrook et al ., Supra.) Only when introducing one or more genes into a host cell capable of successfully expressing the selected protein requires a special genetic engineering process.

융합 단백질을 암호화하는 핵산 및 세포 전달 Nucleic acid encoding the fusion protein and cell transfer

설계된 ZFP를 암호화하는 핵산을 세포(예를 들어, 포유류 세포) 및 표적 조직에 도입하기 위해서 통상적인 바이러스 및 비바이러스 기반 유전자 전달 방법을 사용할 수 있다. 생체 외 상에서 ZFP를 암호화하는 핵산을 세포로 도입하는데 상기 방법을 사용할 수 있다. 어떤 구체예에서, 생체 내또는 생체 외 유전자 치료법으로 ZFP를 암호화하는 핵산을 도입하였다. 비바이러스 벡터 전달 시스템은 DNA 플라스미드, 네이키드핵산, 및 리포솜 또는 폴록사머 등의 운반체와 결합한 핵산을 포함한다. 바이러스 벡터 전달 시스템은 세포로 전달된 후 에피솜 또는 통합 게놈이 되는 DNA 바이러스와 RNA 바이러스를 포함한다. 유전자 치료 절차를 개관하기 위해서는 Anderson, Science 256: 808-813 (1992); Nabel & Feigne, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6 (10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51 (1) : 31-44 (1995); Haddada et al., Current Topics in Microbiology and Immunology Doerfler & Bohm (eds) (1995); Yu et al., Gene Therapy 1: 13-26 (1994)을 참조할 수 있다.Conventional viral and non-viral-based gene delivery methods can be used to introduce nucleic acids encoding designed ZFPs into cells (e. G., Mammalian cells) and target tissues. The above method can be used to introduce nucleic acid encoding ZFP in vitro into cells. In some embodiments, in vivo Or a nucleic acid encoding ZFP was introduced by in vitro gene therapy. Non-viral vector delivery systems include DNA plasmids, Nucleic acids, and nucleic acids conjugated to carriers such as liposomes or poloxamers. The viral vector delivery system includes DNA viruses and RNA viruses that are delivered to cells and then become episomes or integrated genomes. To review gene therapy procedures, see Anderson, Science 256: 808-813 (1992); Nabel & Feigne, TIBTECH 11: 211-217 (1993); Mitani & Caskey, TIBTECH 11: 162166 (1993); Dillon, TIBTECH 11: 167-175 (1993); Miller, Nature 357: 455-460 (1992); Van Brunt, Biotechnology 6 (10): 1149-1154 (1988); Vigne, Restorative Neurology and Neuroscience 8: 35-36 (1995); Kremer & Perricaudet, British Medical Bulletin 51 (1): 31-44 (1995); Haddada et al ., Current Topics in Microbiology and Immunology Doerfler & Bohm (eds) (1995); Yu et al ., Gene Therapy 1: 13-26 (1994).

설계된 ZFP를 암호화하는 핵산의 비바이러스 전달 방법은 전지천공법, 리포펙션, 미세주사, 탄도법, 비로솜, 리포솜, 면역리포솜, 다가 양이온 또는 지질:핵산 접합체, 네이키드 DNA, 인공 바이론 및 화학물질 촉진 DNA 유입을 포함한다. 소소노포레이션, 예를 들어 Sonitron 2000 시스템(Rich-Mar)을 이용한 방법도 핵산의 전달에 사용할 수 있다.Non-viral delivery methods for nucleic acids encoding the designed ZFPs include but are not limited to cell perforation, lipofection, microinjection, ballistics, virosomes, liposomes, immunoliposomes, polyvalent cations or lipid: nucleic acid conjugates, naked DNA, Includes facilitated DNA entry. Sonophoresis, for example using the Sonitron 2000 system (Rich-Mar), can also be used for nucleic acid delivery.

다른 대표적인 핵산 전달 시스템은 Amaxa Biosystems(Cologne, Germany), Maxcyte, Inc.(Rockville, Maryland) 및 BTX Molesular Syetem(Holliston, MA)의 방법을 포함한다.Other representative nucleic acid delivery systems include the methods of Amaxa Biosystems (Cologne, Germany), Maxcyte, Inc. (Rockville, Maryland) and BTX Molesular Syetem (Holliston, MA).

리포펙션 방법은 미국특허 제 5,049,386호, 4,946,787호 및 4,897,355호에 명시되어 있으며 리포펙션 시약은 상업적으로 시판되고 있다. (예를 들어, TransfectamTM 및 Lipofectin TM) 폴리뉴클레오티드의 효과적인 리셉터-인식 리포펙션에 적당한 양이온 또는 중성 지질은 Felgner의 지질을 포함한다. (WO 91/17424 및 91/16024) 생체 외 도입을 통해 세포로, 생체 내도입을 통해 표적 조직으로 전달할 수 있다.Ripofection methods are described in U.S. Patent Nos. 5,049,386, 4,946,787 and 4,897,355, and the lipofection reagents are commercially available. Cation or neutral lipids suitable for effective receptor-recognition lipofection of polynucleotides (e.g., Transfectam ™ and Lipofectin ™ ) include Felgner's lipid. (WO 91/17424 and 91/16024) into cells via in vitro delivery, in vivo It can be delivered to the target tissue through introduction.

면역지질 복합체 등 표적 리포솜을 포함하는 지질:핵산 복합체의 제조 방법은 당해 업계에 잘 알려져 있다. (Crystal, Science 270: 404-410 (1995); Blaese et al., Cancer Gene Ther. 2: 291-297 (1995); Behr et al., Bioconjugate Chem. 5: 382389 (1994); Remy et al., Bioconjugate Chem. 5: 647-654 (1994); Gao et al., Gene Therapy 2: 710-722 (1995); Ahmad et al., Cancer Res. 52: 4817-4820 (1992); 미국특허 제4,186,183호, 제4,217,344호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호, 및 제4,946,787호) Methods for preparing lipid: nucleic acid complexes including target liposomes such as immunological lipid complexes are well known in the art. (Crystal, Science 270:. 404-410 (1995); Blaese et al, Cancer Gene Ther 2: 291-297 (1995); Behr et al, Bioconjugate Chem 5:... 382389 (1994); Remy et al. Gene Therapy 2: 710-722 (1995); Ahmad et al ., Cancer Res. 52: 4817-4820 (1992); U.S. Patent No. 4,186,183 No. 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, and 4,946,787)

설계된 ZFP를 암호화하는 핵산 전달을 위한 RNA 또는 DNA 바이러스 기반 시스템을 사용하면 바이러스가 특이 세포를 표적하고 핵내로 잠입하는 장점이 있다. 바이러스 벡터는 환자에게(생체 내) 또는 직접 투여 또는 생체 외 상에서 세포에 직접 처리할 수 있고 변성된 세포를 환자에게(생체 외) 투여할 수도 있다. ZFP 전달을 위한 통상적인 바이러스 기반 시스템은 유전자 전달을 위한 레트로바이러스 벡터, 렌티바이러스 벡터, 아데노바이러스 벡터, 아데노 부속 바이러스 벡터, 백시니아 벡터, 및 단순 포진 바이러스 벡터를 포함하지만 여기에 한정되지는 않는다. 아데노 바이러스, 렌티바이러스아데노 부속 바이러스를 이용한 유전자 전달 방법은 숙주 게놈과 통합이 가능하여 종종 삽입된 트랜스젠을 오랜 기간 발현한다. 또한, 많은 다른 세포와 표적 조직에서 고효율 형질도입이 관찰된다.Using an RNA or DNA virus-based system for nucleic acid delivery that encodes a designed ZFP has the advantage that the virus targets specific cells and infiltrates into the nucleus. The viral vector may be directly administered to the patient (in vivo) or directly or directly to the cells in vitro, and the modified cells may be administered to the patient (in vitro). Typical viral based systems for delivery of ZFP include, but are not limited to, retroviral vectors, lentiviral vectors, adenoviral vectors, adeno-associated viral vectors, vaccinia vectors, and herpes simplex virus vectors for gene delivery. Adenovirus, lentivirus And Gene delivery using adeno-associated viruses can be integrated with the host genome, often expressing the inserted transgene for a long time. In addition, high efficiency transduction is observed in many different cells and target tissues.

레트로바이러스의 친화성은 외부 외피 단백질과 일체화함으로써 변할 수 있어 표적 세포의 종류를 확대시킬 수 있다. 렌티바이러스 벡터는 비분열 세포를 형질도입 또는 감염시켜서 고바이러스 역가를 생성하는 레트로바이러스 벡터이다. 표적 조직에 따라 레트로바이러스 유전자 잔달 시스템이 결정된다. 레트로바이러스 벡터는 6-10 kb 외부 서열을 포장할 수 있는 시스 액팅 긴 말단 반복을 포함한다. 벡터의 복제와 포장을 위해 충분한 최소의 시스 액팅 LTR은 영구적인 트랜스젠 발현을 위해 치료 유전자가 표적 세포로 통합되도록 사용할 수 있다. 널리 사용되는 레트로바이러스 벡터는 쥐 백혈병 바이러스(MuLV), 긴팔원숭이 백혈병 바이러스(GaLV), 원숭이 면역결핍 바이러스(SIV), 인간 면역결핍 바이러스(HIV), 및 그들의 조합 바이러스를 포함한다. (Buchscher et al., J. Virol. 66: 2731-2739 (1992); Johann et al., J. Virol. 66: 1635-1640 (1992); Sommerfelt et al., Virol. 176: 58-59 (1990); Wilson et al., J. Virol. 63: 2374-2378 (1989); Miller et al., J. Virol. 65: 2220- 2224 (1991); PCT/US94/05700)The affinity of the retrovirus can be changed by integrating with the outer coat protein, and the kind of the target cell can be enlarged. Lentiviral vectors are retroviral vectors that transduce or infect non-dividing cells to produce viral titer. Depending on the target tissue, the retroviral gene locus system is determined. The retroviral vector contains a long acting terminal repeat that can package 6-10 kb of external sequence. A minimal minimal amount of transactivation LTR for vector replication and packaging can be used to integrate therapeutic genes into target cells for permanent transgene expression. Widely used retroviral vectors include murine leukemia virus (MuLV), gibbon monkey leukemia virus (GaLV), monkey immunodeficiency virus (SIV), human immunodeficiency virus (HIV), and combinations thereof. (Buchscher et al. , J. Virol. 66: 2731-2739 (1992), Johann et al., J. Virol. 66: 1635-1640 (1992), Sommerfelt et al. , Virol. 176: 58-59 1990); Wilson et al, J. Virol 63: 2374-2378 (1989); Miller et al, J. Virol 65:.... 2220- 2224 (1991); PCT / US94 / 05700)

ZFP 융합 단백질을 일시적으로 발현하는 경우에는 아데노바이러스 기반 시스템을 더욱 많이 사용한다. 아데노바이러스계 벡터는 많은 세포들에서 고효율로 형질도입을 일으키지만 세포 분열을 필요로 하지 않는다. 상기 벡터를 이용하면 높은 역가와 높은 수준의 발현을 얻을 수 있다. 상기 벡터는 비교적 간단한 시스템에서 대량으로 생산될 수 있다. 또한 아데노 부속 바이러스(AAV) 벡터는 표적 핵산을 가진 세포로 형질도입하는데 이용되는데, 예를 들면 생체 외 상에서 핵산과 펩티드의 생산 및 생체 내 및 생체 외 상에서 유전자 치료에 이용된다. (West et al., Virology 160: 38-47(1987); 미국특허 제4,797,368호; WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. Invest. 94: 1351 (1994) 참조) 재조합 AAV 벡터의 구성은 이미 많은 출판물에 명시되어 있다. (미국특허 제 5,173,414호; Tratschin et al., Mol. Cell. Biol. 5:3251-3260(1985); Tratschin, et al., Mol. Cell. Biol. 4: 20722081 (1984); Hermonat & Muzyczka, PNAS 81 : 6466-6470 (1984); Samulski et al., J Virol. 63: 038223828 (1989))Adenovirus-based systems are used more often when transiently expressing ZFP fusion proteins. Adenoviral vectors result in high efficiency transduction in many cells but do not require cell division. High titers and high levels of expression can be obtained using these vectors. The vector can be produced in large quantities in a relatively simple system. Adeno-associated virus (AAV) vectors are also used to transduce cells with the target nucleic acid, for example, in vitro, in the production of nucleic acids and peptides and in vivo And in vivo gene therapy. (West et al. , Virology 160: 38-47 (1987); U.S. Patent 4,797,368; WO 93/24641; Kotin, Human Gene Therapy 5: 793-801 (1994); Muzyczka, J. Clin. : 1351 (1994)). The construction of recombinant AAV vectors has already been documented in many publications. (U.S. Patent No. 5,173,414; Tratschin et al ., Mol. Cell. Biol. 5: 3251-3260 (1985); Tratschin, et al. , Mol Cell Biol. 4: 20722081 (1984); Hermonat & Muzyczka, PNAS 81: 6466-6470 (1984); Samulski et al. , J Virol 63: 038223828 (1989))

임상 실험에서는 적어도 6개의 바이러스 벡터를 이용한 유전자 전달 방법이 이용되고 있는데 형질도입제를 생성하는 도움 세포 라인에 유전자를 삽입함으로써 결함있는 벡터를 보완하는 접근법이다. In clinical trials, at least six viral vectors have been used for gene transfer, which is a complementary approach to a defective vector by inserting a gene into the helper cell line that produces the transducer.

pLASN과 MFG-S는 임상 실험에서 사용되고 있는 레트로바이러스의 예이다 (Dunbar et al., Blood 85: 3048-305 (1995); Kohn et al., Nat. Med. 1: 1017-102 (1995); Malech et al., PNAS 94 : 22 12133-12138 (1997)) PA317/pLASN는 유전자 치료에 사용된 최초의 치료 벡터이다. (Blaese et al., Science 270: 475-480 (1995)) MFG-S 포장 벡터의 형질도입 효율은 50% 또는 그 이상을 보였다. (Ellem et al., Immunol Immunother. 44 (1) : 10- 20 (1997); Dranoff et al., Hum. Gene Ther. 1: 111-2 (1997))pLASN and MFG-S are examples of retroviruses that have been used in clinical trials (Dunbar et al. , Blood 85: 3048-305 (1995); Kohn et al ., Nat. Med. 1: 1017-102 (1995); Malech et al. , PNAS 94: 22 12133-12138 (1997)) PA317 / pLASN is the first therapeutic vector used in gene therapy. (Blaese et al. , Science 270: 475-480 (1995)). The transfection efficiency of the MFG-S packaging vector was 50% or more. (Ellem et al. , Immunol Immunother. 44 (1): 10-20 (1997); Dranoff et al. , Hum. Gene Ther.

재조합 아데노 부속 바이러스 벡터(rAAV)는 결함 있고 비병원성인 제2형 파르보바이러스 아데노 부속 바이러스를 기반으로 하는 유망한 대체 유전자 전달 시스템이다. 모든 벡터는 트랜스젠 발현 카세트 측면에 위치하는 AAV 145 bp 역위 말단 반복을 보유한 플라스미드로부터 유래한다. 형질도입된 세포의 게놈으로 통합에 기인하는 효율적인 유전자 전달 및 안정한 트랜스젠 전달은 상기 벡터 시스템의 큰 장점이다. (Wagner et al., Lancet 351: 9117 17023 (1998); Kearns et al., Gene Ther. 9: 748-55 (1996))Recombinant adeno-associated viral vectors (rAAV) are promising alternative gene delivery systems based on defective, non-pathogenic, type 2 parvovirus adeno-associated viruses. All vectors are derived from a plasmid carrying an AAV 145 bp inverted terminal repeat located at the side of the transgene expression cassette. Efficient gene transfer and stable transgeneration due to integration into the genome of transduced cells is a major advantage of the vector system. (Wagner et al. , Lancet 351: 9117 17023 (1998); Kearns et al. , Gene Ther. 9: 748-55 (1996)

복제 결핍 재조합 아데노바이러스 벡터(Ad)는 고역가로 생산될 수 있으며 많은 세포들을 감염시킬 수 있다. 대부분의 아데노바이러스 벡터는 트랜스젠이 Ad E1a 유전자, Ad E1b 유전자, 및 Ad E3 유전자를 치환하도록 설계되고 실제로 복제 결함 벡터가 트랜스에 제거된 유전자 기능을 제공하는 인간 293 세포에 전달된다. Ad 벡터는 간, 신장 및 근육에서 발견되는 비분열, 분화 세포를 포함하는 많은 형태의 생체 내조직에 형질도입할 수 있다. 통상적인 Ad 벡터는 큰 운반 능력을 가진다. 임상 실험에서 Ad 벡터의 사용예는 근육주사를 통한 항종양 면역화를 위한 폴리뉴클레오티드 치료를 포함한다. (Sterman et al., Hum. Gene Ther. 7: 1083-9 (1998)) 임상 실험에서 아데노바이러스 벡터를 이용한 유전자 전달의 사용예는 다음과 같다.;Rosenecker et al., Infection 24: 1 5-10 (1996); Sterman et al., Hum. Gene Ther. 9: 7 1083-1089 (1998); Welsh et al., Hum. Gene Ther. 2: 205-18 (1995); Alvarez et al., Hum. Gene Ther. 5: 597-613 (1997); Topf et al., Gene Ther. 5: 507-513 (1998); Sterman et al., Hum. Gene Ther. 7: 1083-1089 (1998)))Replication deficient recombinant adenovirus vector (Ad) can be produced at high frequency and can infect many cells. Most adenoviral vectors are designed to displace the Ad E1a gene, the Ad E1b gene, and the Ad E3 gene, and are actually delivered to human 293 cells, which provide gene function in which the replication defect vector is removed in the trans. Ad vectors can be used in many forms of in vivo, including non-dividing, differentiated cells found in liver, kidney and muscle Can be transduced into tissues. A typical Ad vector has a large carrying capacity. Examples of use of Ad vectors in clinical trials include polynucleotide treatment for antitumor immunization via intramuscular injection. (Sterman et al ., Hum. Gene Ther. 7: 1083-9 (1998).) Examples of the use of gene delivery using adenoviral vectors in clinical trials are as follows: Rosenecker et al ., Infection 24: 10 (1996); Sterman et al. , Hum. Gene Ther. 9: 7 1083-1089 (1998); Welsh et al. , Hum. Gene Ther. 2: 205-18 (1995); Alvarez et al. , Hum. Gene Ther. 5: 597-613 (1997); Topf et al. , Gene Ther. 5: 507-513 (1998); Sterman et al. , Hum. Gene Ther. 7: 1083-1089 (1998)))

포장 세포는 숙주 세포를 감염시킬 수 있는 바이러스 입자를 형성하는데 사용된다. 상기 세포는 아데노바이러스를 포장하는 293 세포와 레트로바이러스를 포장하는 y 2 세포 또는 PA317 세포를 포함한다. 유전자 치료에 사용되는 바이러스 벡터는 보통 핵산 벡터를 바이러스 입자에 포장하는 생산자 세포 라인에 의해 생산된다. 벡터는 보통 포장과 숙주로 통합되기 위해 필요한 최소의 바이러스 서열만 가지며 다른 바이러스 서열은 발현될 단백질을 암호화하는 발현 카세트에 의해 치환된다. 손실된 바이러스 기능은 포장 세포 라인에 의해 트랜스에 공급된다. 예를 들면, 유전자 치료에 사용되는 AAV 벡터는 포장과 숙주 게놈으로 통합되는데 필요한 AAV 게놈의 역위 말단 반복(ITR) 서열만 가지고 있다. 바이러스 DNA는 다른 AAV 유전자를 암호화하는 도움 플라스미드, 즉 rep 및 cap를 가지고 있지만 ITR 서열은 없다. 아데노바이러스에 의한 오염은 AAV보다 열에 더욱 민감하므로 열처리를 하여 줄일 수 있다.Packaged cells are used to form virus particles that can infect host cells. The cells include 293 cells that pack the adenovirus and y2 cells that package the retrovirus or PA317 cells. Viral vectors used in gene therapy are usually produced by producer cell lines that pack nucleic acid vectors into viral particles. The vector usually has only the minimum viral sequence necessary to integrate into the package and the host and the other viral sequence is replaced by an expression cassette encoding the protein to be expressed. The lost virus function is supplied to the trans by the packaging cell line. For example, the AAV vector used for gene therapy has only the inverted terminal repeat (ITR) sequence of the AAV genome necessary for packaging and integration into the host genome. The viral DNA has helper plasmids encoding other AAV genes, rep and cap , but no ITR sequences. Adenovirus contamination is more sensitive to heat than AAV and can be reduced by heat treatment.

많은 유전자 치료 응용에서, 유전자 치료 벡터가 특별한 조직으로 높은 특이성을 가지고 전달되는 것이 바람직하다. 따라서, 바이러스 표면에 바이러스 외피 단백질을 가진 융합 단백질로서 리간드를 발현함으로써 바이러스 벡터는 주어진 세포에 특이성을 갖도록 변성될 수 있다. 관심 세포에 존재한다고 알려진 리셉터와 친화성을 가지는 리간드를 선택한다. 예를 들어, 생쥐 백혈병 바이러스는 gp70과 융합된 인간 헤레굴린을 발현하도록 변성될 수 있고 재조합 바이러스는 인간 표피 성장 인자 리셉터를 발현하는 특정 인간 유방암 세포를 감염시킬 수 있다. (Han et al., Proc. Natl. Acad. Sci. USA 92 : 9747-9751 (1995)) 이 이론은 표적 세포가 리셉터를 발현하고 바이러스가 세포 표면 리셉터에 대한 리간드를 포함하는 융합 단백질을 발현하는 다른 바이러스 표적 세포 쌍으로 확장될 수 있다. 예를 들면, 세포 리셉터와 특이적인 결합 친화도를 가지는 항체 단편(예를 들어, FAB 또는 Fv)을 나타내도록 섬유상 파지를 설계할 수 있다. 상기에 바이러스 벡터에 관하여 주로 기술했지만 동일한 이론을 비바이러스 벡터에도 적용할 수 있다. 특이한 표적 세포에 의해 잘 유입되는 서열을 가지도록 상기 벡터를 설계할 수 있다.In many gene therapy applications, it is desirable that the gene therapy vector be delivered with a high specificity to a particular tissue. Thus, by expressing a ligand as a fusion protein with a viral coat protein on the surface of the virus, the viral vector can be modified to have specificity for a given cell. A ligand that has affinity for the receptor known to be present in the cell of interest is selected. For example, murine leukemia viruses can be modified to express human allergens fused with gp70, and recombinant viruses can infect certain human breast cancer cells expressing human epidermal growth factor receptor. (Han et al, Proc Natl Acad Sci USA 92:..... 9747-9751 (1995)) The theory is that the target cell expressing the receptor and the virus expresses a fusion protein comprising a ligand for a cell surface receptor Can be extended to other viral target cell pairs. For example, a fibrous phage can be designed to represent an antibody fragment (e.g., FAB or Fv) with a specific binding affinity for a cell receptor. Although primarily described above for viral vectors, the same theory can be applied to non-viral vectors as well. The vector may be designed to have a sequence that is well introduced by a specific target cell.

보통 시스템 투여(예를 들어, 정맥주입, 복막내 주입, 근육 주입, 피하 주입, 또는 두 개 주입) 또는 하기에 기술될 국소 사용법을 이용하여 환자 개인에게 투입함으로써, 생체 내 상에서 유전자 치료 벡터를 전달할 수 있다. 따라서, 환자 개인에서 떼어낸 세포(예를 들어, 림프구, 골수 흡입, 조직 생체검사 등) 또는 기증 조혈 줄기 세포 등 생체 외 세포에 벡터를 전달한 다음 벡터와 일체화한 세포를 선별한 후 환자에게 재이식한다.By delivering the gene therapy vector in vivo, usually by system administration (e.g., intravenous infusion, intraperitoneal injection, intramuscular injection, subcutaneous infusion, or two infusion) or by topical use as described below, . Therefore, after delivering a vector to an ex vivo cell such as a cell (for example, lymphocyte, bone marrow aspirate, tissue biopsy or the like) or donated hematopoietic stem cell removed from an individual patient, cells integrated with the vector are selected, do.

진단, 연구, 또는 감염된 세포를 숙주에 재주입을 통한 치료를 위한 생체 외 세포 감염 기술은 당해 업계에 잘 알려져 있다. 바람직한 구체예는 대상 생물체로부터 세포를 분리하고 ZFP 핵산(유전자 또는 cDNA)으로 감염시킨 후 대상 생물체로 재주입하는 것이다. 생체 외감염에 적합한 세포 유형은 당해 업계에 잘 알려져 있다. (Freshney et al., Culture of Animal Cells, A Manual of Basic Technique (3rd ed. 1994) 환자로부터 세포를 분리하고 배양하는 방법은 인용된 참고문헌 참조) In vitro cell infectivity techniques for diagnosis, research, or treatment through host regeneration of infected cells are well known in the art. A preferred embodiment is to separate cells from the subject organism and infect the subject with ZFP nucleic acid (gene or cDNA) and re-infuse into the subject organism. In vitro Cell types suitable for infection are well known in the art. (See references cited for methods of isolating and cultivating cells from patients with freshman et al., Culture of Animal Cells , A Manual of Basic Technique (3rd ed., 1994)

어떤 구체예에서, 세포 감염과 유전자 치료를 위한 생체 외 과정에서 줄기 세포를 사용하고 있다. 줄기 세포를 이용하는 장점은 골수에 이식될 포유류(세포 도너)에 줄기세포를 도입하거나 생체 외 상에서 다른 세포 유형으로 분화할 수 있다는 것이다. GM CSF, IFN y, TNF a 등의 사이토카인을 이용하여 CD34+ 세포를 임상적으로 중요한 면역 세포로 분화시키는 방법은 밝혀졌다. (Inaba et al., J. Exp. Med. 176: 1693-1702 (1992))In some embodiments, stem cells are used in an in vitro process for cell infection and gene therapy. The advantage of using stem cells is that stem cells can be introduced into the mammal (cell donor) to be implanted in the bone marrow, or differentiated into different cell types in vitro. GM CSF, IFN y, and TNF a to differentiate CD34 + cells into clinically important immune cells. (Inaba et al., J. Exp. Med., 176: 1693-1702 (1992)).

형질도입과 분화를 위해 알려진 방법을 이용하여 줄기세포를 분리하였다. 예를 들면, CD4+ 및 CD8+ (T 세포), CD45+ (panB 세포), GR-1 (과립구), lad (분화된 항체 표현 세포) 등 원하지 않는 세포와 결합하는 항체와 함께 골수세포를 회전하여 골수세포로부터 줄기세포를 분리하였다. (Inaba et al., J. Exp. Med. 176:1693 -1702 (1992))Stem cells were isolated using known methods for transduction and differentiation. For example, bone marrow cells are rotated with antibodies that bind to undesired cells such as CD4 + and CD8 + (T cells), CD45 + (panB cells), GR-1 (granulocyte), lad . (Inaba et al., J. Exp. Med., 176: 1693-1702 (1992)),

생체 내상에서 세포의 형질도입을 위하여 치료용 ZFP 핵산을 가지는 벡터(예를 들어, 레트로바이러스, 아데노바이러스, 리포솜, 등)을 직접 생물체에 투여할 수 있다. 또한, 네이키드 DNA를 투여할 수도 있다. 분자를 도입하기 위해서는 혈액이나 조직과 접촉할 수 있는 어떤 경로도 가능한데 주사, 주입, 국소 사용 및 전기영동법을 포함하지만 여기에 한정되지는 않는다. 핵산을 투여하는 적당한 방법은 당해 업계에 잘 알려져 있고 특정 조성물을 투여하는데 사용할 수 있는 경로가 하나 이상이지만 보통 특별한 경로가 다른 경로보다 더욱 효과적이다.In vivo (E. G., Retrovirus, adenovirus, liposomes, etc.) having therapeutic ZFP nucleic acids can be directly administered to the organism for transduction of the cells on the host cell. In addition, naked DNA may be administered. Any pathway that can contact the blood or tissue to introduce the molecule is possible, including, but not limited to, injection, infusion, topical use and electrophoresis. Suitable methods of administering nucleic acids are well known in the art and include one or more routes that can be used to administer a particular composition, but usually the particular route is more effective than the other route.

예를 들면, DNA를 조혈 줄기세포에 도입하는 방법은 미국특허 제5,928,638호에 명시되어 있다. 조혈 줄기세포, 예를 들어 CD34+ 세포에 트랜스젠을 도입하는데 유용한 벡터는 아데노바이러스 Type 35를 포함한다.For example, a method for introducing DNA into hematopoietic stem cells is disclosed in U.S. Patent No. 5,928,638. The vector useful for introducing transgenes into hematopoietic stem cells, e. G., CD34 + cells, includes adenovirus Type 35.

면역세포(예를 들어, T-세포)에 트랜스젠을 도입하는데 적합한 벡터는 비-통합 렌티바이러스 벡터를 포함한다. 예를 들어, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93:11382-11388; Dull et al. (1998) J. Virol. 72:8463-8471; Zuffery et al. (1998) J. Virol. 72:9873-9880; Follenzi et al. (2000) Nature Genetics 25:217-222를 참조한다.Suitable vectors for introducing transgenes into immune cells (e. G., T-cells) include non-integrated lentiviral vectors. For example, Ory et al. (1996) Proc. Natl. Acad. Sci. USA 93: 11382-11388; Dull et al. (1998) J. Virol. 72: 8463-8471; Zuffery et al. (1998) J. Virol. 72: 9873-9880; Follenzi et al. (2000) Nature Genetics 25: 217-222.

약제학적으로 허용가능한 담체는 조성물을 투여하는 방법뿐만 아니라 투여되는 조성물에 좌우된다. 따라서, 가능한 약제학적 조성물의 제형은 다음에 기술되는 것처럼 매우 다양하다. (Remington's Pharmaceutical Sciences, 17th ed., 1989)The pharmaceutically acceptable carrier depends on the composition to be administered as well as the method of administration of the composition. Thus, the formulation of the possible pharmaceutical compositions is very varied as described below. ( Remington ' s Pharmaceutical Sciences , 17th ed., 1989)

다양한 통상적인 기술을 통하여 원하는 식물 숙주 게놈에 DNA 구성체를 도입할 수 있다. 상기 기술의 개관을 위해서는, 예를 들어 Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, N.Y.) Section VIII, pp. 421-463; 그리고 Grierson & Corey, Plant Molecular Biology (1988,2d Ed.), Blackie, London, Ch. 7 ~ 9를 참조할 수 있다. 예를 들면, 전기영동법 및 식물세포 원형질체의 미세주사 기술을 이용하여 DNA 구성체를 식물세포의 게놈 DNA에 도입하거나 DNA 입자 폭격 등 유전자도입(biolistic) 방법을 이용하여 직접 식물조직에 DNA 구성체를 도입할 수 있다. (Klein et al (1987) Nature 327: 70-73)DNA constructs can be introduced into the desired plant host genome through a variety of conventional techniques. For an overview of the technique, see, for example, Weissbach & Weissbach Methods for Plant Molecular Biology (1988, Academic Press, NY) Section VIII, pp. 421-463; And Grierson & Corey, Plant Molecular Biology (1988, 2d Ed.), Blackie, London, Ch. 7 to 9 can be referred to. For example, by introducing a DNA construct into a genomic DNA of a plant cell using an electrophoresis method and a microinjection technique of a plant cell protoplast or directly introducing a DNA construct into a plant tissue using a biolistic method such as DNA particle bombardment . (Klein et al (1987) Nature 327: 70-73)

또한, DNA 구성체는 적당한 T DNA 측면 영역과 결합할 수도 있고 통상적인 Agrobacterium tumefaciens 숙주 벡터에 도입될 수도 있다. 이중벡터의 무력화 및 사용을 포함하여 Agrobacterium tumefaciens 중재 형질전환기술은 과학논문에 잘 기술되어 있다. (Horsch et al (1984) Science 233 : 496-498, 및 Fraley et al (1983) Proc. Nat'l. Acad. Sci. USA 80: 4803) 이중 T DNA 벡터를 이용하여 세포를 세균으로 감염시키거나(Bevan (1984) Nuc. Acid Res. 12: 8711-8721) 또는 공동 배양할 때(Horsch et al (1985) Science 227: 1229-1231)) Agrobacterium tumefaciens 숙주의 발병기능은 식물숙주 안으로 구성체와 마커가 삽입되었음을 직접 지시할 수 있다. 일반적으로, 쌍떡잎식물을 변형하기 위해서 Agrobacterium 형질전환 시스템을 사용한다. (Bevan et al (1982) Ann. Rev. Genet 16: 357-384; Rogers et al (1986) Methods Enzymol. 118: 627-641) 또한 DNA를 외떡잎식물 및 식물세포에 형질전환뿐만 아니라 전달하기 위해서도 Agrobacterium 형질전환 시스템을 사용한다. (Hernalsteen et al (1984) EMBO J 3: 3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311: 763-764; Grimsley et al (1987) Nature 325: 1677-179; Boulton et al (1989) Plant Mol. Biol. 12: 31-40; 그리고 Gould et al (1991) Plant Physiol. 95: 426-434)In addition, the DNA construct may bind to the appropriate T DNA lateral region and may be introduced into a conventional Agrobacterium tumefaciens host vector. double Agrobacterium tumefaciens mediated transformation techniques, including the disruption and use of vectors, are well described in scientific papers. (Horsch et al (1984) Science 233: 496-498, and Fraley et al (1983) Proc Nat'l Acad Sci USA 80: 4803) (1987) Science 227: 1229-1231). The onset of Agrobacterium tumefaciens host is characterized by the presence of constituents and markers in the host plant, such as Bevan (1984) Nuc. Acid Res. 12: 8711-8721 or co-cultivated (Horsch et al It can directly indicate that it has been inserted. Generally, an Agrobacterium transformation system is used to transform a dicotyledonous plant. (Bevan et al (1982) Ann Rev. Genet 16: 357-384; Rogers et al (1986) Methods Enzymol 118:.. 627-641) In addition, Agrobacterium also for transmission, as well as transforming DNA to monocotyledonous plants and plant cells Transformation systems are used. Grimsley et al (1987) Nature 325: 1677-179; Boulton et al (1989); Hoyal et al. (1984) EMBO J. 3: 3039-3041; Hooykass-Van Slogteren et al (1984) Nature 311: 763-764; Plant Mol. Biol. 12: 31-40; and Gould et al (1991) Plant Physiol. 95: 426-434)

대체 유전자 전달 및 형질전환 방법은 칼슘 중재 벌거숭이 DNA의 유입, 폴리에틸렌글리콜(PEG) 중재 벌거숭이 DNA의 유입, 또는 전기영동법 중재 벌거숭이 DNA의 유입(Paszkowski et al. (1984) EMBO J 3: 2717-2722, Potrykus et al. (1985) Molec. Gen. Genet. 199: 169-177; Fromm et al. (1985) Proc. Nat. Acad. Sci. USA 82: 5824-5828; 그리고 Shimamoto (1989) Nature 338: 274-276) 및 식물조직의 전기영동법을(D'Halluin et al. (1992) Plant Cell 4: 1495-1505) 통한 원형질체 형질전환을 포함하지만 여기에 한정되는 것은 아니다. 식물세포 형질전환을 위한 또 다른 방법은 미세 주사, 탄화 규소 중재 DNA 유입(Kaeppler et al. (1990) Plant Cell Reporter 9: 415-418) 및 고점도 폭격을(Klein et al. (1988) Proc. Nat. Acad. Sci. USA 85: 4305-4309; 그리고 Gordon-Kamm et al. (1990) Plant Cell 2: 603-618) 포함한다. Alternative gene delivery and transformation methods include the introduction of calcium-mediated nematode DNA, the introduction of polyethylene glycol (PEG) mediated nematode DNA, or electrophoresis mediated nematode DNA entry (Paszkowski et al. (1984) EMBO J 3: 2717-2722, Potrykus et al (1985) Molec Gen. Genet 199:........ 169-177; Fromm et al (1985) Proc Nat Acad Sci USA 82: 5824-5828; and Shimamoto (1989) Nature 338: 274 -276) and protoplast transformation through plant tissue electrophoresis (D'Halluin et al. (1992) Plant Cell 4: 1495-1505). Plant Cell Another method for transformation microinjection, silicon carbide mediated DNA introduced.. (Kaeppler et al (1990 ) Plant Cell Reporter 9:. 415-418) and the highly viscous bombardment (Klein et al (1988) Proc Nat USA 85: 4305-4309; and Gordon-Kamm et al. (1990) Plant Cell 2: 603-618).

외래 서열을 식물세포 게놈의 미리 계산된 위치에 삽입하기 위하여 명시된 방법과 조성물을 이용할 수 있다. 식물 게놈에 도입된 트랜스젠의 발현이 통합 부위에 의존하는 한 상기 방법과 조성물은 유용하다. 따라서, 표적화된 재조합에 의하여 영양소, 항생제, 또는 치료 분자를 암호화하는 유전자를 발현하기 용이한 식물 게놈의 영역에 삽입할 수 있다.The specified methods and compositions can be used to insert foreign sequences into pre-calculated locations of the plant cell genome. The above methods and compositions are useful as long as the expression of the transgenes introduced into the plant genome depends on the integration site. Thus, the gene encoding the nutrient, antibiotic, or therapeutic molecule can be inserted into the region of the plant genome that is easy to express by targeted recombination.

형질전환된 유전형을 포함하여 원하는 표현형을 가지는 식물을 재생하기 위해 상기의 형질전환기술을 이용하여 형질전환된 식물세포를 배양할 수 있다. 재생기술은 조직배양 성장 배지에 조작하는 식물호르몬에 영향을 받으며, 보통 원하는 뉴클레오티드 서열과 함께 도입된 살생물제 또는 제초제 마커에 영향을 받는다. 배양된 원형질체로부터 식물재생은 다음에 기술되어 있다; Evans et al., "Protoplasts Isolation and Culture" Handbook of Plant Cell Culture, pp. 124-176, Macmillian Publishing Company, New York, 1983; 그리고 Binding, Regeneration of Plants, Plant Protoplasts, pp. 21-73, CRC Press, Boca Raton, 1985. 식물캘러스, 외식, 기관, 화분, 배, 또는 그들의 일부분에서도 재생될 수 있다. 상기 재생기술은 Klee et al (1987) Ann. Rev. of Plant Phys. 38: 467-486에 기술되어 있다.Transgenic plant cells can be cultured using the above transformation techniques to regenerate plants having the desired phenotype, including transformed genotypes. Regeneration techniques are influenced by plant hormones manipulated in tissue culture growth media and are usually affected by biocides or herbicide markers introduced with the desired nucleotide sequence. Plant regeneration from cultured protoplasts is described below; Evans et al., "Protoplasts Isolation and Culture" Handbook of Plant Cell Culture , pp. 124-176, Macmillian Publishing Company, New York, 1983; And Binding, Regeneration of Plants, Plant Protoplasts , pp. 21-73, CRC Press, Boca Raton, 1985. It can also be regenerated in plant callus, eating out, organs, pots, pears, or parts thereof. The regeneration technique is described by Klee et al (1987) Ann. Rev. of Plant Phys. 38: 467-486.

식물세포에 도입된 핵산은 원하는 기질을 제공하기 위해 어떤 식물에도 사용될 수 있다. 본 발명에 명시된 핵산 구성체와 상기에 기술한 형질전환 방법을 이용하여 원하는 생리학적 및 작물학적 성질을 가지도록 많은 식물과 식물세포를 설계할 수 있다. 보다 바람직한 양태는, 설계되는 표적 식물과 식물세포가 외떡잎식물 및 쌍떡잎식물을 포함하지만 여기에 한정되지는 않는다. 예를 들면, 곡물(예, 밀, 옥수수, 쌀, 기장, 보리, 등), 과일(예, 토마토, 사과, 배, 딸기, 오렌지, 등), 마초(예, 자주개나리, 등), 근채(예, 당근, 감자, 사탕무, 참마, 등) 및 엽채(예, 상추, 시금치, 등); 종자식물(예, 페튜니아, 장미, 국화, 등), 침엽수 및 소나무(예, 전나무, 가문비나무, 등); 식물치료에 사용되는 식물(예, 중금속 축적 식물,등); 그리고 유지를(예, 해바라기씨, 평지씨, 등) 포함하는 수확물 및 실험 목적으로 사용되는 식물을(예, 아라비돕시스) 포함하지만 여기에 한정되지는 않는다. 따라서, 본 발명에 명시된 방법과 조성물은 아스파라거스 속, 아베나 속, 브라시카 속, 시트러스 속, 시트럴러스 속, 캡시쿰 속, 쿠쿠르비타 속, 다우쿠스 속, 글리신 속, 호르데움 속, 락투카 속, 리코페르시콘 속, 말루스 속, 마니호트 속, 니코티아나 속, 오리자 속, 페르세아 속, 피슘 속, 피러스 속, 프루너스 속, 라파너스 속, ㅅ세칼레 속, 솔라넘 속, 소르검 속, 트리티쿰 속, 비티스 속, 비그나 속, 및 제아 속의 종들을 포함하지만 여기에 한정되지는 않는다. Nucleic acid introduced into plant cells can be used on any plant to provide the desired substrate. Many plant and plant cells can be designed to have desired physiological and plant characteristics using the nucleic acid constructs described herein and the transformation methods described above. More preferred embodiments include, but are not limited to, target plants and plant cells to be designed, including monocotyledonous and dicotyledonous plants. For example, there may be a variety of foods such as cereals (eg wheat, corn, rice, millet, barley, etc.), fruits (eg tomatoes, apples, pears, strawberries, (Eg, carrots, potatoes, sugar beets, yams, etc.) and leafy leaves (eg, lettuce, spinach, etc.); Seed plants (eg, petunia, roses, chrysanthemums, etc.), conifers and pines (eg, fir, spruce, etc.); Plants used in plant therapy (eg, heavy metal accumulation plants, etc.); And plants used for experimental purposes (eg, Arabidopsis), including, but not limited to, seeds, seeds, and oils (eg, sunflower seeds, Thus, the methods and compositions specified herein can be used for the treatment and / or prophylaxis of asparagus, Avena, Brassica, Citrus, Citrus, Capsicum, Cucurbitaceae, Tuscany, Ricotta, Ricotta, Rhinoceros, Rhinophyta, Rhinoceros, Manicot, Nicotiana, Oridiana, Perceae, Cyprinaceae, Pyrus, Pyrusus, Rapanus, , Sorghum, Triticum spp., Vitis spp., Vigna spp., And Zebrafish spp.

당해 업계에 알려진 방법에 의하면 발현 카세트가 안전하게 유전자전이식물에 일체화고 작동이 확인된 후 유성 교배에 의해 다른 식물로 도입될 수 있다. 표준 번식 기술은 교배되는 종에 의해 결정된다.
According to methods known in the art, the expression cassette can be safely incorporated into a transgenic plant and then introduced into other plants by meteoric crossing once it has been confirmed to work. Standard breeding techniques are determined by the species being crossed.

형질전환 DNA에 존재하는 마커 유전자에 의해 암호화되는 기질을 선택하고 검사함으로써 형질전환된 식물세포, 캘러스, 조직 또는 식물을 확인하고 분리할 수 있다. 예를 들면, 내성을 가지는 형질전환 유전자 구성체를 항생제 또는 제초제를 포함하는 배지에서 배양함으로써 선택할 수 있다. 또한, 재조합 핵산 구성체에 존재할 수 있는 가시적 마커 유전자를(예, ß-글루쿠로니다제, 루시퍼라제, B 또는 Cl 유전자, 등) 이용하여 형질전환된 식물 및 식물세포를 확인할 수도 있다. 상기 선택 및 확인 방법은 당해 업계에 잘 알려져 있다.The transformed plant cell, callus, tissue or plant can be identified and isolated by selecting and inspecting the substrate encoded by the marker gene present in the transformed DNA. For example, the transgene construct having resistance can be selected by culturing in a medium containing an antibiotic or a herbicide. In addition, transgenic plant and plant cells may be identified using a visible marker gene that may be present in the recombinant nucleic acid construct (e.g., ß-glucuronidase, luciferase, B or Cl gene, etc.). Such selection and verification methods are well known in the art.

삽입된 유전자 구성체를 가지는 식물 또는 식물세포 형질전환체를 확인하기 위해 물리적 및 화학적 방법을 사용할 수도 있다. 상기 방법은 1) 재조합 DNA 삽입체 구조를 확인하기 위한 서던분석 또는 PCR 증폭, 2) 유전자 구성체의 RNA 전사체를 확인하기 위한 노던 블롯, SI RNase 보호, 프라이머-확장 또는 역전사효소-PCR 증폭, 3) 유전자 구성체로 암호화된 산물이 효소 또는 리보자임일 때, 그 활성을 확인하기 위한 효소 검사, 그리고 4) 유전자 구성체로 암호화된 산물이 단백질일 때, 단백질 겔 전기영동법, 웨스턴 블롯 기술, 면역침전법, 또는 효소 연관 면역검사법을 포함하지만 여기에 한정되지는 않는다. 또한 특이한 식물 기관과 조직에서 재조합 구성체의 발현 및 존재를 확인하기 위한 다른 방법은 현지내 혼성법, 효소 염색법, 및 면역염색법이 있다. 상기의 모든 검사법은 당해 업계에 널리 알려져 있다.Physical and chemical methods may also be used to identify plant or plant cell transformants with inserted genetic constructs. These methods include 1) Southern analysis or PCR amplification to identify the recombinant DNA insert structure, 2) Northern blot, SI RNase protection, primer-extension or reverse transcriptase-PCR amplification to identify the RNA transcript of the gene construct, 3 An enzyme test for confirming its activity when the product encoded by the gene construct is an enzyme or ribozyme, and 4) a protein gel electrophoresis method, a Western blotting technique, an immunoprecipitation technique , Or enzyme-linked immunosorbent assays. Other methods for identifying the expression and presence of recombinant constructs in specific plant organs and tissues include in situ hybridization, enzyme staining, and immunostaining. All of the above assays are well known in the art.

본 발명에 명시된 유전자 조작의 결과는 관심 조직에서 분리된 RNA(예, mRNA)를 노던 블롯으로 관찰하였다. mRNA 양이 증가하면,상응하는 내인성 유전자 발현의 증가를 의미한다. 유전자 또는 CYP74B 활성을 측정하는 방법을 이용할 수도 있다. 효소 검사법의 종류는 사용되는 기질의 종류 및 반응 산물 또는 부산물의 증감을 확인하는 방법에 따라 결정된다. 또한, 면역화학적, 즉 ELISA, RIA, EIA 및 당해 업계에 알려진 전기영동 확인검사법(염색법 또는 웨스턴 블롯팅)을 이용한 다른 항체 기반 방법에 의하여 CYP74B 단백질 발현 수준을 측정할 수 있다. 트랜스젠은 상당한 발달 단계들에서 몇몇 식물의 조직에서 선택적으로 발현되거나 전 생명주기에 걸쳐 모든 조직에서 발현되기도 한다. 그러나, 어떤 조합적인 발현도 또한 가능하다.
The results of the genetic manipulations specified in the present invention were observed with Northern blots of RNA (e.g., mRNA) isolated from the tissue of interest. An increase in the amount of mRNA implies an increase in the corresponding endogenous gene expression. Gene or a method of measuring CYP74B activity may be used. The type of enzyme assay is determined by the type of substrate used and the method of ascertaining the increase or decrease of reaction products or byproducts. In addition, CYP74B protein expression levels can be measured by immunochemical, i. E. ELISA, RIA, EIA and other antibody-based methods using electrophoretic identification assays known in the art (staining or Western blotting). Transgenes are selectively expressed in the tissues of some plants in significant developmental stages or are expressed in all tissues throughout the life cycle. However, any combination of expression is also possible.

본 발명은 트랜스젠 또는 유전자 구성체를 가진 형질전환 식물의 종자를 포함한다. 본 발명은 또한 트랜스젠 또는 유전자 구성체를 가진 형질전환 식물의 자손, 클론, 세포 라인, 또는 세포를 포함한다.The present invention includes seeds of transgenic plants having transgenes or genetic constructs. The invention also includes the offspring, clones, cell lines, or cells of transgenic plants with transgenes or gene constructs.

운반체 Carrier

ZFP 융합 단백질 등 폴리펩티드 화합물 투여의 중요한 인자는 폴리펩티드가 세포 원형질막 또는 핵 등의 세포내 구성물의 막을 통과하는 능력을 확보하는 것이다. 세포막은 작고 비이온의 지질친화성 화합물은 쉽게 받아들이지만 극성화합물, 거대분자 및 치료제 또는 진단시약은 받아들이지 않는 지질-단백질 이중막으로 구성되어 있다. 그러나, 상기에 기술된 단백질 및 화합물들은(예, 리포솜 등) ZFP 등의 폴리펩티드를 세포막으로 전위시킬 수 있다. An important factor in the administration of polypeptide compounds, such as ZFP fusion proteins, is the ability of the polypeptide to pass through membranes of intracellular constituents, such as cell plasma membranes or nuclei. Cell membranes are composed of lipid-protein bilayers, which are small, non-ionic lipophilic compounds readily accepted but not accepted as polar compounds, macromolecules and therapeutic agents or diagnostic reagents. However, the proteins and compounds described above (e. G., Liposomes, etc.) can displace polypeptides such as ZFP to the cell membrane.

예를 들면, "막 전위 단백질"은 막 전위 담체로 작용할 수 있는 양친성 또는 친수성 아미노산 서열이 있다. 한 구체예에서 호메오도메인 단백질은 세포막을 통과할 수 있다. 호메오도메인 단백질의 최소 펩티드인 안테나페디아의 구조는 아미노산 위치 43 ~ 58에서 세 쌍 나선형태를 가진다. (Prochiantz, Current Opinion in Neurobiology 6: 629-634 (1996)) 다른 서열인 신호 펩티드의 h(친수성) 도메인도 유사한 세포막 전위 성질을 가진다. (Lin et al., J. Biol. Chem. 270: 14255-14258 (1995))For example, "membrane potential protein" is an amphipathic or hydrophilic amino acid sequence that can act as a membrane potential carrier. In one embodiment, the homeodomain protein can pass through the cell membrane. The structure of the Antennapedia, the minimum peptide of the homeome domain protein, has a triple helix form at amino acid positions 43-58. (Prochiantz, Current Opinion in Neurobiology 6: 629-634 (1996)) h (hydrophilic) domains of signal peptides of other sequences have similar cell membrane potential properties. (Lin et al., J. Biol. Chem. 270: 14255-14258 (1995)).

단백질을 세포로 유입하기 위한 단백질과 연결된 펩티드 서열 예는 HIV tat 단백질의 11개 아미노산 펩티드; p16 단백질의 아미노산 84 ~ 103 dp 상응하는 20 잔기 펩티드(Fahraeus et al., Current Biology 6: 84 (1996)); 안테나페디아 60 아미노산 호메오도메인의 세쌍 나선구조(Derossi et al., J. Biol. Chem. 269: 10444 (1994)); Kaposi 섬유아세포 성장인자(K-FGF)의 h 영역 등의 신호 펩티드의 h 영역 (Lin et al., supra); 또는 HSV의 VP22 전위 도메인을(Elliot & O'Hare, Cell 88: 223-233 (1997)) 포함하지만 여기에 한정되지는 않는다. 세포내 유입을 촉진하는 다른 적당한 화학적 구조도 ZFP에 화학적으로 연결될 수 있다. 또한 막 전위 도메인은(즉, 통합 도메인) 무작위 펩티드 서열 라이브러리로부터 선택될 수 있다. (Yeh et al. (2003) Molecular Therapy 7 (5): S461, Abstract #1191) Examples of peptide sequences linked to proteins for introducing proteins into cells include the 11 amino acid peptides of HIV tat protein; amino acid 84 to 103 dp of the p16 protein corresponding 20 residue peptide (Fahraeus et al., Current Biology 6: 84 (1996)); Three pairs of helical structures of an antenna pediatric 60 amino acid homeome domain (Derossi et al., J. Biol. Chem. 269: 10444 (1994)); The h region of signal peptides such as the h region of Kaposi fibroblast growth factor (K-FGF) (Lin et al., Supra ); Or the VP22 potential domain of HSV (Elliot &O'Hare, Cell 88: 223-233 (1997)). Other suitable chemical structures that facilitate intracellular entry can also be chemically linked to the ZFP. The membrane potential domain (i. E., The integration domain) may be selected from a randomized peptide sequence library. (Yeh et al. (2003) Molecular Therapy 7 (5): S461, Abstract # 1191)

독소 분자 또한 폴리펩티드를 세포막을 가로질러 전달할 수 있다. 보통 상기 분자는(이중 독소라 불림) 전위/결합 도메인 또는 폴리펩티드 및 분리된 독소 도메인 또는 폴리펩티드 두 부분으로 구성된다. 전위 도메인 또는 폴리펩티드가 세포막 리셉터에 결합하여 독소가 세포로 전위된다. 가스괴저균 아이오타 독소, 디프테리아 독소(DT), 수도수균 외독소 A(PE), 백일해 독소(PT), 탄저균 독소, 및 백일해 아세틸레이트 시클라제(CYA)를 포함하여 많은 세균 독소들이 세포질로 전달하기 위하여 펩티드의 내부 또는 아미노 말단 융합 형태로 사용된다. (Arora et al., J. Biol. Chem., 268: 3334-3341 (1993); Perelle etal., Infect. Immun., 61: 5147-5156 (1993); Stenmark et al., J. Cell Biol. 113: 1025-1032 (1991); Donnelly et al., PNAS 90: 3530-3534 (1993); Carbonetti et al., Abstr. Annu. Meet. Am. Soc. Microbiol. 95: 295 (1995); Sebo et al., Infect. Immun. 63: 3851-3857 (1995); Klimpel et al., PNAS USA 89: 10277-10281 (1992); 그리고 Novak et al., J. Biol. Chem. 267: 17186-17193 1992))The toxin molecule can also carry the polypeptide across the cell membrane. Usually the molecule consists of two parts: a potential / binding domain or polypeptide (called a double toxin) and a separate toxin domain or polypeptide. The potential domain or polypeptide binds to the cell membrane receptor and the toxin transitions to the cell. Many bacterial toxins, including gaseous gonococcus iota toxin, diphtheria toxin (DT), water microbial exotoxin A (PE), pertussis toxin (PT), anthrax toxin, and pertussis acetylate cyclase (CYA) Lt; RTI ID = 0.0 > amino-terminal < / RTI > fusion form. Et al., J. Biol. Chem. , 268: 3334-3341 (1993); Perelle et al., Infect. Immun. , 61: 5147-5156 (1993); Stenmark et al., J. Cell Biol. 113: 1025-1032 (1991); Donnelly et al, PNAS 90:........ 3530-3534 (1993); Carbonetti et al, Abstr Annu Meet Am Soc Microbiol 95: 295 (1995); Sebo et Klimpel et al., PNAS USA 89: 10277-10281 (1992); and Novak et al., J. Biol. Chem. 267: 17186-17193, 1992. Infect. Immun. 63: 3851-3857 ))

세포막을 가로질러 ZFP를 이동시키는데 상기 펩티드 서열을 사용할 수 있다. ZFP는 상기 서열과 쉽게 융합하거나 유도될 수 있다. 보통 전위 서열은 융합 단백질의 일부분으로 제공된다. ZFP와 전위 서열을 연결하기 위해 추가로 링커를 사용할 수 있다. 적당한 링커로 펩티드 링커를 사용할 수 있다. The above peptide sequence may be used to transfer the ZFP across the cell membrane. ZFP can be easily fused or derived from the above sequence. The normal sequence is provided as part of the fusion protein. An additional linker can be used to link the ZFP to the potential sequence. Peptide linkers can be used with suitable linkers.

리포솜 및 면역리포솜 등의 리포솜 유도체를 통하여 동물 세포 바람직하게는 포유류 세포에 ZFP을 도입할 수 있다. "리포솜"은 구심으로 정렬된 지질 이중막으로 구성된 운반체를 의미하며 수용액층을 포함할 수 있다. 수용액층은 보통 세포로 전달하려는 화합물, 즉 ZFP를 포함한다.ZFP can be introduced into animal cells, preferably mammalian cells, through liposome derivatives such as liposomes and immunoliposomes. "Liposome" means a carrier composed of lipid bilayers aligned with the core and may include an aqueous solution layer. The aqueous solution layer usually contains the compound to be delivered to the cell, namely ZFP.

리포솜은 원형질막과 융합함으로써 약물을 세포질로 방출한다. 한편, 리포솜은 운반체 상태로 세포에 의해 유입되거나 식세포작용으로 내포되기도 한다. 먼저 내포나 식포에서 리포솜이 분해되거나 운반체 막과 융합하여 내용물을 방출한다. Liposomes fuse with the plasma membrane to release the drug into the cytoplasm. On the other hand, liposomes may be introduced into cells as a carrier or encapsulated by phagocytosis. First, the liposomes are degraded in the napo cells or the tissues, or the contents are released by fusion with the carrier membrane.

최근의 리포솜을 통한 약물 전달 방법은 리포솜이 투과성이 있고 표적 세포나 조직에서 내용물(본 발명의 경우, ZFP)을 방출한다. 전신 또는 조직 특이적인 전달은 몸 전체에서 다양한 분자들의 작용을 통해 장기간에 걸쳐 리포솜 이중막이 분해되는 방식으로 달성될 수 있다. 또한, 리포솜 운반체의 투과능을 향상시키는 물질을 이용하여 활성 약물을 방출할 수 있다. 리포솜 막은 환경이 산성일 때 분해되도록 구성될 수도 있다. (PNAS 84: 7851 (1987); Biochemistry 28: 908 (1989)) 세포에 의해 내포되면 리포솜은 분해되고 내용물을 방출한다. 상기의 분해를 융합분해라 한다. 디올레오일포스파티딜에탄올아민(DOPE)가 융합분해 시스템의 근간을 이룬다. Recent drug delivery methods through liposomes are permeable to liposomes and release the contents (ZFP in this case, in the present case) in target cells or tissues. Systemic or tissue specific delivery can be achieved in such a way that the liposome bilayer membrane is degraded over a long period of time through the action of various molecules throughout the body. In addition, the active drug can be released using a substance that enhances the permeability of the liposome carrier. The liposome membrane may be configured to degrade when the environment is acidic. ( PNAS 84: 7851 (1987); Biochemistry 28: 908 (1989)). When encapsulated by cells, the liposomes degrade and release the contents. The above decomposition is referred to as fusion. Dioleoylphosphatidylethanolamine (DOPE) forms the basis of the fusion-splitting system.

상기 리포솜은 ZFP 및 지질 구성성분, 예를 들어 중성 또는 양성 지질을 포함하고, 추가로 미리 계산된 세포표면 리셉터와 결합하는 항체 등의 리셉터-인지 분자 또는 리간드를 포함할 수 있다. 리포솜을 제조하는 유용한 방법들은 Szoka et al., Ann. Rev. Biophys. Bioeng. 9: 467 (1980), 미국특허 제4,186,183호, 제4,217,344호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호, 제4,235,871호, 제4,261,975호, 제4,485,054호, 제4,501,728호, 제4,774,085호, 제4,837,028호, 제4,946,787호, PCT/WO/91/17424, Deamer & Bangham, Biochim. Biophys. Acta 443: 629-634 (1976); Fraley, et al., PNAS 76: 3348-3352 (1979); Hope et al., Biochim. Biophys. Acta 812: 55-65 (1985); Mayer et al., Biochim. Biophys. Acta 858: 161-168 (1986); Williams et al., PNAS 85: 242246 (1988); Liposomes (Ostro (ed. ), 1983, Chapter 1); Hope et al., Chem. Phys. Lip. 40: 89 (1986); Gregoriadis, Liposome Technology (1984) and Lasic, Liposomes : from Physics to Applications (1993)에 기술되어 있다. 예를 들면, 적당한 방법으로 초음파처리법, 압출법, 고압균질화법, 미세유동화법, 투석법, 작은 리포솜의 칼슘 유도 융합법, 에테르 융합법 등을 포함하는데 당해 업계에 잘 알려져 있다.The liposome may comprise a ZFP and a lipid component, such as a neutral or positive lipid, and may further comprise a receptor-recognition molecule or ligand, such as an antibody, that binds to a pre-calculated cell surface receptor. Useful methods for making liposomes are described in Szoka et al., Ann. Rev. Biophys. Bioeng. 9: 467 (1980), U.S. Patent Nos. 4,186,183, 4,217,344, 4,235,871, 4,261,975, 4,485,054, 4,501,728, 4,774,085, 4,837,028, 4,235,871, 4,261,975 4,485,054, 4,501,728, 4,774,085, 4,837,028, 4,946,787, PCT / WO / 91/17424 , Deamer & Bangham, Biochim. Biophys. Acta 443: 629-634 (1976); Fraley, et al., PNAS 76: 3348-3352 (1979); Hope et al., Biochim. Biophys. Acta 812: 55-65 (1985); Mayer et al., Biochim. Biophys. Acta 858: 161-168 (1986); Williams et al., PNAS 85: 242246 (1988); Liposomes (Ostro (ed.), 1983, Chapter 1); Hope et al., Chem. Phys. Lip. 40: 89 (1986); Gregoriadis, Liposome Technology (1984) and Lasic, Liposomes : from Physics to Applications (1993). For example, the method includes an ultrasonic treatment method, an extrusion method, a high pressure homogenization method, a microfluidization method, a dialysis method, a calcium induced fusion method of a small liposome, an ether fusion method and the like.

어떤 구체예에서, 세포유형, 조직 등에 특이적인 표적 부분을 이용하여 리포솜을 원하는 곳에 표적하고 있다. 다양한 표적 잔기를(예, 리간드, 리셉터, 단일클론 항체,등) 이용한 리포솜의 표적은 미국특허 제4,957,773호 및 제4,603,044호에 기술되어 있다. In certain embodiments, liposomes are targeted at the desired site using a targeting moiety specific for cell type, tissue, and the like. Targets of liposomes using various targeting moieties (e.g., ligands, receptors, monoclonal antibodies, etc.) are described in U.S. Patent Nos. 4,957,773 and 4,603,044.

표적 잔기의 예는 전립선암 특이적 항체 및 MAGE 등의 신생물과 연관된 항원에 특이적인 단일클론 항체들이다. ras 또는 c-erbB2 등의 종양유전자의 활성화나 과발현을 결과 생성되는 유전자 산물을 확인함으로써 암을 진단할 수 있다. 또한 많은 종양은 태아 조직에서 일반적으로 발현되는 항원, 예를 들어 알파펙토프로테인(AFP), 태아 종양성 항원(CEA) 등을 발현한다. 바이러스 감염부위는 B형 간염 코어 및 표면 항원(HBVc, HBVs), C형 감염 항원, 엡스타인-바 바이러스 항원, 제 1형 인간 면역결핍 바이러스(HIVI) 및 파필로마 바이러스 항원을 이용하여 진단한다. 염증은 염증부위에서 발현되는 표면 분자, 예를 들어 인테그린(예, VCAM-1), 셀렉틴 리셉터(예, ELAM 1) 등을 이용하여 확인한다. Examples of target residues are monoclonal antibodies specific for an antigen associated with a prostate cancer specific antibody and a neoplasm such as MAGE. Cancer can be diagnosed by identifying gene products resulting from activation or overexpression of tumor genes such as ras or c-erbB2. In addition, many tumors express antigens normally expressed in fetal tissues such as alpha-fetoprotein (AFP), fetal tumorigenic antigen (CEA), and the like. Viral infections are diagnosed using hepatitis B core and surface antigens (HBVc, HBVs), type C infections, Epstein-Barr virus, type 1 human immunodeficiency virus (HIVI) and papillomavirus antigens. Inflammation is confirmed using surface molecules expressed at the site of inflammation, such as integrins (eg, VCAM-1), selectin receptors (eg, ELAM 1), and the like.

리포솜에 표적제를 붙이기 위해 표준 방법을 사용할 수 있다. 상기 방법은 일반적으로 표적제를 붙이도록 활성화될 수 있는 지질 구성성분(예,포스파티딜에탄올아민) 또는 유도된 지질친화성 화합물에(예, 지질 유도체인 블레마이신) 일체화되어 리포솜에 도입된다. 단백질 A 와 일체화된 리포솜을 이용하여 항체 표적 리포솜을 구성할 수 있다. (Renneisen et al., J Biol. Chem., 265: 16337-16342 (1990) 및 Leonetti et al., PNAS 87: 2448-2451 (1990))Standard methods can be used to attach the targeting agent to the liposome. The method is generally incorporated into liposomes by integrating into lipid components (e.g., phosphatidylethanolamine) or an induced lipophilic compound (e.g., a lipid derivative, blemycin) that can be activated to attach a targeting agent. Antibody-targeted liposomes can be constructed using liposomes integrated with protein A. Chem. , 265: 16337-16342 (1990) and Leonetti et al., PNAS 87: 2448-2451 (1990)).

용량 Volume

치료에 응용하기 위하여 환자 또는 환자에 도입될 세포에 대한 투여 용량은 장시간 유효한 치료반응을 나타낼 만큼 충분하여야 한다. 또한, 기능성 게놈 연구 등의 실험적 조건 및 세포나 동물 모델에서 표현형의 변화를 확인하기 위해서는 특별 용량섭생법이 유용하다. 용량은 환자의 몸무게 또는 표면적 뿐만 아니라 사용된 ZFP의 효능 및 Kd, 표적세포의 핵 부피 및 환자의 상태에 의해 결정된다. 용량은 또한 환자에게 화합물 또는 벡터를 투여할 때 동반하는 부작용의 존재, 특성 및 정도에 의해 결정된다.The dosage for a patient or a cell to be introduced into a patient for application to therapy should be sufficient to exhibit a long-lasting therapeutic response. In addition, special dosing regimens are useful to identify phenotypic changes in experimental conditions such as functional genomic studies and in cell or animal models. The dose is determined by the potency and K d of the ZFP used, the nuclear volume of the target cell, and the condition of the patient, as well as the weight or surface area of the patient. The dose is also determined by the presence, nature and extent of side effects associated with administering the compound or vector to the patient.

표적 세포에 99 % 결합하는 ZFP의 최대 유효 치료용량은 세포당 ZFP 분자 1.5x105 - 1.5x106 을 넘지않는 범위에서 계산된다. 이 결합 수준을 위한 세포당 ZFP 분자수는 헬라 세포 핵의 부피를(대략 1000 mm3 또는 10-12 L; Cell Biology, (Altman & Katz, eds. (1976)) 이용하여 아래와 같이 계산된다. 헬라 핵 크기는 비교적 크기 때문에 표적 세포 핵 부피를 이용하여 용량은 필요에 따라 재계산된다. 이 계산을 다른 부위에 의한 ZFP의 결합은 고려하지 않았다. 이 계산은 또한 모든 ZFP 가 핵내에 존재한다고 가정하였다. 표적 부위와 99 % 결합 계산을 위하여 100x Kd 값을 사용하였고 90 % 결합 계산을 위해서는 lOx Kd 값을 사용하였다. 예를 들어, Kd = 25 nM 라면The maximum effective therapeutic dose of 99% binding ZFP to target cells is calculated to not exceed 1.5 x 10 5 - 1.5 x 10 6 per cell of ZFP molecule. The number of ZFP per cell for this binding level is calculated as follows using the volume of Hela cell nuclei (approximately 1000 mm 3 or 10 -12 L; Cell Biology , (Altman & Katz, eds. Because the size is relatively large, the dose is recalculated as necessary using the target cell nucleus volume. This calculation does not take into account the binding of the ZFP by other sites. 100x K d values were used for the target site and 99% binding calculations, and lOx K d values were used for 90% binding calculations. For example, if K d = 25 nM

ZFP + 표적 부위

20um에는 몇 dna ug ul

복합체 ZFP + target site

20um에는 몇 dna ug ul

Complex

즉, DNA + 단백질

20um에는 몇 dna ug ul

DNA: 단백질 복합체 That is, DNA + protein

20um에는 몇 dna ug ul

DNA: Protein complex

Kd= [DNA] [단백질]Kd = [DNA] [protein]

[DNA:단백질 복합체]    [DNA: protein complex]

ZFP가 50% 결합하였을 때 Kd = [단백질] When ZFP is 50% bound, Kd = [protein]

그래서 [단백질] = 25 nM, 핵 부피가 10-l2 L 일때 Thus, when [protein] = 25 nM and the nuclear volume is 10 -12 L

[단백질] = (25x10-9 moles/L)(10-12 L/핵)(6x1023 분자/mole) [Protein] = (25x10 -9 moles / L ) (10 -12 L / nucleus) (6x10 23 molecules / mole)

= 15,000 분자/핵 (50% 결합의 경우)= 15,000 molecules / nucleus (for 50% binding)

99% 결합하였을 때; 1OOx Kd = [단백질] 99% bound; 100x K d = [protein]

100x Kd = [단백질] = 2.5 mM 100x Kd = [protein] = 2.5 mM

(2.5xlO-6moles/L)(10-l2L/핵)(6xlO23분자/mole) (2.5 x 10 -6 moles / L) (10 -12 L / nuclei) (6 x 10 23 molecules / mole)

= 약 1,500,000 분자 /핵 (99% 결합의 경우)= About 1,500,000 molecules / nucleus (for 99% binding)

ZFP를 암호화하는 발현 벡터의 적당한 용량은 또한 프로모터에서 ZFP 평균발현속도 및 세포에서 ZFP 평균분해속도를 고려하여 계산될 수 있다. 어떤 구체예에서, 상기에서 기술한 바대로 야생형 또는 변종 HSV TK 프로모터 등 약한 프로모터를 사용하였다. ZFP의 분자량을 고려하여 μg의 ZFP용량이 계산되었다. The appropriate dose of the expression vector encoding the ZFP can also be calculated taking into account the average expression rate of the ZFP in the promoter and the average degradation rate of the ZFP in the cell. In certain embodiments, a weak promoter such as the wild-type or variant HSV TK promoter as described above was used. The ZFP capacity of μg was calculated considering the molecular weight of ZFP.

질병의 치료와 예방을 위한 ZFP 투여량을 결정할 때 전문의는 ZFP 또는 ZFP를 암호화하는 핵산의 순환 원형질 수준, 잠재적 ZFP 독성, 질병의 진행 및 항 ZFP 항체의 생성을 검정하고 한번에 또는 나누어 투여한다.When determining the dosage of ZFP for the treatment and prevention of disease, the practitioner will test the circulating protoplast level of the nucleic acid encoding the ZFP or ZFP, the potential ZFP toxicity, the progression of the disease and the production of the anti-ZFP antibody and administer them once or in divided doses.

제약 조성물 및 투여Pharmaceutical Compositions and Administration

ZFP와 이를 암호화하는 발현 벡터는 표적화된 절단 및/또는 재조합을 위하여 환자에게 직접 투여될 수 있다. 그리고, 예를 들어, 암, 허혈, 당뇨병성 망막증, 시력감퇴, 류머티즘성 관절염, 건선, HIV 감염, 겸상 적혈구 빈혈증, 노인성 치매, 근위축증, 신경퇴행성 질환, 혈관 질환, 낭포성 섬유증, 뇌졸중, 기타의 치료나 예방을 위해서도 마찬가지다. ZFP 유전자 요법을 방해할 수 있는 미생물의 예로는, 클라미디아, 리케차, 마이코박테리아, 포도구균, 연쇄상구균, 폐렴구균, 메닝고구균과 코노구균, 클레브시엘라, 프로테우스, 세라치아, 슈도모나스, 레지오넬라균, 디프테리아균, 살로넬라균, 바실루스균, 콜레라균, 파상풍균, 보툴리누스균, 탄저균, 페스트균, 렙토스피라균, 라임병 박테리아 등과 같은 병원성 박테리아; 아스페르길루스, 칼럼디다균 등과 같은 전염성 진균류; 포자충류(말라리아 원충), 근족충류(엔트아메바), 편모충류(트리파노소마, 리슈마니아, 트리코모나스, 지아디아 등) 등과 같은 원생동물문; 간염(A, B, C), 헤르페스 바이러스(예, VZV, HSV-1, HSV- 6, HSV-11, CMV, EBV), HIV, 에볼라, 아데노바이러스, 인플루엔자 바이러스, 플라비 바이러스, 에코 바이러스, 감기 바이러스, 콕사키 바이러스, 코로나 바이러스, 호흡기 세포융합 바이러스, 이하선염 바이러스, 로타바이러스, 홍역 바이러스, 풍진 바이러스, 파보 바이러스, 우두 바이러스, HTLV 바이러스, 뎅기열 바이러스, 유두종 바이러스, 폴리오 바이러스, 공수병 바이러스, 뇌염 바이러스 등과 같은 바이러스병 등이 있다. ZFPs and expression vectors encoding them can be administered directly to the patient for targeted cleavage and / or recombination. The present invention also relates to a method for the treatment and prophylaxis of cancer, ischemia, diabetic retinopathy, vision loss, rheumatoid arthritis, psoriasis, HIV infection, sickle cell anemia, senile dementia, muscular dystrophy, neurodegenerative diseases, vascular diseases, cystic fibrosis, The same is true for treatment and prevention. Examples of microorganisms that may interfere with ZFP gene therapy include chlamydia, rickettsia, mycobacteria, Staphylococcus, Streptococcus, Streptococcus pneumoniae, Meningococcus and Streptococcus pneumoniae, Klebsiella, Proteus, Serratia, Pseudomonas, Legionella , Pathogenic bacteria such as Diphtheria, Salmonella, Bacillus, Cholera, Tetanus, Botulinus, Anthrax, Pest, Leptospira, Lyme disease, and the like; Infectious fungi such as Aspergillus, Columdida, and the like; Protozoa such as protozoa (malarial protozoa), endosporidium (entomoeba), anthelmintics (trypanosoma, ricinmania, trichomonas, giadia, etc); (E. G., Hepatitis A, B and C), herpes viruses (e. G. VZV, HSV-1, HSV-6, HSV-11, CMV and EBV), HIV, Ebola, adenovirus, influenza virus, Viruses, viruses, viruses, cockroaches, coronaviruses, respiratory syncytial viruses, mumps viruses, rotaviruses, measles viruses, rubella viruses, parvoviruses, vaccinia viruses, HTLV viruses, dengue viruses, papillomaviruses, polioviruses, rabies viruses, encephalitis viruses And the like.

치료에 효과적인 투여량은 ZFP가 치료할 생체 조직에 최종적으로 도달하게끔 보통 이용되는 경로에 의해 결정한다. ZFP는 모든 적절한 방식으로 투여되는데, 약학적으로 허용되는 매개체에 의함이 바람직하다. 그러한 조절물을 투여하는 적절한 방법은 이용가능하며 또 해당 기술 분야에서 잘 알려져 있다. 특정한 조성물을 투여하는 방식에는 하나 이상의 투여 경로가 가능하지만, 특정의 투여 경로만이 더 빠르고 더 효과적인 반응을 보이는 경우가 종종 있다. A therapeutically effective dose is determined by the route commonly used to cause the ZFP to ultimately reach the tissue to be treated. The ZFP is administered in any suitable manner, preferably by means of a pharmaceutically acceptable vehicle. Suitable methods of administering such modulators are available and well known in the art. While the route of administration of a particular composition may be one or more routes of administration, only certain routes of administration often exhibit a faster and more effective response.

약학적으로 허용되는 매개체는 상기 조성물을 투여하는데 이용되는 특정한 방법에 의해 결정됨은 물론, 부분적으로는 투여되는 특정한 조성물에 의해서도 결정된다. 그에 따라 이용가능하면서 적절한 제약 조성물의 제형의 종류는 다양하다. (예를 들어, Remington's Pharmaceutical Sciences, 17th ed. 1985 참조). The pharmaceutically acceptable vehicle is determined by the particular method used to administer the composition, as well as, in part, by the particular composition being administered. The types of formulations of suitable pharmaceutical compositions that are available accordingly vary. (E. G., Remington's Pharmaceutical Sciences, 17 th ed. See 1985).

ZFP는, 독자적으로나 아니면 다른 적절한 구성물과의 조합으로, 흡입으로 투여될 수 있는 연무질의 제형으로 만들어져 분무될 수도 있다. 연무질 제형은 디클로로디플루오로메탄, 프로판, 질소 등과 같은 압축된 용인 추진물에 놓여 질 수 있다. The ZFP may be sprayed and made into a formulation of aerosol that can be administered by inhalation, either alone or in combination with other suitable constituents. The aerosol formulation may be placed in a compressed propellant such as dichlorodifluoromethane, propane, nitrogen, and the like.

정맥주사, 근육주사, 피내주사, 피하주사와 같은 비경구 투약에 적당한 제형에는, 수성 및 비수성, 등장성 살균 주사 용액이 있는데, 이는 산화방지제, 완충제, 세균발육저지제, 수용체의 피와 등장성을 유지시키는 용매, 수성 및 비수성의 살균 현탁물을 함유하고, 그 현탁물은 현탁화제, 가용화제, 농밀화제, 안정화제, 방부제를 함유한다. 본 발명의 조성물들은, 예를 들어, 정맥 주사, 경구, 국부적, 복막내, 방광내, 경막내 등으로 투여될 수 있다. 화합물의 제형은 1회 복용 또는 수회복용으로 앰풀이나 병과 같은 용기에 밀봉되어 담을 수 있다. 주사 용액과 현탁물은 살균 가루, 미립, 앞서 기술한 정제류 등을 이용하여 준비할 수 있다. Formulations suitable for parenteral dosing such as intravenous, intramuscular, intradermal, subcutaneous injection include aqueous and non-aqueous, isotonic sterile injection solutions, which may include antioxidants, buffering agents, bacterial growth inhibitors, A suspending agent, a solubilizing agent, a thickening agent, a stabilizer, and an antiseptic agent. The compositions of the present invention may be administered, for example, by intravenous, oral, topical, intraperitoneal, intracerebral, intrathecal, and the like. The formulation of the compound may be enclosed in a container such as an ampoule or bottle for single dose or for water recovery. Injection solutions and suspensions may be prepared using sterile powders, microspheres, refining streams as described above, and the like.

용도Usage

표적화 절단을 위한 개시된 방법 및 조성물은, 예를 들어 두 부위에서 절단하고 그 사이에 서열을 삽입함으로써, 한 부위에서 절단한 후 비-상동성 단부 잇기에 의해, 한 부위 또는 두 부위를 절단하면서 브레이크들 사이에 외래 서열을 삽입함으로써, 및/또는 한 부위를 절단하여 1개 또는 2개 또는 몇 개의 뉴클레오티드를 제거함으로써 게놈 서열에 돌연변이를 유도하는데 사용될 수 있다. 또한, 표적화 절단은 유전자 녹-아웃(예를 들어, 기능적 유전자학 또는 표적 유효화를 위해)을 만들고, 게놈에 서열의 표적화 삽입(즉, 유전자 녹-인)을 용이하게 하는데 사용될 수 있으며, 예를 들어 이것은 세포조작 또는 단백질 과발현을 위해 사용된다. 삽입은 상동성 재조합을 통하거나 표적화 통합에 의한 염색체 서열의 치환에 의해 이루어질 수 있으며, 여기서는 염색체 내 관심 영역에 상동성인 서열이 측면에 존재하는 새 서열(즉, 관심 영역에는 존재하지 않는 서열)이 정해진 표적 부위에 삽입된다.The disclosed methods and compositions for targeted cleavage can be performed by, for example, cleaving at two sites and inserting sequences therebetween, cutting at one site and then cutting one or both sites by non-homologous terminal ends, And / or by truncating a site to remove one or two or several nucleotides, to induce mutations in the genomic sequence. In addition, targeted cleavage can be used to create a gene knock-out (e.g., for functional genetics or target validation) and facilitate the targeted insertion of the sequence into the genome (i. E., Gene knock-in) It is used for cell manipulation or protein overexpression. Insertion may be accomplished by homologous recombination or by substitution of the chromosomal sequence by targeting integration, wherein a new sequence (ie, a sequence not present in the region of interest) whose homologous sequence is present in the region of interest in the chromosome Is inserted into the target site.

또한, 동일한 방법이 야생형 서열과 돌연변이 서열을 치환하는데, 또는 하나의 대립유전자를 다른 대립유전자로 전환하는데 사용될 수 있다.In addition, the same method can be used to replace wild-type sequences and mutant sequences, or to convert one allele to another allele.

감염된 또는 통합된 바이러스 게놈의 표적화 절단이 숙주에서 바이러스 감염을 치료하는데 사용될 수 있다. 추가하여, 바이러스 수용체를 암호화하는 유전자의 표적화 절단이 이러한 수용체의 발현을 차단하는데 사용될 수 있으며, 이로써 숙주 유기체에서 바이러스 감염 및/또는 바이러스 전파가 방지된다. 바이러스 수용체(예를 들어, HIV의 CCR5 및 CXCR4 수용체)를 암호화하는 유전자의 표적화 돌연변이는 수용체가 바이러스와 결합할 수 없게 만드는데 사용될 수 있으며, 이로써 새로운 감염이 방지되고 기존 감염의 전파가 차단된다. 치료될 수 있는 바이러스 또는 바이러스 수용체의 비-제한적 예는 헤르페스 단순 바이러스(HSV), 예를 들어 HSV-I 및 HSV-2, 대상포진 바이러스(VZV), 엡스타인-바 바이러스(EBV) 및 시토메갈로바이러스(CMV), HHV6 및 HHV7을 포함한다. 간염 군 바이러스는 A형 간염 바이러스(HAV), B형 바이러스(HBV), C형 바이러스(HCV), D형 간염 바이러스(HDV), E형 간염 바이러스(HEV) 및 G형 간염 바이러스(HGV)를 포함한다. 표적화 될 수 있는 다른 바이러스 또는 바이러스 수용체는, 제한되는 것은 아니지만, 피코르나비리다에(예를 들어, 폴리오바이러스 등); 칼리시비리다에; 토가비리다에(예를 들어, 루벨라 바이러스, 뎅그열 바이러스 등); 플라비비리다에; 코로나비리다에; 레오비리다에; 비르나비리다에; 라보도비리다에(예를 들어, 라비에스 바이러스 등); 필로비리다에; 파라믹소비리다에(예를 들어, 유행성이하선염 바이러스, 홍역 바이러스, 호흡기 신시티아 바이러스 등); 오르토믹소비리다에(예를 들어, 인플루엔자 바이러스 A형, B형 및 C형 등); 분야비리다에; 아레나비리다에; 레트로비리다에; 렌티바이러스(예를 들어, HTLV-I; HTLV-II; HIV-I(HTLV-III, LAV, ARV, hTLR, 등으로도 알려짐) HIV-II); 유인원 면역결핍 바이러스(SIV), 인간 유두종 바이러스(HPV), 인플루엔자 바이러스 및 진드기-매개 뇌염 바이러스를 포함한다. 예를 들어, 이들 및 다른 바이러스에 대한 설명은, Virology, 3판(W. K. Joklik ed. 1988); Fundamental Virology, 2판(B. N. Fields and D. M. Knipe, eds. 1991)을 참조한다. HIV 수용체는, 예를 들어, CCR-5 및 CXCR-4를 포함한다.Targeted cleavage of infected or integrated viral genomes can be used to treat viral infections in a host. In addition, targeted cleavage of the gene encoding the viral receptor can be used to block expression of such a receptor, thereby preventing viral infection and / or viral transmission in the host organism. Targeting mutations of genes encoding viral receptors (e. G., CCR5 and CXCR4 receptors of HIV) can be used to render the receptor incapable of binding to viruses, thereby preventing new infections and blocking the spread of existing infections. Non-limiting examples of viruses or viral receptors that may be treated include herpes simplex virus (HSV), such as HSV-I and HSV-2, herpes zoster virus (VZV), Epstein-Barr virus (EBV) and cytomegalovirus (CMV), HHV6 and HHV7. The hepatitis viruses are caused by hepatitis A virus (HAV), hepatitis B virus (HBV), hepatitis C virus (HCV), hepatitis D virus (HDV), hepatitis E virus (HEV) . Other viral or viral receptors that may be targeted include, but are not limited to, picornaviridae (e. G., Poliovirus, etc.); To caliciviridae; Tobacco (eg, luvella virus, dengue virus, etc.); Flaviviridae; Corona is invisible; To leo viridas; Birnaviridae; (For example, rabbis virus, etc.); To piloviridae; (For example, mumps virus, measles virus, respiratory syncytial virus, etc.); Orthomycin consortia (for example, influenza viruses A, B and C); To the field is vain; In the arena; On the retro villa; HIV-II (also known as HTLV-III, LAV, ARV, hTLR, etc.) HIV-II; Human immunodeficiency virus (SIV), human papilloma virus (HPV), influenza virus and tick-borne encephalitis virus. For example, descriptions of these and other viruses can be found in Virology, 3rd edition (W. K. Joklik ed. 1988); Fundamental Virology, 2nd Edition (B. N. Fields and D. M. Knipe, eds., 1991). HIV receptors include, for example, CCR-5 and CXCR-4.

유사한 방식으로, 감염된 박테리아의 게놈이 표적화 DNA 절단 후 비-상동성 단부 잇기에 의해 돌연변이될 수 있으며, 이로써 박테리아 감염이 차단되거나 개선된다.In a similar manner, the genome of the infected bacteria can be mutated by non-homologous end-translocations after targeted DNA cleavage, thereby blocking or improving bacterial infection.

표적화 재조합을 위한 개시된 방법은 어떤 게놈 서열을 상동성이지만 동일하지는 않은 서열로 치환하는데 사용될 수 있다. 예를 들어, 돌연변이 게놈 서열이 그것의 야생형 카운터파트로 치환될 수 있으며, 이로써, 예를 들어 유전질환, 유전된 장애, 암, 및 자가면역질환의 치료 방법이 제공된다. 유사한 방식으로, 유전자의 한 대립유전자가 본원에 개시된 표적화 재조합 방법을 사용하여 다른 대립유전자로 치환될 수 있다.The disclosed methods for targeted recombination can be used to replace any genomic sequence with sequences that are homologous but not identical. For example, a mutant genomic sequence may be substituted with its wild-type counterpart, thereby providing a method for the treatment of, for example, genetic disorders, inherited disorders, cancer, and autoimmune diseases. In a similar manner, an allele of a gene may be replaced with another allele using the targeted recombination methods disclosed herein.

전형적인 유전질환은, 제한되는 것은 아니지만, 연골무형성, 완전색맹, 산 말타제 결핍, 아데노신 데아미나제 결핍(OMIM No. 102700), 부신백질이영양증, 에이카르디 증후군, 알파-1 안티트립신 결핍, 알파-탈라세미아, 안드로겐 무감응 증후군, 에퍼트 증후군, 부정맥성 우심실 심근병증, 이형성증, 혈관확장성 실조증, 바스 증후군, 베타-탈라세미아, 청색고무포말모반 증후군, 카나반병, 만성 육아종병(CGD), 묘성증후군, 낭성섬유증, 더컴병, 외배엽이형성증, 판코니 빈혈, 진행성 골화성 섬유이형성, 취약성 X 염색체 증후군, 갈락토오스혈증, 고셔병, 범발성 강글리오시드증(예를 들어, GM1), 혈색소증, 베타-글로빈의 6번째 코돈에서의 헤모글로빈 C 돌연변이(HbC), 혈우병, 헌팅턴병, 후를러 증후군, 저인산염증, 클라인펠터 증후군, 크라베병, 랑게-기디온 증후군, 백혈구 유착 결핍(LAD, OMIM No. 116920), 백질이영양증, QT 간격연장 증후군, 마르팡 증후군, 뫼비우스 증후군, 뮤코다당증 (MPS), 손톱 무릎뼈 증후군, 신장성 요붕증, 신경섬유종증, 니만-픽 병, 골형성부전증, 포피린증, 프라더-윌리 증후군, 조로증, 프로테우스 증후군, 망막모세포증, 레트 증후군, 루빈스타인-테이비 증후군, 산필립포 증후군, 중증 합병성 면역결핍 (SCID), 슈와크만 증후군, 겸상적혈구질환(겸상적혈구빈혈증), 스미스-마제니스 증후군, 스틱클러 증후군, 테이삭스병, 저혈소판 요골무형성(TAR) 증후군, 트리쳐-콜린스 증후군, 삼염색체증, 결절성 경화증, 터너 증후군, 요소 주기 장애, 본 히펠-란도 병, 바르덴부르크 증후군, 윌리엄스 증후군, 윌슨병, 위스콧-알드리치 증후군, 반성 유전성 림프증식성 증후군(XLP, OMIM No. 308240)을 포함한다.Typical hereditary diseases include, but are not limited to, cartilage intolerance, complete color blindness, deficiency of acid maltase, deficiency of adenosine deaminase (OMIM No. 102700), adrenal leukodystrophy, Akadi syndrome, alpha-1 antitrypsin deficiency, (CBD), beta-thalassemia, blue rubber Folliculogenesis syndrome, cannabis disease, chronic granulomatous disease (CGD) syndrome, hypertrophic cardiomyopathy, thalassemia, androgen insensitivity syndrome, ephedrine syndrome, arrhythmogenic right ventricular cardiomyopathy, dysplasia, (For example, GM1), hemoglobinopathies, beta-amyloid angiogenesis, autoimmune diseases, autoimmune diseases, autoimmune diseases, autoimmune diseases, - hemoglobin C mutation (HbC) at the sixth codon of globin, hemophilia, Huntington's disease, Hurler's syndrome, hypophosphorus inflammation, Kleinfelder's syndrome, Krabb's disease, Lange- , Leukocyte adhesion deficiency (LAD, OMIM No. 116920), leukodystrophy, QT interval extension syndrome, Marfan's syndrome, Möbius syndrome, mucopolysaccharide (MPS), nail-knee bone syndrome, renal diabetes insipidus, neurofibromatosis, (SCID), schizophrenia, schizophrenia, rheumatoid arthritis, rheumatoid arthritis, rheumatoid arthritis, rheumatoid arthritis, rheumatoid arthritis, rheumatoid arthritis, (Sickle cell anemia), Smith-Mazanis syndrome, Stickler's syndrome, Tay-Sachs disease, Low platelet radial-infarction (TAR) syndrome, Trichor-Collins syndrome, Trisy- thyroidism, Tuberous sclerosis, Turner's syndrome Wilson's syndrome, Wilson's disease, Wisconsin-Aldrich syndrome, and Lymphoproliferative Syndrome (XLP, OMIM No. 308240).

표적화 DNA 절단 및/또는 상동성 재조합에 의해 치료될 수 있는 추가의 전형적인 질환들은 후천적 면역결핍증, 리소좀 저장병(예를 들어, 고셔병, GM1, 파브리병 및 테이-삭스 병), 뮤코다당증(예를 들어, 헌터병, 후를러병), 혈색소병증(예를 들어, 겸상적혈구질환, HbC, 알파-탈라세미아, 베타-탈라세미아) 및 혈우병을 포함한다.Additional typical diseases that can be treated by targeted DNA cleavage and / or homologous recombination include acquired immunodeficiency syndrome, lysosomal storage diseases (e.g., Gaucher disease, GM1, Fabry disease and Tay-Sachs disease), mucodegaly (E.g., Hunter's disease, Hewlett-Packard disease), hemochromatosis (e.g., sickle cell disease, HbC, alpha-tralachemia, beta-thalassemia) and hemophilia.

어떤 사례에서, 다능성 세포(예를 들어, 조혈 줄기세포)의 게놈 서열의 변경이 바람직하다. 조혈 줄기세포의 모집, 부화 및 배양 방법은 본 분야에 잘 공지되어 있다. 예를 들어, U.S. 특허 5,061,620; 5,681,559; 6,335,195; 6,645,489 및 6,667,064를 참조한다. 처치된 줄기세표는, 제한은 아니지만, SCID 및 겸상적혈구빈혈증을 포함하는 여러 질환의 치료를 위해 환자에게 다시 복귀될 수 있다.In some instances, alteration of the genomic sequence of pluripotent cells (e. G., Hematopoietic stem cells) is desirable. Methods of harvesting, hatching and culturing hematopoietic stem cells are well known in the art. For example, U.S. Pat. 5,061,620; 5,681,559; 6,335,195; 6,645,489 and 6,667,064. The treated stem cell mark may be returned to the patient for treatment of various diseases, including, but not limited to, SCID and sickle cell anemia.

이런 사례들의 대부분에서, 관심 영역은 돌연변이를 포함하고, 도너 폴리뉴클레오티드는 상응하는 야생형 서열을 포함한다. 유사하게, 바람직하다면 야생형 게놈 서열이 돌연변이 서열로 치환될 수 있다. 예를 들어, 유전자 돌연변이에 의해서, 또는 유전자 제어 서열을 낮은 비-병원성 수준의 발현을 지원하는 서열로 치환함으로써 종양유전자의 과별현이 반전될 수 있다. 다른 예로서, AopAI 유전자의 야생형 대립유전자가 죽상경화증의 치료를 위해 ApoAI 밀라노 대립유전자로 치환될 수 있다. 사실상, 특정 게놈 서열에 의존하는 어떤 병인은 어떤 방식으로든 본원에 개시된 방법 및 조성물을 사용하여 교정되거나 완화될 수 있다.In most of these cases, the region of interest comprises a mutation and the donor polynucleotide comprises the corresponding wild-type sequence. Similarly, if desired, the wild-type genomic sequence may be substituted with a mutant sequence. For example, the transgenic strand of the oncogene can be reversed by gene mutation or by substituting a gene control sequence with a sequence that supports expression at a low non-pathogenic level. As another example, the wild-type allele of the AopAI gene may be substituted with the ApoAI Milano allele for the treatment of atherosclerosis. Indeed, any etiology dependent on a particular genomic sequence may be calibrated or mitigated in any manner using the methods and compositions disclosed herein.

또한, 표적화 절단 및 표적화 재조합은 비-코딩 서열(예를 들어, 프로모터, 인핸서, 이니시에이터, 터미네이터, 스플라이스 부위와 같은 조절 서열)을 변경함으로써 유전자 산물의 발현 수준을 변경하기 위해 사용될 수 있다. 이러한 방법은, 예를 들어 치료 목적, 기능적 유전자학 및/또는 표적 유효화 연구를 위해 사용될 수 있다.In addition, targeted cleavage and targeted recombination can be used to alter the expression level of the gene product by altering non-coding sequences (e. G., Regulatory sequences such as promoters, enhancers, initiators, terminators, splice sites). Such methods can be used, for example, for therapeutic purposes, functional genomics and / or target validation studies.

또한, 본원에 설명된 조성물 및 방법은 동종 이식편에 대한 숙주의 면역반응을 다루는 새로운 접근법 및 시스템을 허용한다. 특히, 동종 줄기세포(또는 어떤 종류의 동종 세포)가 숙주 레시피언트에 이식될 때 직면하는 주된 문제는 주로 이식된 세포 표면상의 주 조직적합성 복합체(MHC)의 인식을 통해 매개되는 숙주의 면역 시스템에 의한 높은 거부 위험이다. MHC는 공통 β 서브유닛과 가변적 α 서브유닛으로 이루어진 이종이량체로서 기능하는 HLA I형 단백질(들)을 포함한다. HLA가 없는 줄기세포로부터 유래한 조직 이식편은 숙주의 면역반응으로부터 벗어난다는 것이 증명되었다. 예를 들어, Coffman et al. J Immunol 151, 425-35. (1993); Markmann et al. Transplantation 54, 1085-9. (1992); Koller et al. Science 248, 1227-30. (1990)를 참조한다. 본원에 설명된 조성물 및 방법을 사용하여, 이식편 거부에 연관된 HLA 단백질을 암호화하는 유전자의 코딩 또는 조절 서열이 재조합에 의해 절단, 돌연변이 또는 변경될 수 있으며, 이로써 그 발현이 차단되거나, 이들이 비-기능적 산물을 발현하게 된다. 예를 들어, 본원에 설명된 ZFP 융합 단백질을 사용하여 공통 β 서브유닛 유전자(β2 마이크로글로불린)를 암호화하는 유전자를 불활성화함으로써, I형 HLA가 세포로부터 제거되어 어떤 도너로부터 HLA I형 무표지 세포가 신속하면서도 신뢰할 만하게 생성될 수 있으며, 이로써 줄기세포를 이식하는 동안 아주 일치하는 도너/레시피언트 MHC 일배체형에 대한 필요성이 감소된다.In addition, the compositions and methods described herein permit new approaches and systems to address host immune responses to allografts. In particular, the main problem faced when allogeneic stem cells (or some kind of allogeneic cells) are transplanted into a host recipient is the immune system of the host, which is mediated primarily through the recognition of the main histocompatibility complex (MHC) Is a high rejection risk. MHC includes HLA I-type protein (s) that function as a heterodimer consisting of a common? Subunit and a variable? Subunit. It has been demonstrated that tissue grafts derived from HLA-free stem cells deviate from the immune response of the host. For example, Coffman et al. J Immunol 151, 425-35. (1993); Markmann et al. Transplantation 54, 1085-9. (1992); Koller et al. Science 248, 1227-30. (1990). Using the compositions and methods described herein, the coding or regulatory sequences of a gene encoding an HLA protein associated with graft rejection can be truncated, mutated or altered by recombination, thereby blocking its expression or causing them to become non-functional And the product is expressed. For example, by inactivating a gene encoding the common [beta] 2 subunit gene ([beta] 2 microglobulin) using the ZFP fusion protein described herein, I-type HLA is removed from the cell and HLA I- Can be produced quickly and reliably, thereby reducing the need for a highly matched donor / recipient MHC haplotype during transplantation of stem cells.

예를 들어, 단일 절단 사건, 절단 후 비-상동성 단부 잇기, 두 부위의 절단 후 결합시켜 두 절단 부위 사이의 서열을 결실, 코딩 영역 쪽 미스센스 또는 논센스 코돈의 표적화 재조합, 또는 무관한 서열(즉, "스터퍼" 서열)의 표적화 재조합에 의해 어떤 유전자(예를 들어, β2 마이크로글로불린 유전자)의 불활성화가 달성될 수 있다.For example, a single cleavage event, non-homologous end joining after cleavage, cleavage of the region between the two cleavage sites by binding after cleavage of the two sites, targeted recombination of the coding region side missense or the Nonsense codon, (E. G., The "stuffer" sequence) can be achieved by targeted recombination of the gene (e.

공동 소유의 WO 01/83793에 개시된 대로, 염색질 구조의 표적화 변형이 융합 단백질과 세포 염색질의 결합을 촉진하는데 사용될 수 있다.As disclosed in co-owned WO 01/83793, targeting modifications of the chromatin structure can be used to facilitate binding of the fusion protein to the cell chromatin.

추가의 구체예에서, 본원에 개시된 징크핑거-절단 도메인 융합체에 더하여, 또는 그 대신에 징크핑거 결합 도메인과 재조합효소(또는 그 기능 단편) 사이의 하나 이상의 융합체를 사용하여 표적화 재조합을 촉진할 수 있다. 예를 들어, 공동 소유의 U.S. 특허 No. 6,534,261 및 Akopian et al. (2003) Proa Natl. Acad. Scl. USA 100:8688-8691를 참조한다. In further embodiments, one or more fusions between a zinc finger binding domain and a recombinant enzyme (or functional fragment thereof), in addition to or instead of the zinc finger-cleavage domain fusions disclosed herein, can be used to facilitate targeted recombination . For example, U.S. Pat. Patent No. 6,534, 261 and Akopian et al. (2003) Proa Natl. Acad. Scl. USA 100: 8688-8691.

추가의 구체예에서, 개시된 방법 및 조성물은 활성을 위해 이량체화(동종이량체화 또는 이종이량체화)를 필요로 하는 전사 활성화 또는 억제 도메인과 ZFP 결합 도메인의 융합을 제공하는데 사용된다. 이들 경우에, 융합 폴리펩티드는 징크핑거 결합 도메인과 기능 도메인 단량체(예를 들어, 이량체 전사 활성화 또는 억제 도메인의 단량체)를 포함한다. 적절히 위치한 표적 부위에 이러한 두 융합 폴리펩티드의 결합은 이량체화를 허용함으로써 기능적 전사 활성화 또는 억제 도메인이 복구된다.In a further embodiment, the disclosed methods and compositions are used to provide fusion of a ZFP binding domain with a transcriptional activation or suppression domain that requires dimerization (homodimerization or heterodimerization) for activity. In these cases, the fusion polypeptide comprises a zinc finger binding domain and a functional domain monomer (e. G., A monomer of a dimer transcription activation or repression domain). The binding of these two fusion polypeptides to the appropriately located target site restores functional transcriptional activation or repression domains by allowing dimerization.

표적화 통합Targeting integration

상기 설명된 대로, 본원에 제시된 방법 및 조성물은 세포 게놈의 관심 영역에 외래 서열을 표적화 통합하는데 사용될 수 있다. 게놈의 이중-가닥 브레이크에 외래 서열의 표적화 통합은 상동성-의존적 및 상동성-독립적 메커니즘 모두에 의해 일어날 수 있다.As described above, the methods and compositions provided herein can be used to target and integrate foreign sequences into a region of interest of the cellular genome. Targeting integration of foreign sequences into the double-stranded brakes of the genome can occur by both homology-dependent and homology-independent mechanisms.

상기 주지된 대로, 어떤 구체예에서, 상동성-의존적 및 상동성-독립적 메커니즘 모두에 의한 표적화 통합은 절단에 의해 생긴 단부들 사이에 외래 서열을 삽입하는 것을 포함한다. 삽입된 외래 서열은 어떤 길이일 수 있으며, 예를 들어 1 내지 50개 뉴클레오티드 길이(예를 들어, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45 또는 50개 뉴클레오티드 서열)의 비교적 짧은 "패치" 서열일 수 있다.As noted above, in some embodiments, targeting integration by both homology-dependent and homology-independent mechanisms involves inserting foreign sequences between the ends caused by cleavage. The inserted foreign sequence may be of any length and may be of any length, for example from 1 to 50 nucleotides in length (e.g., 2,3, 4,5, 6,7, 8,9, 10,11, 12,13, 14 , 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 35, 40, 45 or 50 nucleotide sequences) Sequence.

표적화 통합이 상동성-의존적인 경우, 도너 핵산 또는 도너 서열은 정해진 게놈 서열(즉, 표적 부위)과 동일하거나 또는 상동성이지만 동일하지는 않은 하나 이상의 서열과 함께 외래 서열을 포함한다. 어떤 구체예에서, 2개의 동일한 서열 또는 2개의 상동성이지만 동일하지는 않은 서열(또는 각 하나씩)은 외래 서열의 측면에 존재한다. 외래 서열(또는 외래 핵산 또는 외래 폴리뉴클레오티드)는 정상적으로는 관심 영역에 존재하지 않는 뉴클레오티드 서열을 함유하는 서열이다.Where the targeting integration is homology-dependent, the donor nucleic acid or donor sequence includes foreign sequences with one or more sequences that are identical or homologous but not identical to a given genomic sequence (i.e., target site). In some embodiments, two identical sequences or two homologous but not identical sequences (or each one) are present at the side of the foreign sequence. A foreign sequence (or foreign nucleic acid or foreign polynucleotide) is a sequence that normally contains a nucleotide sequence that is not present in the region of interest.

전형적인 외래 서열은, 제한되는 것은 아니지만, cDNA, 프로모터 서열, 인핸서 서열, 에피토프 택, 마커 유전자, 절단 효소 인식부위 및 여러 종류의 발현 구성체들을 포함한다. 마커 유전자는, 제한되는 것은 아니나, 항생제 내성(예를 들어, 암피실린 내성, 네오마이신 내성, G418 내성, 퓨로마이신 내성)을 매개하는 단백질을 암호화하는 서열, 착색 또는 형광 또는 발광 단백질(예를 들어, 녹색 형광 단백질, 강화 녹색 형광 단백질, 적색 형광 단백질, 루시페라제)을 암호화하는 서열, 및 증진된 세포 성장 및/또는 유전자 증폭을 매개하는 단백질(예를 들어, 디히드로폴레이트 환원효소)을 포함한다. 에피토프 택은, 예를 들어 FLAG, His, myc, Tap, HA 또는 어떤 검출가능한 아미노산 서열의 하나 이상의 카피들을 포함한다.Exemplary foreign sequences include, but are not limited to, cDNA, promoter sequences, enhancer sequences, epitope tags, marker genes, cleavage enzyme recognition sites, and various types of expression constructs. Marker genes include, but are not limited to, sequences encoding proteins that mediate antibiotic resistance (e.g., ampicillin resistance, neomycin resistance, G418 resistance, puromycin resistance), staining or fluorescence or luminescent proteins (E.g., green fluorescent protein, enhanced green fluorescent protein, red fluorescent protein, luciferase), and proteins that mediate enhanced cell growth and / or gene amplification (e. G., Dihydrofolate reductase) do. An epitope tag includes, for example, FLAG, His, myc, Tap, HA or one or more copies of any detectable amino acid sequence.

단백질 발현 구성체는, 제한되는 것은 아니지만, cDNA 및 cDNA 서열과 작동 연결된 전사 제어 서열을 포함한다. 전사 제어 서열은 프로모터, 인핸서 및 인슐레이터를 포함한다. 발현 구성체에 포함될 수 있는 추가의 전사 및 번역 조절 서열은, 예를 들어 내부 리보솜 점입 부위, 2A 펩티드 암호화 서열 및 폴리아데닐화 신호를 포함한다. 전형적인 단백질 발현 구성체는 항체 중쇄 암호화 서열 및 항체 경쇄 암호화 서열을 포함하며, 각 서열은 프로모터(동일하거나 상이한 프로모터)에 작동 연결되고, 어느 한 서열 또는 두 서열 모두는 선택적으로 인핸서에 연결된다(두 코딩 서열이 모두 인핸서에 연결된 경우에 인핸서는 동일하거나 상이할 수 있다). Protein expression constructs include, but are not limited to, transcription control sequences operatively linked to cDNA and cDNA sequences. Transcriptional control sequences include promoters, enhancers and insulators. Additional transcriptional and translational control sequences that may be included in the expression construct include, for example, an internal ribosome entry site, a 2A peptide coding sequence, and a polyadenylation signal. Typical protein expression constructs include an antibody heavy chain encoding sequence and an antibody light chain encoding sequence, each sequence operatively linked to a promoter (the same or a different promoter), and either a sequence or both sequences are optionally linked to an enhancer The enhancers may be the same or different if the sequences are all linked to enhancers).

절단 효소 인식부위는, 예를 들어 제한 엔도뉴클레아제, 귀소성 엔도뉴클레아제 및/또는 메가뉴클레아제에 의해 인식되는 서열을 포함한다. 절단 효소 인식부위의 표적화 통합(상동성-의존적 또는 상동성-독립적 메커니즘에 의한)은 게놈이 특정 효소에 의해서 절단될 수 있는 하나의 부위만을 함유하는 세포를 생성하는데 유용하다. 이러한 세포를 단일 부위를 인식하여 절단하는 효소와 접촉시킴으로써 이후의 외래 서열의 표적화 통합(상동성-의존적 또는 상동성-독립적 메커니즘) 및/또는 절단된 부위에서의 표적화 돌연변이가 용이해진다.The cleavage enzyme recognition site includes, for example, a sequence recognized by a restriction endonuclease, an endogenous endonuclease, and / or a meganuclease. Targeting integration of cleavage enzyme recognition sites (by homology-dependent or homology-independent mechanisms) is useful for generating cells that contain only one site where the genome can be cleaved by a particular enzyme. By contacting such cells with an enzyme that recognizes and cleaves a single site, targeting integration (homology-dependent or homology-independent mechanism) of subsequent foreign sequences and / or targeted mutation at the truncated site is facilitated.

절단 효소 인식부위의 한 예는 귀소성 엔도뉴클레아제 I-SceI에 의해 인식되는 것인데, 이것은 서열: TAGGGATAACAGGGTAAT(SEQ ID NO:213)을 가진다. 예를 들어, U.S. 특허 No. 6,833,252를 참조한다. 추가의 전형적인 귀소성 엔도뉴클레아제는 I-CeuI, PI-PspI, PI-Sce, I-SceIV, I-CsmI, I-PanI, I-SceII, I-PpoI, I-SceIII, I-CreI, I-TevI, I-TevII 및 I-TevIII를 포함한다. 이것들의 인식 서열은 공지되어 있다. 또한, U.S. 특허 No. 5,420,032; Belfort et al. (1997) Nucleic Acids Res. 25:3379-3388; Dujon et al. (1989) Gene 82:115-118; Perler et al. (1994) Nucleic Acids Res. 22, 1125-1127; Jasin (1996) Trends Genet. 12:224-228; Gimble et al. (1996) J. Mol. Biol. 263:163-180; Argast et al. (1998) J. Mol. Biol. 280:345-353 및 New England Biolabs 카탈로그를 참조한다.One example of a cleavage enzyme recognition site is recognized by the endogenous endonuclease I- Sce I, which has the sequence: TAGGGATAACAGGGTAAT (SEQ ID NO: 213). See, for example, U.S. Pat. 6,833,252. Additional exemplary endogenous endonuclease agents include I- Ceu I, PI- Psp I, PI- Sce , I- Sce IV, I- Csm I, I- Pan I, I- Sce II, I- Ppo I, Sce III, I- Cre I, I- Tev I, I- Tev II and I- Tev III. These recognition sequences are known. In addition, US Pat. 5,420,032; Belfort et al. (1997) Nucleic Acids Res. 25: 3379-3388; Dujon et al. (1989) Gene 82: 115-118; Perler et al. (1994) Nucleic Acids Res. 22,1125-1127; Jasin (1996) Trends Genet. 12: 224-228; Gimble et al. (1996) J. Mol. Biol. 263: 163-180; Argast et al. (1998) J. Mol. Biol. 280: 345-353 and the New England Biolabs catalog.

대부분의 귀소성 엔도뉴클레아제의 절단 특이성은 그것의 인식부위에 대해서 절대적이지는 않지만, 인식부위는 귀소성 엔도뉴클레아제 인식부위의 단일 카피를 함유하는 세포에서 귀소성 엔도뉴클레아제를 발현시킴으로써 포유류-규모 게놈 당 단일 절단 사건이 획득될 수 있을 정도의 충분한 길이를 가진다. 또한, 절단 효소가 비-자연적 표적 부위에 결합하도록 조작될 수 있다는 것도 보고된바 있다. 예를 들어, Chevalier et al. (2002) Molec. Cell 10:895-905; Epinat et al. (2003) Nucleic Acids Res. 31:2952-2962; Ashworth et al. (2006) Nature 441:656-659를 참조한다.Although the cleavage specificity of most of the endocytotic endo-nuclease is not absolute for its recognition site, the recognition site is a mammalian-nociceptive site by expressing an endogenous endonuclease in cells containing a single copy of the endogenous endonuclease recognition site, Lt; RTI ID = 0.0 > a < / RTI > single truncation event per size genome. It has also been reported that cleavage enzymes can be engineered to bind to non-natural target sites. For example, Chevalier et al. (2002) Molec. Cell 10: 895-905; Epinat et al. (2003) Nucleic Acids Res. 31: 2952-2962; Ashworth et al. (2006) Nature 441: 656-659.

귀소성 엔도뉴클레아제를 사용하여 표적화 재조합 및 통합을 획득하는 이전의 방법은 인식부위의 표적화 삽입이 극도로 비효과적이며, 때문에 원하는 위치에 삽입된 인식부위를 함유한 세포를 확인하기 위한 힘든 스크리닝 과정이 필요하다는 문제가 있었다. 본 방법은 DNA-절단 효소 인식부위의 매우-효율적인 표적화 통합(상동성-의존적 또는 상동성-독립적)을 허용함으로써 이런 문제들을 극복한다.Previous methods for obtaining targeted recombination and integration using the endogenous endonuclease have been extremely ineffective in targeting the recognition site and therefore require a tough screening procedure to identify cells containing the recognition site inserted at the desired location There was a problem that it was necessary. This method overcomes these problems by allowing highly efficient targeting integration (homology-dependent or homology-independent) of DNA-cleaving enzyme recognition sites.

어떤 구체예에서, 표적화 통합은 RNA 발현 구성체, 예를 들어 마이크로 RNA 또는 siRNA의 조절된 발현을 초래하는 서열을 삽입하는데 유용하다. 상기 설명된 바와 같은 프로모터, 인핸서 및 추가의 전사 조절 서열이 또한 RNA 발현 구성체에 통합될 수 있다.In some embodiments, targeting integration is useful for inserting sequences that result in regulated expression of an RNA expression construct, e. G., MicroRNA or siRNA. Promoters, enhancers and additional transcriptional control sequences as described above may also be integrated into the RNA expression constructs.

표적화 통합이 상동성-의존적 메커니즘에 의해 발생하는 구체예에서, 도너 서열은 외래 서열의 측면 영역에서 충분한 상동성을 함유함으로써 게놈 서열에 있는 이중-가닥 브레이크의 상동성-지정 수선을 지원하며, 이로써 게놈 표적 부위에 외래 서열이 삽입된다. 따라서, 도너 핵산은 상동성-의존적 수선 메커니즘(예를 들어, 상동성 재조합)에 의한 외래 서열의 통합을 지원할 만큼 충분한 어떤 크기를 가질 수 있다. 어떤 특정 이론에 결부시키기 원하지 않지만, 외래 서열 측면의 상동성 영역이 이중-가닥 브레이크 부위에 있는 유전 정보의 재합성을 위한 주형을 파괴된 염색체 단부에 제공할 것으로 생각된다.In embodiments in which targeting integration occurs by a homology-dependent mechanism, donor sequences support homology-directed repairs of double-stranded brakes in the genomic sequence by containing sufficient homology in the lateral regions of the foreign sequence, A foreign sequence is inserted at the genome target site. Thus, the donor nucleic acid can be of any size sufficient to support the integration of foreign sequences by a homology-dependent repair mechanism (e. G., Homologous recombination). Although not wishing to be bound to any particular theory, it is believed that the homology region of the exogenous sequence side will provide a template for the resynthesis of the genetic information at the double-stranded break site on the destroyed chromosome end.

본원에 개시된 바와 같은 외래 서열의 표적화 통합은 단백질 발현을 위한 세포 및 셀라인을 생성하는데 사용될 수 있다. 예를 들어, 공동 소유의 U.S. 특허출원 공개 No. 2006/0063231(이것의 명세서는 모든 목적을 위하여 그 전문이 본원에 참고자료로 포함된다)를 참조한다. 게놈에 통합된 외래 서열에 의해 암호화된 하나 이상의 단백질의 최적 발현을 위하여, 염색체 통합 부위는, 바람직하게는 광범위한 세포 타입 및 발생 단계에서, 통합된 서열의 높은 수준의 전사와 양립가능해야 한다. 그러나, 여러 가지 중에서도 특히, 통합 부위의 게놈의 염색질 구조 때문에 통합 부위에 따라 통합된 서열의 전사가 변한다는 것이 관찰되었다. 따라서, 통합된 서열의 높은 수준의 전사를 지원하는 게놈 표적 부위가 바람직하다. 어떤 구체예에서는 또한, 외래 서열의 통합이 하나 이상의 세포성 유전자(예를 들어, 종양유전자)의 이소성 활성화를 야기하지 않는 것이 바람직할 것이다. 한편, 프로모터 및/또는 인핸서 서열을 통합시키는 경우에는 이소성 발현이 바람직할 수 있다.Targeting integration of foreign sequences as disclosed herein can be used to generate cells and cell lines for protein expression. For example, U.S. Pat. Patent application publication no. 2006/0063231 (the disclosure of which is incorporated herein by reference in its entirety for all purposes). For optimal expression of one or more proteins encoded by foreign sequences integrated into the genome, the chromosomal integration site should preferably be compatible with high levels of transcription of the integrated sequence, in a wide variety of cell types and developmental stages. However, it has been observed that, among other things, the transcription of the integrated sequence varies depending on the integration site due to the chromatin structure of the genome of the integration site. Thus, genomic targeting sites that support high levels of transcription of integrated sequences are desirable. In certain embodiments, it may also be desirable that the integration of the foreign sequence does not result in ectopic activation of one or more cellular genes (e. G., Oncogenes). On the other hand, when promoter and / or enhancer sequences are integrated, ectopic expression may be preferable.

어떤 구체예에서, 필수 유전자(예를 들어, 세포 생존성에 필수적인 유전자)에는 통합 부위가 존재하지 않는 것이 바람직하며, 이로써 외래 유전자의 통합으로 인해서 상기 필수 유전자의 비활성화는 일어나지 않는다. 한편, 유전자 기능을 무력하게 할 목적이라면(즉, 유전자 "녹-아웃"의 생성), 내인성 유전자를 파괴할 수 있는 외래 서열의 표적화 통합이 효과적인 방법이다. 이런 경우, 외래 서열은 내인성 유전자의 전사를 차단하거나, 또는 비-기능적 번역 산물, 예를 들어 선택적으로 검출가능한 아미노산 서열의 짧은 패치(상기 참조)를 생성할 수 있는 어떤 서열일 수 있다. 어떤 구체예에서, 외래 서열은 표적화 통합을 겪은 세포의 선택을 허용하는 마커 유전자(상기 설명된)를 포함할 수 있다.In some embodiments, it is desirable that no integral site be present in the essential gene (e.g., a gene essential for cell viability), thereby resulting in inactivation of the essential gene due to integration of the foreign gene. On the other hand, if it is intended to nullify the function of the gene (ie, the generation of the gene "knock-out"), integration of targeting of foreign sequences capable of destroying the endogenous gene is an effective method. In this case, the foreign sequence may be any sequence capable of blocking the transcription of the endogenous gene, or producing a non-functional translation product, e. G., A short patch (see above) of an optionally detectable amino acid sequence. In certain embodiments, the foreign sequence may comprise a marker gene (described above) that allows selection of cells that have undergone targeted integration.

필수 유전자를 암호화하지 않으면서 거기에 통합된 서열의 높은 수준의 전사를 지원하는 염색체 영역의 비제한적인 예는 Rosa26 및 CCR5 유전자좌를 포함한다.Non-limiting examples of chromosomal regions that support high levels of transcription of the sequences integrated therein without encoding the essential gene include the Rosa26 and CCR5 loci.

Rosa26 유전자좌는 뮤린 게놈에서 확인되었다. Zambrowicz et al. (1997) Proc. Natl. Acad. Scl. ㄹSA 94:3789-3794. 마우스 Rosa26 mRNA의 서열이 인간 cDNA 스크리닝 데이터와 비교되었으며(Strausberg et al.(2002) Proc. Natl. Acad. Scl. USA 99:16899-16903), 본 발명자들에 의해서 상동성 인간 전사체가 검출되었다. 따라서, Rosa26의 인간 상동체가 본원에 설명된 방법 및 조성물을 사용하여 인간 세포 및 셀라인의 게놈에 외래 서열을 통합시키기 위한 표적 부위로서 사용될 수 있다.The Rosa26 locus was identified in the murine genome. Zambrowicz et al. (1997) Proc. Natl. Acad. Scl. D SA 94: 3789-3794. The sequence of mouse Rosa26 mRNA was compared to human cDNA screening data (Strausberg et al. (2002) Proc. Natl. Acad. Scl. USA 99: 16899-16903) and homologous human transcripts were detected by the present inventors. Thus, human homologues of Rosa26 can be used as target sites for integrating foreign sequences into the genome of human cells and cell lines using the methods and compositions described herein.

CCR5 게놈 서열(CCR5-Δ32와 같은 대립유전자 변이체를 포함하여)은 본 분야에 잘 공지되어 있다. 예를 들어, Liu et al. (1996) Cell 367-377 참조.The CCR5 genomic sequence (including allelic variants such as CCR5- [Delta] 32) is well known in the art. For example, Liu et al. (1996) Cell 367-377.

통합된 서열의 높은 수준의 전사를 지원하는 추가의 게놈 표적 부위는 개방 염색질 영역 또는, 예를 들어 공동 소유의 U.S. 특허출원 공개 2002/0064802(2002. 5.30) 및 2002/0081603(2002. 6.27)에 설명된 "접근가능한 영역"으로서 확인될 수 있다. Additional genomic targeting sites that support high levels of transcription of the integrated sequences may be introduced into the open chromatin region or, Can be identified as an "accessible area" as described in patent application publication 2002/0064802 (May 5, 2002) and 2002/0081603 (June 2002).

게놈 서열에서 이중-가닥 브레이크의 존재는 외래 서열의 상동성-의존적 통합(즉, 상동성 재조합)을 촉진할 뿐만 아니라 이중-가닥 브레이크 부위에서 게놈에 외래 서열의 상동성-독립적 통합을 촉진한다. 따라서, 본원에 설명된 조성물 및 방법은 게놈 서열의 표적화 절단 후, 표적화 절단 부위에 또는 근처에 외래 서열을 비-상동성-의존적 통합시키는데 사용될 수 있다. 예를 들어, 본원에 설명된 대로, 게놈의 관심 영역에서 절단하도록 조작된 하나 이상의 ZFP-절단 도메인(또는 절단 하프-도메인) 융합 단백질(또는, 이러한 융합 단백질을 암호화하는 하나 이상의 폴리뉴클레오티드) 및 관심 영역에 대해 상동성이 없는 외래 서열을 포함하는 폴리뉴클레오티드가 세포와 접촉됨으로써, 관심 영역에 외래 서열 전체 또는 일부가 통합된 세포가 획득될 수 있다.The presence of double-stranded brakes in the genomic sequence not only promotes homology-dependent integration (i.e., homologous recombination) of foreign sequences, but also promotes homology-independent integration of foreign sequences into the genome at the double-stranded break site. Thus, the compositions and methods described herein can be used to non-homologously integrate foreign sequences at or near the targeted cleavage site after targeted cleavage of the genomic sequence. (Or at least one polynucleotide that encodes such a fusion protein) engineered to cleave in the region of interest of the genome, as described herein, and a second ZFP-cleaved domain (or truncated half-domain) fusion protein A polynucleotide comprising a foreign sequence that is not homologous to the region may be contacted with the cell so that a cell in which all or part of the foreign sequence is integrated into the region of interest can be obtained.

본원에 설명된 상동성-의존적 및 -독립적 방식의 표적화 통합(즉, 게놈에 외래 서열의 삽입)은 모두 여러 목적에 사용될 수 있다. 이들은, 제한되는 것은 아니지만, 세포의 게놈에 유전자나 cDNA 서열을 통합시킴으로써 상기 세포에 의한 유전자 또는 cDNA의 전사 및/또는 번역 산물의 발현을 가능하게 하는 것을 포함한다. 질환 또는 병인이 다수의 돌연변이(예를 들어, 유전자 서열 전체에 분포된 다중 점 돌연변이) 중 하나에 기인할 수 있는 상황에서는 야생형 유전자의 cDNA 카피의 표적화 통합(상동성-의존적 또는 상동성-독립적)이 특히 효과적이다. 예를 들어, 이러한 야생형 cDNA가 모든 공지된 돌연변이의 미번역 리더 서열 또는 유전자 상류의 제 1 엑손에 삽입된다. 번역 리딩 프레임이 보존되는 어떤 통합체에서, 그 결과는 야생형 cDNA가 발현되고, 그 발현이 적합한 내인성 전사 조절 서열에 의해 조절되는 것이다. 추가의 구체예에서, 이러한 통합된 cDNA 서열은 야생형 cDNA의 하류와 돌연변이 내인성 유전자의 상류에 배치된 전사(및/또는 번역) 종결 신호를 포함할 수 있다. 이 방식에서, 질환-원인 유전자의 야생형 카피가 발현되고, 돌연변이 내인성 유전자는 발현되지 않는다. 다른 구체예에서, 야생형 cDNA 부분이 유전자(예를 ㄷ르어, 질환-원인 돌연변이가 군집되어 있는 유전자)의 적합한 영역에 삽입된다.
The homologous-dependent and independent approaches of targeting integration described herein (i. E., Insertion of foreign sequences into the genome) can all be used for several purposes. These include, but are not limited to, allowing expression of a gene or cDNA transcription and / or translation product by the cell by integrating the gene or cDNA sequence into the genome of the cell. (Homology-dependent or homology-independent) of the cDNA copies of the wild-type gene in situations where the disease or etiology may be attributable to one of a number of mutations (e. G., Multipoint mutations distributed throughout the gene sequence) This is particularly effective. For example, such wild-type cDNA is inserted into the first translocation sequence of all known mutants or the first exon of the gene upstream. In some integrations in which the translation leader frame is conserved, the result is that the wild-type cDNA is expressed and its expression is regulated by suitable endogenous transcriptional control sequences. In a further embodiment, such an integrated cDNA sequence may comprise a transcription (and / or translation) termination signal downstream of the wild-type cDNA and upstream of the mutant endogenous gene. In this manner, a wild-type copy of the disease-causing gene is expressed, and the mutant endogenous gene is not expressed. In another embodiment, the wild-type cDNA portion is inserted into a suitable region of the gene (eg, the gene where the disease-causing mutation is clustered).

실시예Example 1:  One: 표적화된Targeted 재조합에 의한 염색체  Chromosome by recombination hSMClL1hSMClL1 유전자의 편집  Editing a gene

hSMC IL1 유전자는 발아 효모의 염색체 1 구조 보존 유전자와 같은 기능을 하는 인간 유전자(오르토로그)이다. Walker ATPase 도메인을 포함하는 단백질의 아미노 말단부분을 암호화하는 영역에서 표적화된 절단 및 재조합에 의해 돌연변이를 유도하였다. 징크핑거 DNA 결합도메인 및 FokI 절단 하프도메인을 포함하는 가공의 뉴클레아제를 설계하여 메티오닌 개시코돈(뉴클레오티드 24~26, 도 1) 부위와 결합시킴으로써, 상기 개시코돈의 표적화된 절단을 하였다. 이렇게 하여, 하나는 뉴클레오티드 23 ~ 34(도 1에 나타냈듯이 상부 나선을 따라 일차적 접촉)를 인지하고 다른 하나는 뉴클레오티드 5 ~ 16(하부 나선을 따라 일차적 접촉)을 인지하는, 두 개의 징크핑거 결합도메인을 설계하였다. 미국특허 제6,453,242호 및 제6,534, 261호에 제시된 방법으로 징크핑거 단백질을 설계하였다. 상기 징크핑거 단백질의 인지영역의 아미노산에 대해서는 표 2를 참조하라. The hSMC IL1 gene is a human gene (ortholog) that functions as a chromosome 1 conserved gene of germination yeast. Mutations were induced by targeted cleavage and recombination in the region encoding the amino terminal portion of the protein containing the Walker ATPase domain. The engineered nuclease, including the zinc finger DNA binding domain and the Fokl cleavage half domain, was engineered and targeted cleavage of the initiation codon by binding to the methionine initiation codon (nucleotides 24-26, Figure 1) site. Thus, one recognizes nucleotides 23-34 (primary contact along the upper helix as shown in Figure 1) and the other recognizes nucleotides 5-16 (primary contact along the lower helix), two zinc finger combinations Domain. Zinc finger proteins were designed by the methods described in U.S. Patent Nos. 6,453,242 and 6,534,261. See Table 2 for the amino acids of the recognition region of the zinc finger protein.

이들 두 ZFP 결합도메인을 각각 암호화하는 서열을 FokI 절단 하프도메인을 암호화하는 서열(천연 FokI 서열의 아미노산 384~579; Kita et al.(1989) J. Biol. Chem. 264: 5751-5756)과 융합하여, 상기 암호화된 단백질이 카르복시 말단의 FokI 서열 및 아미노 말단의 ZFP 서열을 포함하도록 하였다. 그 후, 상기 융합 서열을 편집된 포유류 pcDNA3 발현 벡터 내에서 복제하였다(도 2). A sequence encoding each of these two ZFP binding domains was fused to a sequence encoding the Fok I cleavage half domain (amino acids 384 to 579 of the natural Fok I sequence; Kita et al. (1989) J. Biol. Chem. 264: 5751-5756) Such that the encoded protein contained the FokI sequence at the carboxy terminus and the ZFP sequence at the amino terminus. The fusion sequence was then replicated in an edited mammalian pcDNA3 expression vector (Figure 2).

hSMClL1 유전자에 대한 징크핑거 설계Design of zinc finger for hSMClL1 gene 표적서열Target sequence F1F1 F2F2 F3F3 F4F4 CATGGGGTTCCT
(SEQ ID NO: 27)
CATGGGGTTCCT
(SEQ ID NO: 27)
RSHDLIE
(SEQ ID NO: 28)
RSHDLIE
(SEQ ID NO: 28)
TSSSLSR
(SEQ ID NO: 29)
TSSSLSR
(SEQ ID NO: 29)
RSDHLST
(SEQ ID NO: 30)
RSDHLST
(SEQ ID NO: 30)
TNSNRIT
(SEQ ID NO: 31)
TNSNRIT
(SEQ ID NO: 31)
GCGGCGCCGGCG
(SEQ ID NO: 32)
GCGGCGCCGGCG
(SEQ ID NO: 32)
RSDDLSR
(SEQ ID NO: 33)
RSDDLSR
(SEQ ID NO: 33)
RSDDRKT
(SEQ ID NO: 34)
RSDDRKT
(SEQ ID NO: 34)
RSEDLIR
(SEQ ID NO: 35)
RSEDLIR
(SEQ ID NO: 35)
RSDTLSR
(SEQ ID NO: 36)
RSDTLSR
(SEQ ID NO: 36)
주: 위에 제시된 징크핑거 아미노산 서열(한 문자 코드)은 각각의 징크핑거의 알파나선 개시 부분과 관련된 -1 내지 +6의 잔기를 나타낸다. 핑거 F1은 상기 단백질의 아미노 말단에 가장 가깝게, 핑거 F4는 카르복시 말단에 가장 가깝게 위치한다. Note: The above zinc finger amino acid sequence (one letter code) represents residues -1 to +6 associated with the alpha helical start of each zinc finger. Finger F1 is located closest to the amino terminus of the protein, and finger F4 is located closest to the carboxy terminus.

도너 DNA 분자는 하기의 방법으로 얻었다. 먼저, HEK293 세포로부터 얻은 게놈 DNA를 주형으로 사용하여, 인간 hSMCIL1 유전자의 제1엑손을 포함하는 X 염색체(2003년 7월에 공개된 UCSC 인간 게놈)의 "-" 나선의 뉴클레오티드 52415936 ~ 52416635로 표시되는 인간 게놈 DNA의 700개 염기쌍 절편을 증폭시켰다. 증폭용으로 사용된 프라이머의 서열은 표 3에 제시하였다("초기 amp 1" 및 "초기 amp 2"). 그 후, 표준 중복 확장 PCR법을 사용(Ho, et al. (1989) 유전자 77: 51-59 참조), 상기 PCR 생성물을 변경하여 서열 ATGGGG(도 1의 뉴클레오티드 24~29)를 ATAAGAAGC로 교체하였다. 상기 변화에 의해서 ATG 코돈(메티오닌)은 ATA 코돈(이소로이신)으로 전환되고 서열 AGAAGC는 GGG(도 1의 뉴클레오티드 27~29)로 교체되어, 재조합을 수반하는 도너 유도 서열 및 내인성 염색체 서열을 식별할 수 있게 되었다. 개시코돈의 특정영역 내의 염색체 DNA의 서열 및 염색체 서열과 다른 도너 DNA의 서열을 포함하는 hSMC 1 유전자의 개요도는 도 3에 제시하였다. 상기 700 개의 염기쌍 도너 절편은 인간 게놈과 상동성이 있는 서열을 전혀 포함하지 않는 pCR4BluntTopo 내에서 복제되었다. 도 4 참조.The donor DNA molecule was obtained by the following method. First, nucleotides 52415936 to 52416635 of the "-" helix of the X chromosome (UCSC human genome disclosed in July 2003) containing the first exon of the human hSMCIL1 gene were used as genomic DNAs obtained from HEK293 cells as a template Of the human genomic DNA was amplified. The sequences of the primers used for amplification are shown in Table 3 ("early amp 1" and "early amp 2"). Subsequently, the PCR product was changed to replace the sequence ATGGGG (nucleotides 24-29 of FIG. 1) with ATAAGAAGC using standard redundant extension PCR (Ho et al. (1989) Gene 77: 51-59 . By this change, the ATG codon (methionine) is converted to the ATA codon (isoleucine) and the sequence AGAAGC is replaced by GGG (nucleotides 27-29 in Figure 1) to identify the donor-derived and endogenous chromosomal sequences involving recombination It was possible. A schematic of the hSMC 1 gene, which contains the sequence of the chromosomal DNA within a specific region of the initiation codon and the sequence of the donor DNA other than the chromosomal sequence, is shown in Fig. The 700 base pair donor fragment was cloned in pCR4BluntTopo, which does not contain any sequences homologous to the human genome. See FIG.

염색체 HSMCIL1 유전자의 표적화된 돌연변이를 일으키기 위해 Lipofectamine 2000

20um에는 몇 dna ug ul

(Invitrogen)을 사용하여 두 개의 플라스미드를 1 x 106 HEK293 세포 내로 도입하였다. ZFP FokI 융합을 암호화하는 두 개의 플라스미드만에 의해 감염된 세포, 도너 플라스미드만에 의해 감염된 세포 및 대조용 플라스미드(pEGFP N1, Clontech)에 의해 감염된 세포를 대조군으로 하였다. 5% C02 , 37℃ 하에서 세포를 배양하였다. 48시간 동안 감염시킨 후, 세포로부터 게놈 DNA를 분리하였고, 그 중 200 ng을 PCR 증폭용 주형으로 사용하였다. 도너 서열과 상동성이 있는 영역의 유전자의 외부 영역과 상보성인 프라이머(X 염색체의 "-" 나선 상의 뉴클레오티드 52416677 ~ 52416701, 2003년 7월 UCSC) 및 삽입된 돌연변이와 구분되는 도너 분자의 영역과 상보성이 있는 다른 프라이머를 사용하여 증폭하였다. 만일 표적화된 재조합이 발생하지 않는다면, 상기 두 개의 프라이머를 사용하여 400개 염기쌍의 증폭생성물을 게놈 DNA로부터 얻을 수 있다. 프라이머 서열은 표 3과 같다(각각 "염색체 특이성" 및 "도너 특이성"이라고 표시). 증폭조건은 2분 동안 94 ℃, 30초 동안 94 ℃로 40회 순환, 1분 동안 60 ℃, 1분 동안 72 ℃ 및 최종 단계에서 7분 동안 72 ℃로 하였다.To induce the targeted mutation of the chromosome HSMCIL1 gene, Lipofectamine 2000

20um에는 몇 dna ug ul

(Invitrogen) was used to introduce two plasmids into 1 x 106 HEK293 cells. Cells infected with only two plasmids encoding ZFP FokI fusion, cells infected only with donor plasmids, and cells infected with control plasmids (pEGFP N1, Clontech) were used as controls. Cells were cultured at 37 ° C at 5% CO 2 . After infection for 48 hours, genomic DNA was isolated from the cells, of which 200 ng was used as a template for PCR amplification. Primer (complementary nucleotide 52416677 to 52416701 on the "-" helix of the X chromosome, UCSC on July 2003) complementary to the region of the gene in the region homologous to the donor sequence and complementary region of the donor molecule separated from the inserted mutation Were amplified using different primers. If no targeted recombination occurs, the two primers can be used to obtain 400 base pairs of amplification products from the genomic DNA. The primer sequences are shown in Table 3 (labeled "chromosome specificity" and "donor specificity", respectively). The amplification conditions were 94 ° C for 2 minutes, 40 cycles of 94 ° C for 30 seconds, 60 ° C for 1 minute, 72 ° C for 1 minute and 72 ° C for 7 minutes at the final stage.

분석결과(도 5)는 400개 염기쌍 증폭생성물(상기 도에서는 "가공의 DNA"로 표시)이 두 개의 플라스미드 및 두 개의 ZFP FokI 플라스미드에 의해 감염된 세포로부터 추출한 DNA만으로 얻어졌음을 보여준다.The results of the analysis (Fig. 5) show that the 400 base pair amplification products (denoted as "working DNA" in the above figure) were obtained only from DNA extracted from the cells infected with two plasmids and two ZFP FokI plasmids.

hSMClL1 유전자용 증폭 프라이머amplification primer for hSMClL1 gene 초기 amp 1Early amp 1 AGCAACAACTCCTCCGGGGATC (SEQ ID NO: 37) AGCAACAACTCCTCCGGGGATC (SEQ ID NO: 37) 초기 amp 2Early amp 2 TTCCAGACGCGACTCTTTGGC (SEQ ID NO: 38) TTCCAGACGCGACTCTTTGGC (SEQ ID NO: 38) 염색체 특이성Chromosome specificity CTCAGCAAGCGTGAGCTCAGGTCTC (SEQ ID NO: 39) CTCAGCAAGCGTGAGCTCAGGTCTC (SEQ ID NO: 39) 도너 특이성Donor specificity CAATCAGTTTCAGGAAGCTTCTT (SEQ ID NO: 40) CAATCAGTTTCAGGAAGCTTCTT (SEQ ID NO: 40) 외부 1External 1 CTCAGCAAGCGTGAGCTCAGGTCT (SEQ ID NO: 41) CTCAGCAAGCGTGAGCTCAGGTCT (SEQ ID NO: 41) 외부 2External 2 CGGGTCAAGTAAGGCTGGGAAGC (SEQ ID NO: 42) CGGGTCAAGTAAGGCTGGGAAGC (SEQ ID NO: 42)

상기 결과를 확인하기 위하여, 두 개의 추가적인 실험을 실시하였다. 먼저, 상기 증폭생성물을 pCR4Blunt Topo(Invitrogen) 내에서 복제한 후, 뉴클레오티드 서열을 확정하였다. 도 6(SEQ ID NO: 6)에서 보듯이, 두 개의 ZFP FokI 암호화 플라스미드 및 도너 플라스미드에 의해 감염된 세포의 염색체 DNA로부터 얻은 증폭서열은 도너 분자 내에 존재하지 않는 염색체 서열(도 6의 뉴클레오티드 32~97)과 공유결합하는 도너에 특이적인 AAGAAGC 서열(도 6의 뉴클레오티드 395~401)을 포함하고 있으며, 이로부터 상기 도너 서열이 염색체와 재조합하였음을 알 수 있다. 특히, 개시코돈이 이소로이신 코돈으로 전환되는 G→A 돌연변이가 서열의 395 위치에서 관찰된다. To confirm the above results, two additional experiments were performed. First, the amplification product was cloned in pCR4Blunt Topo (Invitrogen), and the nucleotide sequence was confirmed. As shown in FIG. 6 (SEQ ID NO: 6), the amplification sequence obtained from the chromosomal DNA of the cells infected by the two ZFP FokI-encoding plasmids and the donor plasmid contains a chromosomal sequence not present in the donor molecule (nucleotides 32 to 97 ) (Fig. 6, nucleotides 395 to 401), indicating that the donor sequence was recombined with the chromosome. In particular, a G? A mutation in which the initiation codon is converted to the isoleucine codon is observed at position 395 of the sequence.

두 번째 실험에서는, 도너 플라스미드만에 의해 감염된 세포, 두 개의 ZFP FokI 융합 플라스미드에 의해 감염된 세포, 도너 플라스미드 및 두 개의 ZFP FokI 융합 플라스미드에 의해 감염된 세포 또는 EGFP 대조용 플라스미드에 의해 감염된 세포로부터 얻은 염색체 DNA를 증폭용 주형으로 사용했다. 도너 서열 및 염색체 서열과 상동성이 있는 700개 뉴클레오티드 영역의 외부 서열(표 3에서 "외부 1" 및 "외부 2"로 표시)과 상보성이 있는 프라이머를 사용하여 증폭하였다. 얻어진 증폭생성물을 정화하여 위에서 서술한 도너 특이성 및 염색체 특이성 프라이머(표 3)를 이용한 증폭반응의 주형으로 사용하였다. 증폭에 의해서 도너 구조 및 두 개의 ZFP FokI 융합 구조에 의해 감염된 세포로부터 400개 뉴클레오티드 생성물만을 얻었으며, 이 생성물은 세포 내의 표적화된 재조합에 의해서 게놈서열을 교체해서 얻은 경우와 일치했다. In the second experiment, cells infected by donor plasmids alone, cells infected with two ZFP FokI fusion plasmids, donor plasmids and cells infected with two ZFP FokI fusion plasmids or cells infected with EGFP-positive plasmids Was used as an amplification template. Amplified using primers complementary to the external sequence of the 700 nucleotide region (designated as "Outer 1" and "Outer 2" in Table 3) that are homologous to the donor and chromosomal sequences. The obtained amplification product was purified and used as a template for the amplification reaction using the donor specificity and chromosome specific primers (Table 3) described above. By amplification, only 400 nucleotide products were obtained from the donor construct and the cells infected by the two ZFP FokI fusion constructs, consistent with the case where the product was obtained by replacing the genomic sequence by targeted recombination in the cell.

실시예 2: 표적화된 재조합에 의한 염색체 IL2Rγ 유전자의 편집 Example 2: Editing chromosomal IL2R? Gene by targeted recombination

IL 2Rγ 유전자는 "일반 사이토카인 수용체 감마 체인"으로 알려져 있고 몇몇 인터루킨 수용체의 서브유닛으로 기능하는 단백질(IL 2R, IL 4R, IL 7R, IL 9R, IL 15R 및 IL 21R를 포함)을 암호화한다. 제3엑손의 5' 말단(예를 들어, 티로신 91 코돈)을 포함하는 상기 유전자 내의 돌연변이는 X 연관 중증합병 면역결핍증(SCID)의 원인이 될 수 있다(Puck et al. (1997) Blood 89: 1968-1977 참조). 티로신 91 코돈(SEQ ID NO: 7의 뉴클레오티드 23~25, 도 7) 내의 돌연변이를 표적화된 절단 및 재조합에 의해서 IL 2Rγ 유전자 내로 도입하였다. 두 쌍의 징크핑거 단백질을 설계하여 표적화된 절단을 하였다. 첫 번째 쌍(표 4의 처음의 두 칼럼)은 뉴클레오티드 29~40(도 7에 제시된 바와 같이 상부 나선을 따라 일차적으로 접촉)과 결합하도록 설계된 징크핑거 단백질과 뉴클레오티드 8~20(하부 나선을 따라 일차적으로 접촉)과 결합하도록 설계된 징크핑거 단백질을 포함한다. 두 번째 쌍(표 4의 3번째 및 4번째 칼럼)은 뉴클레오티드 23~34(도 7에 제시된 바와 같이 상부 나선을 따라 일차적으로 접촉)을 인지하는 징크핑거 단백질과 뉴클레오티드 8~16(하부 나선을 따라 일차적으로 접촉)을 인지하는 징크핑거 단백질을 포함한다. 미국특허 제6,453,242호 및 제6,534,261호의 방법에 따라서 징크핑거 단백질을 설계했다. 상기 징크핑거 단백질의 인지영역의 아미노산에 대해서는 표 4를 참조하라. The IL 2Rγ gene encodes a protein known as the "general cytokine receptor gamma chain" and which functions as a subunit of several interleukin receptors (including IL 2R, IL 4R, IL 7R, IL 9R, IL 15R and IL 21R). Mutations in the gene, including the 5 'terminus of the third exon (e.g., tyrosine 91 codon), can cause X-linked severe combined immunodeficiency syndrome (SCID) (Puck et al. (1997) Blood 89: 1968-1977). Mutations in the tyrosine 91 codon (nucleotides 23-25 of SEQ ID NO: 7, Figure 7) were introduced into the IL2Ry gene by targeted cleavage and recombination. Two pairs of zinc finger proteins were designed and targeted cleavage was performed. The first pair (the first two columns of Table 4) contains a zinc finger protein designed to bind nucleotides 29-40 (primary contact along the top helix as shown in FIG. 7) and nucleotides 8-20 Lt; RTI ID = 0.0 > a < / RTI > zinc finger protein. The second pair (the third and fourth column of Table 4) contains a zinc finger protein that recognizes nucleotides 23-34 (first contact along the upper helix as shown in Figure 7) and nucleotides 8-16 Lt; RTI ID = 0.0 > primary < / RTI > contact). Zinc finger proteins were designed according to the methods of U.S. Patent Nos. 6,453,242 and 6,534,261. See Table 4 for the amino acids of the recognition region of the zinc finger protein.

ZFP 결합도메인을 암호화하는 서열을 FokI 절단 하프도메인을 암호화하는 서열(천연 FokI 서열의 아미노산 384~579, Kita et al., supra)과 융합시켜, 암호화된 단백질이 카르복시 말단의 FokI 서열 및 아미노 말단의 ZFP 서열을 포함하도록 하였다. 그 후, 각각의 상기 융합 서열을 편집된 포유류 pcDNA3 발현 벡터 내에서 복제하였다. 상기 구조의 개요도에 대해서는 도 8를 참조하라. The sequence encoding the ZFP binding domain was fused with a sequence encoding the FokI cleavage half domain (amino acids 384-579 of the native FokI sequence, Kita et al., Supra), so that the encoded protein was flanked by the FokI sequence at the carboxy terminus and the amino terminus ZFP < / RTI > Each of the fusion sequences was then cloned in an edited mammalian pcDNA3 expression vector. See FIG. 8 for a schematic view of the structure.

IL2Rγ 유전자에 대한 징크핑거 설계Design of zinc finger for IL2Rγ gene 표적서열Target sequence F1F1 F2F2 F3F3 F4F4 AACTCGGATAAT
(SEQ ID NO: 43)
AACTCGGATAAT
(SEQ ID NO: 43)
DRSTLIE
(SEQ ID NO: 44)
DRSTLIE
(SEQ ID NO: 44)
SSSNLSR
(SEQ ID NO: 45)
SSSNLSR
(SEQ ID NO: 45)
RSDDLSK
(SEQ ID NO: 46)
RSDDLSK
(SEQ ID NO: 46)
DNSNRIK
(SEQ ID NO: 47)
DNSNRIK
(SEQ ID NO: 47)
TAGAGGaGAAAGG
(SEQ ID NO: 48)
TAGAGGaGAAAGG
(SEQ ID NO: 48)
RSDNLSN
(SEQ ID NO: 49)
RSDNLSN
(SEQ ID NO: 49)
TSSSRIN
(SEQ ID NO: 50)
TSSSRIN
(SEQ ID NO: 50)
RSDHLSQ
(SEQ ID NO: 51)
RSDHLSQ
(SEQ ID NO: 51)
RNADRKT
(SEQ ID NO: 52)
RNADRKT
(SEQ ID NO: 52)
TACAAGAACTCG
(SEQ ID NO: 53)
TACAAGAACTCG
(SEQ ID NO: 53)
RSDDLSK
(SEQ ID NO: 54)
RSDDLSK
(SEQ ID NO: 54)
DNSNRIK
(SEQ ID NO: 55)
DNSNRIK
(SEQ ID NO: 55)
RSDALSV
(SEQ ID NO: 56)
RSDALSV
(SEQ ID NO: 56)
DNANRTK
(SEQ ID NO: 57)
DNANRTK
(SEQ ID NO: 57)
GGAGAAAGG
(SEQ ID NO: 58)
GGAGAAAGG
(SEQ ID NO: 58)
RSDHLTQ
(SEQ ID NO: 59)
RSDHLTQ
(SEQ ID NO: 59)
QSGNLAR
(SEQ ID NO: 60)
QSGNLAR
(SEQ ID NO: 60)
RSDHLSR
(SEQ ID NO: 61)
RSDHLSR
(SEQ ID NO: 61)
주: 위에 제시된 징크핑거 아미노산 서열(한 문자 코드)은 각각의 징크핑거의 알파나선 개시 부분과 관련된 -1 내지 +6의 잔기를 나타낸다. 핑거 F1은 상기 단백질의 아미노 말단과 가장 가깝게 위치한다.Note: The above zinc finger amino acid sequence (one letter code) represents residues -1 to +6 associated with the alpha helical start of each zinc finger. Finger F1 is located closest to the amino terminus of the protein.

도너 DNA 분자는 하기의 방법으로 얻었다. 먼저, K562 세포로부터 얻은 게놈 DNA를 주형으로 사용하여, IL2Rγ 유전자의 엑손 3을 포함하는 X 염색체(2003년 7월, UCSC)의 "-" 나선 상의 69196910~69197609위치에 일치하는 인간 DNA의 700 개 염기쌍 절편을 증폭시켰다(도 9 참조). 증폭용으로 사용된 프라이머의 서열은 표 5와 같다(초기 amp 1 및 초기 amp 2로 표시). 그 후, 표준 중복 확장 PCR법을 사용하여(Ho, et al., supra) PCR 생성물을 변경, 서열 TACAAGAACTCGGATAAT(SEQ ID NO: 62)를 TAAAAGAATTCCGACAAC(SEQ ID NO: 63)로 교체하였다. 상기 교체에 의해서 뉴클레오티드 25(도 7)에서 점 돌연변이가 발생하여 티로신 91 코돈 TAC가 TAA 말단 코돈으로 전환되며, 코돈 91의 하류 내의 서열이 다르기 때문에 재조합을 수반하는 도너 유도 서열 및 내인성 염색체 서열을 식별할 수 있게 된다. 생성된 700 개의 염기쌍 절편은 인간 게놈과 상동성이 있는 서열을 전혀 포함하지 않는 pCR4BluntTopo 내에서 복제되었다(도 10 참조).The donor DNA molecule was obtained by the following method. First, 700 genomic DNAs corresponding to positions 69196910 to 69197609 on the "- " spiral of the X chromosome (UCSC, July 2003) containing the exon 3 of the IL2R gamma gene were obtained using genomic DNA obtained from K562 cells as a template Base pair sections were amplified (see FIG. 9). The sequences of the primers used for amplification are shown in Table 5 (indicated by initial amp 1 and initial amp 2). Subsequently, the PCR product was changed (Ho, et al., Supra) using the standard redundant extension PCR method, and the sequence TACAAGAACTCGGATAAT (SEQ ID NO: 62) was replaced with TAAAAGAATTCCGACAAC (SEQ ID NO: 63). Due to this substitution, a point mutation occurs in nucleotide 25 (FIG. 7), tyrosine 91 codon TAC is converted to TAA terminal codon, and the sequence in the downstream of codon 91 is different, so that donor-inducible sequence and endogenous chromosome sequence . The generated 700 base pair fragment was cloned in pCR4BluntTopo, which does not contain any sequences homologous to the human genome (see FIG. 10).

염색체의 IL 2Rγ 유전자의 표적화된 돌연변이를 유발하기 위해, 리포펙션/일렉트로포레이션 혼합물(Amaxa)을 사용하여 한 쌍의 ZFP FokI 융합의 각각을 암호화하는 두 개의 플라스미드 및 도너 플라스미드를 2 x 106 K652 세포 내로 도입하였다. 각 ZFP/FokI 쌍(표 4 참조)을 테스트하였다. ZFP FokI 융합을 암호화하는 두 개의 플라스미드만에 의해 감염된 세포, 도너 플라스미드만에 의해 감염된 세포를 대조군으로 하였다. 5% C02, 37℃에서 세포를 배양하였다. 48시간 동안 감염시킨 후, 세포로부터 게놈 DNA를 분리하였고, 그 중 200 ng을 PCR 증폭용 주형으로 사용하였다. 도너 서열과 상동성이 있는 영역의 유전자의 외부 영역과 상보성이 있는 하나의 프라이머(X 염색체의 "+" 나선 상의 뉴클레오티드 69196839~69196863, 2003년 7월 UCSC) 및 삽입된 돌연변이와 구별(상기 참조)되므로 염색체 DNA의 서열과 다른 서열을 지니는 도너 분자의 영역과 상보성이 있는 다른 프라이머를 사용하여 증폭하였다. 만일 표적화된 재조합이 발생하지 않는다면, 상기 두 개의 프라이머를 사용하여 400개 염기쌍의 증폭생성물을 게놈 DNA로부터 얻을 수 있다. 프라이머 서열은 표 3과 같다(각각 "염색체 특이성" 및 "도너 특이성"이라고 표시). 증폭조건은 2분 동안 94 ℃, 30초 동안 94 ℃로 40회 순환, 1분 동안 60 ℃, 1분 동안 72 ℃ 및 최종 단계에서 7분 동안 72 ℃로 하였다.To induce a targeted mutation of the chromosomal IL 2R gamma gene, two plasmids and donor plasmids encoding each of a pair of ZFP FokI fusions using a lipofection / electroporation mixture (Amaxa) were resuspended in 2 x 10 6 K652 Lt; / RTI > Each ZFP / FokI pair (see Table 4) was tested. Cells infected by only two plasmids encoding ZFP FokI fusion, and cells infected only by donor plasmids, served as controls. Cells were cultured at 37 ° C in 5% CO 2 . After infection for 48 hours, genomic DNA was isolated from the cells, of which 200 ng was used as a template for PCR amplification. One primer (nucleotides 69196839 to 69196863 on the "+" helix of the X chromosome, UCSC on July 2003) and discrimination from the inserted mutations (see above) complementary to the outside region of the gene in the region of homology with the donor sequence And amplified using another primer complementary to the region of the donor molecule having a sequence that is different from the sequence of the chromosomal DNA. If no targeted recombination occurs, the two primers can be used to obtain 400 base pairs of amplification products from the genomic DNA. The primer sequences are shown in Table 3 (labeled "chromosome specificity" and "donor specificity", respectively). The amplification conditions were 94 ° C for 2 minutes, 40 cycles of 94 ° C for 30 seconds, 60 ° C for 1 minute, 72 ° C for 1 minute and 72 ° C for 7 minutes at the final stage.

분석결과(도 11)는 기대된 크기의 증폭생성물(500 개의 염기쌍)이 상기 ZFP FokI 암호화 플라스미드 중 한 쌍 및 상기 도너 플라스미에 의해 감염된 세포에서 추출한 DNA로부터 얻어졌음을 보여준다. 한 쌍의 ZFP만을 암호화하는 플라스미드에 의해 감염된 세포로부터 얻은 DNA는 물론 상기 도너 플라스미만에 의해 감염된 세포로부터 감염된 DNA에서도도 500개 bp의 생성물이 얻어지지 않았다. The results of the analysis (Figure 11) show that amplified products of the expected size (500 base pairs) were obtained from DNA extracted from cells infected with the pair of ZFP FokI-encoding plasmids and the donor plasmid. A product of 500 bp was not obtained even from the DNA obtained from the cells infected by the plasmid encoding only a pair of ZFPs and also from the DNA infected from the cells infected by less than the donor plasmids.

IL 2Rγ 유전자용 증폭 프라이머Amplification primers for the IL 2Rγ gene 초기 amp 1Early amp 1 TGTCGAGTACATGAATTGCACTTGG (SEQ ID NO: 64) TGTCGAGTACATGAATTGCACTTGG (SEQ ID NO: 64) 초기 amp 2Early amp 2 TTAGGTTCTCTGGAGCCCAGGG (SEQ ID NO: 65) TTAGGTTCTCTGGAGCCCAGGG (SEQ ID NO: 65) 염색체 특이성Chromosome specificity CTCCAAACAGTGGTTCAAGAATCTG (SEQ ID NO: 66) CTCCAAACAGTGGTTCAAGAATCTG (SEQ ID NO: 66) 도너 특이성Donor specificity TCCTCTAGGTAAAGAATTCCGACAAC(SEQ ID NO: 67) TCCTCTAGGTAAAGAATTCCGACAAC (SEQ ID NO: 67)

위 결과를 확인하기 위해서, 두 쌍의 ZFP/FokI 융합을 사용한 상기 실험으로부터 얻은 증폭생성물을 pCR4Blunt Topo (Invitrogen) 내에서 복제한 후, 생성물의 뉴클레오티드를 확정하였다. 도 12에 제시된 바와 같이(SEQ ID NO: 12), 상기 서열은 염색체 서열 및 도너 플라스미드로부터 얻은 서열의 융합을 포함한다. 특히, 상기 서열의 43 위치에서, 티로신 91을 정지코돈으로 전환하는 G→A 돌연변이가 관찰된다. 위치 43~58은 상기 도너의 특징적인 뉴클레오티드를 포함하며, 뉴클레오티드 32~42 및 59~459는 상기 도너 및 염색체의 공통적인 서열이며, 뉴클레오티드 460~552는 상기 염새체의 특징적인 서열이다. 도너가 아닌 염색체 내에 존재하는 서열과 공유결합하는 도너 특징적 서열이 존재함은 도너 플라스미드로부터 얻은 DNA가 상동 재조합에 의해서 염색체 내로 도입되었을 보여준다. To confirm the above results, the amplification product from the above experiment using two pairs of ZFP / FokI fusion was cloned in pCR4Blunt Topo (Invitrogen) and the nucleotide of the product was confirmed. As shown in Figure 12 (SEQ ID NO: 12), the sequence includes fusion of sequences derived from chromosomal and donor plasmids. Specifically, at position 43 of the sequence, a G? A mutation that converts tyrosine 91 to a stop codon is observed. Nucleotides 32-42 and 59-459 are the common sequences of the donor and chromosome, and nucleotides 460-552 are the characteristic sequences of the salt mars. The presence of a donor characteristic sequence covalently linked to a sequence present in the chromosome rather than the donor indicates that the DNA from the donor plasmid was introduced into the chromosome by homologous recombination.

실시예 3: 표적화된 재조합에 의한 염색체 β 글로빈 유전자의 편집 Example 3: Editing chromosomal beta globin gene by targeted recombination

인간 베타 글로빈 유전자는 성인 인간 적혈구 내의 헤모글로빈의 구조 및 기능을 담당하는 두 가지 유전자 중 하나다. 베타 글로빈 유전자 내의 돌연 변이는 겸상 적혈구 빈혈증의 원인을 제공할 수 있다. 두 개의 징크핑거 단백질은 돌연 변이를 일으킨 경우 겸상 적혈구 빈혈증의 원인이 되는 서열 주변에 위치하는 상기 서열 내에 결합하도록 고안되었다. 도 13은 인간 베타 글로빈 유전자의 뉴클레오티드 서열을 나타내며, 상기 서열 내의 징크핑거 단백질에 대한 표적 부위에는 밑줄이 그어있다. 두 개의 징크핑거 단백질의 인지 영역의 아미노산 서열은 표 6에 나타낸다. 상기 두 개의 ZFP 결합 도메인 각각을 코드화한 서열은 FokI 절단 하프 도메인을 코드화한 서열과 융합되어, 내생적인 베타 글로빈 유전자에 표적화된 가공된 ZFP 뉴클레아제를 생성했다. 그 후, 상기 융합 서열의 각각은 포유류 pcDNA3. 1 발현 벡터 내에서 복제되었다(도 14). The human beta globin gene is one of two genes responsible for the structure and function of hemoglobin in adult human red blood cells. Mutations in the beta globin gene can contribute to sickle cell anemia. Two zinc finger proteins are designed to bind within the sequence located around the sequence that causes sickle cell anemia when mutated. Figure 13 shows the nucleotide sequence of the human beta globin gene, and the target site for the zinc finger protein in the sequence is underlined. The amino acid sequences of the recognition regions of the two zinc finger proteins are shown in Table 6. Sequences encoding each of the two ZFP binding domains were fused with a sequence encoding the FokI truncated half domain to generate engineered ZFP nuclease targeted to the endogenous beta globin gene. Each of the fusion sequences was then cloned into mammalian pcDNA3. 1 expression vector (Fig. 14).

베타 글로빈 유전자에 대한 징크핑거 설계Design of zinc finger for beta globin gene 표적 서열Target sequence F1F1 F2F2 F3F3 F4F4 GGGCAGTAACGG
(SEQ ID NO: 68)
GGGCAGTAACGG
(SEQ ID NO: 68)
RSDHLSE
(SEQ ID NO: 69)
RSDHLSE
(SEQ ID NO: 69)
QSANRTK
(SEQ ID NO: 70)
QSANRTK
(SEQ ID NO: 70)
RSDNLSA
(SEQ ID NO: 71)
RSDNLSA
(SEQ ID NO: 71)
RSQNRTR
(SEQ ID NO: 72)
RSQNRTR
(SEQ ID NO: 72)
AAGGTGAACGTG
(SEQ ID NO: 73)
AAGGTGAACGTG
(SEQ ID NO: 73)
RSDSLSR
(SEQ ID NO: 74)
RSDSLSR
(SEQ ID NO: 74)
DSSNRKT
(SEQ ID NO:75)
DSSNRKT
(SEQ ID NO: 75)
RSDSLSA
(SEQ ID NO: 76)
RSDSLSA
(SEQ ID NO: 76)
RNDNRKT
(SEQ ID NO: 77)
RNDNRKT
(SEQ ID NO: 77)
주: 위에 제시된 징크핑거 아미노산 서열(한 문자 코드)은 징크핑거 각각의 알파 나선 개시 부분과 관련된 -1 내지 +6의 잔기를 나타낸다. 핑거 F1은 상기 단백질의 아미노 말단에 가깝게 위치하며, 핑거 F4는 카르복시 말단에 가깝게 위치한다.Note: The above zinc finger amino acid sequence (one letter code) represents residues -1 to +6 associated with the alpha helical start of each zinc finger. Finger F1 is located close to the amino terminus of the protein, and finger F4 is located close to the carboxy terminus.

도너 DNA 분자는 하기의 방법으로 얻었다. 먼저, K562 세포로부터 얻은 게놈 DNA를 주형으로 사용하는 PCR에 의해서, 염색체 11(BLAT, UCSC 인간 게놈 부위)의 "-" 나선 상의 뉴클레오티드 5212134 ~ 5212833위치에 일치하는 인간 DNA의 700 개 염기쌍 절편을 증폭시켰다. 증폭용으로 사용된 프라이머의 서열은 표 7에서 나타낸다(초기 증폭 프라이머 1 및 초기 증폭 프라이머 2로 표시). 생성된 증폭 절편은 인간 베타 글로빈 유전자의 프로모터, 두 개의 제1 엑손 및 제1 프로톤에 일치하는 서열을 포함한다. 상기 베타 글로빈 서열 내의 엑손 1 및 2, 제1 인트론 및 프라이머 결합 부위의 위치를 나타내는 개요도에 대해서는 도 15를 참조하라. 그 후, 상기 복제된 생성물을 PCR에 의해서 또 한번 개조해서, 서열The donor DNA molecule was obtained by the following method. First, 700 base pair fragments of human DNA corresponding to the nucleotides 5212134 to 5212833 on the "-" helix of chromosome 11 (BLAT, UCSC human genome region) were amplified by PCR using genomic DNA obtained from K562 cells as a template . The sequences of the primers used for amplification are shown in Table 7 (denoted as initial amplification primer 1 and initial amplification primer 2). The resulting amplification fragment contains a promoter of the human beta globin gene, sequences corresponding to the two first exons and the first proton. See Figure 15 for a schematic diagram illustrating the location of exons 1 and 2, the first intron, and the primer binding site in the beta globin sequence. Thereafter, the replicated product was further modified by PCR,

CCGTTACTGCCCTGTGGGGCAAGGTGAACGTG(SEQ ID NO: 78)이CCGTTACTGCCCTGTGGGGCAAGGTGAACGTG (SEQ ID NO: 78)

gCGTTAgTGCCCGAATTCCGAtcGTcAACcae(SEQ ID NO: 79)로 교체(볼드체에서 교체)된 뉴클레오티드 305 ~ 336(도 13에 나타낸 대로)의 서열 교체 부위를 삽입시켰다. 상기 교체 부위 중 어떤 부위(소문자로 표시)는 ZFP/FokI 융합단백질이 염색체 내로 융합된 도너 서열을 절단하거나 그 도너 서열에 결합하지 못하도록 특별하게 가공되었다. 또한, 상기 서열 교체 부위는 재조합을 수반하는 도너 및 내생적인 염색체 서열과 구별된다. 생성된 700 개의 염기쌍 절편은 인간 게놈과 상동성을 가지는 어떤 서열도 포함하지 않는 pCR4 TOPO 내에서 복제되었다(도 16). g CGTTA g TGCCC GAATTCCGAtc GT c AAC cae (SEQ ID NO: 79) was inserted into the sequence replacing part of the replacement (replacement in bold) the nucleotide 305-336 (as shown in Fig. 13). Some of the replacement sites (in lower case) have been specially processed to prevent the ZFP / FokI fusion protein from digesting the donor sequence fused into the chromosome or binding to the donor sequence. In addition, the sequence replacement sites are distinguished from donor and endogenous chromosomal sequences involving recombination. The resulting 700 base pair fragments were replicated in pCR4 TOPO that does not contain any sequence homologous to the human genome (Figure 16).

염색체의 베타 글로빈 유전자의 표적화된 돌연 변이를 일으키기 위해서, Nucleofector™ 용액(Amaxa Biosystems)을 사용하여 감염시킴으로써 ZFP FokI 융합및 도너 플라스미드(pCR4 TOPO HBB 도너)를 코드화한 두 개의 플라스미드를 1 x 106 K652 세포 내로 삽입했다. ZFP FokI 융합을 코드화한 두 개의 플라스미드 100 ng(로) 또는 200 ng(하이)만으로 감염된 세포, 도너 플라스미드 200 ng(로) 또는 600 ng(하이)만으로 감염된 세포, GFP 코드화 플라스미드로 감염된 세포 및 모의 감염 세포를 조절했다. 10% 우태혈청(FBS)(Hyclone) 및 L 글루타민 10 mM를 추가한 RPMI 배지 1640(Invitrogen) 내에서 세포를 배양했다. 5 % CO2의 분위기 하에서 37 ℃로 세포를 유지했다. 72 시간 동안 감염시킨 후, 상기 세포로부터 게놈 DNA를 분리하였고, 그 중 200 ng을 PCR 증폭용 주형으로 사용하였다. 상기 증폭에서, 도너 서열과 상동성을 가지는 영역의 유전자의 바깥 영역과 상보성이 있는 하나의 프라이머(염색체 11의 "-" 나선 상의 뉴클레오티드 5212883 ~ 5212905) 및 상기 도너 서열 내로 삽입된 돌연 변이와 구별 도너 분자의 영역과 상보성이 있는 또 다른 프라이머(상동 참조)를 사용한다. 상기 프라이머 서열은 표 7에서 제시된다(각각 "염색체 특이성 프라이머" 및 "도너 특이성 프라이머"이라고 표시). 만일 표적화된 재조합이 발생하지 않는다면, 상기 두 개의 프라이머를 사용하여 415개 염기쌍의 증폭 생성물을 게놈 DNA로부터 얻을 수 있다. DNA 로딩을 조절하기 위해서, 초기 증폭 프라이머 1 및 초기 증폭 프라이머 2를 사용하여 PCR 반응을 실행했다. 이 경우, PCR 반응 각각에 유사한 량의 게놈 DNA를 첨가했다. 증폭을 위한 조건으로 2분 동안 95 ℃, 30초 동안 95 ℃로 40회 순환, 45초 동안 60 ℃, 2분 동안 68 ℃ 및 최종 단계에서 10분 동안 68 ℃를 순차적으로 가했다.Two plasmids encoding ZFP FokI fusion and donor plasmids (pCR4 TOPO HBB donor) were infected with Nucleofector (TM) solution (Amaxa Biosystems) to generate targeted mutations of the beta globin gene of the chromosome in 1 x 106 K652 Lt; / RTI > Cells infected with only 100 ng of the two plasmids encoding ZFP FokI fusion or 200 ng (high), cells infected with only 200 ng (donor) plasmid or 600 ng (high) donor plasmid, cells infected with GFP- Cells were regulated. Cells were cultured in RPMI medium 1640 (Invitrogen) supplemented with 10% fetal calf serum (FBS) (Hyclone) and 10 mM L glutamine. The cells were maintained at 37 ° C in an atmosphere of 5% CO 2 . After infection for 72 hours, genomic DNA was isolated from the cells, 200 ng of which was used as a template for PCR amplification. In this amplification, one primer (nucleotides 5212883-5212905 on the "-" helix of chromosome 11) that is complementary to the outside region of the gene in the region having homology with the donor sequence, and a donor Use another primer (see homology) that is complementary to the region of the molecule. The primer sequences are shown in Table 7 (labeled "chromosome specific primer" and "donor specific primer", respectively). If no targeted recombination occurs, the two primers can be used to obtain 415 base pairs of amplification products from the genomic DNA. In order to control DNA loading, the PCR reaction was carried out using the initial amplification primer 1 and the initial amplification primer 2. In this case, a similar amount of genomic DNA was added to each of the PCR reactions. Conditions for amplification were 95 ° C for 2 minutes, 40 cycles of 95 ° C for 30 seconds, 60 ° C for 45 seconds, 68 ° C for 2 minutes and 68 ° C for 10 minutes in the final step.

이 분석의 결과(도 17)는 415개의 염기쌍 증폭 생성물이 "고" 농도의 도너 플라스미드 및 염색체 베타 글로빈 자리 내에서 표적화된 재조합이 된 도너 서열과 일치하는 두 개의 ZFP FokI 플라스미드로 감염된 세포로부터 축출한 DNA로부터 생성되었음을 나타낸다. The results of this analysis (Figure 17) show that 415 base pair amplification products were exported from infected cells with two ZFP FokI plasmids that corresponded to the recombinant donor sequences targeted in the "high" concentration donor plasmid and in the chromosome beta globulin DNA. ≪ / RTI >

인간 베타 글로빈 유전자용 증폭 프라이머Amplification primers for human beta globin gene 초기 amp 1Early amp 1 TACTGATGGTATGGGGCCAAGAG(SEQ ID NO: 80)TACTGATGGTATGGGGCCAAGAG (SEQ ID NO: 80) 초기 amp 2Early amp 2 CACGTGCAGCTTGTCACAGTGC(SEQ ID NO: 81)CACGTGCAGCTTGTCACAGTGC (SEQ ID NO: 81) 염색체 특이성 Chromosome specificity TGCTTACCAAGCTGTGATTCCA(SEQ ID NO: 82)TGCTTACCAAGCTGTGATTCCA (SEQ ID NO: 82) 도너 특이성Donor specificity GGTTGACGATCGGAATTC(SEQ ID NO: 83)GGTTGACGATCGGAATTC (SEQ ID NO: 83)

상기 결과를 확인하기 위해서, 얻어진 증폭 생성물을 pCR4 TOPO(Invitrogen) 내에서 복제한 후, 상기 생성물의 뉴클레오티드를 확정했다. 도 18에 제시된 바와 같이(SEQ ID NO: 14), 상기 서열은 도너 플라스미드에서는 존재하지 않는 염색체 서열 및 도너 플라스미드의 특징적인 서열이 융합된 서열을 포함한다. 예를 들어, 상기 서열의 377 및 383 위치에서, ZEP 결합을 깨뜨리는 두 개의 C → G 돌연 변이가 관찰된다. 뉴클레오티드 377 ~ 408은 상기에서 서술된 서열의 교체 부분을 포함하는 도너 플라스미드로부터 얻은 서열이며, 뉴클레오티드 73 ~ 376은 상기 도너 및 염색체의 공통적인 서열이며, 뉴클레오티드 1 ~ 72은 상기 염색체의 특징적인 서열이다. 상기 게놈 내에서의 도너 특이적 서열과 염색체 특이적 서열 간의 공유 결합은 K562 세포의 게놈 내의 편집된 위치에서의 도너 서열을 성공적으로 재조합 하게 한다. To confirm the above results, the obtained amplification product was cloned in pCR4 TOPO (Invitrogen), and the nucleotide of the product was confirmed. As shown in Fig. 18 (SEQ ID NO: 14), the sequence includes a sequence fused with a chromosomal sequence not present in the donor plasmid and a characteristic sequence of the donor plasmid. For example, at positions 377 and 383 of the sequence, two C? G mutations that disrupt the ZEP binding are observed. Nucleotides 377 to 408 are sequences derived from a donor plasmid comprising a replacement portion of the sequence described above, nucleotides 73 to 376 are sequences common to the donor and chromosome, and nucleotides 1 to 72 are characteristic sequences of the chromosome . The covalent linkage between the donor-specific sequence and the chromosome-specific sequence in the genome will successfully recombine the donor sequence at the edited position in the genome of the K562 cell.

실시예 4: ZFP FokI 링커(ZC 링커)의 최적화.Example 4: Optimization of a ZFP FokI linker (ZC linker).

절단 효율성 면에서의 ZC 링커 길이의 효과를 테스트하기 위해서, 다양한 길이의 ZC 링커를 사용하여 네 개의 핑거 ZFC 결합 도메인을 FokI 절단 하프 도메인과 융합시켰다. ZFP에 대한 표적 부위는 5'-AACTCGGATAAT-3' (SEQ ID NO : 84)이다. 징크핑거 각각의 인지 영역(알파 나선의 개시에 관련되는 -1 내지 +6 위치)의 아미노산 서열은 하기와 같다(여기서 F1은 N이 가장 많은 징크핑거이며, F4는 C가 가장 많은 징크핑거이다).To test the effect of ZC linker length in terms of cleavage efficiency, four finger ZFC binding domains were fused with FokI truncated half domains using ZC linkers of various lengths. The target site for ZFP is 5'-AACTCGGATAAT-3 '(SEQ ID NO: 84). The amino acid sequences of the recognition regions of each of the zinc fingers (positions -1 to +6 associated with the start of the alpha helices) are as follows (where F1 is the zinc finger having the greatest number of zinc fingers and F4 is the zinc finger having the largest number of zinc fingers) .

F1: DRSTLIE (SEQ ID NO:85)F1: DRSTLIE (SEQ ID NO: 85)

F2: SSSNLSR (SEQ ID NO:86)F2: SSSNLSR (SEQ ID NO: 86)

F3: RSDDLSK (SEQ ID NO:87)F3: RSDDLSK (SEQ ID NO: 87)

F4: DNSNRIK (SEQ ID NO:88)F4: DNSNRIK (SEQ ID NO: 88)

전술한 ZEP 결합 도메인 및 FokI 절단 하프 도메인이 2, 3, 4, 5, 6 또는 10 개 아미노산 잔기에 의해서 분리되는 ZFP FokI 융합을 제조했다. 상기 단백질 각각이 4, 5, 6, 7, 8, 9, 12, 15, 16, 17, 22 또는 26개의 염기쌍에 의해서 분리된 반복부를 지닌 ZEP 표적 부위의 역 반복부를 포함하는 기질을 절단하는지에 대해서 테스트했다. The ZFP FokI fusion described above wherein the ZEP binding domain and the FokI cleavage half domain are separated by 2, 3, 4, 5, 6 or 10 amino acid residues was prepared. Whether the protein cleaves a substrate comprising an inverted repeat of the ZEP target site with repeats separated by 4, 5, 6, 7, 8, 9, 12, 15, 16, 17, 22 or 26 base pairs .

ZFP FokI 연결(ZC 링커 서열의 밑줄 부분) 영역 내 융합 구조의 아미노산 서열은 하기와 같다. The amino acid sequence of the fusion construct in the ZFP Fokl linkage (underlined portion of the ZC linker sequence) region is as follows.

10개의 잔기 링커 HTKIHLRQKDAARGSQLV (SEQ ID NO: 89) 10 residue linker HTKIH LRQKDAARGS QLV (SEQ ID NO: 89)

6개의 잔기 링커 HTKIHLRQKGSQLV (SEQ ID NO : 90) 6 residue linker HTKIH LRQKGS QLV (SEQ ID NO: 90)

5개의 잔기 링커 HTKIHLRQGSQLV (SEQ ID NO : 91) 5 residue linker HTKIH LRQGS QLV (SEQ ID NO: 91)

4개의 잔기 링커 HTKIHLRGSQLV(SEQ ID NO: 92) Four residue linkers HTKIH LRGS QLV (SEQ ID NO: 92)

3개의 잔기 링커 HTKIHLGSQLV(SEQ ID NO : 93) Three residue linkers HTKIH LGS QLV (SEQ ID NO: 93)

2개의 잔기 링커 HTKIHGSQLV (SEQ ID NO: 94) Two residue linker HTKIH GS QLV (SEQ ID NO: 94)

밑줄친 ZEP 표적 부위를 포함하는 다양한 절단 기질의 서열은 하기와 같다. The sequences of the various cleaved substrates, including the underlined ZEP target site, are as follows.

4bp 분리 4bp separation

CTAGCATTATCCGAGTTACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAATGTGTTGAGCCTATTACGATC (SEQ ID NO : 95)CTAGCATTATCCGAGTTACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA TGTGTTGAGCCTATTACGATC (SEQ ID NO: 95)

5bp 분리 5bp separation

CTAGCATTATCCGAGTTCACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGTGTTGAGCCTATTACGATC (SEQ ID NO : 96)CTAGCATTATCCGAGTTCACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA GTGTGTTGAGCCTATTACGATC (SEQ ID NO: 96)

6bp 분리 6bp separation

CTAGGCATTATCCGAGTTCACCACAACTCGGATAATGACTAGGATCCGTAATAGGCTCAAGTGGTGTTGAGCCTATTACTGATC (SEQ ID NO : 97) CTAGGCATTATCCGAGTTCACCAC AACTCGGATAAT GACTAGGATCCG TAATAGGCTCAA GTGGTGTTGAGCCTATTACTGATC (SEQ ID NO: 97)

7bp 분리 7bp separation

CTAGCATTATCCGAGTTCACACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGTGTGTTGAGCCTATTACGATC (SEQ ID NO : 98) CTAGCATTATCCGAGTTCACACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA GTGTGTGTTGAGCCTATTACGATC (SEQ ID NO: 98)

8bp 분리 8bp separation

CTAGCATTATCCGAGTTCACCACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGGTGTGTTGAGCCTATTACGATC (SEQ ID NO : 99) CTAGCATTATCCGAGTTCACCACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGGTGTGTTGAGCCTATTACGATC (SEQ ID NO: 99)

9bp 분리 9bp separation

CTAGCATTATCCGAGTTCACACACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGTGTGTGTTGAGCCTATTACGATC (SEQ ID NO : 100) CTAGCATTATCCGAGTTCACACACAC AACTCGGATAAT GCTAGGATCGTAATAGGCTCAAGTGTGTGTGTTGAGCCTATTACGATC (SEQ ID NO: 100)

12bp 분리 12bp separation

CTAGCATTATCCGAGTTCACCACCAACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGGTGGTTGTGTTGAGCCTATTACGATC (SEQ ID NO : 101) CTAGCATTATCCGAGTTCACCACCAACACAACTCGGATAATGCTAGGATCG TAATAGGCTCAA GTGGTGGTTGTGTTGAGCCTATTACGATC (SEQ ID NO: 101)

15bp 분리 15bp separation

CTAGCATTATCCGAGTTCACCACCAACCACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGGTGGTTGGTGTGTTGAGCCTATTACGATC (SEQ ID N0 : 102) CTAGCATTATCCGAGTTCACCACCAACCACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA GTGGTGGTTGGTGTGTTGAGCCTATTACGATC (SEQ ID NO: 102)

16bp 분리 16bp separation

CTAGCATTATCCGAGTTCACCACCAACCACACCAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTGGTGGTTGGTGTGGTTGAGCCTATTACGATC (SEQ ID N0 : 103) CTAGCATTATCCGAGTTCACCACCAACCACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA GTGGTGGTTGGTGTGGTTGAGCCTATTACGATC (SEQ ID NO: 103)

17bp 분리 17bp separation

CTAGCATTATCCGAGTTCAACCACCAACCACACCAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTTGGTGGTTGGTGTGGTTGAGCCTATTACGATC (SEQ ID N0 : 104) CTAGCATTATCCGAGTTCAACCACCAACCACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTCAA GTTGGTGGTTGGTGTGGTTGAGCCTATTACGATC (SEQ ID NO: 104)

22bp 분리 22 bp separation

CTAGCATTATCCGAGTTCAACCACCAACCACACCAACACAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTTGGTGGTTGGTGTGGTTGTGTTGAGCCTATTACGATC (SEQ ID NO : 105)CTAGCATTATCCGAGTTCAACCACCAACCACACCAACAC AACTCGGATAAT GCTAGGATCG TAATAGGCTC AAGTTGGTGGTTGGTGTGGTTGTGTTGAGCCTATTACGATC (SEQ ID NO: 105)

26bp 분리 26 bp separation

CTAGCATTATCCGAGTTCAACCACCAACCACACCAACACCACCAACTCGGATAATGCTAGGATCGTAATAGGCTCAAGTTGGTGGTTGGTGTGGTTGTGGTGGTTGAGCCTATTACGATC (SEQ ID N0 : 106) CTAGCATTATCCGAGTTCAACCACCAACCACACCAACACCAC AACTCGGATAAT GCTAGGATCG TAATAG GCTCAAGTTGGTGGTTGGTGTGGTTGTGGTGGTTGAGCCTATTACGATC (SEQ ID NO: 106)

표준 분자 생물학적 기술에 의해서 다른 ZFP FokI 융합단백질(상기 참조)을 코드화한 플라스미드를 제조했고, 코드화된 단백질을 발현하기 위해서 생체 외 전사/번역 시스템을 사용했다. 각각의 구조에 있어서, 선형의 플라스미드 DNA 200 ng을 TnT 혼합 20 μM하에서 배양했고, 30 ℃에서 1 시간 또는 45 분 동안 배양했다. TnT 혼합은 T7 RNA 폴리머라제(Promega) 4 μl + 메티오닌(1 mM) 2 μl + ZnCl2 (20 mM) 2.5 μl를 함유하는 TnT 용해물(Promega, Madison, WI) 100 μl를 포함한다. A plasmid encoding another ZFP FokI fusion protein (see above) was prepared by standard molecular biology techniques and an in vitro transcription / translation system was used to express the encoded protein. For each construct, 200 ng of linear plasmid DNA was cultured under 20 μM TnT mix and incubated at 30 ° C. for 1 hour or 45 minutes. TnT mixes include 100 μl of TnT lysate (Promega, Madison, WI) containing 4 μl of T7 RNA polymerase (Promega) + 2 μl of methionine (1 mM) + 2.5 μl of ZnCl 2 (20 mM).

다른 ZFP FokI 융합에 의한 DNA 절단을 분석하기 위해서, 전사/번역 반응 혼합물 1 μl를 DNA 기질(말단을 T4 폴리뉴클레오티드 키나아제를 사용하는 32P로 표지) 1 ng과 혼합시킨 후, 상기 혼합물에 FokI 절단 완충액를 가해 최종 부피가 19 μl가 되도록 희석시켰다. FokI 절단 완충액는 pH 8.5 Tris-HCl 20 mM, NaCl 75 mM, ZnCl2 10 μM, DTT 1 mM, 5% 글리세롤, BSA 500 μg/ml를 포함한다. 상기 혼합물을 37 ℃에서 1 시간 동안 배양했다. 그 후, MgCl2 8 mM를 포함하는 FokI 완충액 6.5 μl를 첨가하고, 37 ℃에서 1 시간 동안 계속해서 배양했다. 각 반응에 페놀 클로로포름 10 μl를 첨가한 후, 혼합하고, 상을 분리하기 위해 원심분리시킴으로써 단백질을 축출했다. 10% 폴리아크릴아미드 겔 상에서 전기영동을 실행하여 각 반응으로부터 얻은 수용액 상 10 μl를 분석했다.To analyze DNA cleavage by other ZFP FokI fusion, 1 μl of the transcription / translation reaction mixture was mixed with 1 ng of DNA substrate (labeled with 32 P using T4 polynucleotide kinase at the terminus) and FokI cut The buffer was added and diluted to a final volume of 19 μl. The FokI digestion buffer contains 20 mM of pH 8.5 Tris-HCl, 75 mM of NaCl, 10 μM of ZnCl 2 , 1 mM of DTT, 5% glycerol, 500 μg / ml of BSA. The mixture was incubated at 37 DEG C for 1 hour. Then, 6.5 μl of FokI buffer containing 8 mM of MgCl 2 was added and incubated at 37 ° C for 1 hour. 10 [mu] l of phenol chloroform was added to each reaction, followed by mixing and centrifugation to separate the phases. Electrophoresis was performed on a 10% polyacrylamide gel to analyze 10 μl of the aqueous solution from each reaction.

상기 겔을 방사선 사진 촬영했다. 절단되거나 절단되지 않은 기질에 상응하는 밴드 내의 방사능을 정량하고, 얻어진 전체 방사능을 합하고, 절단 생성물에 해당하는 밴드 내에 존재하는 전체 방사능의 퍼센트를 결정함으로써, ZFP FokI 융합/기질 쌍 각각에 대한 절단 효율을 계산했다. The gel was photographed by radiography. The cut efficiency for each ZFP FokI fusion / substrate pair was determined by quantifying radioactivity in the bands corresponding to the cleaved or uncut substrate and summing the total radioactivity obtained and determining the percentage of total radioactivity present in the band corresponding to the cleavage product Respectively.

이 실험의 결과는 표 8에 나타난다. 이 데이터에 의해서 표적 부위를 분리하기 위한 최적의 절단 효율을 제공하는 ZC 링커를 선택할 수 있다. 또한, 이 데이터에 의해서 표적 부위의 표적화된 절단을 하지만, 원하던 절단 부위와 다른 유사 ZEP 표적 부위를 구별할 수 있다. The results of this experiment are shown in Table 8. With this data, a ZC linker can be selected which provides optimal cutting efficiency for separating the target site. This data also allows targeted cleavage of the target site, but can distinguish the desired cleavage site from other pseudo-ZEP target sites.

다양한 ZC 링커 길이 및 다양한 결합 부위의 분리를 위한 DNA 절단 효율*DNA cleavage efficiency for various ZC linker lengths and separation of various binding sites * 2 잔기2 residues 3 잔기3 residues 4 잔기4 residues 5 잔기5 residues 6 잔기6 residues 10 잔기10 residues 4 bp4 bp 74 %74% 81 %81% 74 %74% 12 %12% 6 %6% 4 %4 % 5 bp5 bp 61 %61% 89 %89% 92 %92% 80 %80% 53 %53% 40 %40% 7 bp7 bp 15 % 15% 55 %55% 80 %80% 80 %80% 70 %70% 80 %80% 8 bp8 bp 0 %0 % 0 %0 % 8 %8 % 11 %11% 22 %22% 63 %63% 9 bp9 bp 2 %2 % 6 %6% 23 %23% 9 %9% 13 %13% 51 %51% 12 bp12 bp 8 %8 % 12 %12% 22 %22% 40 %40% 69 %69% 84 %84% 15 bp15 bp 73 %73% 78 %78% 97 %97% 92 %92% 95 %95% 88 %88% 16 bp16 bp 59 %59% 89 %89% 100 %100% 97 %97% 90 %90% 86 %86% 17 bp17 bp 5 %5% 22 %22% 77 %77% 71 %71% 85 %85% 82 %82% 22 bp22 bp 1 %One % 3 %3% 5 %5% 8 %8 % 18 %18% 58 %58% 26 bp26 bp 1 %One % 2 %2 % 35 %35% 36 %36% 84 %84% 78 %78% * 칼럼은 ZEP 및 FokI 절단 하프 도메인을 분리하는 잔기의 수를 포함하는 다른 ZFP FokI 융합 구조를 나타낸다. 상기 줄은 ZEP 표적 부위의 역 반복부를 분리하는 염기쌍의 수를 포함하는 다른 DNA 기질을 나타낸다.* Columns represent other ZFP FokI fusion constructs including the number of residues separating the ZEP and FokI cleavage half domains. The strand represents another DNA substrate comprising the number of base pairs separating the inverted repeats of the ZEP target site.

4 개의 잔기 링커를 포함하는 ZFP FokI 융합에 있어서, 상기 링커의 아미노산 서열을 변화시켰다. 분리 구조에 있어서, 원형 LRGS 링커 서열(SEQ ID NO : 107)을 LGGS(SEQ ID NO : 108), TGGS(SEQ ID NO : 109), GGGS(SEQ ID NO : 110), LPGS(SEQ ID NO : 111), LRKS(SEQ ID NO : 112) 및 LRWS(SEQ ID NO : 113)로 교체했다. 결합 부위 사이에서 6개의 염기쌍 분리를 포함하는 기질 상에서 얻어진 융합 체를 테스트했다. LGGS(SEQ ID NO : 108) 링커 서열을 포함하는 융합이 원형 LRGS 서열(SEQ ID NO : 107)을 포함하는 융합보다 더 효과적으로 절단함이 관찰되었다. LRKS(SEQ ID NO : 112) 및 LRWS(SEQ ID NO : 113) 서열을 포함하는 융합은 LRGS 서열(SEQ ID NO: 107)을 포함하는 융합보다 덜 효과적으로 절단했지만, 나머지 융합의 절단 효율은 원형 LRGS 서열(SEQ ID NO : 107)을 포함하는 융합의 절단 효율과 비슷했다. In the ZFP FokI fusion involving four residue linkers, the amino acid sequence of the linker was varied. (SEQ ID NO: 108), TGGS (SEQ ID NO: 109), GGGS (SEQ ID NO: 110), LPGS (SEQ ID NO: 111), LRKS (SEQ ID NO: 112) and LRWS (SEQ ID NO: 113). Fusions obtained on a substrate containing six base pair separations between binding sites were tested. It was observed that the fusion involving the LGGS (SEQ ID NO: 108) linker sequence more efficiently cleaved than the fusion comprising the circular LRGS sequence (SEQ ID NO: 107). Fusion containing the LRKS (SEQ ID NO: 112) and LRWS (SEQ ID NO: 113) sequences cuts less efficiently than the fusion comprising the LRGS sequence (SEQ ID NO: 107) Was similar to the cleavage efficiency of the fusion containing the sequence (SEQ ID NO: 107).

실시예 5: 이량체화 인터페이스 내의 FokI 절단 하프 도메인을 개조함으로써 향상된 절단 특이성 Example 5: Improved cleavage specificity by modifying the FokI cleavage half-domain in the dimerization interface

IL 2Rγ 유전자의 제5 엑손 내의 표적 부위에 결합하도록 한 쌍의 ZFP/FokI 융합단백질(5 ~ 8 및 5 ~ 10으로 표시)을 고안하여, 표적 부위 사이 영역 내에서의 절단을 향상시켰다. 두 개의 융합단백질의 표적 서열을 포함하는 유전자와 관련되는 영역은 도 19에 나타낸다. 5 ~ 8 단백질의 아미노산 서열은 도 20에 나타내고, 5 ~ 10 단백질의 아미노산 서열은 도 21 에 나타낸다. 이 두 단백질은 10 개의 아미노산 ZC 링커을 포함한다. 상기 단백질의 징크핑거 부분에 관련하여, 상기 징크핑거 내의 인지 영역의 DNA 표적 서열 및 아미노산 서열은 표 9에 제시된다. A pair of ZFP / FokI fusion proteins (designated by 5 to 8 and 5 to 10) were designed to bind to the target site in the fifth exon of the IL 2R gamma gene to improve cleavage in the region between the target sites. The region associated with the gene containing the target sequence of the two fusion proteins is shown in Fig. The amino acid sequence of the 5 to 8 protein is shown in Fig. 20, and the amino acid sequence of 5 to 10 protein is shown in Fig. These two proteins contain 10 amino acid ZC linkers. With respect to the zinc finger portion of the protein, the DNA target sequence and amino acid sequence of the recognition region in the zinc finger are shown in Table 9.

IL 2Rγ 유전자용 징크핑거 설계 Design of zinc finger for IL 2Rγ gene 융합fusion 표적 서열Target sequence F1F1 F2F2 F3F3 F4F4 5 ~ 8
5 ~ 8
ACTCTGTGGAAG
(SEQ ID NO: 114)
ACTCTGTGGAAG
(SEQ ID NO: 114)
RSDNLSE
(SEQ ID NO: 115)
RSDNLSE
(SEQ ID NO: 115)
RNAHRIN
(SEQ ID NO : 116)
RNAHRIN
(SEQ ID NO: 116)
RSDTLSE
(SEQ ID NO: 117)
RSDTLSE
(SEQ ID NO: 117)
ARSTRTT
(SEQ ID NO : 118)
ARSTRTT
(SEQ ID NO: 118)
5 ~ 105 to 10 AACACGaAACGTG
(SEQ NO : 119)
AACACGaAACGTG
(SEQ ID NO: 119)
RSDSLSR
(SEQ ID NO : 120)
RSDSLSR
(SEQ ID NO: 120)
DSSNRKT
(SEQ ID NO : 121)
DSSNRKT
(SEQ ID NO: 121)
RSDSLSV
(SEQ ID NO: 122)
RSDSLSV
(SEQ ID NO: 122)
DRSNRIT
(SEQ ID NO : 123)
DRSNRIT
(SEQ ID NO: 123)
주: 위에 제시된 징크핑거 아미노산 서열(한 문자 코드)은 징크핑거 각각의 알파 나선 개시 부분과 관련된 -1 내지 +6의 잔기를 나타낸다. 핑거 F1은 상기 단백질의 아미노 말단에 가깝게 위치한다.Note: The above zinc finger amino acid sequence (one letter code) represents residues -1 to +6 associated with the alpha helical start of each zinc finger. Finger F1 is located close to the amino terminus of the protein.

표적 서열을 포함하는 표시된 DNA 주형을 사용하고 특징적인 분해 생성물을 분석함으로써, 융합단백질의 표적 서열 사이에서 DNA를 특이적으로 절단하는 것이 촉진된 융합단백질 쌍의 효능(도 19 참조)을 생체 외 테스트했다. 두 개의 단백질을 사용한 경우 특이적인 절단이 가능했다(표 10, 첫 번째 줄). 그러나, 5 ~ 10 융합단백질(야생형 FokI 절단 하프 도메인을 포함)은 자체 이량체화이 가능하기 때문에 5 ~ 8 단백질이 없는 비표적 부위에서의 비정상적인 절단을 실행할 수 있다(표 10, 두 번째 줄). By using the indicated DNA template containing the target sequence and analyzing the characteristic degradation products, the efficacy of the fusion protein pairs promoted to specifically cleave the DNA between the target sequences of the fusion protein (see Figure 19) did. When two proteins were used, specific cleavage was possible (Table 10, first line). However, since 5 to 10 fusion proteins (including the wild-type FokI cleavage half domain) are capable of self dimerization, abnormal cleavage at non-target sites without 5 to 8 proteins can be performed (Table 10, second row).

따라서, 글루탐산(E)을 리신(K)로 아미노산 잔기 490을 전환함으로써, FokI 절단 하프 도메인 내에서 5 ~ 10을 편집했다(FokI 단백질 내의 아미노산 잔기의 번호 매김은 Wah et al., supra.를 따른다). 상기 편집은 이량체화 인터페이스 내의 아미노산 잔기를 개조함으로써 동일 이량체화을 막도록 고안됐다. 모체 5 ~ 10 단백질과 다르게, 5 ~ 10(E490K) 돌연 변이는 5 ~ 8 융합단백질이 없는 비정상적인 부위를 절단할 수 없었다(표 10, 줄 3). 그러나, 5 ~ 8 단백질과 함께 5 ~ 10(E490K) 돌연변이는 기질의 특이적 절단을 촉진했다(표 10, 줄 4). 따라서, 이량체화을 수반하는 5 ~ 10의 절단 하프 도메인 내의 잔기를 개조하여 자체 이량체화에 따른 상기 융합단백질에 의한 비정상적인 절단을 막았다.또한, E490R 돌연 변이는 모체 단백질보다 낮은 수준의 동일 이량체화을 나타낸다. Thus, 5 to 10 were edited within the FokI cleavage half domain by converting glutamic acid (E) to amino acid residue 490 with lysine (K) (numbering of amino acid residues in the FokI protein follows Wah et al., Supra. ). The editing is designed to prevent the same dimerization by modifying the amino acid residues in the dimerization interface. Unlike maternal 5-10 protein, the 5 to 10 (E490K) mutation failed to cleave an abnormal site without 5 to 8 fusion proteins (Table 10, line 3). However, 5 to 10 (E490K) mutations with 5-8 proteins promoted substrate specific cleavage (Table 10, line 4). Thus, residues within the truncated half-domain of 5 to 10 involving dimerization were modified to prevent abnormal cleavage by the fusion protein due to its dimerization. The E490R mutation also exhibits lower levels of homodimerization than the parent protein.

또한, 486에 위치하는 글루타민(Q)을 글루탐산(E)으로 교체함으로써, 5 ~ 8 단백질은 그것의 이량체화 인터페이스에서 개질 되었다. 야생형 5 ~ 10 단백질 또는 5 ~ 10(E490K) 돌연변이 내에서의 표적화된 절단을 촉진하는 상기 5 ~ 8(Q486E) 돌연변이를 테스트했다. 표시된 기질이 두 5 ~ 8(Q486E) 및 야생형 5 ~ 10 내에서 배양된 경우, DNA의 절단이 관찰되지 않았다(표 10, 줄 5). 그러나, 5 ~ 8(Q486E) 및 5 ~ 10(E490K) 돌연변이를 같이 사용한 경우, 절단이 발생했다(표 10, 줄 6). Also, by replacing glutamine (Q) at 486 with glutamic acid (E), 5-8 proteins were modified at its dimerization interface. The 5 to 8 (Q486E) mutations that promote targeted cleavage in wild type 5-10 protein or 5-10 (E490K) mutants were tested. No DNA cleavage was observed (Table 10, line 5) when the indicated substrates were cultured in two 5-8 (Q486E) and wild-type 5-10. However, when 5 to 8 (Q486E) and 5 to 10 (E490K) mutations were used together, cleavage occurred (Table 10, line 6).

이 결과는 하나 또는 두 개의 융합단백질 내의 절단 하프 도메인의 아미노산 서열을 개조함으로써, 두 개의 융합단백질의 표적 서열에 의해서 정의된 것과는 다른 영역에서의 ZFP/FokI 융합단백질 쌍에 의한 DNA의 절단이 최소화되거나 폐지됨을 의미한다.This result suggests that by modifying the amino acid sequence of the cleavage half domain in one or two fusion proteins, the cleavage of the DNA by the ZFP / FokI fusion protein pair in a region other than that defined by the target sequence of the two fusion proteins is minimized It means that it is abolished.

야생형 및 돌연 변이 절단 하프 도메인을 포함하는 ZFP/FokI 융합단백질 쌍에 의한 DNA 절단DNA cleavage by a pair of ZFP / FokI fusion proteins including wild type and mutant truncation half domains ZFP 5 ~ 8 결합 도메인ZFP 5-8 binding domains ZFP 5 ~ 10 결합 도메인ZFP 5 to 10 binding domains DNA 절단DNA cutting 1One 야생형 FokIWild type FokI 야생형 FokIWild type FokI 특이성Specificity 22 비 존재Nonexistence 야생형 FokIWild type FokI 비특이성Non-specific 33 비 존재Nonexistence FokI E490KFoki E490K 비 발생Non-occurrence 44 야생형 FokIWild type FokI FokI E490KFoki E490K 특이성Specificity 55 FokI Q486EFoki Q486E 야생형 FokIWild type FokI 비 발생Non-occurrence 66 FokI Q486EFoki Q486E FokI E490KFoki E490K 특이성Specificity 주: 상기 표의 각 줄은 표시된 DNA 기질에 대한 ZFP/FokI 융합단백질을 테스트한 분리 실험의 결과를 보여준다. 하나의 융합단백질은 5 ~ 8 DNA 결합 도메인을 포함했고, 다른 하나의 융합단백질은 5 ~ 10 DNA 결합 도메인을 포함했다(표 9 및 도 19 참조). 융합단백질의 절단 하프 도메인 부분은 상기 표에서 제시했다. 따라서, ZEP 5 ~ 8 칼럼의 내용은 ZEP 5 ~8에 융합된 FokI 절단 도메인의 형태를 나타내며, ZEP 5 ~ 10 칼럼의 내용은 ZEP 5 ~10에 융합된 FokI 절단 도메인의 형태를 나타낸다. FokI 절단 하프 도메인 돌연 변이에 대해서, 상기 수치는 FokI 단백질 내의 아미노산 잔기를 나타내며, 상기 문자 앞의 수치는 야생형 단백질 내에 존재하는 아미노산을 나타내며, 상기 문자 뒤의 수치는 상기 야생형 잔기가 변질하여 개질된 단백질을 만드는 아미노산을 나타낸다. "비존재"는 전체 ZFP/FokI 융합단백질이 상기 특징적인 실험에서 생략되었음을 나타낸다. 이 실험에서 사용된 DNA 기질은 두 개의 ZFP 5 ~ 8 및 ZFP 5 ~ 10에 대한 표적 부위를 포함하는 400 bp PCR 생성물에 가까웠다. 상기 두 개의 표적 부위의 서열 및 상대적인 배열은 도 19를 참조하라.Note: Each row in the table above shows the results of a separation experiment that tested ZFP / FokI fusion proteins for the indicated DNA substrates. One fusion protein contained 5 to 8 DNA binding domains and the other fusion protein contained 5 to 10 DNA binding domains (see Table 9 and Figure 19). The cleavage half-domain portion of the fusion protein is presented in the table above. Thus, the contents of the ZEP 5-8 column represent the Fok I cleavage domain fused to ZEP 5-8, and the contents of the ZEP 5-10 column represent the Fok I cleavage domain fused to ZEP 5-10. For FokI truncation half-domain mutations, the values represent amino acid residues in the FokI protein, the numerical values preceding the letters represent amino acids present in the wild-type protein, and the numerical value after the letter indicates that the wild- ≪ / RTI > "Non-presence" indicates that the entire ZFP / FokI fusion protein was omitted from the above-mentioned characteristic experiment. The DNA substrate used in this experiment was close to a 400 bp PCR product containing target sites for two ZFPs 5-8 and ZFPs 5-10. See FIG. 19 for the sequence and relative arrangement of the two target sites.

실시예 6: 불완전하게 강화된 녹색 형광 단백질(eGFP) 유전자의 발생Example 6: Generation of incompletely enhanced green fluorescent protein (eGFP) gene

강화된 녹색 형광 단백질(eGFP)은 아미노산 64(phe 내지 leu) 및 65(ser 내지 thr)를 포함하는 녹색 형광 단백질(GFP, 예를 들어, Tsien (1998) Ann. Rev. Biochem. 67: 509 ~ 544 참조)의 형태로 개질 된다. 이에 대하여는 Heim et al.(1995) Nature 373: 663 ~ 664 및 Cormack et al. (1996) GENE 173: 33 ~ 38를 참조하라. 개시 코돈 및 2 bp 프레임시프트 돌연 변이를 포함하는 eGFP 유전자의 불완전한 형태를 제조함으로써, eGFP계 리포터 시스템을 만들었다. 상기 eGFP 유전자의 서열을 도 22에 나타낸다. Platinum

20um에는 몇 dna ug ul

DNA 폴리머라제 High Fidelity 키트 (Invitrogen) 및 프라이머로서의 올리고뉴클레오티드 GFP Bam, GFP Xba, 개시 센스2, 개시 안티2(올리고뉴클레오티드 서열은 하기의 표 11에 제시)를 사용하는 중복 PCR 돌연 변이에 의해서 돌연 변이를 삽입했다. GFP Bam 및 GFP Xba는 외래 프라이머로 작동했으며, 정지 센스2 및 정지 안티2는 뉴클레오티드 교체 부분을 코드화한 내부 프라이머로 작동했다. 두 개의 분리 증폭 실험 내의 DNA 주형으로는 eGFP 유전자 전체 길이를 코드화한 peGFP NI 벡터(BD Biosciences)를 사용했다. 상기 증폭 실험중, 하나는 프라이머로 GFP Bam 및 정지 안티2 올리고뉴클레오티드를 사용했고 다른 하나는 프라이머로 GFP Xba 및 정지 센스2 올리고뉴클레오티드를 사용했다. 그 결과 서열이 중복되는 두 개의 증폭 생성물을 얻었다. 이 생성물을 혼합하여 프라이머로서 GFP Bam 및 GFP Xba 올리고뉴클레오티드를 사용하는 세 번째 증폭 실험에서의 주형으로 사용함으로써, 뉴클레오티드 280 ~ 287에 위치한 서열 GACCACAT(SEQ ID NO: 124)이 서열 TAACAC(SEQ ID NO: 125)로 교체된 eGFP 유전자를 제조했다. 모든 증폭 실험에 대한 PCR 조건은 하기와 같다. 먼저, 상기 주형을 94 ℃에서 2 분 동안 변성시킨 후, 94 ℃에서 30 초 동안, 46 ℃에서 45 초 동안, 68 ℃에서 60 초 동안 반응을 배양시키는 증폭을 25차례 순환했다. 확장의 최종 단계는 68 ℃에서 60 초 동안 실행했다. 최종 증폭 생성물의 서열은 도 23에 나타낸다. TOPO TA 복제 키트(Invitrogen)를 사용하는 pCR(R) 4 TOPO 베터 내에서 상기 795 bp 절편을 복제하여 pCR(R) 4 TOPO GFPmut를 제조했다. Enhanced Green Fluorescent Protein (eGFP) is a green fluorescent protein (GFP, e.g., Tsien (1998) Ann. Rev. Biochem. 67: 509-75) containing amino acids 64 (phe to leu) 544). See Heim et al. (1995) Nature 373: 663-664 and Cormack et al. (1996) GENE 173: 33-38. An eGFP based reporter system was constructed by preparing an incomplete version of the eGFP gene, including the initiation codon and the 2 bp frame shift mutation. The sequence of the eGFP gene is shown in Fig. Platinum

20um에는 몇 dna ug ul

DNA polymerase High Fidelity Kit (Invitrogen) and the oligonucleotides GFP Bam, GFP Xba, Initiation Sensitivity 2, Initiation Anti 2 (the oligonucleotide sequence is shown in Table 11 below) as primers. . GFP Bam and GFP Xba acted as exogenous primers, while Suspense Sense 2 and Suspected Anti 2 served as internal primers coding for the nucleotide substitution. PeGFP NI vector (BD Biosciences) encoding the entire length of the eGFP gene was used as the DNA template in the two separate amplification experiments. Among the amplification experiments, one used GFP Bam and a stationary anti-2 oligonucleotide as primers and the other used GFP Xba and a stop sense 2 oligonucleotide as primers. As a result, two amplified products with overlapping sequences were obtained. This product was mixed and used as a template in a third amplification experiment using GFP Bam and GFP Xba oligonucleotides as primers to obtain the sequence GACCACAT (SEQ ID NO: 124) located at nucleotides 280-287 with the sequence TAACAC (SEQ ID NO: : 125). ≪ / RTI > The PCR conditions for all amplification experiments are as follows. First, the template was denatured at 94 DEG C for 2 minutes, and then the amplification was repeated 25 times at 94 DEG C for 30 seconds, 46 DEG C for 45 seconds, and 68 DEG C for 60 seconds. The final step of extension was run at 68 ° C for 60 seconds. The sequence of the final amplification product is shown in Fig. The above 795 bp fragment was replicated in a pCR (R) 4 TOPO vector using TOPO TA replication kit (Invitrogen) to prepare pCR (R) 4 TOPO GFP mut.

GFP용 올리고뉴클레오티드 서열Oligonucleotide sequence for GFP 올리고Oligo 서열 5' ~ 3'Sequences 5 'to 3' GFP-BamGFP-Bam CGAATTCTGCAGTCGAC (SEQ ID NO : 126)CGAATTCTGCAGTCGAC (SEQ ID NO: 126) GFP-XbaGFP-Xba GATTATGATCTAGAGTCG (SEQ ID NO: 127)GATTATGATCTAGAGTCG (SEQ ID NO: 127) 정지 센스2Stop sense 2 AGCCGCTACCCCTAACACGAAGCAG (SEQ ID NO : 128)AGCCGCTACCCCTAACACGAAGCAG (SEQ ID NO: 128) 정지 안티2Stop Anti 2 CTGCTTCGTGTTAGGGGTAGCGGCT (SEQ ID NO: 129)CTGCTTCGTGTTAGGGGTAGCGGCT (SEQ ID NO: 129)

실시예 7: eGFP를 표적화한 징크핑거 뉴클레아제의 설계 및 조립Example 7: Design and assembly of eGFP-targeted zinc finger nuclease

뉴클레오티드 271 ~ 294(도 23에 따라 번호 매김)에 상응하는 돌연 변이를 일으킨 GFP 유전자(실시예 6) 영역에 결합하도록 두 개의 제3 핑거 ZFP를 고안했다. 상기 단백질에 대한 결합 부위는 두 개의 결합 부위를 분리하는 6 개 염기쌍과 반대 배열을 지닌다. 도 23을 참조하라. ZFP 287A는 비코딩 나선 상의 뉴클레오티드 271 ~ 279와 결합하며, ZFP 296은 코딩 나선 상의 뉴클레오티드 286 ~ 294와 결합한다. ZFP의 인지 영역에 대한 DNA 표적 및 아미노산 서열을 표 12 및 하기에 제시한다. Two third finger ZFPs were devised to bind to the GFP gene (Example 6) region that caused mutations corresponding to nucleotides 271 to 294 (numbered according to Figure 23). The binding site for the protein has an opposite sequence to the 6 base pairs separating the two binding sites. See FIG. ZFP 287A binds nucleotides 271-279 on the uncoded helices and ZFP 296 binds nucleotides 286-294 on the coding helices. The DNA target and amino acid sequence for the recognition region of the ZFP are shown in Table 12 and below.

287A : 287A:

F1 (GCGg) RSDDLTR (SEQ ID NO : 130) F1 (GCGg) RSDDLTR (SEQ ID NO: 130)

F2 (GTA) QSGALAR (SEQ ID NO: 131) F2 (GTA) QSGALAR (SEQ ID NO: 131)

F3 (GGG) RSDHLSR (SEQ ID NO : 132) F3 (GGG) RSDHLSR (SEQ ID NO: 132)

296S : 296S:

F (GCA) QSGSLTR (SEQ ID NO : 133) F (GCA) QSGSLTR (SEQ ID NO: 133)

F2 (GCA) QSGDLTR (SEQ ID NO : 134) F2 (GCA) QSGDLTR (SEQ ID NO: 134)

F3 (GAA) QSGNLAR (SEQ ID NO: 135) F3 (GAA) QSGNLAR (SEQ ID NO: 135)

GFP 유전자용 징크핑거 고안Design of zinc finger for GFP gene 단백질protein 표적 서열Target sequence F1F1 F2F2 F3F3 287A287A GGGGTAGCGg
(SEQ ID NO: 136)
GGGGTAGCGg
(SEQ ID NO: 136)
RSDDLTR
(SEQ ID NO : 137)
RSDDLTR
(SEQ ID NO: 137)
QSGALAR
(SEQ ID NO: 138)
QSGALAR
(SEQ ID NO: 138)
RSDHLSR
(SEQ ID NO: 139)
RSDHLSR
(SEQ ID NO: 139)
296S296S GAAGCAGCA
(SEQ ID NO : 140)
GAAGCAGCA
(SEQ ID NO: 140)
QSGSLTR
(SEQ ID NO : 141)
QSGSLTR
(SEQ ID NO: 141)
QSGDLTR
(SEQ ID NO : 142)
QSGDLTR
(SEQ ID NO: 142)
QSGNLAR
(SEQ ID NO : 143)
QSGNLAR
(SEQ ID NO: 143)
주: 위에 제시된 징크핑거 아미노산 서열(한 문자 코드)은 징크핑거 각각의 알파 나선 개시 부분과 관련된 -1 내지 +6의 잔기를 나타낸다. 핑거 F1은 상기 단백질의 아미노 말단에 가깝게 위치하며, F3는 카르복시 말단에 가깝게 위치한다. Note: The above zinc finger amino acid sequence (one letter code) represents residues -1 to +6 associated with the alpha helical start of each zinc finger. Finger F1 is located close to the amino terminus of the protein, and F3 is located close to the carboxy terminus.

상기 단백질을 코드화한 서열을 PCR 조립(예를 들어, 미국특허 제6,534, 261 호)에 의해서 제조했고, pcDNA3.1 벡터(Invitrogen)의 Kpnl 및 BamHI 부위 사이에서 복제했고, FokI 엔도뉴클레아제의 촉진 도메인을 포함하는 구조 내에서 융합했다(Gene (1989) 80: 193-208 Looney et al.의 서열의 아미노산 384 ~ 579). 얻어진 구조를 pcDNA3.1 GFP287 FokI 및 pcDNA3.1 GFP296 FokI이라고 명했다(도 24). The protein encoded sequence was prepared by PCR assembly (e.g., U.S. Patent No. 6,534,261), replicated between the Kpnl and BamHI sites of the pcDNA3.1 vector (Invitrogen), and the FokI endonuclease (Gene (1989) 80: 193-208 amino acids 384-579 of the sequence of Looney et al.). The obtained structure was named pcDNA3.1 GFP287 FokI and pcDNA3.1 GFP296 FokI (Fig. 24).

실시예 8 : 설계된 징크핑거 뉴클레아제에 의한 생체 외에서의 표적화된 DNA 절단 Example 8: Targeted DNA cleavage in vitro by engineered zinc finger nuclease

생체 외에서의 개질된 형태의 eGFP를 절단하고 단백질의 표적 부위을 특이적으로 인지하는 287 및 296 단백질의 효능을 테스트하기 위한 주형으로서 상기 pCR(R) 4 TOPO GFPmut 구조를 사용했다. The above pCR (R) 4 TOPO GFP mut structure was used as a template for testing the potency of the 287 and 296 proteins that cleave the modified form of eGFP in vitro and specifically recognize the target site of the protein.

T4 및 T3 프라이머와 pCR(R) 4 TOPO GFPmut 주형을 사용하는 PCR 증폭에 의해서 불완전하게 eGFP 코드가 삽입된 DNA 절편을 얻었다. 상기 절편의 말단을 γ 32P ATP 및 T4 폴리뉴클레오티드 키나아제로 표시했다. 미세 스핀 G 50 칼럼 (Amersham)을 사용하여 융합되지 않은 뉴클레오티드를 제거했다. A DNA fragment in which eGFP code was inserted incompletely was obtained by PCR amplification using T4 and T3 primers and pCR (R) 4 TOPO GFPmut template. The ends of the fragments were designated as? 32 P ATP and T4 polynucleotide kinase. Unfused nucleotides were removed using a fine spin G 50 column (Amersham).

생체 외에서 전사/번역 조합 시스템을 사용하여 실시예 7에서 서술한 287 및 296 징크핑거 뉴클레아제를 발현했다. 각각의 구조에 있어서, 선형 플라스미드 DNA 200 ng을 TnT 혼합 20 μL에서 배양했고, 30 ℃에서 1 시간 및 45 분 동안 배양했다. TnT 혼합은 메티오닌 2 μl 및 ZnCl2(20 mM) 2.5 μl를 첨가한 TnT 용해물(T7 RNA 폴리머라제, Promega, Madison, WI를 포함) 100 μl를 포함한다.The 287 and 296 zinc finger nuclease agents described in Example 7 were expressed using an in vitro transcription / translation assembly system. For each construct, 200 ng of linear plasmid DNA was cultured in 20 μL of TnT mix and incubated at 30 ° C for 1 hour and 45 minutes. TnT mixes include 100 μl of TnT lysate (including T7 RNA polymerase, Promega, Madison, WI) with 2 μl of methionine and 2.5 μl of ZnCl 2 (20 mM).

DNA 절단을 분석하기 위해서, 전사/번역 반응 혼합물의 287 및 296을 소량 취해서 혼합한 후, 절단 완충액로 희석했다. 절단 완충액는 pH 8.5 Tris-HCl 20 mM, NaCl 75 mM, MgCl2 10 mM, ZnCl2 10 μM, DTT 1 mM, 5% 글리세롤, BSA 500 μg/ml를 포함한다. 각 희석물 5 μl를 DNA 기질(위에서 서술한 바와 같이 T4 폴리뉴클레오티드 키나아제를 이용하는 32P로 말단을 표시) 1 ng과 혼합시킨 후, 각 혼합물을 한 번 더 희석하여 하기의 조성물을 포함하는 절단 반응물 20 μl를 제조했다. pH 8.5 Tris-HCl 20 mM, NaCl 75 mM, MgCl2 10 mM, ZnCl2 10 μM, DTT 1 mM, 5% 글리세롤, BSA 500 μg/ml. 절단 반응물을 37 ℃에서 1 시간 동안 배양했다. 각 반응물에 페놀 클로로포름 용액 10 μl를 첨가한 후, 원심 분리로 상 분리하여, 단백질을 축출했다. 10 % 폴리아크릴아미드 겔 상의 전기 영동에 의해서, 각 반응의 수용액 상의 10 μl를 분석했다. To analyze the DNA cleavage, a small volume of 287 and 296 of the transcription / translation reaction mixture was mixed and diluted with the cleavage buffer. The cleavage buffer contains 20 mM Tris-HCl pH 8, 75 mM NaCl, 10 mM MgCl 2 , 10 μM ZnCl 2 , 1 mM DTT, 5% glycerol, BSA 500 μg / ml. Five microliters of each dilution was mixed with 1 ng of DNA substrate (labeled 32 P using T4 polynucleotide kinase as described above) and each mixture was diluted once more to obtain a cleavage reaction product 20 μl. pH 8.5 Tris-HCl 20 mM, NaCl 75 mM, MgCl 2 10 mM, ZnCl 2 10 μM, DTT 1 mM, 5% glycerol, BSA 500 μg / ml. The cleavage reaction was incubated at 37 DEG C for 1 hour. Ten .mu.l of a phenol chloroform solution was added to each reaction product, followed by phase separation by centrifugation to remove the protein. 10 [mu] l of the aqueous phase of each reaction was analyzed by electrophoresis on a 10% polyacrylamide gel.

상기 겔을 방사성 사진 촬영했고, 상기 실험의 결과를 도 25에 나타냈다. 4개의 가장 왼쪽에 있는 레인은 각 전사/번역 반응 혼합의 최종 희석량이 1/156.25, 1/31.25, 1/12.5 및 1/5이므로 각 전사/번역 반응의 유효량이 0.032, 0.16, 0.4 및 1 μl가 되는 반응의 결과를 보여준다. 개시 절편보다 낮은 분자량을 가지는 두 개의 DNA 절편은 반응 혼합물 내의 징크핑거 엔도뉴클레아제 함량 증가와 관련되므로, 기대된 표적 부위에서의 DNA 절단이 얻어졌음을 알 수 있다.The gel was photographed radiographically and the results of the experiment are shown in Fig. The four leftmost lanes show that the final dilutions of each transcription / translation reaction mixture were 1 / 156.25, 1/31.25, 1 / 12.5 and 1/5, respectively, so the effective amounts of each transcription / translation reaction were 0.032, 0.16, 0.4 and 1 μl The results are shown in Fig. Two DNA fragments with lower molecular weights than the initiation fragment are associated with an increase in zinc finger endonuclease content in the reaction mixture, indicating that DNA cleavage at the expected target site has been obtained.

실시예 9: 통합된 불완전 eGFP 유전자를 포함하는 안정된 셀라인의 생성Example 9: Generation of stable cell lines containing integrated incomplete eGFP gene

돌연 변이 eGFP 즉, eGFPmut를 코드화한 DNA 절편이 pCR(R) 4 TOPO GFPmut q벡터의 외부에서 절단됐고(실시예 6), pcDNA4/TO의 HindIII 및 NotI 부위 내에서 복제됐다. 따라서, 상기 유전자는 테트라사이클린 유도 CMV 프로모터의 조절하에서 놓인다. 얻어진 플라스미드를 pcDNA4/TO/GFPmut라 명했다(도 26). 10% 비 Tet 우태혈청(FBS)을 첨부한 (HyClone) 듈베코 변성 이글 배지(DMEM)(Invitrogen) 내에서 T Rex 293 세포(Invitrogen)를 배양했다. 세포를 6 웰 배양 접시 내에서 배양하여 50% 포화하게 했고, 두 개의 세포를 pcDNA4/TO/GFPmut로 감염시켰다. 그 후, 상기 세포를 48 시간 동안 회수하고나서, 두 개의 웰에서 얻은 세포를 혼합한 후, 표적화된 배지 즉, Zeocin(Invitrogen) 400 μg/ml를 첨부한 배지 내의 10 x l5 cm2 배양 접시 내로 분할했다. 상기 배지을 3일 후 교체했고, 10일 후 단일 세포 군집을 격리시켰고 또다시 팽창시켰다. 정량적 RT PCR(TaqMan

20um에는 몇 dna ug ul

)에 의해서, 각 클론 라인의 eGFPmut 유전자의 독시시클린(dox) 유도 발현에 대해서 테스트했다. The mutated eGFP, eGFPmut-encoding DNA fragment was excised outside the pCR (R) 4 TOPO GFPmut q vector (Example 6) and replicated in the HindIII and NotI sites of pcDNA4 / TO. Thus, the gene is placed under the control of a tetracycline-inducing CMV promoter. The obtained plasmid was named pcDNA4 / TO / GFP mut (Fig. 26). T Rex 293 cells (Invitrogen) were cultured in HyClone Dulbecco's modified Eagle's medium (DMEM) (Invitrogen) supplemented with 10% non-Tet rabbit serum (FBS). Cells were cultured in 6-well culture dishes to 50% saturation, and two cells were infected with pcDNA4 / TO / GFPmut. Thereafter, the cells were collected for 48 hours, and then the cells obtained from the two wells were mixed. Then, 400 μg / ml of the targeted medium, that is, Zeocin (Invitrogen) was added into a 10 × 15 cm 2 culture dish Split. The medium was replaced after 3 days and after 10 days single cell clusters were isolated and expanded again. Quantitative RT PCR (TaqMan

20um에는 몇 dna ug ul

) Was tested for doxycycline (dox) -induced expression of the eGFPmut gene of each clone line.

정량 RT PCR 분석을 위해 고순도 분리 키트(Roche Molecular Biochemicals)를 사용하는 독스 처리하거나 처리하지 않은 세포로부터 전체 RNA를 분리했다. 또한, TaqMan

20um에는 몇 dna ug ul

을 사용하여 내인성 유전자 발현을 분석할 수 있도록, 각 샘플로부터 얻은 전체 RNA 25 ng에 대해 실시간 정량적 RT PCR을 실시했다.For quantitative RT PCR analysis, total RNA was isolated from toxin treated or untreated cells using a high purity separation kit (Roche Molecular Biochemicals). In addition, TaqMan

20um에는 몇 dna ug ul

Real-time quantitative RT-PCR was performed on 25 ng of total RNA from each sample in order to be able to analyze endogenous gene expression using the primers.

프로브 및 프라이머 서열을 표 13에 나타낸다. 반응은 하기의 조건하에서 ABI 7700 SDS 기계(PerkinElmer Life Sciences)를 사용하여 실행했다. 48℃에서 30 분 동안 MultiScribe 역 전사효소(PerkinElmer Life Sciences)를 사용하여 역 전사 반응을 실행한 후, 95℃에서 10분 동안 변성시켰다. AmpliGold DNA 폴리머라제( PerkinElmer Life Sciences)를 사용하여 95 ℃에서 15 초 동안 및 60 ℃에서 1 분 동안 40번 순환하는 폴리머라제 연쇄반응(PCR)을 실행했다. SDS 소프트웨어 버전 1.7을 사용하여 정규화된 eGFPmut 유전자의 발현에서 인간 GAPDH 유전자의 발현에 이르는 결과를 분석하였고, 도 27에 나타냈다. 세포 라인의 수는 eGFP의 독시시클린 의존형 발현을 나타냈다. 또 다른 연구를 위한 모델 세포 라인으로서 라인 18(T18)을 선택했다.The probe and primer sequences are shown in Table 13. The reaction was carried out using an ABI 7700 SDS machine (PerkinElmer Life Sciences) under the following conditions. The reverse transcription reaction was carried out using MultiScribe reverse transcriptase (PerkinElmer Life Sciences) at 48 캜 for 30 minutes and denatured at 95 캜 for 10 minutes. Polymerase chain reaction (PCR) was performed using AmpliGold DNA polymerase (PerkinElmer Life Sciences), circulating 40 times at 95 ° C for 15 seconds and at 60 ° C for 1 minute. Analysis of the expression of the human GAPDH gene in the expression of the normalized eGFPmut gene using SDS software version 1.7 was analyzed and shown in FIG. The number of cell lines showed an ischemic-dependent expression of eGFP. Line 18 (T18) was selected as the model cell line for another study.

mRNA 분석용 올리고뉴클레오티드Oligonucleotides for mRNA analysis 올리고뉴클레오티드Oligonucleotide 서열order eGFP 프라이머 1 (5T)eGFP primer 1 (5T) CTGCTGCCCGACAACCA (SEQ ID NO : 144)CTGCTGCCCGACAACCA (SEQ ID NO: 144) eGFP 프라이머 2 (3T)eGFP primer 2 (3T) CCATGTGATCGCGCTTCTC (SEQ ID NO : 145) CCATGTGATCGCGCTTCTC (SEQ ID NO: 145) eGFP 프로브eGFP probe CCCAGTCCGCCCTGAGCAAAGA(SEQ ID NO : 146)CCCAGTCCGCCCTGAGCAAAGA (SEQ ID NO: 146) GAPDH 프라이머 1GAPDH Primer 1 CCATGTTCGTCATGGGTGTGA (SEQ ID NO : 147)CCATGTTCGTCATGGGTGTGA (SEQ ID NO: 147) GAPDH 프라이머 2GAPDH Primer 2 CATGGACTGTGGTCATGAGT (SEQ ID NO : 148)CATGGACTGTGGTCATGAGT (SEQ ID NO: 148) GAPDH 프로브GAPDH probe TCCTGCACCACCAACTGCTTAGCA(SEQ ID NO : 149)TCCTGCACCACCAACTGCTTAGCA (SEQ ID NO: 149)

실시예 10: 불완전한 염색체 eGFP 유전자의 편집용 도너 서열의 제조Example 10: Preparation of Editing Donor Sequence of Incomplete Chromosomal eGFP Gene

PCR를 사용하여, 불완전한 eGFP 유전자를 편집하기 위한 유전자 정보를 포함하는 도너 구조를 만들었다. 주형으로서 peGFP NI 벡터를 사용하여, 상기에 서술한 방법으로 PCR 반응을 실행했다. 표적화된 재조합 실험에서 도너 구조의 배경 발현을 막기위해서, 프라이머 GFPnostart 및 GFP Xba(표 14에 제시된 서열)를 사용하는 PCR를 사용하여 제1 12 bp 및 개시 코돈을 상기 도너로부터 제거했다. pCR(R) 4 TOPO GFP 도너 5를 제조하도록 복제되는 TOPO TA에 의해서, 생성된 PCR 절편(734 bp)를 포유류 세포 프로모터를 포함하는 pCR (R) 4 TOPO 벡터 내에서 복제했다(도 28). 상기 구조(도 22에 제시된 서열의 뉴클레오티드 64 ~ 797에 해당)의 eGFP 삽입체의 서열이 도 29에 나타난다(SEQ ID NO : 20).PCR was used to create a donor structure containing gene information for editing the incomplete eGFP gene. Using the peGFP NI vector as a template, the PCR reaction was carried out by the method described above. To prevent background expression of the donor structure in targeted recombination experiments, the first 12 bp and initiation codon were removed from the donor using PCR using the primers GFPnostart and GFP Xba (the sequence given in Table 14). The resulting PCR fragment (734 bp) was replicated in a pCR (R) 4 TOPO vector containing the mammalian cell promoter by TOPO TA, which was cloned to make pCR (R) 4 TOPO GFP donor 5 (Figure 28). The sequence of the eGFP insert of the above structure (corresponding to nucleotides 64 to 797 of the sequence presented in Figure 22) is shown in Figure 29 (SEQ ID NO: 20).

도너 분자의 구조를 위한 올리고뉴클레오티드Oligonucleotides for the structure of donor molecules 올리고뉴클레오티드Oligonucleotide 서열 5' ~ 3'Sequences 5 'to 3' GFPnostartGFPnostart GGCGAGGAGCTGTTCAC(SEQ ID NO: 150)GGCGAGGAGCTGTTCAC (SEQ ID NO: 150) GFP-XbaGFP-Xba GATTATGATCTAGAGTCG(SEQ ID NO: 151)GATTATGATCTAGAGTCG (SEQ ID NO: 151)

실시예 11: 표적화된 절단 및 재조합에 의한 통합된 염색체 eGFP 유전자 내의 돌연 변이 편집 Example 11: Editing mutations in the integrated chromosomal eGFP gene by targeted cleavage and recombination

하나 또는 두 개의 ZFP FokI 발현 플라스미드(pcDNA3.1 GFP287 FokI 및pcDNA3.1 GFP296 FokI, 실시예 7) 및 제조자 프로토콜에 따라 혈청 배지을 환원한pti-MEM I 내의 LipofectAMINE 2000 Reagent(Invitrogen)를 사용하는 도너 플라스미드 pCR(R)4 TOPO GFP도너5(실시예 10) 300 ng을 사용하여 T18 세포 라인(실시예 9)을 감염시켰다. 배양 배지에 독시시클린 2 ng/ml을 첨가함으로써 감염시킨 후, 5 ~ 6 시간 동안 불완전한 염색체 eGFP 유전자를 발현시켰다. 상기 세포는 24 시간 감염된 후 노코다졸(도 30) 100 ng/ml 또는 빈블라스틴(도 31) 0.2 uM를 첨가함으로써 세포 주기의 G2기에서 고정됐다. G2기 고정을 24 ~ 48 시간 동안 유지시킨 후, 배지을 제거함으로써 풀었다. 세포를 PBS로 세척했고, 배지을 비테트라사이클린 FBS 및 독시시클린 2 ng/ml를 포함하는 DMEM으로 교체했다. 상기 세포를 24 ~ 48 시간 동안 회수했다. 형광 활성 세포 분류(FACS) 분석에 의해서 eGFP 형광성을 나타내는 세포의 수를 모니터함으로써 유전자 편집 효율을 측정했다. Beckman Coulter EPICS XL MCL 장치 및 System II 데이터 획득 및 표시 소프트웨어 버전 2.0을 사용하여 FACS 분석을 실행했다. 아르곤 레이저로 488 nm에서 여기시키고 525 nm(x 축)에서 방사를 모니터함으로써, eGFP 형광을 측정했다. 570 nm(y 축)에서 방사를 모니터함으로써, 배경 및 자가형광을 측정했다. 525 nm에서 높은 형광 방사 및 570 nm(E 영역)에서 낮은 방사를 나타내는 세포는 유전자 편집에 대해서 양의 수치를 기록했다. One or two ZFP FokI expression plasmids (pcDNA3.1 GFP287 FokI and pcDNA3.1 GFP296 FokI, Example 7) and donor plasmids using LipofectAMINE 2000 Reagent (Invitrogen) in pti-MEM I reduced serum media according to the manufacturer's protocol 300 ng of pCR (R) 4 TOPO GFP donor 5 (Example 10) was used to infect the T18 cell line (Example 9). The culture medium was infected by adding 2 ng / ml of doxycycline, and the incomplete chromosome eGFP gene was expressed for 5 to 6 hours. The cells were fixed in the G2 phase of the cell cycle by adding 100 ng / ml of nocodazole (Fig. 30) or 0.2 uM of vinblastine (Fig. 31) after 24 hours of infection. G2 phase fixation was maintained for 24-48 hours and then loosened by removing the medium. The cells were washed with PBS and the medium was replaced with DMEM containing 2 ng / ml of vitetracycline FBS and doxycycline. The cells were collected for 24-48 hours. The gene editing efficiency was measured by monitoring the number of cells exhibiting eGFP fluorescence by fluorescence activated cell sorting (FACS) analysis. Beckman Coulter conducted FACS analysis using EPICS XL MCL device and System II data acquisition and display software version 2.0. EGFP fluorescence was measured by excitation at 488 nm with an argon laser and emission at 525 nm (x axis). Background and autofluorescence was measured by monitoring radiation at 570 nm (y-axis). Cells showing high fluorescence emission at 525 nm and low emission at 570 nm (E-region) recorded positive quantities for gene compilation.

상기 결과를 표 15, 도 30 및 도 31에 요약한다. 도 30 및 도 31은 T18 세포가 ZFP 뉴클레아제를 코드화한 pcDNA3.1 GFP287 FokI 및 pcDNA3.1 GFP296 FokI 플라스미드 및 pCR(R)4 TOPO GFP도너5 플라스미드로 감염됐고, eGFP 발현은 독시사이클론으로 실행됐고, 세포가 노코다졸(도 30) 또는 빈블라스틴(도 31)으로 G2기에 고정된 결과를 보여준다. 두 개의 도는 eGFP 형광성을 띠는 세포가 FACS 흔적의 보다 낮은 오른쪽 영역에 존재하는 FACS 흔적을 보여준다(곡선의 4분의 1 밑 부분인 E 영역). 노코다졸로 처리된 세포로 감염 세포에 있어서, 상기 세포의 5.35 %는 돌연 변이를 일으킨 염색체 eGFP 유전자가 편집을 됐음을 보이는 GFP 형광을 나타냈고(도 30), 세포의 6.7 %는 eGFP 유전자 편집된 빈블라스틴으로 처리됐다(도 31). 상기 결과를 또 다른 조절 실험과 더불어 표 15의 1 ~ 8 줄에서 요약한다. The above results are summarized in Tables 15, 30 and 31. Figures 30 and 31 show that T18 cells were infected with the pcDNA3.1 GFP287 FokI and pcDNA3.1 GFP296 FokI plasmids encoding the ZFP nuclease and the pCR (R) 4 TOPO GFP donor 5 plasmid, eGFP expression was performed as a doxycycline , And the results show that the cells were fixed in the G2 group with nocodazole (Fig. 30) or vinblastine (Fig. 31). Two rounded eGFP fluorescent cells show a FACS trace (the E region, which is the bottom of the curve) in the lower right region of the FACS trace. In the infected cells treated with nocodazole, 5.35% of the cells showed GFP fluorescence showing that the mutant chromosomal eGFP gene was edited (Fig. 30), and 6.7% of the cells were subjected to eGFP gene editing Treated with vinblastine (Fig. 31). The results are summarized in Table 15, lines 1 to 8, along with another control experiment.

요약하면, 상기 실험은 두 개의 ZFP 뉴클레아제 및 도너 서열의 존재하에서, 처리된 세포의 1 %는 유전자 편집을 실행했고, 상기 편집 수치는 세포 주기의 G2 기에 처리된 세포를 고정함으로써 4 ~ 5 배 증가함을 보인다. Briefly, the experiment showed that in the presence of two ZFP nuclease and donor sequences, 1% of the treated cells underwent genetic editing and the edited values were 4 to 5 by fixing the treated cells to the G2 phase of the cell cycle Times.

불완전한 염색체 eGFP 유전자의 편집Editing incomplete chromosome eGFP gene 실험Experiment 처리process 1One 편집된 eGFP를 함유하는 세포의 퍼센트Percent of cells containing edited eGFP 22 1One 300 ng의 도너 단독300 ng donor alone 0.010.01 22 100 ng의 ZFP 287 + 300 ng의 도너100 ng ZFP 287 + 300 ng donor 0.160.16 33 100 ng의 ZFP 287 + 300 ng의 도너100 ng ZFP 287 + 300 ng donor 0.60.6 44 50 ng의 ZFP 287 + 50 ng의 ZFP 296 + 300 ng의 도너50 ng of ZFP 287 + 50 ng of ZFP 296 + 300 ng donor 1.21.2 55 실험 4 + 100 ng/ml의 노코다졸 Experiment 4 + 100 ng / ml of nocodazole 5.355.35 66 실험 4 + 0.2 uM의 빈블라스틴 Experiment 4 + 0.2 uM Vinblastine 6.76.7 77 도너 비존재, ZFP 비존재, 100 ng/ml의 노코다졸Donor non-presence, ZFP non-presence, 100 ng / ml nocodazole 0.010.01 88 도너 비존재, ZFP 비존재, 0.2 uM의 빈블라스틴Donor non-presence, ZFP non-presence, 0.2 uM bin blastin 0.00.0 99 100 ng의 ZFP287/Q486E + 300 ng의 도너100 ng ZFP287 / Q486E + 300 ng donor 0.00.0 1010 100 ng의 ZFP296/E490K + 300 ng의 도너100 ng ZFP296 / E490K + 300 ng donor 0.010.01 1111 50 ng의 287/Q486E + 50 ng의 296/E490K + 300 ng의 도너50 ng of 287 / Q486E + 50 ng of 296 / E490K + 300 ng donor 0.620.62 1212 실험 11 + 100 ng/ml의 노코다졸Experiment 11 + 100 ng / ml of nocodazole 2.372.37 1313 실험 11 + 0.2 uM의 빈블라스틴Experiment 11 + 0.2 uM of Binblastine 2.562.56 주:
1 : 하나 또는 두 개의 ZFP 뉴클레아제를 코드화한 플라스미드 및/또는 완전한 eGFP 서열을 코드화한 도너 플라스미드를 사용하여, 불완전한 염색체 eGFP 유전자를 포함하는 T18 세포를 감염했다. 염색체 eGFP의 발현을 독시시클린으로 실행했다. eGFP를 유도한 후, 선택적으로 세포를 세포 주기의 G2기에 고정했다. 감염된 후 5일 동안 FACS 분석을 실행했다.
2: 상기 수치는 525 nm에서 높은 방사를 나타내고 570 nm에서 낮은 방사를 나타내는 전체 형광의 퍼센트이다(FACS 흔적의 E 영역).
week:
1: T18 cells containing an incomplete chromosome eGFP gene were infected with a plasmid encoding one or two ZFP nuclease and / or donor plasmids encoding a complete eGFP sequence. Expression of chromosomal eGFP was performed with an isocycline. After induction of eGFP, cells were selectively fixed in the G2 phase of the cell cycle. FACS analysis was performed for 5 days after infection.
2: The above values represent high emission at 525 nm and a percentage of total fluorescence representing low emission at 570 nm (E region of the FACS trace).

실시예 12: 이량체화 인터페이스 내에서 서열이 변경된 징크핑거 뉴클레아제를 사용하는 불완전한 염색체 유전자의 편집 Example 12: Editing of an incomplete chromosomal gene using a zinc finger nuclease whose sequence was changed within the dimerization interface

이량체화 인터페이스 내에서 변경된 서열을 포함하는 징크핑거 뉴클레아제의 불완전한 염색체의 eGFP 유전자의 편집을 촉진하는 능력을 테스트했다. ZEP 뉴클레아제의 뉴클레아제 부분(즉, FokI 절단 하프 도메인)을 실시예 5에서 서술한 바와 같이 개조한 것을 제외하고, 실시예 11에서 제시한 프로토콜을 사용했다. 따라서, E490K 절단 하프 도메인을 GFP296 ZFP 도메인과 융합했고(표 12), Q486E 절단 하프 도메인을 GFP287 ZFP과 융합했다(표 12).The ability to promote editing of the incomplete chromosomal eGFP gene of zinc finger nuclease, including altered sequences within the dimerization interface, was tested. The protocol presented in Example 11 was used, except that the nuclease portion of the ZEP nuclease (i. E., The FokI cleavage half domain) was modified as described in Example 5. Thus, the E490K cleavage half domain was fused with the GFP296 ZFP domain (Table 12) and the Q486E cleavage half domain was fused with the GFP287 ZFP (Table 12).

얻어진 결과를 표 15의 줄 9 ~ 11에 나타낸다. 상기 결과는 이량체화 인터페이스에서 개조된 두 개의 ZEP 뉴클레아제의 존재시 얻은 유전자 편집의 발생 빈도가 두 개의 뉴클레아제 중 한 개만 존재하는 경우에 비해서 현격히 증가함을 나타낸다. 또 다른 실험에서, T18 세포를 도너 플라스미드 및 287/Q486E 및 296/E490K 징크핑거 뉴클레아제를 코드화한 플라스미드로 감염시킨 후, 노코다졸 또는 빈블라스틴으로 G2기에 고정시켰다. 그 결과 염색체 eGFP유전자가 편집됐음을 나타내는 eGFP 형광을 띠는 세포가 2 %를 웃도는 수준으로 편집의 발생 빈도가 또다시 증가했음을 보였다.The obtained results are shown in lines 9 to 11 of Table 15. [ The results show that the frequency of gene editing obtained in the presence of two ZEP nucleases modified in the dimerization interface is significantly increased compared to the case where only one of the two nucleases is present. In another experiment, T18 cells were infected with donor plasmids and plasmids encoding 287 / Q486E and 296 / E490K zinc finger nuclease, followed by fixation to G2 with nocodazole or vinblastine. As a result, it was shown that the number of eGFP-fluorescing cells indicating that the chromosomal eGFP gene was edited increased again to more than 2%.

실시예 13: 도너 길이의 유전자 보정 주기에 미치는 영향Example 13: Influence of donor length on gene correction cycle

실시예 11에서 기술한 것과 유사한 실험에서, 도너 서열의 길이가 표적화된 재조합의 주기에 미치는 영향을 테스트하였다. 실시예 11에서와 같이 두개의 ZFP 뉴클레아제로 T18 세포를 감염시키고, 독시시클린으로 eGFP 발현이 유도되었다. 또한 실시예 11과 같이 734 bp eGFP 삽입체 (도 29)를 포함하는 pCR(R)4-TOPO-GFPdonor5 플라스미드 (도 28)로 세포를 감염시키거나, 변형된 염색체 eGFP 유전자와 상동성을 지닌 1527 bp 서열 삽입체 (도 32)를 포함하는 동일 플라스미드로 세포를 감염시켰다. 또한, 노코다졸에 의한 G2기 고정이 재조합 주기에 미치는 영향도 평가되었다.In an experiment similar to that described in Example 11, the effect of donor sequence length on the cycle of targeted recombination was tested. T18 cells were infected with two ZFP nuclease agents as in Example 11 and eGFP expression was induced by the doxycycline. The cells were also infected with the pCR (R) 4-TOPO-GFPdonor5 plasmid (Fig. 28) containing the 734 bp eGFP insert (Fig. 29) as in Example 11, bp < / RTI > sequence insert (Figure 32). In addition, the effect of the G2 termination by nocodazole on the recombination cycle was also evaluated.

두 번째의 실험에서, 0.7, 1.08, 1.5 도너 길이에 대하여 각각 비교하였다. 실시예 11에서 기술한 것과 같이, 50 ng의 287-FokI 과 296-FokI 발현 플라스미드(실시예 7, 표 12) 와 500 ng의 0.7 kbp, 1.08 kbp, 1.5 kbp 도너로, T18 세포를 감염시켰다. 감염후 4일이 지난 후, FACS로 결함있는 eGFP 유전자를 보정하기 위하여 세포를 분석하고, GFP 형광을 관찰하였다.In the second experiment, 0.7, 1.08 and 1.5 donor lengths were compared, respectively. As described in Example 11, T18 cells were infected with 50 ng of 287-FokI and 296-FokI expression plasmids (Example 7, Table 12) and 500 ng of 0.7 kbp, 1.08 kbp, 1.5 kbp donor. Four days after infection, cells were analyzed for FFP-deficient eGFP gene and GFP fluorescence was observed.

이러한 두 개의 실험 결과는, 표 16에서 보듯이, 긴 도너 서열은 표적화된 재조합의 주기를 증가시킨다는 사실을 보이고(따라서 유전자 보정의 주기 또한 증가), 세포 주기의 G2 단계에 세포를 고정하는 것은 또한 표적화된 재조합의 주기를 증가시킨다는 사실을 확인해 준다.These two experimental results show that long donor sequences increase the cycle of targeted recombination (and thus the cycle of gene correction also increases), as shown in Table 16, and fixing the cells in the G2 stage of the cell cycle also Confirming that it increases the cycle of targeted recombination.

도너 길이와 세포 주기 고정이 표적화된 재조합 주기에 미치는 영향Effect of Donor Length and Cell Cycle Immobilization on the Targeted Recombination Cycle
도너 길이 (kb)

Donor length (kb)
실험 1
노코다졸 농도
0 ng/ml 100ng/ml
Experiment 1
Nocodazole concentration
0 ng / ml 100 ng / ml

실험 2

Experiment 2
0.70.7 1.411.41 5.845.84 1.21.2 1.081.08 불실시Not carried out 불실시Not carried out 2.22.2 1.51.5 2.162.16 8.388.38 2.32.3 : 수치는 FACS 추적의 영역 E에 나타난 전체 형광의 백분율을 나타내며 (실시예 11 참고), 이것은 결함있는 염색체 eGFP 유전자의 보정을 위하여 표적화된 재조합의 과정을 거친 세포의 비율을 나타낸다. Note : The figure represents the percentage of total fluorescence in area E of FACS tracing (see example 11), which represents the percentage of cells that have undergone targeted recombination for correction of defective chromosome eGFP gene.

실시예 14: 징크 핑거 뉴클레아제를 이용하여 표적화된 절단에 의한 내인성 인간 IL-2Rγ 유전자의 편집 Example 14: Editing endogenous human IL-2R [gamma] gene by targeted cleavage using zinc finger nuclease

인간 IL-2Rγ 유전자를 표적으로 하는 ZFP-뉴클레아제를 각각 인코딩하는 두개의 발현 벡터를 만들었다. 각 ZFP-뉴클레아제는 징크 핑거 단백질-기반의 DNA 결합 도메인 (표 17)을 포함하고 있었는데, 이것을 4개의 아미노산 ZC 링커 (실시예 4)를 매개로 하여 IIS 제한 효소 FoKI (Wah et al. (1998) Proc. Natl. Acad. Sci. USA 95: 10564-10569의 서열의 아미노산 384-579) 형태의 뉴클레아제 도메인으로 융합하였다. 뉴클레아제의 설계는, 코돈 228과 229(돌연변이 빈발부위)를 둘러싸고 있는 염색체 IL-2Rγ 유전자의 엑손 5 위치에 결합하고, 그 결합 부위 사이에 있는 DNA의 이중-나선 절단을 유도하도록 하였다. Two expression vectors, each encoding a ZFP-nuclease targeting the human IL-2R gamma gene, were generated. Each ZFP-nuclease contained a zinc finger protein-based DNA binding domain (Table 17), which was cloned via the four amino acid ZC linker (Example 4) into the IIS restriction enzyme FokI (Wah et al. 1998) Proc. Natl. Acad. Sci. USA 95: 10564-10569 (amino acids 384-579). The design of the nuclease was designed to bind to the exon 5 position of the chromosomal IL-2Rγ gene surrounding codons 228 and 229 (frequent mutations) and to induce double-helix cleavage of DNA between the binding sites.

IL-2Rγ 유전자의 엑손 5를 위한 징크 핑거의 설계Design of zinc finger for exon 5 of IL-2Rγ gene 표적 서열Target sequence F1F1 F2F2 F3F3 F4F4 ACTCTGTGGAAG
(SEQ ID NO: 152) 5-8G
ACTCTGTGGAAG
(SEQ ID NO: 152) 5-8G
RSDNLSV
(SEQ ID NO : 153)
RSDNLSV
(SEQ ID NO: 153)
RNAHRIN
(SEQ ID NO : 154)
RNAHRIN
(SEQ ID NO: 154)
RSDTLSE
(SEQ ID NO : 155)
RSDTLSE
(SEQ ID NO: 155)
ARSTRTN
(SEQ ID NO : 156)
ARSTRTN
(SEQ ID NO: 156)
AAAGCGGCTCCG
(SEQ ID NO: 157) 5-9G
AAAGCGGCTCCG
(SEQ ID NO: 157) 5-9G
RSDTLSE
(SEQ ID NO : 158)
RSDTLSE
(SEQ ID NO: 158)
ARSTRTT
(SEQ ID NO : 159)
ARSTRTT
(SEQ ID NO: 159)
RSDSLSK
(SEQ ID NO : 160)
RSDSLSK
(SEQ ID NO: 160)
QRSNLKV
(SEQ ID NO : 161)
QRSNLKV
(SEQ ID NO: 161)
주: 하나의 문자 코드로 표시된 징크 핑거 아미노산 서열은, 각 징크 핑거의 알파-나선 부분의 시작점과의 관계에서 잔기 -1에서 +6까지를 각각 나타낸다. 핑거 Fl은 단백질의 아미노 말단에 가장 가까이 있다.Note: The zinc finger amino acid sequence represented by one character code represents residues -1 to +6 in relation to the starting point of the alpha-helical portion of each zinc finger. Finger Fl is closest to the amino terminus of the protein.

각각의 키메라 엔도뉴클레아제의 상세한 DNA-결합 부분은 하기와 같다:The detailed DNA-binding portion of each chimeric endonuclease is as follows:

ACTCTGTGGAAG를 표적으로 하는 뉴클레아제 (SEQ ID NO : 152)Nucleases targeting ACTCTGTGGAAG (SEQ ID NO: 152)

MAERPFQCRICMRNFSRSDNLSVHIRTHTGEKPFACDICGRKFARNAHRINHTKIHTGSQKPFQCRICMRNFSRSDTLSEHIRTHTGEKPFACDICGRKFAARSTRTNHTKIHLRGS (SEQ ID NO : 162)MAERPFQCRICMRNFSRSDNLSVHIRTHTGEKPFACDICGRKFARNAHRINHTKIHTGSQKPFQCRICMRNFSRSDTLSEHIRTHTGEKPFACDICGRKFAARSTRTNHTKIHLRGS (SEQ ID NO: 162)

AAAGCGGCTCCG를 표적으로 하는 뉴클레아제 (SEQ ID NO : 157)Nucleases targeting AAAGCGGCTCCG (SEQ ID NO: 157)

MAERPFQCRICMRNFSRSDTLSEHIRTHTGEKPFACDICGRKFAARSTRTTHTKIHTGSQKPFQCRICMRNFSRSDSLSKHIRTHTGEKPFACDICGRKFAQRSNLKVHTKIHLRGS (SEQ ID NO : 163)MAERPFQCRICMRNFSRSDTLSEHIRTHTGEKPFACDICGRKFAARSTRTTHTKIHTGSQKPFQCRICMRNFSRSDSLSKHIRTHTGEKPFACDICGRKFAQRSNLKVHTKIHLRGS (SEQ ID NO: 163)

인간의 배아기 신장 293 세포를 2개의 발현 구조체로 감염시켰는데 (리포펙타민 2000; Invitrogen), 각각은 상기 단락에서 기술한 ZFP-뉴클레아제 하나를 코딩화한다. 또한 삽입체로 기능하면서 IL-2Rγ 유전자좌의 1,543 bp 절편을 나르는 도너 구조체를 이용하여, pCR4Blunt Topo (Invitrogen) 벡터에서 상기 세포를 감염시켰는데, 상기 절편은 X 염색체의 마이너스 나선에 있는 위치 69195166-69196708에 해당한다. IL-2Rγ는 엑손 5 서열에 있는 하기의 두개의 점돌연변이를 포함하는 서열을 삽입한다(밑줄부분):Human embryonic kidney 293 cells were infected with two expression constructs (Lipofectamine 2000; Invitrogen), each encoding one of the ZFP-nucleases described in the above paragraph. The donor construct, which functions as an insert and carries a 1,543 bp fragment of the IL-2Rγ locus, was used to infect the cell in a pCR4Blunt Topo (Invitrogen) vector, which is located at the position 69195166-69196708 on the minus helix of the X chromosome . IL-2Rγ inserts a sequence containing the following two point mutations in the exon 5 sequence (underlined):

F R V R S R F N P L C G S (SEQ ID NO : 164)F R V R S R F N P L C G S (SEQ ID NO: 164)

TTTCGTGTTCGGAGCCGGTTTAACCCGCTCTGTGGAAGT (SEQ ID NO : 165)TTTCGTGTTCGGAGCCG G TTTAACCC G CTCTGTGGAAGT (SEQ ID NO: 165)

첫 번째 돌연변이 (CGC->CGG)는 아미노산 서열(윗줄)은 변경시키지 않고, ZFP-뉴클레아제가 도너 DNA에 결합하고 또 이에 이은 재조합에서의 염색체 DNA와 결합하는 능력에 나쁜 영향을 미치게 된다. 두 번째 돌연변이 (CCAoCCG)는 아미노산 서열을 변경하지 않고 제한 효소 BsrBI를 위한 인식 부위를 형성한다.The first mutation (CGC-> CGG) does not alter the amino acid sequence (the top row), and the ZFP-nucleases bind to the donor DNA, which then adversely affects the ability to bind to chromosomal DNA in recombination. The second mutation (CCAoCCG) does not alter the amino acid sequence but forms a recognition site for the restriction enzyme BsrBI.

50 또는 100 ng의 각 ZFP-뉴클레아제 발현 구조체와, 0.5 또는 1 mg의 도너 구조체가 쌍으로 감염에 사용되었다. 또한 하기의 대조 실험 역시 실시되었다: eGFP 단백질을 코드화하는 발현 플라스미드를 이용한 감염, ZFP 뉴클레아제만을 발현하는 플라스미드를 이용한 감염. 감염 후 24시간이 지난 후, 각 쌍의 하나에 빈블라스틴(Sigma)을 첨가하여 0.2μM의 최종 농도를 맞추고 나머지 하나는 그대로 두었다. 빈블라스틴은 세포가 유사분열방추를 모으는 능력에 영향을 미쳐서 마치 강력한 G2기 고정물로 작용한다. 이러한 처리는 표적화의 주기를 향상하기 위하여 이루어졌는데, 왜냐하면 세포 주기의 G2 단계에서는 상동성-직접적 이중 나선 단절 복구 경로가, 비상동성 말단 결합보다 더 활성화되기 때문이다.50 or 100 ng of each ZFP-nuclease expression construct and 0.5 or 1 mg of the donor construct were used for the infection in pairs. The following control experiments were also performed: infection with an expression plasmid encoding the eGFP protein, infection with a plasmid expressing only the ZFP nuclease. Twenty-four hours after infection, one of each pair was supplemented with Vinblastine (Sigma) to a final concentration of 0.2 μM and the other was left alone. Vinblastin affects the ability of cells to collect mitotic spindles and acts as a powerful G2 fixture. This treatment was done to improve the targeting cycle, because in the G2 stage of the cell cycle, the homology-directed double-strand break recovery pathway is more active than the non-homologous end-binding.

0.2μM의 빈블라스틴 처리후 48시간이 지나서, 성장 배지를 교체하고, 추가적으로 24시간 동안 세포가 빈블라스틴 처리를 회복하도록 하였다. DNEasy 조직 키트(Qiagen)를 이용하여 모든 세포 샘플에서 게놈 DNA를 분리하였다. 유전자 표적화의 주기를 구하기 위해 각 샘플에서 500 ng의 게놈 DNA를 분석하였는데, 도 33에서 도식적으로 설명된 분석법을 이용하여 염색체 IL-2Rγ 유전자좌에 있는 새로 형성된 BsrBI를 분석하는 검사방법에 의하였다.After 48 hours of treatment with 0.2 [mu] M vinblastine, the growth medium was changed and cells were allowed to recover the vinblastine treatment for an additional 24 hours. Genomic DNA was isolated from all cell samples using a DNEasy tissue kit (Qiagen). To determine the cycle of gene targeting, 500 ng of genomic DNA was analyzed in each sample, and the assay method was used to analyze the newly formed BsrBI in the chromosomal IL-2Rγ locus using the assay schematically illustrated in FIG.

요약하면, 표 18에서 보듯이 프라이머를 이용하여 PCR을 20번 순환 실시하였다. 1.5kb 도너 서열에 상동하는 영역 밖에서 각각 염색체 IL-2Rγ 유전자좌와 즉시 혼성화하게 된다. PCR 생성물의 검출을 위하여 각 PCR 반응마다 20 마이크로퀴리의 α-32P-dCTP와 α-32P-dATP를 함유하게 한다. PCR 반응을 G-50 칼럼(Amersham)에서 탈염 처리하고, 1시간 동안 증해하여 10 단위의 BsrBI를 만들었다. 증해한 생산물을 10%의 비변성 폴리아크릴아미드 겔(BioRad)에 용해하고, 겔을 말린 후 방사능 사진을 촬영하였다 (도 34). IL-2Rγ 유전자좌의 1.55 kb 증폭 절편에 해당되는 주요 PCR 생산물과 더불어(도 34의 wt), 추가적인 밴드가 관찰되었는데 (도 34의 rflp), 이는 도너 DNA 구조체와 두개 전부의 ZFP-뉴클레아제 구조체로 감염된 세포 샘플에 해당한다. 상기의 추가적인 밴드는 대조 레인에는 나타나지 않는 것인데, 이것은 BsrBI RFLP-함유 도너 서열이 염색체에 ZFP 뉴클레아제-조장성 재조합이 본 실험에서 발생하였음을 나타낸다.In summary, as shown in Table 18, the PCR was carried out 20 times using the primer. They immediately hybridize with chromosomal IL-2R [gamma] loci outside the region homologous to the 1.5 kb donor sequence. For the detection of PCR products, each PCR reaction should contain 20 microqueries of α- 32 P-dCTP and α- 32 P-dATP. The PCR reaction was desalted on a G-50 column (Amersham) and digested for 1 hour to yield 10 units of BsrBI. The digested product was dissolved in 10% of unmodified polyacrylamide gel (BioRad), the gel was dried and radiographs were taken (FIG. 34). An additional band was observed (rflp in FIG. 34), along with the major PCR product corresponding to the 1.55 kb amplification fragment of the IL-2Rγ locus (wt in FIG. 34), indicating that the donor DNA construct and the two whole ZFP-nuclease constructs Lt; / RTI > infected cells. These additional bands do not appear in the control lane, indicating that the BsrBI RFLP-containing donor sequence generated ZFP nuclease-promoting recombination in the chromosome in this experiment.

추가적인 실험에서는, 극소량의 RFLP 함유 IL-2Rγ DNA 서열을 인간 게놈 DNA (야생형 IL-2Rγ 유전자 함유)에 첨가하고, 그 혼합결과물을 증폭하고 RFLP에서 절단하는 제한 효소로 증해하였는데, 상기의 평가법을 이용하여 0.5%만큼 작은 RFLP 함유 서열도 검출될 수 있음을 보였다.In a further experiment, a very small amount of RFLP-containing IL-2Rγ DNA sequence was added to human genomic DNA (containing the wild-type IL-2Rγ gene) and the resultant mixture was amplified and digested with restriction enzymes cleaved at RFLP. Lt; RTI ID = 0.0 > 0.5% < / RTI >

인간 IL-2Rγ 유전자의 분석을 위한 올리고뉴클레오티드Oligonucleotides for the analysis of human IL-2R gamma gene 올리고뉴클레오티드Oligonucleotide 서열order Ex5_1.5detF1Ex5_1.5detF1 GATTCAACCAGACAGATAGAAGG (SEQ ID NO : 166)GATTCAACCAGACAGATAGAAGG (SEQ ID NO: 166) Ex5_1.5detR1Ex5_1.5detR1 TTACTGTCTCATCCTTTACTCC (SEQ ID NO : 167)TTACTGTCTCATCCTTTACTCC (SEQ ID NO: 167)

실시예 15: K562 세포의 IL-2Rγ 유전자좌에 대한 표적화된Example 15: Targeted expression of IL-2R [gamma] locus in K562 cells 재조합Recombination

K562는 인간의 만성 골수성 백혈병에서 유래하는 세포계를 말한다. 표적화된 절단을 위해 사용되는 단백질은, 5-8G 및 5-9D 징크 핑거 DNA 결합 도메인에 융합하는 FokI이다(실시예 14, 표 17). 도너 서열은 실시예 14에서 기술하였듯이, 돌연변이에 의한 BsrBI 부위를 포함하는 인간 IL-2Rγ 유전자의 1.5kbp 절편이 된다.K562 refers to a cell line derived from human chronic myelogenous leukemia. The protein used for targeted cleavage is Fok I, which fuses to the 5-8G and 5-9D zinc finger DNA binding domains (Example 14, Table 17). The donor sequence is a 1.5 kbp fragment of the human IL-2R gamma gene containing the BsrBI site by mutation, as described in Example 14. [

K562 세포는 RPMI 배지 1640(Invitrogen)에서 배양되고, 10%의 소태혈청 (FBS, Hyclone)과 2 mM L-글루타민을 보충한다. 모든 세포들은 5% CO2의 환경에서 37°C를 유지한다. 이러한 세포들은 Nucleofection™(Solution V, Program T16) (Amaxa Biosystems)로 감염되고, 생산자의 규약에 따라서, 샘플마다 2백만개의 세포를 감염시킨다. 감염 DNA는, 하기에 기술한 것과 같이 다양한 조합으로 사용되는데, 5-8G ZFP-FokI 융합 엔도뉴클레아제를 코드화하는 플라스미드, 5-9D ZFP- FokI 융합 엔도뉴클레아제를 코드화하는 플라스미드, 상기 실시예 14에서 기술한 도너 서열과 조절체로 사용되는 peGFP-N1 벡터(BD Biosciences)를 포함하는 플라스미드 등이 있다.K562 cells are cultured in RPMI medium 1640 (Invitrogen) supplemented with 10% fetal bovine serum (FBS, Hyclone) and 2 mM L-glutamine. All cells are maintained at 37 ° C in a 5% CO 2 environment. These cells are infected with Nucleofection ™ (Solution V, Program T16) (Amaxa Biosystems) and infect 2 million cells per sample according to the manufacturer's protocol. Infected DNA is used in various combinations as described below, including plasmids encoding 5-8G ZFP-FokI fusion endonuclease, plasmids encoding 5-9D ZFP-FokI fusion endonuclease, A plasmid containing the donor sequence described in Example 14 and the peGFP-N1 vector (BD Biosciences) used as a regulator.

첫 번째 실험에서는, 표 19에서와 같이 세포들은 다양한 플라스미드나 그 조합을 이용하여 감염된다.In the first experiment, cells are infected with various plasmids or combinations thereof, as shown in Table 19.

샘플 #Sample # p-eGFP-N1p-eGFP-N1 p5-8Gp5-8G p5-9Dp5-9D 도너donor 빈블라스틴Bin blastin 1One 5 μg5 μg -- -- -- -- 22 -- -- -- 50 μg50 μg -- 33 -- -- -- 50 μg50 μg 처리함Processed 44 -- 10 μg10 μg 10 μg10 μg -- -- 55 -- 5 μg5 μg 5 μg5 μg 25 μg25 μg -- 66 -- 5 μg5 μg 5 μg5 μg 25 μg25 μg 처리함Processed 77 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 25 μg25 μg -- 88 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 25 μg25 μg 처리함Processed 99 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 50 μg50 μg -- 1010 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 50 μg50 μg 처리함Processed

빈블라스틴 처리는, 감염 24시간 후 세포를 30 시간동안 0.2 uM 빈블라스틴에 노출하는 방식으로 하였다. 세포를 수집한 후, PBS로 두 번 씻은 다음, 다시 성장 배지에 놓았다. 게놈 DNA의 분석을 위하여 감염후 4일이 지나서 세포를 수확하였다.Vinblastine treatment was carried out by exposing the cells to 0.2 uM vinblastine for 30 hours after 24 hours of infection. The cells were harvested, washed twice with PBS, and then placed on growth medium again. Cells were harvested 4 days after infection for genomic DNA analysis.

DNEasy 키트(Qiagen)를 사용하여 세포에서 게놈 DNA를 추출하였다. 하기의 프라이머와의 PCR 반응에는 각 샘플마다 100 ng의 게놈 DNA가 사용되었다:Genomic DNA was extracted from the cells using a DNEasy kit (Qiagen). 100 ng of genomic DNA was used for each sample in the PCR reaction with the following primers:

엑손 5 전방향: GCTAAGGCCAAGAAAGTAGGGCTAAAG (SEQ ID NO : 168)Exon 5 forward direction: GCTAAGGCCAAGAAAGTAGGGCTAAAG (SEQ ID NO: 168)

엑손 5 역방향: TTCCTTCCATCACCAAACCCTCTTG (SEQ ID NO : 169)Exon 5 reverse direction: TTCCTTCCATCACCAAACCCTCTTG (SEQ ID NO: 169)

이러한 프라이머들은 "마이너스" 나선상 (UCSC 인간 게놈 2003년 7월 공개)의 위치 69195100 ~ 69196768에 해당하는 X 염색체의 1,669 절편을 증폭하는데, 그 나선에는 IL-2Rγ 유전자의 엑손 5가 포함되어 있다. 도너 DNA와 상동성 재조합 과정을 거친 게놈 DNA의 증폭을 통하여 BsrBI 부위를 포함하는 결과물을 얻을 수 있다. 이에 반하여 도너 DNA와 상동성 재조합의 과정을 거치지 않은 게놈 DNA를 증폭하여 얻은 결과물은 상기 제한 부위를 포함하지 않을 것이다.These primers amplify 1,669 fragments of the X chromosome corresponding to positions 69195100 to 69196768 of the "minus" spiral (UCSC Human Genome published July 2003), which contains exon 5 of the IL-2Rγ gene. By amplifying the genomic DNA that has undergone homologous recombination with the donor DNA, a result containing the BsrBI region can be obtained. On the contrary, the result obtained by amplifying genomic DNA not subjected to homologous recombination with donor DNA will not include the restriction sites.

반응물의 검증을 위해서 각 증폭 반응마다 각각 10 마이크로퀴리의 α-32PdCTP 및 α-32PdATP가 포함되게 하였다. PCR을 20번 순환한 후, Sephadex G-50 칼럼 (Pharmacia)상에서 탈염 처리하고, BsrBI(New England Biolabs) 10 단위를 이용하여 37°C에서 1시간 동안 증해시켰다. 10%의 비변성 PAGE에 용해한 후, 말리고, PhosphorImager 스크린에 노출시켰다.To verify the reactants, 10 microcuries of α- 32 PdCTP and α- 32 PdATP were included for each amplification reaction. The PCR was cycled 20 times, then desalted on a Sephadex G-50 column (Pharmacia) and digested with 10 units of BsrBI (New England Biolabs) for 1 hour at 37 ° C. Dissolved in 10% non-denaturing PAGE, dried, and exposed to a PhosphorImager screen.

상기 실험의 결과는 도 35에 나타나 있다. 조절자 GFP 플라스미드, 그리고 도너 플라스미드 하나만 또는 도너 없이 두 개의 ZFP 코드화 플라스미드를 이용하여 세포를 감염하였을 때에는, 도 35에서 샘플에 해당되는 레인상에 "rflp"로 표시된 밴드가 없는 것을 통하여 알 수 있듯이, 증폭 생성물에는 BsrBI 부위가 발견되지 않았다. 그러나, 도너 플라스미드와 두 개의 ZFP 코드화 플라스미드를 모두 이용하여 감염시킨 세포의 경우, 도너 DNA와 상동성 재조합으로 유도된 BsrBI 부위가 그 세포의 게놈 DNA에 존재하였다("rflp"로 표시된 밴드). RFLP 함유 DNA가 나타낸 신호의 백분율 분석은 도 35에 나타나 있는데, 최적의 조건 아래에서는 감염된 세포의 모든 IL-2Rγ 유전자의 18%까지만이 상동성 재조합에 의한 개체수 변화가 있음을 알 수 있다.The results of the above experiment are shown in Fig. As shown by the absence of the band labeled "rflp " on the lane corresponding to the sample in Fig. 35 when the cells were infected with two ZFP-encoding plasmids without the regulator GFP plasmid and donor plasmid alone or donor, No BsrBI sites were found in the amplified products. However, for cells infected with both donor plasmids and two ZFP-encoding plasmids, BsrBI sites derived from homologous recombination with donor DNA were present in the genomic DNA of the cells (the band labeled "rflp"). The percent signal analysis of RFLP-containing DNA is shown in Figure 35. Under optimal conditions, only 18% of all IL-2Rγ genes in the infected cells are found to have a population change due to homologous recombination.

상기에서 기술된 형식에 따라서 두 번째 실험을 행하였는데, 다만 세포를 감염 후 10일 동안 확장하여 진행시켰다. 감염에 사용된 DNA는 표 20에 나타나 있다.A second experiment was performed according to the format described above, but the cells were expanded for 10 days after infection. The DNA used for infection is shown in Table 20.

샘플 #Sample # p-eGFP-N1p-eGFP-N1 p5-8Gp5-8G p5-9Dp5-9D 도너donor 빈블라스틴Bin blastin 1One 50 μg50 μg -- -- -- -- 22 -- -- -- 50 μg50 μg -- 33 -- -- -- 50 μg50 μg 처리함Processed 44 -- 7.5 μg7.5 μg 7.5 μg7.5 μg -- -- 55 -- 5 μg5 μg 5 μg5 μg 25 μg25 μg -- 66 -- 5 μg5 μg 5 μg5 μg 25 μg25 μg 처리함Processed 77 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 50 μg50 μg -- 88 -- 7.5 μg7.5 μg 7.5 μg7.5 μg 50 μg50 μg 처리함Processed

도 36의 증폭된 DNA의 BsrBI 분석을 통하여, IL-2Rγ 유전자의 18%가, 세포 분화의 다중 순회 후 상동 재조합을 통하여 서열 변질 과정을 거쳤다는 사실이 다시 증명된다. 따라서 표적화된 재조합 발생은 안정적이다.Through the BsrBI analysis of the amplified DNA of FIG. 36, it is again proved that 18% of the IL-2R gamma gene undergoes sequence alteration through homologous recombination after multiple rounds of cell differentiation. Therefore, targeted recombination occurrence is stable.

또한, 상기 두번째 실험에서 감염된 세포의 DNA를 서던 블로팅으로 분석하였다. 이 분석을 위하여, 각 샘플에서 12mg의 게놈 DNA를, 37℃에서 12시간동안 증해하였는데, 100 단위 EcoRI, 50 단위 BsrBI, 40 단위 DpnI (New England Biolabs)를 이용하였다. BsrBI 부위를 포함하게 하기 위하여 상동성 재조합에 의하여, 상기의 증해를 통하여 천연 IL-2Rγ 유전자(BsrBI 부위 부재)로부터 7.7 kbp의 Eco RI 절편을 얻어내고 그 서열이 변질된 염색체 IL-2Rγ 유전자로부터 6.7 및 1.0 kbp의 절편을 얻어내었다. dam-메틸화 도너 DNA를 파괴하기 위하여 메틸화 의존성 제한 효소인 DpnI를 포함시켰다.In the second experiment, the DNA of infected cells was analyzed by Southern blotting. For this analysis, 12 mg of genomic DNA was digested in each sample for 12 hours at 37 ° C, using 100 units of EcoRI, 50 units of BsrBI, and 40 units of DpnI (New England Biolabs). A 7.7 kbp Eco RI fragment was obtained from the native IL-2Rγ gene (BsrBI site member) through homologous recombination by homologous recombination to include the BsrBI site and the 6.7 kbp Eco RI fragment was obtained from the altered chromosomal IL-2Rγ gene And a fragment of 1.0 kbp were obtained. The methylation-dependent restriction enzyme DpnI was included to destroy the dam-methylated donor DNA.

증해한 후, 게놈 DNA를 페놀-클로로포름 추출법과 에탄올 침전법을 이용하여 정화시키고, TE 완충제로 재부유화한 후, 사이즈 마커를 만들기 위해 EcoRI와 SphI로 증해시킨 게놈 DNA 샘플을 함께 0.8%의 아가로스 겔에 용해시켰다. 겔은 표준처리절차에 이어 알칼린 전이 과정을 거치고, DNA는 나일론 멤브레인으로 전이된다(Schleicher and Schuell). 그 후, X 염색체(UCSC 인간 게놈 2003년 7월 공개)의 "-"나선의 69198428 ~ 69198769위치에 있는 IL 2Rγ 자리의 방사능 표시된 절편을 사용하여 블롯을 혼성화했다. 상기 유전자의 영역은 도너 DNA에 상동성을 지니는 영역의 바깥부분이다. 혼성화된 후, 상기 막을 PhosphorImager 플레이트에 노출시켰고, Molecular Dynamics 소프트웨어를 사용하여 상기 데이터를 정량했다. EcoRI-BsrBI 절편에 해당하는 밴드의 강도를 분석함으로써 염색체 IL 2Ry 서열의 개조를 측정했다(방사능 사진 옆의 화살표, BrBI 부위는 방사능 사진 위의 지도에서의 색칠해진 삼각형으로 표시). After digestion, the genomic DNA was purified using phenol-chloroform extraction and ethanol precipitation, resuspended with TE buffer, and genomic DNA samples digested with EcoRI and SphI to make size markers were ligated together with 0.8% agar And dissolved in a Ross gel. The gel is subjected to a standard treatment procedure followed by an alkaline transfer process, and the DNA is transferred to a nylon membrane (Schleicher and Schuell). The blots were then hybridized using the radioactively labeled fragments of the IL 2R? Locus at positions 69198428 to 69198769 on the "-" helix of the X chromosome (UCSC Human Genome published July 2003). The region of the gene is the outer portion of the region having homology to the donor DNA. After hybridization, the membrane was exposed to PhosphorImager plates and the data were quantified using Molecular Dynamics software. Modifications of the chromosomal IL2Ry sequence were determined by analyzing the intensity of the bands corresponding to the EcoRI-BsrBI fragment (the arrow next to the radiographic picture, the BrBI site is indicated by the colored triangles on the map above the radiographic picture).

도 37에 제시된 결과는 최대 15 %의 염색체 IL 2Ry 서열이 상동 재조합에 의해서 개조되었음을 나타낸다. 따라서, PCR에 의해서 얻은 결과는 다양한 수의 세포 분리를 통해서 표적화된 재조합이 안정적이라는 것을 확인시킨다. 또한, 서던 블롯 결과는 도 36에 제시된 결과가 증폭 생성물로부터 얻은 결과가 아님을 나타낸다. The results presented in Figure 37 show that up to 15% of the chromosomal IL2Ry sequences have been modified by homologous recombination. Thus, the results obtained by PCR confirm that the targeted recombination is stable through a number of cell separations. Also, the Southern blot results indicate that the results presented in Figure 36 are not the result of amplification products.

실시예 16 : CD34 양성 조혈모세포 내 IL 2Ry 자리에서의Example 16: Expression of IL-2Ry in CD34-positive hematopoietic cells 표적화된 재조합Targeted recombination

유전성 질환(예 : 중증합병 면역결핍증(SCID), 겸상적혈구빈혈증)은 질환의 원인이 되는 DNA 서열변경을 상동 재조합을 통해 편집함으로써 치료가 가능하다. 경우에 따라서는, 만능세포의 유전적 결함을 편집함으로써 치료 효율성 및 안정성을 극대화할 수 있다. 본 실시예에서는 이와 관련하여 인간 CD34 양성 골수세포의 IL-2Ry 유전자 서열 변경을 수행하였다. CD34+ 세포는 적혈구, 골수 및 림프구를 생산하는 만능 조혈모세포이다. Hereditary diseases (eg, severe combined immunodeficiency syndrome (SCID), sickle cell anemia) can be treated by editing DNA sequence changes that cause the disease through homologous recombination. In some cases, editing of genetic defects in pluripotent cells can maximize therapeutic efficiency and stability. In this example, the IL-2Ry gene sequence alteration of human CD34-positive bone marrow cells was performed in this regard. CD34 + cells are allogeneic hematopoietic stem cells that produce red blood cells, bone marrow, and lymphocytes.

AllCells, LLC에서 냉동상태로 입수한 골수 유래 인간 CD34 세포를 사용하였다. 세포를 해동시켜 37℃의 5% C02 RPMI Medium 1640(Invitrogen)에서 2시간 동안 방치한 후, 10% 우태혈청(FBS, Hyclone) 및 2 mM L-글루타민을 공급하였다. 인간 CD34 세포 뉴클레오펙터 키트를 사용하여 세포 샘플(세포 수: 1xl06 또는 2xl06 개)을 뉴클레오펙션(amaxa biosystems)으로 감염시켰다. 10% FBS, 2 mM L-글루타민, 100ng/ml 과립백혈구군 자극인자(G-CSF), 100ng/ml 줄기세포인자(SCF), 100ng/ml 트롬보포이틴(TPO), 50ng/ml Flt3 리간드 및 20ng/ml 인터류킨-6(IL- 6)를 공급한 후 감염된 세포를 RPMI 배지 1640(Invitrogen)에서 배양하였다. 감염 직후, 카스파제 억제제인 VAD-FMK(Sigma-Aldrich)를 최종농도 40 uM으로 성장배지에 가하여 세포사멸을 억제하였다. 48시간 후에, 카스파제 억제제를 최종농도 20 uM로 추가로 가하였다. 37℃, 5% C02 조건에서 3일 동안 배양한 후 세포를 회수하였다.Bone marrow-derived human CD34 cells obtained frozen at AllCells, LLC were used. After thawing the cells was allowed to stand for 2 hours in 5% C0 2 RPMI Medium 1640 ( Invitrogen) in 37 ℃, and fed with a 10% fetal calf serum (FBS, Hyclone) and 2 mM L- glutamine. Cell samples (cell number: 1 x 10 6 or 2 x 10 6 ) were infected with the nucleofection (amaxa biosystems) using human CD34 cell nucleocyte factor kit. (G-CSF), 100 ng / ml stem cell factor (SCF), 100 ng / ml thrombopoietin (TPO), 50 ng / ml Flt3 ligand and 10 ng / After feeding 20 ng / ml interleukin-6 (IL-6), the infected cells were cultured in RPMI medium 1640 (Invitrogen). Immediately after infection, the caspase inhibitor VAD-FMK (Sigma-Aldrich) was added to the growth medium to a final concentration of 40 uM to inhibit apoptosis. After 48 hours, the caspase inhibitor was further added to a final concentration of 20 uM. In 37 ℃, 5% C0 2 condition for 3 days to recover the cultured cells.

감염실험에 사용된 세포 수 및 DNA는 표 21과 같다. The number of cells and DNA used in the infection experiment are shown in Table 21.

샘플Sample 세포 수Cell number p-eGFP-N1p-eGFP-N1 1One 도너donor 22 p5-8Gp5-8G 33 p5-9Dp5-9D 33 1One l

20um에는 몇 dna ug ul

l06l

20um에는 몇 dna ug ul

10 6 5 ug5 ug -- -- -- 22 2

20um에는 몇 dna ug ul

l06
2

20um에는 몇 dna ug ul

10 6
-- 50 ug50 ug -- -- 33 2

20um에는 몇 dna ug ul

l06
2

20um에는 몇 dna ug ul

10 6
-- 50 ug50 ug 7.5 ug7.5 ug 7.5 ug7.5 ug 1. 강화된 녹색 형광단백질을 암호화하는 대조용 플라스미드.
2. BsrBI 부위가 도입된 IL 2Ry 유전자의 엑손 5 서열을 포함하는 1.5 kbp 절편
(실시예 14 참조).
3. 5-8 G 및 5-9D 징크핑거 DNA 결합도메인과의 FokI 융합을 암호화하는 플라스미드
(표 17 참조).
1. Reference plasmid encoding enhanced green fluorescent protein.
2. A 1.5 kbp fragment containing the exon 5 sequence of the IL 2Ry gene into which the BsrBI site was introduced
(See Example 14).
3. Plasmids encoding FokI fusion with 5-8 G and 5-9D zinc finger DNA binding domains
(See Table 17).

MasterPure DNA 정제 키트(Epicentre)를 사용하여 세포에서 게놈 DNA를 추출하였다. 침전물에 존재하는 글리코겐 때문에 PCR 반응에 사용되는 DNA 양의 정확한 정량은 불가능하다. 브롬산에티디움으로 염색한 아가로스 겔로 분석한 결과, 각 샘플 당 약 50 ng의 게놈 DNA가 사용된 것으로 추정되었다. 하기의 프라이머를 사용하여 PCR을 30사이클 수행하였다. 각 프라이머는 1.5 kb 도너와 상동성이 있는 부위 바로 바깥쪽의 염색체 IL-2Ry 자리에서 하이브리드된다.Genomic DNA was extracted from the cells using a MasterPure DNA purification kit (Epicenter). Due to the presence of glycogen in the precipitate, the exact quantification of the amount of DNA used in the PCR reaction is impossible. Analysis by agarose gel stained with bromide acid was found to result in about 50 ng of genomic DNA being used per sample. PCR was performed for 30 cycles using the following primers. Each primer hybridizes to the chromosome IL-2Ry located just outside the site that is homologous to the 1.5 kb donor.

ex5_1.5detF3 GCTAAGGCCAAGAAAGTAGGGCTAAAG (SEQ ID NO : 170)ex5_1.5detF3 GCTAAGGCCAAGAAAGTAGGGCTAAAG (SEQ ID NO: 170)

ex5_1.5detR3 TTCCTTCCATCACCAAACCCTCTTG (SEQ ID NO : 171)ex5_1.5detR3 TTCCTTCCATCACCAAACCCTCTTG (SEQ ID NO: 171)

PCR 반응시 a-32PdCTP 및 a-32PdATP 20 마이크로퀴리씩을 가하여 PCR 생성물을 검출하였다. 쥬카르트 세포의 IL- 2R 감마 유전자의 엑손 5에 자발성 SNP가 존재하는지를 확인하여 겔 내 함량을 평가하였다. SNP는 정상적인 인간 DNA에 존재하는 MaeII 부위를 파괴하여 RFLP를 생성한다. 따라서, 정상적인 인간 게놈 DNA(Clontech, Palo Alto, CA) 1 또는 10 ng을 쥬카르트 게놈 DNA 100 또는 90 ng에 각각 가한 후, 위에서 설명한 바와 같이 PCR을 실행하여 참고표준을 만들었다. PCR 생성물을 G-50 칼럼(Amersham)으로 탈염한 후, 제한효소로 1시간 동안 처리하였다. 실험 샘플은 BsrBI(New England Biolabs) 10 유닛으로 처리하였고, "참고표준" 생성물은 MaeII로 처리하였다. 처리 생성물을 10% 비변성 PAGE (BioRad)에 녹인 후, 형성된 겔을 PhosphorImager 플레이트(Molecular Dynamics)에 노출하여 건조, 분석하였다. PCR products were detected by adding 20 microcuries each of a-32PdCTP and a-32PdATP in the PCR reaction. The content in the gel was evaluated by confirming the presence of spontaneous SNP in exon 5 of the IL-2R gamma gene of Jurkat cells. SNP destroys the MaeII site present in normal human DNA to produce RFLP. Thus, 1 or 10 ng of normal human genomic DNA (Clontech, Palo Alto, CA) was added to 100 or 90 ng of jucart genomic DNA, respectively, and PCR was performed as described above to generate reference standards. The PCR product was desalted with G-50 column (Amersham) and then treated with restriction enzyme for 1 hour. Experimental samples were treated with 10 units of BsrBI (New England Biolabs) and the "reference standard" product was treated with MaeII. After the treated product was dissolved in 10% non-denaturing PAGE (BioRad), the gel formed was exposed to PhosphorImager plates (Molecular Dynamics), dried and analyzed.

결과는 도 38에 도시하였다. 주요 PCR 생성물은 IL2Ry 자리의 1.6 kb 절편(도 38 오른쪽의 "wt")이며, 그 외에 ZFP-뉴클레아제와 도너 DNA 구성체를 암호화하는 플라스미드에 의해 감염된 세포에서 취한 샘플에 해당하는 밴드("rflp")가 관찰되었다. 이 밴드는 대조군에서는 발견되지 않았으며, 이는 ZFP-뉴클레아제가 보조 유전자 표적화 공통 감마사슬 유전자의 엑손 5 표적화를 보조한다는 것을 뒷받침해 준다. The results are shown in Fig. The major PCR product is a 1.6 kb fragment of the IL2Ry locus ("wt" on the right side of Figure 38) and a band corresponding to the sample taken from the infected cell by a plasmid encoding ZFP-nuclease and donor DNA constructs ("rflp ") Was observed. This band was not found in the control group, which supports that ZFP-nuclease assist in targeting exon 5 of the accessory gene common gamma chain gene.

RFLP 밴드가 야생형 밴드와 가깝게 위치하고 있어 표적화 빈도를 정확하게 정량화하기는 어렵지만, 참고표준(왼쪽 패널)과 비교할 때 표적화 빈도는 1~5%로 추정되었다. It is difficult to quantify the targeting frequency accurately because the RFLP band is located close to the wild-type band, but the targeting frequency is estimated to be 1 to 5% compared to the reference standard (left panel).

실시예 17: 도너 표적 상동성의 효과Example 17: Effect of donor target homology

도너 DNA와 재조합 염색체 서열 사이의 상동성 정도가 상동 재조합의 빈도에 미치는 효과를 T18 셀라인을 대상으로 실험하였다(실시예 9 참조). 셀라인은 염색체 통합 결함성 eGFP 유전자를 포함하고 있었으며, 도너 DNA는 염색체 유전자의 결함을 편집하는 서열변경을 포함하고 있었다. The effect of degree of homology between the donor DNA and the recombinant chromosome sequence on the frequency of homologous recombination was tested on T18 cell line (see Example 9). Celluline contained a chromosomally integrated defect-free eGFP gene, and donor DNA contained sequence modifications that edited defects in the chromosomal gene.

따라서, PCR 돌연변이에 의해 실시예 10의 도너 서열이 변경되어, 표적과 다양한 비상동성을 가지는 700 bp 도너 구조체들이 생성되었다. 변경된 도너는 모두 염색체 eGFP 유전자의 결함을 편집하는 서열변경을 포함하고 있었으며 절단부위 주변의 암호화 부위에 삽입되는 침묵 돌연변이(암호화된 단백질의 서열을 변경시키지 않는 DNA 돌연변이)를 포함하고 있었다. 침묵 돌연변이는 징크핑거 절단 도메인 융합에 의한 도너 서열과의 결합 및 도너 서열의 절단을 막아, 염색체 표적과 도너 플라스미드가 경쟁적으로 키메라 뉴클레아제와 결합하는 것을 억제하기 위함이다. 또한, 상동 재조합이 있은 후, 키메라 뉴클레아제가 새로 삽입된 염색체 서열과 결합하였다가 다시 분리되는 현상 역시 최소화된다(새로운 재조합의 촉진이나 비상동성 말단결합 또는 기타 이중사슬의 붕괴에 의한 게놈의 변경 역시 최소화될 수 있다).Thus, the donor sequence of Example 10 was altered by PCR mutation, resulting in 700 bp donor constructs with targets and various non-similarities. All of the modified donors contained sequence modifications that edited defects in the chromosomal eGFP gene and included silent mutations (DNA mutations that did not alter the sequence of the encoded protein) inserted in the coding region around the cleavage site. The silent mutation is intended to inhibit the binding of the donor sequence to the donor sequence and the cleavage of the donor sequence by zinc finger cleavage domain fusion, thereby preventing the chromosomal target and donor plasmid competitively binding to the chimeric nuclease. In addition, after homologous recombination, the phenomenon of chimeric nuclease binding and reassociation with the newly inserted chromosomal sequence is also minimized (either by promoting a new recombination or by altering the genome by non-homologous end joining or other double chain disruption Can be minimized).

4개의 각기 다른 도너 서열을 테스트하였다. 도너 1은 염색체 결함성 eGFP 표적서열과의 미스매치가 8개, 도너 2는 10개, 도너 3은 6개, 도너 5는 4개였다. 도너 5의 서열은 야생형 eGFP 서열과 동일하나, T18 셀라인 내의 염색체 결함 eGFP 서열과 미스매치가 4개이다. 뉴클레오티드 201~242의 각 도너의 서열을 표 22에 제시하였다. T18 셀라인의 게놈 내로 통합된, 결함 eGFP 유전자의 서열과 다른 뉴클레오티드는 볼드체 및 밑줄로 표시하였다. 결함 염색체 eGFP 유전자(GFP mut) 및 정상적인 eGFP 유전자(GFP wt)의 서열도 함께 표시하였다. Four different donor sequences were tested. Donor 1 had 8 mismatches with the chromosomally defective eGFP target sequence, 10 donors 2, 6 donors 3, and 4 donors 5. Donor 5 has the same sequence as the wild-type eGFP sequence, but has four chromosomal defective eGFP sequences and mismatches in T18 cell line. The sequence of each donor of nucleotides 201 to 242 is shown in Table 22. < tb > < TABLE > The sequence of the defective eGFP gene integrated into the genome of T18 cell line and other nucleotides are indicated by bold and underlined. The sequences of the defect chromosome eGFP gene (GFP mut) and the normal eGFP gene (GFP wt) are also indicated.

도너donor 서열order SEQ ID NO.SEQ ID NO. 도너 lDonor l CTTCAGCCGCTA TCC AGA CCAC ATGAA ACA ACACGACTTCTT CTTCAGCCGCTA T CC AG A C CAC AT GAA A CA A CACGACTTCTT 172172 도너 2Donor 2 CTTCAGCCG GTA TCC AGA CCAC ATGAA ACA ACA TGACTTCTT CTTCAGCCG G TA T CC AG A C CAC AT GAA A CA A CA T GACTTCTT 173173 도너 3Donor 3 CTTCAGCCGCTACCC AGA CCAC ATGAA ACAGCACGACTTCTT CTTCAGCCGCTACCC AG A C CAC AT GAA A CAGCACGACTTCTT 174174 도너 5Donor 5 CTTCAGCCGCTACCCC GA CCAC ATGAAGCAGCACGACTTCTTCTTCAGCCGCTACCCC G A C CAC AT GAAGCAGCACGACTTCTT 175175 GFP mutGFP mut CTTCAGCCGCTACCCCTAACAC--GAAGCAGCACGACTTCTTCTTCAGCCGCTACCCCTAACAC - GAAGCAGCACGACTTCTT 176176 GFP wtGFP wt CTTCAGCCGCTACCCC GA CCAC ATGAAGCAGCACGACTTCTTCTTCAGCCGCTACCCC G A C CAC AT GAAGCAGCACGACTTCTT 177177

실시예 11에서와 같이, 50 ng의 287-FokI 및 296-FokI 발현 구조체(실시예 7, 표 12)과 500 ng의 각 도너 구조체로 T18 셀라인을 감염시켰다. 실시예 11에서와 같은 방법으로 FACS 분석을 실시하였다. As in Example 11, 50 ng of 287-FokI and 296-FokI expression constructs (Example 7, Table 12) and 500 ng of each donor construct were infected with T18 cell line. FACS analysis was carried out in the same manner as in Example 11.

표 23에 제시된 바와 같이, 도너 서열과 염색체 표적서열 사이에 미스매치가 감소함에 따라(즉 상동성이 증가함에 따라) GFP 기능이 회복되었으며, 따라서 상동 재조합 빈도가 증가하는 것으로 나타났다. As shown in Table 23, GFP function was restored as the mismatch between the donor and chromosome target sequences decreased (i.e., as the homology increased) and thus the homologous recombination frequency was found to increase.

도너donor 미스매치 수Mismatch count 편집된 eGFP 유전자 도너를 가지는 세포의 비율Percentage of cells with edited eGFP gene donors 22 도너 2Donor 2 1010 0.45%0.45% 도너 1Donor 1 88 0.53%0.53% 도너 3Donor 3 66 0.89%0.89% 도너 5Donor 5 44 1.56%1.56% 1 : 결함 염색체 eGFP 유전자를 포함하는 T18 세포를 2개의 ZFP 뉴클레아제를 암호화하는
플라스미드 및 염색체 표적서열과 다양한 수의 서열 미스매치를 가지는 비결함 eGFP
서열을 암호화하는 도너 플라스미드로 감염시켰다. 독시시클린으로 염색체 eGFP 유전자의
발현을 유도하였으며, 5일 후에 FACS 분석을 실시하였다.
2: 수치는 525 nm에서 고발광, 570 nm(FACS의 E 영역)에서 저발광을 보이는 형광발광의
전 전체 비율을 뜻한다.
1: T18 cells containing the defective chromosomal eGFP gene were transfected with two ZFP nucleases encoding
Plasmid and chromosome target sequences and non-defective eGFP
Lt; RTI ID = 0.0 > donor < / RTI > As a cytoskeleton, the chromosomal eGFP gene
Expression was induced, and FACS analysis was performed after 5 days.
2: Numerical values indicate fluorescence emission at 525 nm, low emission at 570 nm (E region of FACS)
I mean the total percentage.

상기 결과는 표적서열과 도너 서열 사이의 편차를 줄임으로써 상동 재조합 수준을 높일 수 있다는 것을 보여준다. 어떤 특정한 이론 또는 메커니즘에 국한되는 것은 아니지만, 도너와 표적 사이의 상동성이 클수록 세포의 상동 재조합 시스템이 도너분자를 적절한 주형으로 인지하게 되어 상동 재조합이 촉진되는 것으로 생각된다. 또는, 도너와 표적 사이의 상동성이 증가하면 키메라 ZFP 뉴클레아제에 의해 도너가 절단되게 되고, 절단된 도너는 사슬의 침입빈도를 높여 상동 재조합을 촉진하거나 절단된 도너의 말단부를 DNA의 상동부위로 인식하게 함으로써 상동 재조합을 촉진하는 것일 수 있다. 이 두 가지 가능성은 서로 모순되는 것이 아니다. The results show that the degree of homologous recombination can be increased by reducing the deviation between the target sequence and the donor sequence. Though not limited to any particular theory or mechanism, the greater homology between the donor and the target, the more homologous the recombination system of the cells will recognize the donor molecule as the appropriate template, promoting homologous recombination. Alternatively, when the homology between the donor and the target is increased, the donor is cleaved by the chimeric ZFP nuclease, and the cleaved donor increases the frequency of the chain invasion to promote homologous recombination, To promote homologous recombination. These two possibilities are not contradictory.

실시예 18 : siRNA의 제조Example 18: Preparation of siRNA

비상동성 말단결합(NHEJ)과 관련된 단백질의 세포 내 농도 저하가 표적화된 상동 재조합을 촉진하는지 알아보기 위하여, siRNA 억제를 통해 Ku70 단백질 농도를 낮추는 실험을 실시하였다. Ku70 cDNA를 전사한 후 Dicer 효소로 이중사슬 전사체를 분리하여 Ku70 유전자를 표적으로 하는 siRNA 분자를 생산하였다. In order to investigate whether the intracellular concentration decrease of the NHEJ-related protein promotes targeted homologous recombination, experiments were conducted to lower the Ku70 protein concentration through siRNA inhibition. After the Ku70 cDNA was transcribed, double-stranded transcripts were separated by Dicer enzyme to produce siRNA molecules targeting the Ku70 gene.

293 및 U20S 세포로부터 얻은 cDNA 풀을 이용하여 5가지 증폭반응을 실시하였다. 각 증폭반응에서 Ku70 유전자에 대해 특이성을 가지는 각기 다른 증폭 프라이머를 사용하여 크기가 500~750 bp인 5가지 cDNA 절편 풀(풀 A~E)을 얻었다. 박테리오파지 T7 RNA 폴리머라제 프로모터 인자를 포함하는 프라이머를 이용하여 5개 풀의 각 절편을 다시 증폭하였다. 이 때에도 각 cDNA 풀에 대해 각기 다른 프라이머를 사용하였다. cDNA 생산 및 PCR 반응에는 Superscript Choice cDNA 시스템과 백금 택 고 충실 폴리머라제(Invitrogen, Carlsbad, CA)을 사용하였다.Five different amplification reactions were performed using cDNA pools from 293 and U20S cells. In each amplification reaction, five different cDNA fragment pools (pools A to E) with sizes of 500 to 750 bp were obtained using different amplification primers specific for the Ku70 gene. Each fragment of 5 pools was re-amplified using primers containing the bacteriophage T7 RNA polymerase promoter factor. Again, different primers were used for each cDNA pool. Superscript Choice cDNA system and platinum tagged polymerase (Invitrogen, Carlsbad, Calif.) were used for cDNA production and PCR reactions.

증폭된 각 DNA 풀을 RNAMAXX 생체 외 전사키트(Stratagene, San Diego, CA)를 사용, 박테리오파지 T7 RNA 폴리머라제로 생체 외에서 전사하여 5개의 이중사슬 RNA(dsRNA) 풀(A~E)을 얻었다. 에탄올로 침전시킨 다음, 각 풀의 RNA를 다시 현탁시킨 후 재조합 Dicer 효소(Stratagene, San Diego, CA)를 이용하여 절단하였다. 각 풀의 21-23 bp siRNA 생성물을 Microspin G-25 칼럼(Amershan)과 Microcon YM-100 칼럼(Amicon)을 사용, 2단계 공정을 통해 정화하였다. Lipofectamone 20000을 사용하여 각 siRNA 생성물 풀을 일시적으로 T7 셀라인에 감염시켰다. Each amplified DNA pool was in vitro transcribed with bacteriophage T7 RNA polymerase using the RNAMAXX in vitro transcription kit (Stratagene, San Diego, Calif.) To yield five double-stranded RNA (dsRNA) pools (AE). After ethanol precipitation, the RNA of each pool was resuspended and digested with recombinant Dicer enzyme (Stratagene, San Diego, Calif.). The 21-23 bp siRNA product of each pool was purified through a two-step process using a Microspin G-25 column (Amershan) and a Microcon YM-100 column (Amicon). Each siRNA product pool was transiently infected with T7 cell line using Lipofectamone 20000.

siRNA 풀의 상대적인 Ku70 발현 억제효율을 평가하기 위하여 감염 후 약 3일이 지난 뒤 웨스턴블롯을 실시하였다. RIPA 완충액(Santa Cruz Biotechnology)을 사용하여 세포를 용해, 파열한 뒤, QIAshredder(Qiagen, Valencia, CA)를 통과시켜 균질화하였다. 이후, 용해물을 SDS PAGE 샘플 완충액(β 머캅토에탄올을 환원제로 사용)으로 처리한 후 5분 동안 끓였다. 샘플을 농도경사 4-12%의 NUPAGE 겔로 녹인 후 PVDF 막으로 옮겼다. 블롯 상층부는 anti-Ku70 항체(Santa Cruz sc-5309)에, 하층부는 anti-TF IIB 항체(Santa Cruz sc-225, 대조군)에 노출시켰다. 이후에, 2차 항체(양고추냉이 퍼옥시다제-콘쥬게이트 염소 항-마우스 2차 항체)에 노출시키고 Pierce Chemical Co. 제품을 이용하여 전기적 화학발광(ECL) 검출을 실시하였다. To evaluate the relative inhibition of Ku70 expression of siRNA pools, western blotting was performed about 3 days after infection. Cells were lysed and ruptured using RIPA buffer (Santa Cruz Biotechnology) and homogenized by passage through QIAshredder (Qiagen, Valencia, CA). Thereafter, the lysate was treated with SDS PAGE sample buffer (using β-mercaptoethanol as a reducing agent) and boiled for 5 minutes. The sample was dissolved in NUPAGE gel at a concentration gradient of 4-12% and transferred to a PVDF membrane. The upper part of the blot was exposed to anti-Ku70 antibody (Santa Cruz sc-5309) and the lower part was exposed to anti-TF IIB antibody (Santa Cruz sc-225, control). Subsequently, the secondary antibody (horseradish peroxidase-conjugated goat anti-mouse secondary antibody) was exposed and incubated with Pierce Chemical Co. Electrochemiluminescence (ECL) detection was performed using the product.

도 39는 2개의 siRNA 풀(D, E)을 T7 세포에 감염시킨 결과를 도시한 것이다. siRNA E 70 ng으로 감염시켰을 때 Ku70 단백질의 농도가 크게 감소하였다(도 39, 레인 3). Figure 39 shows the results of infecting T7 cells with two siRNA pools (D, E). When infected with siRNA E 70 ng, the concentration of Ku70 protein was greatly reduced (Fig. 39, lane 3).

실시예 19 : 비상동성 말단결합 관련 단백질의 발현억제를 통한 상동 재조합 빈도의 증가 Example 19: Increase in homologous recombination frequency through inhibition of expression of non-homologous terminal binding-related proteins

게놈 DNA에서 손상된 이중사슬의 수선은 상동 재조합(HR)과 비상동성 말단결합(NHEJ)의 두 가지 방법에 의해 수행된다. Ku70은 NHEJ에 관여하는 단백질로서, 게놈 DNA의 이중사슬 손상으로 인해 생겨나는 DNA 유리말단과 결합한다. NHEJ에 관여하는 단백질의 세포 내 농도가 낮아지면 HR 빈도가 증가하는지를 알아보기 위하여, 실시예 18에서 얻은 siRNA를 이용하여 Ku70 mRNA의 발현을 억제함으로써, 세포 도너 DNA 및 키메라 뉴클레아제를 암호화하는 플라스미드로 감염시킨 세포 내의 Ku70 단백질 농도를 낮추었다. Repair of damaged double chains in genomic DNA is performed by two methods: homologous recombination (HR) and non-homologous terminal junction (NHEJ). Ku70 is a protein involved in NHEJ that binds to the DNA end of the DNA that is generated by the double-stranded damage of genomic DNA. In order to investigate whether the HR frequency increases when the intracellular concentration of the protein involved in NHEJ is lowered, expression of Ku70 mRNA is inhibited by using the siRNA obtained in Example 18, whereby a plasmid encoding a cell donor DNA and a chimeric nuclease To lower the Ku70 protein concentration in the infected cells.

T7 셀라인(실시예 9, 도 27)을 사용하여 실험하였다. 이들 세포는 염색체결합 결함 eGFP 유전자를 포함하고 있으나, 실시예 11~13에서 사용한 T18 셀라인에 비해 표적화된 상동 재조합 정도가 낮은 것으로 확인되었다. T7 cell line (Example 9, Fig. 27). These cells contained a chromosomal binding defect eGFP gene but it was confirmed that the degree of homologous recombination targeted was lower than that of T18 cell line used in Examples 11-13.

실시예 11에서와 같이, 표적화 Ku70을 표적화하는 다이서 생성물의 두 풀 중 하나 70 ng 또는 140 ng으로 T7 세포를 감염시켰다(실시예 18 참조). 세포를 siRNA로 처리하면 Ku70 단백질의 농도가 낮아지는지 확인하기 위하여 감염된 세포에서 얻은 추출물에 대해 단백질 블롯분석을 실시하였다(실시예 18 참조). 도 39에서 보듯이, 풀 E의 siRNA 70 ng으로 처리한 세포의 Ku70 단백질 농도가 감소하였다. As in Example 11, T7 cells were infected with 70 ng or 140 ng of either of the two pools of the dicer product targeting the targeted Ku70 (see Example 18). When the cells were treated with siRNA, protein blot analysis was performed on the extracts obtained from the infected cells (see Example 18) to confirm that the concentration of Ku70 protein was lowered. As shown in Fig. 39, the Ku70 protein concentration of the cells treated with 70 ng of the pool E siRNA was decreased.

Ku70 농도를 낮추면 상동 재조합 빈도가 높아지는지 확인하기 위하여 세포 샘플을 siRNA(풀 D 또는 풀 E) 70 또는 140 ng, 287 FokI 및 296 FokI 발현 구조체(실시예 7, 표 12) 각 50 ng, 그리고 1.5 kbp GFP 도너(실시예 13) 500 ng으로 감염시켰다. 실험조건은 표 24와 같이 하였다. 실시예 11에서와 같이 FACS 분석을 통해 상동 재조합에 의한 eGFP 활성의 회복정도를 평가하였다. Cell samples were seeded with 50 ng each of 70 or 140 ng of the siRNA (full D or full E), 287 FokI and 296 FokI expression constructs (Example 7, Table 12), and 1.5 ng of the 1.5 kbp GFP donor (Example 13). The experimental conditions were as shown in Table 24. The degree of recovery of eGFP activity by homologous recombination was evaluated by FACS analysis as in Example 11.

실시예Example 도너donor ll ZFNsZFNs 22 SiRNASiRNA 33 편집비율Edit ratio 44 1One 500 ng500 ng -- -- 0.050.05 22 -- 각 50 ngEach 50 ng -- 0.010.01 33 500 ng500 ng 각 50 ngEach 50 ng -- 0.790.79 44 500 ng500 ng 각 50 ngEach 50 ng 풀 D 70 ngPool D 70 ng 0.680.68 55 500 ng500 ng 각 50 ngEach 50 ng 풀 D 140 ngPool D 140 ng 0.590.59 66 500 ng500 ng 각 50 ngEach 50 ng 풀 E 70 ngPool E 70 ng 1.251.25 77 500 ng500 ng 각 50 ngEach 50 ng 풀 E 140 ngPool E 140 ng 0.920.92 1. 염색체결합 결함 eGFP 유전자와 상동성이 있는 기능성 eGFP 단백질을 암호화하는
1.5 kbp 서열을 포함하는 플라스미드.
2. eGFP 특이성 287 및 296 징크핑거 단백질/FokI 융합 엔도뉴클레아제를 암호화하는
플라스미드.
3. 실시예 18 참조.
4. 525 nm 고발광 및 570 nm 저발광을 포함한 총형광 비율(FACS 트레이스의 영역 E,
실시예 11 참조).
1. Encoding a functional eGFP protein homologous to a chromosomal binding defect eGFP gene
Plasmids containing the 1.5 kbp sequence.
2. Encoding eGFP specificity 287 and 296 zinc finger proteins / FokI fusion endonuclease
Plasmid.
3. See Example 18.
4. Total fluorescence ratio, including 525 nm high emission and 570 nm low emission (area E of the FACS trace,
See Example 11).

표 24의 오른쪽에는 감염된 T7 세포의 결함 eGFP 유전자 편집비율(표적화된 상동 재조합의 빈도를 암시)이 표시되어 있다. 도너 DNA, 2개의 eGFP 특이성 융합 뉴클레아제를 암호화하는 플라스미드 및 풀 E의 siRNA 70 ng으로 세포를 감염시킨 실시예 6에서 표적화된 재조합 빈도가 가장 높았다. 실시예 18과 도 39를 참조하면, 풀 E siRNA 70 ng에 의해 Ku70 단백질의 농도가 상당히 억제된 것을 알 수 있다. 따라서, NHEJ에 관여하는 단백질의 세포 내 농도를 낮춤으로써 상동 재조합을 촉진할 수 있다. On the right side of Table 24, the defective eGFP gene editing rate of the infected T7 cells (indicating the frequency of targeted homologous recombination) is shown. The recombination frequency targeted in Example 6, which infected cells with donor DNA, a plasmid encoding two eGFP specific fusion nucleases and 70 ng of pull E siRNA, was the highest. Referring to Example 18 and Figure 39, it can be seen that the concentration of Ku70 protein was significantly inhibited by 70 ng of pooled E siRNA. Therefore, homologous recombination can be promoted by lowering intracellular concentrations of proteins involved in NHEJ.

실시예 20 : 인간 ß-글로빈 유전자를 표적으로 하는 징크핑거 FokI 융합 뉴클레아제 Example 20: Synthesis of zinc finger FokI fusion nuclease targeting human ß-globin gene

인간 ß-글로빈 유전자를 표적으로 하는 다수의 4 핑거 징크핑거 DNA 결합도메인을 설계하였으며, FokI 절단 하프도메인과 결합하여 각 징크핑거 도메인을 암호화하는 플라스미드를 생산하였다. 각 징크핑거 도메인은 4개의 징크핑거를 가지고 있었으며, 겸상적혈구빈혈증을 일으키는 돌연변이를 암호화하는 인간 ß-글로빈 유전자 영역의 12 bp 표적부위를 인식하였다. 이들 각 단백질의 표적서열에 대한 결합친화력을 평가하여 친화력이 큰 4개의 단백질(sca-r29b, sca-36a, sca-36b, 및 sca-36c)을 이용, FokI 융합 엔도뉴클레아제를 생산하였다. A large number of four finger finger finger DNA binding domains targeting the human ß-globin gene were designed and produced plasmids encoding each zinc finger domain by binding to the Fok I cleavage half domain. Each zinc finger domain had four zinc fingers and recognized a 12 bp target site in the human ß-globin gene region that encodes a mutation that causes sickle cell anemia. The binding affinity of each of these proteins to the target sequence was evaluated and FokI fusion endonuclease was produced using four proteins having high affinity (sca-r29b, sca-36a, sca-36b, and sca-36c).

ZFP DNA 결합도메인의 표적부위 및 인간 ß-글로빈 유전자의 서열은 아래와 같다. 번역 개시 코돈(ATG)은 볼드체와 밑줄로 표시하였다. A-T 치환에 의해 겸상적혈구빈혈증이 발병한다.The sequence of the target site of the ZFP DNA binding domain and the human 棺-globin gene is as follows. Translation initiation codon (ATG) is indicated by bold and underlined. A-T substitution causes sickle cell anemia.

sca-36a GAAGTCTGCCGT (SEQ ID NO : 178)sca-36a GAAGTCTGCCGT (SEQ ID NO: 178)

sca-36b GAAGTCtGCCGTT (SEQ ID NO : 179)sca-36b GAAGTCtGCCGTT (SEQ ID NO: 179)

sca-36c GAAGTCtGCCGTT (SEQ ID NO : 180)sca-36c GAAGTCtGCCGTT (SEQ ID NO: 180)

CAAACAGACACC ATGGTGCATCTGACTCCTG TGGAGAAGTCTGCCGTTACTGGTTTGTCTGTGGTACCACGTAGACTGAGGAC ACCTCTTCAGACGGCAATGAC (SEQ ID NO : 181) CAAACAGACACC ATG GTGCATCTGACTCCTG T GGAGAAGTCTGCCGTTACTGGTTTGTCTGTGGTACCACGTAGACTGAGGAC A CCTCTTCAGACGGCAATGAC ( SEQ ID NO: 181)

sca-r29b ACGTAGaCTGAGG (SEQ ID NO : 182) sca-r29b ACGTAGaCTGAGG (SEQ ID NO: 182)

각 단백질의 징크핑거 인지영역의 아미노산 서열을 표 25에 제시하였다. 이들 징크핑거 도메인의 전체 아미노산 서열은 도 40에 도시하였다. sca-36a 도메인은 12개의 인접 뉴클레오티드(위에서 대문자로 표시)를 가지는 표적부위를 인지하고, 나머지 세 도메인은 2개의 6 뉴클레오티드 표적부위(대문자로 표시)와 하나의 뉴클레오티드(소문자로 표시)로 구성되는 13개의 뉴클레오티드 서열을 인지한다. 따라서, sca-r29b, sca-36b 및 sca-36c 도메인은 두 번째 및 세 번째 핑거 사이에 아미노산 서열 TGGGGSQKP (SEQ ID NO : 183)을 가지는 비정규적인 핑거간 링커를 포함한다. The amino acid sequences of the zinc finger recognition regions of each protein are shown in Table 25. The entire amino acid sequence of these zinc finger domains is shown in Fig. The sca-36a domain recognizes a target site with 12 contiguous nucleotides (shown in upper case) and the remaining three domains consist of two 6-nucleotide target sites (shown in upper case) and one nucleotide (in lower case) We recognize 13 nucleotide sequences. Thus, the sca-r29b, sca-36b and sca-36c domains contain an irregular finger-finger linker with the amino acid sequence TGGGGSQKP (SEQ ID NO: 183) between the second and third finger.

ZFP ZFP F1F1 F2F2 F3F3 F4F4 sca-r29bsca-r29b QSGDLTR
(SEQ : 184)
QSGDLTR
(SEQ: 184)
TSANLSR
(SEQ : 185)
TSANLSR
(SEQ: 185)
DRSALSR
(SEQ : 186)
DRSALSR
(SEQ: 186)
QSGHLSR
(SEQ : 187)
QSGHLSR
(SEQ: 187)
sca-36asca-36a RSQTRKT
(SEQ : 188)
RSQTRKT
(SEQ: 188)
QKRNRTK
(SEQ : 189)
QKRNRTK
(SEQ: 189)
DRSALSR
(SEQ : 190)
DRSALSR
(SEQ: 190)
QSGNLAR
(SEQ : 191)
QSGNLAR
(SEQ: 191)
sca-36bsca-36b TSGSLSR
(SEQ : 192)
TSGSLSR
(SEQ: 192)
DRSDLSR
(SEQ : 193)
DRSDLSR
(SEQ: 193)
DRSALSR
(SEQ : 194)
DRSALSR
(SEQ: 194)
QSGNLAR
(SEQ : 195)
QSGNLAR
(SEQ: 195)
sca-36csca-36c TSSSLSR
(SEQ : 196)
TSSSLSR
(SEQ: 196)
DRSDLSR
(SEQ ID : 197)
DRSDLSR
(SEQ ID: 197)
DRSALSR
(SEQ : 198)
DRSALSR
(SEQ: 198)
QSGNLAR
(SEQ : 199)
QSGNLAR
(SEQ: 199)

실시예 21 : β 글로빈 특이성 ZFPIFokI 융합 엔도뉴클레아제를 이용한 DNA 표적 서열의 생체 외 절단 Example 21: In vitro cleavage of DNA target sequence using beta globin specificity ZFPIFokI fusion endonuclease

FokI 절단 하프도메인과 실시예 20의 네 ZFP DNA 결합도메인 중 하나를 포함하는 융합단백질에 대하여 생체 외에서 특정 서열의 DNA 절단능력을 테스트하였다. KpnI 및 BamHI 부위를 통해 이들 ZFP 도메인을 pcDNA3.1 발현벡터로 복제한 후 4 아미노산 ZC 링커를 이용하여 FokI 절단도메인과 융합시켰다. 인간 β-글로빈 유전자 700 bp를 포함하는 DNA 절편을 K562 세포에서 얻은 게놈 DNA로부터 복제하였다. 절편의 분리 및 서열은 실시예 3에서 설명한 것과 동일하다. The DNA cleavage ability of a specific sequence in vitro was tested for a fusion protein comprising the FokI truncation half domain and one of the four ZFP DNA binding domains of Example 20. These ZFP domains were cloned through the KpnI and BamHI sites into the pcDNA3.1 expression vector and then fused with the FokI cleavage domain using a 4 amino acid ZC linker. A DNA fragment containing 700 bp of the human β-globin gene was cloned from genomic DNA obtained from K562 cells. The cleavage and the sequence are the same as those described in Example 3.

생체 외 검정용 융합 엔도뉴클레아제(ZFNs)를 생산하기 위하여, sca-r29b, sca-36a, sca-36b 및 sca-36c 단백질과의 FokI 융합을 암호화하는 원형 플라스미드를 생체 외 전사/번역 시스템에서 배양하였다(실시예 4 참조). 총 2 ul의 TNT 반응액(하나의 단백질을 검정하는 경우 2 ul 사용, 두 개의 단백질을 검정하는 경우 각각 1 ul씩 사용)을 절단 완충혼합액 13 ul 및 표지자 3 ul(~1 ng/ul)에 가하였다. 폴리뉴클레오티드 키나아제를 사용하여 표지자의 끝부분을 32p로 표지하였다. 반응액을 실온에서 1시간 동안 방치하여 ZFNs가 결합되도록 하였다. 최종농도가 약 2.5 mM이 되도록 절단 완충액으로 희석한 8 mM MgCl2 8 ul를 가하여 절단을 유도하였다. 37°C에서 1시간 동안 반응 후, 페놀/클로로포름 혼합용액 11 ul을 가하여 반응을 중지시켰다. 페놀/클로로포름 혼합용액으로 DNA를 추출한 후 실시예 4에서와 같이 겔 전기영동으로 분석하였다. 3 ul의 표지자를 대조군으로 사용하여 절단되지 않은 DNA(도 41에 "U"로 표시)의 겔 상 이동을 분석하였다. A circular plasmid encoding FokI fusion with the sca-r29b, sca-36a, sca-36b and sca-36c proteins was produced in an in vitro transcription / translation system to produce fusion endonuclease (ZFNs) (See Example 4). A total of 2 μl of the TNT reaction solution (2 μl for one protein assay and 1 μl for two proteins, respectively) are mixed with 13 μl of cleavage buffer solution and 3 μl (~ 1 ng / μl) of the marker . The ends of the markers were labeled with 32p using polynucleotide kinase. The reaction solution was allowed to stand at room temperature for 1 hour to allow ZFNs to bind. Cleavage was induced by adding 8 μl of 8 mM MgCl 2 diluted with cleavage buffer to a final concentration of about 2.5 mM. After reaction at 37 ° C for 1 hour, 11 μl of phenol / chloroform mixed solution was added to stop the reaction. The DNA was extracted with a phenol / chloroform mixed solution and analyzed by gel electrophoresis as in Example 4. [ 3 ul of the marker was used as a control to analyze the gel migration of uncut DNA (labeled "U" in FIG. 41).

결과를 도 41에 도시하였다. 표적 DNA를 하나의 징크핑거/FokI으로 융합한 경우에는 주형 DNA의 크기에 변화가 없었다. 그러나, sca-r29b 뉴클레아제를 sca-36b 또는 sca- 36c 뉴클레아제와 함께 사용한 경우, 짧은 DNA 절편 2개가 관찰되었는데(도 41의 오른쪽 레인 2개) 이로부터 표적 DNA가 절단되었다는 것을 알 수 있다.The results are shown in Fig. When the target DNA was fused to one zinc finger / FokI, there was no change in the size of the template DNA. However, when sca-r29b nuclease was used with sca-36b or sca- 36c nuclease, two short DNA fragments were observed (two right lanes in Figure 41), indicating that the target DNA was cleaved have.

실시예 22 : β 글로빈 유전자를 표적으로 하는 ZFP/FokI 융합 엔도뉴클레아제에 대한 염색체 GFP 리포터 시스템 테스트 Example 22: Chromosomal GFP reporter system test for ZFP / FokI fusion endonuclease targeted against beta globin gene

실시예 20에서 설명한 바 있는, ZFNs에 의해 표적화되는 인간 β-글로빈 유전자 서열을 포함하는 DNA 절편을 합성하여 eGFP 리포터 유전자의 SpeI 부위 내로 복제함으로써 eGFP 발현을 억제하였다. 절편은 아래의 서열을 포함하고 있었다(겸상적혈구 돌연변이의 원인이 되는 뉴클레오티드는 볼드체 및 밑줄로 표시하였다).A DNA fragment containing the human β-globin gene sequence targeted by ZFNs as described in Example 20 was synthesized and replicated into the SpeI site of the eGFP reporter gene to inhibit eGFP expression. The sections contained the following sequences (the nucleotides responsible for sickle cell mutation were indicated by bold and underlined).

CTAGACACCATGGTGCATCTGACTCCTG TGGAGAAGTCTGCCGTTACTGCCCTAG (SEQ ID NO : 200)CTAGACACCATGGTGCATCTGACTCCTG T GGAGAAGTCTGCCGTTACTGCCCTAG (SEQ ID NO: 200)

삽입된 β-글로빈 서열을 포함하는 eGFP 유전자를 HindlII 및 NotI 부위를 이용하여 pcDNA4/TO(Invitrogen, Carlsbad, CA) 내로 복제하고, 그로부터 얻어지는 벡터를 HEK293 TRex 세포(Invitrogen)에 감염시켰다. 안정적인 개별 클론을 분리하여 성장시킨 후, sca-36 단백질(sca-36a, sca- 36b, sca-36c) 및 sca-29b으로 감염시켜 표적화된 상동 재조합 여부를 테스트하였다(이들 키메라 뉴클레아제의 서열과 결합부위는 실시예 20 및 표 25 참조). 각 ZFNs를 암호화하는 플라스미드 50 ng과 1.5-kb GFP 도너 500 ng으로 세포를 감염시켰다(실시예 13). 5일 후에, 삽입된 결합 eGFP 자리의 상동 재조합 여부를 테스트하였다. 먼저, 형광현미경을 이용하여 세포의 eGFP 기능을 조사한 후, 형광을 나타내는 세포에 대하여 실시예 11에서와 같은 방법으로 FACS 검정을 이용한 정량분석을 실시하였다. The eGFP gene containing the inserted beta-globin sequence was cloned into pcDNA4 / TO (Invitrogen, Carlsbad, Calif.) Using the HindIII and NotI sites and the resulting vector was infected with HEK293 TRex cells (Invitrogen). Stable individual clones were isolated and grown and then tested for homologous recombination targeted by infection with sca-36 proteins (sca-36a, sca-36b, sca-36c) and sca-29b (the sequence of these chimeric nuclease And binding sites for Example 20 and Table 25). The cells were infected with 50 ng of plasmid encoding each ZFNs and 500 ng of a 1.5-kb GFP donor (Example 13). After 5 days, the inserted recombinant eGFP sites were tested for homologous recombination. First, the eGFP function of the cells was examined using a fluorescence microscope, and the cells showing fluorescence were quantitatively analyzed by the FACS test in the same manner as in Example 11.

형광현미경 분석 결과, sca-29b 및 sca-36a에 감염된 모든 셀라인의 eGFP 기능이 음성으로 나타났다. sca-29b와 sca-36b 또는 sca-36c에 감염된 셀라인 중 일부는eGFP 발현에 대해 양성을 나타내었으므로, 추가적으로 FACS 분석을 실시하였다. 이들 셀라인에 대한 FACS 분석결과가 표 26에 제시되어 있다. β-글로빈 서열에 대해 선택성을 보이는 징크핑거 뉴클레아제는 서열-특이성 이중사슬 DNA 절단을 촉진함으로써 살아 있는 세포 내에서 상동 재조합을 촉진하는 능력이 있다는 것을 알 수 있다. Fluorescence microscopy analysis showed that all of the cell lines infected with sca-29b and sca-36a had negative eGFP function. Since some of the cell lines infected with sca-29b and sca-36b or sca-36c were positive for eGFP expression, additional FACS analysis was performed. The FACS analysis results for these cells are shown in Table 26. It can be seen that zinc finger nuclease, which exhibits selectivity for the? -globin sequence, is capable of promoting homologous recombination in living cells by promoting sequence-specific double-stranded DNA cleavage.

셀라인Selin 감염 DNA Infected DNA
sca-29b sca-36a sca-36b sca-36c   sca-29b sca-36a sca-36b sca-36c 편집비율Edit ratio 1 One
#20

# 20
++ ++ 00 ++ ++ 0.080.08 ++ ++ 0.070.07
#40

# 40
++ ++ 00 ++ ++ 0.180.18 ++ ++ 0.120.12 1. 525 nm 고발광 및 570 nm 저발광을 포함하는 총 형광발광의 비율(FACS 트레이스의 영역 E, 실시예 11 참조). 1. Ratio of total fluorescence emission including 525 nm high emission and 570 nm low emission (Region E of FACS trace, see Example 11).

실시예 23 : 전사 정도가 표적화된 상동 재조합에 미치는 영향Example 23: Effect of degree of transcription on targeted homologous recombination

염색체 DNA 서열이 전사되는 과정에서 염색질의 구조변경이 수반되므로(일반적으로 전사된 서열은 접근이 용이해진다), 전사가 활발한 유전자는 표적화된 상동 재조합의 기질로서 유용할 것으로 생각할 수 있다. 독시시클린 유도성 프로모터로 전사를 통제하면서, 결함 eGFP 유전자의 염색체 서열을 포함하는 T18 셀라인(실시예 9)를 이용하여 이를 테스트하였다. Since transcription of the chromosomal DNA sequence involves structural modification of the chromatin (generally, the transcribed sequence is accessible), transcriptionally active genes may be considered useful as substrates for targeted homologous recombination. This was tested using a T18 cell line containing the chromosomal sequence of the defective eGFP gene (Example 9), while controlling transcription with a toxicin inducible promoter.

각 T18 세포 샘플을 eGFP 특이성 287 및 296 징크핑거/FokI 융합단백질을 암호화하는 플라스미드(실시예 7) 및 염색체 eGFP 유전자의 결함을 편집하는 서열을 포함하는 1.5 kbp 도너 DNA 분자로 감염시켰다(실시예 9). 5시간 후, 감염된 세포를 여러 농도의 독시시클린으로 처리하고 48시간 후에 eGFP mRNA의 농도를 측정하였다. 감염 후 4일이 지난 뒤에 FACS로 520 nm에서의 eGFP 형광(염색체 내로 도너서열이 표적화된 재조합이 되어 삽입된 β-글로빈 서열을 대체한 것을 보여줌)을 측정하였다. Each T18 cell sample was infected with a 1.5 kbp donor DNA molecule containing a plasmid encoding the eGFP specificity 287 and 296 zinc finger / FokI fusion protein (Example 7) and a sequence editing the defect of the chromosomal eGFP gene (Example 9 ). After 5 hours, the infected cells were treated with various concentrations of doxycycline and the concentration of eGFP mRNA was measured after 48 hours. Four days after infection, eGFP fluorescence at 520 nm (showing donor sequence-targeted recombination into the chromosome, replacing the inserted beta-globin sequence) was measured by FACS.

결과를 도 42에 도시하였다. GAPDH mRNA에 대해 정규화한 eGFP mRNA의 정상상태 농도(결함 염색체 eGFP 유전자의 전사율)가 증가한 것을 알 수 있다. 각 막대 위의 수치는 eGFP 형광을 나타내는 세포의 비율이다. 표적 유전자의 전사율이 증가함에 따라 표적화된 재조합의 빈도가 높아지는 것을 알 수 있다. 따라서, 표적화된 DNA 절단과 더불어 전사의 표적화된 활성화(미국특허 제6,534,261호 및 제6,607,882호 참조)를 통해 표적화된 상동 재조합을 촉진할 수 있음을 알 수 있다. The results are shown in Fig. It can be seen that the steady state concentration of eGFP mRNA normalized to GAPDH mRNA (transcription rate of defective chromosome eGFP gene) is increased. The values on each bar are the percentage of cells that exhibit eGFP fluorescence. As the transcription rate of the target gene increases, the frequency of the targeted recombination increases. Thus, it can be seen that, along with targeted DNA cleavage, promoted homologous recombination targeted through targeted activation of transcription (see U.S. Patent Nos. 6,534,261 and 6,607,882).

실시예 24 : IL- 2Rγ 유전자 내에 돌연변이를 포함하는 셀라인의 생산Example 24: Production of a cell line containing a mutation in the IL-2R? Gene

K562 세포를 5-8GL0 및 5- 9DL0 징크핑거 뉴클레아제(ZFNs)를 암호화하는 플라스미드(실시예 14, 표 17 참조) 및 1.5 kbp DraI 도너 구조체로 감염시켰다. DraI 도너는 IL2Rγ 유전자의 5번째 엑손을 암호화하는 영역과 상동성이 있는 서열을 포함하지만, ZFN 결합부위 사이에 염기가 하나 더 삽입되어 있어 프레임시프트 및 DraI 부위를 제공한다. K562 cells were infected with a plasmid encoding 5-8 GLO and 5-9 DL0 zinc finger nuclease (ZFNs) (see Example 14, Table 17) and a 1.5 kbp DraI donor construct. The DraI donor contains a sequence that is homologous to the region encoding the 5th exon of the IL2R gamma gene, but with one additional base inserted between the ZFN binding sites to provide frame shift and DraI sites.

24시간이 지난 후, 세포를 30시간 동안 0.2 uM 빈블라스틴(최종농도)으로 처리하였다. PBS로 세포를 3회 세척한 후 배지에 다시 고정시켰다. 세포가 회복되도록 3일 동안 방치한 뒤, 실시예 14에서와 유사한 방법으로 PCR 기반 RFLP 검정을 실시하여 DraI 부위의 존재여부를 확인하였다. 유전자 편집빈도는 약 4%였다. After 24 hours, the cells were treated with 0.2 uM vinblastine (final concentration) for 30 hours. The cells were washed three times with PBS and fixed again in the medium. After allowing the cells to recover for 3 days, a PCR-based RFLP assay was performed in a manner similar to that in Example 14 to confirm the presence of the Dra I site. Genetic editing frequency was about 4%.

세포가 회복되도록 2일 동안 더 방치한 뒤, 1600개의 세포를 100 ul 배지 내의 40×96 웰 플레이트에 고정하였다.After two more days to allow the cells to recover, 1600 cells were fixed in 40 x 96 well plates in 100 ul medium.

세포를 약 3주간 배양한 후, DraI 돌연변이 표현형에 대해 동형접합 관계에 있는 세포를 고립시켰다. 이들 세포에 대해 유전자변형 여부(IL-2Rγ 유전자의 엑손 5에 DraI 부위가 존재하는지 확인)와 IL-2Rγ mRNA 농도(실시간 PCR) 및 단백질 농도(웨스턴블롯)를 테스트하여 돌연변이가 유전자 발현에 미치는 영향을 평가하였다. FACS 분석을 통해 세포기능을 테스트하였다. Cells were incubated for approximately 3 weeks and cells homozygous for the DraI mutant phenotype were isolated. These cells were tested for genetic modification (presence of DraI site in exon 5 of IL-2Rγ gene) and IL-2Rγ mRNA concentration (real time PCR) and protein concentration (Western blot) to determine the effect of mutation on gene expression . Cell function was tested by FACS analysis.

IL-2Rγ 유전자 내에 DraI 프레임시프트 돌연변이를 포함하는 세포를 5-8GL0 및 5-9DL0 융합단백질을 암호화하는 플라스미드 및 1.5 kb BsrBI 도너 구조체로 감염시켜(실시예 14) DraI 프레임시프트 돌연변이를 기능성 단백질을 암호화하는 서열로 교체하였다. 실시예 14에서와 같이 BsrBI 존재여부 확인을 통해 측정한 결과, 이들 세포는 상동 재조합 정도가 1% 이상이었다. FACS 분석을 통해 mRNA 및 단백질 농도를 측정한 결과 유전자 기능이 회복되었음을 확인할 수 있었다.
Cells containing the Dra I frame shift mutation in the IL-2R gamma gene were infected with a plasmid encoding a 5-8GL0 and 5-9DL0 fusion protein and a 1.5 kb BsrBI donor construct (Example 14), resulting in a DraI frame shift mutation encoding the functional protein . As shown in Example 14, the presence of BsrBI was confirmed, and the degree of homologous recombination of these cells was 1% or more. The mRNA and protein concentrations were measured by FACS analysis and the gene function was restored.

실시예Example 25: 상이한 극성을 지닌  25: with different polarity ZFPZFP // FokFok II 융합체Fusant 엔도뉴클레아제Endonuclease

ZFP 도메인이 FokI 도메인의 N-말단인 ZFP/FokI 융합체를 암호화하는 벡터를 제조하였다. IL2-1로 표시된 상기 ZFP 도메인은 4개의 징크핑거를 함유하며, IL-2Rγ 유전자의 제3의 엑손에 위치한 서열 AACTCGGATAAT(SEQ TD NO:202)를 표적화한다. 징크핑거의 인식영역의 아미노산 서열을 표 27에 나타내었다.A vector encoding ZFP / Fok I fusions wherein the ZFP domain is the N-terminus of the Fok I domain was prepared. The ZFP domain, designated IL2-1, contains four zinc fingers and targets the sequence AACTCGGATAAT (SEQ ID NO: 202) located in the third exon of the IL-2Ry gene. The amino acid sequences of the recognition regions of zinc finger are shown in Table 27.

IL2-1 결합 도메인의 징크핑거 설계 Design of zinc finger of IL2-1 binding domain 표적 서열Target sequence F1(AAT)F1 (AAT) F2(GAT)F2 (GAT) F3(TCG)F3 (TCG) F4(AAC)F4 (AAC)
AACTCGGATAAT
(SIQ ID NO:203)

AACTCGGATAAT
(SIQ ID NO: 203)

DRSTLIE
(SIQ ID NO:204)

DRSTLIE
(SIQ ID NO: 204)

SSSNSLR
(SIQ ID NO:205)

SSSNSLR
(SIQ ID NO: 205)

RSDDLSK
(SIQ ID NO:206)

RSDDLSK
(SIQ ID No: 206)

DNSNRIK
(SIQ ID NO:207)

DNSNRIK
(SIQ ID NO: 207)
참고: DNA 표적 서열을 좌단 칼럼에 나타내었다. 나머지 칼럼은 각 징크핑거의 알파 나선 부분의 시작에 관한, 4개의 징크핑거 각각의 -1 에서 +6까지의 잔기의 아미노산 서열(한 문자 코드)을 나타낸다. 핑거 F1은 단백질의 아미노 말단부에 가장 근접해 있다. 각 핑거에 결합된 3-뉴클레오티드 하부부위를 핑거 지정과 인접한 상부 열에 나타내었다.Note: The DNA target sequence is shown in the left column. The remaining columns represent the amino acid sequence (one-letter code) of residues from -1 to +6 of each of the four zinc fingers, with respect to the beginning of the alpha helical portion of each zinc finger. Finger F1 is closest to the amino end of the protein. The 3-nucleotide lower region bound to each finger is shown in the upper row adjacent to the finger designation.

이 징크핑거 도메인을 암호화하는 서열은 FokI 제한 엔도뉴클레아제의 절단 하프-도메인을 암호화하는 서열과 결합(Looney et al. (1989) Gene 80:193-208에 의한 아미노산 384-579)하고, 4개의 아미노산 링커가 ZFP 도메인과 절단 하프-도메인(즉, 4개의 아미노산 ZC 링커)의 사이에 존재하게 된다. FokI 절단 하프-도메인은 하기의 프라이머를 사용하여 박테리아 균주 플라노미크로비움 오케아노코이테스 (Planomicrobium okeanokoites (ATCC 33414))로부터 분리된 게놈 DNA의 PCR 증폭을 통하여 획득하였다:The sequence encoding this zinc finger domain binds to a sequence encoding the cleavage half-domain of the Fok I restriction endonuclease (amino acids 384-579 by Looney et al . (1989) Gene 80: 193-208) Four amino acid linkers are present between the ZFP domain and the cleavage half-domain (i.e., the four amino acid ZC linkers). The Fok I cleavage half-domain was obtained by PCR amplification of genomic DNA isolated from the bacterial strain Planomicrobium okeanokoites (ATCC 33414) using the following primers:

5'-GGATCCCAACTAGTCAAAAGTGAAC(SEQ ID NO:208) 5'- GGATCC CAACTAGTCAAAAGTGAAC (SEQ ID NO: 208)

5'-CTCGAGTTAAAAGTTTATCTCGCCG(SEQ ID NO:209). 5'- CTCGAG TTAAAAGTTTATCTCGCCG (SEQ ID NO: 209).

PCR 산물은 BamHI 및 XhoI로 절단(상기 서열상의 밑줄친 부위)되었으며, BamHI 및 XhoI에 의한 절단 후 플라스미드 pcDNA-nls-ZFP1656-VP16-flag로부터 제조된 벡터 단편에 결찰되었다. 결과 구성체, pcDNA-nls-ZFP1656-FokI는 pcDNA3.1 (Invitrogen, Carlsbad, CA) 벡터 백본 내에서, N-말단에서 C-말단까지, SV40 거대 T 항원-유도 핵위치 신호(NLS, Kalderon et al.(1984) Cell 39:499-509), ZFP1656, 및 FokI 절단 하프-도메인을 함유하는 융합 단백질을 암호화한다. 이 구성체는 KpnI 및 BamHI로 절단되어 ZFP1656-암호화 서열을 방출하며, IL2-1 징크핑거 결합 도메인을 암호화하는 KpnI/BamHI 단편이 결찰에 의하여 삽입되었다. 결과 구성체 (pIL2-1C)는 4개의 아미노산 ZC 링커를 지닌, N- 에서 C-말단까지, 핵 위치 신호, 4-핑거 IL2-1 징크핑거 결합 도메인 및 FokI 절단 하프-도메인을 포함하는 융합 단백질을 암호화한다.The PCR product was digested with Bam HI and Xho I (underlined in the sequence) and ligated into a vector fragment prepared from the plasmid pcDNA-nls-ZFP1656-VP16-flag after cleavage with Bam HI and Xho I. Resulting construct, pcDNA-nls-ZFP1656-FokI is pcDNA3.1 (Invitrogen, Carlsbad, CA) vector within the backbone, to the C- terminus in the N- terminal, SV40 large T antigen-induced nuclear location signal (NLS, Kalderon et al (1984) Cell 39: 499-509), ZFP1656, and Fok I cleavage half-domain. This construct is digested with Kpn I and Bam HI to release the coding sequence and ZFP1656-, zinc IL2-1 the Kpn I / Bam HI fragment encoding the finger binding domain was inserted by ligation. The resulting construct (pIL2-1C) contains a fusion protein comprising a nuclear locus signal, a 4-finger IL2-1 zinc finger binding domain and a Fok I cleavage half-domain, with N- amino acid to C-terminus, with four amino acid ZC linkers .

FokI 서열이 ZFP 서열의 N-말단인, ZFP/FokI 융합 단백질을 암호화하는 벡터를 또한 제조하였다. KpnI/BamHI 단편으로서, 상기 IL2-1 4-핑거 징크핑거 도메인을 KpnI 및 BamHI로 이미 절단되어 EGFP-암호화 서열을 방출하는, NLS, KOX-1 억제 도메인, EGFP 및 플래그 에피토프 태그를 함유한 융합 단백질을 암호화하는 벡터에 삽입하였다. 이로써 N-말단에서 C-말단까지, (SV40 거대 T-항원의)NLS, KOX 억제 도메인, IL2-1 징크핑거 도메인 및 플래그 에피토프 태그를 함유한 벡터를 생성하였다. 이 구성체는 EcoRI 및 KpnI로 절단되어 NLS- 및 KOX-암호화 서열을 방출하고, FokI 제한 효소의 아미노산 384-579를 암호화하는, (주형으로, FokI를 암호화하는 벡터를 사용한 PCR로 생성된) EcoRI/KpnI 단편 및 NLS가 삽입되었다. 상기 결과 구성체, pIL2-IR은, N-말단에서 C-말단까지, FokI 절단 하프-도메인, NLS, 및 4-핑거 IL2-1 ZFP 결합 도메인을 함유한 융합 단백질을 암호화한다. 이 구성체 내의 ZC 링커는 21개 아미노산의 길이이며, 7개 아미노산의 핵 위치 서열(PKKKRKV; SEQ ID NO:210)를 포함한다.A vector encoding a ZFP / Fok I fusion protein wherein the Fok I sequence is the N-terminus of the ZFP sequence was also prepared. As a Kpn I / Bam HI fragment, the IL2-1 4- finger zinc finger domain has already been cut by Kpn I and Bam HI to release the EGFP- coding sequence, NLS, KOX-1 repression domain, and a Flag epitope tag EGFP And inserted into a vector encoding the fusion protein contained therein. This resulted in a vector containing the NLS, the KOX suppression domain, the IL2-1 zinc finger domain and the flag epitope tag (of the SV40 giant T-antigen) from the N-terminus to the C-terminus. This construct is digested with Eco RI and Kpn I to release a NLS- KOX- and the coding sequence, and encoding the amino acids 384-579 of the Fok I restriction enzyme, (generated by PCR using the vector coding for, Fok I as a template, ) Eco RI / Kpn I fragment and NLS were inserted. The resulting construct, pIL2-IR, encodes a fusion protein containing the Fok I cleavage half-domain, the NLS, and the 4-finger IL2-1 ZFP binding domain, from the N-terminus to the C-terminus. The ZC linker in this construct is 21 amino acids in length and contains the nucleotide sequence of seven amino acids (PKKKRKV; SEQ ID NO: 210).

5-9D 징크핑거 도메인은 IL-2Rγ 유전자의 5번째 엑손에 위치한 12-뉴클레오티드 표적 서열 AAAGCGGCTCCG(SEQ ID NO:157)과 결합한다. 실시예 14(표 17)을 참조한다. 5-9D 징크핑거 도메인을 암호화하는 서열을 벡터 내로 삽입하여 FokI 서열이 ZFP 서열의 N-말단인 FokI/ZFP 융합체를 생성시켰다. 이러한 구성체를 제조하기 위하여, 이전 문단에서 기술한 pIL2-lR 플라스미드를 KpnI 및 BamHI로 절단하여 IL2-1 징크핑거 결합 도메인을 암호화하는 서열을 함유한 단편을 방출시키고, 5-9D 징크핑거 결합 도메인을 암호화하는 KpnI/BamHI 단편을 그 자리에 삽입하였다. 결과 구성체, p5-9DR은, N-말단에서 C-말단까지, FokI 절단 하프-도메인, NLS, 및 4-핑거 5-9D 징크핑거 결합 도메인을 함유한 융합 단백질을 암호화한다. 이 구성체 내의 ZC 링커는 22개 아미노산 길이이며, 7개 아미노산의 핵 위치 서열(PKKKRKV; SEQ ID NO:210)을 포함한다.The 5-9D zinc finger domain binds to the 12-nucleotide target sequence AAAGCGGCTCCG (SEQ ID NO: 157) located in the fifth exon of the IL-2R gamma gene. See Example 14 (Table 17). 5-9D by inserting the sequence encoding the zinc finger domains into the vector was generated the N- terminus of Fok I / ZFP fusion of Fok I sequence ZFP sequences. In order to produce such a structure body, a discharge pIL2-lR by cutting the plasmid with Kpn I and Bam HI fragment containing the sequence coding for IL2-1 zinc finger binding domain described in the previous paragraph and, 5-9D zinc finger binding A Kpn I / Bam HI fragment encoding the domain was inserted in place. The resulting construct, p5-9DR, encodes a fusion protein containing the Fok I cleavage half-domain, the NLS, and the 4-finger 5-9D zinc finger binding domain, from the N-terminus to the C-terminus. The ZC linker in this construct is 22 amino acids in length and contains the nucleotide sequence of seven amino acids (PKKKRKV; SEQ ID NO: 210).

벡터 구조의 더 상세한 설명을 원한다면 공유인 미국 등록특허 제6,453,242호 및 제6,534,261호를 참조할 것.See U.S. Patent Nos. 6,453,242 and 6,534,261 for more details of the vector structure.

실시예 26: DNA 절단을 위한 합성 기질의 제조 Example 26: Preparation of synthetic substrate for DNA cleavage

전술한 IL2-1 및 5-9D 융합 단백질에 결합된 표적 서열을, FokI 도메인이 ZFP 도메인의 N-말단인, 변화된 극성을 지닌 징크핑거/FokI 융합 단백질의 절단능을 시험하기 위하여 이중-가닥 DNA 단편으로 도입하였다. 주형 1 내에서, 5-9D 표적 부위는 한 가닥 내에 존재하고, IL2-1 표적 부위는 서로 인접하거나, 6개의 삽입 뉴클레오티드 쌍에 의하여 분리된 결합 부위의 3' 말단을 지닌 상보 서열에 존재하게 된다. 주형 2에서, 5-9D 및 IL2-1 표적 부위는, 6개의 삽입 뉴클레오티드 쌍에 의하여 분리된 5-9D 결합 부위의 3' 말단에서부터 IL2-1 결합 부위의 5' 말단까지를 지닌 동일한 DNA 가닥 상에 존재한다.The target sequences bound to the IL2-1 and 5-9D fusion proteins described above were cloned into the double-stranded region to test the ability of the Fok I domain to cleave the zinc finger / Fok I fusion protein with the changed polarity, which is the N-terminus of the ZFP domain. Stranded DNA fragment. Within template 1, the 5-9D target site is in one strand, and the IL2-1 target site is adjacent to, or in a complementary sequence with the 3 ' end of the binding site separated by 6 insertional nucleotide pairs . In template 2, the 5-9D and IL2-1 target sites are located on the same DNA strand with the 5 'end of the IL2-1 binding site from the 3' end of the 5-9D binding site separated by 6 insertional nucleotide pairs Lt; / RTI >

전술한 서열을 함유한 약 442 염기 쌍의 DNA 단편은 주형이 클론된 플라스미드의 증폭 산물로서 획득하였다. IL2-1 및 5-9D 표적 부위는 이러한 단편 내로 위치되고, 두 표적 부위 간의 이중-가닥 DNA 절단에 의하여 약 278 내지 164 염기 쌍의 DNA 단편을 생성하게 된다. 증폭 산물은 T4 폴리뉴클레오티드 키나제를 사용하여 γ-32P-ATP로부터 오르토인산염을 전이시켜 방사성 표지를 하였다A DNA fragment of about 442 base pairs containing the above sequence was obtained as an amplification product of the plasmid in which the template was cloned. The IL2-1 and 5-9D target sites are located in these fragments and produce about 278 to 164 base pairs of DNA fragments by double-stranded DNA cleavage between the two target sites. The amplification product was radio-labeled by transferring orthophosphate from &ggr; -32P-ATP using T4 polynucleotide kinase

실시예 27: 변화된 극성을 지닌 징크핑거/ Fok I 융합체에 의한 표적화된 DNA 절단 Example 27: Targeted DNA cleavage by zinc finger / Fok I fusions with changed polarity

TNT 결합 망상적혈구 용해질(Promega, Madison, WI) 내에서 이러한 단백질을 암호화하는 플라스미드를 배양하여 IL2-1C, IL2-1R 및 5-9DR 융합 단백질을 획득한다. 절단 반응은 각 융합 단백질을 위한 1 ㎕의 TNT 반응물, 1 ㎕의 표지된 절단 기질 및 20 ㎕ 절단 버퍼를 함유하는 23 ㎕의 혼합물에서 수행된다. 절단 버퍼는 1 ㎕의 1M 디티오트레이톨 및 50 ㎕의 소 혈청 알부민(10 mg/㎖)을 1 ㎖의 20 mM Tris-CL pH 8.5, 75 mM의 NaCl, 10 μM의 ZnCl2, 5%(v/v) 글리세롤에 첨가하여 제조한다. 절단 반응은 37℃에서 2 시간 동안 배양되었으며, 그 다음 13 ㎕의 페놀/클로로포름/이소아밀 알콜(25:24:1)과 함께 진탕하였다. 원심분리 후, 10 ㎕의 수성 액상을 10% 폴리아크릴아미드 겔 상에서 분석하였다. 상기 겔 내의 방사성을 포스포러이미저(Phosphorimager)(Molecular Dynamics)로 검출하였으며, ImageQuant 소프트웨어(Molecular Dynamics)를 사용하여 정량하였다.IL2-1C, IL2-1R and 5-9DR fusion proteins are obtained by culturing plasmids encoding these proteins in TNT-conjugated reticulocyte lysates (Promega, Madison, Wis.). The cleavage reaction is performed in a mixture of 23 [mu] l containing 1 [mu] l of TNT reagent for each fusion protein, 1 [mu] l of labeled cleavage substrate and 20 [mu] l of cleavage buffer. The cleavage buffer contained 1 μl of 1 M dithiothreitol and 50 μl of bovine serum albumin (10 mg / ml) in 1 ml of 20 mM Tris-CL pH 8.5, 75 mM NaCl, 10 μM ZnCl 2 , 5% v / v) glycerol. The cleavage reaction was incubated for 2 hours at 37 ° C and then shaken with 13 μl phenol / chloroform / isoamyl alcohol (25: 24: 1). After centrifugation, 10 [mu] l of aqueous liquid phase was analyzed on 10% polyacrylamide gel. The radioactivity in the gel was detected with a Phosphorimager (Molecular Dynamics) and quantified using ImageQuant software (Molecular Dynamics).

도 44는 NH2-FokI 도메인-징크핑거 도메인-COOH 극성을 지닌 두 키메라 뉴클레아제를 사용하여 얻은, 두 키메라 뉴클레아제의 결합 부위가 반대 가닥에 위치하고, 상기 결합 부위의 3' 말단이 서로 인접하고, 6 뉴클레오티드 쌍에 의하여 분리된 기질을 분리하는 결과를 나타낸다. IL2-1R 또는 5-9DR 뉴클레아제를 단독으로 함유한 기질의 배양에 의하여 기질이 절단되지는 않으나(2 및 3 열과 1열의 비교), 반면 두 뉴클레아제를 배양한 결과 의도한 표적 부위 내의 DNA 기질의 거의 전부가 절단되었다(4 열).Figure 44 shows that the binding sites of two chimeric nuclease sites, which were obtained using two chimeric nuclease with NH 2 -Fok I domain-zinc finger domain -COOH polarity, are located on the opposite strand and the 3 ' The results show the separation of substrates separated by 6 nucleotide pairs, which are adjacent to each other. The substrate was not cleaved by incubation of substrate containing IL2-1R or 5-9DR nuclease alone (comparison of columns 2 and 3 and column 1), whereas incubation of two nuclease results in an intracellular Nearly all of the DNA substrate was cleaved (column 4).

도 45는 NH2-징크핑거 도메인-FokI 도메인-COOH 극성을 지닌 제1 키메라 뉴클레아제, 및 NH2-FokI 도메인-징크핑거 도메인-COOH 극성을 지닌 제2 키메라 뉴클레아제가, 키메라 뉴클레아제의 결합 부위가 동일한 가닥 내 상에 존재하고, 제1 결합 부위의 3' 말단은 제2 결합 부위의 5'말단에 인접하고 6 뉴클레오티드 쌍에 의하여 분리된 기질를 절단하는 능력을 나타낸다. 5-9DR 및 IL2-1C 뉴클레아제(즉, 서로 다른 극성을 지닌 각각의 뉴클레아제)의 조합만이 동일한 가닥에 두 표적 부위를 지닌 기질의 분리에 성공적이었다(6 열과 1-5열을 비교).Figure 45 shows a first chimeric nuclease having an NH 2 -ink finger domain- Fok I domain -COOH polarity and a second chimeric nuclease having an NH 2 -Fok I domain-zinc finger domain -COOH polarity, The binding site of the cleavage is in the same strand and the 3 'end of the first binding site is adjacent to the 5' end of the second binding site and exhibits the ability to cleave a substrate separated by a pair of 6 nucleotides. Only a combination of 5-9DR and IL2-1C nuclease (i.e., each of the nuclease with different polarities) was successful in separating substrates with two target sites on the same strand (columns 6 and 1-5, compare).

실시예 28: 상이한 ZC 링커 길이를 지닌 키메라 뉴클레아제Example 28: Chimeric nuclease with different ZC linker length

폴드 도메인이 ZFP 도메인 아미노 말단인, 서로 다른 ZC 링커 길이를 지닌 두 융합 단백질 세트를 설계하였다. 상기 폴드 도메인은 Looney et al. (1989) Gene 80:193-208에 따른 아미노산 384-579이다. 상기 ZFP 도메인은 IL1-2(표 27), 5-8G(표 17) 및 5-9D(표 17) 도메인으로부터 선택된다. 제1 세트는 NH2-NLS-FokI-ZFP-플래그-COOH 구조를 가진다. 이 세트에서, ZC 링커의 길이가 13, 14, 18, 19, 28 및 29 아미노산인 단백질이 설계되었다. 제2 세트는 NH2-FokI-NLS-ZFP-플래그-COOH 구조를 가지며, ZC 링커의 길이가 21, 22, 23, 24, 28, 29, 38 및 39 아미노산인 단백질이 설계되었다. 제2 세트에서, 상기 NLS는 ZC 링커의 일부라는 것을 유념할 것이다. 이러한 융합 단백질을 암호화하는 플라스미드를 또한 제조하였다.Two sets of fusion proteins with different ZC linker lengths were designed, wherein the fold domain is the ZFP domain amino terminus. The folded domain is described by Looney et al . (1989) Gene 80: 193-208. The ZFP domain is selected from IL1-2 (Table 27), 5-8G (Table 17) and 5-9D (Table 17) domains. The first set has the NH 2 -NLS- Fok I-ZFP-flag-COOH structure. In this set, proteins with lengths of 13, 14, 18, 19, 28 and 29 amino acids of the ZC linker were designed. The second set is NH 2 - Fok I-NLS- ZFP- flag has a -COOH structure, the length of the ZC linker was designed in the 21, 22, 23, 24, 28, 29, 38 and 39 amino acid protein. In the second set, it will be noted that the NLS is part of the ZC linker. Plasmids encoding such fusion proteins were also prepared.

모델 DNA 서열을 설계하여 이러한 융합 단백질의 절단 활성을 시험하고, 두 융합 단백질을 위한 표적 부위 간의 거리의 함수로 최적 ZC 링커 길이를 결정하였다. 다음의 서열이 설계되었다:Model DNA sequences were designed to test the cleavage activity of these fusion proteins and determine the optimal ZC linker length as a function of distance between target sites for both fusion proteins. The following sequence was designed:

1. 반대 가닥 상의 5-9D 표적 부위 및 IL2-1 표적 부위1. 5-9D target site on the opposite strand and IL2-1 target site

2. 동일 가닥 상의 5-9D 표적 부위 및 IL2-1 표적 부위2. 5-9D target site on the same strand and IL2-1 target site

3. 반대 가닥 상의 5-9D 표적 부위 및 5-8G 표적 부위3. 5-9D target sites on the opposite strand and 5-8G target sites on the opposite strand

4. 동일 가닥 상의 5-9D 표적 부위 및 5-8G 표적 부위4. 5-9D target site and 5-8G target site on the same strand

표적 부위의 이러한 4개의 쌍은 각각에 대하여, 서열은 두 표적 부위 간의 분리가 4, 5, 6 또는 7 bp로 제조되었다. These four pairs of target sites were prepared for each, and the sequences were prepared for separation between two target sites at 4, 5, 6 or 7 bp.

이러한 서열은 실시예 26에 기술한 표지된 기질 내로 도입되고, 실시예 27에 기술한 방법에 따라 DNA를 절단하는 이들의 능력을 위한 실시예에 기술한 다양한 융합 단백질을 시험하기 위하여 사용되었다.These sequences were introduced into the labeled substrates described in Example 26 and used to test the various fusion proteins described in the examples for their ability to cleave DNA according to the method described in Example 27. [

실시예 29: 통합된 결함 eGFP 수용체 유전자를 함유하는 안정한 셀라인의 제 Example 29: Preparation of a stable cell line containing an integrated defect eGFP receptor gene

상기 IL-2Rγ 유전자의 프레임시프트 돌연변이 및 엑손 5의 단편을 함유하며, 테트라시클린-조절 CMV 프로모터와 효과적으로 결합한 eGFP(강화 녹색 형광 단백질) 암호 서열을 다음과 같이 제조하였다. 사일런트 돌연변이를 pEGFP-NI 벡터(BD BioSciences) 내의 eGFP 암호 서열 내로 삽입하여 신규의 SpeI 부위를 생성하였다. 그 다음, 일-뉴클레오티드 결함(프레임시프트 돌연변이를 생성)을 새로운 SpeI 부위의 하류에 도입하였다. 5-8G 및 5-9D 징크핑거/FokI 융합 단백질에 대한 표적 부위를 함유한, IL-2Rγ 유전자의 엑손 5로부터의 다음 서열을 새로 도입된 SpeI 부위에 삽입시켰다(상기 실시예 14, 표 17에 기술):The eGFP (enhanced green fluorescent protein) coding sequence containing the frame-shift mutation of the IL-2R gamma gene and a fragment of exon 5 and effectively binding with the tetracycline-regulated CMV promoter was prepared as follows. A silent mutation was inserted into the eGFP coding sequence in the pEGFP-NI vector (BD BioSciences) to create a new SpeI site. Then, one-nucleotide defects (generating frame shift mutations) were introduced downstream of the new SpeI site. The following sequence from exon 5 of the IL-2R gamma gene containing the target site for the 5-8G and 5-9D zinc finger / Fok I fusion protein was inserted into the newly introduced SpeI site (Example 14, Table 17 Technology):

CTAGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCCTAG(SEQ IDNO:214)CTAGCTACACGTTTCGTGTTCGGAGCCGCTTTAACCCACTCTGTGGAAGTGCTCCTAG (SEQ ID NO: 214)

결과 플라스미드는 IL2Rγ 유전자의 엑손 5로부터의 DNA 서열의 단편을 함유한 변이 eGFP를 암호화하는 서열을 함유한다. 이 플라스미드는 HindIII 및 NotI로 절단되었으며, 변이 eGFP 서열을 함유하는 단편(삽입된 IL-2Rγ의 엑손 5 서열을 포함)을 방출한다. 이 단편은 pcDNA4/TO 벡터(Invitrogen)의 HindIII 및 NotI 부위 내로 삽입되어, eGFP 서열의 발현이 2X tet-작동자-조절 CMV 프로모터에 의하여 조절되는 구성체가 되었다. 이 플라스미드의 개념도를 도 46에 나타내었다.The resulting plasmid contains a sequence encoding a mutant eGFP containing a fragment of the DNA sequence from exon 5 of the IL2Ry gene. This plasmid was digested with Hind III and Not I and released a fragment containing the mutated eGFP sequence (including the exon 5 sequence of inserted IL-2Rγ). This fragment was inserted into the Hind III and Not I sites of the pcDNA4 / TO vector (Invitrogen), resulting in a construct in which the expression of the eGFP sequence was regulated by the 2X tet-activator-regulated CMV promoter. A conceptual diagram of this plasmid is shown in Fig.

이 구성체는 HEK293 TRex 세포(Invitrogen)의 형질전환에 사용되었으며, 이 구성체의 통합된 카피를 함유하는 안정한 셀라인이 분리되었다. 이러한 셀라인에서, 상기 eGFP 암호 서열은 독시시클린의 첨가로 전사되었으나, 프레임시프트 돌연변이 및 IL-2Rγ 삽입에 의하여, 어떠한 기능적 단백질도 발현되지 않았다.This construct was used to transform HEK293 TRex cells (Invitrogen), and a stable cell line containing an integrated copy of this construct was isolated. In this cell line, the eGFP coding sequence was transcribed by the addition of doxycycline, but no functional protein was expressed by frame-shift mutagenesis and IL-2Ry insertion.

실시예 30: 염색체 eGFP 유전자 내로의 퓨로마이신 내성 마커의 표적화된 상동성-의존 통합 Example 30: Targeted homology-dependent integration of the puromycin resistance marker into the chromosomal eGFP gene

본 실험은 퓨로마이신 내성 마커의 상기 실시예에서 기술한 변이 염색체 eGFP 유전자로의 통합을 위한 시험을 위하여 수행하였다.This experiment was performed for testing for integration of the puromycin resistance marker into the mutant chromosome eGFP gene described in the above example.

퓨로마이신 내성("퓨로 서열"로 표시)을 암호화하는 서열을 함유하고, eGFP cDNA 구성체와 상동인 서열이 측면에 위치하는, 프로모터 없는 도너를 다음과 같이 제조하였다. 서열을 pTRE2pur-HA 벡터(BD Bioscience)로부터 PCR 증폭하여, 우회 SpeI 부위 및 ATG 개시 코돈의 상류와 일치하는 Kozak 서열을 지닌 퓨로 서열을 생성하였다. 증폭 프라이머는 다음과 같다:A donor without promoter was prepared as follows, containing a sequence coding for puromycin resistance (denoted "puerosse") and flanking the sequence homologous to the eGFP cDNA construct. The sequence was PCR amplified from the pTRE2pur-HA vector (BD Bioscience) to generate a fuzzy sequence with a Kozak sequence that coincided with the bypass SpeI site and upstream of the ATG start codon. The amplification primers are as follows:

퓨로-5': ACTAGTGCCGCCACCATGACCGAGTACAAGCCCA(SEQ ID NO:215) Furo-5 ': ACTAGTGCCGCCACCATGACCGAGTACAAGCCCA (SEQ ID NO: 215)

퓨로-3': ACTAGTCAGGCACCGGGCTT(SEQ ID NO:216)Furo-3 ': ACTAGTCAGGCACCGGGCTT (SEQ ID NO: 216)

이 PCR 단편은 신규한 SpeI 제한 부위 및 유전자 발현을 차단하는 프레임시프트 돌연변이(실시예 29 참조)를 암호화하는 변형 eGFP 유전자를 함유한 pEGFP-N1 벡터 내로 클론되었다. 이 eGFP/퓨로마이신 유전자는 HindIII 및 NotI 부위를 통하여 pcDNA4/TO 벡터 내로 클론되어, 표적화된 통합에 의하여 퓨로마이신 내성 세포를 얻기 위한 실험에서 양성 대조군으로 제공되는, 벡터 pcDNA4/TO/GFPpuro를 생성하였다. 프로모터 없는 도너를 생성하기 위하여, 상기 pcDNA4/TO/GFPpuro 벡터는 다음의 프라이머와 함께 PCR 증폭되었다:This PCR fragment was cloned into a pEGFP-N1 vector containing a modified SpeI restriction site and a modified eGFP gene encoding a frame shift mutation (see Example 29) that blocks gene expression. The eGFP / puromycin gene, the vector pcDNA4 / TO / GFPpuro provided as a positive control in experiments is cloned into the pcDNA4 / TO vector through the Hind III and Not I sites, to obtain puromycin-resistant cell by targeted integration Respectively. To generate a donor without promoter, the pcDNA4 / TO / GFPpuro vector was PCR amplified with the following primers:

GFP-Bam CGAATTCTGCAGTCGAC(SEQ ID NO:217) GFP-Bam CGAATTCTGCAGTCGAC (SEQ ID NO: 217)

pcDNA42571 TGCATACTTCTGCCTGC(SEQ ID NO:218)pcDNA42571 TGCATACTTCTGCCTGC (SEQ ID NO: 218)

결과 증폭 산물을 pCR4-TOPO 벡터 내로 Topo 클론하였으며, 이들의 서열을 확인하였다. 이로써 퓨로 서열의 염색체 eGFP 구성체 상류와 상동인 413 bp의 서열 및 퓨로 서열의 염색체 eGFP 구성체 하류와 상동인 1285 bp의 서열을 지닌 도너를 생성하였다.The resulting amplified products were Topo cloned into pCR4-TOPO vector and their sequence was confirmed. This resulted in a donor with a sequence of 413 bp homologous to the chromosomal eGFP construct upstream of the furo sequence and a sequence of 1285 bp homologous to the downstream chromosomal eGFP construct of the furo sequence.

퓨로 서열의 표적화된 통합을 시험하기 위하여, 실시예 29에서 기술한 셀라인에 본 실시예에서 기술한 도너 구성체의 존재 하에 징크핑거/FokI 융합 단백질에 의하여 표적화된 DNA 절단을 가하고, 트랜스펙션된 세포를 퓨로마이신 내성으로 선택하고, 이들의 염색체 DNA를 분석하였다. eGFP 유전자 (5-8G 및 5-9D) 내로 삽입된 엑손 5 서열 내에서 절단되도록 설계된 두 징크핑거/FokI 융합 단백질(ZFN)을 전술한 실시예 14, 표 17에서 기술하였다. 퓨로마이신 내성은 eGFP 암호 서열 내로 삽입된 IL-2Rγ 서열 내에 위치한 절단 부위의 도너 서열의 상동성-의존 또는 상동성-비의존 통합에 의하여 발생할 수 있다. 도너 구성체의 상동성-의존 통합은 푸로 서열에 의하여 IL-2Rγ 서열을 치환하게 된다In order to test the targeted integration of the furosequence, the DNA cut targeted by the zinc finger / Fok I fusion protein was applied to the cell line described in Example 29 in the presence of the donor construct described in this Example, Were selected for puromycin resistance and their chromosomal DNA was analyzed. Two zinc finger / Fok I fusion proteins (ZFN) designed to be cleaved within the exon 5 sequence inserted into the eGFP genes (5-8G and 5-9D) are described in Example 14, Table 17, above. Puromycin resistance may occur due to homology-or homology-independent integration of the donor sequence of the cleavage site located within the IL-2Rγ sequence inserted into the eGFP coding sequence. Homology-dependent integration of the donor construct replaces the IL-2R < gamma > sequence by furosequence

HEK 293 세포를 10% 태아 소 혈청 (FBS)(Hyclone) 및 2 mM L-글루타민을 보충한 듈베코 변형 이글 배지(DMEM)(Invitrogen)에서 37℃로 유지하고 5% CO2 환경하에서 성장시켰다. 퓨로 서열의 표적화된 통합을 시험하기 위하여, 세포를 50 ng의 각 ZFN-암호화 플라스미드 및 500 ng의 도너 플라스미드로 트랜스펙션했다. 음성 대조군 실험으로써, 세포를 50 ng의 각 ZFN-암호화 플라스미드 또는 500 ng의 도너 플라스미드로 각각 트랜스펙션했다. 양성 대조군으로서, 500 ng의 pcDNA4/TO/GFP푸로 벡터를 HEK293 세포로 트랜스펙션했다. 세포는 LipofectAMINE 2000 시약 (Invitrogen)의 Opti-MEM I 환원 혈청 배지 용액을 사용하여 트랜스펙션했다. 퓨로마이신 내성은 독시시클린 2 ng/㎖(통합된 서열의 전사를 활성화하기 위하여) 및 퓨로마이신 2 ug/㎖(최종 농도)를 성장 배지에 첨가하여 측정하였다.HEK 293 cells were maintained in Dulbecco's modified Eagle's medium (DMEM) (Invitrogen) supplemented with 10% fetal bovine serum (FBS) (Hyclone) and 2 mM L-glutamine at 37 ° C and grown under 5% CO 2 environment. To test the targeted integration of the purosequence, cells were transfected with 50 ng of each ZFN-encoding plasmid and 500 ng donor plasmid. As a negative control experiment, cells were each transfected with 50 ng of each ZFN-encoding plasmid or 500 ng of donor plasmid. As a positive control, 500 ng of pcDNA4 / TO / GFP furovector was transfected into HEK293 cells. Cells were transfected using Opti-MEM I reducing serum medium solution of LipofectAMINE 2000 reagent (Invitrogen). Puromycin resistance was determined by adding 2 ng / ml of doxycycline (to activate transcription of the integrated sequence) and 2 ug / ml of puromycin (final concentration) to the growth medium.

퓨로마이신 내성 집락은 ZFN-암호화 플라스미드 및 도너 플라스미드 둘 다로 트랜스펙션된 세포로부터만 획득한다. 24 집락 개체군을 분리하여, >6-주간의 선택을 하였으며, 그 다음 표적화된 통합 결과를 위한 PCR로 분석하였다. 다음의 PCR 프라이머가 표적화된 통합 결과가 발생하였는지 검출하기 위하여 사용되었다:Puromycin resistant colonies are obtained only from cells transfected with both ZFN-encoding plasmids and donor plasmids. 24 colonies were separated and> 6-week selection was made and then analyzed by PCR for targeted integration results. The following PCR primers were used to detect if targeted integration results occurred:

CMV퓨로-5' TTTGACCTCCATAGAAGACA(SEQ ID NO:219)CMV furo-5 'TTTGACCTCCATAGAAGACA (SEQ ID NO: 219)

CMV퓨로-3' GCGCACCGTGGGCTTGTACT(SEQ ID NO:220)CMV furo-3 ' GCGCACCGTGGGCTTGTACT (SEQ ID NO: 220)

일 프라이머는 외래 퓨로 서열과 상보적이며, 다른 프라이머는 통합된 수용체 구성체에 존재하는 CMV 프로모터 내의 서열과 상보적이다. 24 집락 중의 21개는 푸로 서열의 표적화된 통합과 일치하는 크기의 증폭 산물을 산출한다. 이러한 단편을 클론하였으며, 이들의 뉴클레오티드 서열을 결정하였다. 서열 분석에서는 24 클론 중 8개가 염색체 eGFP 구성체 내로의 퓨로 서열의 상동성-직접 통합을 겪은 반면에, 13개는 퓨로 서열의 부분적 복제와 함께 염색체 서열 내로 도너 DNA의 상동성-비의존 통합을 겪었다는 것을 적시한다.One primer is complementary to the foreign Pue sequence and the other primer is complementary to the sequence in the CMV promoter present in the integrated receptor construct. Twenty-one of the 24 colonies yield amplification products of a size consistent with the targeted integration of the furo sequence. These fragments were cloned and their nucleotide sequences were determined. In sequencing, eight of the 24 clones underwent homology-direct integration of the furosse into the chromosomal eGFP construct, whereas 13 underwent homologous-independent integration of the donor DNA into the chromosomal sequence with partial replication of the furosse sequence And so on.

실시예 31: IL-2Rγ 유전자의 엑손 5에 표적화된 징크핑거/ Fok I 융합 단백질의 코돈 최적화 Example 31: Codon optimization of zinc finger / Fok I fusion protein targeted to exon 5 of the IL-2Rγ gene

4 아미노산 ZC 링커(LO)에 의하여 FokI 절단 하프-도메인에 결합된, 5-8G 및 5-9D 징크핑거 결합 도메인(표 17)를 함유하는 융합 단백질은 전술하였다. 예컨대, 실시예 14 및 실시예 24를 참조할 것. 이러한 두 융합 단백질을 암호화하는 폴리뉴클레오티드는 코돈이 포유류 세포에서 발현하기 위하여 최적화되도록 설계하였다. 이러한 두 융합 단백질을 암호화하는 코돈-최적화 뉴클레오티드 서열은 다음과 같다:The fusion proteins containing the 5-8G and 5-9D zinc finger binding domains (Table 17), coupled to the Fok I cleavage half-domain by a 4 amino acid ZC linker (LO), were described above. See, for example, Examples 14 and 24. Polynucleotides encoding these two fusion proteins were designed such that the codons were optimized for expression in mammalian cells. The codon-optimized nucleotide sequences encoding these two fusion proteins are as follows:

20um에는 몇 dna ug ul

20um에는 몇 dna ug ul

실시예 32: 표적화된 상동성 통합을 위한 K-562 세포의 성장 및 트랜스펙션Example 32: Growth and transfection of K-562 cells for targeted homology integration

인간 K-562 적백혈병 세포(ATCC)를 37℃로 10% 태아 소 혈청, 페니실린 및 스트렙토마이신으로 보충한 DMEM 내에서 배양하였으며, 내부 IL2Rγ 유전자 내의 아르기닌 226의 코돈을 둘러싼 위치에서 이중-가닥 파열을 유도하도록 설계된 두 징크핑거 뉴클레아제(ZFN)를 암호화하는 2.5 μg의 발현 벡터로 트랜스펙션(뉴클레오펙터(Nucleofector); 아멕사(Amaxa))시켰다. 상기 두 뉴클레아제(5-8G 및 5-9D)는 전술한 실시예 14, 표 17에서 기술하였다. 뉴클레아제를 암호화하는 서열이 2A 펩티드를 암호화하는 서열에 의하여 분리되었다. 예컨대, Szymczak et al. (2004) Nature Biotechnol. 22:589-594를 참조할 것. 이와 동시에, 상기 세포는 엑손 5의 중앙에 위치한 IL2Rγ 염색체 DNA 서열의 1.5 Kb DNA 신장(stretch)을 수반하는 25 또는 50 μg의 도너 DNA 플라스미드로 트랜스펙션(Urnov et al. (2005) Nature 435:646-651)되고, 삽입된 DNA 서열에 의하여 중단된다(하기할 실시예 33-36 참조). 트랜스펙션 72 시간 후, 게놈 DNA를 분리하고(디엔이지(DNEasy); 키아젠(Qiagen)), IL2Rγ 유전자좌의 세포 유전형을, 도너 상동성의 1.5 kb 영역 외부를 서냉상동결합하고, 야생형 IL2Rγ 서열의 1.6 kbp의 증폭 산물을 생성(Urnov et al, 전술)하는 프라이머를 사용하여, X 염색체의 엑손 5-함유 신장의 PCR로 결정하였다. PCR 산물은 겔 전기영동하고, 지적된 부분은 제한 절단하여 분석하였다. 대조군 샘플은 다음을 포함한다: (1) GFP-암호화 발현 벡터로 트랜스펙션된 세포, (2) ZFN을 암호화하는 발현 벡터 단독으로 트랜스펙션된 세포, 및 (3) 도너 DNA 분자 단독으로 트랜스펙션된 세포.Human K-562 red leukemia cells (ATCC) were cultured in DMEM supplemented with 10% fetal bovine serum, penicillin and streptomycin at 37 ° C and double-stranded rupture at the location surrounding the codon of arginine 226 in the internal IL2Rγ gene (Nucleofector; Amaxa) with 2.5 [mu] g of an expression vector encoding two zinc finger nuclease (ZFN) designed to induce transcription. The two nucleases (5-8G and 5-9D) were described in Example 14, Table 17 above. Sequences encoding nuclease were isolated by sequences encoding 2A peptides. For example, Szymczak et al . (2004) Nature Biotechnol. 22: 589-594. At the same time, the cells were transfected with 25 or 50 [mu] g of donor DNA plasmid (Urnov et al . (2005) Nature 435: 1) with 1.5 Kb DNA stretching of the IL2R? Chromosomal DNA sequence located in the center of exon 5 646-651) and terminated by the inserted DNA sequence (see Examples 33-36). After 72 hours of transfection, the genomic DNA was isolated (DNEasy; Qiagen), the cytotypic form of the IL2R [gamma] locus was annealed to the outside of the 1.5 kb region of the donor homology and the wild type IL2R [gamma] Was determined by PCR of the exon 5-containing elongation of the X chromosome using a primer (Urnov et al., Supra) to generate an amplification product of 1.6 kbp. The PCR products were gel electrophoresis and the points indicated were analyzed by restriction cleavage. Control samples include: (1) cells transfected with a GFP-encoding expression vector, (2) cells transfected with an expression vector encoding ZFN alone, and (3) Cells that were sorted.

실시예 33: 내인성 IL-2Rγ 유전자 내로 12-뉴클레오티드 외래 서열의 표적화된 상동성-의존 통합 Example 33: Targeted homology-dependent integration of a 12-nucleotide extraneous sequence into an endogenous IL-2Ry gene

세포 성장 및 트랜스펙션은 실시예 32에 기술한 바와 같이 수행하였다. 도너 DNA 분자는 제한 효소 StuI를 위한 신규한 특징적 인식 부위를 함유하는 12 뉴클레오티드 쌍 서열 태그를 포함하도록 조작되었다. 세포 DNA는 분리되었으며, 실시예 32에서 기술한 증폭을 위한 주형으로 사용되었고, 그 다음 StuI로 절단되었다. 도 47에 나타낸 바와 같이, 모든 대조군 샘플은 제한 효소에 의한 절단에 내성이 있는 증폭 산물을 산출하는 염색체를 수반한다. 이에 비하여, 도너 DNA 분자 및 ZFN 발현 구성체 둘 다에 의하여 트랜스펙션된 세포 샘플 내의 15%의 모든 증폭 산물은 도너 DNA의 통합을 나타내는 제한 효소에 민감하다. 염색체-유도 PCR 산물의 직접 뉴클레오티드 서열 결정을 통하여 통합이 상동성-의존성이라는 것을 확인하였다.Cell growth and transfection were performed as described in Example 32. < tb >< TABLE > The donor DNA molecule was engineered to contain a 12 nucleotide pair sequence tag containing a novel characteristic recognition site for restriction enzyme Stu I. Cell DNA was isolated and used as a template for amplification as described in Example 32, and then digested with Stu I. As shown in Figure 47, all control samples carry a chromosome that yields an amplification product that is resistant to cleavage by restriction enzymes. In contrast, all 15% of the amplification products in cell samples transfected with both the donor DNA molecule and the ZFN expression construct are sensitive to restriction enzymes indicating integration of the donor DNA. Direct nucleotide sequencing of the chromosome-derived PCR products confirmed that integration was homology-dependent.

실시예 34: 내인성 IL-2Rγ 유전자 내로 외래 오픈 리딩 프레임의 표적화된 상동성-의존 통합 Example 34: Targeted homology-dependent integration of foreign open reading frames into endogenous IL-2Ry gene

세포 성장 및 트랜스펙션은 실시예 32에 기술한 바와 같이 수행하였다. 본 실험에서, 서로 다른 두개의 도너 DNA 분자가 사용되었다. 도너 DNA 분자 #1은 염색체 IL2Rγ 유전자좌와 상동 서열이 측면에 위치한 강화 녹색 형광 단백질 (eGFP)의 전 720 bp ORF를 함유하도록 조작되었다(실시예 32 참조). 도너 DNA 분자 #2는 폴리아데닐화 신호를 따르는 전 eGFP ORF로 구성된 924 bp 서열을 함유하며; 이 서열은 IL2Rγ-상동 서열이 측면에 위치한다(실시예 32 참조). 다음의 트랜스펙션에서, 세포 DNA를 분리하였으며, 실시예 32에서 기술한 증폭을 위한 주형으로 사용되었다. 도 48에 나타낸 바와 같이, 모든 대조군 샘플은 야생형 크기가 ~1.6 kb인 PCR 산물을 산출하는 염색체를 수반한다. 이에 비하여, ORF-수반 도너 및 ZFN 발현 구성체 둘 다로 트랜스펙션된 세포 샘플 내의 3-6%의 모든 염색체는 야생형-염색체-유도 PCR 산물보다 더 많은 증폭 산물을 산출하였으며, 크기의 차이는 eGFP ORF의 ZFN-유도성 표적화된 통합이 발생하였다는 주장과 일치하였다. 염색체-유도 PCR 산물의 직접 뉴클레오티드 서열 결정은 이러한 관찰 결과를 확인하였으며, 이러한 통합이 상동성-의존성이라는 것을 적시하였다.Cell growth and transfection were performed as described in Example 32. < tb > < TABLE > In this experiment, two different donor DNA molecules were used. Donor DNA molecule # 1 was engineered to contain the entire 720 bp ORF of the enhanced green fluorescent protein (eGFP) with homologous sequences flanking the chromosomal IL2R? Locus (see Example 32). Donor DNA molecule # 2 contains a 924 bp sequence consisting of the entire eGFP ORF following a polyadenylation signal; This sequence is flanked by the IL2Ry-homologous sequence (see Example 32). In the following transfection, cell DNA was isolated and used as template for amplification as described in Example 32. [ As shown in Figure 48, all control samples carry a chromosome that yields a PCR product of ~ 1.6 kb in wild-type size. In contrast, all chromosomes 3-6% in the cell samples transfected with both the ORF-associated donor and ZFN expression constructs produced more amplification products than the wild-type-chromosome-derived PCR products, ZFN-inducible targeted integration of the two groups. Direct nucleotide sequencing of the chromosome-derived PCR products confirmed these observations and indicated that such integration is homology-dependent.

실시예 35: 내인성 IL-2Rγ 유전자 내로의 외래 "치료 하프-유전자"의 표적화된 상동성-의존 통합 Example 35: Targeted homology-dependent integration of exogenous " therapeutic half-genes "into the endogenous IL-2Rγ gene

세포 성장 및 트랜스펙션은 실시예 32에 기술한 바와 같이 수행하였다. 도너 DNA 분자는 엑손 5, 및 엑손 6, 7 및 8의 완전 카피(엑손 8 내의 번역 종결 코돈 및 폴리아데닐화 신호를 포함)의 하방 서열 부분을 함유하는 부분적 IL2Rγ cDNA의 720 뉴클레오티드-쌍으로 구성되어 있다. 이러한 cDNA 서열의 일 측면에는 엑손 5의 상류 부분과 상동인 서열과 인트론 4의 인접 부분이 위치하고, 다른 측면에는 엑손 5의 하류 부분과 상동인 서열 및 인트론 5의 인접 부분이 위치한다(도 49 참조). 엑손 5의 하류 부분의 두 카피는 도너 구성체 내에 존재하여, 재조합이 엑손 8에 인접한 카피 내에서 일어나는 것을 확보하므로, 수개의 사일런트 서열 변화는 엑손 6에 인접한 카피 내로 도입된다. 이러한 변화는 외래 엑손 5 서열의 암호화 능력을 변화시키지 못하나, 이러한 파괴를 수리하는 개시 회귀 작용에 이러한 서열을 사용하는 것을 차단시키기 위하여 염색체 서열과 비-상동성인 서열을 충분히 도입하게 된다. 따라서, 뉴클레아제에 의하여 표적화된 부위의 도너 구성체의 통합은 엑손 6, 7 또는 8 및 도너 구성체 내에 함유된 엑손 5의 하류 부분의 모든 IL2Rγ 돌연변이를 수정하는데 사용될 수 있다. Cell growth and transfection were performed as described in Example 32. < tb > < TABLE > The donor DNA molecule consists of a 720-nucleotide-pair of partial IL2R? CDNA containing exon 5, and a down-sequence portion of a complete copy of the exons 6, 7 and 8 (including translation termination codon and polyadenylation signal in exon 8) have. On one side of this cDNA sequence is located an upstream portion of exon 5, a homologous sequence and an adjacent portion of intron 4, and on the other side is a homologous sequence to the downstream portion of exon 5 and an adjacent portion of intron 5 (see FIG. 49 ). Several silent sequence changes are introduced into the copy adjacent to exon 6, since two copies of the downstream portion of exon 5 are present in the donor construct, ensuring that recombination occurs within the copy adjacent to exon 8. These changes do not alter the coding capacity of exogenous exon 5 sequences, but they fully introduce sequences that are non-homologous to chromosomal sequences in order to block the use of such sequences for initiation regressions repairing such disruption. Thus, integration of the donor construct of the site targeted by the nuclease can be used to modify all IL2R [gamma] mutations in exon 6, 7 or 8 and the downstream portion of exon 5 contained within the donor construct.

트랜스펙션 후, 세포 DNA를 분리하였으며, 실시예 32에서 기술한 증폭의 주형으로 사용되었다. 도 50에 나타난 바와 같이, 세포가 GFP-암호화 플라스미드로 트랜스펙션된 대조군 샘플은 야생형 크기(~1.6 kb)의 PCR 산물을 산출하는 염색체를 함유한다. 이에 비하여, 치료 하프-유전자-수반 도너 및 ZFN 발현 구성체 둘 모두로 트랜스펙션된 세포 샘플 내의 6%의 염색체는 야생형- 염색체-유도 PCR 산물보다 더 크며, 크기의 차이는 "치료 하프-유전자"의 ZFN-유도성 표적화된 통합이 발생하였다는 주장과 일치한다. 거대 PCR 산물의 직접 뉴클레오티드 서열 결정에 의하여 도너 구성체의 상동성-의존 통합이 발생하였음을 확인하였다.After transfection, the cellular DNA was isolated and used as the template for the amplification described in Example 32. As shown in Figure 50, a control sample in which cells were transfected with a GFP-encoding plasmid contains a chromosome that yields a PCR product of wild-type size (~1.6 kb). In contrast, 6% of chromosomes in cell samples transfected with both therapeutic half-gene-associated donor and ZFN expression constructs were larger than wild-type-chromosome-directed PCR products, Of ZFN-inducible targeted integration of the two. Direct nucleotide sequencing of the large PCR products confirmed homologous-dependent integration of donor constructs.

실시예 36: 내인성 IL-2Rγ 유전자 내로의 외래 7.7 kbp 발현 구성체의 표적화된 상동성-의존 통합 Example 36: Targeted homology-dependent integration of an exogenous 7.7 kbp expression construct into the endogenous IL-2R.gamma.

세포 성장 및 트랜스펙션 실시예 32에 기술한 바와 같이 수행하였다. 도너 DNA 분자는 IL2Rγ 엑손 5 및 인접 서열과 상동인 서열이 측면에 위치하는, 7.7 kbp 항체 발현 구성체를 함유하도록 제조하였다(실시예 32 참조). 이 실험에서, 두 종의 도너의 위상 형태가 사용되었다: 벡터 백본이 발현 구성체("원형")에 의하여 차단되는 두 상동성 가지를 지닌 삽입체에 인접한 플라스미드 도너; 및 발현 구성체("선형")에 의하여 차단되는 두 상동성 가지를 함유하는 선형 도너. Cell growth and transfection were performed as described in Example 32. [ The donor DNA molecule was prepared containing the 7.7 kbp antibody expression construct (see Example 32) in which the IL2R? Exon 5 and the sequence homologous to the adjacent sequence are flanked. In this experiment, the topological forms of two donors were used: a plasmid donor adjacent to an insert with two homologous branches whose vector backbone is blocked by an expression construct ("circular"); And a linear donor containing two homologous branches blocked by an expression construct ("linear").

DNA는 실시예 32에서 기술한 트랜스펙션 세포로부터 분리되었다. 상기 DNA는 통합된 외래 서열과 내부 IL-2Rγ 엑손 5 서열간의 접합을 검출하도록 설계된 두 프라이머 쌍을 사용하여 PCR로 분석되었다. 따라서, 각 프라이머 쌍에 있어서, 일 프라이머는 내부 엑손 5 서열에 상보적이고, 및 다른 프라이머는 발현 구성체에 상보적이다(도 51의 상부를 참조). 도 51의 하부에 나타낸 바와 같이, 도너 DNA 만으로 트랜스펙션된 대조군 샘플에서는 PCR 산물이 관찰되지 않았다. 이에 비하여, 기대하는 크기의 PCR 산물은 도너 DNA(선형 또는 원형) 및 ZFN-암호화 플라스미드로 트랜스펙션된 세포 샘플 내에서 관찰되었다. 임계적으로, 발현 구성체의 양 말단에 특이적인 프라이머 세트는 외래 7.7 kb 서열의 ZFN-유도성 표적화된 통합이 발생하였다는 주장과 일치하는 결과를 산출하였다. 증폭 산물의 뉴클레오티드 서열 결정에 의하여 상동성-의존 통합이 발생하였다는 것을 확인하였다.The DNA was isolated from the transfected cells described in Example 32. The DNA was analyzed by PCR using two primer pairs designed to detect the junction between the integrated foreign sequence and the internal IL-2R [gamma] exon 5 sequence. Thus, for each primer pair, one primer is complementary to the internal exon 5 sequence, and the other primer is complementary to the expression construct (see top of FIG. 51). As shown in the lower portion of FIG. 51, no PCR product was observed in the control sample transfected with donor DNA only. In contrast, PCR products of the expected size were observed in cell samples transfected with donor DNA (linear or circular) and ZFN-encoding plasmids. Critically, primer sets specific for both ends of the expression construct yielded results consistent with the assertion that ZFN-induced targeted integration of the foreign 7.7 kb sequence occurred. It was confirmed that homology-dependent integration occurred by nucleotide sequencing of the amplification product.

실시예 37: 내인성 염색체 유전자좌의 외래 서열의 표적화된, 상동성-비의존 통합 Example 37: Targeted, homologous-independent integration of extraneous sequences of endogenous chromosomal loci

징크핑거/FokI 융합 단백질의 쌍은 중국 햄스터 디히드로폴레이트 환원효소(DHFR) 유전자 내의 6 뉴클레오티드 쌍에 의하여 분리된 두 표적 부위에 결합하고, 두 표적 부위 사이의 유전자를 절단하도록 설계되었다. 융합 단백질의 표적 부위의 뉴클레오티드 서열, 및 인식 부위의 아미노산 서열은 표 28에 나타내었다. The pair of zinc finger / Fok I fusion proteins was designed to bind to two target sites separated by a 6 nucleotide pair in the Chinese hamster dihydrofolate reductase (DHFR) gene and to cleave the gene between the two target sites. The nucleotide sequence of the target site of the fusion protein and the amino acid sequence of the recognition site are shown in Table 28. < tb >< TABLE >

CHO DHFR 유전자를 위한 징크핑거 설계Design of zinc finger for CHO DHFR gene 표적 서열Target sequence F1F1 F2F2 F3F3 F4F4
GGAAGGTCTCCG
(SEQ ID NO:223)

GGAAGGTCTCCG
(SEQ ID NO: 223)

RSDTLSE
(SEQ ID NO:224)

RSDTLSE
(SEQ ID NO: 224)

NNRDRTK
(SEQ ID NO:225)

NNRDRTK
(SEQ ID NO: 225)

RSDHLSA
(SEQ ID NO:226)

RSDHLSA
(SEQ ID NO: 226)

QSGHLSR
(SEQ ID NO:227)

QSGHLSR
(SEQ ID NO: 227)

AATGCTCAGGTA
(SEQ ID NO:228)

AATGCTCAGGTA
(SEQ ID NO: 228)

QSGALAR
(SEQ ID NO:229)

QSGALAR
(SEQ ID NO: 229)

RSDNLRE
(SEQ ID NO:230)

RSDNLRE
(SEQ ID NO: 230)

QSSDLSR
(SEQ ID NO:231)

QSSDLSR
(SEQ ID NO: 231)

TSSNRKT
(SEQ ID NO:232)

TSSNRKT
(SEQ ID NO: 232)
참고: DNA 표적 서열을 좌단 칼럼에 나타내었다. 나머지 칼럼은 각 징크핑거의 알파 나선 부분의 시작에 관한, 4개의 징크핑거 각각의 -1 에서 +6까지의 잔기의 아미노산 서열(한 문자 코드)을 나타낸다. 핑거 F1은 단백질의 아미노 말단부에 가장 근접해 있다.Note: The DNA target sequence is shown in the left column. The remaining columns represent the amino acid sequence (one-letter code) of residues from -1 to +6 of each of the four zinc fingers, with respect to the beginning of the alpha helical portion of each zinc finger. Finger F1 is closest to the amino end of the protein.

중국 햄스터 난소(CHO) 세포를 고정 배지(DMEM + 10% FBS와 2 mM L-글루타민 + 비필수 아미노산을 보충)에서 37℃로 배양하였다. 12-웰 플레이트 내에서 3 x 105 세포가 성장하여 70% 융합되었으며, 각각 100 ng의 두 융합 단백질-암호화 플라스미드로 임시 트랜스펙션(LipofectAMINE 2000®)시켰다. 트랜스펙션 24 시간 후, 20 μM 빈블라스틴을 성장 배지에 첨가하였다. 배지는 빈블라스틴 첨가 24 시간 후 교체되었다. 배지 교체 24 시간 후, 세포 DNA를 분리(키아젠)하였으며, 표적 부위를 둘러싼 DHFR 유전자 서열을 PCR로 증폭하였다. 프라이머는 야생형 DHFR 유전자를 함유한 세포의 DNA가 뉴클레오티드 쌍 증폭 산물을 산출하도록 설계되었다. 기대치 않게도, 두 증폭 산물을 획득하였는데, 하나는 기대한 크기였으며, 다른 하나는 약 150 뉴클레오티드 쌍보다 더 컸다.Chinese hamster ovary (CHO) cells were cultured at 37 ° C in fixed media (supplemented with DMEM + 10% FBS and 2 mM L-glutamine plus non-essential amino acids). It was fused to the 70% of 3 x 10 5 cells grown in 12-well plates, each of the two fusion proteins of 100 ng - were temporarily transfected into encryption plasmid (LipofectAMINE 2000 ®). Twenty-four hours after transfection, 20 [mu] M vinblastine was added to the growth medium. The medium was replaced after 24 h of addition of vinblastine. Twenty-four hours after the medium change, cell DNA was isolated (Kiagen), and the DHFR gene sequence surrounding the target site was amplified by PCR. The primers were designed so that the DNA of the cells containing the wild type DHFR gene produced the nucleotide pair amplification products. Unexpectedly, two amplification products were obtained, one of which was of the expected size and the other larger than about 150 nucleotide pairs.

절단 부위에 돌연변이가 유도되었는지 결정하기 위하여, 상기 증폭 산물을, 증폭 산물을 변성시키고 재변성시켜, 불합치-특이성 Cel-1 뉴클레아제로 처리하는 Cel-1 측정법을 사용하여 분석하였다. 예를 들면, Oleykowski et al. (1998) Nucleic Acids res. 26:4597-4602; Qui et al. (2004) BioTechniques 36:702-707; Yeung et al. (2005) BioTechniques 38:749-758를 참조할 것. Cel-1 측정법의 결과(도 52)는 절단 부위에서 비상동성 말단-결합의 결과인 서냉상동결합 산물 내의 작은 불합치가 첨가되어(도 52의 우단 열 내의 저분자량 밴드의 존재에 의하여 적시), 더 큰 삽입이 발생한다는 것을 보여준다(도 52의 3 및 5열 내의 "변이"로 지정된 고분자량 밴드의 존재에 의하여 적시). 더 큰 증폭 산물의 확실한 관찰은 전술하였다. To determine if a mutation was induced at the cleavage site, the amplification product was analyzed using the Cel-1 assay, denaturing and re-denaturing the amplification product and treating with an incompatible-specific Cel-1 nuclease. For example, Oleykowski et al . (1998) Nucleic Acids Res . 26: 4597-4602; Qui et al . (2004) BioTechniques 36: 702-707; Yeung et al . (2005) BioTechniques 38: 749-758. The results of the Cel-1 assay (Figure 52) show that the addition of a small affinity in the slow-cooling homologous conjugate product resulting from the non-homologous end-binding at the cleavage site (timely by the presence of low molecular weight bands in the rightmost column of Figure 52) Large insertions occur (timely by the presence of the high molecular weight band designated "mutation" in columns 3 and 5 of FIG. 52). Certain observations of larger amplification products have been described above.

삽입 특성을 특성화하기 위하여 전술한 두 증폭 산물뉴클레오티드 서열을 측정하였으며 도 53에 나타내었다. 최상행에 나타낸 서열(SEQ ID NO:233)은 야생형 DHFR 서열이며, 하부행에 나타낸 서열(SEQ ID NO:234)은 절단 부위에 157 bp의 삽입체 및 단일 뉴클레오티드 쌍의 결실체를 함유하는 DHFR 서열로 구성되어 있다. 추가의 분석에 의하여, 삽입된 157 염기 쌍이 징크핑거/FokI 융합 단백질을 암호화하는 벡터 플라스미드의 부분과 상응한다는 것을 알아내었다. 더욱이, 형광 메토트렉세이트의 흡수가 측정된 경우, 이러한 돌연변이를 함유한 세포는 야생형 CHO 세포에 비하여 53%의 평균 메토트렉세이트 흡수를 나타내는데 이는 유전자의 일 카피의 기능 상실과 일치한다.The nucleotide sequences of the two amplification products described above were measured to characterize the insertion characteristics and are shown in FIG. The sequence shown in the top row (SEQ ID NO: 233) is the wild type DHFR sequence and the sequence shown in the bottom row (SEQ ID NO: 234) contains a 157 bp insert at the cleavage site and a DHFR containing a single nucleotide pair Sequence. By further analysis, it was found that the inserted 157 base pair corresponded to the portion of the vector plasmid encoding the zinc finger / Fok I fusion protein. Moreover, when the absorption of fluorescent methotrexate was measured, cells containing these mutants exhibited an average methotrexate uptake of 53% compared to wild-type CHO cells, consistent with the loss of one copy of the gene.

따라서, 외래 벡터 서열의 표적화된 상동성-비의존 통합은 DHFR 유전자 내의 표적화된 절단 부위에서 발생하며, 이는 이형접합 DHFR 변이 셀라인의 발생의 결과이다.Thus, the targeted homology-independent integration of the foreign vector sequence occurs at the targeted cleavage site in the DHFR gene, which is the result of the occurrence of the heterozygous DHFR mutation cell line.

실시예 38: 내인성 유전자의 표적화된 절단 및 상동성-지정 수선을 위한 FokI 이량체 도메인 내의 다중 돌연변이 Example 38: Targeted cleavage and homology of endogenous genes - multiple mutations in the Fok I dimer domain for designated repair

추가 서열 변경이 실시예 5에서 기술한 돌연변이된 FokI 절단 하프-도메인 내로 도입되었으며, 여기서 잔기 490은 글루탐산에서 라이신(E490K)으로 전환되어, 이들의 절단 특이성을 추가로 향상시키는데 제공된다. 일 실시 태양에서(변이 X2), 아미노산 538은 이소로이신에서 라이신(I538K)으로 전환되었다. 다른 실시 태양에서, X2 변이의 아미노산 486은 글루타민에서 글루탐산(Q486E)으로 전환되어 X3A 변이를 생성하거나, 또는 글루타민에서 이소로이신(Q486I)으로 전환되어 X3B 변이를 생성하였다. E490K, X2, X3A 및 X3B 변이의 아미노산 서열을 야생형 FokI 절단 하프-도메인의 아미노산 서열에 대비하여 도 54에 나타내었다.Additional sequence changes were introduced into the mutated Fok I cleavage half-domain described in Example 5, wherein residue 490 was converted to lysine (E490K) in glutamic acid to further enhance their cleavage specificity. In one embodiment (mutation X2), amino acid 538 was converted from isoleucine to lysine (I538K). In another embodiment, the amino acid 486 of the X2 mutation was converted from glutamine to glutamic acid (Q486E) to produce the X3A mutation, or from glutamine to isoleucine (Q486I) to generate the X3B mutation. The amino acid sequences of the E490K, X2, X3A and X3B mutations are shown in Figure 54 against the amino acid sequence of the wild-type Fok I cleavage half-domain.

이러한 변이 절단 하프-도메인을 암호화하는 서열이 5-8G 및 5-9D 징크핑거 도메인을 암호화하는 서열과 융합된 플라스미드를 제조하였다(실시예 14 참조). 이러한 변이의 다양한 조합이 지닌 BsrBI 부위를 함유한 도너 DNA 서열의 존재 하에 IL-2Rγ 유전자의 엑손 5 내의 이중-가닥 파괴의 상동성-직접 복구를 자극하기 위한 능력에 대하여 측정하였다. 실시예 15에서 기술한 측정시스템 및 절차를 사용하였으며, 세포를 빈블라스틴 처리하지 않는 것을 제외하고, 20 유닛의 BsrBl를 절단을 위하여 사용하였다.Plasmids fused with sequences encoding these mutated truncated half-domains with sequences encoding 5-8G and 5-9D zinc finger domains were prepared (see Example 14). The ability of the IL-2R gamma gene to stimulate homology-direct repair of double-strand breaks in exon 5 in the presence of donor DNA sequences containing Bsr BI sites with various combinations of these mutations was determined. The measurement system and procedures described in Example 15 were used and 20 units of Bsr Bl were used for cleavage, except that the cells were not subjected to vinblastine treatment.

겔에 노출시키고 48시간 후에 포스포러이미저 스크린으로 판독하였고, RFLP-유도형 및 야생형 밴드의 강도를 이미지퀀트 소프트웨어(몰레큘러 다이나믹스)를 사용하여 정량화하였다. RFLP-유도형 밴드의 강도는 야생형 및 RFLP 밴드의 총 방사선의 백분율로 표 29에 나타내었다. 그 결과는 X3 FokI 변이가 자신의 2차 카피와 결합하는 경우에 비하여 Q486E 변이와 결합하는 경우에 현저하게 기능이 향상되었다는 사실을 나타낸다.Gel, read 48 hours later on a phosphor-imager screen, and the intensity of the RFLP-induced and wild-type bands was quantified using ImageQuant software (Molecular Dynamics). The intensity of the RFLP-induced bands is shown in Table 29 as a percentage of the total radiation in the wild-type and RFLP bands. The results indicate that the X3 Fok I mutation significantly improved function when combined with the Q486E mutation compared to its second mutation binding.

FokFok I 이량체 인터페이스I dimer interface ** 내의 돌연변이를 함유한 징크핑거/ Lt; RTI ID = 0.0 &gt; finger / FokFok I 융합 단백질을 사용한 내부 유전자의 상동성-직접 변형 Homology of internal genes using I fusion proteins - Direct mutation 샘플Sample 5-85-8 5-95-9 %CG% CG 1One WT(1 ug)WT (1 ug) WT(1 ug)WT (1 ug) 2.62.6 22 WT(2.5 ug)WT (2.5 ug) WT(2.5 ug)WT (2.5 ug) < 1<1 33 WT(5 ug)WT (5 ug) WT(5 ug)WT (5 ug) 1.51.5 44 WT(7.5 ug)WT (7.5 ug) WT(7.5 ug)WT (7.5 ug) < 1<1 55 X3(1 ug)X3 (1 [mu] g) Q486E(1 ug)Q486E (1 ug) 4.14.1 66 X3(2.5 ug)X3 (2.5 ug) Q486E(2.5 ug)Q486E (2.5 ug) 4.34.3 77 X3(5 ug)X3 (5 [mu] g) Q486E(5 ug)Q486E (5 ug) 8.68.6 88 X3(7.5 ug)X3 (7.5 ug) Q486E(7.5 ug)Q486E (7.5 ug) 3.63.6 99 X3(5 ug)X3 (5 [mu] g) X3(5 ug)X3 (5 [mu] g) 00 1010 Q486E(5 ug)Q486E (5 ug) Q486E(5 ug)Q486E (5 ug) 2.32.3 * K562 세포는 두 징크핑거/FokI 융합 단백질을 암호화하는 플라스미드 및 BsrBI 부위의 존재 결과 서열 변화가 발생한 IL-2Rγ 유전자의 엑손 5와 상동인 도너 DNA 서열을 함유한 플라스미드로 트랜스펙션되었다. 두번째 및 세번째 칼럼은 5-8 및 5-9 징크핑거 융합 단백질 내의 FokI 절단 하프-도메인의 특성을 다음과 같이 동정한다: WT (야생형 FokI 절단 하프-도메인); Q486E 변이 절단 하프-도메인 (실시예 5에서 기술한 야생형에 비하여 단일 아미노산 변화를 함유); X3 변이 절단 하프-도메인 (도 54에 나타낸 야생형에 비하여 3 개의 아미노산 변화를 함유). "%GC"는 총 증폭 산물의 분획을 나타내는데, 이는 BsrBI에 의하여 절단되며, BsrBl 절단 산물 내의 방사성으로 측정된다. * K562 cells were illustration two zinc finger / Fok I the presence of a plasmid and a Bsr BI site coding for the fusion protein resulting sequence changes occurred IL-2Rγ exon transfected with 5 and homologous to the donor plasmid containing the DNA sequence of the gene. The second and third columns identify the characteristics of the Fok I cleavage half-domain in 5-8 and 5-9 zinc finger fusion proteins as follows: WT (wild type Fok I cleavage half-domain); Q486E mutated cleavage half-domain (containing a single amino acid change relative to the wild type described in Example 5); X3 mutated truncation half-domain (containing three amino acid changes relative to the wild type shown in Figure 54). "% GC" represents the fraction of the total amplification product, which is cleaved by Bsr BI and measured by radioactivity in the Bsr Bl cleavage product.

실시예 39: 염색체 GFP 리포터 유전자 분석으로 시험된 Fok I 이량체화 도메인 내에 다중 돌연변이를 가진 징크핑거/FokI 융합 단백질 Example 39: A zinc finger / Fok I fusion protein with multiple mutations in the Fok I dimerization domain tested by chromosome GFP reporter gene analysis

FokI 절단 하프-도메인의 이량체화 인터페이스에 아미노산 서열 변경을 함유하는 징크핑거/FokI 융합 단백질(ZFN)의 상이한 조합들을 시험하기 위한 실험에서는 테트라시클린-조절 CMV 프로모터에 작동 연결된 염색체 통합된 돌연변이 eGFP 코딩 서열을 함유하는 실시예 29에 설명된 셀라인을 사용했다. 실시예 38 및 도 54를 참조한다. 실시예 13 및 도 32에서 이미 설명된 외래 도너 DNA 구성체는 야생형 eGFP 코딩 서열에 상동성인 1527 뉴클레오티드 쌍 삽입체를 함유했다. 이것은 하기 프라이머를 사용하여 eGFP 서열을 증폭시켜 구성하였다: In experiments to test different combinations of zinc finger / Fok I fusion protein (ZFN) containing amino acid sequence alterations at the dimerization interface of the Fok I cleavage half-domain, a chromosomal integrated mutant that is operably linked to a tetracycline-regulated CMV promoter The cell line described in Example 29 containing the eGFP coding sequence was used. See Example 38 and FIG. The exogenous donor DNA constructs already described in Example 13 and Figure 32 contained a 1527 nucleotide pair insert homologous to the wild-type eGFP coding sequence. This was constructed by amplifying the eGFP sequence using the following primers:

GFPnostart GGCGAGGAGCTGTTCAC (SEQ ID NO:235) GFPnostart GGCGAGGAGCTGTTCAC (SEQ ID NO: 235)

pcDNA42571 TGCATACTTCTGCCTGC (SEQ ID NO:236)pcDNA42571 TGCATACTTCTGCCTGC (SEQ ID NO: 236)

증폭 산물을 pCR4-TOPO 벡터로 토포 클로닝하여 도더 구성체를 생성하고, 이것을 pCR4-TOPO_GFPDonor_1.5KB로 표시했다. 이 도너 서열의 표적화 상동성-지정 통합은 돌연변이 염색체 eGFP 서열의 야생형 eGFP 서열로의 치환 및 기능적 eGFP의 독시시클린-유도성 발현을 가져올 것이다.The amplification product was topocloned with pCR4-TOPO vector to generate a dodder construct, which was designated pCR4-TOPO_GFPDonor_1.5KB. The targeting homology-directed integration of this donor sequence will result in the replacement of the mutant chromosome eGFP sequence with the wild-type eGFP sequence and the innoculatory-inducible expression of functional eGFP.

염색체 통합된 돌연변이 eGFP 서열(상기 설명된)을 함유하는 세포를 10% 우태혈청(FBS)(Hyclone) 및 2mM L-글루타민으로 보충되고 5% 이산화탄소 분위기 하에 37℃에서 유지된 듈베코 변성 이글 배지(DMEM)(Invitrogen)에서 성장시켰다. Opti -MEM I 감소 혈청 배지에서 LipofectAMINE 2000 시약(Invitrogen)을 사용하여 세포를 트랜스펙션했다. 세포를 ZFN만(각 5ng), 도너 플라스미드만(500ng)을 암호화하는 플라스미드, 또는 ZFN(각 5ng) + 도너 플라스미드(500ng)를 암호화하는로 트랜스펙션했다. 트랜스펙션 5시간 후에 성장배지에 2ng/mL 독시시클린(최종 농도)를 첨가하여 염색체 eGFP 코딩 서열의 발현을 활성화시켰다. 트랜스펙션 3일 후에 세포를 수집하고, 유세포분석에 의해 eGFP 발현을 분석했다. 표 30에 나타낸 결과는 이량체화 인터페이스에 돌연변이를 함유하는 융합 단백질이 상이한 절단 하프-도메인의 존재하에 상동성-지정 수선을 더욱 효과적으로 촉진하는 기능을 한다는 것을 나타내며, 이것은 이들의 동종이량체화의 경향이 더 적다는 것을 암시한다.Cells containing the chromosomal integrated mutant eGFP sequences (described above) were incubated in Dulbecco's modified Eagle's medium supplemented with 10% fetal calf serum (FBS) (Hyclone) and 2 mM L-glutamine and maintained at 37 [deg. DMEM) (Invitrogen). Cells were transfected using LipofectAMINE 2000 reagent (Invitrogen) in Opti-MEM I reduced serum medium. Cells were transfected with plasmids encoding ZFN alone (5 ng each), donor plasmid alone (500 ng), or ZFN (5 ng each) + donor plasmid (500 ng). After 5 hours of transfection, the growth medium was supplemented with 2 ng / mL doxycycline (final concentration) to activate the expression of the chromosomal eGFP coding sequence. Cells were harvested 3 days after transfection and eGFP expression was analyzed by flow cytometry. The results shown in Table 30 indicate that the fusion protein containing the mutation in the dimerization interface functions to more effectively promote homology-directed repair in the presence of different cleavage half-domains, which suggests that the trend of their homodimerization Is less.

FokFok I 이량체화 인터페이스에 돌연변이를 함유하는 징크핑거/I dimerization interface with a zinc finger / FokFok I 융합 단백질을 사용한 돌연변이 염색체 eGFP 유전자의 상동성-지정 변경*Homology of the mutant chromosome eGFP gene using the I fusion protein *
5-9↓

5-9 ↓
5-8:5-8: WTWT Q486EQ486E E490K E490K X2X2 X3AX3A X3BX3B WTWT 0.660.66 0.380.38 0.610.61 0.400.40 0.700.70 0.180.18 Q486EQ486E 0.260.26 0.140.14 0.540.54 0.530.53 0.500.50 0.230.23 E490KE490K 0.580.58 0.420.42 0.300.30 0.010.01 0.020.02 0.030.03 X2X2 0.140.14 0.550.55 0.070.07 0.010.01 0.010.01 0.010.01 X3AX3A 0.430.43 0.430.43 0.020.02 0.010.01 0.030.03 0.010.01 X3BX3B 0.190.19 0.330.33 0.060.06 0.020.02 0.030.03 0.020.02 * 세포는 도너 구성체 및 2개의 ZFN 발현 구성체로 트랜스펙션되었다: 하나는 FokI 절단 하프-도메인에 융합된 5-8 징크핑거 결합 도메인을 발현하고, 나머지 하나는 FokI 절단 하프-도메인에 융합된 5-9 징크핑거 결합 도메인을 발현한다. 5-8 징크핑거 결합 도메인에 융합된 절단 하프-도메인의 성질은 윗줄에 제공된다: 5-9 징크핑거 결합 도메인에 융합된 절단 하프-도메인의 성질은 맨 좌측 칼럼에 제공된다. 숫자는 시험된 각 ZFN 쌍에 대해 eGFP 형광을 나타내는 세포의 퍼센트를 표시한다.The cells were transfected with a donor construct and two ZFN expression constructs: one expressing the 5-8 zinc finger binding domain fused to the Fok I cleavage half-domain and the other expressing the 5-8 zinc finger binding domain fused to the Fok I cleavage half- RTI ID = 0.0 &gt; 5-9 &lt; / RTI &gt; zinc finger binding domain. The properties of the cleavage half-domain fused to the 5-8 zinc finger binding domain are provided in the upper row: The properties of the cleavage half-domain fused to the 5-9 zinc finger binding domain are provided in the leftmost column. The numbers represent the percentage of cells exhibiting eGFP fluorescence for each ZFN pair tested.

실시예 40: 내인성 CCR-5 유전자에 41-뉴클레오티드 외래 서열의 표적화 상동성-의존적 통합 Example 40: Targeting homologous-dependent integration of the 41-nucleotide foreign sequence into the endogenous CCR-5 gene

K562 세포의 성장 및 트랜스펙션을 실시예 32에 설명된 대로 수행했다. 세포를 2개의 징크핑거/FokI 융합 단백질(2A 펩티드 서열에 의해 분리된)을 암호화하는 구성체 2.5㎍ 및 도너 구성체(하기 참조) 50㎍으로 트랜스펙션했는데, 융합 단백질의 징크핑거 도메인(7568 및 7296)은 인간 CCR-5 유전자 내의 표적 부위와 결합하도록 디자인하였다. 징크핑거 도메인의 표적 부위(박스 표시)는 하기 나타낸 대로 5개의 뉴클레오티드 쌍에 의해 분리된다.Growth and transfection of K562 cells was performed as described in Example 32. [ Cells were transfected with 2.5 μg construct and 50 μg donor construct (see below) encoding two zinc finger / Fok I fusion proteins (separated by the 2A peptide sequence), the zinc finger domains of fusion proteins (7568 and 7296) was designed to bind to a target site in the human CCR-5 gene. The target site (box) of the zinc finger domain is separated by five nucleotide pairs as shown below.

20um에는 몇 dna ug ul

20um에는 몇 dna ug ul

표적 부위의 뉴클레오티드 서열, 및 징크핑거 도메인 인식 영역의 아미노산 서열을 표 31에 나타낸다.The nucleotide sequence of the target site and the amino acid sequence of the zinc finger domain recognition region are shown in Table 31.

인간 CCR-5 유전자를 위한 징크핑거 디자인Zinc finger design for human CCR-5 gene 표적 서열Target sequence F1F1 F2F2 F3F3 F4F4 GATGAGGATGAC
(SEQ ID NO:238)
GATGAGGATGAC
(SEQ ID NO: 238)
DRSNLSR
(SEQ ID NO:239)
DRSNLSR
(SEQ ID NO: 239)
TSANLSR
(SEQ ID NO:240)
TSANLSR
(SEQ ID NO: 240)
RSDNLAR
(SEQ ID NO:241)
RSDNLAR
(SEQ ID NO: 241)
TSANLSR
(SEQ ID NO:242)
TSANLSR
(SEQ ID NO: 242)
AAACTGCAAAAG
(SEQ ID NO:243)
AAACTGCAAAAG
(SEQ ID NO: 243)
RSDHLSE
(SEQ ID NO:244)
RSDHLSE
(SEQ ID NO: 244)
QNANRIT
(SEQ ID NO:245)
QNANRIT
(SEQ ID NO: 245)
RSDVLSE
(SEQ ID NO:246)
RSDVLSE
(SEQ ID NO: 246)
QRNHRTT
(SEQ ID NO:247
QRNHRTT
(SEQ ID NO: 247
주: DNA 표적 서열은 맨 좌측 칼럼에 나타낸다. 나머지 칼럼은 각 징크핑거의 알파-나선 부분의 시작과 관련하여, 4개의 징크핑거 각각의 잔기 -1에서 +6까지의 아미노산 서열(한 문자 코드로)을 나타낸다. 핑거 F1은 단백질의 아미노 말단에 가장 가까이 있다.Note: The DNA target sequence is shown in the leftmost column. The remaining columns represent the amino acid sequence (in one letter code) of residues -1 to +6 of each of the four zinc fingers, with respect to the start of the alpha-helical portion of each zinc finger. Finger F1 is closest to the amino terminus of the protein.

도너 DNA 분자는 제한효소 BglI에 대한 신규의 특징적 인식부위를 함유하는 41개 뉴클레오티드 쌍 서열 택을 함유하도록 조작된 인간 CDR-5 유전자의 약 2킬로 염기쌍 부분을 포함했다. 도너 분자는 XbaI 부위를 만들도록 CCR-5 유전자 단편을 돌연변이시키고, 이 XbaI 부위에 41-뉴클레오티드 택을 도입함으로써 구성하였다. 그 결과, 41-뉴클레오티드 택의 한쪽 측면에는 CCR-5 서열의 약 0.5킬로 염기쌍이, 그리고 다른 한쪽 측면에는 CCR-5 서열의 약 1.5킬로 염기쌍이 위치하게 되었다. 이 서열을 하기에 나타내며, 여기서 41-뉴클레오티드 쌍 택은 대문자로 표시하고, BglI 부위는 밑줄로 표시한다.The donor DNA molecule contained approximately 2 kilobase pairs of the engineered human CDR-5 gene to contain 41 nucleotide pair sequence tags containing a novel characteristic recognition site for restriction enzyme Bgl I. The donor molecule and the mutant CCR-5 gene segments to create a Xba I site, was constructed by introducing the nucleotide 41- chosen in the Xba I site. As a result, approximately 0.5 kilobase pairs of the CCR-5 sequence and approximately 1.5 kilobase pairs of the CCR-5 sequence were located on either side of the 41-nucleotide tag. This sequence is shown below, in which the 41-nucleotide pair is shown in upper case and the Bgl I site is underlined.

20um에는 몇 dna ug ul

20um에는 몇 dna ug ul

트랜스펙션 6일 후에 세포 DNA를 분리하여 실시예 32에 설명된 대로 증폭 주형으로서 사용한 다음 BglI로 분해하였다. 도너 구성체와 2개의 징크핑거/FokI 융합 단백질을 암호화하는 구성체로 트랜스펙션된 세포로부터의 DNA에서 증폭 산물의 약 1%가 BglI에 의해 절단되었는데, 이것이 바로 CCR-5 유전자에 서열 택이 삽입된 표시이다. 트랜스펙션되지 않은 세포로부터의 DNA, 도너 구성체로만 트랜스펙션된 세포, 및 2개의 징크핑거/FokI 융합 단백질을 암호화하는 구성체로만 트랜스펙션된 세포는 BglI에 의해 절단되는 증폭 산물을 산출하지 않았다. 이것은 이 41-뉴클레오티드 서열의 표적화 삽입이 CCR-5 유전자 내에 프레임시프트 돌연변이를 발생시키고, 이로써 HIV 수용체로서의 기능을 포함하여 그것의 유전자 기능을 불활성화한다는 것을 의미한다.Six days after transfection, the cellular DNA was isolated and used as an amplification template as described in Example 32 and then digested with Bgl I. Approximately 1% of the amplified product in the DNA from cells transfected with the construct encoding the donor construct and two zinc finger / Fok I fusion proteins was cleaved by Bgl I, indicating that the CCR- It is an inserted mark. Cells transfected only with DNA from untransfected cells, cells transfected only with donor constructs, and constructs encoding two zinc finger / Fok I fusion proteins yield amplification products cleaved by Bgl I Did not do it. This means that the targeted insertion of this 41-nucleotide sequence results in a frame shift mutation in the CCR-5 gene, thereby inactivating its gene function, including its function as an HIV receptor.

본 명세서에서 인용한 특허, 특허출원 및 간행물들은 모두 모든 목적을 위하여 그 전문이 본원에 참고자료로 포함된다.All patents, patent applications, and publications cited herein are hereby incorporated by reference in their entirety for all purposes.

이상에서 실시예를 들어 본 발명에 대해 상세하게 설명하였으나, 상기 실시예들은 본 발명의 이해를 위한 것일 뿐이며, 본 발명의 사상 및 범위에서 벗어남이 없이 다양한 수정 및 변형이 가능하다. 따라서, 상기 실시예는 본 발명의 범위를 제한하는 것으로 해석하지 않아야 한다.
While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, it is to be understood that the invention is not limited to the disclosed embodiments, but, on the contrary, is intended to cover various modifications and equivalent arrangements included within the spirit and scope of the appended claims. Therefore, the above embodiments should not be construed as limiting the scope of the present invention.