KR20000037116A - Insecticidal Protein Toxins from Photorhabdus - Google Patents

Insecticidal Protein Toxins from Photorhabdus Download PDF

Info

Publication number
KR20000037116A
KR20000037116A KR1019990701698A KR19997001698A KR20000037116A KR 20000037116 A KR20000037116 A KR 20000037116A KR 1019990701698 A KR1019990701698 A KR 1019990701698A KR 19997001698 A KR19997001698 A KR 19997001698A KR 20000037116 A KR20000037116 A KR 20000037116A
Authority
KR
South Korea
Prior art keywords
seq
protein
dna
toxin
culture
Prior art date
Application number
KR1019990701698A
Other languages
Korean (ko)
Inventor
제럴드 씨. 엔사인
데이비드 제이. 보웬
제임스 피텔
레이몬드 패틱
슈 쉬노버
리챠드 에이취. 프랜치-컨스탄트
토마스 에이. 로첼로
마이클 비. 블랙번
티모씨 디. 헤이
도날드 제이. 멜로
그레고리 엘. 오르
진 엘. 로버츠
제임스 에이. 스트릭랜드
라이닝 구오
토드 에이. 시체
키티스리 수카핀다
Original Assignee
케네쓰 엘. 로에르트셔
다우 아그로사이언시즈 엘엘씨
리차드 에이취 리저
위스콘신 얼럼나이 리서어치 화운데이션
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/US1996/018003 external-priority patent/WO1997017432A1/en
Application filed by 케네쓰 엘. 로에르트셔, 다우 아그로사이언시즈 엘엘씨, 리차드 에이취 리저, 위스콘신 얼럼나이 리서어치 화운데이션 filed Critical 케네쓰 엘. 로에르트셔
Publication of KR20000037116A publication Critical patent/KR20000037116A/en

Links

Classifications

    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/20Bacteria; Substances produced thereby or obtained therefrom
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/195Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01NPRESERVATION OF BODIES OF HUMANS OR ANIMALS OR PLANTS OR PARTS THEREOF; BIOCIDES, e.g. AS DISINFECTANTS, AS PESTICIDES OR AS HERBICIDES; PEST REPELLANTS OR ATTRACTANTS; PLANT GROWTH REGULATORS
    • A01N63/00Biocides, pest repellants or attractants, or plant growth regulators containing microorganisms, viruses, microbial fungi, animals or substances produced by, or obtained from, microorganisms, viruses, microbial fungi or animals, e.g. enzymes or fermentates
    • A01N63/50Isolated enzymes; Isolated proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Pest Control & Pesticides (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Virology (AREA)
  • Environmental Sciences (AREA)
  • Agronomy & Crop Science (AREA)
  • Dentistry (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Agricultural Chemicals And Associated Chemicals (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Pretreatment Of Seeds And Plants (AREA)

Abstract

PURPOSE: An easily administered insecticidal protein as well as the expression of toxin in a heterologous system, and a method for delivering insecticidal toxins that are functional active and effective against many orders of insects, are provided. CONSTITUTION: Native toxins are protein complexes that are produced and secreted by growing bacteria cells of the genus Photorhabdus, the proteins is produced by the species Photorhabdus luminescens. The protein complexes, with a molecular size of approximately 1,000 kDa, can be separated by SDS-PAGE gel analysis into numerous component proteins. The toxins contain no hemolysin, lipase, type C phospholipase, or nuclease activities. The toxins exhibit significant toxicity upon exposure administration to a number of insects.

Description

포토랍두스 유래의 살충 단백질 독소 {Insecticidal Protein Toxins from Photorhabdus}Insecticidal Protein Toxins from Photorhabdus}

관련 출원Related Applications

본 출원은 1993년 5월 18일 출원된 미국 특허출원 제08/063,615호의 계속출원인 1995년 2월 28일 출원된 미국 특허출원 제08/395,947호의 계속출원인 1996년 2월 28일 출원된 미국 특허출원 제08/608,423호의 계속출원인 1996년 8월 28일 출원된 미국 특허출원 제08/705,484호의 계속출원인 1999년 11월 6일 출원된 미국 특허출원 제08/743,699호의 계속출원이다. 본 출원은 또한 1995년 11월 6일 출원된 가출원인 미국 특허출원 제60/007,255호의 계속출원이다.This application is a US patent application filed on Feb. 28, 1996, filed February 28, 1993, filed on Feb. 28, 1993, filed on Feb. 28, 1995, filed on Feb. 28, 1995, filed on Feb. 28, 1995. Continuing application of US patent application Ser. No. 08 / 743,699, filed Nov. 6, 1999, filed Continuing Application of U.S. Patent Application No. 08 / 705,484, filed Aug. 28, 1996, filed 08 / 608,423. This application is also a continuation of US Provisional Application No. 60 / 007,255, filed Nov. 6, 1995.

많은 곤충들이 주택소유자, 소풍객, 정원사 및 농부, 및 종종 밭작물에 대한 곤충 피해의 결과로 파괴되거나 감소되는 농산물에 투자하는 사람들에게 광범위하게 해충으로 여겨진다. 특히, 재배철이 짧은 지역에서는, 상당한 곤충 피해는 재배자에게 모든 이익의 손실을 의미하고 농작물 수확의 극적인 감소를 의미할 수 있다. 특정 농산물의 공급이 부족하면, 반드시 식품 가공업자들이 더 높은 비용을 치르고, 따라서 식용 식물 및 그러한 식물로부터 얻은 생산물의 궁극적인 소비자까지 더 높은 비용을 치러야 한다.Many insects are widely considered pests to homeowners, picnickers, gardeners and farmers, and those who invest in agricultural products that are often destroyed or reduced as a result of insect damage to field crops. In particular, in areas with short growing seasons, significant insect damage can mean a loss of all profits to growers and a dramatic reduction in crop harvest. If there is a shortage of certain agricultural supplies, food processors must pay higher costs, and therefore higher costs for edible plants and ultimate consumers of the products obtained from those plants.

농작물 및 화훼에 대한 곤충 피해를 방지하고 곤충 해충의 폐해를 제거하는 것은 전형적으로 광범위한 독성을 갖는 강한 유기 살해충제 및 살충제에 의존해왔다. 이들 합성 제품은 환경과 그러한 약제에 노출되는 사람에게 너무 해로우므로 일반 대중에 의해 공격을 받게 되었다. 유사하게, 비경작 환경에서, 주택소유자는 그들의 가정 또는 야외 식사에서 곤충을 죽일 필요없이 곤충을 피하는 것에만 만족할 수 있다.The prevention of insect damage to crops and flowers and the elimination of insect pest pests has typically relied on strong organic pesticides and insecticides with a wide range of toxicity. These synthetic products are so harmful to the environment and to people exposed to such drugs that they have been attacked by the general public. Similarly, in a non-cultivated environment homeowners may be content only with avoiding insects without having to kill them in their home or outdoor meals.

화학 살충제의 광범위한 사용은 농부, 살충제를 생산하는 회사, 정부 기관, 공공 이익 단체 및 일반적인 대중의 환경 및 건강에 대한 관심을 증가시켰다. 환경에 대한 사회적인 관심 및 곤충 관리의 메카니즘을 개발하는 생물학적 도구의 개발에 의해 덜 침해적인 곤충 관리 방법의 개발이 자극되었다. 생물학적 방제제가 화학 살충제에 대한 유망한 대체물로 제시된다.The widespread use of chemical pesticides has increased interest in the environment and health of farmers, companies producing pesticides, government agencies, public interest groups and the general public. The development of less invasive insect management methods has been stimulated by the social concern for the environment and the development of biological tools that develop mechanisms of insect management. Biological control agents are suggested as promising substitutes for chemical pesticides.

각각의 진화 발전 단계에서 생물체는 그들 자신의 성공 및 생존을 강화시키기 위한 수단을 발견하였다. 방어 및 공격의 도구로서의 생물학적 분자의 사용이 동물계 및 식물계 전체를 통하여 공지되어 있다. 또한, 유전 공학의 상대적으로 새로운 도구에 의해 생물학적 살충제를 변형하여 특정한 문제에 대한 특정한 해결을 성취할 수 있게 되었다.At each stage of evolutionary development, the creatures found a means to enhance their own success and survival. The use of biological molecules as a tool of defense and attack is known throughout the animal and plant kingdoms. In addition, relatively new tools in genetic engineering have made it possible to modify biological pesticides to achieve specific solutions to specific problems.

그러한 약제 중 하나인 바실루스 터린기엔시스(Bt: Bacillus thuringiensis)는 유효한 살충제로 상업적으로 널리 사용된다. 실제로, Bt 박테리아의 살충제는 그러한 제한된 독성을 갖는 단백질이며, 수확기에도 사람의 식용 작물에 사용될 수 있다. 비표적의 생물체에 대해, Bt 독소는 소화가능한 비독성 단백질이다.One such agent, Bacillus thuringiensis (Bt), is widely used commercially as an effective insecticide. Indeed, insecticides of Bt bacteria are proteins with such limited toxicity and can be used in human edible crops even at harvest time. For nontarget organisms, Bt toxins are digestible nontoxic proteins.

다른 공지된 종류의 생물학적 곤충 방제제는 살충 박테리아 공생자에 대해 전달 벡터로 공지된 특정한 속의 선충류이다. 살충성 박테리아를 포함하는 선충류는 곤충의 유충을 공격한다. 이어서, 박테리아가 유충을 죽인다. 선충류는 유충의 시체에서 번식한다. 이어서, 선충류 후대는 내부로부터 시체를 먹는다. 이어서, 이렇게 생산된 박테리아 함유 선충류 후대는 또 다른 유충을 공격할 수 있다.Another known class of biological insect control agents is nematodes of a particular genus known as transfer vectors for pesticidal bacterial commensals. Nematodes, including insecticidal bacteria, attack insect larvae. The bacteria then kill the larvae. Nematodes multiply in the larva's body. Subsequently, the nematode progeny eat the carcass from the inside. The bacterial containing nematode progenitors can then attack another larva.

과거에는, 스테인너네마 (Steinernema) 속 및 헤테로랍디티스 (Heterorhabditis) 속의 살충성 선충류가 곤충 방제제로서 사용되었다. 명백하게, 이들 속의 선충류는 각각 특정 종의 박테리아를 숙주로 한다. 헤테로랍디티스 속의 선충류에서, 공생 박테리아는 포토랍두스 루미네센스이다.In the past, insecticidal nematodes of the genus Steinernema and Heterorhabditis have been used as insect control agents. Obviously, nematodes in these genera are each host to bacteria of a particular species. In the nematodes of the genus Helobaltis, the symbiotic bacterium is photoractose luminescence.

이들 선충류가 곤충 방제제로서 유효하지만, 현재 곤충 방제용 선충류를 생산하고 유지하고 분배시키는 것은 어렵고, 고가이며 비효율적이다.While these nematodes are effective as insect control agents, it is presently difficult, expensive and inefficient to produce, maintain and distribute insect control nematodes.

나비목 및 딱정벌레목 곤충의 유충에 주사되는 경우에만 활성을 갖는 포토랍두스 루미네센스로부터 살충성 독소를 단리할 수 있음이 당업계에 공지되어 있다. 이로인해, 선충류 또는 그의 박테리아 공생자의 살충 특성을 효과적으로 개발할 수 없었다. 전달후에 그의 생물학적 특성을 보유할, 살충성 독소의 더 실용적이고, 덜 노동집약적인 광범위한 전달 방법이 유용할 것이다. 포토랍두스 속에 의해 생산된 경구 활성을 갖는 독소를 발견하는 것이 매우 요망되었다. 효능의 이유로 이들 독소의 단리 및 사용이 요망되었다. 본 출원인의 발명에 와서야, 이들 독소가 단리되고 특성화되었다.It is known in the art that it is possible to isolate insecticidal toxins from photolapus luminescence which is active only when injected into the larvae of Lepidoptera and Coleoptera insects. This prevented the effective development of the insecticidal properties of the nematode or its bacterial symbiosis. A more practical, less labor intensive, widespread method of delivery of pesticidal toxins that will retain their biological properties after delivery would be useful. It was highly desirable to find toxins having oral activity produced by the genus Photorapdus. Isolation and use of these toxins has been desired for reasons of efficacy. It was only by the applicant's invention that these toxins were isolated and characterized.

〈발명의 요약〉<Summary of invention>

천연 독소는 포토랍두스 속의 성장하는 박테리아 세포에 의해 생산되고 분비되는 단백질 복합체이며, 관심있는 것은 포토랍두스 루미네센스 종에 의해 생산된 단백질이다. 약 1,000 kDa의 분자 크기를 갖는 단백질 복합체를 SDS-PAGE 겔 분석에 의해 많은 성분 단백질로 분리할 수 있다. 독소는 헤몰리신, 리파제, 유형 C 포스포리파제 또는 뉴클레아제 활성을 갖지 않는다. 독소는 많은 곤충에 노출 투여시에 상당한 독성을 나타낸다.Natural toxins are protein complexes produced and secreted by the growing bacterial cells of the genus Photorapdus, and of interest are proteins produced by the photolapus luminescence species. Protein complexes having a molecular size of about 1,000 kDa can be separated into many component proteins by SDS-PAGE gel analysis. The toxin does not have hemolysin, lipase, type C phospholipase or nuclease activity. Toxins show significant toxicity upon exposure to many insects.

본 발명은 쉽게 투여되는 살충성 단백질 뿐만 아니라 이종계내에서의 독소의 발현을 제공한다.The present invention provides expression of toxins in heterologous systems as well as easily administered pesticidal proteins.

본 발명은 또한 많은 목의 곤충에 대하여 작용 활성이고 유효한 살충성 독소를 전달하기 위한 방법을 제공한다.The present invention also provides a method for delivering functionally active and effective insecticidal toxins against many neck insects.

본 발명의 목적, 이점 및 특징은 하기 상세한 설명으로부터 명백해질 것이다.The objects, advantages and features of the present invention will become apparent from the following detailed description.

본 발명은 박테리아로부터 단리된 독소 및 살충제로서의 그의 용도에 관한 것이다.The present invention relates to toxins isolated from bacteria and their use as insecticides.

도 1은 본 발명의 독소를 위한 서열 유전자의 일부로서 사용된 한 쌍의 클론된 DNA 단리물의 도면이다.1 is a diagram of a pair of cloned DNA isolates used as part of a sequence gene for toxins of the invention.

도 2는 시퀀싱 방법에서 사용된 3개의 플라스미드의 지도이다.2 is a map of three plasmids used in the sequencing method.

도 3은 몇몇 부분 DNA 단편의 내부-관계를 도시하는 지도이다.3 is a map showing the internal-relationships of several partial DNA fragments.

도 4는 TcbAii및 TcaBii단백질들의 단백질 서열 사이의 상동성 분석의 도면이다.4 is a diagram of homology analysis between protein sequences of TcbA ii and TcaB ii proteins.

도 5는 포토랍두스 균주의 페노그램(phenogram)이다. 포토랍두스 균주의 관계는 rep-PCR에 의해 정의된다. 도 5의 상부축은 rep-PCR 생성물의 스코어링 (scoring)을 기준으로한 균주의 % 유사성을 측정한다(즉, 0.0 [유사성 없음] 내지 1.0 [100% 유사성]). 오른쪽 축에서, 숫자 및 문자는 시험된 다양한 균주를 나타낸다:14=W-14, Hm=Hm, H9=H9, 7=WX-7, 1=WX-1, 2=WX-2, 88=HP88, NC-1=NC-1, 4=WX-4, 9=WX-9, 8=WX-8, 10=WX-10, WIR=WIR, 3=WX-3, 11=WX-11, 5=WX-5, 6=WX-6, 12=WX-12, 14=WX-14, 15=WX-15, Hb=Hb, B2=B2, 48 내지 52=ATCC 43948 내지 ATCC 43952. 수평선을 분리하는 수직선은 수평선의 기부에서 균주 또는 균주의 군 사이의 상관도(상부축과의 수직선의 외삽 교차점을 읽음)를 나타낸다(예를 들면, 균주 W-14는 균주 H9 및 Hm에 대해 약 60% 유사하다).FIG. 5 is a phenogram of the Photolapdus strain. FIG. The relationship of the photolapidus strain is defined by rep-PCR. The upper axis of FIG. 5 measures the% similarity of the strains based on scoring of the rep-PCR product (ie 0.0 [no similarity] to 1.0 [100% similarity]). On the right axis, numbers and letters represent the various strains tested: 14 = W-14, Hm = Hm, H9 = H9, 7 = WX-7, 1 = WX-1, 2 = WX-2, 88 = HP88 , NC-1 = NC-1, 4 = WX-4, 9 = WX-9, 8 = WX-8, 10 = WX-10, WIR = WIR, 3 = WX-3, 11 = WX-11, 5 = WX-5, 6 = WX-6, 12 = WX-12, 14 = WX-14, 15 = WX-15, Hb = Hb, B2 = B2, 48 to 52 = ATCC 43948 to ATCC 43952. The vertical line represents the correlation between the groups of strains or groups of strains at the base of the horizontal line (reading the extrapolated intersection of the vertical lines with the upper axis) (eg, strain W-14 is about 60% similar for strains H9 and Hm). Do).

도 6은 W-14 균주의 게놈 지도의 도면이다.6 is a diagram of a genomic map of the W-14 strain.

도 6A는 tca 및 tcb 좌위 및 주 유전자 산물을 나타낸다.6A shows tca and tcb loci and main gene products.

도 7은 rep-PCR에 의해 정의된 것과 같은 포토랍두스 균주의 페노그램 (phenogram)이다. 도 7의 상부축은 rep-PCR 생성물의 스코어링 (scoring)을 기준으로한 균주의 % 유사성을 나타낸다(즉, 0.0 [유사성 없음] 내지 1.0 [100% 유사성]). 오른쪽 축에서, 숫자 및 문자는 시험된 다양한 균주를 나타낸다. 수평선을 분리하는 수직선은 수평선의 기부에서 균주 또는 균주의 군 사이의 상관도(상부축과의 수직선의 외삽 교차점을 읽음)를 나타낸다(예를 들면, 균주 인디커스는 균주 MP1 및 HB 오스웨고에 대해 약 30% 유사하다). 페노그램상의 포토랍두스 균주는 다음과 같다: 14=W-14, Hm=Hm, H9=H9, 7=WX-7, 1=WX-1, 2=WX-2, 88=HP88, NC1=NC-1, 4=WX-4, 9=WX-9, 8=WX-8, 10=WX-10, 30=W30, WIR=WIR, 3=WX-3, 11=WX-11, 5=WX-5, 6=WX-6, 12=WX-12, 15=WX-15, 14=WX-14, Hb=Hb, B2=B2, 48=ATCC 43948, 49=ATCC 43949, 50=ATCC 43950, 51=ATCC 43951, 52=ATCC 43952.FIG. 7 is a phenogram of Photorabdus strain as defined by rep-PCR. The upper axis in FIG. 7 shows the% similarity of the strains based on scoring of the rep-PCR product (ie 0.0 [no similarity] to 1.0 [100% similarity]). In the right axis, numbers and letters represent the various strains tested. The vertical line separating the horizontal line represents the correlation between the group of strains or strains at the base of the horizontal line (reading the extrapolated intersection of the vertical lines with the upper axis) (for example, strain indices for strains MP1 and HB Oswego). About 30% similar). The photolabose strains on the phenogram are as follows: 14 = W-14, Hm = Hm, H9 = H9, 7 = WX-7, 1 = WX-1, 2 = WX-2, 88 = HP88, NC1 = NC-1, 4 = WX-4, 9 = WX-9, 8 = WX-8, 10 = WX-10, 30 = W30, WIR = WIR, 3 = WX-3, 11 = WX-11, 5 = WX-5, 6 = WX-6, 12 = WX-12, 15 = WX-15, 14 = WX-14, Hb = Hb, B2 = B2, 48 = ATCC 43948, 49 = ATCC 43949, 50 = ATCC 43950 , 51 = ATCC 43951, 52 = ATCC 43952.

본 발명은 곤충에 대해 경구 독성을 갖는 포토랍두스 속 유래의 독특한 종류의 살충 단백질 독소의 발견에 관한 것이다. 포토랍두스의 독특한 특성은 그의 생물발광이다. 포토랍두스는 다양한 공급원으로부터 단리될 수 있다. 그러한 공급원 중 하나는 선충류, 더 특히 헤테로랍디티스 속의 선충류이다. 그러한 공급원 중 다른 하나는 상처로부터의 사람 임상 샘플이다(파머 등의 문헌[Farmer 등, 1989, J. Clin, Microbiol. 27, pp 1594-1600]을 참조하시오). 이들 부패 균주는 아메리칸 타입 컬쳐 컬렉션[American Type Culture Collection(Rockville, MD)]에서 ATCC# 43948, 43949, 43950, 43951, 및 43952로서 기탁되어 있고, 본원에서 참고로 포함하였다. 다른 공급원이 살충성 독소를 생산하는 포토랍두스 박테리아를 포함할 수 있다. 그러한 공급원의 환경은 육상이거나 수상일 수 있다.The present invention relates to the discovery of a unique class of pesticidal protein toxins from the genus Photorapdus that have oral toxicity against insects. The unique characteristic of Photorabdus is his bioluminescence. Photolabdus can be isolated from a variety of sources. One such source is a nematode, more particularly a nematode of the genus heterolapidis. Another such source is human clinical samples from wounds (see Farmer et al., 1989, J. Clin, Microbiol. 27, pp 1594-1600). These decay strains have been deposited as ATCC # 43948, 43949, 43950, 43951, and 43952 in the American Type Culture Collection (Rockville, MD) and are incorporated herein by reference. Other sources may include photolabose bacteria that produce insecticidal toxins. The environment of such sources can be terrestrial or aquatic.

상기 포토랍두스 속은 분류학적으로 엔테로박테리아세애 (Enterobacteriaceae) 과로 정의되지만, 이 과의 비전형적인 특정 특성을 갖는다. 예를 들면, 이 속의 균주는 질산염 환원 음성이고, 황색 및 적색 안료를 생산하며 생물발광성이다. 반면, 후자의 특성은 엔테로박테리아세애 내에서는 공지되어 있지 않다. 포토랍두스는 최근에 와서야 제노랍두스 (Xenorhabdus)로부터 분리된 속으로서 설명되었다 (Boemare 등, 1993, Int. J. Syst. Bacteriol. 43, 249-255). 이러한 구별은 DNA-DNA 하이브리드화 연구, 표현형의 차이 (예를 들면, 카탈라제 및 생물발광의 존재(포토랍두스) 또는 부재(제노랍두스)), 및 선충류 숙주의 과 (제노랍두스: 스테이너네마티대 (Steinernematidae), 포토랍두스: 헤테로랍디티대 (Heterorhabditidae))를 기준으로 한다. 세포질 지방산의 비교 분석(Janse 등, 1990, Lett. Appl. Microbiol. 10, 131-135: Suzuki 등, 1990, J. Gen. Appl. Microbiol., 36, 393-401)은 제노랍두스로부터 포토랍두스의 구별을 지지한다.The genus Photolapus is taxonomically defined as the Enterobacteriaceae family, but has atypical specific properties. For example, strains of this genus are nitrate reduction negative, produce yellow and red pigments and are bioluminescent. On the other hand, the latter property is not known within Enterobacteriaceae. Photorabdus was only recently described as a genus separated from Xenorhabdus (Boemare et al., 1993, Int. J. Syst. Bacteriol. 43, 249-255). This distinction is due to DNA-DNA hybridization studies, differences in phenotypes (eg, the presence or absence of catalase and bioluminescence (photorabdus) or absence (xenorabdus), and the family of nematode hosts (Xenorabdus: Steiner). Steinernematidae, Photorabdus: Heterorhabditidae. Comparative analysis of cytoplasmic fatty acids (Janse et al., 1990, Lett. Appl. Microbiol. 10, 131-135: Suzuki et al., 1990, J. Gen. Appl. Microbiol., 36, 393-401) was performed by Genolabdus. Support Doo's distinction.

본원에 개시된 균주 컬렉션이 포토랍두스 균주로 이루어짐을 확정하기 위해, 균주를 포토랍두스를 정의하는 인식된 특성을 기준으로 특성화하고, 그를 다른 엔테로박테리아세애 및 제노랍두스 종으로부터 구별하였다. (Farmer, 1984, Bergey's Manual of Systemic Bacteriology, Vol.1, pp.510-511; Akhurst 및 Boemere 1988, J. Gen. Microbiol. 134, pp 1835-1845; Boemare 등, 1993, Int. J. Syst. Bacteriol. 43, pp 249-255, 본원에서 참고로 인용함). 연구된 특성은 하기와 같다: 그람 염색 음성 간균, 생물체 크기, 콜로니 색소형성, 봉입체, 카탈라제의 존재, 질산염 환원 능력, 생물발광, 염료 업테이크, 젤라틴 가수분해, 선택 배지 상의 성장, 성장 온도, 혐기 조건하의 생존 및 운동성. 지방산 분석은 본원의 균주가 모두 하나의 포토랍두스 속에 속함을 확정하기 위해 사용되었다.In order to confirm that the strain collections disclosed herein consist of Photolabduus strains, the strains were characterized based on the recognized properties defining Photorabdus and distinguished them from other Enterobacteriaceae and Genorabdus species. (Farmer, 1984, Bergey's Manual of Systemic Bacteriology, Vol. 1, pp. 510-511; Akhurst and Boemere 1988, J. Gen. Microbiol. 134, pp 1835-1845; Boemare et al., 1993, Int. J. Syst. Bacteriol. 43, pp 249-255, incorporated herein by reference). The properties studied were as follows: Gram staining negative bacilli, organism size, colony pigmentation, inclusion bodies, the presence of catalase, nitrate reducing ability, bioluminescence, dye uptake, gelatin hydrolysis, growth on selective media, growth temperature, anaerobic Survival and motility under conditions. Fatty acid analysis was used to confirm that all of the strains herein belonged to one photolapidus.

현재, 박테리아 포토랍두스 속은 하나의 정의된 종인 포토랍두스 루미네센스 (ATCC 유형 균주 #29999, Poinar 등, 1977, Nematologica 23, 97-102)로 이루어진다. 다양한 관련 균주가 문헌에 기재되어 있다(예를 들면, Akhurst 등, 1988, J. Gen. Microbiol., 134, 1835-1845; Boemare 등, 1993, Int. J. Syst. Bacteriol. 43 pp. 249-255; Putz 등, 1990, Appl. Environ. Microbiol., 56, 181-186). 본원에서 많은 포토랍두스 균주를 특성화하였다. 그러한 균주를 실시예에서 표 18에 나열하였다. 현재 포토랍두스 속에 한 종(루미네센스)만이 정의되었으므로, 본원에서 균주를 특성화하기 위해 루미네센스 종의 특성을 사용하였다. 도 5에서 알 수 있는 바와 같이, 이들 균주는 매우 다양하다. 미래에, 루미네센스 종의 일부 속성 뿐만 아니라, 포토랍두스 루미네센스의 특성으로 현재에는 정의되지 않은 일부 다른 특성을 갖는 다른 포토랍두스 종이 있을 수 있음을 예측할 수 있다. 그러나, 본원에서 본 발명의 범위는 다른 특성 및 특성화를 고려하지 않고, 곤충 방제제로서 작용 활성을 갖는 단백질을 생산하는 모든 포토랍두스 종 또는 균주이다.Currently, the bacterial photorapdus genus consists of one defined species, photolapus luminescence (ATCC type strain # 29999, Poinar et al., 1977, Nematologica 23, 97-102). Various related strains are described in the literature (see, eg, Akhurst et al., 1988, J. Gen. Microbiol., 134, 1835-1845; Boemare et al., 1993, Int. J. Syst. Bacteriol. 43 pp. 249- 255; Putz et al., 1990, Appl. Environ.Microbiol., 56, 181-186). Many of the photolabose strains have been characterized herein. Such strains are listed in Table 18 in the Examples. Since only one species (luminescence) has been defined in the genus Photolapus at present, the properties of the luminescence species have been used herein to characterize the strain. As can be seen in Figure 5, these strains are very diverse. In the future, it can be predicted that not only some properties of the luminescence species, but also other photolabduus species may have some other properties not currently defined by the properties of photolabduus luminescence. However, the scope of the present invention herein is any photolabduus species or strain that produces a protein having functional activity as an insect control agent without considering other properties and characterizations.

또한, 본원에서 증명된 바와 같이, 포토랍두스 속의 박테리아는 본원에서 정의된 작용 활성을 갖는 단백질을 생산한다. 포토랍두스 루미네센스 종에 의해 생산된 단백질에 특히 관심을 둔다. 본 발명은 본원에 개시된 균주로 제한되지 않아야 한다. 이들 균주는 처음으로 포토랍두스의 다양한 단리물에 의해 생산된 단백질이 곤충에 노출시에 유독함을 설명한다. 따라서, 본원에 열거된 균주 및 그의 임의의 돌연변이체 뿐만 아니라, 본원에 설명된 작용 활성을 갖는 포토랍두스 속의 임의의 균주 또는 종이 본원에서 설명된 본 발명에 포함된다.In addition, as demonstrated herein, bacteria of the genus Photorapdus produce proteins with the functional activity defined herein. Of particular interest is the protein produced by the photolapid luminescence species. The invention should not be limited to the strains disclosed herein. These strains demonstrate for the first time that the proteins produced by the various isolates of photolabose are toxic upon exposure to insects. Thus, the strains listed herein and any mutants thereof, as well as any strain or species of the genus Photorapdus having the functional activity described herein, are included in the invention described herein.

본원에서 사용된 몇몇 용어는 하기와 같은 특정한 의미를 갖는다:Some terms used herein have the following specific meanings:

"작용 활성"은 본원에서 단백질 독소가 단백질이 경구적으로 활성인 곤충 방제제로서 작용하거나, 독성 효과를 갖거나, 음식 섭취를 방해하거나 중단시킬 수 있어, 곤충의 죽음을 유발시킬 수 있거나 유발시킬 수 없는 것을 의미한다. 곤충이 유전자전환 식물의 발현, 제형화된 단백질 조성물(들), 분무가능한 단백질 조성물(들), 미끼 매트릭스 또는 다른 전달계에 의해 전달된 독소의 유효량에 접촉하는 경우, 전형적으로 곤충의 죽음을 야기하거나, 곤충이 곤충에 대해 독소를 이용가능하게 하는 공급원을 섭취하지 못하게 한다."Agonistic activity" as used herein means that a protein toxin may act as an orally active insect control agent, have a toxic effect, interfere with or disrupt food intake, and may cause or cause death of an insect. It means you can't. When an insect comes into contact with an effective amount of toxin delivered by expression of the transgenic plant, formulated protein composition (s), sprayable protein composition (s), bait matrix or other delivery system, typically it causes death of the insect or This prevents insects from ingesting sources that make toxins available to insects.

본원에서 용어 "유전 물질"의 사용은 모든 유전자, 핵산, DNA 및 RNA를 포함하는 것을 의미한다.The use of the term "genetic material" herein is meant to include all genes, nucleic acids, DNA and RNA.

본원에서 용어 "상동체"는 대조 W-14 독소 폴리펩티드 아미노산 서열에 대한 상동성을 갖는 것으로 식별된 아미노산 서열을 의미한다.The term “homolog” herein refers to an amino acid sequence that has been identified as having homology to the control W-14 toxin polypeptide amino acid sequence.

본원에서 용어 "상동성"은 B10sum 62 단백질 스코어링 매트릭스 (위스콘신 패키지 버젼 9.0, 제너틱 컴퓨터 그룹 (GCG), 위스콘신주 매디슨)를 사용한 GAP 알고리듬을 사용하여 측정하였을 경우 대조 W-14 독소 폴리펩티드 아미노산 서열에 대하여 33 % 이상의 유사성 지수 및(또는) 26 % 이상의 동일성 지수를 갖는 아미노산 서열을 의미한다.The term “homology” herein refers to a control W-14 toxin polypeptide amino acid sequence as measured using the GAP algorithm using the B10sum 62 protein scoring matrix (Wisconsin Package Version 9.0, Genetic Computer Group (GCG), Madison, Wisconsin). An amino acid sequence having a similarity index of at least 33% and / or at least 26% of an identity.

본원에서 용어 "동일성"은 GAP 알고리듬에 의한 대조 W-14 독소 폴리펩티드 아미노산 서열의 정열 이후에 소정의 위치에서 동일한 잔기를 함유하는 아미노산 서열을 의미한다.The term “identity” herein refers to an amino acid sequence containing the same residue at a given position after alignment of the control W-14 toxin polypeptide amino acid sequence by the GAP algorithm.

본원에서 논의된 단백질 독소는 전형적으로 "살충제"로서 지칭된다. 살충제는 본원에서 단백질 독소가 본원에서 더욱 설명될 바와 같은 "작용 활성"을 갖고 곤충 방제제로서 사용되는 것을 의미한다.Protein toxins discussed herein are typically referred to as "pesticides." Pesticides herein means that the protein toxin has a "functional activity" as described further herein and is used as an insect control agent.

용어 "올리고뉴클레오티드"의 사용은 RNA 또는 DNA의 뉴클레오티드의 짧은 사슬로 이루어진 거대분자를 의미한다. 그러한 길이는 적어도 하나의 뉴클레오티드일 수 있지만, 전형적으로 약 10 내지 약 12개의 뉴클레오티드의 범위내에 있다. 올리고뉴클레오티드의 길이의 측정은 숙련인의 기술 범위내에 잘 알려져 있고, 본원에서 제한되지 않는다. 따라서, 올리고뉴클레오티드는 10개 미만이거나 12개 이상일 수 있다.The use of the term "oligonucleotide" refers to a macromolecule consisting of short chains of nucleotides of RNA or DNA. Such length may be at least one nucleotide, but is typically in the range of about 10 to about 12 nucleotides. Measurement of the length of an oligonucleotide is well known within the skill of the art and is not limited herein. Thus, oligonucleotides may be less than 10 or more than 12.

용어 "포토랍두스 독소"는 곤충에 대해 작용 활성을 갖는 포토랍두스 미생물 균주에 의해 생산된 임의의 단백질을 의미하며, 포토랍두스 독소는 분무가능한 조성물로 제형화되거나, 유전자전환 식물에 의해 발현되거나, 미끼 매트릭스로서 제형화되거나, 바쿨로바이러스를 통해 전달되거나, 임의의 다른 이용가능한 숙주 또는 전달계에 의해 전달될 수 있다.The term “photolapus toxin” refers to any protein produced by a photolabose microbial strain that has agonistic activity against insects, wherein photolapus toxin is formulated in a sprayable composition or expressed by a transgenic plant It may be formulated as a bait matrix, delivered via baculovirus, or delivered by any other available host or delivery system.

본원에서 용어 "유독" 또는 "독성"의 사용은 포토랍두스에 의해 생산된 독소가 본원에서 정의된 바와 같은 "작용 활성"을 갖는 것을 의미한다.The use of the term "toxic" or "toxic" herein means that the toxin produced by Photorabdus has "functional activity" as defined herein.

본원에서 용어 "절단 (truncated) 펩티드"는 작용 활성을 갖는 것으로 관찰된 펩티드의 단편인 모든 펩티드를 포함하는 것을 의미한다.The term "truncated peptide" herein is meant to include all peptides that are fragments of the peptide that have been observed to have functional activity.

본원에서 용어 "실질적인 서열 상동성"은 유사한 생화학적 성질을 갖는 부분을 제조하기 위하여 또 다른 DNA 단편과 충분히 유사한 뉴클레오티드 서열을 갖는 DNA 단편, 또는 유사한 생화학적 성질을 나타내기 위한 또 다른 폴리펩티드와 충분히 유사한 아미노산 사열을 갖는 폴리펩티드를 의미한다.As used herein, the term “substantial sequence homology” is sufficiently similar to a DNA fragment having a nucleotide sequence sufficiently similar to another DNA fragment, or another polypeptide to exhibit similar biochemical properties to produce a moiety with similar biochemical properties. A polypeptide having an amino acid sequence is meant.

표 20에 기록된 선택된 균주로부터의 발효 브로쓰는 포토랍두스 속에 의한 살충성 독소 생산의 폭 및 이들 독소의 살충 스펙트럼을 측정하기 위해, 및 독소 복합체를 정제하기 위한 공급원 물질을 제공하기 위해 사용되었다. 본원에서 특성화된 균주는 다양한 곤충 목에 대해 경구 독성을 갖는 것으로 나타났다. 그러한 곤충 목은 딱정벌레목(Coleoptera), 동시목(Homoptera), 나비목(Lepidoptera), 파리목(Diptera), 응애목(Acarina), 벌목(Hymenoptera) 및 방시목(Dictyoptera)을 포함하지만, 이에 한정되지 않는다.Fermentation broth from selected strains reported in Table 20 was used to determine the breadth of pesticidal toxin production by the genus Photorapdus and the pesticidal spectrum of these toxins, and to provide a source material for purifying the toxin complex. The strains characterized herein have been shown to have oral toxicity against various insect necks. Such insect trees include, but are not limited to, Coleoptera, Homoptera, Lepidoptera, Diptera, Acarina, Hymenoptera, and Dictoptera .

다른 박테리아 독소에서와 같이, 군집내에서의 박테리아의 돌연변이율로 인해, 서열에서 약간 상이한 많은 관련 독소가 존재한다. 본원에서 관심있는 독소는 본원에서 설명된 바와 같이 노출시에 다양한 곤충에 유독한 단백질 복합체를 생산하는 것이다. 바람직하게는, 독소는 나비목, 딱정벌레목, 동시목, 파리목, 벌목, 방시목 및 응애목에 대해 활성이다. 본 발명은 본원의 균주 및 그의 임의의 변종 균주에 의해 생산된 단백질 독소에 상동성인 단백질 독소 뿐만 아니라, 포토랍두스에 의해 생산된 임의의 단백질 독소를 포함하도록 의도된다. 이들 상동성 단백질은 서열에서는 다를 수 있지만, 작용에서는 본원에서 설명된 독소와 다르지 않다. 상동성 독소는 300 kDa 내지 2,000 kDa의 단백질 복합체를 포함하는 것을 의미하고, 적어도 2개의 서브유닛으로 이루어지며, 서브유닛은 다른 서브유닛과 동일하거나 동일하지 않은 펩티드이다. 다양한 단백질 서브유닛이 동정되었고, 본원에서 실시예에 교시되어 있다. 전형적으로, 단백질 서브유닛은 약 18 kDa 내지 약 230 kDa; 약 160 kDa 내지 약 230 kDa; 약 100 kDa 내지 약 160 kDa; 약 80 kDa 내지 약 100 kDa; 및 약 50 kDa 내지 약 80 kDa이다.As with other bacterial toxins, there are many related toxins that differ slightly in sequence due to the mutation rate of the bacteria in the population. Toxins of interest herein are those that produce protein complexes that are toxic to various insects upon exposure as described herein. Preferably, the toxin is active against Lepidoptera, Coleoptera, Simulaceae, Fly, Logs, Scrub and Mite. The present invention is intended to include protein toxins homologous to the protein toxins produced by the strains herein and any of the variant strains thereof, as well as any protein toxins produced by Photorapdus. These homologous proteins may differ in sequence but are not different in function from the toxins described herein. Homologous toxin is meant to include a protein complex of 300 kDa to 2,000 kDa, consisting of at least two subunits, the subunit being a peptide that is the same or not the same as the other subunits. Various protein subunits have been identified and taught in the Examples herein. Typically, protein subunits range from about 18 kDa to about 230 kDa; About 160 kDa to about 230 kDa; About 100 kDa to about 160 kDa; About 80 kDa to about 100 kDa; And about 50 kDa to about 80 kDa.

전술된 바와 같이, 일부 포토랍두스 균주가 선충류로부터 단리될 수 있다. 일부 선충류, 즉, 선충문(Nematoda)의 긴 원통형 기생충은 유리한 성장 환경으로서 곤충 유충을 이용하는 능력을 진화시켰다. 곤충 유충은 선충류를 성장시키는 먹이원 및 번식하기 위한 환경을 제공한다. 특정한 선충류가 유충을 침입함에 따른 한 극적인 효과가 유충의 죽음이다. 유충의 죽음은 특정한 선충류내의, 유충 성장을 정지시키고 먹이섭취 활동을 억제하는 살충성 독소를 생산하는 박테리아의 존재에 의한 것이다.As mentioned above, some photolabose strains can be isolated from nematodes. Some nematodes, the long cylindrical parasites of Nematoda, have evolved the ability to use insect larvae as an advantageous growth environment. Insect larvae provide a food source for growing nematodes and an environment for reproduction. As long as certain nematodes invade the larvae, the dramatic effect is the death of the larvae. The death of the larvae is caused by the presence of bacteria in certain nematodes that produce insecticidal toxins that stop larval growth and inhibit feeding activity.

흥미롭게, 곤충 기생 선충류의 각각의 속은 선충류와의 공생적 성장을 위해 독특하게 적응된 특정한 종의 박테리아를 숙주로 하는 것으로 나타난다. 이러한 연구가 시작된 사이에, 박테리아 제노랍두스 속의 명칭이 제노랍두스 및 포토랍두스로 재분류되었다. 포토랍두스 속의 박테리아는 헤테로랍디투스 선충류의 공생자로서 특성화되며, 제노랍두스 종은 스테인너네마 종의 공생자이다. 명칭에서의 이러한 변경을 본 명세서에서 반영하지만, 명칭에서의 변경이 어떠한 방식으로도 본원에 설명된 발명의 범위를 변화시키지 않아야 한다.Interestingly, each genus of insect parasitic nematodes appears to host a particular species of bacteria that has been uniquely adapted for symbiotic growth with nematodes. During the start of this study, the genus Bacterium genodudus was renamed Genorabdus and Photorabdus. Bacteria in the genus Photorabdus are characterized as symbiosis of heterorabditus nematodes, and genorabdus are symbiosis of Stainnerema species. While such changes in names are reflected herein, changes in names should not in any way alter the scope of the invention described herein.

본원에 개시된 펩티드 및 유전자는 문헌[the Journal of Bacteriology "Instructions to Authors" p. i-xii(Jan. 1996)]에서 최근에 공개된 지침에 따라 명명된다. 하기 펩티드 및 유전자는 포토랍두스 균주 W-14로부터 단리되었다.Peptides and genes disclosed herein are described in the Journal of Bacteriology "Instructions to Authors" p. i-xii (Jan. 1996), according to the recently published guidelines. The following peptides and genes were isolated from photolapidus strain W-14.

상기 목록의 서열은 게놈 영역에 의해 분류된다. 더욱 구체적으로는, 포토랍두스 루미네스센스 박테리아 (W-14)는 4개 이상의 구별되는 게놈 영역, tca, tcb, tcc 및 tcd를 갖는다. 표 1에서 알 수 있는 바와 같이, 펩티드 생성물은 이들 구별되는 게놈 영역에서 제조된다. 더욱이, 실시예, 구체적으로 실시예 15 및 21에서 설명되는 것처럼, 세 게놈 영역으로 부터 제조된 각각의 유전자 생성물은 조합하여 곤충 활성을 나타낸다. 또한, 이들 4개의 게놈 영역 사이에는 현저한 상동성이 있다.The sequences in this list are sorted by genomic region. More specifically, Photolab durum luminescens bacteria (W-14) have four or more distinct genomic regions, tca, tcb, tcc and tcd. As can be seen in Table 1, peptide products are prepared in these distinct genomic regions. Moreover, as described in Examples, specifically Examples 15 and 21, each gene product produced from three genomic regions exhibits insect activity in combination. In addition, there is marked homology between these four genomic regions.

실시예에서 자세하게 설명되는 것처럼, tcbA 유전자는 두 가능한 생물학적 활성 단백질 단편 (TcbA 및 TcbAii/iii)으로서 이. 콜리에서 발현되었다. 또한, TcdA 유전자도 이. 콜리에서 발현되었다. 실시예 16에서 설명되는 것처럼, 천연의 비프로세싱된 TcbA 독소를 내생의 메탈로프로테아제 또는 프로테아제를 함유하는 곤충의 소화관 내용물로 처리하면, TcbA 단백질 독소는 더 작은 서브유닛으로 프로세싱되어 천연의 펩티드보다 크기가 작아지고, 써던 옥수수 뿌리벌레 활성이 증가한다. 더 작은 독소 펩티드는 독소 복합체의 부분으로서 잔류하게된다. 몇몇 상황에서 단백질 분해적 프로세싱 또는 절단 펩티드를 사용하여 독소의 활성화를 증가시키는 것이 소망될 수 있다. 따라서, 몇몇 용도, 즉 상업적 유전자전환 식물 용도에서 절단 펩티드를 사용하는 것이 더욱 바람직할 수 있다.As explained in detail in the Examples, the tcbA gene is divided into two possible biologically active protein fragments (TcbA and TcbA ii / iii ). Expressed in collie. In addition, the TcdA gene. Expressed in collie. As described in Example 16, when a natural unprocessed TcbA toxin is treated with the endogenous metalloprotease or the digestive tract content of an insect containing a protease, the TcbA protein toxin is processed into smaller subunits that are larger in size than the native peptide. Decreases, and increases the activity of the southern corn rootworm. The smaller toxin peptide will remain as part of the toxin complex. In some situations it may be desirable to increase the activation of toxins using proteolytic processing or cleavage peptides. Thus, it may be more desirable to use truncated peptides in some applications, ie in commercial transgenic plant applications.

W-14 균주 이외에, 차별적인 작용 활성을 갖는 포토랍두스 속 내의 다른 종들이 있다 (구체적으로 표 20 및 36 참조). 차별적인 활성이 있을지라도, 몇몇 경우의 아미노산 서열은 실질적인 서열 상동성을 갖는다. 더욱이, 분자 프로브는 균주에 함유되어 있는 몇몇 유전자가 W-14 균주에 함유된 유전자와 상동성이 있다는 것을 나타낸다. 사실 본원에서 설명된 균주 모두는 W-14 독소 유전자에 대한 하나 이상의 상동체를 갖는다. 실시예 26에서의 항체 데이터 및 실시예 25의 N-말단 서열 데이터는 이들 균주에 의하여 생산된 단백질 독소 사이에 상동성 및 동일성 (아미노산 서열을 기준으로)이 있다는 결론을 더욱 지지해준다. 분자 수준에서, W-14 유전자 프로브는 포토랍두스 속 전체에 걸쳐 이들 상동체 또는 W-14 유전자들 (표 37, 38 및 39)이 존재한다는 것을 가리킨다. 더욱이, W-14와 상동성이 아니나, 전체적인 단백질 특성을 유지하는 다른 균주에서 새로운 독소 유전자가 존재하는 것도 가능하다 (참조. 구체적으로, 실시예 14 및 25).In addition to the W-14 strain, there are other species in the genus Photorapdus with differential action activity (see specifically Tables 20 and 36). Although there is differential activity, in some cases amino acid sequences have substantial sequence homology. Moreover, molecular probes indicate that some genes contained in the strains are homologous to genes contained in the W-14 strain. In fact, all of the strains described herein have one or more homologues for the W-14 toxin gene. The antibody data in Example 26 and the N-terminal sequence data of Example 25 further support the conclusion that there is homology and identity (based on amino acid sequence) between the protein toxins produced by these strains. At the molecular level, the W-14 gene probe indicates that these homologues or W-14 genes (Tables 37, 38 and 39) exist throughout the genus Photorapdus. Moreover, it is also possible for new toxin genes to be present in other strains that are not homologous to W-14 but retain overall protein properties (see, eg, Examples 14 and 25).

포토랍두스 균주에 의하여 생성된 독소 유전자 사이에 상동성 또는 동일성이 존재할 지라도, 균주들 자체는 다양하다. 실시예 22에 설명된 폴리머라제 연쇄 중합반응 기법을 사용할 때, 본원에서 설명된 균주 대부분은 구별된다. 예를 들면, 도 5에서 알 수 있는 것처럼, HP88 및 NC-1과 같은 몇몇 균주에서의 상대 %유사성은 약 0.8로, 이는 상기 균주들이 유사하다는 것을 나타내고, HP88 및 Hb는 0.1 인데, 이는 실질적으로 다름을 나타낸다. 따라서, 곤충의 독소 유전자 또는 이들 균주가 생산하는 유전자 산물이 동일하거나 유사할지라도, 상기 균주들은 다른 종류이다.Although homology or identity exists between the toxin genes produced by the Photoractus strains, the strains themselves vary. When using the polymerase chain polymerization technique described in Example 22, most of the strains described herein are distinguished. For example, as can be seen in Figure 5, the relative% similarity in some strains, such as HP88 and NC-1, is about 0.8, indicating that the strains are similar, with HP88 and Hb being 0.1, which is substantially Indicates a difference. Thus, although the toxin genes of insects or the gene products produced by these strains are the same or similar, the strains are of different kinds.

실시예 및 본원에서 추가로 개시된 데이터면에서 신규하고 독특한 군의 살충 단백질 독소가 발견되었다는 것은 분명하다. 본원에서 이들 독소들이 포토랍두스 속의 박테리아 균주내에 넓게 존재한다는 것을 설명하고 있다. 또한, 이들 독소 유전자가 엔테로박테라카애 과내에 넓게 존재한다는 것을 보여준다. 실시예 21에 설명된 것처럼 제조된 항체 또는 실시예 25에서 설명된 것처럼 제조된 유전자 프로브가 작용 활성을 갖는 상동성의 독소를 생성하는 엔테로박테라카애 과내의 박테리아 균주를 추가로 스크리닝하기 위하여 사용될 수 있다. 또한, 포토랍두스 속 또는 엔테로박테라카애 과 내의 새로운 유전자를 식별하는 것을 용이하게 할 수 있는 특정의 프라이머가 존재하는 지를 확인하기 위하여 사용될 수 있다.It is clear from the examples and the data further disclosed herein that a novel and unique group of pesticidal protein toxins has been found. It is described herein that these toxins are widely present in bacterial strains of the genus Photorapdus. It also shows that these toxin genes are widely present in the Enterobacteraceae family. Antibodies prepared as described in Example 21 or gene probes prepared as described in Example 25 can be used to further screen bacterial strains in the Enterobacteraceae family that produce homologous toxins with functional activity. . It may also be used to identify the presence of specific primers that may facilitate the identification of new genes in the genus Photorapus or in the Enterobacteraceae family.

상기 설명한 것처럼, 포토랍두스 속 또는 엔테로박테라카애 과의 박테리아를 실시예 26에서 설명한 것처럼 상동성의 독소 생성물에 대해 신속히 스크리닝하기 위하여 사용될 수 있다. 본 분야의 숙련자들은 분석 또는 스크리닝 기법으로서 항체를 사용하는 것에 매우 익숙하다 (참조. 미국 특허 제5,430,137호가 본원에 참고로 도입된다). 더욱이, 폴리펩티드의 노출된 표면을 점유하는 경향이 있는 6 내지 20개의 아미노산 잔기 세그먼트에 의해 항체가 유도되는 것은 일반적으로 문헌 (Current Protocols in Immunology, Coligan et al, National Institutes of Heath, John Wiley & Sons, Inc.)에서 설명된다. 일반적으로 아미노산은 인접하는 아미노산 잔기들로 이루어지지만, 특정의 경우에는 특정의 형태에 의하여 제한되는 인접하지 않는 아미노산에 의하여 형성되는 경우도 있다. 항체에 의하여 인식되는 아미노산 세그먼트는 매우 특이적이며, 일반적으로 에피토프로 간주된다. 아미노산 단편은 천연 단백질의 화학적 및(또는) 효소적 절단에 의하여, 자동화된 고체상 펩티드 합성에 의하여 또는 유전공학적 생물체로 부터의 생성에 의하여 생성될 수 있다. 폴리펩티드 단편은 본 분야에 공지된 다양한 HPLC 또는 FPLC 크로마토그래피법 또는 그 조합에 의하여 단리될 수 있다. 폴리펩티드 단편의 선별은 예를 들면 Kyte 및 Doolittle의 1982의 문헌 (Journal of Molecular Biology 157: 105-132) 및 Chou 및 Fasman의 1974년의 문헌 (Biochemistry 13: 222-245)의 단백질의 표면상에 노출된 서열을 나타내는 알고리듬에 의해 도움을 받을 수 있다. 유의한 폴리펩티드 단편을 함유하는 면역원의 제조를 위하여 일반적으로 화학적 반응물을 사용하여 유리 아미노 (라이신), 설프히드릴 (시스테인), 페놀기 (티로신) 또는 카르복실기 (아스파르테이트 또는 글루타메이트)를 통하여 키홀 림펫 헤모시아닌과 같은 캐리어 단백질에 폴리펩티드가 공유적으로 결합된다. 보강제와 함께 면역원을 쥐 또는 토끼, 또는 면역원에 대하여 면역반응을 이끌어내는 닭에게 주사한다. 폴리펩티드 단편에 대한 주사 동물의 항혈청에서의 항체양의 분석은 ELISA 및 웨스턴 블럿과 같은 여러 면역학적 방법을 사용하여 측정될 수 있다. 이외에, 종양 세포와의 융합이 단일 항체군을 생성하는 불멸의 히브리도마 세포를 제조하는 주입된 동물의 비장 세포를 사용하여 단클론성 항체를 제조될 수 있다. 히브리도마 세포를 면역학적 방법을 통하여 스크리닝하여 유의한 폴리펩티드 단편에 대한 특이 항체를 제조하는 세포주를 선별한다. 상이한 생물원으로 부터 항체의 정제는 다양한 항원 친화성 또는 항체 친화성 컬럼 또는 다른 크로마토그래피 HPLC 또는 FPLC 방법을 사용하여 수행될 수 있다.As described above, bacteria of the genus Photoractus or Enterobacteraeaceae can be used for rapid screening for homologous toxin products as described in Example 26. Those skilled in the art are very familiar with using antibodies as assay or screening techniques (see US Pat. No. 5,430,137, incorporated herein by reference). Moreover, the induction of antibodies by 6-20 amino acid residue segments that tend to occupy the exposed surface of the polypeptide is generally described in Current Protocols in Immunology, Coligan et al, National Institutes of Heath, John Wiley & Sons, Inc.). Amino acids are generally composed of contiguous amino acid residues, but in certain cases are also formed by noncontiguous amino acids that are limited by a particular form. The amino acid segments recognized by the antibody are very specific and are generally considered epitopes. Amino acid fragments can be produced by chemical and / or enzymatic cleavage of natural proteins, by automated solid phase peptide synthesis, or by production from genetically engineered organisms. Polypeptide fragments can be isolated by various HPLC or FPLC chromatography methods or combinations thereof known in the art. The selection of polypeptide fragments is described, for example, on the surface of proteins of Kyte and Doolittle's 1982 (Journal of Molecular Biology 157: 105-132) and Chou and Fasman's 1974 (Biochemistry 13: 222-245). This can be helped by an algorithm that represents a sequence that has been modified. For the preparation of immunogens containing significant polypeptide fragments, keyhole lymphets are generally used via chemical reactions via free amino (lysine), sulfhydryl (cysteine), phenolic groups (tyrosine) or carboxyl groups (aspartate or glutamate). The polypeptide is covalently bound to a carrier protein such as hemocyanin. The immunogen along with the adjuvant is injected into rats or rabbits or chickens that elicit an immune response against the immunogen. Analysis of the amount of antibody in the antiserum of injected animals against polypeptide fragments can be measured using several immunological methods such as ELISA and Western blot. In addition, monoclonal antibodies can be prepared using splenocytes of injected animals that produce immortal hybridoma cells in which fusion with tumor cells produces a single antibody group. Hybridoma cells are screened by immunological methods to select cell lines that produce specific antibodies to significant polypeptide fragments. Purification of antibodies from different biological sources can be performed using various antigen affinity or antibody affinity columns or other chromatographic HPLC or FPLC methods.

본원에 설명된 독소는 독소가 작용 활성을 갖는 점에서 매우 독특하며, 이는 곤충 관리 방법을 개발하기 위한 핵심이다. 곤충 관리 방법을 개발하는데 있어서, 단백질을 소화관을 피하여 생물체에 직접 주사함으로써 단백질 분해 과정을 지연시키거나 회피할 수 있다. 그러한 경우, 생물체에 투여된 단백질은 변성되거나, 비특이적으로 분해되거나, 고등 생물체에서 면역계에 의해 제거되기 전까지 그의 기능을 유지할 것이다. 살충성 독소를 곤충에 주사하는 것은 단지 실험실에서, 및 그에 따라 쉽게 주사되는 큰 곤충에 대해서만 가능한 적용이다. 본원에 설명된 살충 단백질 독소가 경구 섭취 또는 독소와의 접촉 후에 그들의 유독 활성을 나타낸다는 관찰은 단백질 독소를 곤충의 먹이내로 혼입시키는 것에만 전적으로 기초된 곤충 관리 계획의 개발을 허용한다. 그러한 계획은 곤충 미끼의 생산을 이끌 수 있다.The toxins described herein are very unique in that the toxins have functional activity, which is the key for developing insect management methods. In developing insect control methods, protein can be injected directly into the organism, avoiding the digestive tract, to delay or avoid proteolytic processes. In such a case, the protein administered to the organism will retain its function until it is denatured, unspecifically degraded, or removed by the immune system in higher organisms. Injecting insecticidal toxins into insects is a possible application only in the laboratory and only for large insects which are thus easily injected. The observation that the pesticidal protein toxins described herein exhibit their toxic activity after oral ingestion or contact with the toxin allows the development of an insect management plan based solely on incorporating the protein toxin into the insect's food. Such a plan can lead to the production of insect baits.

포토랍두스 독소는 정제된 형태로 곤충에 투여될 수 있다. 독소는 또한 약 1 내지 약 100㎎/ℓ 브로쓰의 양으로 전달될 수 있다. 이는 제형 조건, 접종 공급원의 조건, 독소의 단리 기술 등에 따라 변할 수 있다. 독소는 이종 원핵세포 또는 진핵세포 숙주에서 원래 발현된 삼출 분비물 또는 세포내 단백질로서 투여될 수 있다. 박테리아는 전형적으로 단백질이 발현되는 숙주이다. 진핵세포 숙주는 식물, 곤충 및 효모를 포함할 수 있지만 이에 한정되지 않는다. 이외에, 독소는 박테리아 또는 들판의 유전자전환 식물에서 또는 바쿨로바이러스 벡터에 의해 곤충내에서 생산될 수 있다. 전형적으로, 독소는 하나 이상의 독소를 곤충의 먹이에 혼입시킴으로써 곤충에 도입될 것이다.Photolapus toxin can be administered to an insect in purified form. Toxins may also be delivered in an amount of about 1 to about 100 mg / L broth. This may vary depending on formulation conditions, conditions of inoculation source, isolation techniques of toxins, and the like. Toxins can be administered as exudate secretions or intracellular proteins originally expressed in heterologous prokaryotic or eukaryotic hosts. Bacteria are typically hosts in which proteins are expressed. Eukaryotic hosts may include, but are not limited to, plants, insects, and yeasts. In addition, toxins can be produced in insects by transgenic plants of bacteria or fields or by baculovirus vectors. Typically, the toxin will be introduced to the insect by incorporating one or more toxins into the insect's food.

완전 치사량이 곤충에 섭취시키기 위해 유용하지만, 유용한 독성을 성취하기위해서 요구되지는 않는다. 곤충이 독소를 회피하거나 먹이 섭취를 중단하면, 일부 적용에서는 효과가 거의 치사량에 가깝더라도, 그러한 회피가 유용할 것이다. 예를 들면, 내충 유전자전환 작물 식물이 요망되는 경우, 궁극적인 목적은 곤충을 죽이는 것보다 식물의 보호에 있으므로, 식물을 섭취하는 것에 대한 곤충의 거리낌이 곤충에 대한 치명적인 독성만큼 유용하다.Full lethality is useful for ingestion by insects, but is not required to achieve useful toxicity. If an insect avoids toxins or stops feeding, such avoidance will be useful in some applications, even if the effect is close to lethal. For example, where insecticidal transgenic crop plants are desired, the ultimate goal is to protect the plant rather than kill the insect, so insect reluctance to ingest the plant is as useful as lethal toxicity to insects.

독소를 곤충의 먹이에 혼입할 수 있는 다른 많은 방법이 있다. 예로서, 본원에 개시된 바와 같이 단백질 용액을 먹이에 분무함으로써, 유충 먹이원을 독성 단백질로 혼합시킬 수 있다. 이외에, 정제된 단백질을 다른 무해한 박테리아내로 유전 공학적으로 처리한 다음, 배양물에서 성장시키고, 먹이원에 적용하거나 곤충 박멸이 요구되는 지역내 토양에 잔류시킬 수 있다. 또한, 단백질을 직접 곤충 먹이원내로 유전공학적으로 처리할 수 있다. 예를 들면, 많은 곤충 유충의 주요 먹이원은 식물이다.There are many other ways in which toxins can be incorporated into insect food. For example, larval food sources can be mixed with toxic proteins by spraying the protein solution into the food as disclosed herein. In addition, the purified protein may be genetically engineered into other harmless bacteria and then grown in culture, applied to food sources or left in soil in areas where insect killing is required. In addition, proteins can be genetically processed directly into insect food sources. For example, the main food source for many insect larvae is plants.

포토랍두스 독소의 살충 특성을 코딩하는 유전 물질을 특정 곤충 해충의 먹이가 되는 식물의 게놈내로 혼입시킴으로써, 성충 또는 유충이 먹이 식물을 소비한 후에 죽을 수 있다. 많은 수의 단자엽식물속 및 쌍자엽식물속이 형질전환되었다. 유전자전환 농작물 뿐만 아니라 열매 및 채소가 상업적인 대상이다. 그러한 농작물은 옥수수, 벼, 대두, 카놀라, 해바라기, 알팔파, 사탕수수, 밀, 면, 땅콩, 토마토, 감자 등을 포함하지만 이에 한정되지 않는다. 외인성 유전 물질을 식물 세포내에 도입시키기 위한 및 도입된 유전자를 안정하게 유지하고 발현하는 식물을 얻기 위한 몇몇 기술이 존재한다. 그러한 기술은 미립자에 피복된 유전 물질의 세포내로의 직접적인 도입 촉진을 포함한다(미국 특허 4,945,050 (Cornell), 및 미국 특허 5,141,131 (DowElanco)). 식물은 아그로박테리움 기술을 사용하여 형질전환될 수 있다[미국 특허 5,177,010 (University of Toledo), 미국 특허 5,104,310 (Texas A&M), 유럽 특허 출원 0131624B1, 유럽 특허 출원 120516, 159418B1 및 176,112(Schilperoot), 미국 특허 5,149,645, 5,469,976, 5,464,763, 4,940,838, 및 4,693,976 (Schilperoot), 유럽 특허 출원 116718, 290799 및 320500 (모두 MaxPlanck), 유럽 특허 출원 604662 및 627752 (Japan Tobacco), 유럽 특허 출원 0267159 및 0292435, 및 미국 특허 5,231,019 (모두 Ciba Geigy), 미국 특허 5,463,174 및 4,762,785 (모두 Calgene), 및 미국 특허 5,004,863 및 5,159,135 (모두 Agracetus)를 참조하시오]. 다른 형질전환 기술은 휘스커스 (whiskers) 기술을 포함한다[미국 특허 5,302,523 및 5,464,765 (모두 Zeneca)를 참조하시오]. 일렉트로포레이션 기술이 또한 식물을 형질전환시키기 위해 사용되고 있다[국제 출원 공개 87/06614 (Boyce Thompson Institute), 미국 특허 5,472,869 및 5,384,253 (모두 Dekalb), 국제 출원 공개 92/09696 및 93/21335 (모두 PGS)를 참조하시오]. 이들 형질전환 특허 및 공개를 모두 본원에서 참고로 인용하였다. 식물을 형질전환시키기 위한 많은 기술에 덧붙여, 외인성 유전자와 접촉되는 조직 유형이 또한 다양할 수 있다. 그러한 조직은 배아 조직, 칼루스 조직 유형 Ⅰ 및 Ⅱ, 배축조직(hypocotyl), 분열조직 등을 포함할 것이지만 이에 한정되지는 않는다. 숙련인의 기술내의 적절한 기술을 사용하여 거의 모든 식물 조직이 탈분화 중에 형질전환될 수 있다.By incorporating the genetic material encoding the pesticidal properties of the photolabose toxin into the genome of the plant that is feeding the particular insect pest, the adult or larvae can die after consuming the food plant. A large number of monocotyledonous and dicotyledonous plants were transformed. Fruits and vegetables as well as transgenic crops are commercial targets. Such crops include, but are not limited to, corn, rice, soybeans, canola, sunflower, alfalfa, sugar cane, wheat, cotton, peanuts, tomatoes, potatoes and the like. Several techniques exist for introducing exogenous genetic material into plant cells and for obtaining plants that stably maintain and express the introduced genes. Such techniques include facilitating the direct introduction of genetic material coated into particulates into cells (US Pat. No. 4,945,050 (Cornell), and US Pat. No. 5,141,131 (DowElanco)). Plants can be transformed using the Agrobacterium technology [US Patent 5,177,010 (University of Toledo), US Patent 5,104,310 (Texas A & M), European Patent Application 0131624B1, European Patent Application 120516, 159418B1 and 176,112 (Schilperoot), United States Patents 5,149,645, 5,469,976, 5,464,763, 4,940,838, and 4,693,976 (Schilperoot), European Patent Applications 116718, 290799 and 320500 (all MaxPlanck), European Patent Applications 604662 and 627752 (Japan Tobacco), European Patent Applications 0267159 and 0292435, and US Patent 5,231 (All Ciba Geigy), US Pat. Nos. 5,463,174 and 4,762,785 (all Calgene), and US Pat. Nos. 5,004,863 and 5,159,135 (all Agracetus). Other transformation techniques include whiskers techniques (see US Pat. Nos. 5,302,523 and 5,464,765, all of Zeneca). Electroporation techniques are also used to transform plants [International Application Publication 87/06614 (Boyce Thompson Institute), US Patents 5,472,869 and 5,384,253 (all Dekalb), International Application Publications 92/09696 and 93/21335 (all PGS) ). All of these transformation patents and publications are incorporated herein by reference. In addition to many techniques for transforming plants, the types of tissues in contact with exogenous genes may also vary. Such tissues will include, but are not limited to, embryonic tissue, callus tissue types I and II, hypocotyl, meristem, and the like. Almost all plant tissues can be transformed during dedifferentiation using appropriate techniques within the skill of the art.

다른 변수는 선택가능한 마커의 선택이다. 특정 마커에 대한 선호는 숙련인의 재량이지만, 임의의 하기 선택가능한 마커가 선택가능한 마커로서 작용할 수 있는 본원에 나열되지 않은 임의의 다른 유전자와 함께 사용될 수 있다. 그러한 선택가능한 마커는 항생제 카나마이신, 네오마이신 및 G418에 내성을 코딩하는 트랜스포존 Tn5의 아미노글리코시드 포스포트랜스퍼라제 유전자(Aph Ⅱ) 뿐만 아니라, 글리포세이트; 하이그로마이신; 메토트렉세이트; 포스피노트리신(비알로포스); 이미다졸리논, 술포닐우레아 및 트리아졸로피리미딘 제초제(예를 들면, 클로로술푸론; 브로목시닐, 달라폰 등)에 대한 내성 또는 용인성을 코딩하는 유전자를 포함하지만 이에 한정되지는 않는다.Another variable is the selection of selectable markers. Preference for a particular marker is at the discretion of the skilled person, but any of the following selectable markers may be used with any other gene not listed herein, which may serve as a selectable marker. Such selectable markers include glyphosate, as well as the aminoglycoside phosphotransferase gene (Aph II) of transposon Tn5 encoding resistance to the antibiotics kanamycin, neomycin and G418; Hygromycin; Methotrexate; Phosphinothricin (bialophos); Include, but are not limited to, genes encoding tolerance or tolerance to imidazolinone, sulfonylureas, and triazolopyrimidine herbicides (e.g., chlorosulfuron; bromoxynil, dalapon, etc.) .

선택 마커 외에, 리포터(reporter) 유전자의 사용이 바람직할 수 있다. 몇몇 경우, 선택 마커없이 리포터 유전자를 사용할 수 있다. 리포터 유전자는 전형적으로 수용 생물체 또는 조직에 존재하거나 발현되지 않는 유전자이다. 리포터 유전자는 전형적으로 일부 표현형의 변화 또는 효소 특성을 제공하는 단백질을 코딩한다. 그러한 유전자의 예는 본원에 참고로 인용한 문헌[K. Weising 등, Ann. Rev. Genetics, 22, 421 (1988)]에서 제공된다. 바람직한 리포터 유전자는 글루쿠로니다제(GUS) 유전자이다.In addition to selection markers, the use of reporter genes may be desirable. In some cases, reporter genes can be used without selection markers. Reporter genes are typically genes that are present or not expressed in a recipient organism or tissue. Reporter genes typically encode proteins that provide some phenotypic change or enzymatic properties. Examples of such genes are described in K. Weising et al., Ann. Rev. Genetics, 22, 421 (1988). Preferred reporter genes are glucuronidase (GUS) genes.

형질전환 기술에 상관없이, 유전자는 바람직하게는 식물 프로모터를 벡터에 포함시킴으로써 식물 세포내에서 포토랍두스 독소를 발현시키기 위해 개조된 유전자 전달 벡터내로 도입된다. 식물 프로모터 외에, 다양한 공급원으로부터의 프로모터가 외인성 유전자를 발현시키기 위해 식물 세포에서 효율적으로 사용될 수 있다. 예를 들면, 박테리아 기원의 프로모터(예를 들면, 옥토핀 신타제 프로모터, 노팔린 신타제 프로모터, 만노핀 신타제 프로모터), 바이러스 기원의 프로모터(콜리플라워 모자이크 바이러스(35S 및 19S), 35T로 알려진 재가공된 35S) 등이 사용될 수 있다 (참조. PCT/US96/16582, 1997년 4월 17일 공개된 WO97/13402가 본원에 참고로 도입된다). 식물 프로모터는 리불로스-1,6-비스포스페이트 (RUBP) 카르복실라제의 작은 서브유닛(ssu), 베타-콘글리시닌 프로모터, 파제올린 프로모터, ADH 프로모터, 열 쇽 프로모터 및 조직 특이성 프로모터를 포함하지만 이에 한정되지는 않는다. 프로모터는 또한 전사 효능을 개선시킬 수 있는 특정 인헨서 서열 요소를 포함할 수 있다. 전형적인 인헨서는 Adh-인트론 1 및 Adh-인트론 6을 포함하지만 이에 한정되지는 않는다. 구성 프로모터가 사용될 수 있다. 구성 프로모터는 모든 세포 유형에서 모든 시기에 연속적인 유전자 발현을 일으킨다(예를 들면, 액틴, 유비퀴틴, CaMV 35S). 조직 특이성 프로모터는 잎 또는 종자와 같은 특이 세포 또는 조직 유형에서 유전자 발현을 담당하고 (예를 들면, 제인, 올레오신, 나핀, ACP), 이들 프로모터가 또한 사용될 수 있다. 프로모터는 또한 식물 발생의 특정 단계 동안 활성이며 또한 식물 조직 및 기관에서 활성일 수 있다. 그러한 프로모터의 예는 화분 특이성, 배 특이성, 옥수수 수염 특이성, 면 섬유 특이성, 뿌리 특이성, 종자 배유 특이성 프로모터 등을 포함하지만 이에 한정되지는 않는다.Regardless of the transformation technique, the genes are preferably introduced into a gene transfer vector adapted for expressing photolabduus toxin in plant cells by including the plant promoter in the vector. In addition to plant promoters, promoters from various sources can be used efficiently in plant cells to express exogenous genes. For example, promoters of bacterial origin (e.g., octopin synthase promoter, nopaline synthase promoter, mannofine synthase promoter), promoters of viral origin (known as cauliflower mosaic virus (35S and 19S), 35T) Reprocessed 35S) and the like can be used (see PCT / US96 / 16582, WO97 / 13402, published April 17, 1997, incorporated herein by reference). Plant promoters include small subunits of ribulose-1,6-bisphosphate (RUBP) carboxylase, beta-conglycinin promoter, pazeolin promoter, ADH promoter, heat shock promoter and tissue specific promoter But it is not limited thereto. Promoters can also include certain enhancer sequence elements that can improve transcriptional efficacy. Typical enhancers include, but are not limited to, Adh-Intron 1 and Adh-Intron 6. Configuration promoters can be used. Constitutive promoters produce continuous gene expression at all times in all cell types (eg, actin, ubiquitin, CaMV 35S). Tissue specific promoters are responsible for gene expression in specific cell or tissue types such as leaves or seeds (eg, zein, oleosin, napin, ACP), and these promoters may also be used. Promoters are also active during certain stages of plant development and may also be active in plant tissues and organs. Examples of such promoters include, but are not limited to, pollen specificity, pear specificity, corn beard specificity, cotton fiber specificity, root specificity, seed endoplasmic specificity promoter and the like.

특정 환경 하에, 유도성 프로모터를 사용하는 것이 바람직할 수 있다. 유도성 프로모터는 특이 신호 (예를 들면, 물리적 자극(열 쇽 유전자); 광(RUBP 카르복실라제); 호르몬(Em); 대사물질; 및 스트레스)에 대해 반응하는 유전자의 발현을 담당한다. 식물에서 작용하는 다른 바람직한 전사 및 번역 요소가 사용될 수 있다. 많은 식물-특이성 유전자 전달 벡터가 당업계에 공지되어 있다.Under certain circumstances, it may be desirable to use an inducible promoter. Inducible promoters are responsible for the expression of genes that respond to specific signals (eg, physical stimuli (heat genes); light (RUBP carboxylase); hormones (Em); metabolites; and stress). Other preferred transcription and translation elements that function in plants can be used. Many plant-specific gene transfer vectors are known in the art.

그 외에, 식물 내에서 박테리아 유전자의 높은 발현을 수득하기 위해, 박테리아 유전자를 재공학처리하여 식물의 세포질내에서 더 효율적으로 발현할 수 있도록 하는 것이 바람직한 것으로 공지되어 있다. 옥수수가 식물내 독소의 발현 수준을 증가시키기 위해 형질전환에 앞서 박테리아 유전자(들)을 재공학처리하는 것이 바람직한 그러한 식물 중 하나이다. 재공학처리하는 한 가지 이유는 천연 박테리아 유전자(들)의 매우 낮은 G+C 함량 (및 결과적으로 높은 A+T 함량으로의 편향) 때문이다. 이는 A+T가 매우 풍부한 것으로 공지된 식물 유전자 대조 서열을 의태하거나 복제하는 서열을 생산시킨다. 식물내로 도입된 유전자(들)의 DNA 내의 일부 A+T 풍부 서열의 존재(예를 들면, 유전자 프로모터에서 보통 발견되는 TATA 박스 영역)는 유전자(들)의 이상 전사를 일으킬 수 있다. 반면, 전사된 mRNA내에 존재하는 다른 조절 서열의 존재(예를 들면, 폴리아데닐화 신호 서열(AAUAAA), 또는 예비-mRNA 스플라이싱에 관여하는 작은 핵 RNA에 상보적인 서열)는 RNA 불안정성을 이끌 수 있다. 따라서, 더 바람직하게 식물 최적화된 유전자(들)로 지칭되는, 재공학처리된 박테리아 유전자(들)의 디자인에서 한 목적은 더 높은 G+C 함량을 갖는 DNA 서열을 생산하는 것이며, 바람직하게는 대사성 효소를 코딩하는 식물 유전자의 것에 근접하는 것을 생산하는 것이다. 식물 최적화된 유전자(들)의 디자인에서 다른 목적은 더 높은 G+C 함량을 가질 뿐만 아니라, 서열 변화를 변경시킴으로써 번역이 저해되지 않도록 제조되어야 하는 DNA 서열을 생산하는 것이다.In addition, in order to obtain high expression of bacterial genes in plants, it is known that it is desirable to reengineer bacterial genes so that they can be expressed more efficiently in the cytoplasm of plants. It is one such plant in which corn is desirable to reengineer bacterial gene (s) prior to transformation to increase the expression level of toxins in the plant. One reason for reengineering is due to the very low G + C content (and consequently bias towards high A + T content) of the native bacterial gene (s). This produces sequences that mimic or replicate plant gene control sequences that are known to be very rich in A + T. The presence of some A + T rich sequences in the DNA of the gene (s) introduced into the plant (eg, the TATA box region normally found in the gene promoter) can cause aberrant transcription of the gene (s). In contrast, the presence of other regulatory sequences present in the transcribed mRNA (eg, polyadenylation signal sequence (AAUAAA), or sequences complementary to small nuclear RNAs involved in pre-mRNA splicing) may lead to RNA instability. Can be. Thus, one purpose in the design of reengineered bacterial gene (s), more preferably referred to as plant optimized gene (s), is to produce DNA sequences with higher G + C content, preferably metabolic. It produces something close to that of the plant gene that encodes the enzyme. Another goal in the design of plant optimized gene (s) is to produce DNA sequences that must not only have higher G + C content but also be prepared so that translation is not inhibited by altering sequence changes.

높은 G+C 함량을 갖는 식물의 예는 옥수수이다. 하기 표 2는 옥수수내에서 G+C 함량의 높은 정도를 설명한다. 옥수수에서와 같이, 다른 식물내 G+C 함량이 또한 높을 것으로 생각된다.An example of a plant with a high G + C content is corn. Table 2 below describes the high degree of G + C content in corn. As in corn, the G + C content in other plants is also believed to be high.

옥수수 유전자의 단백질 코딩 영역의 G+C 함량의 수집Collection of G + C Content in Protein Coding Regions of Corn Genes 단백질 종류a Protein class a %G+C의 범위Range of% G + C %G+C의 평균b Average b of% G + C 대사성 효소 (40)Metabolic Enzymes (40) 44.4-75.344.4-75.3 59.0 (8.0)59.0 (8.0) 저장 단백질Storage protein Ⅰ군 (23)Group I (23) 46.0-51.946.0-51.9 48.1 (1.3)48.1 (1.3) Ⅱ군 (13)Group II (13) 60.4-74.360.4-74.3 67.5 (3.2)67.5 (3.2) Ⅰ+Ⅱ군 (36)Group I + II (36) 46.0-74.346.0-74.3 55.1 (9.6)c 55.1 (9.6) c 구조 단백질 (18)Structure Proteins (18) 48.6-70.548.6-70.5 63.6 (6.7)63.6 (6.7) 조절 단백질 (5)Regulatory Proteins (5) 57.2-68.957.2-68.9 62.0 (4.9)62.0 (4.9) 비특성화된 단백질 (9)Uncharacterized Protein (9) 41.5-70.341.5-70.3 64.3 (7.2)64.3 (7.2) 총 단백질 (108)Total Protein (108) 44.4-75.344.4-75.3 60.8 (5.2)60.8 (5.2) a종류내 유전자의 수를 괄호안에 제공한다.Provide the number of genes in type a in parentheses. b표준 편차를 괄호안에 제공한다. b Provide the standard deviation in parentheses. c합한 군의 평균은 총 평균의 계산에서 무시된다. c The mean of the combined group is ignored in the calculation of the total mean.

표 2의 데이터에서, 유전자들의 코딩 영역은 진뱅크(GenBank)(발매 71) 등록으로부터 발췌하고, 기초 조성은 맥벡터(MacVectorTM) 프로그램(IBI, New Haven, CT)를 사용하여 계산하였다. 인트론 서열은 계산에서 무시된다. Ⅰ군 및 Ⅱ군 저장 단백질 유전자 서열은 기초 조성에서 그들의 두드러진 차이에 의해 구별된다.In the data in Table 2, coding regions of genes were extracted from GenBank (Release 71) registration and basal compositions were calculated using the MacVector program (IBI, New Haven, CT). Intron sequences are ignored in the calculations. Group I and Group II storage protein gene sequences are distinguished by their marked differences in basal composition.

유전자 코드의 여분에 의해 제공되는 유연성으로 인해(즉, 몇몇 아미노산이 하나 이상의 코돈에 의해 지정됨), 상이한 생물체 또는 종류 또는 생물체의 진화는 여분의 코돈의 상이한 사용을 일으킨다. 이 "코돈 바이어스"은 단백질 코딩 영역의 평균 기초 조성물에서 반영된다. 예를 들면, 상대적으로 낮은 G+C 함량을 갖는 생물체는 여분의 코돈의 제 3 위치에서 A 또는 T를 갖는 코돈을 이용하는 반면, 더 높은 G+C 함량을 갖는 생물체는 제 3 위치에서 G 또는 C를 갖는 코돈을 이용한다. 유전자의 mRNA내에 "마이너(minor)" 코돈의 존재는 특히 마이너 코돈에 상응하는 충전된 tRNA의 상대적인 풍부성이 낮은 경우, mRNA의 완전한 번역율을 감소시킬 수 있는 것으로 생각된다. 이를 확장하면, 개별적인 마이너 코돈에 의한 번역율의 감소가 다중 마이너 코돈에 대해 적어도 부가적일 것이다. 따라서, 상대적으로 높은 함량의 마이너 코돈을 갖는 mRNA는 상응하게 낮은 번역율을 가질 것이다. 이러한 번역율은 코딩되는 단백질의 낮은 수준의 합성에 의해 반영될 것이다.Due to the flexibility provided by the redundancy of the genetic code (ie, some amino acids are designated by one or more codons), the evolution of different organisms or types or organisms results in different uses of the extra codons. This "codon bias" is reflected in the average basal composition of the protein coding region. For example, a creature with a relatively low G + C content uses a codon with A or T at the third position of the extra codon, while an organism with a higher G + C content has a G or C at the third position. Use a codon having It is believed that the presence of "minor" codons in the mRNA of a gene can reduce the complete translation rate of the mRNA, especially if the relative abundance of the charged tRNA corresponding to the minor codon is low. Expanding this, the reduction in translation rate by individual minor codons will be at least additive for multiple minor codons. Thus, mRNAs with relatively high content of minor codons will have correspondingly low translation rates. This rate of translation will be reflected by the low level of synthesis of the protein being encoded.

박테리아 유전자(들)을 재공학처리하기 위해, 식물의 코돈 바이어스를 측정한다. 코돈 바이어스는 식물이 그의 단백질을 코딩하기 위해 사용하는 통계적인 코돈 분포이다. 바이어스를 측정한 후, 관심있는 유전자(들) 내의 코돈의 빈도%를 측정한다. 식물이 선호하는 제 1 코돈은 바람직한 코돈의 제 2 및 제 3의 선택과 함께 결정되어야 한다. 관심있는 단백질의 아미노산 서열이 역번역되어 생성된 핵산 서열은 천연 박테리아 유전자에서와 동일한 단백질을 코딩하지만, 이 생성된 핵산 서열은 원하는 식물의 바람직한 제 1 코돈에 해당한다. 새로운 서열을 변경에 의해 생성될 수 있는 제한 효소 자리에 대해 분석한다. 동정된 자리는 코돈을 제 2 또는 제 3 선택의 바람직한 코돈으로 교체함으로써 추가로 변경된다. 관심있는 유전자의 전사 또는 번역에 영향을 끼칠 수 있는 서열내의 다른 자리는 엑손:인트론 5' 또는 3' 결합, 폴리 A 첨가 신호, 또는 RNA 폴리머라제 종결 신호이다. 서열은 추가로 분석되고 TA 또는 GC 더블렛(doublet)의 빈도를 감소시키기 위해 변경된다. 더블렛 외에, 약 4개 이상의 동일한 잔기를 갖는 G 또는 C 서열 블록이 서열의 전사에 영향을 끼칠 수 있다. 따라서, 이들 블록은 또한 제 1 또는 제 2 선택 등의 코돈을 다음 바람직한 선택의 코돈으로 교체함으로써 변경된다. 식물 최적화된 유전자(들)가 약 63%의 제 1 선택 코돈, 약 22% 내지 약 37%의 제 2 선택 코돈, 및 15% 내지 0%의 제 3 선택 코돈을 포함하는 것이 바람직하며, 총 %는 100%이다. 가장 바람직한 식물 최적화된 유전자(들)는 약 63%의 제 1 선택 코돈, 적어도 약 22%의 제 2 선택 코돈, 약 7.5%의 제 3 선택 코돈 및 약 7.5%의 제 4 선택 코돈을 포함하며, 총 %는 100%이다. 전술된 방법으로 당업계의 숙련인은 특정 식물에 외인성인 유전자(들)을 변경하여 유전자가 식물내에서 최적으로 발현되도록 할 수 있다. 이 방법은 1997년 4월 17일 WO97/13402로 공개된 국제 특허 출원 제PCT/US96/16582호에 더 설명되어 있다.To reengineer the bacterial gene (s), the codon bias of the plant is measured. Codon bias is the statistical codon distribution that a plant uses to encode its protein. After measuring the bias, the percentage of codons in the gene (s) of interest is determined. The first codon preferred by the plant should be determined with the second and third choice of preferred codons. The nucleic acid sequence generated by reverse translation of the amino acid sequence of the protein of interest encodes the same protein as in the native bacterial gene, but this generated nucleic acid sequence corresponds to the preferred first codon of the desired plant. New sequences are analyzed for restriction enzyme sites that can be generated by alterations. The identified site is further modified by replacing the codon with the preferred codon of the second or third choice. Other sites in the sequence that may affect the transcription or translation of the gene of interest are exon: intron 5 'or 3' binding, poly A addition signals, or RNA polymerase termination signals. The sequence is further analyzed and altered to reduce the frequency of TA or GC doublets. In addition to the doublet, G or C sequence blocks having about 4 or more identical residues may affect the transcription of the sequence. Thus, these blocks are also modified by replacing a codon, such as a first or second selection, with a codon of the next preferred selection. Preferably, the plant optimized gene (s) comprises about 63% of the first selection codon, about 22% to about 37% of the second selection codon, and 15% to 0% of the third selection codon, total% Is 100%. The most preferred plant optimized gene (s) comprises about 63% of the first selection codon, at least about 22% of the second selection codon, about 7.5% of the third selection codon and about 7.5% of the fourth selection codon, The total percentage is 100%. By the methods described above, one skilled in the art can alter the gene (s) exogenous to a particular plant so that the gene is optimally expressed in the plant. This method is further described in International Patent Application No. PCT / US96 / 16582, published April 17, 1997, WO97 / 13402.

따라서, 식물 최적화된 유전자(들)를 디자인하기 위해서는, 형질전환될 특정 식물의 유전자 DNA 서열에 대해 파악한 코돈 바이어스 표로부터 확정된 비여분의 유전자 코드를 사용하여, 독소의 아미노산 서열을 DNA 서열로 역번역시킨다. 코돈 사용에서 완전하게 상동성인, 생성된 DNA 서열은 더 높은 정도의 코돈 다양성 외에 또한 전략적으로 배치된 제한 효소 인식 자리 및 바람직한 염기 조성물을 갖고, 유전자의 전사 또는 생성물 mRNA의 번역을 방해할 수 있는 서열이 결여된 DNA 서열을 정하기 위해 추가로 변경된다.Thus, in order to design plant optimized gene (s), the amino acid sequence of the toxin is reversed into the DNA sequence, using the extra gene code determined from the codon bias table identified for the gene DNA sequence of the particular plant to be transformed. Translate. The resulting DNA sequence, which is completely homologous in codon use, has a restriction enzyme recognition site and a preferred base composition that is strategically placed in addition to a higher degree of codon diversity and that may interfere with transcription of the gene or translation of the product mRNA. Further modifications are made to establish this missing DNA sequence.

박테리아 유전자가 색소체(plastid)내에서 발현되는 경우에는 이론상 식물내에서 그 박테리아 유전자는 식물 내에서 더 쉽게 발현될 수 있다. 이런 경우 식물 발현을 위해 유전자를 최적화시키지 않고도, 식물내에서 박테리아 유전자를 발현시킬 수 있으며, 단백질을 높은 발현율로 수득할 수 있다. 본원에서 참고로 인용한 미국 특허 제 4,762,785호, 제 5,451,513호 및 제 5,545,817호를 참조하시오.When a bacterial gene is expressed in a plastid, in theory the bacterial gene can be more easily expressed in the plant. In this case, bacterial genes can be expressed in plants without optimizing the genes for plant expression, and proteins can be obtained at high expression rates. See US Pat. Nos. 4,762,785, 5,451,513 and 5,545,817, which are incorporated herein by reference.

유전자전환 식물을 상업적으로 이용하는데 관한 문제점 중 하나는 내성 관리이다. 이는 특히 바실루스 터린기엔시스(Bacillus thuringiensis) 독소에 있어서 그러하다. 많은 회사가 바실루스 터린기엔시스를 상업적으로 이용하며, Bt 독소가 내성이 되는 것에 대하여 많은 관심을 두고 있다. 곤충 내성 관리의 한 방법은 포토랍두스에 의해 생산된 독소를 Bt와 같은 독소, 식물 곤충 단백질(Ciba Geigy) 또는 다른 독소와 결합시키는 것이다. 이 결합물은 분무가능한 적용을 위해 제형화될 수 있거나, 분자 결합물이 될 수 있다. 식물은 곤충 독소를 생성하는 포토랍두스 유전자, 및 Bt와 같은 다른 곤충 독소 유전자로 형질전환될 수 있다.One of the problems with commercial use of transgenic plants is resistance management. This is especially true for Bacillus thuringiensis toxins. Many companies use Bacillus terringiensis commercially and are very concerned about the resistance of Bt toxins. One method of managing insect resistance is to combine toxins produced by photolapids with toxins such as Bt, plant insect proteins (Ciba Geigy) or other toxins. This binder may be formulated for sprayable applications or may be a molecular binder. Plants can be transformed with the photolapose gene, which produces insect toxins, and other insect toxin genes such as Bt.

유럽 특허 출원 0400246A1에서는 임의의 2개의 유전자일 수 있는, 식물내 2개의 Bt의 형질전환을 설명하였다. 하나 이상의 곤충 내성 유전자를 포함하는 유전자전환(transgenic) 식물을 생산하기 위한 다른 방법은 각각의 식물이 곤충 내성 유전자를 포함하는 2개의 식물을 생산하는 것이다. 이들 식물은 하나 이상의 곤충 내성 유전자를 포함하는 식물을 생산하기 위해 전통적인 식물 교배 기술을 사용하여 역교배될 수 있다.European patent application 0400246A1 describes the transformation of two Bt in plants, which can be any two genes. Another method for producing transgenic plants comprising one or more insect resistance genes is that each plant produces two plants containing insect resistance genes. These plants can be backcrossed using traditional plant breeding techniques to produce plants comprising one or more insect resistance genes.

식물 최적화된 유전자(들)를 포함하는 유전자전환 식물을 생산하는 것 외에, 박테리아 유전자(들)를 재공학처리하는 것이 요망될 수 있는 다른 전달계가 존재한다. 동일한 라인을 따라, 먹이원으로서 곤충을 유인하는 분자 및 독소의 살충 활성을 함께 융합시키는, 유전 공학처리되고 쉽게 단리된 단백질 독소를 잘 알려진 표준 기술을 사용하여 박테리아 또는 진핵세포내에 공학처리되고 발현될 수 있다. 실험실에서의 정제 후에, "조립된(built-in)" 미끼를 갖는 그러한 독성 약제를 표준 곤충 덫 하우징내에 포장할 수 있다.In addition to producing transgenic plants containing plant optimized gene (s), there are other delivery systems that may be desired to reengineer bacterial gene (s). Along the same lines, genetically engineered and easily isolated protein toxins, which fuse together the pesticidal activity of molecules and toxins that attract insects as a food source, can be engineered and expressed in bacteria or eukaryotic cells using well known standard techniques. Can be. After purification in the laboratory, such toxic agents with "built-in" baits can be packaged in a standard insect trap housing.

다른 전달계는 바쿨로바이러스 벡터내로의 독소의 유전 물질을 혼입하는 것이다. 바쿨로바이러스는 포토랍두스 독소의 바람직한 표적을 포함하는 특정한 곤충 숙주를 감염시킨다. 포토랍두스 독소를 위한 발현 구조물을 포함하는 감염성 바쿨로바이러스를 곤충 만연 지역으로 도입하여, 곤충을 감염시켜 유독화시키거나 중독시킬 수 있다.Another delivery system is the incorporation of the toxin's genetic material into the baculovirus vector. Baculoviruses infect certain insect hosts that include the desired targets of photolabose toxin. Infectious baculoviruses containing expression constructs for the photolaptoxin can be introduced into an insect rampant area to infect and poison or poison the insect.

살충 특성을 전달하기 위해서는 벡터가 거주할 숙주에 적합한 단백질 발현 벡터내로, 포토랍두스 독소의 코딩 아미노산 서열을 코딩하는 핵산 서열이 통합될 필요가 있다. 살충 특성을 갖는 단백질을 코딩하는 핵산 서열을 수득하기 위한 한 방법은 독소의 아미노산 서열로부터 추정된 정보(이의 대부분이 하기에 설명됨)를 이용하여 포토랍두스에서 독소를 생산하는 천연 유전 물질을 단리하는 것이다. 후술될 바와 같이, 독소 활성에 관여하는 단백질의 정제 방법을 또한 개시한다.In order to deliver pesticidal properties, the nucleic acid sequence encoding the coding amino acid sequence of the photolabose toxin needs to be integrated into a protein expression vector suitable for the host where the vector will reside. One method for obtaining nucleic acid sequences encoding proteins with pesticidal properties is to isolate natural genetic material that produces toxins in Photorapdus using information estimated from the amino acid sequences of the toxins, most of which are described below. It is. As described below, a method of purifying a protein involved in toxin activity is also disclosed.

하기한 바와 같은 N-말단 아미노산 서열 데이터를 사용하여, 독소의 제 1 아미노산을 코딩하는 DNA 염기의 전부 또는 일부에 상보적인 올리고뉴클레오티드를 제작할 수 있다. 이들 올리고뉴클레오티드는 방사성표지화된 후, 포토랍두스의 균주에서 단리된 유전 물질로부터 제작한 게놈 유전자 라이브러리에서 유전 물질을 단리하기 위한 분자 프로브로서 사용될 수 있다. 유전자 라이브러리는 플라스미드, 코스미드, 파지 또는 파지미드 벡터내에 클로닝될 수 있다. 이 라이브러리로 에스케리치아 콜리(Escherichia coli)를 형질전환시키고 이 형질전환된 세포가 독소를 생산하는지 여부를 알기 위해 이 독소에 대해 발생된 항체를 사용하여 스크리닝하거나, 곤충 독성에 대해 직접 분석할 수 있다.Using the N-terminal amino acid sequence data as described below, oligonucleotides complementary to all or part of the DNA base encoding the first amino acid of the toxin can be prepared. These oligonucleotides can be radiolabelled and then used as molecular probes for isolating genetic material from genomic gene libraries made from genetic material isolated from strains of photolapose. Gene libraries can be cloned into plasmids, cosmids, phage or phagemid vectors. The library can be used to transform Escherichia coli and screen it using antibodies generated against this toxin to determine whether the transformed cells produce a toxin, or directly analyze for insect toxicity. have.

동의성 유전 코드가 수개의 3-뉴클레오티드 조합 중 임의의 것에 의해 아미노산이 DNA내에서 코딩될 수 있도록하므로, 이러한 연구는 한벌의 올리고뉴클레오티드의 생산을 필요로한다. 예를 들면, 아미노산 아르기닌은 핵산 트리플렛 CGA, CGC, CGG, CGT, AGA 및 AGG에 의해 코딩될 수 있다. 독소 유전자내에서 그러한 위치에서 어떠한 트리플렛이 사용되는지를 예측할 수 없으므로, 제시된 각각의 가능한 트리플렛을 갖는 올리고뉴클레오티드를 제조하여야 한다. 단백질 서브유닛에 상응하는 하나 이상의 DNA 분자가 경구 독성을 성취하기 위해 필수적인 단백질 서브유닛의 전부를 회수하기 위한 충분한 수의 올리고뉴클레오티드 프로브를 제작하기 위해 필수적일 수 있다.Since the synonymous genetic code allows amino acids to be encoded in DNA by any of several 3-nucleotide combinations, this study requires the production of a set of oligonucleotides. For example, the amino acid arginine can be encoded by nucleic acid triplets CGA, CGC, CGG, CGT, AGA and AGG. Since it is not possible to predict which triplet is used at that position in the toxin gene, oligonucleotides should be prepared with each possible triplet presented. One or more DNA molecules corresponding to protein subunits may be necessary to construct a sufficient number of oligonucleotide probes to recover all of the protein subunits necessary to achieve oral toxicity.

분자 생물학 분야의 숙련인에게 잘 공지된 몇몇 기술중 임의의 것을 사용하여 정제된 단백질의 아미노산 서열로부터, 독소의 생산을 책임지는 유전 물질을 쉽게 분리하여, 전체 또는 일부를 발현 벡터내로 클로닝시킬 수 있다. 전형적인 발현 벡터는 DNA 플라스미드이지만, 코스미드, 파지미드 및 파지를 포함하지만 이에 한정되지 않는 다른 전달 수단도 또한 계획될 수 있다. 플라스미드 복제를 위해 필요하거나 요구되는 특징, 예를 들면, 복제 기원 및 항생제 내성 또는 선택가능한 마커의 다른 형태, 예를 들면, 스트렙토마이시스 하이그로스코피쿠스(Streptomyces hygroscopicus) 또는 비리도크로모겐스(viridochromogene)의 bar 유전자 외에, 단백질 발현 벡터는 일반적으로 관심있는 유전자의 전사 및 번역에 필요한 시스-작용 서열을 혼입하는 발현 카셋트를 부가적으로 필요로한다. 원핵세포내의 발현을 위해 요구되는 시스-작용 서열은 진핵세포 및 식물에서 요구되는 것과 상이하다.Any of several techniques well known to those skilled in the molecular biology field can be easily isolated from the amino acid sequence of the purified protein to clone all or part of the genetic material responsible for the production of toxins into an expression vector. . Typical expression vectors are DNA plasmids, but other means of delivery can also be envisioned, including but not limited to cosmids, phagemids and phages. Features required or required for plasmid replication, for example replication origin and other forms of antibiotic resistance or selectable markers, for example Streptomyces hygroscopicus or viridochromogene In addition to the bar gene of, protein expression vectors generally additionally require an expression cassette that incorporates the cis-acting sequences required for transcription and translation of the gene of interest. The cis-acting sequences required for expression in prokaryotic cells differ from those required in eukaryotic cells and plants.

진핵세포 발현 카셋트는 관심있는 유전자에 대한 상류(5')의 전사 프로모터, 폴리-A 첨가 자리와 같은 전사 종결 영역 및 관심있는 유전자의 제 1 코돈의 상류의 리보솜 결합 자리를 필요로한다. 박테리아 세포에서, 벡터내로 포함될 수 있는 유용한 전사 프로모터는 T7 RNA 폴리머라제-결합 프로모터이다. 본원에서 전술된 바와 같은 프로모터는 mRNA의 전사를 유효하게 진행시키는 것으로 공지되어 있다. 또한, 관심있는 유전자의 상류에서, 벡터는 단백질을 세포 표면과 같은 숙주 세포의 특정 부분에 공유적으로 결합시키는 것으로 공지된 신호 서열을 코딩하는 뉴클레오티드 서열을 포함할 수 있다.Eukaryotic expression cassettes require a 5 ') transcriptional promoter upstream to the gene of interest, a transcription termination region such as a poly-A addition site and a ribosomal binding site upstream of the first codon of the gene of interest. In bacterial cells, a useful transcriptional promoter that can be incorporated into a vector is the T7 RNA polymerase-binding promoter. Promoters as described herein above are known to effectively advance the transcription of mRNA. In addition, upstream of the gene of interest, the vector may comprise a nucleotide sequence that encodes a signal sequence known to covalently bind the protein to a specific portion of the host cell, such as the cell surface.

곤충 바이러스 또는 바쿨로바이러스는 특정한 곤충을 감염시켜 부작용을 끼치는 것으로 공지되어 있다. 곤충에 대한 바이러스의 영향은 느리며, 바이러스는 곤충의 먹이섭취를 중단시키지 않는다. 따라서, 바이러스는 곤충 해충 방제제로서 유용한 것으로 보이지 않는다. 포토랍두스 독소 유전자를 바쿨로바이러스 벡터내로 결합시키면, 바이러스의 치사율을 증가시키면서 독소의 전달의 유효한 방법을 제공할 수 있다. 그외에, 상이한 바쿨로바이러스가 상이한 곤충에 특이적이므로, 특히 해를 끼치는 곤충 해충을 선택적으로 표적으로하기 위해 특정 독소를 사용하는 것이 가능할 수 있다. 독소 유전자를 위해 특히 유용한 벡터는 핵 폴리헤드로시스 바이러스이다. 이 바이러스를 이용하는 전달 벡터는 이전에 기술되었고, 현재 곤충에 외부 유전자를 전달시키기 위한 선택 벡터이다. 바이러스-독소 유전자 재조합물은 경구 전달가능한 형태로 제작될 수 있다. 바쿨로바이러스는 일반적으로 곤충의 중장 장점막을 통하여 감염시킨다. 강한 바이러스의 코트 단백질 프로모터의 뒤에 삽입된 독소 유전자가 발현되어 감염된 곤충을 신속하게 죽일 것이다.Insect viruses or baculoviruses are known to infect certain insects and cause side effects. The effect of the virus on insects is slow, and the virus does not stop insect feeding. Thus, viruses do not appear to be useful as insect pest control agents. Incorporation of the photolapus toxin gene into a baculovirus vector can provide an effective method of delivery of toxins while increasing the lethality of the virus. In addition, since different baculoviruses are specific to different insects, it may be possible to use certain toxins to selectively target particularly harmful insect pests. Particularly useful vectors for toxin genes are nuclear polyhedrosis viruses. Delivery vectors using this virus have been described previously and are currently the selection vectors for delivering foreign genes to insects. Virus-toxin gene recombinants may be constructed in oral deliverable form. Baculoviruses generally infect the insect's midgut membranes. Toxin genes inserted behind the strong viral coat protein promoter will be expressed and will quickly kill infected insects.

곤충 바이러스 또는 바쿨로바이러스 또는 본 발명의 단백질 독소를 위한 유전자전환 식물 전달계 외에, 단백질은 바실루스 터린기엔시스 캡슐화 기술(예를 들면, 본원에서 모두 참고로 인용한 미국 특허 제 4,695,455호, 제 4,695,462호, 제 4,861,595호에서와 같지만 이에 한정되지는 않음)을 사용하여 캡슐화될 수 있다. 본 발명의 단백질 독소를 위한 다른 전달계는 미끼 매트릭스 내로의 단백질의 제제이며, 이어서, 이 제제를 지상 또는 지하 곤충 미끼 스테이션에서 사용할 수 있다. 그러한 기술의 예는 본원에서 참고로 인용한 PCT 특허 출원 WO 93/23998을 포함하지만 이에 제한되지는 않는다.In addition to transgenic plant delivery systems for insect viruses or baculoviruses or protein toxins of the present invention, proteins are also known as Bacillus terringiensis encapsulation techniques (e.g., US Pat. Nos. 4,695,455, 4,695,462, all of which are incorporated herein by reference). As in, but not limited to, US Pat. No. 4,861,595. Another delivery system for the protein toxins of the present invention is the preparation of proteins into the bait matrix, which can then be used at ground or underground insect bait stations. Examples of such techniques include, but are not limited to, the PCT patent application WO 93/23998, which is incorporated herein by reference.

전술된 바와 같이, 다른 숙주의 코돈 선호도가 포토랍두스와는 상이할 수 있으므로, 비천연 숙주에서 발현시키는 경우, 단백질을 코딩하는 서열을 변경하는 것이 필요할 수 있다. 그러한 경우, 코딩 서열에 대한 보충 변경을 하지 않는다면, 새로운 숙주내에서 번역은 매우 불충분할 수 있다. 부가적으로, 새로운 숙주의 단백질과의 억제 교차 반응성을 피하거나, 새로운 숙주내에서 단백질의 살충 특성을 개량하기 위해 아미노산 서열에 대한 변형이 요망될 수 있다. 유전적으로 변형된 독소 유전자는 예를 들면, 증강되거나 감소된 독성, 변환된 곤충 내성 개발, 변환된 안정성 또는 변형된 표적 종 특이성을 나타내는 독소를 코딩할 것이다.As mentioned above, codon preferences of other hosts may be different from photolapidus, so when expressed in non-natural hosts, it may be necessary to alter the sequence encoding the protein. In such cases, without making supplemental changes to the coding sequence, the translation in the new host may be very insufficient. In addition, modifications to amino acid sequences may be desired to avoid inhibitory cross-reactivity with proteins of the new host or to improve the pesticidal properties of the protein in the new host. Genetically modified toxin genes will encode toxins that exhibit, for example, enhanced or reduced toxicity, transformed insect resistance development, transformed stability, or modified target species specificity.

독소를 코딩하는 포토랍두스 유전자 외에, 본 발명은 범위는 독소 단백질에 상동성인 아미노산 생중합체를 코딩하고, 곤충류에서 경구 섭취후에 포토랍두스 단백질의 독성 효과를 보유하는 관련 핵산 서열을 포함하는 것이다.In addition to photolabose genes encoding toxins, the present invention encompasses related nucleic acid sequences that encode amino acid biopolymers homologous to toxin proteins and retain the toxic effects of photolabose protein after oral ingestion in insects.

예를 들면, 본 발명에서 사용된 독소는 유충을 죽이기 전에 먼저 유충의 먹이 섭취를 억제하는 것으로 보인다. 포토랍두스 독소의 핵산 서열 또는 그의 제어 서열을 조작함으로써, 독소 유전자를 식물내에 배치시키는 유전 공학자는 예를 들면, 유충에 대한 완전한 독성을 제거하면서 먹이섭취-저해 활성을 유지시키기위해 그의 효력 또는 그의 작용 양식을 조정할 수 있다. 이러한 변화는 형질전환된 식물이 모든 표적 곤충을 생태계내에서 없애는 불필요한 극적인 효과를 갖지 않고도 추수때까지 생존할 수 있도록 한다. 독소를 코딩하는 유전자 또는 유전자에 의해 코딩되는 단백질의 모든 그러한 변경은 본 발명의 범위내에 있는 것으로 계획된다.For example, the toxin used in the present invention seems to inhibit the larva's food intake before killing the larva. By manipulating the nucleic acid sequence of the photolabose toxin or its control sequence, the genetic engineer placing the toxin gene in the plant can, for example, remove its full toxicity against larvae and maintain its ingestion-inhibiting activity while maintaining its ingestion-inhibiting activity. You can adjust the mode of action. This change allows the transformed plant to survive till harvest without the unnecessary dramatic effect of removing all target insects from the ecosystem. All such alterations of the gene encoding the toxin or the protein encoded by the gene are envisioned to be within the scope of the present invention.

핵산의 다른 계획된 변경은 그의 효능을 개선하기 위해 곤충 유충의 특정 부위로 독소를 전달시키는 표적 서열의 첨가를 포함한다.Other planned alterations of nucleic acids include the addition of target sequences that deliver toxins to specific sites of insect larvae to improve their efficacy.

균주 W-14, ATCC 55397, 43948, 43949, 43950, 43951 및 43952는 아메리칸 타입 컬쳐 컬렉션(미국 20852 메릴랜드주 록크빌 파크로운 드라이브 12301)에 기탁되어 있다. W-14 천연 독소(ATCC 55397)에 대한 아미노산 및 뉴클레오티드 서열 데이터를 하기에 제시한다. 박테리아 숙주로부터의 독소에 대한 게놈 DNA의 단리를 또한 본원에서 예시한다. 본원의 다른 균주는 미농무부 (미국 일리노이주 페오리아 노쓰 유니버시티 드라이브 1815)에 기탁되었다.Strains W-14, ATCC 55397, 43948, 43949, 43950, 43951 and 43952 have been deposited in the American Type Culture Collection (Rockville Parknrow Drive 12301, Maryland, USA 20852). Amino acid and nucleotide sequence data for W-14 natural toxin (ATCC 55397) are shown below. Isolation of genomic DNA for toxins from bacterial hosts is also exemplified herein. Other strains herein have been deposited with the US Department of Agriculture (Feoria North University Drive 1815, Illinois, USA).

표준 및 분자 생물학 기술은 본원에서 명세서에 후술하고 교시한다. 부가의 정보는 본원에 참고로 인용한 문헌[Sambrook, J., Fritsch, E.F., 및 Maniatis, T. (1989), Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press] 및 [Current Protocalsin Molecular Biology, ed. F. M. Ausubel et al., (1997)]에서 찾을 수 있다.Standard and molecular biology techniques are described and taught herein below in the specification. Additional information can be found in Sambrook, J., Fritsch, EF, and Maniatis, T. (1989), Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Press, and Current Protocalsin Molecular Biology, ed . F. M. Ausubel et al., (1997).

하기 약자를 실시예 전체에서 사용한다: Tris= 트리스(히드록시메틸) 아미노 메탄; SDS= 소듐 도데실 술페이트; EDTA= 에틸렌디아민테트라아세트산; IPTG= 이소프로필티오-B-갈락토시드; X-gal= 5-브로모-4-클로로-3-인도일-B-D-갈락토시드; CTAB= 세틸트리메틸암모늄 브로마이드; kbp= 킬로염기 쌍; dATP, dCTP, dGTP, dTTP, I= 각각 아데닌, 시토신, 구아닌, 티민 및 이노신의 2'-데옥시뉴클레오시드 5'-트리포스페이트; ATP= 아데노신 5'-트리포스페이트.The following abbreviations are used throughout the examples: Tris = tris (hydroxymethyl) amino methane; SDS = sodium dodecyl sulfate; EDTA = ethylenediaminetetraacetic acid; IPTG = isopropylthio-B-galactoside; X-gal = 5-bromo-4-chloro-3-indoyl-B-D-galactoside; CTAB = cetyltrimethylammonium bromide; kbp = kilobase pair; dATP, dCTP, dGTP, dTTP, I = 2'-deoxynucleoside 5'-triphosphate of adenine, cytosine, guanine, thymine and inosine, respectively; ATP = Adenosine 5'-triphosphate.

〈실시예 1〉<Example 1>

포토랍두스 루미네센스 유래의 독소의 정제 및 정제된 독소의 경구 전달 후의 독성의 증명Purification of toxins derived from photolapus luminescence and demonstration of toxicity after oral delivery of purified toxins

본 발명의 살충 단백질 독소를 포토랍두스 루미네센스 균주 W-14, ATCC 기탁 번호 55397로부터 정제하였다. 포토랍두스 루미네센스의 원배양물을 1.5% 아가 중 2% 프로테오스 펩톤 #3(즉, PP3, Difco Laboratories, Detroit MI)가 들어있는 페트리 접시 상에 유지하고, 25℃에서 배양하고 매주 옮겼다. 박테리아의 제 1 형태의 콜로니를 1ℓ 플라스크 중에서 0.5%의 폴리옥시에틸렌 소르비탄 모노스테아레이트(트윈 60(Tween 60), Sigma Chemical Company, St. Louis MO)가 보충된 200㎖의 PP3 브로쓰내로 접종하였다. 브로쓰 배양물을 회전 진탕기 상에서 30℃에서 72시간 동안 성장시켰다. 트윈의 존재 또는 부재하에 성장된 배양물로부터 독소 단백질을 회수할 수 있지만; 트윈이 부재하면 성장된 박테리아의 형태 및 박테리아에 의해 생산된 단백질의 프로파일에 영향을 끼칠 수 있다. 트윈의 부재하에, 적어도 하나의 동정된 독소 서브유닛의 분자량이 약 200 kDa에서 약 185 kDa로 이동하는 한, 변형 이동(variant shift)이 발생한다.Insecticidal protein toxins of the present invention were purified from photolabduum luminescence strain W-14, ATCC deposit no. 55397. The original culture of photolapus luminescence was maintained on a Petri dish containing 2% Proteose Peptone # 3 (ie PP3, Difco Laboratories, Detroit MI) in 1.5% agar, incubated at 25 ° C. and weekly Moved. Colonies of the first form of bacteria were inoculated into 200 ml PP3 broth supplemented with 0.5% polyoxyethylene sorbitan monostearate (Tween 60, Sigma Chemical Company, St. Louis MO) in a 1 L flask. It was. Broth cultures were grown for 72 hours at 30 ° C. on a rotary shaker. Toxin proteins can be recovered from cultures grown in the presence or absence of tweens; The absence of tweens can affect the shape of the grown bacteria and the profile of the proteins produced by the bacteria. In the absence of tweens, as long as the molecular weight of at least one identified toxin subunit shifts from about 200 kDa to about 185 kDa, variant shifts occur.

72 시간 배양물을 10,000×g에서 30분 동안 원심분리하여 세포 및 파쇄물을 제거하였다. 살충 활성을 포함하는 상청액 분획을 기울어 따르고 적절한 용적의 1.0M K2HPO4를 첨가함으로써 50mM K2HPO4로 조정하였다. 수산화칼륨을 첨가함으로써 pH를 8.6으로 조정하였다. 이어서, 이 상청액 분획을 50mM K2HPO4로 평형화된 DEAE-세파셀(Sephacel) (Pharmacia LKB Biotechnology)와 혼합시켰다. 독성 활성이 DEAE 수지에 흡착되었다. 이어서, 이 혼합물을 2.6×40㎝ 컬럼에 따르고, 유출액이 280㎚에서 정상(steady) 베이스라인 UV 흡수에 도달할때까지 실온에서 30㎖/hr의 유동속도로 50mM K2HPO4로 세척하였다. 이어서, 컬럼을 유출액이 다시 정상 280㎚ 베이스라인에 도달할때까지 150mM KCl로 세척하였다. 최종적으로, 컬럼을 300mM KCl로 세척하고, 분획을 수집하였다.The 72 hour culture was centrifuged at 10,000 × g for 30 minutes to remove cells and debris. The supernatant fractions containing pesticidal activity were decanted and adjusted to 50 mM K 2 HPO 4 by addition of 1.0 MK 2 HPO 4 in the appropriate volume. The pH was adjusted to 8.6 by adding potassium hydroxide. This supernatant fraction was then mixed with DEAE-Sephacel (Pharmacia LKB Biotechnology) equilibrated with 50 mM K 2 HPO 4 . Toxic activity was adsorbed on DEAE resin. The mixture was then poured into a 2.6 × 40 cm column and washed with 50 mM K 2 HPO 4 at room temperature at a flow rate of 30 ml / hr until the effluent reached steady baseline UV absorption at 280 nm. The column was then washed with 150 mM KCl until the effluent reached the normal 280 nm baseline again. Finally, the column was washed with 300 mM KCl and fractions collected.

독소를 포함하는 분획을 모으고, 0.2미크론 공극 막 필터를 사용하여 여과 멸균하였다. 이어서, 독소를 농축시키고, 4℃에서 100 kDa의 분자량 컷오프를 갖는 초여과막(Centriprep 100, Amicon Division-W.R. Grace and Company)을 사용하여 100mM KPO4, pH 6.9로 평형화시켰다. 독소 농축물의 3㎖ 샘플을 2.6×95㎝ 세파크릴(Sephacryl) S-400 HR 겔 여과 컬럼(Pharmacia LKB Biotechnology)의 상단에 적용하였다. 용출 완충액은 100mM KPO4, pH 6.9이었고, 이를 4℃에서 17㎖/hr의 유동속도로 전개시켰다. 용출물을 280㎚에서 모니터링하였다.Fractions containing toxins were pooled and filtered sterilized using a 0.2 micron pore membrane filter. The toxin was then concentrated and equilibrated to 100 mM KPO 4 , pH 6.9 using an ultrafiltration membrane (Centriprep 100, Amicon Division-WR Grace and Company) having a molecular weight cutoff of 100 kDa at 4 ° C. A 3 ml sample of toxin concentrate was applied on top of a 2.6 × 95 cm Sephacryl S-400 HR gel filtration column (Pharmacia LKB Biotechnology). The elution buffer was 100 mM KPO 4 , pH 6.9, which was developed at 4 ° C. at a flow rate of 17 ml / hr. Eluate was monitored at 280 nm.

분획을 모으고, 독성 활성에 대하여 시험하였다. 크로마토그래피 분획의 독성을 만두카 섹스타(Manduca sexta) 유충을 사용하는 생물학적 분석으로 시험하였다. 분획을 곤충 먹이(매미나방 밀 배(germ) 먹이, ICN Biochemicals Division - ICN Biomedicals, Inc.) 상에 직접 적용하거나 5㎕의 샘플을 30게이지 바늘을 사용하여 4회 또는 5회령(instar) 유충의 제 1 전각(proleg)을 통하여 인트라헤모셀릭 (intrahemocelic) 주사에 의해 투여하였다. 처리군내의 각각의 유충의 무게를 24시간 간격으로 기록하였다. 처리된 곤충 먹이를 소비한 수일내에 곤충이 먹이섭취를 중단하고 죽거나, 분획을 주사한 후 24시간 내에 죽는다면 독성이 추정된다.Fractions were pooled and tested for toxic activity. The toxicity of the chromatographic fractions was tested by biological assays using Manduca sexta larvae. Fractions can be applied directly to insect food (Cornabis wheat germ food, ICN Biochemicals Division-ICN Biomedicals, Inc.) or 5 μL of samples can be obtained from 4 or 5 instar larvae using a 30 gauge needle. Administration was by intrarahemocelic injection via the first proleg. The weight of each larvae in the treatment group was recorded at 24 hour intervals. Toxicity is estimated if the insect stops eating and dies within 24 days of consuming the treated insect food, or dies within 24 hours after injection of the fraction.

독성 분획을 모으고 센트리프렙(Centriprep)-100을 사용하여 농축시킨 다음, 100mM의 인산 칼륨, pH 6.9의 용출 완충액을 0.4㎖/분으로 전개하면서 7.5㎜×60㎝ TSK-GEL G-4000 SW 겔 삼투 컬럼을 사용하여 HPLC에 의해 분석하였다. 이 분석으로 독소 단백질이 약 33.6분의 보유 시간으로 컬럼으로부터 용출된 하나의 날카로운 피크내에 포함되는 것을 밝혔다. 이 보유 시간은 1,000 kDa의 추정된 분자량에 상응하였다. 추가의 정제를 위해 피크 분획을 모으고, 이 단백질을 포함하지 않는 분획을 폐기하였다. HPLC로부터 용출된 피크는 218 및 280㎚에서 UV 광을 흡수하지만, 405㎚에서는 흡수하지 않았다. 405㎚에서의 흡수는 제노랍딘 항생제 화합물에 의한 것으로 나타났다.Toxic fractions were collected and concentrated using Centriprep-100, then 7.5 mm × 60 cm TSK-GEL G-4000 SW gel with 100 mM potassium phosphate, pH 6.9 elution buffer running at 0.4 ml / min. Analysis by HPLC using an osmosis column. This analysis revealed that the toxin protein was contained within one sharp peak eluted from the column with a retention time of about 33.6 minutes. This retention time corresponds to an estimated molecular weight of 1,000 kDa. Peak fractions were collected for further purification and fractions not containing this protein were discarded. The peak eluted from HPLC absorbed UV light at 218 and 280 nm but not at 405 nm. Absorption at 405 nm was shown to be caused by the genorabine antibiotic compound.

모은 피크 분획을 비-변성 아가로즈겔(Metaphor Agarose, FMC BioProducts) 내에서 전기영동하면, 두 개의 단백질 복합체가 피크내에 존재함을 나타냈다. 50 mM Tris-HCl(pH 7.0)에 완충된 피크 물질을 표준 완충 조건(양극 완충액 1M Tris-HCl(pH 8.3); 음극 완충액 0.025M Tris, 0.192M 글라이신)하에 100mM Tris-HCl(pH 7.0)로 완충된 1.5% 아가로즈 스태킹 겔 및 200mM Tris-보레이트(pH8.3)으로 완충된 1.9% 아가로즈 용해 겔 상에서 분리하였다. 겔을 15℃에서 13㎃의 불변 전류에서 페놀 레드 트랙킹 염료가 겔의 단부에 도달할때까지 전개시켰다. 두 개의 단백질 밴드가 쿠마지 브릴리언트 블루(Coomassie brilliant blue) 염색을 사용하여 아가로즈 겔에 가시화되었다.The collected peak fractions were electrophoresed in non-modified agarose gel (Metaphor Agarose, FMC BioProducts), indicating that two protein complexes were present in the peak. Peak material buffered in 50 mM Tris-HCl, pH 7.0 was transferred to 100 mM Tris-HCl, pH 7.0, under standard buffer conditions (anode buffer 1M Tris-HCl, pH 8.3); cathodic buffer 0.025M Tris, 0.192M glycine). It was isolated on a buffered 1.5% agarose stacking gel and a 1.9% agarose lysis gel buffered with 200 mM Tris-borate, pH8.3. The gel was developed at 15 ° C. at a constant current of 13 mA until the phenol red tracking dye reached the end of the gel. Two protein bands were visualized on the agarose gel using Coomassie brilliant blue staining.

느리게 이동하는 밴드를 "단백질 밴드 1"로 지칭하고, 빠르게 이동하는 밴드를 "단백질 밴드 2"로 지칭하였다. 두 개의 단백질 밴드는 대략 동일한 양으로 존재하였다. 겔의 비염색된 부분으로부터 두 개의 단백질 밴드를 정확하게 절제하기 위해, 쿠마지 염색된 아가로즈 겔을 가이드로서 사용하였다. 단백질 밴드를 포함하는 절제된 조각을 용매에 넣어 부드럽게하고, 소량의 멸균수를 첨가하였다. 대조군으로서, 단백질을 포함하지 않는 겔의 일부를 또한 절제하고, 단백질을 포함하는 겔 조각에서와 동일한 방법으로 처리하였다. 단백질을 전기용출에 의해 100V(불변 전압)에서 겔 조각으로부터 2시간 동안 100mM Tris-보레이트(pH 8.3) 중으로 회수하였다. 대안적으로, 겔 조각에 등용적의 50mM Tris-HCl(pH 7.0)을 첨가함으로써 겔 조각으로부터 단백질을 수동적으로 용출시킨 다음, 30℃에서 16시간 동안 배양시켰다. 이에 의해, 단백질이 겔로부터 완충액 중으로 분산되며, 이어서, 이를 모았다.Slow moving bands were referred to as "protein band 1" and fast moving bands were referred to as "protein band 2". The two protein bands were present in approximately equal amounts. In order to accurately excise two protein bands from the unstained portion of the gel, a Kumaji stained agarose gel was used as a guide. The excised pieces containing the protein bands were placed in a solvent to soften and a small amount of sterile water was added. As a control, a portion of the gel containing no protein was also excised and treated in the same manner as in the gel piece containing the protein. Proteins were recovered by electroelutation from gel pieces at 100 V (constant voltage) in 100 mM Tris-borate, pH 8.3 for 2 hours. Alternatively, the protein was manually eluted from the gel piece by adding an equal volume of 50 mM Tris-HCl (pH 7.0) to the gel piece and then incubated at 30 ° C. for 16 hours. Thereby, the protein was dispersed from the gel into the buffer, which was then collected.

HPLC-정제된 독소(33.6분, 피크) 및 아가로즈 겔 정제된 독소를 사용하는 곤충 독성 시험의 결과는 추출물의 독성을 증명하였다. HPLC 정제된 단백질 1.5㎍을 주사하는 경우, 24시간 내에 곤충이 죽었다. 수동 용출 또는 전기용출에 의해 아가로즈 겔로부터 회수된 단백질 밴드 1 및 단백질 밴드 2는 모두 주사하는 경우 곤충을 치사시켰다. 이들 샘플에 대해 추정된 단백질 농도는 50ng 미만/유충이었다. 단백질 밴드 1 또는 단백질 밴드 2가 주사된 유충군 사이의 무게 증가 및 치사율을 비교하면, 단백질 밴드 1이 주사 전달에 의해 더 독성임을 나타냈다.The results of the insect toxicity test using HPLC-purified toxin (33.6 min, peak) and agarose gel purified toxin demonstrated the toxicity of the extract. Injecting 1.5 μg HPLC purified protein killed the insect within 24 hours. Both Protein Band 1 and Protein Band 2 recovered from the agarose gel by manual or electroelution killed the insect when injected. The estimated protein concentration for these samples was less than 50 ng / larva. Comparing the weight gain and mortality between larva groups injected with either protein band 1 or protein band 2, it was shown that protein band 1 is more toxic by injection delivery.

HPLC-정제된 독소가 7.5㎍/유충의 농도로 유충 먹이에 적용되는 경우, 이는 유충 무게 증가를 중단시켰다(24마리의 유충이 시험됨). 유충이 먹이 섭취를 시작하지만, 단지 매우 소량의 독소 처리된 먹이를 소비한 후에, 이들은 다시 독소에 의해 유도된 병리 증상을 나타내기 시작하고, 먹이 섭취를 중단한다. 유충의 배설물이 퇴색되기 시작했고, 대부분의 유충은 설사 증상을 나타내었다. 수회의 5㎍ 독소 투여량을 7 내지 10일 기간에 걸쳐 먹이에 적용하는 경우, 상당한 곤충 치사가 발생하였다.When HPLC-purified toxins were applied to the larvae at a concentration of 7.5 μg / larva, this stopped larval weight gain (24 larvae tested). The larvae start feeding, but after consuming only a very small amount of toxin-treated food, they again begin to develop pathological symptoms induced by toxins and stop feeding. Larvae began to fade, and most of the larvae had diarrhea. Significant insect lethality occurred when several 5 μg toxin doses were applied to the food over a 7-10 day period.

아가로즈-분리된 단백질 밴드 1은 200ng/유충의 투여량에서 유충의 무게 증가를 상당하게 억제하였다. 유사한 농도의 단백질 밴드 2를 섭취한 유충은 억제되지 않으며, 대조 유충과 동일한 비율로 무게가 증가하였다. 12마리의 유충에 용출된 단백질을 섭취시켰고, 45마리의 유충에 단백질-함유 아가로즈 조각을 섭취시켰다. 이들 2세트의 데이터는 단백질 밴드 1이 만두카 섹스타에 대해 경구적으로 독성임을 나타낸다. 본 시험에서, 단백질 밴드 2가 만두카 섹스타에 대해 독성이 아님이 명백하다.Agarose-isolated protein band 1 significantly inhibited larval weight gain at a dose of 200 ng / larva. Larvae fed a similar concentration of protein band 2 were not inhibited and gained weight in the same proportion as the control larvae. Twelve larvae consumed the protein and 45 larvae consumed the protein-containing agarose slices. These two sets of data indicate that protein band 1 is orally toxic to manduka sexta. In this test, it is evident that protein band 2 is not toxic to manduka sexta.

변성 조건하에 SDS-PAGE에 의한 단백질 밴드 1 및 2의 추가의 분석은 각각의 밴드가 수개의 더 작은 단백질 서브유닛으로 이루어짐을 나타내었다. 단백질은 최대의 감도를 얻기 위해 쿠마지 브릴리언트 블루 염색에 이어 은 염색함으로써 가시화되었다.Further analysis of protein bands 1 and 2 by SDS-PAGE under denaturing conditions showed that each band consisted of several smaller protein subunits. Proteins were visualized by silver staining followed by Kumazi Brilliant Blue staining for maximum sensitivity.

두 개의 밴드내의 단백질 서브유닛은 매우 유사하였다. 단백질 밴드 1은 25.1, 56.2, 60.8, 65.6, 166, 171, 184 및 208 kDa의 8개의 단백질 서브유닛을 포함하였다. 단백질 밴드 2는 25.1, 60.8 및 65.6 kDa 단백질이 존재하지 않는 것을 제외하고는 동일한 프로파일을 가졌다. 56.2, 60.8, 65.6 및 184 kDa 단백질은 단백질 밴드 1의 복합체내에 대략 동일한 농도로 존재하고, 복합체의 총 단백질 함량의 80% 이상을 나타내었다.The protein subunits in the two bands were very similar. Protein band 1 contained eight protein subunits of 25.1, 56.2, 60.8, 65.6, 166, 171, 184 and 208 kDa. Protein band 2 had the same profile except that 25.1, 60.8 and 65.6 kDa proteins were not present. The 56.2, 60.8, 65.6 and 184 kDa proteins were present at approximately the same concentrations in the complex of protein band 1 and showed at least 80% of the total protein content of the complex.

천연 HPLC-정제된 독소를 하기와 같이 추가로 특성화하였다. 독소는 열 불안정성이며, 60℃로 15분 동안 가열한 후에 엠. 섹스타 유충에 주사하거나 섭취시키는 경우 치사시키거나 무게 증가를 억제하는 그의 능력을 잃었다. 리파제, 유형 C 포스포리파제, 뉴클레아제 또는 적혈구 용혈 활성을 검출하기 위해 분석을 디자인하여, 정제된 독소로 수행하였다. 이들 활성 중 어느 것도 존재하지 않았다. 항생 지대 억제 분석을 또한 수행하였고, 정제된 독소는 그람 음성 또는 그람 양성 박테리아, 효모 또는 필라멘트형 진균의 성장을 억제하지 못하였고, 이는 독성이 제노랍딘 항생제가 아님을 나타낸다.Natural HPLC-purified toxins were further characterized as follows. Toxins are thermally unstable and after heating to 60 ° C. for 15 min. Injecting or ingesting sexta larvae lost their ability to kill or inhibit weight gain. Assays were designed to detect lipase, type C phospholipase, nuclease or erythrocyte hemolytic activity and performed with purified toxins. None of these activities were present. Antimicrobial zone inhibition assays were also performed and purified toxins did not inhibit the growth of gram negative or gram positive bacteria, yeast or filamentous fungi, indicating that the toxicity is not genolabin antibiotic.

천연 HPLC-정제된 독소를 만두카 섹스타 이외의 곤충을 치사시키는 능력에 대해 시험하였다. 표 3에 본 연구에서 HPLC-정제된 포토랍두스 루미네센스 독소에 의해 치사되는 곤충을 나열하였다.Natural HPLC-purified toxins were tested for their ability to kill insects other than Manduka Sexta. Table 3 lists the insects that are killed by HPLC-purified photolabduum luminescence toxin in this study.

포토랍두스 루미네센스 독소에 의해 치사되는 곤충Insects killed by photolapux luminescence toxin 일반명Common name neck 속 및 종Genus and species 송달 경로Delivery path 박각시나방(tobacco hornworm)Beetle Moth (tobacco hornworm) 나비목Lepidoptera 만두카 섹스타(Manduca sexta)Manduca sexta 경구 및 주사Oral and injection 밀웜 (mealworm)Mealworm 딱정벌레목Coleoptera 테네브리오 몰리터(Tenebrio molitor)Tenebrio molitor 경구oral- 파라오 개미Pharaoh Ant 벌목felling 모노모륨 파라오아니스(Monomorium pharoanis)Monomorium pharaanis 경구oral- 바퀴(German cockroach)German cockroach 방시목A tree 블라텔라 게르마니카(Blattella germanica)Blatella germanica 경구 및 주사Oral and injection 모기mosquito 파리목Fly 애데스 애집티(Aedes aegypti)Aedes aegypti 경구oral-

고분자량 독소 복합체의 추가 특징 연구Further Characterization of High Molecular Weight Toxin Complex

추가의 분석에서, 독소 단백질 복합체를 W-14 성장 배지로부터 추가로 특징을 규명했다. 배양 조건 및 S-400 HR 컬럼을 통한 초기 정제 단계는 상기한 바와 동일했다. 고분자량 독소 복합체를 S-400 HR 컬럼 분획물에서 단리한 후, 독소 분획물을 10mM Tris-HCl(pH 8.6)로 평형화하고 센트리플러스 100(Amicon) 농축기에서 농축시켰다. 그 다음 단백질 독소 복합체는 약한 음이온 교환 (WAX) 컬럼, Vydac 301VPH575 (Hesparia, CA)에 0.5 ml/분의 유속으로 적용시켰다. 단백질을 선형 염화칼륨 구배 10mM Tris-HCl(pH 8.6) 중의 0 - 250 mM KCl로 50분 동안 용출했다. 280nm에서 흡광도 측정한 결과 8개의 단백질 피크가 검출되었다.In a further analysis, toxin protein complexes were further characterized from W-14 growth medium. Culture conditions and initial purification steps through the S-400 HR column were the same as described above. After the high molecular weight toxin complex was isolated from the S-400 HR column fractions, the toxin fractions were equilibrated with 10 mM Tris-HCl (pH 8.6) and concentrated in a CentriPlus 100 (Amicon) concentrator. The protein toxin complex was then applied to a weak anion exchange (WAX) column, Vydac 301VPH575 (Hesparia, Calif.) At a flow rate of 0.5 ml / min. The protein was eluted with 0-250 mM KCl in linear potassium chloride gradient 10 mM Tris-HCl, pH 8.6 for 50 minutes. As a result of absorbance measurement at 280 nm, eight protein peaks were detected.

신생 써던 옥수수 뿌리벌레 (Diabrotica undecimpunctata howardi, SCR) 유충 및 담배 촉수 벌레 (Manduca sexta, THW)를 사용하여 HPLC 컬럼으로부터 용출된 모든 분획물에 대해 생검을 수행했다. THW는 낮 16시간, 밤 8시간의 주기로 25 ℃에서 매미나방 밀 배(胚) 식이(ICN)를 먹여 성장시켰다. SCR은 낮 16시간/밤 8시간 주기로 25℃에서 써던 옥수수 뿌리벌레 유충의 Insecta-Diet(BioServ)를 먹여 끼웠다.Biopsies were performed on all fractions eluted from HPLC columns using newborn southern corn root worms (Diabrotica undecimpunctata howardi, SCR) larvae and tobacco tentacles worms (Manduca sexta, THW). THW was grown by feeding cicadabang wheat pear diet (ICN) at 25 ° C. with a cycle of 16 hours during the day and 8 hours at night. SCR was fed with Insecta-Diet (BioServ) from corn rootworm larvae at 25 ° C. with a 16-day / 8-hour cycle.

SCR 및 THW 유충의 최대 치사율은 피크 6에서 관찰되었는데, 이 피크는 약 112 mM 내지 132 mM KCl로 용출했다. 피크 6를 SDS-PAGE로 분석하면 두드러진 펩티드는 170 kDa, 66 kDa, 63 kDa, 59.5 kDa 및 31 kDa로 나타났다. 피크 6 단백질 분획물에 대한 웨스턴 블롯 분석은 TcaAii-syn, TcaAiii-syn, TcaBii-syn, TcaC-syn, 및 TcbAii-syn 펩티드 (실시예 21에 기재되어 있음)에 대한 다클론 항체 혼합물 및 TcbAiii펩티드에 대한 단클론성 항체인 C5F2를 사용하여 수행했다. 피크 6은 170 kDa, 90 kDa, 66 kDa, 59.5 kDa 및 31 kDa의 면역반응성 밴드를 함유하고 있었다. 이들은 TcaC (166 kDa), TcaAii+ TcaAiii(92 kDa), TcaAiii(66 kDa), TcaBii (60 kDa) 및 TcaAii(25 kDa)에 대해 각각 예상한 크기에 매우 근접한 것이다. 피크 6은 본 명세서에 기재된 바와 같이 천연 아가로오즈 겔 전기영동으로 추가로 분석한 밴드 1의 것과 유사한 이동도를 갖는 단일 밴드로 이동했다.Maximum mortality of SCR and THW larvae was observed at peak 6, which eluted with about 112 mM to 132 mM KCl. Analysis of peak 6 by SDS-PAGE revealed prominent peptides of 170 kDa, 66 kDa, 63 kDa, 59.5 kDa and 31 kDa. A polyclonal antibody mixture for the Western blot analysis of the peak 6 protein fraction (described in example 21) TcaA ii -syn, TcaA iii -syn, TcaB ii -syn, TcaC-syn, and ii -syn TcbA peptide And C5F2, a monoclonal antibody to the TcbA iii peptide. Peak 6 contained immunoreactive bands of 170 kDa, 90 kDa, 66 kDa, 59.5 kDa and 31 kDa. These TcaC (166 kDa), TcaA ii + TcaA iii (92 kDa), TcaA iii (66 kDa), respectively, are very close to the expected size for the TcaB i i (60 kDa) and TcaA ii (25 kDa). Peak 6 shifted to a single band with similar mobility as that of Band 1, further analyzed by natural agarose gel electrophoresis as described herein.

정제된 피크 6 독소 단백질의 단백질 농도는 BCA 시약 (Pierce)을 사용하여 측정했다. 이 단백질의 희석물은 10 mM Tris(pH 8.6)로 제조한 후 식이 생검에 사용했다. 240 시간 후, 식이 생검을 통해 피크 6 단백질 분획물을 450 ng 또는 그 이상 투여받은 신생 유충은 모두 죽었다. 동일한 분획물 90 ng을 섭취한 유충 군은 40%의 치사율을 나타냈다. 240 시간 후에 피크 6 단백질 분획물 90 ng 및 20 ng을 투여받고 살아남은 것은 각각 대조구 중량의 약 10% 및 70%였다.Protein concentration of purified peak 6 toxin protein was measured using BCA reagent (Pierce). Dilutions of this protein were prepared in 10 mM Tris (pH 8.6) and used for dietary biopsies. After 240 hours, all newborn larvae that received 450 ng or more of the Peak 6 protein fraction via dietary biopsy died. Larvae fed 90 ng of the same fraction had a mortality of 40%. After 240 hours, 90 and 20 ng of peak 6 protein fractions were administered and survived about 10% and 70% of the control weight, respectively.

〈실시예 2〉<Example 2>

살충제 이용성Insecticide Availability

포토랍두스 루미네센스의 이용성 및 독성을 추가로 특성화하였다. 포토랍두스 루메네센스(균주 W-14) 배양 브로쓰는 하기와 같이 생산하였다. 생산 배지는 Milli-Q(등록상표) 탈이온수 중의 2% 백토 프로테오스 펩톤(등록상표) #3(PP3, Difco Laboratories, Detroit, Michigan)이었다. 175㎖의 배지로 이루어지는 종자 배양물 플라스크를 카풋(Kaput)으로 덮인 데롱 목(Delong neck)이 달린 500㎖의 트리배플드 플라스크에 담고, T= 121℃(250℉)에서 20분 동안 오토클레이브시켰다. 생산 플라스크는 신-에쭈(Shin-etsu) 실리콘 포움 마개로 덮인 데롱 목이 달린 500㎖ 트리배플드 플라스크에서 2.8ℓ 중 500㎖로 이루어진다. 이들을 T= 121℃(250℉)에서 45분 동안 오토클레이브시켰다. 종자 배양물을 6.08 cm(2인치) 작동 반경의 회전 진탕 배양기 내에서 150rpm에서 28℃에서 배양시켰다. 16시간 동안 성장시킨 후, 1%의 종자 배양물을 생산 플라스크내에 놓고 회수하기 전 24시간 동안 성장시켰다. 독소의 생산은 로그상 성장동안 나타났다. 미생물 브로쓰를 1ℓ 원심분리병에 옮기고 세포 생물량을 펠릿화하였다(2500 RPM 4℃에서 30분[R.C.F=∼1600] HG-4L Rotor RC3 Sorval centrifuge, Dupont, Wilmington, Delaware). 제 1 브로쓰를 4℃에서 8 내지 16시간 동안 냉각시키고, 적어도 2시간 동안 재원심분리시켜(상기 조건) 정치시에 침전되는 추정 무코폴리사카라이드를 제거함으로써 브로쓰를 추가로 정화시켰다. (대안적인 프로세싱 방법은 두 단계를 합하고, 상기와 동일한 조건하에 16시간의 정화 원심분리의 사용을 포함한다.) 이어서, 이 브로쓰를 생분석 또는 여과하기 전에 4℃에서 저장하였다.The usability and toxicity of photolapux luminescence was further characterized. Photolabduus lumenense (strain W-14) culture broth was produced as follows. The production medium was 2% Baekto Proteose Peptone® # 3 (PP3, Difco Laboratories, Detroit, Michigan) in Milli-Q® deionized water. Seed culture flasks consisting of 175 ml of medium were placed in a 500 ml tribaffle flask with a Delong neck covered with Kaput and autoclaved at T = 121 ° C. (250 ° F.) for 20 minutes. . The production flask consisted of 500 ml in 2.8 L in a delon necked 500 ml tribaffle flask covered with Shin-etsu silicone foam stopper. They were autoclaved at T = 121 ° C. (250 ° F.) for 45 minutes. Seed cultures were incubated at 28 ° C. at 150 rpm in a rotary shake incubator with a 6.08 cm (2 inch) operating radius. After growing for 16 hours, 1% seed culture was placed in the production flask and grown for 24 hours before recovery. Toxin production appeared during log phase growth. The microbial broth was transferred to 1 L centrifuge and the cell biomass pelleted (30 min [R.C.F = 1600] HG-4L Rotor RC3 Sorval centrifuge, Dupont, Wilmington, Delaware at 2500 RPM 4 ° C). The broth was further clarified by cooling the first broth at 4 ° C. for 8-16 hours and recentrifuging for at least 2 hours (the above conditions) to remove the presumed mucopolysaccharides that settle upon standing. (Alternative processing methods combine the two steps and include the use of 16 hours of clarification centrifugation under the same conditions as above.) The broth was then stored at 4 ° C. before bioanalysis or filtration.

포토랍두스 배양 브로쓰, 및 이 브로쓰로부터 정제된 단백질 독소(들)은 많은 곤충에 대하여 활성(치사 및(또는) 성장 억제, 감소된 성충 출현)을 나타냈다. 더 구체적으로, 활성은 딱정벌레목의 곤충의 구성원인 옥수수 뿌리벌레(유충 및 성충), 콜로라도 감자 딱정벌레, 및 잔디 땅벌레(turf grub)에 대하여 나타났다. 딱정벌레목의 다른 구성원은 방아벌레(wireworm), 화분(pollen) 딱정벌레, 뜀벼룩 갑충(flea beetle), 종자 딱정벌레 및 바구미를 포함한다. 활성은 또한 동시목의 구성원인 별 매미충(aster leafhopper)에 대해서도 관찰되었다. 동시목의 다른 구성원은 멸구(planthopper), 배나무이(pyslla), 사과나무이(sucker), 개각충(scale insect), 화이트플라이(whiteflies) 및 침(spittle)벌레 뿐만 아니라, 많은 숙주 특이성 진딧물 종을 포함한다. 브로쓰 및 정제된 분획은 또한 사탕무 행렬구더기(armyworm), 양배추 자벌레, 블랙 야도충(black cutworm), 회색담배나방, 유럽 곡물 천공충, 옥수수 귀벌레(earworm) 및 코들링 나방(이들은 모두 나비목의 구성원임)에 대하여 활성이었다. 이 목의 다른 전형적인 구성원은 옷좀나방, 화랑곡나방(Indian mealmoth), 잎말이나방(leaf roller), 배추벌레, 목화다래나방(cotton ballworm), 도롱이벌레(bagworm), 이스턴 텐트 나방(Eastern tent caterpiller), 잔디 포충나방(sod webworm), 및 폴 행렬구더기(fall armyworm)를 포함한다. 활성은 또한 파리목의 구성원인 과일파리 및 모기 유충에 대해서도 나타났다. 파리목의 다른 구성원은 완두 미지(midge), 당근 파리, 배추 뿌리 파리, 순무 뿌리 파리, 양파 파리, 크레인 파리, 집파리 및 다양한 모기 종을 포함한다. 또한 불개미, 오더러스(oderous) 집개미 및 작은 흑개미를 포함하는 목의 구성원인 카펜터 개미 및 아르헨티나 개미에 대해서도 활성이 나타났다.Photolabose culture broth, and protein toxin (s) purified from the broth, showed activity (lethal and / or growth inhibition, reduced adult appearance) against many insects. More specifically, activity has been shown for corn rootworms (larvae and adults), Colorado potato beetles, and turf grubs, which are members of the insects of the Coleoptera. Other members of the coleoptera include wireworms, pollen beetles, flea beetle, seed beetles and weevils. Activity was also observed for aster leafhoppers, members of the same tree. Other members of the same tree include many host specific aphid species, as well as planthoppers, pysllas, sock, scale insects, whiteflies and spider bugs. . The broth and purified fractions are also found in sugar beet matrix, cabbage beetle, black cutworm, gray tobacco moth, European grain borer, corn earworm and codling moth (all of which are Lepidoptera) Being a member). Other typical members of this neck include moths, Indian mealmoths, leaf rollers, cabbage worms, cotton ballworms, bagworms, eastern tent caterpillers, Grass webworms, and fall armyworms. Activity has also been shown for fruit flies and mosquito larvae that are members of the fly. Other members of the flyfly include pea midge, carrot fly, cabbage root fly, turnip root fly, onion fly, crane fly, housefly and various mosquito species. It also showed activity against carpenter ants and Argentine ants, members of the neck, including fire ants, oderous ants and small black ants.

브로쓰/분획은 곤충의 군집을 감소시키기 위해 유용하며, 곤충 군집을 억제하는 방법에서 사용되었다. 방법은 전술된 유효한 곤충 불활성화량의 활성제를 곤충의 지역에 적용하는 것을 포함할 수 있다. 결과를 표 4에 기록하였다.Broth / fractions are useful for reducing the population of insects and have been used in methods of inhibiting insect communities. The method may comprise applying the effective amount of the insect inactivation described above to the insect's area. The results are reported in Table 4.

옥수수 뿌리벌레 유충에 대한 활성을 하기와 같이 시험하였다. 포토랍두스 배양 브로쓰(여과 멸균됨, 세포 없음) 또는 정제된 HPLC 분획을 30㎕ 분취액내 인공 먹이의 0.25㎖의 표면(∼1.5㎠)에 직접 적용하고, 각각 대조 배지 또는 10mM 인산나트륨 완충액(pH 7.0)으로 희석하였다. 먹이 평판을 멸균 유동 후드내에서 공기 건조시키고, 웰을 멸균된 알로부터 부화된 단일, 신생 디아브로티카 운데심푼크타타 호워디(Diabrotica undecimpunctata howardi)(써던 옥수수 뿌리벌레, SCR)로 채우고, 2회령 SCR을 인공 먹이에서 성장시키거나, 2회령 디아브로티카 비르기페라 비르기페라(Diabrotica virgifera virgifera)(웨스턴 옥수수 뿌리벌레, WCR)을 메트로믹스(Metromix)(등록상표)에서 성장된 묘목 상에 재배하였다. 2회령 유충을 먹이를 첨가하기 전에 칭량하였다. 평판을 밀봉하고, 가습된 성장 체임버에 놓고, 27℃에서 적절한 기간(신생 및 성충 SCR에 대해 4일, WCR 유충에 대해 2 내지 5일, 2회령 SCR에 대해 7 내지 14일). 치사율 및 무게 측정을 지시된 바와 같이 기록하였다. 일반적으로, 모든 연구에서 처리 당 16마리의 곤충을 사용하였다. 대조군 치사율은 하기와 같았다: 신생 유충: 〈5%, 성충 딱정벌레: 5%.Activity against corn rootworm larvae was tested as follows. Photolabose culture broth (filtration sterilized, no cells) or purified HPLC fractions were applied directly to 0.25 ml surface (˜1.5 cm 2) of artificial feed in 30 μl aliquots, respectively, in control medium or 10 mM sodium phosphate buffer ( pH 7.0). The food plate is air dried in a sterile flow hood, and the wells are filled with a single, newborn Diabrotica undecimpunctata howardi (Southern Corn Root, SCR) hatched from sterile eggs SCRs can be grown in artificial diets or grown on seedlings grown in Metromix® (Western Corn Root Beetle, WCR) in two-year-old Diabrotica virgifera virgifera (WCR). It was. Two-year-old larvae were weighed before adding food. The plate is sealed, placed in a humidified growth chamber and appropriately at 27 ° C. (4 days for newborn and adult SCR, 2 to 5 days for WCR larvae, 7 to 14 days for two age SCR). Lethality and weight measurements were recorded as indicated. In general, 16 insects were used per treatment in all studies. Control mortality was as follows: neonatal larvae: <5%, adult beetles: 5%.

콜로라도 감자 딱정벌레에 관한 활성은 다음과 같이 시험하였다. 포토랍두스 배양 브로쓰 또는 대조군 배지를 24-웰 조직 배양 플레이트의 웰 중에 유지된 표준 인공 사료의 1.5 ㎖의 표면(∼2.0 ㎠)에 가하였다. 각각의 웰은 50 ㎕ 씩 처리되었고 방치하여 공기 건조시켰다. 이어서, 개별적인 2회령의 콜로라도 감자 딱정벌레(Leptinotarsa decemlineata, CPB) 유충을 상기 사료 상에 위치시키고 치사율을 4일 후에 기록하였다. 처리 당 10 개의 유충을 모든 경우의 연구에 사용하였다. 대조군의 사망률은 3.3%이었다.The activity on the Colorado potato beetle was tested as follows. Photolabose culture broth or control medium was added to a 1.5 mL surface (˜2.0 cm 2) of standard artificial feed maintained in the wells of a 24-well tissue culture plate. Each well was treated with 50 μl and left to air dry. Individual two-year-old Colorado potato beetle (Leptinotarsa decemlineata, CPB) larvae were then placed on the feed and mortality was recorded 4 days later. Ten larvae per treatment were used for all cases of study. The mortality rate of the control group was 3.3%.

일본 딱정벌레 굼벵이 및 딱정벌레에 대한 활성은 다음과 같이 시험하였다. 잔듸 굼벵이 (Popillia japonica, 2-3회령)을 침입받은 잔듸로부터 수집하여 추가의 사료로서 첨가된 당근 조각이 포함된 토양/토탄 중에 실험실에서 유지시켰다. 잔듸 딱정벌레들은 국부적으로 페로몬으로 덫을 놓아 잡아두고 사료로서 단풍나무 잎이 첨가된 플라스틱 용기 중에 실험실에서 유지시켰다. 무희석 포토랍두스 배양 브로쓰 또는 대조군 옥수수 배지를 뿌리벌레 인공 사료(30 ㎕/1.54 ㎠) 또는 당근 조각 (유충)에 가한 후, 두 단계들을 단독으로 사료 웰 중에 위치시키고 임의의 치사율 및 섭취를 관찰하였다. 모두의 경우에 있어서 관찰된 섭취량 (배설물 생산)에서 명백한 감소가 있었다.The activity against Japanese beetles slugs and beetles was tested as follows. Jang slugs (Popillia japonica, 2-3 ages) were collected from infiltrated mounds and kept in the laboratory in soil / peat containing carrot pieces added as additional feed. Small beetles were trapped locally with pheromones and kept in the laboratory in plastic containers with maple leaves added as feed. Diluted photolabose culture broth or control corn medium was added to the rootworm artificial feed (30 μl / 1.54 cm 2) or carrot slices (larvae), and then the two steps alone were placed in the feed wells and any mortality and uptake was achieved. Observed. In all cases there was a clear decrease in the intake observed (dung production).

모기 유충에 대한 활성은 다음과 같이 시험하였다. 분석은 96-웰 마이크로타이터 플레이트에서 수행하였다. 각각의 웰은 수용액 (포토랍두스 배양 브로쓰, 대조군 배지 또는 H2O) 200 ㎕ 및 대략 20 개씩, 1일령의 유충(애데스 애집티)을 포함하였다. 처리 당 6 개의 웰이 존재하였다. 결과는 침입 후 2 시간이 지나서 판독하였고 3일의 관찰 기간 동안 변화되지 않았다. 대조군 치사율은 관찰되지 않았다.Activity against mosquito larvae was tested as follows. Assays were performed in 96-well microtiter plates. Each well contained 200 μl of an aqueous solution (photolapdus culture broth, control medium or H 2 O) and approximately 20, 1 day old larvae (Ades agetti). There were six wells per treatment. The results were read 2 hours after invasion and did not change during the 3 day observation period. No control mortality was observed.

초파리에 대한 활성은 다음과 같이 수행하였다. 구매한 초파리 (Drosophilia melanogester) 배지를 50% 건조 배지와 물이나 대조군 배지나 포토랍두스 배양 배지 중 어느 하나의 50% 용액을 사용하여 제조하였다. 이는 처리 당 3 개의 사육 바이알 각각 중에 건조 배지 8 ㎖을 넣고, 적절한 용액 8 ㎖을 첨가함으로써 이루어졌다. 이어서 10회 후기 령의 초파리 구더기를 각 바이얼에 첨가하였다. 바이얼들은 형광 천장의 조명하에 실온에서 실험실 벤취 상에 유지시켰다. 새끼 또는 성체 계수는 노출 3, 7 및 10일 후에 행하였다. 포토랍두스 배양 브로쓰를 초파리 구더기 사료 배지로 혼입하면 10일째 성체 출현에 있어서 약간의 (17%) 감소가 나타나지만, 이는 물 및 대조군 배지를 사용한 경우(3%)에 비해서는 상당한 감소를 유발하였다.Activity against fruit flies was performed as follows. Purchased Drosophilia melanogester medium was prepared using 50% dry medium and 50% solution of either water, control medium, or photolabose culture medium. This was done by placing 8 ml of dry media in each of three breeding vials and adding 8 ml of the appropriate solution. Ten late Drosophila maggots were then added to each vial. The vials were kept on a laboratory bench at room temperature under the illumination of a fluorescent ceiling. Pups or adult counts were done 3, 7 and 10 days after exposure. The incorporation of photolapus culture broth into Drosophila maggot feed medium resulted in a slight (17%) decrease in adult appearance on day 10, but caused a significant reduction compared to water and control medium (3%). .

별 매미충에 대한 활성은 다음과 같이 시험하였다. 별 매미충 (Macrosteles severini)에 대한 섭취 분석은 다른 외부의 접촉이 없이 적극적인 섭취를 허용하도록 설계하였다. 능동적/"사료" 용액의 저장용기는 35 x 10 ㎜ 페트리 접시의 바닥 부분의 중앙에 2 개의 구멍을 내어 만들었다. 6.08 cm (2 인치) Parafilm M(등록상표) 스퀘어를 접시의 상부를 가로질러 올려놓고 "O" 링으로 닫았다. 이어서 28.3 g(1 온스) 플라스틱 컵에 대략 7마리의 매미충을 넣고 상기 저장용기를 컵 위에, 파라필름이 밑으로 가도록 올려놓았다. 이어서 시험 용액을 구멍을 통하여 상기 저장용기에 첨가하였다. 무희석 포토랍두스 배양 브로쓰를 사용한 시험에 있어서, 브로쓰 및 대조군 배지를 물에 대하여 투석시켜 대조군 치사율을 감소시켰다. 치사율은 2 일째에 보고하였고 여기서 26.5%의 대조군 치사율이 나타났다. 정제된 분획 (200 ㎎ 단백질/㎖)을 사용한 시험에 있어서, 5% 수크로오스의 최종 농도를 모든 처리에 사용하여 별 매미충의 생존능을 향상시켰다. 이 분석물은 배양기에서 16/8의 광조사 기간의 28 ℃, 70% RH로 유지시켰다. 분석물은 72 시간 생존능에 대하여 등급을 매겼다. 대조군 치사율은 5.5%이었다.The activity against star cicada was tested as follows. Ingestion analysis for the stellar cicada (Macrosteles severini) was designed to allow for active intake without any external contact. A reservoir of active / "feed" solution was made by drilling two holes in the center of the bottom portion of a 35 x 10 mm Petri dish. A 6.08 cm (2 inch) Parafilm M® square was placed across the top of the dish and closed with an "O" ring. Approximately seven cicada larvae were then placed in a 28.3 g (1 ounce) plastic cup and the reservoir was placed on top of the cup with the parafilm facing down. Test solution was then added to the reservoir through the hole. In tests using dilution-free photorabose culture broth, the broth and control medium were dialyzed against water to reduce control lethality. The lethality was reported on day 2, with a control mortality of 26.5%. In tests with purified fractions (200 mg protein / ml), a final concentration of 5% sucrose was used for all treatments to improve the viability of star larvae. This analyte was maintained at 28 ° C., 70% RH in a 16/8 light irradiation period in the incubator. Analytes were rated for 72 hour viability. Control mortality was 5.5%.

아르헨티나 개미에 대한 활성은 다음과 같이 시험하였다. 100% 포토랍두스 배양 브로쓰, 대조군 배지 또는 물의 1.5 ㎖ 분취량을 피펫팅하여 2.0 ㎖ 투명 유리 바이얼 내로 가하였다. 이 바이얼들을 적절한 처리에 의해 젖게한 목화 덴탈 윅(dental wick) 조각으로 틀어막았다. 각각의 바이얼을 8 내지 12 마리의 성체 아르헨티나 개미 (Linepithema humile)를 담은 별도의 60 x 16 ㎜ 페트리 접시 내에 위치시켰다. 처리 당 3회의 반복 실시했다. 생물학적 시험 플레이트는 형광 천장의 조명 하에 실온에서 실험실 벤취 상에 유지시켰다. 치사율 판독은 노출후 5일만에 행하였다. 대조군 치사율은 24%이었다.Activity against Argentine ants was tested as follows. 1.5 ml aliquots of 100% photolabose culture broth, control medium or water were pipetted into 2.0 ml clear glass vials. These vials were plugged with pieces of cotton dental wick wetted by proper treatment. Each vial was placed in a separate 60 x 16 mm Petri dish containing 8-12 adult Argentine ants (Linepithema humile). Three replicates were performed per treatment. Biological test plates were kept on laboratory benches at room temperature under the illumination of fluorescent ceilings. Lethality readings were made 5 days after exposure. Control mortality was 24%.

카펜터 개미에 대한 활성은 다음과 같이 시험하였다. 블랙 카펜터 일개미(Camponotus pennsylvanicus)를 인디아나주 인디아나폴리스의 DowElanco 소유의 나무에서 수집하였다. 포토랍두스 배양 브로쓰를 사용한 시험을 다음과 같이 수행하였다. 각각의 플라스틱 생물학적 시험 용기 (7 1/8" x 3")는 플라스틱 단 유리 중에 15 마리의 일개미, 종이 피난처 및 브로쓰 또는 대조군 배지 10 ㎖을 포함하였다. 목화 윅은 짧은 유리 덮게 중의 구멍을 통하여 개미에 대한 처리물에 전달되었다. 모든 처리물은 5% 수크로스를 포함하였다. 생물학적 시험물들은 실온의 암실에서 유지되었고 19 일 동안 채점되었다. 대조군 치사율은 9%이었다. 정제된 분획을 운반하는 분석물들은 플라스틱 시험관 중에 0.2 ㎖ 처리/2.0 g 사료의 속도로 처리물(정제된 분획 또는 대조군 용액)과 혼합된 인공 개미 사료를 이용하였다. 정제 분획의 최종 단백질 농도는 10 ㎍/g 사료 미만이었다. 처리 당 10 마리의 개미, 물 공급원, 피난처 및 처리된 사료를 밀봉 플라스틱 용기 내에 위치시키고 습기가 있는 배양기 중의 27 ℃의 암실에서 유지시켰다. 치사율은 10일에 기록하였다. 대조군 치사율은 나타나지 않았다.Activity against Carpenter ants was tested as follows. Black Carpenter ants (Camponotus pennsylvanicus) were collected from trees owned by DowElanco, Indianapolis, Indiana. Tests using photolabduose culture broth were performed as follows. Each plastic biological test container (7 1/8 "x 3") contained 15 workers, paper shelters, and 10 ml of broth or control medium in a plastic short glass. Cotton wicks were delivered to the treatment for the ants through holes in the short glass cover. All treatments contained 5% sucrose. Biological specimens were maintained in the dark at room temperature and scored for 19 days. Control mortality was 9%. Analytes carrying the purified fractions used artificial ant feed mixed with the treatment (purified fraction or control solution) at a rate of 0.2 ml treatment / 2.0 g feed in a plastic test tube. The final protein concentration of the purified fraction was less than 10 μg / g feed. Ten ants, water source, shelter and treated feed per treatment were placed in sealed plastic containers and kept in a dark at 27 ° C. in a humid incubator. The mortality rate was recorded on day 10. Control mortality was not shown.

다양한 나비목 유충에 대한 시험은 다음과 같이 시험하였다. 포토랍두스 배양 브로쓰 또는 정제된 분획을 각각 대조군 배지 또는 10 mM 인산나트륨 완충액, pH 7.0 중에 희석한 후 30 ㎕ 분취량 중의 표준 인공 사료 0.25 ㎖의 표면 (∼1.5 ㎠)의 표면에 직접적으로 가하였다. 사료 플레이트를 멸균 플로우 후드 중에서 공기 건조시키고 웰들을 단독의 신생 유충으로 섭취시켰다. 유럽 옥수수 천공충 (Ostrinia nublilalis) 및 옥수수 귀벌레 (Helicoverpa zea) 알들을 상업적인 공급원으로부터 공급받아서 우리 중에서 부화시킨 반면, 사탕무 행렬구더기 (Spodoptera exigua), 양배추 자벌레 (Trichoplusia ni), 회색담배나방(Heliothis virescens), 사과 나방 (Laspeyresia pomonella) 및 블랙 야도충 (Agrotis ipsilon) 유충은 내부적으로 공급받았다. 유충으로 침입시킨 후, 사료 플레이트들을 밀봉하고, 습기가 있는 성장 챔버 중에 위치시켜서 적절한 기간 동안 27 ℃의 암실에서 유지시켰다. 치사율 및 중량 측정은 포토랍두스 배양 배지에 대해서 5-7 일에 기록하였고, 정제된 분획에 대해서는 4-7일에 기록하였다. 일반적으로 처리당 16마리의 곤충이 모든 연구에서 사용되었다. 대조군 치사율은 대조군 배지에 대해서 4 - 12.5%의 범위이었고 인산염 완충액에 대해서는 10% 미만이었다.Tests for various Lepidoptera larvae were tested as follows. The photolabose culture broth or purified fraction is diluted directly in control medium or 10 mM sodium phosphate buffer, pH 7.0 and directly added to the surface of 0.25 ml of surface (˜1.5 cm 2) of standard artificial feed in a 30 μl aliquot. It was. The feed plate was air dried in a sterile flow hood and the wells were taken up as stand alone larvae. European corn borer (Ostrinia nublilalis) and corn beetle (Helicoverpa zea) eggs were hatched from us by commercial sources, while sugar beetles (Spodoptera exigua), cabbage bug (Trichoplusia ni), and gray tobacco moth (Heliothis virescens) ), Apple moths (Laspeyresia pomonella) and black larvae (Agrotis ipsilon) larvae were internally supplied. After infestation with the larvae, the feed plates were sealed and placed in a humid growth chamber and kept in the dark at 27 ° C. for an appropriate period. Lethality and gravimetric measurements were recorded at 5-7 days for photolabdus culture medium and 4-7 days for purified fractions. In general, 16 insects per treatment were used in all studies. Control mortality ranged from 4-12.5% for control medium and less than 10% for phosphate buffer.

포토랍두스 루미네센스 (균주 W-14) 배양 배지 및 정제된 독소 분획의 상이한 곤충목/종의 치사율 및 성장 억제에 미치는 효과Effect of Photolapux luminescence (strain W-14) culture medium and purified toxin fraction on mortality and growth inhibition of different insect species / species 곤충 목/종Insect neck / species 브로쓰Broth 정제된 분획Purified fraction 사망%Dead% G.I.%G.I.% 사망%Dead% G.I.%G.I.% 딱정벌레목Coleoptera 옥수수뿌리벌레써던/신생유충써던/2회령써던/성체웨스턴/2회령Corn root worm Southern / newborn larva Southern / 2 age Southern / adult Western / 2 age 100na45na100na45na na38.5nt35na38.5nt35 100ntntnt100ntntnt nantntntnantntnt 콜로라도 감자 딱정벌레2회령Colorado potato beetle 9393 ntnt ntnt ntnt 잔듸 굼벵이2회령성체Jang-sug slug 2 nananana a.f.a.f.a.f.a.f. ntntntnt ntntntnt 파리목초파리 (성체 출현)모기 유충Mosquito larvae 1710017100 ntnantna ntntntnt ntntntnt 동시목별 매미충Cicada 96.596.5 nana 100100 nana 벌목아르헨티나 개미카펜터 개미Argentinian Ant Carpenter Ant 75717571 nananana nt100nt100 nananana 나비목사탕무 행렬구더기블랙 야도층양배추 자벌레사과 나방옥수수 귀벌레유럽 옥수수 천공충담배 모충ButterfliesBlood procession maggotsblack Biloba cabbage cabbagewormapple mothcorn beetleEuropean corn drillingworm 12.5ntntnt56.396.713.512.5ntntnt56.396.713.5 36ntntnt94.298.452.536ntntnt94.298.452.5 18.75021.96.2597.910019.418.75021.96.2597.910019.4 41.471.266.845.9nana85.641.471.266.845.9nana85.6 G. I.= 성장 억제,na = 적용불가, nt = 시험되지 않음, a.f. = 안티-사료화제G. I. = growth inhibition, na = not applicable, nt = not tested, a.f. = Anti-feeding agent

〈실시예 3〉<Example 3>

토양 적용시 살충제 이용성Insecticide Availability in Soil Applications

포토랍두스 루미네센스(균주 W-14) 배양 브로쓰는 토양 또는 토양 혼합물 (메트로믹스(Metromix)(등록상표)에 직접 가하였을 때 옥수수 뿌리벌레에 대하여 활성인 것으로 나타났다. 메트로믹스(등록상표) 중의 신생 SCR 및 WCR에 대한 활성은 다음과 같이 시험하였다 (표 5). 시험은 습윤 여과지 상의 빛 중에서 6 일간 발아시킨 옥수수 묘목 (United Agriseeds brand CL614)를 사용하여 진행시켰다. 뿌리가 대략 3 - 6 ㎝ 길이이었을 때, 단일 인/묘목을 무수 메트로믹스(등록상표) 50g를 포함하는 투명 플라스틱 컵 591 ㎖ 중에 식묘하였다. 이어서 20 개의 신생 SCR 또는 WCR를 묘목의 뿌리 상에 직접 위치시키고 메트로믹스(등록상표)로 덮었다. 침습시, 묘목들을 희석 브로쓰 용액의 50 ㎖ 전체 부피로 적셨다. 적신 후, 컵들을 밀봉시키고 빛 중의 실온에서 7 일 동안 방치하였다. 그 후, 묘목들을 세척하여 메트로믹스(등록상표)를 제거하고 뿌리를 절단하여 중량을 재었다. 활성은 대조군 식물에 대하여 남아있는 옥수수 뿌리의 비율의 백분율 및 섭취에 의해 유도된 잎 손상으로서 평가하였다. 잎 손상은 육안으로 관찰하였고 -, +, ++, 또는 +++ 중의 하나로서 평가하였으며, -는 무손상을 나타내고, +++는 심한 손상을 나타낸다.Photolabduum luminescence (strain W-14) culture broth has been shown to be active against corn rootworms when added directly to soil or soil mixture (Metromix®). The activity against newborn SCR and WCR in Chinese was tested as follows (Table 5): The test was carried out using corn seedlings (United Agriseeds brand CL614) germinated for 6 days in light on wet filter paper. At cm length, single phosphorus / plants were planted in 591 ml of clear plastic cups containing 50 g of anhydrous metromix® 20 Twenty new SCRs or WCRs were then placed directly on the roots of the seedlings and metromixed (registered). Upon invasion, the seedlings were moistened with a total volume of 50 ml of dilute broth solution, after wetting, the cups were sealed and left for 7 days at room temperature in the light. The seedlings were then washed to remove metromix® and the roots cut and weighed Activity was assessed as leaf damage induced by uptake and percentage of percentage of corn roots remaining relative to control plants. Leaf damage was visually observed and evaluated as one of-, +, ++, or +++,-indicating no damage and +++ indicating severe damage.

토양에서 신생 SCR에 대한 활성은 다음과 같이 시험하였다(표 6). 시험은 습윤 여과지 상의 빛 중에서 6 일간 발아시킨 옥수수 묘목 (United Agriseeds brand CL614)를 사용하여 진행시켰다. 뿌리가 대략 3 - 6 ㎝ 길이이었을 때, 단일 인/묘목을 전년도에 옥수수를 식묘한 인디아나주 레바논(Lebanon)의 야외 토양 150 g을 포함하는 투명 플라스틱 컵 591 ㎖ 중에 식묘하였다. 이 토양은 이전에 살충제로 처리하지 않았다. 이어서 20 개의 신생 SCR을 묘목의 뿌리 상에 직접 위치시키고 토양으로 덮었다. 침습후, 묘목들을 희석 브로쓰 용액의 50 ㎖ 전체 부피로 적셨다. 적신 후, 밀봉되지 않은 컵들을 26.7 ℃(78 ℉)에서 높은 상대습도 (80%)의 챔버 중에서 배양시켰다. 그 후, 묘목들을 세척하여 모든 토양을 제거하고 뿌리를 절단하여 중량을 재었다. 활성은 대조군 식물에 대하여 남아있는 옥수수 뿌리의 비율의 백분율 및 섭취에 의해 유도된 잎 손상으로서 평가하였다. 잎 손상은 육안으로 관찰하였고 -, +, ++, 또는 +++ 중의 하나로서 평가하였으며, -는 무손상을 나타내고, +++는 심한 손상을 나타낸다.The activity for neonatal SCR in soil was tested as follows (Table 6). Testing was conducted using corn seedlings (United Agriseeds brand CL614) that germinated for 6 days in light on wet filter paper. When the roots were approximately 3-6 cm long, single phosphorus / plants were seeded in 591 ml of clear plastic cups containing 150 g of outdoor soil of Lebanon, Indian, where corn was seeded the previous year. This soil was not previously treated with pesticides. 20 newborn SCRs were then placed directly on the roots of the seedlings and covered with soil. After invasion, the seedlings were moistened with 50 ml total volume of dilute broth solution. After soaking, the unsealed cups were incubated in a chamber of high relative humidity (80%) at 26.7 ° C. (78 ° F.). The seedlings were then washed to remove all soil and the roots cut and weighed. Activity was assessed as a percentage of the percentage of corn root remaining relative to the control plant and leaf damage induced by uptake. Leaf damage was visually observed and evaluated as one of-, +, ++, or +++,-indicating no damage and +++ indicating severe damage.

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 침입후 적신 후의 뿌리벌레 유충에 대한 효과 (메트로믹스(등록상표))Effects on Root Beetle Larvae after Soaking After Invasion of Photorabactus Luminesense (Strain W-14) Culture Broth (Metromix®) 처리process 유충larva 잎 손상Leaf damage 뿌리 중량 (g)Root Weight (g) %% 써던 옥수수 뿌리벌레Southern Corn Roots water -- -- 0.4916 ± 0.0230.4916 ± 0.023 100100 배지 (2.0% v/v)Badge (2.0% v / v) -- -- 0.4416 ± 0.0290.4416 ± 0.029 100100 브로쓰 (6.25% v/v)Broth (6.25% v / v) -- -- 0.4641 ± 0.0810.4641 ± 0.081 100100 water ++ ++++++ 0.1410 ± 0.0060.1410 ± 0.006 28.728.7 배지 (2.0% v/v)Badge (2.0% v / v) ++ ++++++ 0.1345 ± 0.0280.1345 ± 0.028 30.430.4 브로쓰 (1.56% v/v)Broth (1.56% v / v) ++ -- 0.4830 ± 0.0310.4830 ± 0.031 104104 웨스턴 옥수수 뿌리벌레Western Corn Roots water -- -- 0.4446 ± 0.0190.4446 ± 0.019 100100 브로쓰( 2.0% v/v)Broth (2.0% v / v) -- -- 0.4069 ± 0.0260.4069 ± 0.026 100100 water ++ -- 0.2202 ± 0.0150.2202 ± 0.015 4949 브로쓰 (2.0% v/v)Broth (2.0% v / v) ++ -- 0.3879 ± 0.0130.3879 ± 0.013 9595

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 침입후 적신 후의 써던 뿌리벌레 유충에 대한 효과 (토양)Effects on Southern Root Beetle Larvae after Soaking after Invasion of Photorabactus Luminense (Strain W-14) Culture Broth (Soil) 처리process 유충larva 잎 손상Leaf damage 뿌리 중량 (g)Root Weight (g) %% water -- -- 0.2148 ± 0.0140.2148 ± 0.014 100100 브로쓰 (50% v/v)Broth (50% v / v) -- -- 0.2260 ± 0.0160.2260 ± 0.016 103103 water ++ ++++++ 0.0916 ± 0.0090.0916 ± 0.009 4343 브로쓰 (50% v/v)Broth (50% v / v) ++ -- 0.2428 ± 0.0320.2428 ± 0.032 113113

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 메트로믹스(등록상표) 중의 제2령의 잔듸 굼벵이에 대한 활성은 다음과 같이 수행된 시험에서 관찰되었다(표 7). 대략 50 g의 무수 메트로믹스(등록상표)를 투명 플라스틱 컵 591 ㎖에 첨가하였다. 이어서, 이 메트로믹스(등록상표)를 희석 포토랍두스 브로쓰 용액 50% (v/v)의 50 ㎖의 전체 부피로 적셨다. 조 브로쓰의 희석은 물로 행하였고, 50 ㎖ 전체 부피에 대해 조 브로쓰 25 ㎖을 25 ㎖에 첨가함으로써 50% 브로쓰를 제조하였다. 정상 배지 농도의 50% 희석인 프로테오스 펩톤 #3(pp3)의 1% (w/v) 용액을 브로쓰 대조군으로서 사용하였다. 적신 후, 5 개의 제2령 잔듸 굼벵이 들을 습윤화된 메트로믹스(등록상표)의 상부에 위치시켰다. 건강한 잔듸 굼벵이 유충은 메트로믹스(등록상표) 속으로 신속하게 굴을 파고 은신하였다. 1 시간 내에 은신하지 못한 유충들은 제거하고 새 유충으로 대체하였다. 컵을 밀봉시키고 28 ℃의 암실 배양기 중에 위치시켰다. 7일 후, 유충들을 메트로믹스(등록상표)로 부터 제거하고 치사율을 기록하였다. 활성은 대조군에 대한 치사율의 백분률로 평가하였다.The activity of the second-stage Zung slugs in the Metromix® of the Photoractose luminescence (strain W-14) culture broth was observed in the test performed as follows (Table 7). Approximately 50 g of anhydrous metromix® was added to 591 mL of a clear plastic cup. This Metromix® was then wetted to a total volume of 50 ml of 50% (v / v) of diluted Photolab Dux Broth solution. Dilution of the crude broth was done with water and 50% broth was prepared by adding 25 ml crude broth to 25 ml for a total volume of 50 ml. A 1% (w / v) solution of Proteose peptone # 3 (pp3) at 50% dilution of normal medium concentration was used as the broth control. After soaking, five second-generation Jang slugs were placed on top of the wetted Metromix®. The healthy Jang slug larvae quickly dug and stealed into Metromix®. Within one hour, the larvae that were not hidden were removed and replaced with new larvae. The cup was sealed and placed in a dark incubator at 28 ° C. After 7 days, the larvae were removed from Metromix® and mortality was recorded. Activity was assessed as a percentage of lethality relative to the control.

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 침입후 적신 후의 잔듸 굼벵이에 대한 효과 (메트로믹스(등록상표))Effects on Zung Slugs after Invasion of Photolab Dose Luminescence (Strain W-14) Culture Broth (Metromix®) 처리process 사망*Dead* 사망%Dead% water 7/157/15 4747 대조 배지(1.0 % v/v)Control medium (1.0% v / v) 12/1912/19 6363 브로쓰 (50% v/v)Broth (50% v / v) 17/2017/20 8585 * 치사/생존 유충의 비로 표시함* Expressed as the ratio of lethal / survival larvae

〈실시예 4〉<Example 4>

잎 적용시 살충제 이용성Insecticide Availability in Leaf Applications

유럽 옥수수 천공충에 대한 포토랍두스 브로쓰의 활성은 브로쓰를 옥수수 잎의 표면에 직접 적용했을 때 관찰하였다(표 8). 이들 분석에 있어서, 포토랍두스 브로쓰는 배양 배지로 100 배 희석하고 잘라진 옥수수 잎의 표면에 잎 표면의 ∼ 6.0 ㎕/㎠의 속도로 손수 가하였다. 잎들을 공기 건조시키고 대략 2 x 2 인치의 동일한 크기의 조각으로 절단하였다. 잎들을 말아서 종이 클립으로 묶고 28.3 g(1 온스) 플라스틱 단 유리 중에 2%의 아가의 0.64 cm (0.25 인치)가 습기를 제공하도록 바닥 표면에 있게 위치시켰다. 이어서, 12 개의 신생 유럽 옥수수 천공충을 말린 잎 상에 위치시키고 컵을 밀봉하였다. 27 ℃의 암실에서 5일 동안 배양시킨 후, 시료들을 섭취 손상 및 회복된 유충에 대하여 기록하였다.The activity of photolabdus broth against European corn puncture was observed when broth was applied directly to the surface of corn leaves (Table 8). In these assays, photolabose broth was diluted 100-fold with culture medium and manually added to the surface of the cut corn leaves at a rate of ˜6.0 μl / cm 2 of the leaf surface. The leaves were air dried and cut into pieces of equal size approximately 2 × 2 inches. The leaves were rolled up and tied with a paper clip and placed in the bottom surface to provide 0.64 cm (0.25 inch) of 2% agar in 28.3 g (1 oz) plastic short glass. Twelve new European corn punches were then placed on the dried leaves and the cup sealed. After incubation for 5 days in the dark at 27 ° C., samples were recorded for ingestion damage and recovered larvae.

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 침입후 절단 옥수수 잎에 적용한 후의 유럽 옥수수 천공충 유충에 대한 효과Effect on European Corn Perforated Larvae after Application of Photorapus Luminesense (Strain W-14) Culture Broth to Infused Corn Leaves 처리process 잎손상Leaf damage 회복된 유충Recovered Larva 중량 (㎎)Weight (mg) water 광범위Wide range 55/12055/120 0.42 ㎎0.42 mg 대조군 배지Control badge 광범위Wide range 40/12040/120 0.50 ㎎0.50 mg 브로쓰 (1.0% v/v)Broth (1.0% v / v) 근소함Small 3/1203/120 0.15 ㎎0.15 mg

배양 브로쓰의 신생 회색담배나방(Heliothis virescens)에 대한 활성은 잎 침지 방법론을 사용하여 입증하였다. 프랑스 목화 잎을 식물로부터 잘라내어 잎 디스크를 18.5 ㎜ 코르크-끌로 절단하였다. 디스크를 개별적으로 대조군 배지 (pp3) 또는 10 kDa 필터를 가진 Amicon (매사추세츠주 Beverly 소재) Proflux M12 트랜스제니탈 여과 시스템을 사용하여 대략 10배로 농축시킨 포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰 중에 침지시켰다. 과량의 용액을 제거하고 똑바로 편 종이 클립을 디스크의 중앙을 통해 위치시셨다. 이어서 종이 클립을 1% 아가 대략 2.0 ㎖을 함유하는 플라스틱, 28.3 g(1.0 온스) 단유리 내에 밀어 넣었다. 이는 아가 상에 잎 디스크를 매달리게 하는 역할을 하였다. 잎 디스크의 건조 후, 단일 신생 회색담배나방 유충을 디스크 상에 위치시키고 컵을 클램핑시켰다. 이어서 컵들을 플라스틱 백 중에 밀봉시키고 암화된 27 ℃ 배양기 중에서 5 일 동안 위치시켰다. 이때 잔여 유충 및 잎 재료들을 중량을 재어 잎 손상에 대한 척도로 설정하였다 (표 9).The activity of neonatal gray tobacco moth (Heliothis virescens) in culture broth was demonstrated using leaf immersion methodology. French cotton leaves were cut from the plants and the leaf discs were cut with 18.5 mm cork-chisels. Incubate the disks individually with photolapus luminescence (strain W-14), concentrated approximately 10-fold using Amicon (Beverly, Mass.) Proflux M12 transgenetal filtration system with control medium (pp3) or a 10 kDa filter. Immerse in broth. Excess solution was removed and a straightened paper clip was placed through the center of the disc. The paper clip was then pushed into a plastic, 28.3 g (1.0 ounce) single glass containing approximately 2.0 ml of 1% agar. This served to suspend the leaf disks on the agar. After drying of the leaf disk, a single newborn gray tobacco moth larva was placed on the disk and the cup was clamped. The cups were then sealed in plastic bags and placed for 5 days in a darkened 27 ° C. incubator. Residual larvae and leaf materials were then weighed and set as a measure for leaf damage (Table 9).

포토랍두스 루미네센스 (균주 W-14) 배양 브로쓰의 목화 잎 침지 분석에 있어서 회색담배나방 신생물 상에 대한 효과Effect of Gray Tobacco Moth Neoplasia on Cotton Leaf Soaking Analysis of Photorapid Luminesense (Strain W-14) Culture Broth 처리process 잎 디스크Leaf disc 최종 중량(㎎) 유충Final weight (mg) larva 대조 잎Contrast leaf 55.7 ± 1.355.7 ± 1.3 na*na * 대조 배지Control badge 34.0 ± 2.934.0 ± 2.9 4.3 ± 0.914.3 ± 0.91 포토랍두스 브로쓰Potorabdus Broth 54.3 ± 1.454.3 ± 1.4 0.0**0.0 ** * - 적용 불가, ** - 생존 유충이 발견되지 않음*-Not applicable, **-No live larvae found

〈실시예 5〉<Example 5>

파트 APart A

독소 펩티드 성분의 특성화Characterization of Toxin Peptide Components

후속되는 분석에 있어서, 실시예 1에서 단리된 밴드의 독소 단백질 소단위들을 30:0.8 (아크릴아미드:비스-아크릴아미드)의 비율의 7% SDS 폴리아크릴아미드 전기영동 겔 상에 분해시켰다. 이 겔 매트릭스는 더 큰 단백질에 대한 더 양호한 해상을 촉진하였다. 실시예 1에서 밴드 1 및 밴드 2 소단위 분자량을 측정하는데 사용했던 겔 시스템은 38:0.8 (아크릴아미드:비스-아크릴아미드)의 18% 겔이었고, 이는 넓은 범위의 크기 분리를 허용하였으나 고분자량 성분의 해상력은 낮았다.In the subsequent assay, the band of toxin protein subunits isolated in Example 1 were digested on a 7% SDS polyacrylamide electrophoretic gel in a ratio of 30: 0.8 (acrylamide: bis-acrylamide). This gel matrix promoted better resolution for larger proteins. The gel system used to measure the band 1 and band 2 subunit molecular weights in Example 1 was an 18% gel of 38: 0.8 (acrylamide: bis-acrylamide), which allowed a wide range of size separations but The resolution was low.

이 분석에 있어서, 8개 보다는 10개의 단백질 밴드가 분해되었다. 표 9는 10개의 해상된 밴드의 이론적 분자량을 나타내고 이들 조건하에서 측정한 분자량을 선행 실시예의 것에 대하여 직접적으로 비교하였다. 추가의 밴드가 이 실시예에서 사용된 상이한 분리 조건하에서 검출되었다는 것은 놀라운 것이 아니다. 분자량에 대한 선행 및 신규 측정 사이의 편차는 또한 분석 조건에 있어서 차이에 따라 예견될 수 있는 것이다. 본 실시예의 분석에 있어서 고분자량 측정물은 개선된 해상력의 결과로서 실시예 1에서의 것보다 더 정확한 것으로 사료된다. 그러나, 이들은 SDS PAGE 분석에 기초한 측정 결과이며 이는 전형적으로 분석 상 정확하지 않은 것이며 펩티드의 추정을 초래하며 후- 및 동시-번역 수식에 기인하여 더욱 변경될 수 있다.In this assay, ten protein bands were degraded rather than eight. Table 9 shows the theoretical molecular weights of the 10 resolved bands and the molecular weights measured under these conditions were compared directly with those of the previous examples. It is not surprising that additional bands were detected under the different separation conditions used in this example. Deviations between previous and novel measurements of molecular weight can also be predicted according to differences in assay conditions. In the analysis of this example it is believed that the high molecular weight measurement is more accurate than that in Example 1 as a result of the improved resolution. However, these are measurement results based on SDS PAGE analysis, which are typically inaccurate in analysis and result in estimation of the peptide and may be further altered due to post- and co-translational formulas.

아미노산 서열들을 10개의 해상된 펩티드 중 5 개의 N-말단 부분에 대하여 결정하였다. 표 10는 단백질의 분자량 및 동정된 서열과 상관 관계가 있다. 서열 2에 있어서, 특정 분석은 잔기 5의 프롤린이 아스파라긴 (asp)일 수 있음을 암시한다. 서열 3에 있어서, 특정 분석은 잔기 13 및 14의 아미노산 잔기가 모두 아르기닌 (arg)일 수 있음을 암시한다. 서열 4에 있어서, 특정 분석은 잔기 6의 아미노산 잔기가 알라닌(ala) 또는 세린 (ser) 중 하나 일 수 있음을 암시한다. 서열 5에 있어서, 특정 분석은 잔기 3의 아미노산 잔기가 아스파르탐산 (asp)일 수 있음을 암시한다.Amino acid sequences were determined for 5 N-terminal portions of 10 resolved peptides. Table 10 correlates with the molecular weight and identified sequences of the proteins. In SEQ ID NO: 2, certain analyzes suggest that the proline at residue 5 may be asparagine (asp). In SEQ ID NO: 3, certain analyzes suggest that the amino acid residues of residues 13 and 14 may both be arginine (arg). In SEQ ID NO: 4, specific analysis suggests that the amino acid residue of residue 6 may be either alanine or serine. In SEQ ID NO: 5, certain analyzes suggest that the amino acid residue of residue 3 may be aspartamic acid (asp).

실시예 1 측정Example 1 Measurement 새로운 측정*New measurement * 서열 목록Sequence list 208208 200.2 kDa200.2 kDa 서열 1SEQ ID NO: 1 184184 175.0 kDa175.0 kDa 서열 2SEQ ID NO: 2 65.665.6 68.1 kDa68.1 kDa 서열 3SEQ ID NO: 3 60.860.8 65.1 kDa65.1 kDa 서열 4SEQ ID NO: 4 56.256.2 58.3 kDa58.3 kDa 서열 5SEQ ID NO: 5 25.125.1 23.2 kDa23.2 kDa 서열 15SEQ ID NO: 15 * 새로운 측정은 SDS PAGE에 기초한 것이고 유전자 서열에 기초하지 않았다. SDS PAGE는 분석상 정확도가 없다.* New measurements are based on SDS PAGE and not on gene sequence. SDS PAGE is not analytically accurate.

〈실시예 5〉<Example 5>

파트 BPart B

독소 펩티드 성분의 특성화Characterization of Toxin Peptide Components

새로운 N-말단 서열, 서열 15, Ala Gln Asp Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr은 상기 실시예 5, 파트 A에서 기술한 천연 HPLC 정제된 독소로부터 단리된 펩티드의 추가의 N-말단 서열화에 의해 얻었다. 이 펩티드는 tcaA 유전자로부터 유래된다. 이 펩티드 표지 TcaAii는위치 254에서 시작하여 위치 491까지 펼쳐있고, 여기서 TcaAiii펩티드, 서열 4가 시작된다. 유전자 서열에 기초한 펩티드의 추정 크기는 25,240 Da이다.The new N-terminal sequence, SEQ ID NO: 15, Ala Gln Asp Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr, is a further N-terminal sequencing of peptide isolated from the native HPLC purified toxin described in Example 5, Part A above. Got by This peptide is derived from the tcaA gene. This peptide label TcaA ii begins at position 254 and extends to position 491, where the TcaA iii peptide, SEQ ID NO: 4 begins. The estimated size of the peptide based on the gene sequence is 25,240 Da.

〈실시예 6〉<Example 6>

독소 펩티드 성분의 특성화Characterization of Toxin Peptide Components

더욱 다른 분석에 있어서, 독소 단백질 복합체를 포토랍두스 루미네센스 성장 배지(Tween의 부재하에서 배양 후)로부터 10% - 80% 암모늄 설페이트 침전에 이어 이온 교환 크로마토그래피 단계 (모노 Q) 및 두 분자 사이징 크로마토그래피 단계를 수행함으로써 단리하였다. 이들 조건들은 실시예 1에서 사용된 것과 유사하다. 처음의 분자 사이징 단계 동안, 두번째의 생물학적으로 할성인 피크는 약 100 ± 10 kDa에서 발견되었다. 단백질 측정에 기초하여 이 단편은 더 큰 또는 처음의 약 860 ± 100 kDa(천연)의 활성 피크 보다 20 - 50 배 덜 활성이었다. 이 단리 실험 동안, 출발 생물학적 활성의 상당부를 함유하였던 약 325 ± 50 kDa의 덜 활성인 피크 역시 해상되었다. 325 kDa 피크는 860 kDa 피크에 관련되거나 또는 이로부터 유도된 것으로 생각된다.In a further assay, the toxin protein complex was subjected to 10% -80% ammonium sulphate precipitation followed by ion exchange chromatography step (mono Q) and two molecule sizing from Photolabduus luminescence growth medium (after incubation in the absence of Tween). Isolation by performing a chromatography step. These conditions are similar to those used in Example 1. During the first molecular sizing step, the second biologically compatible peak was found at about 100 ± 10 kDa. Based on protein measurements, this fragment was 20-50 times less active than the larger or first active peak of about 860 ± 100 kDa (natural). During this isolation experiment, less active peaks of about 325 ± 50 kDa, which contained much of the starting biological activity, were also resolved. The 325 kDa peak is believed to be related to or derived from the 860 kDa peak.

56 kDa 단백질이 이 분석에서 해상되었다. 이 단백질의 N-말단 서열은 서열 6에 나타냈다. 이 단백질이 N-말단에서 서열 5와 상당한 동일성 및 보존성을 나타내는 것이 주목할만 하며, 이는 이 둘이 유전자 집단의 상이한 원에 의해 코딩 될 수 있고 각 유전자에 의해 생성된 단백질은 이 둘이 살충의 독소 복합체로서 작용하기에 서로에 대해 충분히 유사함을 암시한다.56 kDa protein was resolved in this assay. The N-terminal sequence of this protein is shown in SEQ ID NO: 6. It is noteworthy that this protein shows significant identity and conservatism at the N-terminus with SEQ ID NO: 5, both of which can be encoded by different members of the gene population and the protein produced by each gene is the two as a toxin complex of insecticide It suggests that they are sufficiently similar to each other to work.

두번째, 두드러진 185 kDa 단백질은 표 10로부터 단백질 3의 것에 비교할 만한 양으로 일관되게 존재하였으며 동일한 단백질 또는 단백질 단편일 것이다. 이 185 kDa 단백질의 N-말단 서열은 서열 7에 나타냈다.Second, the prominent 185 kDa protein was consistently present in an amount comparable to that of protein 3 from Table 10 and would be the same protein or protein fragment. The N-terminal sequence of this 185 kDa protein is shown in SEQ ID NO: 7.

추가의 N-말단 아미노산 서열 데이터는 또한 단리된 단백질들로부터 얻었다. 결정된 N-말단 서열의 어느 것도 표 10에서 동정된 단백질에 동일하게 나타나지 않았다. 기타의 단백질들이 단리된 제제물에 존재하였다. 하나의 그러한 단백질은 108 kDa의 추정 분자량을 가졌고 서열 8에 나타낸 바와 같은 N-말단 서열을 가졌다. 두번째의 그러한 단백질은 80 kDa의 추정 분자량을 가졌고 서열 9에 나타낸 바와 같은 N-말단 서열을 가졌다.Additional N-terminal amino acid sequence data was also obtained from the isolated proteins. None of the determined N-terminal sequences appeared identical to the proteins identified in Table 10. Other proteins were present in the isolated formulation. One such protein had an estimated molecular weight of 108 kDa and had an N-terminal sequence as shown in SEQ ID NO: 8. The second such protein had an estimated molecular weight of 80 kDa and had an N-terminal sequence as shown in SEQ ID NO: 9.

대략 325 kDa 활성 피크에서 단백질 물질이 크기에 의해 분석되었을 때, 대략 51, 31, 28 및 22 kDa의 밴드들이 관찰되었다. 분자량이 전기영동적 이동의 분석에 의해 결정된 모든 경우에서와 같이, 이들 분자량은 완충액 이온 강도 차이, 전기영동 전력 차이 등에 의해 야기되는 오류 효과를 받았다. 당업자는 결정적인 분자량값은 이들 표준 방법에 의해 결정될 수 없으며 각각은 편차를 갖게 될 것임을 이해할 것이다. 이들 크기의 단백질은 더욱 큰 초기의 독소 복합체에서 관찰된 보다 큰 단백질 종 (대략 200 kDa 크기의)의 분해 산물인 것으로 가정되었다.When protein material was analyzed by size at approximately 325 kDa activity peaks, bands of approximately 51, 31, 28 and 22 kDa were observed. As in all cases where molecular weights were determined by analysis of electrophoretic shifts, these molecular weights received error effects caused by buffer ion intensity differences, electrophoretic power differences, and the like. Those skilled in the art will understand that the critical molecular weight values cannot be determined by these standard methods and each will have a deviation. Proteins of these sizes were assumed to be degradation products of the larger protein species (approximately 200 kDa in size) observed in the larger initial toxin complexes.

마지막으로, 몇몇 제제는 서열 10에 나타낸 N-말단 서열을 갖는 단백질을 포함하였다. 이 서열은 큰 단백질 복합체의 어셈블리에서 기능을 하는 것으로 알려진 보조 단백질인 카페로닌 단백질에 강하게 상동성이었다. 출원인은 서열 10에서 동정된 단백질에 대한 그러한 어셈블리 기능을 규정할 수는 없지만, 그러한 카페로닌 단백질이 그의 어셈블리에서 수반될 수 있는 기술된 독소 단백질 복합체의 존재와 일치하였다. 더욱이, 그러한 단백질은 독성 활성을 갖는 것으로 직접적으로 제안될 수 없으나, 이 단백질은 단백질 독소의 전체의 구조적 성질을 결정하는데 중요할 수 있으며, 따라서 독성 활성 또는 경구 전달 후 복합체의 생체내 생존력에 기여할 것이다.Finally, some formulations included a protein with the N-terminal sequence shown in SEQ ID NO: 10. This sequence was strongly homologous to the caffeonin protein, an auxiliary protein known to function in the assembly of large protein complexes. Applicants cannot prescribe such assembly functions for the protein identified in SEQ ID NO: 10, but is consistent with the presence of the described toxin protein complex that such caffeonine protein may be involved in its assembly. Moreover, such proteins cannot be directly suggested to have toxic activity, but these proteins may be important in determining the overall structural properties of protein toxins and thus will contribute to the in vivo viability of the complex after toxic activity or oral delivery. .

프로테이나제 K에 대한 단백질 독소 복합체의 안정성에 관한 후속 분석을 수행하였다. 10몰 과량의 프로테이나아제 K의 존재 중에서 복합체를 24 시간 배양 시킨후, 활성이 궁극적으로 제거되었다(경구 적용시 치사율이 약 5%까지 떨어졌다)는 것이 확인되었다. 이들 데이터는 독소의 단백질 분해 효소적 성질을 입증한다.Subsequent analyzes of the stability of the protein toxin complex against proteinase K were performed. After 24 hours of incubation of the complex in the presence of 10 molar excess of proteinase K, it was confirmed that activity was ultimately eliminated (mortality dropped to about 5% upon oral application). These data demonstrate the proteolytic enzymatic properties of the toxin.

독성 활성은 투석 멤브레인에 의해서도 유지되었으며 이는 재차 큰 크기의 천연 독소 복합체를 확인한다.Toxic activity was also maintained by the dialysis membrane, which again identified a large size natural toxin complex.

〈실시예 7〉<Example 7>

포토랍두스 독소의 단리, 특성화 및 부분적인 아미노산 서열화Isolation, Characterization, and Partial Amino Acid Sequencing of Photolapus Toxin

단리 및 N-말단 아미노산 서열화: 실시예 5 및 6에 비슷하게 행해진 셋트의 실험에 있어서, 포토랍두스 단백질의 암모늄 설페이트 침전은 포토랍두스 브로쓰, 전형적으로 2 - 3 리터를 암모늄 설페이트 결정을 서서히 첨가함으로써 10% 또는 20% 중 어느 하나의 최종 농도까지 조정함으로써 수행하였다. 4℃에서 1 시간 동안 교반시킨 후, 이 재료를 12,000 x g에서 60 분 동안 원심분리시켰다. 상층액을 80% 암모늄 설페이트로 조정하고 4℃에서 1 시간 동안 교반시킨 후, 12,000 x g에서 60 분 동안 원심분리시켰다. 펠릿을 10 mM Na2·PO4, pH 7.0의 1/10 부피 중에 재현탁시키고 동일한 인산염 완충액에 대하여 4℃에서 밤새 투석시켰다. 투석된 재료를 이온 교환 크로마토그래피에 앞서 12,000 x g에서 1 시간 동안 원심분리시켰다.Isolation and N-terminal Amino Acid Sequencing: In a set of experiments similarly performed in Examples 5 and 6, ammonium sulfate precipitation of photolabdus protein was added slowly to the photolabdus broth, typically 2-3 liters of ammonium sulfate crystals. By adjusting to a final concentration of either 10% or 20%. After stirring at 4 ° C. for 1 hour, the material was centrifuged at 12,000 × g for 60 minutes. The supernatant was adjusted with 80% ammonium sulfate and stirred at 4 ° C. for 1 hour and then centrifuged at 12,000 × g for 60 minutes. The pellet was resuspended in 1/10 volume of 10 mM Na 2 · PO 4 , pH 7.0 and dialyzed overnight at 4 ° C. against the same phosphate buffer. The dialyzed material was centrifuged at 12,000 × g for 1 hour prior to ion exchange chromatography.

HR 16/50 Sepharose (Pharmacia) 음이온 교환 컬럼을 10 mM Na2PO4, pH 7.0으로 평형시켰다. 원심분리시키고, 투석시킨 암모늄 설페이트 펠릿을 Q Sepharose 컬럼에 1.5 ㎖/분의 속도로 가하고 광학적 밀도 (O.D. 280)이 0.100 미만에 도달할 때까지 평형 완충액으로 3.0 ㎖/분의 속도로 활발하게 세척하였다. 다음에, 0 내지 0.5 M에 걸친 3㎖/분의 60 분 NaCl 구배 또는 60 분 동안 각각 0.1 M, 0.4M 및 최종적으로 1.0 NaCl을 사용하는 일련의 단계 용출물을 컬럼에 가하였다. 분획들을 모으고 Centriprep 100을 사용하여 농축시켰다. 별법으로, 단백질은 0.1 M NaCl을 사용한 사전 용출이 없이 단독의 0.4M에 의해 용출될 수도 있다.HR 16/50 Sepharose (Pharmacia) anion exchange column was equilibrated to 10 mM Na 2 PO 4 , pH 7.0. Centrifuged, dialyzed ammonium sulphate pellets were added to the Q Sepharose column at a rate of 1.5 ml / min and vigorously washed with equilibration buffer at 3.0 ml / min until the optical density (OD 280) reached less than 0.100. . Next, a 60 minute NaCl gradient of 3 mL / min over 0 to 0.5 M or a series of step eluents using 0.1 M, 0.4 M and finally 1.0 NaCl, respectively, for 60 minutes were added to the column. Fractions were collected and concentrated using Centriprep 100. Alternatively, the protein may be eluted with 0.4 M alone without prior elution with 0.1 M NaCl.

농축된 Q Sepharose 시료의 2 ㎖ 분취량을 0.5 ㎖/분의 속도로 10 mM Na2PO4, pH 7.0으로 평형시킨 HR 16/50 Sepharose 12 (Pharmacia) 겔 투과 컬럼 상에 부하하였다. 이 컬럼을 동일한 완충액으로 240 분 동안 0.5 ㎖/분의 속도로 세척하고 2 분 시료를 회수하였다. 공 부피의 재료를 수집하고 Centriprep 100을 사용하여 농축시켰다. 농축된 Sepharose 12 시료의 2 ㎖ 분취량을 0.5 ㎖/분의 속도로 10 mM Na2PO4, pH 7.0으로 평형시킨 HR 16/50 Sepharose 4B-CL (Pharmacia) 겔 투과 컬럼 상에 부하하였다. 이 컬럼을 동일한 완충액으로 240 분 동안 0.5 ㎖/분의 속도로 세척하고 2 분 시료를 회수하였다.A 2 ml aliquot of the concentrated Q Sepharose sample was loaded onto an HR 16/50 Sepharose 12 (Pharmacia) gel permeation column equilibrated to 10 mM Na 2 PO 4 , pH 7.0 at a rate of 0.5 ml / min. This column was washed with the same buffer at a rate of 0.5 ml / min for 240 minutes and a 2 minute sample was recovered. Empty volumes of material were collected and concentrated using Centriprep 100. A 2 ml aliquot of the concentrated Sepharose 12 sample was loaded onto an HR 16/50 Sepharose 4B-CL (Pharmacia) gel permeation column equilibrated with 10 mM Na 2 PO 4 , pH 7.0 at a rate of 0.5 ml / min. This column was washed with the same buffer at a rate of 0.5 ml / min for 240 minutes and a 2 minute sample was recovered.

배제된 단백질 피크는 ∼30 kDa 내지 1000 kDa의 범위에서 단백질을 분리하는 Sepharose CL-4B 수지를 사용한 겔 투과 컬럼에 적용함으로써 2회째의 분획을 행하였다. 이 분획은 두 개의 피크로 분해되었는데; 공 부피 (〉1000 kDa)에서 부수적인 피크 및 약 860 kDa의 겉보기 분자량으로 용출되는 주된 피크이었다. 일주일에 걸쳐서 후속 겔 투과된 시료들은 아마도 제한된 단백질 가수분해에 의한 주된 피크로부터 형성된 것으로 보이는 세번째 피크 (대략 325 kDa)의 점진적인 출현을 나타냈다. 이들 3 개의 피크에 대하여 수행한 생물학적 시험은 공 피크는 활성이 없는 반면, 860 kDa 독소 복합체는 고도로 활성이었고, 325 kDa 피크는 아주 강력하긴 하였지만 덜 활성이었음을 나타낸다. 상이한 발효 생산으로부터의 Sepharose CL-4B 독소 복합체 피크의 SDS PAGE 분석은 "P" 및 "S"로 표시된 두개의 뚜렷한 펩티드 패턴을 나타냈다. 두 패턴은 그들의 분자량 및 이들의 분획 중의 펩티드 성분의 농도에 있어서 현저한 차이를 나타냈다. 가장 빈번하게 생성된 "S" 패턴은 4 개의 고분자량 펩티드 (〉150 kDa)를 가진 반면, "P" 패턴은 3 개의 고분자량 펩티드를 가졌다. 또한, "S" 펩티드 분획은 유럽 옥수수 천공충에 대하여 2-3 배 더 높은 활성을 갖는 것으로 나타났다. 이 이동은 접종물의 연령 및(또는) 오래된 배양물의 성장 변수에 기초한 다른 인자에 기인한 단백질 발현에 있어서 변이에 관련될 수 있다.The excluded protein peak was subjected to the second fraction by applying it to a gel permeation column using Sepharose CL-4B resin separating proteins in the range of -30 kDa to 1000 kDa. This fraction was broken down into two peaks; It was a dominant peak eluting at an empty volume (> 1000 kDa) and an apparent molecular weight of about 860 kDa. Over the course of the week, subsequent gel permeated samples showed a gradual appearance of a third peak (approximately 325 kDa), presumably formed from the main peak by limited proteolysis. Biological tests conducted on these three peaks indicated that the empty peak was inactive, whereas the 860 kDa toxin complex was highly active and the 325 kDa peak was very strong but less active. SDS PAGE analysis of Sepharose CL-4B toxin complex peaks from different fermentation production showed two distinct peptide patterns, labeled "P" and "S". The two patterns showed significant differences in their molecular weight and the concentration of peptide components in their fractions. The most frequently produced "S" pattern had four high molecular weight peptides (> 150 kDa), while the "P" pattern had three high molecular weight peptides. In addition, the "S" peptide fraction has been shown to have 2-3 times higher activity against European maize borer. This shift may be related to variations in protein expression due to other factors based on the age of the inoculum and / or growth parameters of the old culture.

"P" 또는 "S" 펩티드 패턴으로 결정된 피크 독소 복합체 분획의 밀리그램 정량은 예비 SDS PAGE를 수행하였고, TRIS-글리신 (PVDF 멤브레인(ProBlott(등록상표, Applied Biosystems) 에 대한 Seprabuff(등록상표)으로 3 - 4 시간 동안 트랜스블롯(transblot)시켰다. 블롯들을 각각 Harvard MicroChem 및 Cambridge ProChem에 아미노산 분석 및 N-말단 아미노산 서열화를 위해 보냈다. "S" 패턴에서 3 개의 펩티드는 이전의 실시예에서 동정된 서열에 비하여 유일한 N-말단 아미노산 서열을 가졌다. 후술하는 서열 13에 나타낸 201 kDa (TcdAii) 펩티드는 33% 아미노산 동일성을 공유하였고 서열 1과는 50% 유사성을 나타냈다 (TcbAii) (표 11, 표 11에서 세로선은 아미노산 동일성 및 콜론은 보존적인 아미노산 치환을 나타낸다). 서열 14에 나타낸 197 kDa의 두번째 펩티드(TcdB)는 42% 동일성을 가졌고 서열 2(TcaC)와는 58% 유사성을 나타냈다(수동 계산된 유사성과 동일성). 세번째 205 kDa의 펩티드는 TcdAii로 표시하였다. 또한, 235 kDa 이상의 펩티드의 서열 16의 제한된 N-말단 아미노산 서열(TcbA)는 서열 1 (Tcbii)에 대응하는 추정된 아미노산 서열을 포함하는 클로닝된 유전자 (tcbA), 서열 11로부터 추정된 아미노산 서열, 서열 12와 일치하였다. 이는 더 큰 235+ kDa 펩티드가 발효 동안 201 kDa 펩티드 (TcbAii)(서열 1)로 단백질 가수분해적으로 가공되어 가능하게는 분자의 활성화를 초래함을 나타낸다. 또다른 서열에 있어서 상기 실시예 5에서 보고된 당초 서열 5 (TcaBii)로서 보고된 서열은 세번째 위치에서 글리신 (Gly) 보다는 아스파르탐산 잔기(Asp) 및 각각 18 및 19 위치에서 두 개의 추가의 아미노산 Gly 및 Asp를 함유하는 것으로 나타났다. 다른 두개의 기타 서열, 서열 2 (TcaC) 및 서열 3 (TcaBi)에 있어서, 추가의 아미노산 서열이 얻어졌다. 밀도계 정량분석을 N-말단 분석을 위해 보내졌던 "S" 제제와 동일한 시료를 사용하여 수행하였다. 이 분석은 201 Kda 및 197 kDa 펩티드가 "S" 패턴에서 전체 쿠마시 브릴리언트 블루 염색된 단백질의 각각 7.0% 및 7.2%를 나타냈고, 기타 풍부한 펩티드에 유사한 양으로 존재함을 보여주었다. 이들 펩티드들은 다양한 CryI Bt 독소 등의 기타 세균성 독소에서 발견되는 상황과 유사한 단백질 동족체를 나타낼 수 있는 것으로 고려된다. 이들 단백질은 독성 단편을 포함하여 N-말단 아미노산 서열에서 40 - 90% 까지 유사성이 다양하다.Milligram quantification of peak toxin complex fractions determined with "P" or "S" peptide pattern was performed with preliminary SDS PAGE and 3 with Seprabuff® for TRIS-glycine (PVDF membrane (ProBlott®). Blots were transfected for 4 hours Blots were sent to Harvard MicroChem and Cambridge ProChem for amino acid analysis and N-terminal amino acid sequencing, respectively.Three peptides in the “S” pattern were identified in the sequence identified in the previous example. Had a unique N-terminal amino acid sequence as compared to the 201 kDa (TcdA ii ) peptide shown in SEQ ID NO: 13, below, shared 33% amino acid identity and showed 50% similarity to SEQ ID NO: 1 (TcbA ii ) (Table 11, Table 11 In the vertical line indicates amino acid identity and colon indicates conservative amino acid substitutions.The second peptide of 197 kDa (TcdB) shown in SEQ ID NO: 14 had 42% identity and SEQ ID NO: 2 (TcaC). ), The third 205 kDa peptide is represented by TcdA ii, and the limited N-terminal amino acid sequence (TcbA) of SEQ ID NO: 16 of the peptide of at least 235 kDa is SEQ ID NO: 1). The cloned gene (tcbA) comprising the putative amino acid sequence corresponding to (Tcb ii ), the amino acid sequence deduced from SEQ ID NO: 11, was consistent with SEQ ID NO: 12. This means that a larger 235+ kDa peptide was added to the 201 kDa peptide (TcbA) during fermentation. ii ) proteolytically processed into (SEQ ID NO: 1), possibly leading to the activation of the molecule.In another sequence, the sequence reported as the original sequence 5 (TcaB ii ) reported in Example 5 above It was found to contain aspartamic acid residues (Asp) rather than glycine at the third position and two additional amino acids Gly and Asp at positions 18 and 19. The other two other sequences, SEQ ID NO: 2 (T In caC) and SEQ ID NO: 3 (TcaB i ), additional amino acid sequences were obtained. Densitometer quantitation was performed using the same sample as the "S" formulation that was sent for N-terminal analysis. This analysis showed that the 201 Kda and 197 kDa peptides represented 7.0% and 7.2% of the total Coomassie Brilliant Blue stained protein in the “S” pattern, respectively, and were present in similar amounts in the other abundant peptides. It is contemplated that these peptides may exhibit protein analogs similar to those found in other bacterial toxins, such as various CryI Bt toxins. These proteins vary in similarity by 40-90% in the N-terminal amino acid sequence, including toxic fragments.

내부 아미노산 서열화: 독소 펩티드 유전자의 클로닝을 촉진하기 위하여, 선택된 펩티드의 내부 아미노산 서열을 다음과 같이 얻었다. "P" 또는 "S" 펩티드 패턴으로 결정된 피크 2A 분획의 밀리그램 정량분석은 예비 SDS PAGE로 수행하였고, TRIS-글리신 (PVDF 멤브레인(ProBlott(등록상표, Applied Biosystems)에 대한 Seprabuff(등록상표)으로 3 - 4 시간 동안 트랜스블롯(transblot)시켰다. 블롯들을 각각 Harvard MicroChem 및 Cambridge ProChem에 아미노산 분석 및 N-말단 아미노산 서열화를 위해 보냈다. TcbAii(서열 1을 포함함), TcdAii, 및 TcaBi(서열 3을 포함함)으로서 언급된 3개의 펩티드들을 Harvard MicroChem에 의해 트립신 분해를 하고 이어서 HPLC 크로마토그래피를 시켜 개별 펩티드들을 분리하였다. N-말단 아미노산 분석은 선택된 트립신형 펩티드 단편 상에 수행하였다. 두개의 내부 펩티드들은 TcdAii-PT111 (서열 17) 및 TcdAii-PT79(서열 18)로서 언급된 펩티드 TcdAii(205 kDa 펩티드)에 대해서 서열화하였다. 두개의 내부 펩티드들은 TcaBi-PT158 (서열 19) 및 TcaBi-PT108(서열 20)으로서 언급된 펩티드 TcaBi(68 kDa 펩티드)에 대해서 서열화하였다. 4개의 내부 펩티드들은 TcbAii-PT103 (서열 21), TcbAii-PT56(서열 22), TcbAii-PT81(a) (서열 23) 및 TcbAii-PT81(b)(서열 24)로서 언급된 펩티드 TcbAii(201 kDa 펩티드)에 대해서 서열화하였다.Internal Amino Acid Sequencing: To facilitate cloning of the toxin peptide gene, the internal amino acid sequence of the selected peptide was obtained as follows. Milligram quantitation of peak 2A fractions determined with "P" or "S" peptide pattern was performed by preliminary SDS PAGE, and TRIS-Glycine (3 with Seprabuff® for PVDF membranes (ProBlott®, Applied Biosystems)). -4 hours transblot Blots were sent to Harvard MicroChem and Cambridge ProChem for amino acid analysis and N-terminal amino acid sequencing, respectively TcbA ii (including SEQ ID NO: 1), TcdA ii , and TcaB i (SEQ ID NO: 6) The three peptides referred to as (including 3) were trypsin digested by Harvard MicroChem followed by HPLC chromatography to separate the individual peptides.N-terminal amino acid analysis was performed on selected trypsin peptide fragments. internal peptides were sequenced for the peptide TcdA ii (205 kDa peptide) referred to as TcdA ii -PT111 (SEQ ID NO: 17) and ii TcdA -PT79 (SEQ ID NO: 18). two internal Are suited TcaB i -PT158 (SEQ ID NO: 19) and was sequenced for a TcaB i -PT108 (SEQ ID NO: 20) peptide TcaB i (68 kDa peptide) referred to as the Four internal peptides are TcbA ii -PT103 (SEQ ID NO: 21), TcbA and peptide TcbA ii (201 kDa peptide), referred to as ii- PT56 (SEQ ID NO: 22), TcbA ii- PT81 (a) (SEQ ID NO: 23) and TcbA ii- PT81 (b) (SEQ ID NO: 24).

M-말단 아미노산 서열 (동일성 및 유사성은 수동계산됨)M-terminal amino acid sequence (identity and similarity are manually calculated) 201 kDa (서열 1과 33% 동일성 및 50% 유사성)201 kDa (33% identity and 50% similarity to SEQ ID NO: 1) L I G Y N N O F S G * A 서열 13: | | | : |F I Q G Y S D L F G N - A 서열 1L I G Y N N O F S G * A Sequence 13: | |: | F I Q G D S D L F G N-A Sequence 1 197 kDa (서열 2와 42% 동일성 및 58% 유사성)197 kDa (42% identity and 58% similarity with SEQ ID NO: 2) M Q N S Q T F S V G E L 서열 14| | : | | : : |M Q D S P E V S I T T L 서열 2M Q N S Q T F S V G E L SEQ ID NO: 14 | |: | |:: | M M D S P E V S I T T L Sequence 2

〈실시예 8〉<Example 8>

포토랍두스 루미네센스 (균주 W-14) 게놈 DNA의 코스미드 라이브러리 제작 및 독소 단백질 제제로 이루어진 펩티드를 코딩하는 유전자의 단리에 대한 그의 스크리닝Screening for the isolation of genes encoding peptides consisting of cosmid library construction of photolapux luminescence (strain W-14) genomic DNA and toxin protein preparations

이형의 숙주에서 포토랍두스 곤충 독소 단백질의 생산 및 기타 용도를 위한 전제 조건으로서, 그러한 펩티드를 코딩하는 유전자를 단리하고 특성화하는 것이 필요하다. 이 목적인 동시에 추구된다. 후술하는 한 접근법은 정제된 독소에 대한 단클론성 클론 또는 폴리클로날 항체의 사용하여 이것을 발현 라이브러리로부터 클론을 단리하는데 사용하는 것에 기초한다. 본 실시예에 기술된 다른 접근법은 N-말단 및 내부의 아미노산 서열 데이터를 사용하여 PCR 증폭에 사용하기 위한 동의성 올리고뉴클레오티드를 설계하는 것에 기초를 두고 있다. 어느 방법이든 각각의 유전자의 단리 및 이들의 DNA 염기 서열의 결정을 허용하도록 펩티드-코딩 유전자를 함유하는 DNA 클론을 동정하는데 사용될 수 있다.As a prerequisite for the production and other uses of photolabdus insect toxin proteins in heterologous hosts, it is necessary to isolate and characterize the genes encoding such peptides. It is both a purpose and a pursuit. One approach described below is based on the use of monoclonal clones or polyclonal antibodies against purified toxins and use this to isolate clones from expression libraries. Another approach described in this example is based on designing synonymous oligonucleotides for use in PCR amplification using N-terminal and internal amino acid sequence data. Either method can be used to identify DNA clones containing peptide-encoding genes to allow isolation of each gene and determination of their DNA base sequence.

게놈 DNA 단리: 포토랍두스 루미네센스 균주 W-14 (ATCC 기탁 번호 55397)을 2% 프로테오스 펩톤 #3 아가 (Difco Laboratories, 미시간주 디트로이트 소재) 상에 성장시키고, 상기 실시예 1에 기술한 방법을 사용하여 계대 후 반복 생물학적 시험에 의해 유지시켰다. 50 ㎖ 진탕 배양물이 2% 프로테오스 펩톤 #3 배지 중의 175 ㎖ 배플 플라스크 중에서 생성되었고, 28 ℃ 및 150 rpm으로 대략 24 시간 동안 성장시켰다. 이 배양물 15 ㎖을 펠릿화하고 이를 DNA 단리를 위해 해동시킬 때까지는 그의 배지 중에 -20 ℃에서 냉동시켰다. 해동된 배양물은 원심분리 (700 x g, 30 분)시키고 부유 오랜지 뮤코폴리사카라이드 물질을 제거하였다. 잔류 세포 물질을 원심분리시켜(25,000 x g, 15분) 세균 세포를 펠릿화하고, 배지를 제거하여 버렸다.Genomic DNA Isolation: Photorabdus luminescence strain W-14 (ATCC Accession No. 55397) was grown on 2% Proteose peptone # 3 agar (Difco Laboratories, Detroit, Mich.) And described in Example 1 above. One method was used to maintain post repeated passage biological testing. 50 ml shake cultures were produced in 175 ml baffle flasks in 2% Proteose Peptone # 3 medium and grown for approximately 24 hours at 28 ° C. and 150 rpm. 15 ml of this culture was pelleted and frozen at −20 ° C. in its medium until it was thawed for DNA isolation. Thawed cultures were centrifuged (700 × g, 30 min) and the suspended orange mucopolysaccharide material was removed. Residual cell material was centrifuged (25,000 × g, 15 min) to pellet bacterial cells and the media removed and discarded.

게놈 DNA를 문헌 [Current Protocols in Moleculat Biology, Ausubel et al. eds, John Wiley & Sons, 1994의 섹션 2.4.1]에 기술된 CTAB 법(염 쇼크를 포함시키고 모든 부피를 10배 증가하도록 변형시킴)을 채용함으로써 단리하였다. 펠릿화된 세균 세포들을 TE 완충액(10 mM Tris-HCl, 1 mM EDTA, pH 8.0) 중에 10 ㎖으로 최종 부피로 재현탁시키고, 이어서 5 M NaCl 12 ㎖을 첨가하였다; 이 혼합물은 15,000 x g에서 20분 원심분리시켰다. 펠릿을 TE 5.7 ㎖ 중에서 재현탁시키고, 10% SDS 300 ㎖ 및 20 ㎎/㎖ 프로테이나아제 K(Gibco BRL Products, Grand Island, NY; 멸균 증류수 중) 60 ㎖을 현탁액에 첨가하였다. 이 혼합물을 37 ℃에서 1 시간 동안 배양시키고; 이어서 대략 10 ㎎ 라이소자임 (Worlington Biochemical Corp., Freehold, NJ)를 첨가하였다. 추가의 45분 후, 5 M NaCL 1 ㎖ 및 CTAB/NaCl 용액(10% w/v CTAB, 0.7 M NaCl) 800 ㎖을 첨가하였다. 이 제제는 65℃에서 10 분 동안 배양시키고 이어서 부드럽게 교란시킨 다음 추가로 배양시키고 대략 20 분 동안 교란시켜 세포 물질의 정화를 거들었다. 동일 부피의 클로로포름/이소아밀 알코올 용액 (24:1 v/v)을 첨가하고, 부드럽게 혼합시키고 원심분리시켰다. 동일 부피의 PCI (페놀/클로로포름/이소아밀 알코올 용액 (50:49:1 v/v, 1 M Tris-HCl, pH 8.0으로 평형시킴; Intermountain Scientific Corporation, Kaysville, UT)로 2회 추출 후, DNA를 이소프로판올 0.6 부피로 침전시켰다. DNA 침전물을 유리 막대로 가볍게 제거하여, 70% 에탄올로 2회 세척하고, 건조시키고, STE 완충액(10 mM Tris-HCl pH 8.0, 10 mM NaCl, 1 mM EDTA) 2 ㎖ 중에 용해시켰다. 이 제제물은 260 nm의 광학 밀도 (즉, O.D260)에 의해 측정된 바 2.5 ㎎/㎖ DNA를 함유하였다.Genomic DNA is described in Current Protocols in Moleculat Biology, Ausubel et al. eds, John Wiley & Sons, 1994, section 2.4.1] was isolated by employing the CTAB method (including salt shock and modifying to increase all volumes 10-fold). Pelletized bacterial cells were resuspended in 10 ml final volume in TE buffer (10 mM Tris-HCl, 1 mM EDTA, pH 8.0), followed by addition of 12 ml 5 M NaCl; This mixture was centrifuged at 15,000 xg for 20 minutes. The pellet was resuspended in 5.7 ml TE and 300 ml 10% SDS and 60 ml 20 mg / ml proteinase K (Gibco BRL Products, Grand Island, NY; in sterile distilled water) were added to the suspension. The mixture is incubated at 37 ° C. for 1 hour; Approximately 10 mg lysozyme (Worlington Biochemical Corp., Freehold, NJ) was then added. After an additional 45 minutes, 1 ml of 5 M NaCl and 800 ml of CTAB / NaCl solution (10% w / v CTAB, 0.7 M NaCl) were added. This preparation was incubated at 65 ° C. for 10 minutes, then gently disturbed, then further incubated and disturbed for approximately 20 minutes to aid in the purification of cellular material. Equal volume of chloroform / isoamyl alcohol solution (24: 1 v / v) was added, mixed gently and centrifuged. Equilibrate with equal volume of PCI (phenol / chloroform / isoamyl alcohol solution (50: 49: 1 v / v, 1 M Tris-HCl, pH 8.0; Intermountain Scientific Corporation, Kaysville, UT), then extract DNA Precipitated with 0.6 volume of isopropanol DNA precipitate was gently removed with a glass rod, washed twice with 70% ethanol, dried and STE buffer (10 mM Tris-HCl pH 8.0, 10 mM NaCl, 1 mM EDTA) 2 Dissolved in ml This formulation contained 2.5 mg / ml DNA as measured by an optical density of 260 nm (ie OD 260 ).

단리된 게놈 DNA의 분자량 크기 범위는 라이브러리 제작에 대한 적합성에 대하여 평가하였다. CHEF 겔 분석은 0.5 x TBE 완충액(44.5 mM Tris-HCl pH 8.0, 44.5 mM H3BO3, 1 mM EDTA)으로 만든 1.5% 아가로스 (Seakem (등록상표) LE, FMC BioProducts, Rockland, ME) 겔 중에서 Pulsewave 760 Switcher가 구비된 BioRad CHEF-DR II 장치 (Bio-Rad Laboratories, Inc., Richmond, CA) 상에서 수행하였다. 진행 변수들은 초기 A 시간, 3초; 최종 A 시간, 12초; 200 볼트; 진행 온도 4 - 18 ℃; 진행 시간, 16.5 시간이었다. 에치듐 브로마이드 염색 및 자외선 광하에 겔의 검사는 DNA가 길이에서 30 - 250 kbp에 걸쳐 나타냈다.The molecular weight size range of the isolated genomic DNA was evaluated for suitability for library construction. CHEF gel analysis was performed with 1.5% agarose (Seakem® LE, FMC BioProducts, Rockland, ME) gel made with 0.5 x TBE buffer (44.5 mM Tris-HCl pH 8.0, 44.5 mM H 3 BO 3 , 1 mM EDTA). On a BioRad CHEF-DR II device (Bio-Rad Laboratories, Inc., Richmond, CA) equipped with Pulsewave 760 Switcher. Progression variables were initial A time, 3 seconds; Final A time, 12 seconds; 200 volts; Running temperature 4-18 ° C .; Run time, 16.5 hours. Ethidium bromide staining and examination of the gel under ultraviolet light revealed that the DNA spans 30-250 kbp in length.

라이브러리의 제작: 부분적인 Sau3A 1 분해물을 이 포토랍두스 게놈 DNA 제제물로 제조하였다. 이 방법은 상기 Ausbel의 섹션 3.1.3에 기초하였다. 거의 최적의 결과가 얻어질 때까지 다양한 조건 하에서 소규모 반응을 진행하여 개조하였다. 이 개조 조건을 사용하여 몇몇의 확대 규모 반응을 진행시켰으며 결과들을 CHEF 겔 상에서 분석하고, 단지 최상의 확대 규모의 제제를 계속하여 수행하였다. 최적의 경우에 있어서, 포토랍두스 게놈 DNA 200 ㎍을 2 ㎖ 전체 부피의 1 X NEB 4 완충액 (제조원에 의해 10 X로 공급됨) 중에서 Sau3A 1 (New England Biolabs, "NEB", Beverly, MA) 1.5 단위를 사용하여 37 ℃에서 15 분 동안 배양시켰다. 반응을 PCI 2 ㎖을 첨가하여 정지시키고 8000 x g에서 10 분 동안 원심분리시켰다. 상층액에 5 M NaCl 200 ㎕ 및 빙냉 에탄올 6 ㎖을 첨가하였다. 이 제제를 -20 ℃에서 30 분 동안 급냉시키고, 이어서 12,000 x g에서 15 분 동안 원심분리시켰다. 상층액을 제거하고 침전물을 진공 중의 40 ℃에서 건조시킨 다음 STE 400 ㎕ 중에 재현탁시켰다. 분광광도계 분석은 투입 DNA의 약 40% 회수율을 나타냈다. 분해된 DNA를 CPMB(인용 문헌 참조)의 섹션 5.3.2에 따라 수크로스 구배 상에서 크기 분획화하였다. 10% 내지 40%(w/v) 선형 수크로오스 구배를 Ultra-Clear(등록상표) 튜브 (Beckman Instruments, Inc., Palo Alto, CA) 중의 구배 마커를 사용하여 제조하고 DNA 시료를 상부에 위치시켰다. 원심분리(26,000 rpm, 17 시간, Beckman SW41 로타, 20 ℃) 후, 분획들 (약 750 ㎕)을 구배의 상부로부터 꺼내어 상기한 바의 CHEF 겔 전기영동에 의해 분석하였다. 크기 범위 20 - 40 kbp의 Sau3A 1를 포함하는 분획들을 선별하고 DNA를 상기 Ausbel의 섹션 5.3.3의 방법을 수정(모든 용액의 양을 대략 6.3배로 증가시킴)함으로써 침전시켰다. 철야 침전 후, DNA를 원심분리 (17,000 x g, 15분)에 의해 회수하고, 건조시키고, TE 중에 재용해시키고, 80 ㎕의 최종 부피로 모은 다음, 3 M 쇼듐 아세테이트 8 ㎕ 및 에탄올 220 ㎕을 첨가하여 재침전시켰다. 상기한 바와 같이 원심분리에 의해 회수한 펠릿을 TE 12 ㎕ 중에 재현탁시켰다. DNA의 농축물은 Hoefer TKO100 플루오로메터 (Hoefer Scientific Instruments, 캘리포니아주 샌프란시스코 소재)에서 Hoechst 33258 염료 (Polyscience, Inc., Warrington, PA) 형광분석기에 의해 결정하였다. 대략 2.5 ㎍의 크기 분획된 DNA가 회수되었다.Construction of the Library: Partial Sau3A 1 digests were prepared with this Photorabdus genomic DNA preparation. This method is based on section 3.1.3 of Ausbel above. Small scale reactions were carried out under various conditions and modified until near optimum results were obtained. Several scale-up reactions were run using this retrofit condition and the results were analyzed on a CHEF gel and only the best scale-up formulation continued to run. In the best case, 200 μg of photolapis genomic DNA was added to Sau3A 1 (New England Biolabs, “NEB”, Beverly, MA) in 2 ml total volume of 1 × NEB 4 buffer (supplied by manufacturer 10 ×). Incubate at 37 ° C. for 15 minutes using 1.5 units. The reaction was stopped by addition of 2 ml of PCI and centrifuged at 8000 x g for 10 minutes. To the supernatant was added 200 [mu] l of 5 M NaCl and 6 ml of ice cold ethanol. This formulation was quenched at −20 ° C. for 30 minutes and then centrifuged at 12,000 × g for 15 minutes. The supernatant was removed and the precipitate was dried at 40 ° C. in vacuo and then resuspended in 400 μl STE. Spectrophotometric analysis showed about 40% recovery of the input DNA. The digested DNA was size fractionated on a sucrose gradient according to section 5.3.2 of CPMB (see Cited Reference). 10% to 40% (w / v) linear sucrose gradients were prepared using gradient markers in Ultra-Clear® tubes (Beckman Instruments, Inc., Palo Alto, Calif.) And DNA samples were placed on top. After centrifugation (26,000 rpm, 17 hours, Beckman SW41 Rota, 20 ° C.), fractions (about 750 μl) were removed from the top of the gradient and analyzed by CHEF gel electrophoresis as described above. Fractions containing Sau3A 1 in the size range 20-40 kbp were selected and DNA was precipitated by modifying the method of section 5.3.3 of the Ausbel above (increasing the amount of all solutions approximately 6.3-fold). After overnight precipitation, the DNA was recovered by centrifugation (17,000 xg, 15 minutes), dried, redissolved in TE, collected to a final volume of 80 μl, then 8 μl of 3 M sodium acetate and 220 μl of ethanol. And reprecipitated. The pellet recovered by centrifugation as described above was resuspended in 12 μl of TE. Concentrates of DNA were determined by a Hoechst 33258 dye (Polyscience, Inc., Warrington, PA) fluorometer on a Hoefer TKO100 fluorometer (Hoefer Scientific Instruments, San Francisco, CA). Approximately 2.5 μg of size fractionated DNA was recovered.

코스미드 pWE15 DNA (Stratagene, 캘리포니아주 라졸라 소재) 30 ㎍을 제조원의 완충액(최종 부피 200 ㎕, 37 ℃, 1 시간) 중의 제한 효소 BamH 1(NEB) 100 단위를 사용하여 분해를 완료하였다. 반응물을 PCI 100 ㎕로 추출하고 DNA를 3M 소듐 아세테이트 및 -20℃ 무수 에탄올 550 ㎕을 첨가하여 수층으로부터 침전시켰다. -70 ℃에서 20 분 후, DNA를 원심분리 (17,000 x g, 15분)에 의해 회수하고 진공하에 건조시키고, 10 mM Tris-HCl, pH 8.0 180㎕ 중에 용해시켰다. 여기에 10 X CIP 완충액(10 mM Tris-HCl, pH 8.3; 10 mM ZnCl2; 10 mM MgCl2) 20㎕ 및 1:4 희석 송아지 장 알칼린 포스파타아제(Boehringer Mannheim Corporation, Indianapolis, IN) 1 ㎕ (0.25 단위)을 첨가하였다. 37 ℃에서 30분 후, 다음을 첨가하였다: 0.5M EDTA 2 ㎕ pH 8.0, 10% SDS 10 ㎕; 20 ㎎/㎖ 프로테이나아제 K(상기함) 0.5 ㎕. 이어서, 55 ℃에서 30 분 동안 배양시켰다. PCI 100 ㎕ 및 페놀(Intermountain Scientific Corporation, 1M Tris-Hcl, pH 8.0으로 평형시킴) 100㎕을 사용하여 추출한 후, 탈인산화된 DNA를 7.5 M 암모늄 아세테이트 72 ㎕ 및 -20℃ 에탄올 550 ㎕을 첨가하여 침전시키고, 30 분 동안 얼음 상에서 배양시키고 상기한 바와 같이 원심분리시켰다. 펠릿화된 DNA를 -20 ℃ 70% 에탄올 500 ㎕로 1회 세척하고, 진공 중에서 건조시키고 TE 완충액 20 ㎕ 중에 용해시켰다.Thirty μg of cosmid pWE15 DNA (Stratagene, La Jolla, Calif.) Was completed using 100 units of restriction enzyme BamH 1 (NEB) in manufacturer's buffer (final volume 200 μl, 37 ° C., 1 hour). The reaction was extracted with 100 μl PCI and the DNA was precipitated from the aqueous layer by addition of 3M sodium acetate and 550 μl anhydrous ethanol at −20 ° C. After 20 minutes at −70 ° C., the DNA was recovered by centrifugation (17,000 × g, 15 minutes), dried under vacuum and dissolved in 180 μl of 10 mM Tris-HCl, pH 8.0. 20 μl of 10 × CIP buffer (10 mM Tris-HCl, pH 8.3; 10 mM ZnCl 2 ; 10 mM MgCl 2 ) and 1: 4 dilution calf enteric alkaline phosphatase (Boehringer Mannheim Corporation, Indianapolis, IN) 1 Μl (0.25 units) were added. After 30 minutes at 37 ° C., the following was added: 2 μl 0.5M EDTA pH 8.0, 10 μl 10% SDS; 0.5 μl 20 mg / ml proteinase K (supplied). It was then incubated at 55 ° C. for 30 minutes. After extraction using 100 μl of PCI and 100 μl of phenol (equilibrated to 1M Tris-Hcl, pH 8.0), dephosphorylated DNA was added by adding 72 μl of 7.5 M ammonium acetate and 550 μl of -20 ° C. ethanol. Precipitate, incubate on ice for 30 minutes and centrifuge as described above. The pelleted DNA was washed once with 500 μl of −20 ° C. 70% ethanol, dried in vacuo and dissolved in 20 μl TE buffer.

크기 분획화된 Sau3A 1 단편의 BamH1-분해 및 인산화된 pWE15 벡터에 대한 라이게이션은 Ausbel 섹션 3.33의 프로토콜을 변형시킴으로써(즉, 제조원에 의해 공급된 미리 혼합한 10 X 라이게이션 완충액을 사용함) T4 리가아제를 사용하여 수행하였다. 라이게이션은 20 ㎕의 전체 부피 중에 15 ℃에서 밤새 수행한 후 -20℃에 저장하였다.Lamation of BamH1-digested and phosphorylated pWE15 vectors of size fractionated Sau3A 1 fragments was modified by modifying the protocol of Ausbel section 3.33 (i.e. using premixed 10 X ligation buffer supplied by the manufacturer). It was carried out using an aze. Ligation was performed overnight at 15 ° C. in a total volume of 20 μl and then stored at −20 ° C.

DNA 약 1 ㎕을 함유하는 코스미드 DNA 라이게이션 반응물 4 ㎕을 상업상의 패키징 추출물(Gigapack(등록상표) III Gold Packaging Ectract, Stratagene)을 사용하여 제조원의 지시에 따라서 박테리오파아지 람다 내에 패키징시켰다. 패키징된 제조물을 사용할 때까지 4℃에 저장하였다. 패키징된 코스미드 제조물은 다음과 같이 (Gigapack(등록상표) III Gold 프로토콜("Titering the cosmid Library")에 따라서 대장균 XL1 Blue MR 세포(Stratagene)을 감염시키는데 사용하였다. XL1 Blue MR 세포를 0.2% (w/v) 말토오스 및 10 mM MgSO4를 함유하는 LB 배지 (g/L: 박토-트립톤, 10; 박토-이스트 엑스, 5; 박토-아카, 15, NaCl, 5(Difco Laboratories, Detroit, MI) 중의 37 ℃에서 성장시켰다. 5 시간 성장 후, 세포들을 700 x g (15분)으로 펠릿화하고 10 mM MgSO46 ㎖ 중에 재현탁시켰다. 배양 밀도는 10 mM MgSO4를 사용하여 OD600= 0.5 까지 조정하였다. 패키징된 코스미드 라이브러리를 멸균 SM 배지 (0.1 M NaCl, 10 mM MgSO4, 50 mM Tris-HCl pH 7.5, 0.01% w/v 젤라틴)를 사용하여 1:10 또는 1:20으로 희석시키고 희석된 제제 25 ㎕를 희석된 XL1 Blue MR 세포 25 ㎕과 혼합하였다. 이 혼합물을 25 ℃에서 30 분 동안 진탕없이 배양시키고 이어서 LB 브로쓰 200 ㎕을 첨가하고 배양을 간혹 가볍게 진탕시키면서 대략 1 시간 동안 계속하였다. 이 배양물의 분취량 (20 - 40 ㎕)을 100 ㎎/ℓ 앰피실린 (즉, LB-Amp100)을 함유하는 LB 아가 플레이트 상에 뿌리고, 37 ℃에서 밤새 배양시켰다. 증폭이 없는 라이브러리를 저장하기 위하여, 단일 콜로니를 뽑아서 멸균 96-웰 마이크로웰 플레이트의 개별 웰 내로 접종하였으며, 각각의 웰은 75 ㎕의 Terrific Broth (TB 배지: 12 g/ℓ 박토-트립톤, 24 g/ℓ 박토-이스트 엑스, 0.4% v/v 글리세롤, 17 mM KH2PO4, 72 mM K2HPO4) 및 100 ㎎/ℓ 앰피실린 (즉, TB-Amp100)을 함유하였으며, 진탕없이 37 ℃에서 밤새 배양시켰다. 96-웰 플레이트를 복제 플레이트 내로 복제한 후, 여과 멸균된 TB:글리세롤 (1:1, v/v: 100 ㎎/ℓ 앰피실린을 포함하거나 또는 포함하지 않음)의 75 ㎕/웰을 플레이트에 첨가한 후, 이를 100 rpm, 37 ℃에서 재빨리 진탕시킨 후, 이어서 Parafilm(등록상표)(American National Can, Greenwich, CT)로 밀봉하고 -70℃ 냉동기 내에 위치시켜 저장하였다. 복제 플레이트를 마스터 플레이트에 동일하게 성장시키고 처리하였다. 총 40 개의 그러한 마스터 플레이트(및 이들의 복제물)이 제조되었다.4 μl of cosmid DNA ligation reaction containing about 1 μl of DNA was packaged into bacteriophage lambda using a commercial packaging extract (Gigapack® III Gold Packaging Ectract, Stratagene) according to the manufacturer's instructions. Packaged preparations were stored at 4 ° C. until use. Packaged cosmid preparations were used to infect Escherichia coli XL1 Blue MR cells (Stratagene) according to the Gigapack® III Gold protocol ("Titering the cosmid Library") as follows: XL1 Blue MR cells were 0.2% ( w / v) LB medium containing maltose and 10 mM MgSO 4 (g / L: bacto-tryptone, 10; bacto-east extract, 5; bacto-aca, 15, NaCl, 5 (Difco Laboratories, Detroit, MI) ) it was grown in 37 ℃ in. after 5 hours growth, pellet the cells with 700 xg (15 min.) screen, and 10 mM MgSO 4 6 ㎖ the resuspended. culture density was OD 600 = 0.5 by using 10 mM MgSO 4 The packaged cosmid library was diluted 1:10 or 1:20 using sterile SM medium (0.1 M NaCl, 10 mM MgSO 4 , 50 mM Tris-HCl pH 7.5, 0.01% w / v gelatin). 25 μl of diluted formulation was mixed with 25 μl of diluted XL1 Blue MR cells This mixture was shaken at 25 ° C. for 30 minutes without shaking. Amount and then was continued for about one hour, while the addition of 200 ㎕ used LB bromo and occasionally gently shaking the culture the culture aliquots (20 - 40 ㎕) of water. The 100 ㎎ / ℓ ampicillin (i.e., LB-Amp 100) Sprinkle onto LB agar plates containing and incubate overnight at 37 ° C. To store libraries without amplification, single colonies were drawn and seeded into individual wells of sterile 96-well microwell plates, each well having 75 μl. Terrific Broth (TB medium: 12 g / l bacto-tryptone, 24 g / l bacto-east x, 0.4% v / v glycerol, 17 mM KH 2 PO 4 , 72 mM K 2 HPO 4 ) and 100 mg / 1 ampicillin (ie TB-Amp 100 ) was contained and incubated overnight at 37 ° C. without shaking. After replicating the 96-well plate into the replicate plate, 75 μl / well of filtered sterilized TB: glycerol (1: 1, v / v: with or without 100 mg / L ampicillin) was added to the plate It was then quickly shaken at 100 rpm, 37 ° C., then sealed with Parafilm® (American National Can, Greenwich, CT) and placed and stored in a -70 ° C. freezer. Replication plates were grown and treated identically on master plates. A total of 40 such master plates (and replicas thereof) were made.

방사성표지된 DNA 프로브를 사용한 라이브러리의 스크리닝: 방사성 동위원소로 표지된 프로브를 사용하여 프로브시키기 위한 콜로니 필터를 제조하기 위하여, 라이브러리의 96-웰 플레이트를 25 ℃에서 해동시켰다(실온에서 벤취 톱). 96 프롱(prong)을 가진 복제 플레이팅 도구를 사용하여 TB-Amp100의 75 ㎕/웰을 포함하는 새로운 96-웰 복제 플레이트를 접종시켰다. 복제 플레이트를 37 ℃에서 밤새(고정시킴) 성장시키고, 이어서 37 ℃에서 약 30 분 동안 100 rpm으로 진탕시켰다. 일부 단리물의 비성장에 기인하여 총 800 개의 콜로니가 이들 복제 플레이트에서 나타났다. 복제 도구를 사용하여 생물 분석 플라스틱 접시(Nunc, 243 x 243 x 18 ㎜; Curtin Mathison Scientific, Inc., Wood Dale, IL) 중의 고체 LB-Amp100(100 ㎖/접시) 상에 위치된 Magna NT (MSI, Westboro, MA) 나일론 멤브레인 (0.45 미크론, 220 x 250 ㎜) 상에 96-웰 어레이의 복제 함침부를 접종시켰다. 이 콜로니들을 37 ℃에서 약 3 시간 동안 멤브레인 상에서 성장시켰다.Screening of Libraries Using Radiolabeled DNA Probes: To prepare colony filters for probing using radioisotope labeled probes, 96-well plates of the library were thawed at 25 ° C. (bench top at room temperature). A replication plating tool with 96 prongs was used to inoculate a new 96-well replicate plate containing 75 μl / well of TB-Amp 100 . Replication plates were grown overnight (fixed) at 37 ° C. and then shaken at 100 rpm for about 30 minutes at 37 ° C. A total of 800 colonies appeared on these replicate plates due to the non-growth of some isolates. Magna NT (100 ml / dish) placed on a solid LB-Amp 100 (100 ml / dish) in a bioanalytical plastic dish (Nunc, 243 × 243 × 18 mm; Curtin Mathison Scientific, Inc., Wood Dale, IL) using a replication tool. MSI, Westboro, Mass.) A 96-well array of replication impregnations was inoculated onto nylon membrane (0.45 micron, 220 × 250 mm). These colonies were grown on the membrane at 37 ° C. for about 3 hours.

양성 대조군 콜로니(GZ4 서열 삽입물을 함유하는 세균 콜로니, 이하 참조)들은 35 ㎎/ℓ 클로람페니콜을 보충한 LB 배지(즉, LB-Cam35) 상의 개별적인 Magna NT 멤브레인 (Nunc, 0.45 미크론, 82 ㎜ 원) 상에서 성장시키고, 라이브러리 콜로니 멤브레인 측면에 나란히 처리하였다. 멤브레인 상의 세균 콜로니들을 Genius(등록상표) 시스템 사용자 가이드 버젼 2.0 (Boehringer Mannheim Corporation, Indianapolis, IN)으로부터 취한 프로토콜에 따라 용해시키고 DNA를 변성시키고 중화시켰다. 멤브레인들을 0.5 N NaOH 및 1.5 M NaCl로 적신 여과지 상의 콜로니 측면에 15 분 동안 위치시켜 변성시키고, 1M Tris-HCl pH 8.0, 1.5 M NaCl로 적신 여과지 상에 15 분 동안 중화시켰다. 자동 가교(crosslink)로 설정해 놓은 Stratagene UV Stratalinker를 사용하여 UV 가교를 시킨 후, 멤브레인들을 25 ℃에 사용할 때까지 저장하였다. 멤브레인들을 단일 96-웰 플레이트의 복제 함침부를 함유하는 스트립으로 다듬은 후, CPMB(문헌 참조)의 섹션 6.4.1의 방법에 의해 대규모로 세척하고 (3 X SSC, 0.1% (w/v) SDS 중의 25 ℃에서 3 시간에 이어서, 동일 용액 중에서 65 ℃에서 1 시간), 이어서 하이브리드화 단계용 제제(20 X SSC = 3 M NaCl, 0.3 M 소듐 시트레이트, pH 7.0) 중의 2 X SSC 중에서 헹구었다.Positive control colonies (bacterial colonies containing GZ4 sequence inserts, see below) are individual Magna NT membranes (Nunc, 0.45 micron, 82 mm circles) on LB medium supplemented with 35 mg / l chloramphenicol (ie, LB-Cam 35 ). The phases were grown and processed side by side on the library colony membrane side. Bacterial colonies on the membranes were lysed and denatured and neutralized according to a protocol taken from Genius® System User Guide Version 2.0 (Boehringer Mannheim Corporation, Indianapolis, IN). The membranes were denatured by placing on the colony side on filter paper soaked with 0.5 N NaOH and 1.5 M NaCl for 15 minutes and neutralized on filter paper soaked with 1M Tris-HCl pH 8.0, 1.5 M NaCl for 15 minutes. After UV crosslinking using a Stratagene UV Stratalinker set to automatic crosslinking, the membranes were stored at 25 ° C. until use. The membranes were trimmed into strips containing a replica impregnation of a single 96-well plate, then washed extensively by the method of section 6.4.1 of CPMB (see literature) and in 3 × SSC, 0.1% (w / v) SDS. 3 hours at 25 ° C., then 1 hour at 65 ° C. in the same solution, followed by 2 × SSC in the formulation for hybridization step (20 × SSC = 3M NaCl, 0.3M sodium citrate, pH 7.0).

TcaC 유전자의 특정 게놈 단편의 증폭: 정제된 Tcac 펩티드 단편에 대해 결정된 N-말단 아미노산 서열(본 명세서에 서열 2로서 기재함)에 기초하여, 동의성 올리고뉴클레오티드의 풀(pool S4Psh)를 Applied Biosystem ABI394 DNA/RNA 합성기(Perkin Elmer, Foster City, CA) 상의 가닥 β-시아노에틸 화학에 의해 합성하였다. 이 올리고뉴클레오티드들을 55 ℃에서 8 시간 동안 탈보호시키고, 물 중에 용해시키고, 분광광도계 측정에 의해 정량화하고, 희석하여 사용하였다. 이 풀은 TcaC 펩티드의 결정된 N-말단 아미노산 서열에 해당한다. 결정된 아미노산 서열 및 대응하는 동의성 DNA 서열은 이하에 나타냈고, 여기서 A, C, G 및 T는 표준 DNA 염기이고, I는 이노신을 나타낸다.Amplification of Specific Genomic Fragments of the TcaC Gene: Based on the N-terminal amino acid sequence determined for the purified Tcac peptide fragment (described herein as SEQ ID NO: 2), a pool of synonymous oligonucleotides (S4Psh) was applied to Applied Biosystem ABI394. Synthesis was performed by strand β-cyanoethyl chemistry on a DNA / RNA synthesizer (Perkin Elmer, Foster City, Calif.). These oligonucleotides were deprotected at 55 ° C. for 8 hours, dissolved in water, quantified by spectrophotometric measurement and used in dilution. This pool corresponds to the determined N-terminal amino acid sequence of the TcaC peptide. The amino acid sequences determined and the corresponding synonymous DNA sequences are shown below, where A, C, G and T are standard DNA bases and I represents inosine.

아미노산 Met Gln Asp Ser Pro Glu ValAmino Acid Met Gln Asp Ser Pro Glu Val S4Psh 5' ATG CA(A/G) GA(T/C) (T/A)(C/G)(T/A) CCI GA(A/G) GT 3'S4Psh 5 'ATG CA (A / G) GA (T / C) (T / A) (C / G) (T / A) CCI GA (A / G) GT 3'

또다른 세트의 동의성 올리고뉴클레오티드를 합성하였으며(pool P2.3.5R), 서열 17의 결정된 아미노산 서열에 대한 코딩 가닥의 상보체를 나타낸다:Another set of synonymous oligonucleotides was synthesized (pool P2.3.5R), showing the complement of the coding strand for the determined amino acid sequence of SEQ ID NO: 17:

아미노산 Ala Phe Asn Ile Asp Asp ValAmino Acids Ala Phe Asn Ile Asp Asp Val 코돈 5' GCN TT(T/C) AA(T/C) AT(A/T/C) GA(T/C) GA(T/C) GT 3'Codon 5 'GCN TT (T / C) AA (T / C) AT (A / T / C) GA (T / C) GA (T / C) GT 3' P2.3.5R 3' CG(A/C/G/T) AA(A/G) TT(A/G) TA(T/A/G) CT(A/G) CT(A/G) CA 5'P2.3.5R 3 'CG (A / C / G / T) AA (A / G) TT (A / G) TA (T / A / G) CT (A / G) CT (A / G) CA 5 '

이들 뉴클레오티드들은 폴리머라제 사슬 반응(PCT(등록상표, Roche Molecular System, Branchburg, NJ)에 사용하여 포토랍두스 균주 W-14로부터 제조된 게놈 DNA로부터의 특정 DNA 단편(상기 함)을 증폭시켰다. 대표적인 반응물 (50 ㎕)은 각 프라이머 풀 P2Psh 및 P2.3.5R 125 pmol, 게놈 주형 DNA 253 ng, dATP, dCTP, dGTP 및 dTTP 각각 10 pmol, 1X GeneAmp(등록상표) PCR 완충액 및 AmpTaq(등록상표) 2.5 단위(이 모두는 Roche Molecular Systems로부터 시판됨; 10X GeneAmp(등록상표) 완충액은 100 mM Tris-HCl pH 8.3, 500 mM KCl, 0.01% w/v 젤라틴을 함유하였다). 증폭은 Perkin Elmer Cetus DNA Thermal Cycler(Perkin Elmer, Foster City, CA) 중에서 94 ℃ (1.0분), 55 ℃ (2.0분), 72 ℃ (3.0분)의 35 주기에 이어서 72 ℃에서 7.0분의 확장 기간을 사용하여 수행하였다. 증폭 절차는 TEA 완충액 (40 mM Tris-아세테이트, 2 mM EDTA, pH 8.0) 중에서 2% w/v NuSieve(등록상표) 3:1 아가로스 (FMC BioProducts)를 통한 전기영동에 의해 분석하였다. 추정 크기 250 bp의 특정 생성물이 에치듐 브로마이드 (0.5 ㎍/㎖) 염색 및 자외선 광 하의 검사에 의해 기타 증폭 생성물 중에서 관찰되었다.These nucleotides were used for polymerase chain reaction (PCT®, Roche Molecular System, Branchburg, NJ) to amplify specific DNA fragments (described above) from genomic DNA prepared from Photorabdus strain W-14. Reactions (50 μl) were prepared for each primer pool P2Psh and 125 pmol of P2.3.5R, 253 ng of genomic template DNA, 10 pmol of dCTP, dGTP and dTTP respectively, 1 × GeneAmp® PCR buffer and AmpTaq® 2.5 Units (all of which are commercially available from Roche Molecular Systems; 10X GeneAmp® buffer contained 100 mM Tris-HCl pH 8.3, 500 mM KCl, 0.01% w / v gelatin) Amplification was Perkin Elmer Cetus DNA Thermal 35 cycles of 94 ° C. (1.0 min), 55 ° C. (2.0 min), 72 ° C. (3.0 min) in Cycler (Perkin Elmer, Foster City, Calif.) Followed by an extended period of 7.0 min at 72 ° C. Amplification procedures were performed using 2% w / v NuSieve (etc.) in TEA buffer (40 mM Tris-acetate, 2 mM EDTA, pH 8.0). Rox) Analysis by electrophoresis through 3: 1 agarose (FMC BioProducts) A specific product of an estimated size of 250 bp was found in other amplification products by ethidium bromide (0.5 μg / ml) staining and examination under ultraviolet light. Was observed.

대략 250 bp 생성물을 함유하는 겔의 영역을 자르고, 작은 플러그 (0.5 ㎜ 직경)을 제거하여 PCR 증폭 (40 사이클)에 대한 주형을 공급하는데 사용하였다. 반응물 (50 ㎕)은 게놈 주형 DNA를 빼고는 상기와 동일한 성분을 함유하였다. 증폭 다음, 단편들의 말단을 평활말단이 되게 하고 25 ℃에서 20 분 동안 T4 DNA 리가아제 (NEB), 1 nmol ATP 및 T4 키나아제 (Pharmacia Biotec Inc., Piscataway, NJ) 2.15 단위를 사용하여 배양시킴으로써 인산화시켰다.The area of the gel containing approximately 250 bp product was cut and a small plug (0.5 mm diameter) was removed and used to feed the template for PCR amplification (40 cycles). The reaction (50 μl) contained the same components as above except for genomic template DNA. Following amplification, the ends of the fragments were blunt-ended and phosphorylated by incubation with T15 DNA ligase (NEB), 1 nmol ATP and T4 kinase (Pharmacia Biotec Inc., Piscataway, NJ) 2.15 units for 20 minutes at 25 ° C. I was.

DNA 단편들을 TEA 중의 1% GTG(등록상표) 아가로스 (FMC)를 통해 전기영동시킴으로써 잔여 프라이머로부터 분리하였다. 겉보기 크기 250 bp의 단편을 함유하는 겔 슬라이스를 자르고, DNA를 Qiaex 킷(Qiaex Inc., Chatsworth, CA)를 사용하여 추출하였다.DNA fragments were isolated from the remaining primers by electrophoresis through 1% GTG® agarose (FMC) in TEA. Gel slices containing fragments of apparent size 250 bp were cut and DNA extracted using a Qiaex kit (Qiaex Inc., Chatsworth, Calif.).

추출된 DNA 단편들을 제한 효소 Sma 1으로 분해를 완료한 후 상기 pWE15 DNA에 대해 기술한 바와 유사한 방식으로 추출한 플라스미드 벡터 pBC KS(+) (Stratagene)에 라이게이션시켰다. 대표적인 라이게이션 반응물 (16.3 ㎕)은 1X 라이게이션 완충액 (50 mM Tris-HCl, pH 7.4; 10 mM MgCl2; 10 mM 디티오트레이톨; 1mM 스퍼미딘, 1mM ATP; 100 ㎎/㎖ 소 혈청 알부민) 중에 분해된 pBC KS(+) DNA 100 ng, 250 bp 단편 DNA 70 ng, 1 nmol [Co(NH3)6]Cl, 및 T4 DNA 리가아제 (Collaborative Biomedical Products, Bedford, MA) 3.9 Weiss 단위를 포함하였다. 14 ℃에서 밤새 배양시킨 후, 라이게이션된 생성물을 공급자의 지침에 따라서 얼린, 컴피턴트 대장균 DH5α 세포 (Gibco BRL) 내로 형질전환시키고, IPTG 119 ㎍/㎖ 및 X-gal 50 ㎍/㎖을 함유하는 LB-Cam35플레이트 상에 위치시켰다. 독립적인 백색 콜로니들을 뽑아서 플라스미드 DNA를 변형된 알칼린-용해/PEG 침전법 [PRISM(등록상표) Ready Reaction DyeDeoxy(등록상표) Terminator Cycle Sequencing Kit Protocols; ABI/Perkin Elmer]에 의하여 제조하였다. 삽입 DNA의 두 가닥의 뉴클레오티트 서열을 T7 프라이머[pBC KS(+) 염기 601-623: TAAAACGACGGCCAGTGAGCGCG] 및 LacZ 프라이머 [pBC KS(+) 염기 792-816: ATGACCATGATTACGCCAAGCGC GC) 및 PRISM(등록상표) 서열화 킷 [ABI/Perkin Elmer]와 함께 제공된 프로토콜을 사용하여 결정하였다. 비혼입된 염료 종결인자 디데옥시리보뉴클레오티드들은 제조원의 지시에 따라 Centri-Sep 100 컬럼 (Princeton Separation, Inc., Adelphia, NJ)을 통해 통과시킴으로써 제거하였다. DNA 서열은 ABI 모델 373 A DNA 서열화기 (ABI/Perkin Elmer) 상에 시료를 분석함으로써 얻었다. 두 단리물, GZ4 및 HB14의 DNA 서열은 도 1에 설명된 바와 같이 발견되었다.The extracted DNA fragments were ligated to the plasmid vector pBC KS (+) (Stratagene) extracted in a similar manner as described for pWE15 DNA after completion of digestion with restriction enzyme Sma 1. Representative ligation reactions (16.3 μl) include 1 × ligation buffer (50 mM Tris-HCl, pH 7.4; 10 mM MgCl 2 ; 10 mM dithiothreitol; 1 mM spermidine, 1 mM ATP; 100 mg / ml bovine serum albumin) PBC KS (+) DNA 100 ng, 250 bp fragment DNA 70 ng, 1 nmol [Co (NH 3 ) 6 ] Cl, and T4 DNA ligase (Collaborative Biomedical Products, Bedford, Mass.) 3.9 Weiss units It was. After overnight incubation at 14 ° C., the ligated product is transformed into frozen E. coli DH5α cells (Gibco BRL), frozen according to the supplier's instructions, containing 119 μg / ml IPTG and 50 μg / ml X-gal. Placed on LB-Cam 35 plate. Independent white colonies were extracted to transform plasmid DNA into modified alkaline-soluble / PEG precipitation methods [PRISM® Ready Reaction DyeDeoxy® Terminator Cycle Sequencing Kit Protocols; ABI / Perkin Elmer]. Two strands of the nucleotide sequence of the insert DNA were sequenced with the T7 primer [pBC KS (+) base 601-623: TAAAACGACGGCCAGTGAGCGCG] and LacZ primer [pBC KS (+) base 792-816: ATGACCATGATTACGCCAAGCGC GC) and PRISM (R) The determination was made using the protocol provided with the kit [ABI / Perkin Elmer]. Unincorporated dye terminator dideoxyribonucleotides were removed by passing through a Centri-Sep 100 column (Princeton Separation, Inc., Adelphia, NJ) according to the manufacturer's instructions. DNA sequences were obtained by analyzing samples on an ABI Model 373 A DNA Sequencer (ABI / Perkin Elmer). The DNA sequences of both isolates, GZ4 and HB14, were found as described in FIG.

이 서열은 다음의 특성들을 나타내었다: i) 염기 1-20은 S4Psh 동의성 올리고뉴클레오티드의 64개의 가능한 서열 중 하나를 나타내었고, ii) 아미노산 서열 1-3 및 6-12의 서열은 TcaC (서열 2에 기술됨)의 N-말단의 것에 정확히 대응하였고, iii) 코딩된 네번째 아미노산은 세린 보다는 시스테인이었다. 이 차이는 세린 코돈에 대한 동의성 내에서 코딩된다(상기 참조), iv) 다섯번째 아미노산은 프롤린으로, 서열 2에 주어진 TcaC N-말단 서열에 대응하고, v) 염기 257-276은 동의성 풀 내로 디자인된 192 개의 가능한 서열 중 하나를 코딩하고, vi) 염기 268-270에서 도입된 TGA 종결 코돈은 대응하는 위치에서 뉴클레오티드 풀 내로 조립된 동의성에 상보성의 결과이며, 대응 유전자에 대한 짧아진 해독 프레임을 제공하지 않는다.This sequence exhibited the following properties: i) Bases 1-20 represented one of the 64 possible sequences of S4Psh synonymous oligonucleotides, and ii) the sequences of amino acid sequences 1-3 and 6-12 were TcaC (SEQ ID NO: The fourth amino acid encoded was cysteine rather than serine. This difference is encoded within the synonym for the serine codon (see above), iv) the fifth amino acid is proline, corresponding to the TcaC N-terminal sequence given in SEQ ID NO: 2, and v) bases 257-276 are synonymous pools. A shortened translation frame for the corresponding gene, which encodes one of the 192 possible sequences designed into it, vi) the TGA termination codon introduced at bases 268-270 is the result of complementarity to synonym assembled into the nucleotide pool at the corresponding position Does not provide.

〈TcaC 펩티드 유전자-특이성 프로브의 표지화〉<Labeling of TcaC peptide gene-specific probes>

상기 276 염기에 대응하는 DNA 단편들을 P2Psh 및 P2.3.5R 프라이머 각각 100 pmol, 주형으로서 플라스미드 GZ4 또는 HB104 10 ng, dATP, dCTP, dGTP 및 dTTP 각각 20 nmol, AmpliTaq (등록 상표) DNA 폴리머라제 5 단위, 및 1X 농도의 GeneAmp (등록 상표) 완충액을 상기한 바와 동일한 온도 관리 하에서 PCR (등록 상표)에 의해 100 ㎕ 반응 부피로 증폭시켰다 (35 주기). 증폭 생성물은 Qiaex 키트에 의해 1 % GTG (등록 상표) 아가로스 겔로부터 추출하고 형광계에 의해 정량화하였다.DNA fragments corresponding to the 276 bases were 100 pmol each of P2Psh and P2.3.5R primers, 10 ng of plasmid GZ4 or HB104 as template, 20 nmol of dATP, dCTP, dGTP and dTTP, respectively, AmpliTaq® DNA polymerase 5 units , And 1 × Concentration of GeneAmp® buffer was amplified (100 cycles) to 100 μl reaction volume by PCR (registered trademark) under the same temperature control as above. Amplification products were extracted from 1% GTG® agarose gel by Qiaex kit and quantified by fluorimeter.

플라스미드 HB14 주형 (대략 400 ng)으로부터 추출된 증폭 생성물을 5 개의 분취량으로 나누고 High Prime Labeling Mix (Boehringer Mannheim 제품)을 사용하여 제조원의 지시에 따라서32P-dCTP로 표지화하였다. 비혼입된 방사성 동위원소들은 제조원의 지시에 따라 NucTrap (등록 상표) 프로브 정제 컬럼 (Stratagene)을 통해 통과시킴으로써 제거하였다. 표지화된 DNA 생성물의 특이 활성은 액체 섬광계수에 의해 3.11 × 108dpm/㎍인 것으로 측정하였다. 이 표지화된 DNA는 게놈 라이브러리의 800 원으로부터 제조된 멤브레인을 프로브시키는데 사용하였다.Amplification products extracted from plasmid HB14 template (approximately 400 ng) were divided into 5 aliquots and labeled with 32 P-dCTP using the High Prime Labeling Mix (Boehringer Mannheim) according to the manufacturer's instructions. Unincorporated radioisotopes were removed by passing through NucTrap® probe purification column (Stratagene) according to the manufacturer's instructions. Specific activity of the labeled DNA product was determined to be 3.11 × 10 8 dpm / μg by liquid scintillation counting. This labeled DNA was used to probe membranes prepared from 800 members of the genomic library.

〈TcaC-펩티드 유전자 특이성 프로브를 사용한 스크리닝〉<Screening using TcaC-peptide gene specificity probes>

방사성 표지화된 HB14 프로브를 대략 10 분 동안 비등시키고, 이어서 "최소 혼성 (minimal hyb)" 용액에 가하였다. [주: "최소 혼성" 방법은 CERES 프로토콜; "Restriction Fragment Length Polymorphism Laboratory Manual 버젼 4.0", 섹션 4-40 및 4-47; CERES/NPI, 유타주 솔트레이크 시티 소재로부터 입수한 것임. NPI는 현존하지 않고, 그의 승계인이 Linkage Genetics로서 경영하고 있음]. "최소 혼성" 용액은 10 % w/v PEG (폴리에틸렌 글리콜), 분자량 대략 8000), 7 % w/v SDS; 0.6X SSC, 10 mM 인산 나트륨 완충액 (95 g/ℓ NaH2PO4·1H2O 및 84.5 g/ℓ Na2HPO4·7H2O를 함유하는 1 M 원액으로부터 제조), 5 mM EDTA 및 100 ㎎/㎖ 변성 연어 정자 DNA를 함유한다. 멤브레인들을 신속하게 지압 건조시키고, 이어서 예비 하이브리드 없이 멤브레인의 5 스트립을 "최소 혼성" 75 ㎖ 및 방사성 표지화된 HB14 프로브 2.6 ng/㎖을 함유하는 2 개의 플라스틱 상자 각각에 위치시켰다. 이들을 60 ℃에서 서서히 진탕시키면서 (50 rpm) 밤새 배양시켰다. 필터를 각각 25 ℃에서 "최소 혼성 세척 용액" (0.25X SSC, 0.2% SDS) 중에 대략 10 분 동안 3회 세척하고, 이어서 동일 용액 중의 60 ℃에서 서서히 진탕시키면서 30 분 동안 2회 세척하였다. 필터들을 차광 방사선 사진 카셋트 중의 Saran Wrap (등록 상표) (Dow Brands 제조, 인디애나주 인디애나폴리스 소재)으로 덮힌 종이 위에 위치시키고, 두 개의 DuPont Cronex Lightening-Plus C1 강화기 (Sigma Chemical Co. 제조, 미주리주 세인트 루이스 소재)를 구비한 X-Omat X-선 필름 (Kodak 제조, 뉴욕주 로케스터 소재)에 -70 ℃에서 4 시간 동안 노출시켰다. 현상시 (표준 사진 공정), 중요한 신호들은 더 약하고, 더욱 불규칙적인 신호의 높은 피이크 중에서 두 복제물에서 두드러졌다. 필터들을 다시 "최소 혼성 세척 용액" 중의 68 ℃에서 약 4 시간 동안 세척하고나서, 다시 카세트에 위치시키고, 필름을 -70 ℃에서 밤새 노출시켰다. 12 개의 가능한 양성들이 복제 96-웰 콜로니 함침부 모두에서의 강한 신호로 인하여 확인되었다. 음성 대조군 멤브레인 (pWE15를 함유하는 XL1 Blue MR 세포의 콜로니)에서는 신호가 나타나지 않았고, 동시에 실험적인 시료를 사용하여 처리한 양성 대조군 멤브레인 (PCR 생성물의 GZ4 단리물을 함유하는 DH5α세포)에서는 매우 강한 신호가 나타났다.Radiolabeled HB14 probe was boiled for approximately 10 minutes and then added to a “minimal hyb” solution. [Note: The "least hybrid" method is the CERES protocol; "Restriction Fragment Length Polymorphism Laboratory Manual Version 4.0", sections 4-40 and 4-47; CERES / NPI, obtained from Salt Lake City, Utah. NPI is nonexistent and his successor runs as Linkage Genetics. “Minimal hybrid” solutions include 10% w / v PEG (polyethylene glycol), molecular weight approximately 8000), 7% w / v SDS; 0.6X SSC, 10 mM sodium phosphate buffer (prepared from 1 M stock containing 95 g / l NaH 2 PO 4 .1H 2 O and 84.5 g / l Na 2 HPO 4 .7H 2 O), 5 mM EDTA and 100 Mg / ml contains denatured salmon sperm DNA. The membranes were rapidly pressure dried, and then 5 strips of membranes were placed in each of two plastic boxes containing 75 ml of "minimum hybrid" and 2.6 ng / ml of radiolabeled HB14 probes without preliminary hybridization. They were incubated overnight with gentle shaking at 60 ° C. (50 rpm). The filters were washed three times for approximately 10 minutes each at 25 ° C. in a “minimum hybrid wash solution” (0.25 × SSC, 0.2% SDS) and then twice for 30 minutes with gentle shaking at 60 ° C. in the same solution. The filters are placed on a paper covered with Saran Wrap (registered trademark) (Dow Brands, Indianapolis, Indiana) in a shaded radiographic cassette, and two DuPont Cronex Lightening-Plus C1 enhancers (Sigma Chemical Co., Missouri) X-Omat X-ray film (St. Louis) (Rokster, Kodak) was exposed for 4 hours at -70 ° C. At development (standard photographic process), the important signals were noticeable in both replicates among the high peaks of weaker, more irregular signals. The filters were again washed for about 4 hours at 68 ° C. in “minimal hybrid wash solution”, then placed back in the cassette and the film exposed at −70 ° C. overnight. Twelve possible positives were identified due to strong signals in all replicate 96-well colony impregnations. No signal was seen in the negative control membrane (colonies of XL1 Blue MR cells containing pWE15), but at the same time very strong signal in the positive control membrane (DH5α cells containing GZ4 isolate of PCR product) treated with experimental samples. Appeared.

12 개로 추정되는 하이브리다이제이션-양성 콜로니들을 동결된 96-웰 라이브러리 플레이트로부터 회수하여 LB-Amp100배지 중에서 37 ℃에서 밤새 성장시켰다. 이어서, 이들을 고상 LB-Amp100상에 패칭하였다 (3/플레이트, + 3 음성 대조군: pWE15 벡터를 함유하는 XL Blue MR 세포). 두 세트의 멤브레인 (Magna NT 나일론, 0.45 미크론)을 하이브리다이제이션용으로 제조하였다. 처음 세트는 필터를 패치 플레이트 위의 콜로니 상에 직접 위치시키고나서, 이것을 부착 박테리아 세포와 함께 제거하고, 아래와 같이 처리함으로써 제조하였다. 두번째 세트의 필터들은 LB-Amp100배지를 포함하는 플레이트 상에 위치시키고, 이어서 패치 플레이트로부터 필터 위로 세포들을 이동시킴으로써 접종하였다. 37 ℃에서 밤새 성장시킨 후에, 필터들을 플레이트로부터 제거하여 처리하였다.Twelve putative hybridization-positive colonies were recovered from frozen 96-well library plates and grown overnight at 37 ° C. in LB-Amp 100 medium. These were then patched onto solid LB-Amp 100 (3 / plate, +3 negative control: XL Blue MR cells containing pWE15 vector). Two sets of membranes (Magna NT nylon, 0.45 micron) were prepared for hybridization. The first set was prepared by placing the filter directly on the colonies on the patch plate, then removing it with adherent bacterial cells and treating as follows. The second set of filters was placed on a plate containing LB-Amp 100 medium and then inoculated by moving the cells over the filter from the patch plate. After growing overnight at 37 ° C., the filters were removed from the plate and treated.

필터 상의 박테리아 세포들을 용해시키고, DNA를 각 필터의 콜로니 측부를 플라스틱 플레이트 중의 0.5 N NaOH의 풀 (1.0 ㎖) 상에 3 분 동안 위치시킴으로써 변성시켰다. 필터들을 종이 타월 상에서 지압 건조시키고나서, 이 공정을 새로운 0.5 N NaOH로 반복하였다. 지압 건조시킨 후, 필터들을 각각 1 M Tris-HCl pH 7.5의 1.0 ㎖ 풀 상에 3 분 동안 위치시킴으로써 중화시키고, 지압 건조시키고, 새로운 완충액으로 다시 중화시켰다. 계속하여, 0.5 M Tris-HCl pH 7.5 및 1.5 M NaCl의 풀 상에서 두 유사한 침지를 (각각 5분) 수행하였다. 지압 건조 후, DNA를 상기한 바와 같이 필터에 자외선 가교화시키고, 필터들을 3X SSC 및 0.1 % (w/v) SDS 약 100 ㎖ 중에서 세척하였다 (25 ℃, 100 rpm) (4회, 매회 세척시 새로운 용액으로 각각 30분). 이어서, 이들을 예비 하이브리다이제이션 용액 [6X SSC 및 Ficoll 400 (Pharmacia 제품), 폴리비닐피롤리돈 (평균 분자량 360,000; Sigma 제품) 및 소혈청 알부민 단편 V; (Sigma 제품) 각각 1 % w/v]의 최소 부피 중에 65 ℃, 50 rpm에서 2 시간 동안 위치시켰다. 예비 하이브리다이제이션 용액을 제거하고, 라이브러리 멤브레인의 이전 하이브리다이제이션로부터 저장되었고, 95 ℃에서 5 분 동안 변성시킨 HB1432P-표지화된 프로브로 대체하였다. 하이브리다이제이션는 60 ℃에서 16 시간 동안 50 rpm으로 진탕시키면서 수행하였다.Bacteria cells on the filter were lysed and DNA was denatured by placing the colony side of each filter for 3 minutes on a pool of 0.5 N NaOH in a plastic plate (1.0 mL). The filters were dried under pressure on a paper towel and the process repeated with fresh 0.5 N NaOH. After acupressure drying, the filters were neutralized by placing on a 1.0 ml pool of 1 M Tris-HCl pH 7.5 for 3 minutes each, acupressure dried and neutralized again with fresh buffer. Subsequently, two similar immersions (5 min each) were performed on a pool of 0.5 M Tris-HCl pH 7.5 and 1.5 M NaCl. After acupressure drying, the DNA was UV crosslinked to the filter as described above, and the filters were washed in about 100 ml of 3 × SSC and 0.1% (w / v) SDS (25 ° C., 100 rpm) (4 times, each wash). 30 minutes each with fresh solution). These were then subjected to preliminary hybridization solutions [6X SSC and Ficoll 400 (from Pharmacia), polyvinylpyrrolidone (average molecular weight 360,000; from Sigma) and bovine serum albumin fragment V; (Sigma) each was placed at 65 ° C., 50 rpm for 2 hours in a minimum volume of 1% w / v]. The preliminary hybridization solution was removed and replaced with an HB14 32 P-labeled probe that was stored from previous hybridization of the library membrane and denatured at 95 ° C. for 5 minutes. Hybridization was performed while shaking at 60 rpm at 50 rpm for 16 hours.

표지화된 프로브 용액의 제거에 이어서, 멤브레인들을 3X SSC 중에서 25 ℃ (50 rpm, 15 분)에서 3회 세척하였다 (매회 세척시 약 150 ㎖). 이어서, 이들을 0.25X SSC 및 0.2% SDS (최소 혼성 세척 용액) 중에서 68 ℃에서 3 시간 동안 (50 rpm) 세척하고, 상기한 바와 같이 25 ℃에서 1.5 시간 동안 X-선 필름에 노출시켰다 (강화기 스크린이 없음). 이 노출은 코스미드 단리물 22G12, 25A10, 26A5 및 26B10에 대하여 매우 강한 하이브리다이제이션 신호를 나타내었고, 코스미드 단리물 8B10에 대하여 매우 약한 신호를 나타내었다. 음성 대조군 (pWE15) 콜로니에서는 신호가 나타나지 않았고, 동시에 실험적인 시료를 사용하여 처리한 양성 대조군 멤브레인 (PCR 생성물의 GZ4 단리물을 함유하는 DH5α 세포)에서는 매우 강한 신호가 나타났다.Following removal of the labeled probe solution, the membranes were washed three times at 25 ° C. (50 rpm, 15 minutes) in 3 × SSC (about 150 mL each wash). They were then washed in 0.25X SSC and 0.2% SDS (minimum hybrid wash solution) at 68 ° C. for 3 hours (50 rpm) and exposed to X-ray film at 25 ° C. for 1.5 hours as described above (enhancers). No screen). This exposure showed a very strong hybridization signal for cosmid isolates 22G12, 25A10, 26A5 and 26B10 and a very weak signal for cosmid isolate 8B10. No signal was seen in the negative control (pWE15) colonies, while at the same time a very strong signal was seen in the positive control membrane (DH5α cells containing GZ4 isolate of PCR product) treated with experimental samples.

〈TcaB 유전자의 특정 게놈 단편의 증폭〉<Amplification of specific genomic fragments of the TcaB gene>

정제된 TcaBi펩티드 단편에 대해 결정된 N-말단 아미노산 서열 (본 명세서에 서열 3으로서 기재함)에 기초하여, 동의성 올리고뉴클레오티드의 풀 (pool P8F)을 펩티드 TcaC에 대하여 기재된 바와 같이 합성하였다. 결정된 아미노산 서열 및 대응하는 동의성 DNA 서열은 이하에 나타나 있고, 여기서 A, C, G 및 T는 표준 DNA 염기이고, I는 이노신을 나타낸다.Based on the N-terminal amino acid sequence determined for the purified TcaB i peptide fragment (described herein as SEQ ID NO: 3), a pool of synonymous oligonucleotides (pool P8F) was synthesized as described for peptide TcaC. The amino acid sequences determined and the corresponding synonymous DNA sequences are shown below, where A, C, G and T are standard DNA bases and I represents inosine.

또다른 세트의 동의성 올리고뉴클레오티드를 합성하였으며 (pool P8.108.3R), 이것은 TcaBi-PT108 내부 펩티드 (서열 20)의 결정된 아미노산 서열에 대한 코딩 가닥의 상보체를 나타낸다:Another set of synonymous oligonucleotides was synthesized (pool P8.108.3R), which represents the complement of the coding strand to the determined amino acid sequence of the TcaB i -PT108 internal peptide (SEQ ID NO: 20):

이들 올리고뉴클레오티드들은 HotStart 50 Tubes (등록 상표) (Molecular Bio-Products, Inc. 제품, 캘리포니아주 샌디에고 소재)를 이용하는 PCR (등록 상표)용 프라이머로서 사용하여 포토랍두스 균주 W-14 (상기 기재됨)로부터 제조된 게놈 DNA로부터 특정 DNA 단편을 증폭시켰다. 대표적인 반응물 (50 ㎕)은 1X GeneAmp (등록 상표) PCR 완충액 중에 각 프라이머 풀 P8F 및 P8.108.3R 25 pmol, dATP, dCTP, dGTP 및 dTTP 각각 2 nmol을 함유하였고 (바닥층), 1X GeneAmp (등록 상표) PCR 완충액 중에 게놈 주형 DNA 230 ng, dATP, dCTP, dGTP 및 dTTP 각각 8 nmol, 및 AmpTaq (등록 상표) DNA 폴리머라제 2.5 단위를 함유하였다 (상부층). 증폭은 TCaC 펩티드에 대해 기재된 바와 같이 35 주기까지 수행하였다. 증폭 생성물은 TEA 완충액 중의 0.7 % w/v SeaKem (등록 상표) LE 아가로스 (FMC)를 통한 전기영동에 의해 분석하였다. 추정된 크기 1600 bp의 특정 생성물이 관찰되었다.These oligonucleotides were used as primers for PCR (registered trademark) using HotStart 50 Tubes (registered trademark, Molecular Bio-Products, Inc., San Diego, Calif.) And photolabose strain W-14 (described above). Specific DNA fragments were amplified from genomic DNA prepared from. Representative reactions (50 μl) contained 2 nmol of each primer pool P8F and P8.108.3R 25 pmol, dATP, dCTP, dGTP and dTTP each in the 1X GeneAmp® PCR buffer (bottom layer), 1X GeneAmp® ) PCR buffer contained 230 ng of genomic template DNA, 8 nmol of dATP, dCTP, dGTP and dTTP, respectively, and 2.5 units of AmpTaq® DNA polymerase (upper layer). Amplification was performed up to 35 cycles as described for the TCaC peptide. Amplification products were analyzed by electrophoresis through 0.7% w / v SeaKem® LE agarose (FMC) in TEA buffer. A specific product of estimated size 1600 bp was observed.

4 개의 이러한 반응물을 풀링하고, 증폭된 DNA를 상기 TcaC 펩티드에 대해 기재된 바와 같이 Qiaex 키트에 의해 1.0 % SeaKem (등록 상표) LE 아가로스 (FMC)로부터 추출하였다. 추출된 DNA를 P8F 및 P8.108.3R 프라이머 풀을 사용하여 서열 결정용 주형 [PRISM (등록 상표) 서열화 키트]으로 직접 사용하였다. 각각의 반응물은 약 100 ng 주형 DNA 및 하나의 프라이머 풀 25 pmol을 함유하였고, TcaC 펩티드에 대해 기재된 바와 같은 표준 프로토콜에 따라 처리하였다. P8F 프라이머의 연장으로부터 유도된 서열 분석은 서열 3 (TcaBi)의 N-말단 펩티드 서열의 일부에 대응하는 짧은 DNA 서열 (및 코딩된 아미노산 서열)을 나타내었다:Four such reactions were pooled and amplified DNA was extracted from 1.0% SeaKem® LE Agarose (FMC) by Qiaex kit as described for the TcaC peptide above. The extracted DNA was used directly as a template for sequencing [PRISM® sequencing kit] using P8F and P8.108.3R primer pools. Each reaction contained about 100 ng template DNA and 25 pmol of one primer pool and treated according to standard protocols as described for the TcaC peptide. Sequence analysis derived from extension of the P8F primer showed a short DNA sequence (and encoded amino acid sequence) corresponding to a portion of the N-terminal peptide sequence of SEQ ID NO: 3 (TcaB i ):

GAT GCA TTG NTT GCTGAT GCA TTG NTT GCT

Asp Ala Leu (Val) AlaAsp Ala Leu (Val) Ala

〈TcaBi펩티드 유전자-특이성 프로브의 표지화〉<Labeling of TcaB i peptide gene-specific probes>

겔-정제된 TcaBiDNA 단편 대략 50 ng을 상기한 바와 같이32P-dCTP로 표지화하고, 비혼입된 방사성 동위원소들은 NICK 컬럼 (등록 상표) (Pharmacia 제품)을 통해 통과시켜 제거하였다. 표지화된 DNA의 특이 활성은 6 × 109dpm/㎍인 것으로 측정되었다. 이 표지화된 DNA는 TcaC-펩티드 특이성 프로브에 혼성된 게놈 라이브러리의 성분들로부터 제조된 콜로니 멤브레인을 프로빙하는데 사용하였다.Approximately 50 ng of gel-purified TcaB i DNA fragments were labeled with 32 P-dCTP as described above and unincorporated radioisotopes were removed by passing through a NICK column (registered trademark) (Pharmacia). The specific activity of the labeled DNA was determined to be 6 × 10 9 dpm / μg. This labeled DNA was used to probe colony membranes prepared from components of genomic libraries hybridized to TcaC-peptide specificity probes.

TcaC-프로브 라이브러리 스크린 (상기 참조)에서 동정된 12 개의 콜로니를 함유하는 멤브레인을 0.1X SSC 및 0.1 % SDS 1ℓ 중에서 매회 대략 30 분 동안 2회 비등시킴으로써 방사성 TcaC-특이성 표지를 제거하였다. 방사성 표지의 제거는 6 시간 동안 필름 노출시켜 확인하였다. 이어서, 제거된 멤브레인은 상기에서 제조한 TcaBi펩티드 특이성 프로브로 배양시켰다. 표지화된 DNA를 10 분 동안 비등시켜 변성시키고나서, "최소 혼성" 용액 100 ㎖ 중에서 60 ℃에서, 1 시간 동안 배양시킨 필터에 가하였다. 이 온도에서 밤새 하이브리다이제이션한 후, 프로브 용액을 제거하고, 여액을 다음과 같이 세척하였다 (모두 0.3X SSC 및 0.1 % SDS 중에서): 25 ℃에서 5 분 동안 1 회, 새로운 용액 중에서 60 ℃에서 1 시간 동안 1 회, 및 새로운 용액 중에서 63 ℃에서 1 시간 동안 1회. 표준 방법에 의해 1.5 시간 동안 X-선 필름에 노출시킨 후, 4 개의 강하게 하이브리드된 콜로니가 관찰되었다. 이들은 TcaC-특이성 프로브와 마찬가지로 단리물, 22G12, 25A10, 26A5 및 26B10 이었다.The radioactive TcaC-specific label was removed by boiling the membrane containing 12 colonies identified in the TcaC-probe library screen (see above) twice for approximately 30 minutes each time in 1 L of 0.1 × SSC and 0.1% SDS. Removal of the radiolabel was confirmed by film exposure for 6 hours. The removed membrane was then incubated with the TcaB i peptide specificity probe prepared above. Labeled DNA was denatured by boiling for 10 minutes and then added to a filter incubated for 1 hour at 60 ° C. in 100 ml of a “minimum hybrid” solution. After hybridization at this temperature overnight, the probe solution was removed and the filtrate was washed as follows (both in 0.3X SSC and 0.1% SDS): once at 25 ° C. for 5 minutes, at 60 ° C. in fresh solution. Once for 1 hour, and once for 1 hour at 63 ° C. in fresh solution. After exposure to the X-ray film for 1.5 hours by the standard method, four strongly hybridized colonies were observed. These were isolates, 22G12, 25A10, 26A5 and 26B10 as well as TcaC-specific probes.

상기 TcaBi 프로브 용액을 동일 부피 (약 100 ㎖)의 "최소 혼성" 용액으로 희석하고나서, 게놈 라이브러리의 800 원을 함유하는 멤브레인들을 스크리닝하는데 사용하였다. 상기한 바와 같이 하이브리다이제이션, 세척 및 X-선 필름에 노출시킨 후, 단지 4 개의 코스미드 클론 22G12, 25A10, 26A5 및 26B10이 이 프로브에 강하게 하이브리드되는 것으로 밝혀졌다.The TcaBi probe solution was diluted with an equal volume (about 100 mL) of "minimal hybrid" solution and then used to screen membranes containing 800 members of the genomic library. After exposure to hybridization, washing and X-ray film as described above, only four cosmid clones 22G12, 25A10, 26A5 and 26B10 were found to hybridize strongly to this probe.

〈TcaC 및 YcaBi 펩티드를 코딩하는 유전자를 함유하는 서브클론의 단리 및 그의 DNA 염기 서열의 결정〉<Isolation of subclones containing genes encoding TcaC and YcaBi peptides and determination of their DNA base sequences>

균주 XL1 Blue MR 중의 3 개의 하이브리다이제이션-양성 코스미드들을 TB-Amp100중에서 30 ℃에서 밤새 진탕(200 rpm)시키면서 성장시켰다. 세포들을 원심분리에 의해 수확한 후, 코스미드 DNA를 제조원의 프로토콜에 따라 시판되는 키트 (BIGprep (등록 상표), 5 Prime 3 Prime, Inc. 제품, 콜로라도주 보울더 소재)를 사용하여 제조하였다. 단 하나의 코스미드, 26A5가 이 절차에 의해 성공적으로 단리되었다. 제한 효소 EcoR 1 (NEB)로 분해하고 전기영동에 의해 분석했을 때, 대략적인 크기 14, 10, 8 (벡터), 5, 3.3, 2.9 및 1.5 kbp의 단편들이 검출되었다. 동일한 3 개의 균주 (8 ㎖ 배양물; TB-Amp100, 30 ℃)로부터 코스미드 DNA를 단리하려는 두번째 시도는 boiling miniprep 방법 [Evans G. and G. Wahl., 1987, "Cosmid vectors for genomic walking and rapid restriction mapping." in Guide to Molecular Cloning Techniques. Meth. Enzymology, Vol. 152, S. Breger and A. Kimmel, eds., pgs. 604-610]을 이용하였다. 단 하나의 코스미드, 25A10이 이 방법에 의해 성공적으로 단리되었다. 제한 효소 EcoR 1 (NEB)로 분해하고 겔 전기영동에 의해 분석했을 때, 이 코스미드는 코스미드 26A5에서 이전에 나타났던 것과 동일한 단편화 패턴을 나타내었다.Three hybridization-positive cosmids in strain XL1 Blue MR were grown overnight with shaking (200 rpm) at 30 ° C. in TB-Amp 100 . After harvesting the cells by centrifugation, cosmid DNA was prepared using a commercially available kit (BIGprep®, 5 Prime 3 Prime, Inc., Boulder, Colorado) according to manufacturer's protocol. Only one cosmid, 26A5, was successfully isolated by this procedure. When digested with restriction enzyme EcoR 1 (NEB) and analyzed by electrophoresis, fragments of approximate sizes 14, 10, 8 (vector), 5, 3.3, 2.9 and 1.5 kbp were detected. A second attempt to isolate cosmid DNA from the same three strains (8 mL culture; TB-Amp 100 , 30 ° C.) was carried out using the boiling miniprep method [Evans G. and G. Wahl., 1987, “Cosmid vectors for genomic walking and rapid restriction mapping. " in Guide to Molecular Cloning Techniques. Meth. Enzymology, Vol. 152, S. Breger and A. Kimmel, eds., Pgs. 604-610] was used. Only one cosmid, 25A10, was successfully isolated by this method. When digested with restriction enzyme EcoR 1 (NEB) and analyzed by gel electrophoresis, this cosmid exhibited the same fragmentation pattern as previously seen in cosmid 26A5.

26A5 코스미드 DNA의 시료 0.15 ㎍을 공급자의 프로토콜에 따라 대장균 DH5α 세포 (Gibco BRL 제품) 50 ㎖을 형질전환시키는데 사용하였다. 그 균주의 단일 콜로니 단리물을 TB-Amp1004 ㎖ 중에 접종시키고, 37 ℃에서 8 시간 동안 성장시켰다. 클로람페니콜을 최종 농도 225 ㎍/㎖로 첨가하고, 배양을 24 시간 동안 더 지속시키고나서, 세포들을 원심분리에 의해 수확하고, -20 ℃에서 동결시켰다. 26A5 코스미드 DNA의 단리는 표준 알칼리 용균 미니프렙 (Maniatis et al., 문헌 참조, p. 382)에 의해 수행하고, 모든 단계에서 와동시키기 보다는 교반하거나 또는 가볍게 혼합시키면서 모든 부피를 50 %까지 증가시켜 변형시켰다. DNA 펠릿을 70 % 에탄올 중에서 세척한 후, 이것을 25 ㎍/㎖ 리보뉴클레아제 (Boehringer Mannheim 제품)를 포함한 TE에 용해시켰다.0.15 μg of a sample of 26A5 cosmid DNA was used to transform 50 ml of E. coli DH5α cells (Gibco BRL) according to the supplier's protocol. A single colony isolate of the strain was inoculated in 4 ml of TB-Amp 100 and grown at 37 ° C. for 8 hours. Chloramphenicol was added to a final concentration of 225 μg / ml and the culture continued for 24 hours, after which the cells were harvested by centrifugation and frozen at -20 ° C. Isolation of 26A5 cosmid DNA was carried out by standard alkaline lysis miniprep (Maniatis et al., See literature, p. 382) and increased all volumes to 50% with stirring or light mixing, rather than vortexing at all stages. Modified. After washing the DNA pellet in 70% ethanol, it was dissolved in TE with 25 μg / ml ribonuclease (from Boehringer Mannheim).

〈GZ4-유도 및 TcaBi-프로브에 하이브리드되는 EcoR I 단편의 동정〉<Identification of EcoR I Fragments Hybridized to GZ4-Induced and TcaBi-Probes>

코스미드 25A10 (XL1 Blue MR 세포로부터 추출) 대략 0.4 ㎍ 및 코스미드 26A5 (클로람페니콜-증폭된 DH5α 세포로부터 추출) 약 0.5 ㎍을 각각 EcoR I (NEB) 약 15 단위로 85 분 동안 분해하고, 밤새 동결시키고, 이어서 65 ℃에서 5 분 동안 가열시키고, 0.7 % 아가로스 겔 중에서 전기영동시켰다 [Seakem (등록 상표) LE, 1X TEA, 80 볼트, 90분]. DNA를 상기한 바와 같이 에티듐 브로마이드로 염색시키고, 자외선 하에 사진을 찍었다. 코스미드 25A10의 EcoR I 분해물은 완전히 분해된 것이었으나, 코스미드 26A5의 시료는 이들 조건 하에서 단지 부분적으로 분해되었다. DNA 단편을 함유하는 아가로스 겔을 탈퓨린화하고, 변성시키고, 중화시킨 다음, Ausubel et al (CPMB, 문헌 참조)의 섹션 2.9에 기재된 바와 같이 고염 (20X SSC) 프로토콜을 사용하여 Magna NT 나일론 멤브레인 상에 써던 블로팅 (Southern Blotting) 시켰다. 이어서, 전이된 DNA들을 상기한 바와 같이 나일론 멤브레인에 UV-가교화시켰다.Approximately 0.4 μg of cosmid 25A10 (extracted from XL1 Blue MR cells) and about 0.5 μg cosmid 26A5 (extracted from chloramphenicol-amplified DH5α cells) were digested with EcoR I (NEB) about 15 units for 85 minutes and frozen overnight. And then heated at 65 ° C. for 5 min and electrophoresed in 0.7% agarose gel [Seakem® LE, 1 × TEA, 80 volts, 90 min]. DNA was stained with ethidium bromide as described above and photographed under ultraviolet light. The EcoR I digest of cosmid 25A10 was completely degraded, but the sample of cosmid 26A5 only partially degraded under these conditions. Agarose gels containing DNA fragments are depurinated, denatured, neutralized and then Magna NT nylon membranes using a high salt (20X SSC) protocol as described in section 2.9 of Ausubel et al (CPMB, see literature). Southern blotting was performed on the image. The transferred DNAs were then UV-crosslinked to the nylon membrane as described above.

플라스미드 단리물 GZ4의 삽입체에 대응하는 TcaC-펩티드 특이적 DNA 단편을 상기한 바와 같은 100 ㎖ 반응 부피 중에서 PCR (등록 상표)에 의해 증폭하였다. 이러한 3회의 반응으로부터의 증폭 생성물을 풀링하고, 상기한 바와 같이 Qiaex 키트에 의해 1 % GTG (등록 상표) 아가로스 겔로부터 추출하고, 형광계에 의해 정량하였다. 겔 정제된 DNA 100 ng을 상기한 바와 같이 High Prime Labeling Mix (Boehringer Mannheim 제품)를 사용하여32P-dCTP로 6.34 × 108dpm/㎍의 특이 활성으로 표지화하였다.TcaC-peptide specific DNA fragments corresponding to inserts of plasmid isolate GZ4 were amplified by PCR (registered trademark) in 100 ml reaction volume as described above. The amplification products from these three reactions were pooled, extracted from 1% GTG (registered trademark) agarose gel by Qiaex kit as described above, and quantified by fluorimeter. 100 ng of gel purified DNA was labeled with a specific activity of 6.34 × 10 8 dpm / μg with 32 P-dCTP using High Prime Labeling Mix (Boehringer Mannheim) as described above.

32P-표지화된 GZ4 프로브를 10분 동안 비등시킨 후, "최소 혼성" 완충액 1 ng/㎖에 첨가하고, 분해된 코스미드 DNA 단편을 포함하는 써던 블롯 멤브레인을 첨가하고, 50 rpm에서 부드럽게 진탕하면서 60 ℃에서 4 시간 동안 배양하였다. 이어서, 멤브레인을 25 ℃에서 각각 약 5 분 동안 3 회 세척한 후 (최소 혼성 세척 용액), 60 ℃에서 각각 30 분 동안 2 회 세척하였다. 블롯을 -70 ℃에서 약 30 분 동안 (강화 스크린과 함께) 필름에 노출시켰다. GZ4 프로브는 2 개의 코스미드 26A5 및 25A10의 5.0 kbp (외관상 크기) EcoR I 단편에 강하게 하이브리다이제이션하였다. 32 P-labeled GZ4 probe was boiled for 10 minutes, then added to 1 ng / ml of "minimal hybrid" buffer, Southern blot membrane containing digested cosmid DNA fragment was added and gently shaken at 50 rpm. Incubated at 60 ° C. for 4 hours. The membranes were then washed three times at 25 ° C. for about 5 minutes each (minimum hybrid wash solution) and then twice at 60 ° C. for 30 minutes each. The blots were exposed to the film (along with the strengthening screen) at −70 ° C. for about 30 minutes. GZ4 probes were strongly hybridized to the 5.0 kbp (apparent size) EcoR I fragments of two cosmids 26A5 and 25A10.

멤브레인을 0.1X SSC + 0.1 % SDS 중에서 약 30 분 동안 비등시켜 방사성을 제거하고, 필름에 노출시켜 방사성 표지의 부재를 확인하였다. 이어서, 이것을 상기 콜로니 멤브레인의 스크리닝에 미리 사용된 "최소 혼성" 완충액 중에서 변형 TcaBi프로브를 사용하여 60 ℃에서 3.5 시간 동안 하이브리다이제이션시키고, 상기한 바와 같이 세척하고, 2 개의 강화 스크린과 함께 -70 ℃에서 40 분 동안 필름에 노출시켰다. 코스미드를 모두 사용할 때, TcaBi프로브는 약 5.0 kbp EcoR 1 단편과 약하게 하이브리다이제이션하고 약 2.9 kbp의 단편과는 강하게 하이브리다이제이션하였다.The membrane was boiled in 0.1 × SSC + 0.1% SDS for about 30 minutes to remove radioactivity and exposed to film to confirm the absence of radiolabel. This was then hybridized at 60 ° C. for 3.5 hours using a modified TcaB i probe in “minimal hybrid” buffer previously used for screening of the colony membrane, washed as described above, and with two strengthening screens − The film was exposed to the film at 70 ° C. for 40 minutes. When both cosmids were used, the TcaB i probe was weakly hybridized with about 5.0 kbp EcoR 1 fragment and strongly hybridized with about 2.9 kbp fragment.

(DH5α 세포로부터의) 상기한 코스미드 26A5 DNA의 시료를 원하는 밴드를 서브클로닝하기 위한 DNA 공급원으로서 사용하였다. 이 DNA 2.5 ㎍을 총 부피 30 ㎕ 중에서 EcoR 1 (NEB) 약 3 단위로 1.5 시간 동안 분해하여 부분 분해물을 수득하였으며, 겔 전기영동에 의해 확인하였다. pBC KS (+) DNA (Stratagene 제품) 10 ㎍을 총 부피 20 ㎕ 중에서 EcoR 1 20 단위로 1.5 시간 동안 분해하여 완전히 분해하고, 전기영동에 의해 확인하였다. EcoR 1 및 절단된 DNA 제제 모두를 물을 사용하여 50 ㎕까지 희석하고, 각각에 동일 부피의 PCI를 가하고, 현탁액을 부드럽게 혼합하고, 마이크로원심분리기로 회전시키고, 수성 상등액을 수거하였다. 에탄올 150 ㎕로 DNA를 침전시키고, 혼합물을 -20 ℃에서 밤새 방치시켰다. 원심분리하고 건조시킨 후, EcoR 1 및 분해된 pBC KS (+)를 TE 100 ㎕에 용해시키고, 부분 분해된 26A5를 TE 20 ㎕에 용해시켰다. DNA 회수를 형광계로 확인하였다.Samples of cosmid 26A5 DNA (from DH5α cells) were used as DNA sources for subcloning the desired bands. 2.5 μg of this DNA was digested with about 3 units of EcoR 1 (NEB) in a total volume of 30 μl for 1.5 hours to obtain a partial digest and confirmed by gel electrophoresis. 10 μg of pBC KS (+) DNA (manufactured by Stratagene) was digested with 20 units of EcoR 1 in a total volume of 20 μl for 1.5 hours and completely digested and confirmed by electrophoresis. Both EcoR 1 and cleaved DNA preparations were diluted to 50 μl with water, equal volume of PCI was added to each, the suspension was gently mixed, spun with a microcentrifuge and the aqueous supernatant was collected. DNA was precipitated with 150 μl of ethanol and the mixture was left overnight at -20 ° C. After centrifugation and drying, EcoR 1 and digested pBC KS (+) were dissolved in 100 μl of TE and partially digested 26A5 was dissolved in 20 μl of TE. DNA recovery was confirmed by fluorimeter.

별개의 반응에서, 약 60 ng의 EcoR I 및 분해된 pBC KS(+) DNA를 부분 분해된 코스미드 26A5 DNA 약 180 ng 또는 270 ng과 라이게이션시켰다. 라이게이션은 T4 리가제 및 New England BioLabs 제품의 완충액을 사용하여 15 ℃에서 부피 20 ㎕ 중에서 5 시간 동안 수행하였다. 멸균 TE를 사용하여 100 ㎕로 희석시킨 라이게이션 혼합물을 사용하여 공급자의 지시에 따라 냉동된 적격의 DH5α 세포 (Gibco BRL 제품)를 형질전환시켰다. 상이한 양 (25 내지 200 ㎕)의 형질전환된 세포를 1 mM IPTG 및 50 ㎎/1 X-gal을 갖는 새로 제조한 고상 LB-Cam35배지 위에 플레이팅하였다. 플레이트를 37 ℃에서 약 20 시간 배양한 후, 약 3 시간 동안 암실에서 냉각시켜 삽입체 선별을 위한 색상을 강화시켰다. 백색 콜로니를 동일한 조성의 패치 플레이트 상에 플레이팅하고 37 ℃에서 철야 배양하였다.In a separate reaction, about 60 ng of EcoR I and digested pBC KS (+) DNA were ligated with about 180 ng or 270 ng of partially digested cosmid 26A5 DNA. Ligation was performed for 5 hours in 20 μl volume at 15 ° C. using T4 ligase and buffer from New England BioLabs. Ligation mixtures diluted to 100 μl with sterile TE were used to transform frozen qualified DH5α cells (Gibco BRL) according to the supplier's instructions. Different amounts (25-200 μl) of transformed cells were plated on freshly prepared solid LB-Cam 35 medium with 1 mM IPTG and 50 mg / 1 X-gal. The plate was incubated at 37 ° C. for about 20 hours and then cooled in the dark for about 3 hours to enhance color for insert selection. White colonies were plated on patch plates of the same composition and incubated overnight at 37 ° C.

각각의 선별된 패치 플레이트의 2 개의 콜로니 리프트를 다음과 같이 제조하였다. 백색 콜로니를 새로운 플레이트에 선택한 후, 구형의 Magna NT 나일론 멤브레인을 패치 플레이트 상에 압축하고, 멤브레인을 들어올리고, 라이브러리 콜로니 막에 대하여 상기한 바와 같이 변성, 중화 및 UV 가교화되게 하였다. 가교화된 콜로니 리프트를 격렬하게 세척하고, 티슈로 과량의 세포 파쇄물을 부드럽게 닦아내었다. "최소 혼성" 프로토콜에 따라 한 세트를 상기한 GZ4 (TcaC) 프로브 용액과 하이브리다이제이션시키고, 다른 한 세트는 상기한 TcaBi프로브 용액과 하이브리다이제이션시킨 후, 세척하고 라이브러리 콜로니 멤브레인에 대해서 기술한 바와 같이 필름에 노출시켰다.Two colony lifts of each selected patch plate were prepared as follows. After white colonies were selected for a new plate, the spherical Magna NT nylon membrane was pressed onto the patch plate, the membrane was lifted and allowed to denature, neutralize and UV crosslink as described above for the library colony membrane. The crosslinked colony lift was washed vigorously and gently wiped off excess cell debris with a tissue. One set was hybridized with the GZ4 (TcaC) probe solution described above according to the "least hybrid" protocol, and the other set was hybridized with the TcaB i probe solution described above, then washed and described for the library colony membrane. As exposed to the film.

단지 GZ4 프로브와, GZ4 및 TcaBi모두와, 또는 단지 TcaBi프로브와만 하이브리다이제이션 신호를 나타내는 콜로니를 추가 연구를 위하여 선별하고, 상기와 같이 단일 콜로니의 단리를 위해 IPTG 및 X-gal을 갖는 LB-Cam35배지 상에 세포를 스트리킹하였다. 16 개의 상이한 단리물로부터의 약 35 개의 단일 콜로니를 액체 LB-Cam35배지에 넣고, 37 ℃에서 철야 성장시키고, 세포를 원심분리에 의해 수거하고, 플라스미드 DNA를 문헌 [Maniatis et al., 문헌 참조, p. 368]에 따라 표준 알칼리 용균 미니프렙에 의해 단리하였다. DNA 펠렛을 TE + 25 ㎍/㎖ 리보뉴클레아제 A에 용해시키고, 형광계로 DNA 농도를 측정하였다. EcoR I 분해 패턴을 겔 전기영동에 의해 분석하였다. 다음과 같은 단리물을 유용하게 사용하였다. 단리물 A17.2는 재라이게이션된 pBC KS(+)만을 포함하며, (음성) 대조군으로 사용하였다. 단리물 D38.3 및 C44.1은 각각 pBC KS(+)에 삽입된 2.9 kbp의 TcaBi- 하이브리다이제이션 EcoR I 단편만을 포함한다. 이들 플라스미드 pDAB2000 및 pDAB2001를 각각 도 2에 도시하였다.Colonies showing hybridization signals with only GZ4 probes, with both GZ4 and TcaB i , or only with TcaB i probes were selected for further study, with IPTG and X-gal for isolation of single colonies as above. Cells were streaked on LB-Cam 35 medium. About 35 single colonies from 16 different isolates are placed in liquid LB-Cam 35 medium, grown overnight at 37 ° C., cells are harvested by centrifugation, and plasmid DNA is described in Maniatis et al. , p. 368] by standard alkaline lysis miniprep. DNA pellets were dissolved in TE + 25 μg / ml ribonuclease A and the DNA concentration was measured with a fluorometer. EcoR I digestion patterns were analyzed by gel electrophoresis. The following isolates were usefully used. Isolate A17.2 contains only the religated pBC KS (+) and was used as a (negative) control. Isolates D38.3 and C44.1 contain only 2.9 kbp TcaB i -hybridization EcoR I fragments inserted in pBC KS (+), respectively. These plasmids pDAB2000 and pDAB2001 are shown in FIG. 2, respectively.

단리물 A35.3은 pBC KS(+)에 삽입된 약 5 kbp의 GZ4 - 하이브리다이제이션 EcoR 1 단편만을 포함한다. 이 플라스미드는 pDAB2002 (도 2 참조)로 명명되었다. 이들 단리물은 DNA 서열 분석을 위한 주형을 제공하였다.Isolate A35.3 contains only about 5 kbp of GZ4-hybridization EcoR 1 fragment inserted into pBC KS (+). This plasmid was named pDAB2002 (see FIG. 2). These isolates provided a template for DNA sequencing.

플라스미드 pDAB2000 및 pDAB2001을 상기 BIGprep (등록 상표) 키트를 사용하여 제조하였다. 배양물 30 ㎖를 OD600이 2가 될 때까지 TB-Cam35중에서 철야 성장시킨 후, 플라스미드를 제조자의 지시에 따라 단리하였다. DNA 펠렛을 각각 TE 100 ㎕에 재용해시키고, 시료의 보전을 EcoR I 분해 및 겔 전기영동 분석법에 의해 확인하였다.Plasmids pDAB2000 and pDAB2001 were prepared using the BIGprep® kit. 30 ml of culture was grown overnight in TB-Cam 35 until OD 600 became 2, and then the plasmid was isolated according to the manufacturer's instructions. DNA pellets were redissolved in 100 μl of TE, respectively, and the integrity of the samples was confirmed by EcoR I digestion and gel electrophoresis analysis.

주형으로서 pDAB2000 DNA를 사용하는 하나의 복제물과 주형으로서 pDAB2001 DNA를 사용하는 다른 하나의 복제물을 사용하여 이중으로 서열화 반응을 실시하였다. 반응은 GZ4/HB14 DNA의 서열 분석에 대해 상기한 바와 같은 디데옥시 염료 종결자 주기 서열 분석법을 사용하여 수행하였다. 초기 서열화는 프라이머로서 상기 LacZ 및 T7 프라이머, 및 TcaBiPCR 증폭 생성물 (TH1 = ATTGCAGACTGCCAATCGCTTCGG, TH12 = GAGAGTATCCAGACCGCGGATGATCTG)의 결정된 서열을 기초로 한 프라이머를 사용하였다.The sequencing reaction was performed in duplicate using one copy using pDAB2000 DNA as a template and the other copy using pDAB2001 DNA as a template. The reaction was performed using dideoxy dye terminator cycle sequencing as described above for sequencing of GZ4 / HB14 DNA. Initial sequencing used primers based on the LacZ and T7 primers as well as the determined sequences of the TcaB i PCR amplification product (TH1 = ATTGCAGACTGCCAATCGCTTCGG, TH12 = GAGAGTATCCAGACCGCGGATGATCTG).

각각의 서열화 결과의 배열 및 편집 후, 각각의 서열을 Perkin Elmer Applied Biosynthesis Division SeqEd 675 소프트웨어에 의해 번역한 염색체 데이터의 보전에 따라 250 내지 350 염기로 절단하였다. 후속하는 서열화 "단계"는 새로운 프라이머에 적합한 서열을 선택하여 실시하였다. 몇가지의 예외를 제외하고, 프라이머 (상기와 같이 합성됨)는 50 % G+C 조성을 갖는 24 염기의 길이를 가졌다. 이러한 방법에 의한 서열화는 약 2.9 kbp EcoR I 단편의 가닥 모두에 대해 수행하였다.After arrangement and editing of each sequencing result, each sequence was cut to 250 to 350 bases according to the integrity of the chromosomal data translated by the Perkin Elmer Applied Biosynthesis Division SeqEd 675 software. Subsequent sequencing “steps” were performed by selecting the appropriate sequence for the new primer. With a few exceptions, the primer (synthesized as above) had a length of 24 bases with a 50% G + C composition. Sequencing by this method was performed for all strands of the about 2.9 kbp EcoR I fragment.

DNA 서열화를 위한 주형으로서 사용하기 위해, 단리물 pDAB2002로부터의 플라스미드 DNA를 BIGprep (등록 상표) 키트에 의해 제조하였다. 서열화 반응을 수행하고 상기한 바와 같이 분석하였다. 초기에는, T3 프라이머 (pBS KS(+) 염기 774-796: CGCGCAATTAACCCTCACTAAAG) 및 T7 프라이머 (pBS KS(+) 염기 621-643: GCGCGTAATACGACTCACTATAG)를 사용하여 인접하는 벡터 서열로부터 서열화 반응물을 프라이밍하여 삽입 DNA로 판독하였다. 다른 프라이머 세트 (GZ4F: GTATCGATTACAACGCTGTCACTTCCC; TH13: GGGAAGTGACAGCGTTGTAATCGATAC; TH14: ATGTTGGGTGCGTCGGCTAATGGACATAAC; 및 LW1-204: GGGAAGTGACAGCGTTGTAATCGATAC)를 제조하여 서브클로닝된 TcaC-펩티드 PCR 생성물의 동의성 올리고뉴클레오티드-매개 서열화에 의해 미리 결정된 내부 서열로부터 프라이밍하였다. 서열화의 초기 순환 동안 생성된 데이터로부터 새로운 세트의 프라이머를 고안하여 약 5 kbp 단편의 총 길이를 프라이밍하기 위해 사용하였다. 총 55 개의 올리고 프라이머를 사용하여 총 4832 bp의 연속 서열을 확인할 수 있었다.For use as template for DNA sequencing, plasmid DNA from isolate pDAB2002 was prepared by BIGprep® kit. Sequencing reactions were performed and analyzed as described above. Initially, sequencing reactions from adjacent vector sequences were primed with insert DNA using T3 primer (pBS KS (+) bases 774-796: CGCGCAATTAACCCTCACTAAAG) and T7 primer (pBS KS (+) bases 621-643: GCGCGTAATACGACTCACTATAG). Read. Subcloned oligonucleotides of the primer-sequenced oligonucleotide sequence were prepared by different primer sets (GZ4F: GTATCGATTACAACGCTGTCACTTCCC; TH13: GGGAAGTGACAGCGTTGTAATCGATAC; TH14: ATGTTGGGTGCGTCGGCTAATGGACATAAC; and LW1-204: GGGAAGTGACAGCGTTGTAATCGATAC) to determine the sequence of the cloned oligonucleotide-PCR It was. A new set of primers was designed from the data generated during the initial cycle of sequencing and used to prime the total length of about 5 kbp fragments. A total of 55 oligo primers were used to confirm the total sequence of 4832 bp.

pDAB2002의 EcoR I 단편 삽입체의 DNA 서열을 pDAB2000/pDAB2001 단리물의 결정 서열의 일부와 합할 때, 총 6005 bp의 연속 서열이 생성되었다 (서열 25로서 표시됨). 긴 개방 해독 프레임을 대응하는 아미노산으로 번역할 때, 서열은 메티오닌 잔기 (번역 개시부) 바로 전의 염기 68-124에 의해 코딩되는 TcaBiN-말단 펩티드 (서열 3으로 표시됨)를 분명하게 나타내었다. 상류는 잠재적인 리보좀 결합 부위 (염기 51-58)이고, 하류는 염기 215-277에서 TcaBi-PT158 내부 펩티드 (서열 19로 표시됨)가 코딩된다. 또한, 동일한 해독 프레임에서 하류의 염기 1787-1822에는 TcaBi-PT108 내부 펩티드 (서열 20으로 표시됨)를 코딩하는 서열이 존재한다. 또한, 동일한 해독 프레임의 염기 1946-1972에서는 TcaBiiN-말단 펩티드 (서열 5)가 코딩되고, 해독 프레임은 뉴클레오티드 3632-3634에서 번역 종결 코돈까지 방해받지 않고 계속된다.When the DNA sequence of the EcoR I fragment insert of pDAB2002 was combined with a portion of the crystal sequence of the pDAB2000 / pDAB2001 isolate, a total of 6005 bp of contiguous sequence was generated (expressed as SEQ ID NO: 25). When translating the long open reading frame to the corresponding amino acid, the sequence clearly showed the TcaB i N-terminal peptide (shown in SEQ ID NO: 3) encoded by bases 68-124 immediately before the methionine residue (translation start). Upstream is a potential ribosomal binding site (bases 51-58) and downstream encodes the TcaB i -PT158 internal peptide (as represented by SEQ ID NO: 19) at bases 215-277. Furthermore, in base 1787-1822 downstream of the same translation frame, there is a sequence encoding the TcaB i -PT108 internal peptide (as represented by SEQ ID NO: 20). In addition, TcaB ii N-terminal peptide (SEQ ID NO: 5) is encoded at bases 1946-1972 of the same translation frame, and the translation frame continues uninterrupted until the translation termination codon at nucleotides 3632-3634.

TcaBi-PT108을 코딩하는 서열의 말단과 TcaBii코딩 영역의 개시부 사이의 프레임 내 (in-frame) 정지 코돈의 결여, 및 TcaBii코딩 영역 바로 상류의 식별할 수 있는 리보좀 결합 부위의 결여는 펩티드 TcaBii및 TcaBi가 서열 25의 염기쌍 65에서 시작하는 3567 bp의 단일 개방 해독 프레임에 의해 코딩됨을 나타내고, 후-번역 분해에 의해 1189 아미노산 (131,586 달톤; 서열 26으로 표시됨)의 단일 1차 유전자 생성물 TcaB로부터 유래할 가능성이 가장 크다. TcaBiiN-말단 펩티드 바로 앞의 아미노산이 펩티드 TcaBi의 C-말단 아미노산을 나타내는 경우, TcaBii(627 개의 아미노산)의 예상 질량은 70,814 달톤 (서열 28로 표시됨)이고, SDS-PAGE에 의해 관찰된 크기 (68 kDa) 보다 다소 크다. 이 펩티드는 1881 염기쌍 (서열 27로 표시됨)의 연속 스트레치에 의해 코딩될 것이다. TcaBi의 천연 C-말단은 TcaBi-PT108의 C-말단에 보다 근접해 있는 것으로 생각된다. PT108의 분자량 (3.438 kDa; 이 펩티드의 N-말단 아미노산 서열 분석 동안 측정됨)을 통하여 30개의 아미노산의 크기를 예상할 수 있다. TcaBi코딩 영역의 C-말단 (서열 28의 604 위치에 있는 Glu)을 나타내기 위하여 이 펩티드의 크기를 사용하여, TcaBi의 유도된 크기는 604 개의 아미노산 또는 68,463 달톤인 것으로 측정되어 실험적 관찰 결과와 보다 일치하였다.TcaB i of the sequence ends and encoding the -PT108 TcaB ii coding start part-frame (in-frame) the lack of a stop codon between the regions, and the lack of TcaB ii coding region a ribosome binding site that can be identified immediately upstream of the Peptides TcaB ii and TcaB i are encoded by a single open translation frame of 3567 bp starting at base pair 65 of SEQ ID NO: 25, and by post-translational degradation a single primary gene of 1189 amino acids (131,586 daltons; represented by SEQ ID NO: 26) Most likely from the product TcaB. If the amino acid immediately preceding the TcaB ii N-terminal peptide represents the C-terminal amino acid of the peptide TcaB i , the expected mass of TcaB ii (627 amino acids) is 70,814 Daltons (denoted as SEQ ID NO: 28) and is observed by SDS-PAGE Is somewhat larger than the size (68 kDa). This peptide will be encoded by a continuous stretch of 1881 base pairs (as represented by SEQ ID NO: 27). Native C- terminus of the TcaB i is considered to be in close proximity than in the C- terminal of a TcaB i -PT108. The molecular weight of PT108 (3.438 kDa; measured during N-terminal amino acid sequencing of this peptide) can predict the size of 30 amino acids. Using the size of this peptide to represent the C-terminus of the TcaB i coding region (Glu at position 604 of SEQ ID NO: 28), the derived size of TcaB i was determined to be 604 amino acids or 68,463 daltons, resulting in experimental observations. More consistent with

1686 염기쌍 (서열 29로 표시됨)의 TcaBii펩티드 코딩 영역의 번역은 예상 질량이 60,789 달톤인 562 아미노산 (서열 30으로 표시됨)의 단백질을 생성하며, 이것은 관찰치 61 kDa와 잘 일치한다.Translation of the TcaB ii peptide coding region of 1686 base pairs (as represented by SEQ ID NO: 29) yields a protein of 562 amino acids (as represented by SEQ ID NO: 30) with an expected mass of 60,789 Daltons, which is in good agreement with the observed 61 kDa.

잠재적인 리보좀 결합 부위 (염기 3682-3687)는 tcaB 개방 해독 프레임의 정지 코돈의 48 bp 하류에서 발견된다. 염기 3694-3726에서 펩티드 TcaC (서열 2)의 N-말단을 코딩하는 서열이 발견된다. 이 N-말단 펩티드에 의해 개시되는 개방 해독 프레임은 염기 6005까지 방해되지 않고 계속된다 (2361 염기쌍, 서열 31의 처음 2361 염기쌍으로 표시됨). 전체 TcaC 펩티드 (외관상 크기 약 165 bp; 약 1500 아미노산)를 코딩하는 유전자 (tcaC)는 약 4500 bp를 포함할 것이다.Potential ribosomal binding sites (bases 3682-3687) are found 48 bp downstream of the stop codon of the tcaB open reading frame. A sequence encoding the N-terminus of peptide TcaC (SEQ ID NO: 2) at bases 3694-3726 is found. The open reading frame initiated by this N-terminal peptide continues undisturbed up to base 6005 (2361 base pairs, represented by the first 2361 base pairs of SEQ ID NO: 31). The gene encoding the total TcaC peptide (apparent size about 165 bp; about 1500 amino acids) (tcaC) will comprise about 4500 bp.

또한, 코스미드 26A5의 클로닝된 EcoR I 단편을 포함하는 다른 단리물 E20.6을 앞에서 언급한 GZ4 및 TcaBi프로브와의 상동성에 의해 확인하였다. 이 균주에 포함된 플라스미드 (pDAB2004, 도 2)의 DNA의 EcoR 1 분해물의 아가로스 겔 분석은 추정된 크기 2.9, 5 및 3.3 kbp의 삽입 단편을 나타내었다. 플라스미드 pDAB2002의 서열로부터 고안된 프라이머로부터 개시된 DNA 서열 분석은 pDAB2004의 3.3 kbp EcoR 1 단편이 pDAB2002에 나타난 5 kbp EcoR 1 단편에 인접하여 존재함을 나타내었다. pDAB2002에서 발견된 2361 염기쌍 개방 해독 프레임은 pDAB2004 내의 다른 2094 염기 (서열 31의 염기쌍 2362 내지 4458로 표시됨)로 방해받지 않고 계속된다. 주형으로서 모(母) 코스미드 26A5 DNA를 사용한 DNA 서열 분석을 통하여 개방 해독 프레임의 연속성을 확인하였다. 또한, 개방 해독 프레임 (TcaC 서열 31)은 4455 개의 염기쌍을 포함하고, 1485 개 아미노산의 단백질 (TcaC) (서열 32로 표시됨)을 코딩한다. 분자 크기의 계산치 166,214 달톤은 TcaC 펩티드의 추정 크기 (165 kDa)와 일치하고, 유도된 아미노산 서열은 TcaC N-말단 서열 (서열 2)에 개시된 서열과 정확하게 일치하였다.In addition, another isolate E20.6, comprising a cloned EcoR I fragment of cosmid 26A5, was identified by homology with the aforementioned GZ4 and TcaB i probes. Agarose gel analysis of the EcoR 1 digest of the DNA of the plasmids (pDAB2004, FIG. 2) contained in this strain showed insert fragments of estimated sizes 2.9, 5 and 3.3 kbp. DNA sequence analysis disclosed from primers designed from the sequence of plasmid pDAB2002 showed that a 3.3 kbp EcoR 1 fragment of pDAB2004 was present adjacent to the 5 kbp EcoR 1 fragment shown in pDAB2002. The 2361 base pair open reading frame found in pDAB2002 continues undisturbed with the other 2094 bases in pDAB2004 (denoted 2362 to 4458 of base pair 31). DNA sequence analysis using parent cosmid 26A5 DNA as a template confirmed the continuity of the open reading frame. In addition, the open reading frame (TcaC SEQ ID NO: 31) comprises 4455 base pairs and encodes a protein (TcaC) of 1485 amino acids (denoted as SEQ ID NO: 32). The calculated molecular size 166,214 Daltons matched the estimated size of the TcaC peptide (165 kDa) and the derived amino acid sequence exactly matched the sequence disclosed in the TcaC N-terminal sequence (SEQ ID NO: 2).

동의성 올리고뉴클레오티드 프라이머 풀을 고안하기 위해 사용된 서열 17에 대응하는 아미노산 서열이 발견된 서열 내에 존재하지 않는 것은 초기 라이브러리 스크린에서 프로브로서 사용된 단리물 GZ4 및 HB14에서 발견된 PCR (등록 상표) 생성물의 생성이 동의성 풀의 프라이머 중 하나에 의해 역-가닥 프라이밍 (reverse-strand priming)에 의해 우연하게 생성되었음을 나타낸다. 또한, 유도된 단백질 서열은 서열 18로서 표시된 내부 단편을 포함하지 않는다. 이들 서열은 플라스미드 pDAB2004가 TcaC 펩티드의 상보체 코딩 영역을 포함한다는 것을 나타낸다.The absence of an amino acid sequence corresponding to SEQ ID NO: 17 used to design a synonymous oligonucleotide primer pool in the found sequence indicates that the PCR (registered trademark) product found in isolates GZ4 and HB14 used as probes in the initial library screen. It is shown that the formation of by chance occurs by reverse-strand priming by one of the primers of the synonym pool. In addition, the derived protein sequence does not comprise an internal fragment represented as SEQ ID NO: 18. These sequences indicate that plasmid pDAB2004 contains the complement coding region of the TcaC peptide.

서열 25을 추가로 분석한 결과는, 본 명세서에서 서열 35로서 개시된 TcaAiii의 최종 13 개의 아미노산을 코딩하는 개방 해독 프레임 (염기 1-43)의 말단을 나타낸다. 단지 24 개의 염기가 TcaAiii코딩 영역의 말단과 TcaBi코딩 영역의 개시를 분리한다. 리보좀 결합 자리로서 작용할 수 있는 서열이 24 염기 내에 포함된다. 가능하기는 하지만, 포토랍두스 유전자 프로모터가 이러한 짧은 영역 내에서 코딩될 것 같지는 않다. 세 개의 긴 개방 해독 프레임 [단지 59 염기에 의해 tcaB 말단으로부터 분리되는 tcaA (서열 33), tcaB (서열 25, 염기 65-36334) 및 tcaC (서열 31)]을 포함하는 게놈 영역 tca를 tcaA 유전자 (서열 33)의 개시부의 초기 상류를 전사하고 폴리시스트론 메신저 RNA를 생성하면서 오페론으로서 조절한다.Further analysis of SEQ ID NO: 25 shows the end of the open reading frame (bases 1-43) encoding the last 13 amino acids of TcaA iii disclosed herein as SEQ ID NO: 35. Only 24 bases separate the start and end of the coding region of the TcaB i TcaA iii coding region. Sequences that can act as ribosomal binding sites are included within 24 bases. Although possible, it is unlikely that the photolabduose gene promoter will be encoded within this short region. A genomic region tca comprising three long open reading frames (tcaA (SEQ ID NO: 33), tcaB (SEQ ID NO: 25, bases 65-36334) and tcaC (SEQ ID NO: 31), separated from the tcaB termini by only 59 bases) is defined by The initial upstream of the beginning of SEQ ID NO: 33) is transcribed and regulated as an operon while producing polycistronic messenger RNA.

〈실시예 9〉<Example 9>

포토랍두스 게놈 라이브러리에서의 TcbAii펩티드 코딩 유전자 스크리닝Screening of TcbA ii Peptide Coding Genes in the Photorabdus Genome Library

본 실시예는 TcbAii펩티드 코딩 유전자를 포함하는 DNA 클론을 확인하는데 사용되는 방법, 상기 유전자의 단리 및 그의 부분 DNA 염기 서열의 결정을 기술한다.This example describes the method used to identify DNA clones comprising the TcbA ii peptide coding gene, isolation of the gene and determination of partial DNA base sequences thereof.

프라이머 및 PCR 반응Primer and PCR Reactions

곤충 활성 제제의 TcbAii폴리펩티드는 약 206 kDa이다. 이 펩티드의 N-말단 아미노산 서열은 서열 1로서 나타나 있다. 실시예 8에서 기술한 바와 같이, 이 아미노산 서열의 일부를 코딩하기 위해 동의성 올리고뉴클레오티드 프라이머의 4 개의 풀 ("전향 프라이머": TH-4, TH-5, TH-6 및 TH-7)을 합성하였고, 아래에 나타내었다.The TcbA ii polypeptide of the insect active agent is about 206 kDa. The N-terminal amino acid sequence of this peptide is shown as SEQ ID NO: 1. As described in Example 8, four pools of synonymous oligonucleotide primers (“forward primers”: TH-4, TH-5, TH-6 and TH-7) were encoded to encode a portion of this amino acid sequence. It was synthesized and shown below.

또한, 내부 펩티드 제제 (TcbAii-PT81)의 1차 ("a") 및 2차 ("b") 서열을 결정하고, 서열 23 및 서열 24로서 각각 표시하였다. 동의성 올리고뉴클레오티드 ("역방향 프라이머": TH-8, TH-9, TH-10 및 TH-11)의 4 개의 풀을 유사하게 고안하고, 서열 23의 펩티드의 일부를 코딩하는 서열의 역방향 상보체를 코딩하기 위해 하기와 같이 합성하였다.In addition, the primary ("a") and secondary ("b") sequences of the internal peptide preparation (TcbA ii -PT81) were determined and denoted as SEQ ID NO: 23 and SEQ ID NO: 24, respectively. Four pools of synonymous oligonucleotides (“reverse primers”: TH-8, TH-9, TH-10 and TH-11) are similarly designed and the reverse complement of the sequence encoding a portion of the peptide of SEQ ID NO: 23 It was synthesized as follows to code.

상기 프라이머의 세트를 PCR 반응에 사용하여 실시예 6에서 제조한 게놈 포토랍두스 루미네센스 W-14 DNA로부터의 TcbAii코딩 유전자 단편을 증폭하였다. 모든 PCR 반응은 AmpliWax (등록 상표) gems 및 다른 Perkin Elmer 시약 및 프로토콜을 사용하여 "핫 스타트 (Hot Start)" 기술로 실시하였다. 일반적으로, 총 부피 11 ㎕의 MgCl2, dNTP's, 10X GeneAmp (등록 상표) PCR 완충액 II 및 프라이머의 혼합물을 단일 왁스 비드를 포함하는 튜브에 가하였다 [10X GeneAmp (등록 상표) PCR 완충액 II는 100 mM Tris-HCl, pH 8.3; 및 500 mM KCl로 구성됨]. 튜브를 2분 동안 80 ℃로 가열하고 냉각시켰다. 왁스 밀봉의 상부에 10X GeneAmp (등록 상표) PCR 완충액 II, DNA 주형 및 AmpliTaq (등록 상표) DNA 폴리머라제를 포함하는 용액을 가하였다. 왁스 밀봉을 용융시키고 열 순환시켜 성분을 혼합한 후의 최종 반응 조건 (부피 50 ㎕)은 10 mM Tris-HCl, pH 8.3; 50 mM KCl; 2.5 mM MgCl2; 각각 200 μM의 dATP, dCTP, dGTP, dTTP; 1.25 mM 단일 전향 프라이머 풀; 1.25 μM 단일 역방향 프라이머 풀, AmpliTaq (등록 상표) DNA 폴리머라제 1.25 단위 및 주형 DNA 170 ng이었다.This set of primers was used in a PCR reaction to amplify the TcbA ii coding gene fragment from the genomic photolabduum luminescence W-14 DNA prepared in Example 6. All PCR reactions were performed with the "Hot Start" technique using AmpliWax® gems and other Perkin Elmer reagents and protocols. In general, a total volume of 11 μl of MgCl 2 , dNTP's, 10X GeneAmp® PCR Buffer II and a mixture of primers were added to a tube containing a single wax bead [10X GeneAmp® PCR Buffer II was 100 mM Tris-HCl, pH 8.3; And 500 mM KCl. The tube was heated to 80 ° C. for 2 minutes and cooled. On top of the wax seal was added a solution containing 10 × GeneAmp® PCR Buffer II, DNA template and AmpliTaq® DNA polymerase. Final reaction conditions (50 μl in volume) after melting the wax seal and heat cycling to mix the components were 10 mM Tris-HCl, pH 8.3; 50 mM KCl; 2.5 mM MgCl 2 ; 200 μM of dATP, dCTP, dGTP, dTTP; 1.25 mM single prospective primer pool; 1.25 μΜ single reverse primer pool, 1.25 units of AmpliTaq® DNA polymerase and 170 ng of template DNA.

반응물을 실시예 8에서와 같은 열 순환기 중에 놓고 하기 프로그램으로 가동시켰다.The reaction was placed in a thermal cycler as in Example 8 and run with the following program.

온도Temperature 시간time 주기 반복Cycle repeat 94 ℃ 94 ℃ 2 분2 mins 1X1X 94 ℃94 ℃ 15 초15 seconds 30X30X 55 - 65 ℃55-65 ℃ 30 초30 sec 30X30X 72 ℃72 ℃ 1 분1 minute 30X30X 72 ℃72 ℃ 7 분7 mins 1X1X 15 ℃15 ℃ 일정calendar

동의성 프라이머 풀을 사용하여 3 개의 상이한 어닐링 온도 (55, 60, 65 ℃)에서 일련의 증폭을 실시하였다. 65 ℃에서 어닐링시킨 반응물은 아가로스 겔 전기영동 후에 가시적인 증폭 생성물을 갖지 않았다. 60 ℃에서 어닐링시키고 프라이머 TH-5+TH-10을 포함하는 반응물은 2.9 kbp에 대응하는 이동성을 갖는 증폭 생성물을 생성하였다. 상기 조건에서 프라이머 TH-7+TH-10을 사용하면 보다 소량의 2.9 kbp 생성물이 생성되었다. 반응물을 55 ℃에서 어닐링시킬 때, 상기 프라이머쌍은 2.9 kbp 생성물을 보다 많이 생성하였고, 이 생성물은 또한 프라이머쌍 TH-5+TH-8 및 TH-5+TH-11에 의해서도 생성되었다. 추가의 매우 희미한 2.9 kbp 밴드가 프라이머쌍 TH-7 + TH-8, TH-9, TH-10 또는 TH-11로부터의 증폭 생성물을 포함하는 레인에서 발견되었다.A series of amplifications were performed at three different annealing temperatures (55, 60, 65 ° C.) using synonymous primer pools. The reaction annealed at 65 ° C. had no visible amplification product after agarose gel electrophoresis. The reaction annealed at 60 ° C. and comprising primer TH-5 + TH-10 produced an amplification product with mobility corresponding to 2.9 kbp. Use of primer TH-7 + TH-10 under these conditions yielded a smaller amount of 2.9 kbp product. When the reaction was annealed at 55 ° C., the primer pairs produced more 2.9 kbp product, which was also produced by primer pairs TH-5 + TH-8 and TH-5 + TH-11. Additional very faint 2.9 kbp bands were found in the lanes containing amplification products from primer pairs TH-7 + TH-8, TH-9, TH-10 or TH-11.

클로닝 및 DNA 서열 결정을 위한 충분한 PCR 증폭 생성물을 얻기 위해서 프라이머 TH-5+TH-10를 사용하여 10 개의 별개의 PCR 반응을 준비하고, 55 ℃의 어닐링 온도에서 상기 조건을 사용하여 실시하였다. 모든 반응물을 모아서 상기한 바와 같이 아가로스 겔로부터 Qiaex 추출에 의해 2.9 kbp 생성물을 정제하였다.Ten separate PCR reactions were prepared using primers TH-5 + TH-10 to obtain sufficient PCR amplification products for cloning and DNA sequencing and run using the above conditions at annealing temperatures of 55 ° C. All reactions were pooled and the 2.9 kbp product was purified by Qiaex extraction from agarose gel as described above.

TcbAii내부 펩티드에 대해 결정한 또다른 서열을 서열 21 및 서열 22로 표시하였다. 상기한 바와 같이, 이 펩티드의 아미노산 서열의 일부를 코딩하는 서열의 역방향 상보체에 대응하도록 동의성 올리고뉴클레오티드 (역방향 프라이머 TH-17 및 TH-18)를 제조하였다.Another sequence determined for the TcbA ii internal peptide is shown in SEQ ID NO: 21 and SEQ ID NO: 22. As described above, synonymous oligonucleotides (reverse primers TH-17 and TH-18) were prepared to correspond to the reverse complement of the sequence encoding a portion of the amino acid sequence of this peptide.

주형으로서 포토랍두스 루미네센스 W-14 DNA를 사용하고 5'-(전향) 프라이머로서 프라이머 TH-4, TH-5, TH-6 또는 TH-7을 사용한 증폭 실험에 동의성 올리고뉴클레오티드 TH-18 및 TH-17을 사용하였다. 이들 반응은 각각 약 4 kbp 및 4.5 kbp의 생성물을 증폭시켰다. 이들 DNA를 아가로스 겔로부터 나일론 멤브레인에 전사하여 TH-5+TH-10 프라이머 쌍에 의해 증폭된 2.9 kbp 생성물로부터 제조한32P-표지화된 프로브 (상기한 바와 같음)와 하이브리다이제이션시켰다. 4 kbp 및 4.5 kbp 증폭 생성물은 모두 2.9 kbp 프로브와 강하게 하이브리다이제이션하였다. 이러한 결과를 사용하여 도 3에 도시한 TcbAii내부 펩티드 서열을 배열한 지도를 제작하였다. 프라이머들간의 대략적인 거리는 도 3의 뉴클레오티드에 나타나 있다.Oligonucleotides TH- synonymous for amplification experiments using photolapux luminescence W-14 DNA as template and primers TH-4, TH-5, TH-6 or TH-7 as 5'- (forward) primers 18 and TH-17 were used. These reactions amplified products of about 4 kbp and 4.5 kbp, respectively. These DNAs were transcribed from agarose gels to nylon membranes and hybridized with 32 P-labeled probes (as described above) prepared from a 2.9 kbp product amplified by TH-5 + TH-10 primer pairs. Both 4 kbp and 4.5 kbp amplification products were strongly hybridized with the 2.9 kbp probe. Using these results, a map of the TcbA ii internal peptide sequences shown in FIG. 3 was prepared. Approximate distances between the primers are shown in nucleotides of FIG. 3.

2.9 kbp TcbAii코딩 단편의 DNA 서열DNA sequence of a 2.9 kbp TcbA ii coding fragment

상기에서 제조된 정제 2.9 kbp 단편 약 200 ng을 에탄올을 사용하여 침전시키고 물 17 ㎖에 용해시켰다. 이 용액의 반을 프라이머로서의 TH-5 풀 25 pmol과 함께 서열화 주형으로서 사용하고, 나머지 반은 TH-10 프라이밍을 위한 주형으로서 사용하였다. 서열화 반응은 실시예 8에 나타낸 바와 같이 실시하였다. TH-10 프라이머 풀을 사용한 경우에는 신뢰할 수 있는 서열이 생성되지 않았지만, TH-5 프라이머 풀을 사용한 반응은 아래와 같은 서열을 생성시켰다.About 200 ng of the purified 2.9 kbp fragment prepared above was precipitated using ethanol and dissolved in 17 ml of water. Half of this solution was used as sequencing template with 25 pmol of TH-5 pool as primer and the other half as template for TH-10 priming. Sequencing reactions were carried out as shown in Example 8. When the TH-10 primer pool was used, no reliable sequence was generated, but the reaction using the TH-5 primer pool produced the following sequence.

상기 서열을 기초로, 서열화 프라이머 (TH-21, 5'-CCGGGCGACGTTTATCTAGG-3')를 역방향 상보체 염기 120-139로 고안하여 겔-정제된 2.9 kbp TcbAii코딩 PCR 단편의 5' 말단 (즉, TH-5 말단) 쪽으로 중합을 개시하였다. 결정된 서열은 아래와 같고, TcbAii(서열 1)의 생화학적으로 결정된 N-말단 펩티드 서열과 비교하였다.Based on this sequence, the sequencing primer (TH-21, 5'-CCGGGCGACGTTTATCTAGG-3 ') was designed with reverse complement bases 120-139 of the 5' end of the gel-purified 2.9 kbp TcbA ii coding PCR fragment (ie Polymerization was initiated towards the TH-5 end). The determined sequence is as follows and compared with the biochemically determined N-terminal peptide sequence of TcbA ii (SEQ ID NO: 1).

TcbAii2.9 kbp PCR 단편 서열 확인TcbA ii 2.9 kbp PCR Fragment Sequence Identification

(밑줄그은 아미노산 = 동의성 올리고뉴클레오티드에 의해 코딩됨)(Underlined amino acid = encoded by synonymous oligonucleotide)

유도된 아미노산 서열과 생화학적으로 결정된 서열과의 상동성으로부터 2.9 kbp PCR 단편이 TcbA 코딩 영역을 나타낸다는 것을 명백하게 알 수 있다. 이어서, 이 2.9 kbp 단편을 혼성 프로브로서 사용하여 TcbAii코딩 유전자를 포함하는 코스미드에 대해 실시예 8에서 제조된 포토랍두스 W-14 게놈 라이브러리를 스크리닝하였다.It is clear from the homology of the derived amino acid sequence with the biochemically determined sequence that the 2.9 kbp PCR fragment represents the TcbA coding region. This 2.9 kbp fragment was then used to screen the Photorabdus W-14 genomic library prepared in Example 8 for cosmids containing the TcbA ii coding gene.

포토랍두스 코스미드 라이브러리의 스크리닝Screening of Photorapdus Cosmid Library

2.9 kb 겔 정제된 PCR 단편을 실시예 8에서 기술한 바와 같이 뵈링거 만하임 High Prime 표지화 키트를 사용하여32P로 표지화하였다. 코스미드 라이브러리로부터 약 800 개의 콜로니의 잔류물을 포함하는 필터를 실시예 8에서 상기한 바와 같이 스크리닝하고, 양성 클론을 단리 콜로니를 위해 스트리킹하고 재스크리닝하였다. 3 개의 클론 (8A11, 25G8 및 26D1)가 수 회의 스크리닝 및 특성화 단계를 통하여 양성 결과를 보였다. TcbAii특이 프로브는 실시예 8에서 확인된, tcaB 및 tcaC 유전자를 포함하는 4 개의 코스미드 중 어느 것과도 하이브리다이제이션하지 않았다. 코스미드 8A11, 25G8 및 26D1으로부터의 DNA를 제한 효소 Bgl II, EcoR I 또는 Hind III (단독으로 또는 서로 혼합됨)로 분해하고, 단편을 아가로스 겔 상에서 분리하고, 실시예 8에서 기술한 바와 같이 나일론 멤브레인으로 옮겼다. 멤브레인을 4.5 kbp 단편 (포토랍두스 게놈 DNA를 프라이머 TH-5+TH-17로 증폭하여 생성됨)으로부터 제조된32P-표지화된 프로브와 하이브리다이제이션시켰다. 코스미드 DNA 8A11 및 26D1로부터 생성된 패턴은 동일한 멤브레인 상에 유사하게 절단된 게놈 DNA로 생성된 것과 동일하였다. 코스미드 8A11 및 26D1은 게놈 TcbAii코딩 로커스를 정확하게 나타낸다는 결론을 얻었다. 그러나, 코스미드 25G8은 게놈 DNA 보다 약간 더 큰 하나의 Bgl II 단편을 갖는다. 이것은 벡터 내에 존재하는 삽입체로 인한 것일 수 있다.2.9 kb gel Purified PCR fragments were labeled with 32 P using the Boehringer Mannheim High Prime labeling kit as described in Example 8. A filter comprising residues of about 800 colonies from the cosmid library was screened as described above in Example 8, and positive clones were streaked and rescreened for isolation colonies. Three clones (8A11, 25G8 and 26D1) showed positive results through several screening and characterization steps. The TcbA ii specific probe did not hybridize with any of the four cosmids containing the tcaB and tcaC genes identified in Example 8. DNA from cosmids 8A11, 25G8 and 26D1 was digested with restriction enzymes Bgl II, EcoR I or Hind III (alone or mixed with each other), fragments were separated on agarose gels and as described in Example 8 Transferred to nylon membrane. Membranes were hybridized with 32 P-labeled probes prepared from 4.5 kbp fragments (generated by amplifying photolapux genomic DNA with primer TH-5 + TH-17). The pattern generated from cosmid DNA 8A11 and 26D1 was identical to that generated from genomic DNA similarly cleaved on the same membrane. It was concluded that cosmids 8A11 and 26D1 accurately represent the genomic TcbA ii coding locus. However, cosmid 25G8 has one Bgl II fragment that is slightly larger than genomic DNA. This may be due to the insert present in the vector.

tcbA 코딩 유전자의 DNA 서열DNA sequence of the tcbA coding gene

코스미드 26D1의 멤브레인 하이브리다이제이션 분석은 4.5 kbp 프로브가 하나의 큰 EcoR I 단편 (9 kbp보다 큼)에 하이브리다이제이션한다는 것을 보여주었다. 이 단편을 겔 정제하여 실시예 8에서 기술한 바와 같이 pBC KS(+)의 EcoR I 부위에 라이게이션시켜 플라스미드 pBC-S1/R1을 생성시켰다. 이 플라스미드의 삽입 DNA의 부분 DNA 서열을 실시예 8에서 기술한 과정을 사용하여 인접 벡터 서열로부터 "프라이머 워킹 (primer walking)"에 의해 결정하였다. 미리 결정한 서열로부터 고안된 새로운 올리고뉴클레오티드를 신장시켜 다른 서열을 생성시켰다. 다른 방법으로 확인된 tcbA 유전자의 결정된 DNA 서열 (실시예 12에 기술될 바와 같이 서열 11로 표시됨)과 비교시에 완전한 상동성이 뉴클레오티드 1-272, 319-826, 2578-3036 및 3068-3540 (총 염기 1712)에서 발견되었다. 두 개의 방법을 사용하여 TcbAii펩티드를 코딩하는 DNA 단편을 확인할 수 있다는 결론을 얻었다.Membrane hybridization analysis of cosmid 26D1 showed that the 4.5 kbp probe hybridized to one large EcoR I fragment (greater than 9 kbp). This fragment was gel purified and ligated to the EcoR I site of pBC KS (+) as described in Example 8 to generate plasmid pBC-S1 / R1. The partial DNA sequence of the insert DNA of this plasmid was determined by "primer walking" from adjacent vector sequences using the procedure described in Example 8. New oligonucleotides designed from predetermined sequences were stretched to generate other sequences. Complete homology when compared to the determined DNA sequence of the tcbA gene (designated as SEQ ID NO: 11 as will be described in Example 12) identified by other methods is shown in nucleotides 1-272, 319-826, 2578-3036 and 3068-3540 ( Total base 1712). Two methods were used to determine the DNA fragment encoding the TcbA ii peptide.

tcbA 유전자의 유도된 아미노산 서열의 분석Analysis of Derived Amino Acid Sequences of the tcbA Gene

서열 11로 확인된 DNA 단편의 서열은 유도된 아미노산 서열이 서열 12로 표시된 단백질을 코딩한다. 몇 개의 특징을 통하여 TcbAii단백질을 코딩하는 유전자의 정체를 확인할 수 있다. TcbAiiN-말단 펩티드 (서열 1; Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala)는 아미노산 88-100으로서 코딩된다. TcbAii내부 펩티드 TcbAii-PT81(a) (서열 23)는 아미노산 1065-1077로서 코딩되고 TcbAii-PT81(b) (서열 24)는 아미노산 1571-1592로서 코딩된다. 또한, 내부 펩티드 TcbAii-PT56 (서열 22)는 아미노산 1474-1488로서 코딩되고 내부 펩티드 TcbAii-103 (서열 21)은 아미노산 1614-1639로서 코딩된다. 이 유전자는 포토랍두스 루미네센스 균주 W-14의 살충 단백질 제제로부터 단리된 TcbAii펩티드를 코딩하는 진정한 클론임이 분명하다.The sequence of the DNA fragment identified in SEQ ID NO: 11 encodes the protein in which the derived amino acid sequence is represented by SEQ ID NO: 12. Several features confirm the identity of the gene encoding the TcbA ii protein. TcbA ii N-terminal peptide (SEQ ID NO: 1; Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala) is encoded as amino acids 88-100. TcbA ii internal peptide TcbA ii -PT81 (a) (SEQ ID NO: 23) is encoded as amino acids 1065-1077 and TcbA ii -PT81 (b) (SEQ ID NO: 24) is encoded as amino acids 1571-1592. In addition, the internal peptide TcbA ii- PT56 (SEQ ID NO: 22) is encoded as amino acids 1474-1488 and the internal peptide TcbA ii- 103 (SEQ ID NO: 21) is encoded as amino acids 1614-1639. It is evident that this gene is a true clone that encodes a TcbA ii peptide isolated from the pesticidal protein preparation of photolapux luminescence strain W-14.

펩티드 TcbAii로서 단리된 단백질은 보다 긴 펩티드의 분해로부터 유도된다. 이에 대한 증거는 TcbAiiN-말단 펩티드 (서열 1)를 코딩하는 뉴클레오티드가 보다 긴 개방 해독 프레임 (서열 11)의 261 개의 염기 (87 개의 N-말단-부근 아미노산을 코딩함) 뒤에 온다는 사실에 의해 제공된다. 이 해독 프레임은 큰 펩티드 TcbA의 N-말단 서열에 대응하고 서열 16으로 표시된 아미노산 서열 Met Gln Asn Ser Leu을 코딩하는 뉴클레오티드로 시작한다. TcbA는 TcbAii의 전구체 단백질인 것으로 생각된다.Proteins isolated as peptide TcbA ii are derived from degradation of longer peptides. Evidence for this is due to the fact that nucleotides encoding the TcbA ii N-terminal peptide (SEQ ID NO: 1) are followed by 261 bases (coding 87 N-terminal-near amino acids) in a longer open reading frame (SEQ ID NO: 11). Is provided. This translation frame begins with the nucleotides corresponding to the N-terminal sequence of the large peptide TcbA and encoding the amino acid sequence Met Gln Asn Ser Leu represented by SEQ ID NO: 16. TcbA is thought to be the precursor protein of TcbA ii .

tcbA, tcaB 및 tcaC 유전자의 관계Relationship between the tcbA, tcaB and tcaC genes

tcbB 및 tcaC 유전자는 밀접하게 연관되어 있고 하나의 mRNA로서 전사될 수 있다 (실시예 8). tcbA 유전자는, 각각의 게놈 라이브러리가 확인된 상이한 코스미드를 스크리닝하기 때문에 tcaB 및 tcaC 클러스터를 포함하는 것과 분명히 중복되지 않는 코스미드 상에 존재한다. 그러나, tcaB 및 tcaC 유전자와 tcbA 유전자에 의해 코딩되는 아미노산 서열을 비교하면 실질적인 정도의 상동성이 존재함을 알 수 있다. 아미노산 보존 (Protein Alignment Mode of MacVector (등록 상표) 서열 분석 소프트웨어, scoring matrix pam250, hash value = 2; 미국 켈리포니아주 켐벨 소재 Oxford Molecular Group)은 도 4에 도시하였다. 도 4에서 각 패널의 스코어 라인에서 상부 캐럿 (^)은 상동성 또는 보존적 아미노산 변화를 나타내고, 하부 캐럿 (v)은 비상동성을 나타낸다.tcbB and tcaC genes are closely related and can be transcribed as one mRNA (Example 8). The tcbA gene is present on cosmids that do not clearly overlap with those containing tcaB and tcaC clusters because each genomic library screens for identified different cosmids. However, comparing the amino acid sequences encoded by the tcaB and tcaC genes with the tcbA gene, it can be seen that there is a substantial degree of homology. Amino acid conservation (Protein Alignment Mode of MacVector® sequencing software, scoring matrix pam250, hash value = 2; Oxford Molecular Group, Campbell, Calif.) Is shown in FIG. 4. In FIG. 4 the upper caret (^) in the score line of each panel represents homologous or conservative amino acid changes, and the lower caret (v) represents nonhomologous.

이 분석은 TcbA 펩티드 잔기 1739 내지 1894의 아미노산 서열이 TcaBi펩티드의 아미노산 441 내지 603 (TcaB의 총 627 아미노산 중 162 개; 서열 28)과 상동성이 매우 높다. 또한, TcbA 아미노산 1932 내지 2459의 서열은 펩티드 TcaBii의 아미노산 12 내지 531 (총 562 개의 아미노산 중 520 개; 서열 30)과 상동성이 매우 높다. TcbA 펩티드 (서열 12)가 2505 개의 아미노산을 포함한다는 것을 고려할 때, 그의 C-말단부 근처에서 총 684 개의 아미노산 (27 %)이 TcaBi또는 TcaBii펩티드에 상동성이고, 이 상동부는 추정 TcaB 전구단백질 (서열 26)의 배열에 직선상으로 배열된다. TcbA 상동부 내의 상당한 갭은 TcaB 전구단백질의 TcaBi와 TcaBii부분 사이의 연결부에 대응한다. 분명한 것은, TcbA 및 TcaB 유전자 생성물은 진화상 관련되어 있고, 이것은 이들이 포토랍두스에서 몇몇의 공통적인 기능(들)을 공유한다는 것을 시사한다.This analysis shows that the amino acid sequences of TcbA peptide residues 1739-1894 are highly homologous to amino acids 441-603 of the TcaB i peptide (162 of 627 amino acids in total of TcaB; SEQ ID NO: 28). In addition, the sequences of TcbA amino acids 1932 to 2459 are highly homologous to amino acids 12 to 531 (520 of a total of 562 amino acids; SEQ ID NO: 30) of peptide TcaB ii . Considering that the TcbA peptide (SEQ ID NO: 12) contains 2505 amino acids, near its C-terminus, a total of 684 amino acids (27%) are homologous to the TcaB i or TcaB ii peptide, and this homology is the putative TcaB proprotein. (Linear 26) is arranged in a straight line. A significant gap in the TcbA homolog corresponds to the junction between the TcaB i and TcaB ii portions of the TcaB proprotein. Obviously, the TcbA and TcaB gene products are evolutionarily related, suggesting that they share some common function (s) in Photorapdus.

〈실시예 10〉<Example 10>

포토랍두스 브로쓰 (broth)에서 아연-메탈로프로테아제의 특성화; 프로테아제 억제, 분류 및 정제Characterization of zinc-metalloprotease in photolapus broth; Protease Inhibition, Classification and Purification

프로테아제 억제 및 분류 분석: 프로테아제 분석은 기질로서 물에 용해시킨 FITC-카제인을 사용하여 실시하였다 (최종 분석 농도 0.08 %). 적합한 완충액 중에서 포토랍두스 브로쓰 25 ㎕ (총 반응 부피 150 ㎕)로 25 ℃에서 1 시간 동안 단백질 분해 반응을 실시하였다. 또한, 시료를 디티오트레이톨의 존재 또는 부재 하에 분석하였다. 배양한 후, 동량의 12 % 트리클로로아세트산을 가하여 분해되지 않은 단백질을 침전시켰다. 0.5 시간 동안 침전시키고 원심분리한 후, 상등액 100 ㎕를 96웰 미세적정 플레이트 내에 넣고 동량의 4N NaOH를 가하여 용액의 pH를 조절하였다. 이어서, 각각 485 및 538 ㎚의 여기 및 방출 파장에서 Fluoroskan II 형광 플레이트 판독기를 사용하여 단백질 분해를 정량하였다. 프로테아제 활성을 pH 5.0 - 10.0에 걸쳐서 0.5 단위로 시험하였다. 하기 완충액을 최종 농도 50 mM에서 사용하였다: 아세트산나트륨 (pH 5.0-6.5), Tris-HCl (pH 7.0-8.0), 및 bis-Tris 프로판 (pH 8.5-10.0). 관찰된 프로테아제(들)의 종류를 확인하기 위해서, 조 브로쓰를 상이한 프로테아제 억제제 (최종 농도 0.5 ㎍/㎕)로 처리한 후 상기 기질을 사용하여 pH 8.0에서 프로테아제 활성을 조사하였다. 사용된 프로테아제 억제제로는 E-64 (L-트랜스-에폭시사키닐류실아미도[4-,-구아니디노]-부탄),3,4-디클로로이소쿠마린, 류펩틴, 펩스타틴, 아마스타틴, 에틸렌디아민테트라아세트산 (EDTA) 및 1,10-페난트롤린을 들 수 있다.Protease Inhibition and Classification Assays: Protease assays were performed using FITC-casein dissolved in water as substrate (final assay concentration 0.08%). Proteolytic reactions were carried out at 25 ° C. for 1 hour with 25 μl of Photorabdus broth (150 μl total reaction volume) in a suitable buffer. Samples were also analyzed in the presence or absence of dithiothreitol. After incubation, an equivalent amount of 12% trichloroacetic acid was added to precipitate undigested protein. After precipitation for 0.5 h and centrifugation, 100 μl of the supernatant was placed in a 96-well microtiter plate and the same amount of 4N NaOH was added to adjust the pH of the solution. Proteolysis was then quantified using a Fluoroskan II fluorescent plate reader at excitation and emission wavelengths of 485 and 538 nm, respectively. Protease activity was tested in 0.5 units over pH 5.0-10.0. The following buffer was used at a final concentration of 50 mM: sodium acetate (pH 5.0-6.5), Tris-HCl (pH 7.0-8.0), and bis-Tris propane (pH 8.5-10.0). To confirm the type of protease (s) observed, the crude broth was treated with different protease inhibitors (final concentration 0.5 μg / μl) followed by protease activity at pH 8.0 using the substrate. Protease inhibitors used include E-64 (L-trans-epoxysakinylsilamido [4-,-guanidino] -butane), 3,4-dichloroisocoumarin, leupeptin, pepstatin, amastatin, Ethylenediaminetetraacetic acid (EDTA) and 1,10-phenanthroline.

특정 pH 범위에 걸쳐 실시한 프로테아제 분석은 pH 약 8.0에서 최대 활성을 보이는 프로테아제(들)이 존재한다는 것을 보여주었다 (표 17). DTT의 첨가는 프로테아제 활성에 아무런 영향을 주지 않았다. 이어서, 조 브로쓰를 상이한 프로테아제 억제제로 처리하였다 (표 18). 상기한 억제제로 조 브로쓰를 처리하면 1,10-페난트롤린은 최종 농도 50 ㎍으로 첨가했을 경우 2 ㎎/㎖의 조 브로쓰 용액 100 ㎕에서 IC50= 5 ㎍으로서 모든 프로테아제 활성을 완전히 억제한다는 것을 알 수 있었다. 이들 데이타는 포토랍두스 브로쓰에서 발견된 대부분의 풍부한 프로테아제(들)이 아연-메탈로프로테아제 부류의 효소라는 것을 나타낸다.Protease analysis conducted over a specific pH range showed that there was a protease (s) showing maximum activity at pH about 8.0 (Table 17). The addition of DTT had no effect on protease activity. The crude broth was then treated with different protease inhibitors (Table 18). Treatment of crude broth with the above inhibitors completely inhibited all protease activity as IC 50 = 5 μg in 100 μl of 2 mg / ml crude broth solution when 50 μg final concentration was added. I could see that. These data indicate that most of the abundant protease (s) found in photolapus broth are enzymes of the zinc-metalloprotease class.

포토랍두스 루미네센스 (균주 W-14)의 1일 생성에서 발견된 프로테아제 활성에 대한 pH의 효과Effect of pH on the Protease Activity Found in the Daily Production of Photolapux Luminesense (Strain W-14) pHpH 형광 단위a Fluorescent unit a 백분율 활성b Percentage active b 5.05.0 3013±783013 ± 78 1717 5.55.5 7994±4487994 ± 448 4545 6.06.0 12965±48312965 ± 483 7474 6.56.5 14390±129114390 ± 1291 8282 7.07.0 14386±128714386 ± 1287 8282 7.57.5 14135±19814135 ± 198 8080 8.08.0 17582±83117582 ± 831 100100 8.58.5 16183±95316183 ± 953 9292 9.09.0 16795±76016795 ± 760 9696 9.59.5 16279±102216279 ± 1022 9393 10.010.0 15225±21015225 ± 210 8787 a 형광 단위 = 형광 단위 (최대 = 약 28,000; 배경 = 약 2200)b pH 8.0에서의 최대치에 대한 백분율 활성a fluorescence unit = fluorescence unit (maximum = about 28,000; background = about 2200) b percentage activity against the maximum at pH 8.0

포토랍두스 루미네센스 (균주 W-14)의 1일 생성에서 발견된 pH 8에서의 프로테아제 활성에 대한 상이한 프로테아제 억제제의 효과Effect of Different Protease Inhibitors on Protease Activity at pH 8 Found in the Daily Production of Photolapux Luminesense (Strain W-14) 억제제Inhibitor 보정된 형광 단위a Calibrated fluorescence unit a 백분율 억제b Percentage suppression b 대조군Control 1305313053 00 E-64E-64 1425914259 00 1,10 페난트롤린c 1,10 phenanthroline c 1515 9999 3,4 디클로로이소쿠마린d 3,4 dichloroisocoumarin d 79567956 3939 류펩틴Leupeptin 1307413074 00 펩스타틴c Pepstatin c 1344113441 00 아마스타틴Amastatin 1247412474 44 DMSO 대조군DMSO control 1200512005 88 메탄올 대조군Methanol control 1212512125 77 a 보정된 형광 단위 = 형광 단위 - 배경 (2200 형광 단위)b pH 8.0에서의 프로테아제 활성에 대한 백분율 억제c 억제제를 메탄올에 용해시킴.d 억제제를 DMSO에 용해시킴.a Corrected fluorescence unit = fluorescence unit-background (2200 fluorescence units) b Percent inhibition of protease activity at pH 8.0 c Dissolve the inhibitor in methanol. d Dissolve the inhibitor in DMSO.

투석된 10 내지 80 % 암모늄 술페이트 펠렛을 포토랍두스 독소에 대해 실시예 5에서 기술한 바와 같이, 50 mM Na2PO4, pH 7.0에서 평형화된 Q 세파로스 컬럼에 가하여 아연-메탈로프로테아제를 단리하였다. 강하게 세척한 후, 0 내지 0.5 M NaCl 구배를 사용하여 독소 단백질을 용출시켰다. 대부분의 생물학적 활성 및 단백질을 0.15 내지 0.45 M NaCl로부터 용출시켰다. 그러나, 대부분의 단백질 분해 활성이 0.25 - 0.35 M NaCl 분획에 존재하고 소량의 활성이 0.15 - 0.25 M NaCl 분획에 존재하는 것이 관찰되었다. 0.25 - 0.35 M NaCl 분획에 대한 SDS-PAGE 분석은 약 60 kDa의 펩티드 주밴드를 보였다. 0.15 - 0.25 M NaCl 분획은 유사한 60 kDa 밴드를 포함하였으나 보다 낮은 상대적인 단백질 농도를 가졌다. 이어서, 이 분획을 수퍼로스 12 HR 16/50컬럼을 사용하여 겔 여과함으로써 SDS-PAGE 분석에 의한 우세한 (총 염색된 단백질의 90 % 초과) 58.5 kDa 밴드를 포함하는, 57.5 kDa에서 이동하는 주피크를 얻었다. 상술한 바와 같은 각종 프로테아제 억제제를 사용한 상기 분획에 대한 추가의 분석을 통하여 프로테아제가 아연-메탈로프로테아제임을 결정하였다. 발효 1일째에 포토랍두스 브로쓰에 존재하는 거의 모든 프로테아제 활성은 약 58 kDa 아연-메탈로프로테아제에 대응하였다.The dialyzed 10-80% ammonium sulphate pellets were added to a Q Sepharose column equilibrated at 50 mM Na 2 PO 4 , pH 7.0 to describe zinc-metalloprotease as described in Example 5 for Photolabduus toxin. Isolated. After a strong wash, the toxin protein was eluted using a 0-0.5 M NaCl gradient. Most biological activity and proteins were eluted from 0.15 to 0.45 M NaCl. However, it was observed that most proteolytic activity is present in the 0.25-0.35 M NaCl fraction and a small amount of activity is present in the 0.15-0.25 M NaCl fraction. SDS-PAGE analysis of the 0.25-0.35 M NaCl fraction showed a peptide main band of about 60 kDa. The 0.15-0.25 M NaCl fraction included a similar 60 kDa band but had a lower relative protein concentration. This fraction was then subjected to gel filtration using a SuperRoose 12 HR 16/50 column, with the main peak moving at 57.5 kDa, including the 58.5 kDa band predominantly by SDS-PAGE analysis (greater than 90% of total stained protein). Got. Further analysis of the fraction using various protease inhibitors as described above determined that the protease was zinc-metalloprotease. Almost all protease activity present in photolapus broth at day 1 of fermentation corresponded to about 58 kDa zinc-metalloprotease.

아연-메탈로프로테아제(들)의 제2 단리에서 3 일 동안 성장한 W-14 포토랍두스 브로쓰를 사용하고, 문헌 [Schmidt, T.M., Bleakley, B. and Nealson, K.M. 1988]에 기재된 바와 같이 젤라틴이 결합된 소듐 도데실 술페이트 폴리아크릴아미드 겔 전기영동 (SDS-PAGE)을 사용하여 프로테아제 활성을 가시화하였다. SDS 전개 겔 (5.5 × 8 ㎝)은, 물 중에 용해시에 최종 농도 0.1 % 젤라틴 (Biorad EIA 그레이드 시약; 미국 캘리포니아주 리치몬도 소재)이 혼입되는 12.5 % 폴리아크릴아미드 (아크릴아미드/비스-아크릴아미드의 40 % 원액; 미국 미주리주 세인트루이스 소재의 Sigma Chemical Co.)로 제조하였다. SDS-스태킹 겔 (1.0 × 8 ㎝)를 0.1 % 젤라틴이 결합된 5 % 폴리아크릴아미드를 사용하여 제조하였다. 일반적으로, 시험 단백질 2.5 ㎍을 디티오트레이톨 (DTT)이 없는 SDS-PAGE 로딩 완충액 0.03 ㎖ 중에 희석시키고 겔 상에 로딩하였다. 0 ℃ 및 8 ㎃에서 SDS 전개 완충액 (Laemmli, U.K. 1970. Nature 227, 680) 중에서 단백질을 전기영동시켰다. 전기영동이 종결된 후, 겔을 2.5 % (v/v) 트리톤 (Triton) X-100 중에서 2 시간 동안 세척하였다. 이어서, 겔을 0.1 M 글리신 (pH 8.0) 중에서 37 ℃에서 1 시간 동안 배양하였다. 배양한 후, 겔을 고정시키고 메탄올-아세트산-물 (30:10:60, v/v/v; Sigma Chemical Co.) 중의 0.1 % 아미도 블랙으로 밤새 염색하였다. 단백질 분해 및 후속한 결합 젤라틴의 확산에 의해 아미도 블랙 염색된 어두운 배경에 대하여 밝은 영역으로서 단백질 분해 활성이 가시화되었다. 58, 41 및 38 kDa에서 단백질 분해 활성에 의해 생성된 3 개 이상의 특이 밴드가 관찰되었다.Using W-14 photolabdus broth grown for 3 days in the second isolation of zinc-metalloprotease (s), see Schmidt, T.M., Bleakley, B. and Nealson, K.M. Gelatin-bound sodium dodecyl sulfate polyacrylamide gel electrophoresis (SDS-PAGE) was used to visualize protease activity as described in 1988]. SDS developing gel (5.5 × 8 cm) is a 12.5% polyacrylamide (acrylamide / bis-acrylamide) that incorporates a final concentration of 0.1% gelatin (Biorad EIA grade reagent; Richmond, CA) upon dissolution in water. 40% stock solution of Sigma Chemical Co., St. Louis, Missouri, USA. SDS-stacking gels (1.0 × 8 cm) were prepared using 5% polyacrylamide with 0.1% gelatin bound. In general, 2.5 μg of test protein was diluted in 0.03 mL of SDS-PAGE loading buffer without dithiothreitol (DTT) and loaded onto gel. Proteins were electrophoresed in SDS development buffer (Laemmli, U.K. 1970. Nature 227, 680) at 0 ° C. and 8 Hz. After the electrophoresis was terminated, the gel was washed for 2 hours in 2.5% (v / v) Triton X-100. The gel was then incubated for 1 hour at 37 ° C. in 0.1 M glycine, pH 8.0. After incubation, the gels were fixed and stained overnight with 0.1% amido black in methanol-acetic acid-water (30:10:60, v / v / v; Sigma Chemical Co.). Proteolytic activity was visualized as a bright area against dark background stained with Amido black by proteolysis and subsequent diffusion of bound gelatin. At least three specific bands produced by proteolytic activity at 58, 41 and 38 kDa were observed.

기질로서 물에 용해시킨 FITC-카제인을 사용하여 W-14 3일 배양 브로쓰 중에서의 상이한 프로테아제의 활성을 분석하였다 (최종 분석 농도 0.02 %). 단백질 분해 실험은 총 부피 0.15 ㎖로 상이한 단백질 분획을 사용하여 0.1 M Tris-HCl (pH 8.0) 중에서 0 내지 0.5 시간 동안 37 ℃에서 실시하였다. 물에 용해시킨 동일 부피의 12 % 트리클로로아세트산 (TCA)을 가하여 반응을 종결시켰다. 실온에서 0.25 시간 동안 배양한 후, 시료를 10,000 × g에서 0.25 시간 동안 원심분리하고, 분취액 0.10 ㎖를 96-웰 미세적정 플레이트에 넣었다. 이어서, 동일 부피의 2 N 수산화나트륨을 가하여 용액을 중화시킨 후, Fluoroskan II 형광 플레이트 판독기를 사용하여 각각 485 및 538 ㎚의 여기 및 방출 파장으로 정량하였다. 상이한 프로테아제 농도로 FITC-카제인을 사용하여 37 ℃에서 0 내지 10 분 동안 활성을 측정하였다. 활성의 단위는 1000 형광 단위/분을 생성시키는데 필요한 효소의 양으로 임의로 규정하고, 특이 활성은 단위/프로테아제 ㎎으로 규정하였다.The activity of different proteases in the W-14 3 day culture broth was analyzed using FITC-casein dissolved in water as substrate (final assay concentration 0.02%). Proteolysis experiments were performed at 37 ° C. for 0-0.5 h in 0.1 M Tris-HCl (pH 8.0) using different protein fractions with a total volume of 0.15 ml. An equal volume of 12% trichloroacetic acid (TCA) dissolved in water was added to terminate the reaction. After incubation at room temperature for 0.25 hours, the samples were centrifuged at 10,000 x g for 0.25 hours and 0.10 ml aliquots were placed in 96-well microtiter plates. An equal volume of 2 N sodium hydroxide was then added to neutralize the solution, followed by quantification with excitation and emission wavelengths of 485 and 538 nm, respectively, using a Fluoroskan II fluorescent plate reader. Activity was measured at 37 ° C. for 0-10 minutes using FITC-casein at different protease concentrations. Units of activity were optionally defined as the amount of enzyme needed to produce 1000 fluorescent units / min, and specific activity was defined as units / protease mg.

각각 100 % 에탄올 및 물 중에 용해시킨 억제제의 원액과 함께 2 개의 아연-메탈로프로테아제 억제제, 즉 1,10-페난트롤린 및 N-(a-람노피라노실옥시히드록시포스피닐)-Leu-Trp (포스포르아미돈)을 사용하여 억제 연구를 실시하였다. 원액 농도는 1,10-페난트롤린 및 포스포르아미돈에 대해 각각 일반적으로 10 ㎎/㎖ 및 5 ㎎/㎖이었고, 억제제의 최종 농도는 반응당 0.5 내지 1.0 ㎎/㎖이었다. 3일째의 W-14 조 브로쓰를 모든 아연-메탈로프로테아제의 억제제인 1,10-페난트롤린으로 처리하면 모든 프로테아제 활성이 완전히 제거되었고, 써모리신 (thermolysine) 유사 프로테아제의 억제제 [Weaver, L.H., Kester, W.R., and Matthews, B.W. 1977. J. Mol. Biol. 114, 119-132]인 포스포르아미돈으로 처리하면 프로테아제 활성이 약 56 % 감소하였다. 잔여 단백질 분해 활성은 추가의 포스포르아미돈으로 처리하여도 더 감소시킬 수 없을 것이다.Two zinc-metalloprotease inhibitors, 1,10-phenanthroline and N- (a-ramnopyranosyloxyhydroxyphosphinyl) -Leu-Trp, with stock solutions of inhibitors dissolved in 100% ethanol and water, respectively Inhibition studies were conducted using (phosphoramidon). Stock concentrations were generally 10 mg / ml and 5 mg / ml for 1,10-phenanthroline and phosphoramidone, respectively, and the final concentration of inhibitor was 0.5-1.0 mg / ml per reaction. Treatment of W-14 crude broth on day 3 with 1,10-phenanthroline, an inhibitor of all zinc-metalloproteases, completely eliminated all protease activity and inhibited thermosine-like proteases [Weaver, LH , Kester, WR, and Matthews, BW 1977. J. Mol. Biol. 114, 119-132] treated with phosphoramidone reduced protease activity by about 56%. Residual proteolytic activity will not be able to be further reduced with further phosphoramidon treatment.

3일째의 W-14 포토랍두스 브로쓰의 프로테아제를 다음과 같이 정제하였다: Amicon M-12 여과 장치에 부착된 Amicon 나선형 한외여과 카트리지 Type S1Y100을 사용하여 브로쓰 4.0 ℓ를 농축하였다. Amicon M-12 여과 장치에 부착된 Amicon 나선형 한외여과 카트리지 Type S1Y100을 사용하여 크기가 100 kDa 미만인 천연 단백질을 갖는 통과 물질 3.8 ℓ를 0.375 ℓ까지 농축하였다. 잔류 물질은 10 내지 100 kDa 크기의 단백질을 포함하였다. 이 물질을 10 mM 인산나트륨 완충액 (pH 7.0) 중에 평형화시킨 PerSeptive Biosystem (미국 매릴랜드주 프라밍턴 소재) Poros (등록 상표) 50 HQ 강 음이온 교환 충전재로 충전된 Pharmacia HR16/10 컬럼 상에 로딩하였다. 단백질을 5 ㎖/분의 유속으로 컬럼에 로딩한 후 A280= 0.00이 될 때까지 결합하지 않은 단백질을 완충액으로 세척하였다. 이어서, 7.5 ㎖/분의 유속으로 40분 내에 0 내지 1.0 M NaCl의 NaCl 구배를 사용하여 단백질을 용출시켰다. 상기와 같이, 프로테아제 활성에 대해 분획을 분석하고 활성 분획을 모았다. 단백질 분해 활성을 보이는 분획을 50 % (v/v) 10 mM 인산나트륨 완충액 (pH 7.0)으로 희석하고 10 mM 인산나트륨 중에 평형화시킨 Pharmacia HR 10/10 Mono Q 컬럼에 로딩하였다. A280= 0.00이 될 때까지 완충액으로 컬럼을 세척한 후, 2.0 ㎖/분의 유속으로 1 시간 동안 0 내지 0.5 M NaCl의 NaCl 구배를 사용하여 단백질을 용출시켰다. 분획을 프로테아제 활성에 대하여 분석하였다. 포스포르아미돈 감수성 프로테아제 활성은 41/38 kDa 프로테아제에 의한 것으로 (하기 참조) 가장 높은 포스포르아미돈 감수성 프로테아제 활성을 갖는 분획을 모았다. 이 분획은 0.15 - 0.25 M NaCl에서 용출되는 것으로 판명되었다. 포스포르아미돈 불감성 프로테아제 활성, 58 kDa 프로테아제를 주로 포함하는 분획도 모았다. 이 분획은 0.25 - 0.35 M NaCl에서 용출되는 것으로 판명되었다. 이어서, 포스포르아미돈 감수성 프로테아제 분획을 Millipore Ultrafree (등록 상표)-15 원심분리 여과 장치 Biomax-5K NMWL 멤브레인을 사용하여 최종 부피 0.75 ㎖까지 농축하였다. 이 물질을 10 mM 인산나트륨 완충액 (pH 7.0)/0.1 M NaCl 중에 평형화시킨 Pharmacia Sephadex G-50으로 충전된 Pharmacia HR10/30 컬럼 상에 0.5 ㎖/분의 유속으로 로딩하였다. 이어서, 최대 포스포르아미돈 감수성 프로테아제 활성을 갖는 분획을 모아서 Millipore Ultrafree (등록 상표)-15 원심분리 여과 장치 Biomax-50K NMWL 멤브레인을 사용하여 원심분리하였다. 상기와 같은 단백질 분해 활성 분석은 이 물질이 포스포르아미돈 감수성 프로테아제 활성만을 갖는다는 것을 나타내었다. 포스포르아미돈 불감성 프로테아제, 58 kDa 단백질을 모은 후, Millipore Ultrafree (등록 상표)-15 원심분리 여과 장치 Biomax-50K NMWL 멤브레인 중에서 농축하고, Pharmacia Superdex-75 컬럼 상에서 추가로 분리하였다. 이 프로테아제를 포함하는 분획을 모았다.The protease of W-14 Photorapdus Broth on Day 3 was purified as follows: Concentration of 4.0 L broth was carried out using Amicon spiral ultrafiltration cartridge Type S1Y100 attached to Amicon M-12 filtration apparatus. Amicon helical ultrafiltration cartridge Type S1Y100 attached to an Amicon M-12 filtration device was used to concentrate 3.8 L of passage material with natural protein less than 100 kDa to 0.375 L. Residual material included proteins of size 10 to 100 kDa. This material was loaded onto a Pharmacia HR16 / 10 column filled with PerSeptive Biosystem (Pramington, MD) Poros® 50 HQ strong anion exchange filler equilibrated in 10 mM sodium phosphate buffer, pH 7.0. Protein was loaded onto the column at a flow rate of 5 ml / min and the unbound protein was washed with buffer until A 280 = 0.00. The protein was then eluted using a NaCl gradient of 0-1.0 M NaCl within 40 minutes at a flow rate of 7.5 ml / min. As above, fractions were analyzed for protease activity and the active fractions collected. Fractions showing proteolytic activity were diluted in 50% (v / v) 10 mM sodium phosphate buffer (pH 7.0) and loaded onto a Pharmacia HR 10/10 Mono Q column equilibrated in 10 mM sodium phosphate. The column was washed with buffer until A 280 = 0.00, then the protein was eluted using a NaCl gradient of 0-0.5 M NaCl for 1 hour at a flow rate of 2.0 ml / min. Fractions were analyzed for protease activity. Phosphoramidone sensitive protease activity was by 41/38 kDa protease (see below) and fractions with the highest phosphoramidone sensitive protease activity were collected. This fraction was found to elute at 0.15-0.25 M NaCl. Fractions containing predominantly phosphoramidone insensitive protease activity, 58 kDa protease were also collected. This fraction was found to elute at 0.25-0.35 M NaCl. The phosphoramidon sensitive protease fractions were then concentrated to a final volume of 0.75 mL using Millipore Ultrafree®-15 centrifugal filtration apparatus Biomax-5K NMWL membrane. This material was loaded at a flow rate of 0.5 ml / min on a Pharmacia HR10 / 30 column packed with Pharmacia Sephadex G-50 equilibrated in 10 mM sodium phosphate buffer (pH 7.0) /0.1 M NaCl. Fractions with maximum phosphoramidon sensitive protease activity were then collected and centrifuged using Millipore Ultrafree®-15 centrifugal filtration apparatus Biomax-50K NMWL membrane. Such proteolytic activity analysis indicated that this material had only phosphoramidone sensitive protease activity. Phosphoramidon insensitive protease, 58 kDa protein was collected, then concentrated in Millipore Ultrafree ™ -15 centrifugal filtration apparatus Biomax-50K NMWL membrane and further separated on a Pharmacia Superdex-75 column. Fractions containing this protease were collected.

정제된 58 및 41/38 kDa 프로테아제의 분석은 두 종류의 프로테아제가 1,10-페난트롤린으로 완전히 억제되지만, 포스포르아미돈으로는 41/38 kDa 프로테아제만 억제되었음을 보여주었다. 조 브로쓰에 대한 추가의 분석은 1일째의 W-14 프로쓰의 프로테아제 활성이 41/38 kDa 프로테아제에 기인하여 전체 프로테아제 활성의 23 %이고, 3일째의 W-14 브로쓰에서는 44 %까지 증가한다는 것을 보여주었다.Analysis of purified 58 and 41/38 kDa proteases showed that both proteases were completely inhibited with 1,10-phenanthroline but only 41/38 kDa protease was inhibited with phosphoramidone. Further analysis of crude broth showed that the protease activity of W-14 protease at day 1 was 23% of the total protease activity due to 41/38 kDa protease, and increased to 44% at day W-14 broth. Showed that

단백질 순도를 조사하고 아미노 말단 서열을 얻기 위해서 미국 매사추세츠주 나티크 소재의 Integrated Separation Systems에서 시판하는 4 내지 20 % 구배 MiniPlus SepraGels를 사용하여 표준 SDS-PAGE 분석을 실시하였다. 아미노 말단에서 서열화될 단백질을 정제 후에 PVDF 멤브레인 [미국 캘리포니아주 포스터 시티 소재의 Applied Biosystems사의 ProBlott (등록 상표) 멤브레인])에 블로팅하고, 0.1 % 아미도 블랙으로 가시화시키고 절개하여 서열화를 위해 미국 매사추세츠주 캠브리지 소재의 Cambridge Prochem에 보냈다.Standard SDS-PAGE analysis was performed using a 4-20% gradient MiniPlus SepraGels available from Integrated Separation Systems, Natick, Mass., To investigate protein purity and obtain amino terminal sequences. After purification, the protein to be sequenced at the amino terminus is blotted onto a PVDF membrane (ProBlott® membrane from Applied Biosystems, Foster City, Calif.), Visualized with 0.1% amido black and incised to cut and sequenced for Mass. Sent to Cambridge Prochem, Cambridge, USA.

3일된 W-14 브로쓰로부터의 58 (서열 45) 및 41/38 kDa (서열 44) 프로테아제의 추정된 아미노 말단 서열은 각각 DV-GSEKANEKLK (서열 45) 및 DSGDDDKVTNTDIHR (서열 44)이었다.The estimated amino terminal sequences of the 58 (SEQ ID NO: 45) and 41/38 kDa (SEQ ID NO: 44) proteases from the 3 day old W-14 broth were DV-GSEKANEKLK (SEQ ID NO: 45) and DSGDDDKVTNTDIHR (SEQ ID NO: 44), respectively.

41/38 kDa 프로테아제의 서열화는 각각 추가의 아미노산이 단백질 분해에 의해 제거된 몇 개의 아미노 말단을 보여 주었다. 38 및 41 kDa 폴리펩티드에 대한 1차, 2차, 3차 및 4차의 서열 조사는 상기 서열의 추정을 가능하게 하였고 이들 2 개의 프로테아제가 상동성이라는 것을 보여주었다.Sequencing of the 41/38 kDa protease showed several amino termini, each with additional amino acids removed by proteolysis. The primary, secondary, tertiary and fourth sequencing of the 38 and 41 kDa polypeptides allowed the estimation of the sequences and showed that these two proteases were homologous.

〈실시예 11a〉<Example 11a>

TcbA 펩티드 코딩 유전자에 대한 포토랍두스 게놈 라이브러리의 항체를 사용한 스크리닝Screening Using Antibodies from the Photorabdus Genome Library Against TcbA Peptide Coding Gene

상술한 서열화와 동시에 TcbAii펩티드 (서열 1)를 기초로 하여 적합한 프로빙 및 서열화를 실시하였다. 이 서열화는 박테리아 배양 브로쓰를 제조하고 상기 실시예 1 및 2에서 기술한 독소를 정제하여 실시하였다.Concurrent with sequencing described above, appropriate probing and sequencing was performed based on the TcbA ii peptide (SEQ ID NO: 1). This sequencing was performed by preparing bacterial culture broths and purifying the toxins described in Examples 1 and 2 above.

게놈 DNA를 Grace의 곤충 조직 배양 배지에서 성장한 포토랍두스 루미네센스 균주 W-14로부터 단리하였다. 박테리아를 250 ㎖ 삼각 플라스크 중의 배양 배지 5 ㎖ 중에서 28 ℃ 및 250 rpm에서 약 24 시간 동안 성장시켰다. 배양 배지 100 ㎖로부터 박테리아 세포를 5000 × g에서 10 분 동안 펠렛화시켰다. 상등액을 버리고나서, 세포 펠렛을 게놈 DNA 단리에 사용하였다.Genomic DNA was isolated from photolabduum luminescence strain W-14 grown in Grace's insect tissue culture medium. The bacteria were grown for about 24 hours at 28 ° C. and 250 rpm in 5 ml of culture medium in a 250 ml Erlenmeyer flask. Bacteria cells were pelleted at 5000 × g for 10 minutes from 100 ml of culture medium. After discarding the supernatant, cell pellets were used for genomic DNA isolation.

게놈 DNA는 Ausubel의 상기 문헌 섹션 2.4.3에 기술된 CTAB 방법을 변형하여 사용하여 단리하였다. 이어서, "Large Scale CsCl prep of bacterial genomic DNA"라는 제목의 섹션을 단계 6을 통하여 실시하였다. 이 때, 추가의 클로로포름/이소아밀 알콜 (24:1) 추출을 실시한 후 페놀/클로로포름/이소아밀 (25:24:1) 추출 단계 및 최종적으로 클로로포름/이소아밀/알콜 (24:1) 추출을 실시하였다. 0.6 부피의 이소프로판올을 첨가하여 DNA를 침전시켰다. 침전된 DNA를 굽은 유리 막대 끝에 감아서 70 % 에탄올에 잠시 담가 최종적으로 세척하고, TE 완충액 3 ㎖에 용해시켰다.Genomic DNA was isolated using a modified CTAB method described in Ausubel, section 2.4.3, supra. Subsequently, a section entitled “Large Scale CsCl prep of bacterial genomic DNA” was conducted via step 6. At this time, an additional chloroform / isoamyl alcohol (24: 1) extraction is performed followed by a phenol / chloroform / isoamyl (25: 24: 1) extraction step and finally a chloroform / isoamyl / alcohol (24: 1) extraction. Was carried out. DNA was precipitated by adding 0.6 volume of isopropanol. Precipitated DNA was wound around a curved glass rod, briefly soaked in 70% ethanol and finally washed, and dissolved in 3 ml of TE buffer.

280/260 ㎚에서의 광학 밀도에 의해 추정한 DNA 농도는 약 2 ㎎/㎚이었다.The DNA concentration estimated by optical density at 280/260 nm was about 2 mg / nm.

상기 게놈 DNA를 사용하여 라이브러리를 제조하였다. 게놈 DNA 약 50 ㎍을 Sau3 A1으로 부분 분해하였다. 이어서, NaCl 밀도 구배 원심분리를 사용하여 부분 분해 DNA 단편을 크기 분별하였다. 아가로스 겔 전기영동에 의해 측정한 평균 크기가 12 kb 이상인 DNA 단편을 포함하는 분획을 미국 캘리포니아주 라 졸라 소재의 Stratagene사의 플라스미드 BluScript에 라이게이션시키고 E. coli DH5α 또는 DHB10 균주로 형질전환시켰다.The library was prepared using the genomic DNA. About 50 μg of genomic DNA was partially digested with Sau3 A1. Subsequently, partial digested DNA fragments were size fractionated using NaCl density gradient centrifugation. Fractions containing DNA fragments with an average size of at least 12 kb, as determined by agarose gel electrophoresis, were ligated into plasmid BluScript from Stratagene, La Jolla, Calif., And transformed into E. coli DH5α or DHB10 strains.

이와 별도로, 단백질의 정제 분취액을 단백질에 대한 단클론성 항체의 생성을 위해 미국 매디슨 소재의 위스콘신 대학교의 바이오테크놀로지 히브리도마 센터에 보냈다. 이 센터에 보낸 물질은 65 ℃에서 변성된 천연 밴드 1 및 2를 포함하는 HPLC 정제 분획으로, 그 중 20 ㎍을 4 마리의 마우스에게 각각 주사하였다. 안정한 단클론성 항체 생성 히브로도마 세포주를 비면역된 마우스의 비장 세포를 안정한 골수종 세포주와 융합시킨 후 회수하였다. 단클론성 항체를 하이브리도마 세포로부터 회수하였다.Separately, purified aliquots of the protein were sent to the Biotechnology Hybridoma Center of the University of Wisconsin, Madison, USA, for the production of monoclonal antibodies against the protein. The material sent to this center was an HPLC purified fraction containing natural bands 1 and 2 denatured at 65 ° C., of which 20 μg were injected into 4 mice, respectively. Stable monoclonal antibody-producing Hibrooma cell lines were recovered after fusion of splenocytes of non-immunized mice with stable myeloma cell lines. Monoclonal antibodies were recovered from hybridoma cells.

이와 별개로, 천연 아가로스 겔 정제 밴드 1 (실시예 1 참조) 단백질을 뉴질랜드 흰토끼를 면역시키는데 사용하여 폴리클로날 항체를 생성시켰다. 천연 아가로스 겔로부터 밴드를 절개하고 겔 조각을 65 ℃로 가열하여 아가로스를 용융시키고, 그 직후 보조제로 유화시켜 단백질을 제조하였다. 프로인트 (Freund) 완전 보조제를 1차 면역을 위해 사용하고, 프로인트 불완전 보조제를 사용하여 1 달 간격으로 추가로 3 회 주사하였다. 각각의 주사에 대해 단백질 50 내지 100 ㎍을 포함하는 유화 밴드 1 약 0.2 ㎖를 토끼의 등에 다중 피하주사하여 전달하였다. 최종 주사 10 일 후에 혈청을 얻고, 3 주 후에 다시 채혈을 실시하였다. 혈청 보충물을 56 ℃까지 15 분 동안 가열하여 불활성화시킨 후 -20 ℃에서 보관하였다.Separately, native agarose gel purification band 1 (see Example 1) protein was used to immunize New Zealand white rabbits to generate polyclonal antibodies. The band was cut from a natural agarose gel and the gel pieces were heated to 65 ° C. to melt the agarose and immediately emulsify with adjuvants to prepare proteins. Freund's complete adjuvant was used for primary immunization and an additional 3 injections at 1 month intervals with Freund's incomplete adjuvant. About 0.2 ml of an emulsified band 1 containing 50-100 μg of protein for each injection was delivered by multiple subcutaneous injections in the rabbit's back. Serum was obtained 10 days after the last injection and blood was collected again after 3 weeks. Serum supplements were inactivated by heating to 56 ° C. for 15 minutes and then stored at −20 ° C.

이어서, 단클론성 항체 및 폴리클로날 항체를 사용하여 에피토프에 의해 검출될 수 있는 항원의 발현에 대하여 게놈 라이브러리를 스크리닝하였다. 양성 클론은 니트로셀룰로스 필터 콜로니 리프트 상에서 검출되었다. 양성 클론에 대한 면역블롯 분석을 실시하였다.The monoclonal and polyclonal antibodies were then used to screen genomic libraries for expression of antigens that can be detected by epitopes. Positive clones were detected on nitrocellulose filter colony lift. Immunoblot analysis was performed for positive clones.

면역블롯 및 써던 분석에 의해 규명된 클론의 분석을 통하여 4 개의 게놈 영역을 실험적으로 확인하였다.Four genomic regions were experimentally identified through analysis of clones identified by immunoblot and Southern analysis.

제1 영역의 클론에는 TcbAii로 명명된 펩티드를 코딩하는 유전자가 존재하였다. 이 유전자 (TcbA)의 전체 DNA 서열을 얻고 서열 11로서 나타내었다. 이 서열이 서열 1의 내부 서열을 코딩한다는 것의 확인은 서열 11의 개방 해독 프레임에 의해 생성된 추정 아미노산 서열로부터 아미노산 번호 88에서 서열 1이 존재한다는 것에 의해 입증된다. 이것은 서열 11에 의해 생성되는 추정 아미노산 서열인 서열 12를 통하여 확인될 수 있다.In the clone of the first region there was a gene encoding a peptide named TcbA ii . The full DNA sequence of this gene (TcbA) was obtained and shown as SEQ ID NO: 11. Confirmation that this sequence encodes the internal sequence of SEQ ID NO: 1 is evidenced by the presence of SEQ ID NO: 1 at amino acid number 88 from the putative amino acid sequence generated by the open translation frame of SEQ ID NO: 11. This can be confirmed through SEQ ID NO: 12, the putative amino acid sequence produced by SEQ ID NO: 11.

제2 영역의 독소 펩티드는 TcaBi, TcaBii및 TcaC로서 언급한 세그먼트를 포함한다. 폴리클로날 항혈청을 사용하여 라이브러리를 스크리닝한 후에, 모두가 면역블롯 상에서 폴리클로날 항체와 교차 반응하고 또한 써던 블롯 상에서 DNA 상동성을 공유하는 것으로 밝혀진, 상이한 크기의 단백질을 생성하는 몇 개의 클론에 의해 상기 제2 영역의 독소 유전자를 확인하였다. 서열 비교를 통하여 이들은 상기 TcaB 및 TcaC로 명명된 유전자 복합체에 속한다는 것을 알았다.Toxin peptides in the second region include the segments referred to as TcaB i , TcaB ii and TcaC. After screening the library using polyclonal antiserum, several clones that produce proteins of different sizes were found to cross-react with polyclonal antibodies on the immunoblot and also share DNA homology on the southern blot. The toxin gene of the said 2nd region was confirmed by this. Sequence comparisons revealed that they belonged to the gene complexes named TcaB and TcaC.

2 개의 다른 영역의 항체 독소 클론을 폴리클로날 스크린에서 단리하였다. 이들 영역은 폴리클로날 항체와 교차반응하는 단백질을 생성하고, 써던 블로팅에 의해 측정한 영역과 DNA 상동성을 공유하였다. 따라서, 포토랍두스 루미네센스 세포외 단백질 유전자는 진화상 관련된 일군의 유전지를 나타내는 것으로 보인다.Two different regions of antibody toxin clones were isolated on polyclonal screens. These regions produced proteins that cross-react with polyclonal antibodies and shared DNA homology with regions measured by Southern blotting. Thus, the photolapus luminescence extracellular protein gene appears to represent a group of genetically related genes.

이러한 생물체 내부에 포함된 독소 펩티드에 진화상 관련된 변이가 존재할 수도 있다는 개념을 추가로 확인하기 위해, 관련 단백질의 존재 여부에 대해 포토랍두스 루미네센스의 다른 균주를 검사하는 2 가지의 방법을 실시하였다. 이것은 게놈 DNA의 PCR 증폭 및 폴리클로날 및 단클론성 항체를 사용하는 면역 블롯 분석 모두에 의해 실시되었다.To further confirm the notion that evolutionary related mutations may exist in the toxin peptides contained within these organisms, two methods of testing different strains of photolapus luminescence for the presence of related proteins are carried out. It was. This was done by both PCR amplification of genomic DNA and immunoblot analysis using polyclonal and monoclonal antibodies.

이 결과는 관련 단백질이 포토랩두스 루미네센스 균주 WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-11, WX-12, WX-15 및 WX-14에 의해 생성된다는 것을 나타낸다.This result indicates that the related proteins are photolabduus luminescence strains WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-11, WX-12, WX Produced by -15 and WX-14.

〈실시예 11b〉<Example 11b>

tcc 독소 클론의 서열화 및 분석Sequencing and Analysis of tcc Toxin Clones

실시예 11a에서 기술한 E. coli 클론에서 단리한 플라스미드에 대해 다른 DNA 서열화를 실시하였다. 상기 E. coli 클론의 제3 영역으로부터의 뉴클레오티드 서열은 상기 게놈 로커스에서 3 개의 밀접하게 연관된 개방 해독 프레임인 것으로 밝혀졌다. 이 로커스는 tccA (서열 56), tccB (서열 58) 및 tccC (서열 60)로 명명된 3 개의 개방 해독 프레임을 갖는 tcc로 명명되었다. 이러한 개방 해독 프레임들 간의 유사한 연관성은 93 bp가 tccb (염기 2992-2994, 서열 56)의 개시 코돈으로부터 tccA의 정지 코돈을 분리하는 서열 56을 시험하거나, 131 염기가 tccB 및 tccC (염기 4930-4932, 서열 58)의 정지 코돈을 분리하는 서열 58을 시험하여 확인한다. 천연 지도가 도 6B에 나타나 있다.Other DNA sequencing was performed on the plasmids isolated from the E. coli clone described in Example 11a. The nucleotide sequence from the third region of the E. coli clone was found to be three closely related open translation frames in the genomic locus. This locus was named tcc with three open reading frames named tccA (SEQ ID NO: 56), tccB (SEQ ID NO: 58), and tccC (SEQ ID NO: 60). A similar association between these open reading frames is shown in SEQ ID NO: 56 where 93 bp separates the stop codon of tccA from the initiation codon of tccb (bases 2992-2994, SEQ ID NO: 56), or 131 bases of tccB and tccC (bases 4930-4932). , SEQ ID NO: 58 to isolate the stop codon of SEQ ID NO: 58). The natural map is shown in Figure 6B.

tccA 개방 해독 프레임으로부터 추정된 아미노산 서열은 105,459 Da의 단백질을 코딩하는 유전자를 나타낸다. 이 단백질을 TccA (서열 57)로서 명명하였다. 이 단백질의 처음 12 개의 아미노산은 독소 복합체의 일부로서 앞에서 확인된 108 kDa 단백질 (서열 8)로부터 얻은 N-말단 서열과 일치한다.The amino acid sequence estimated from the tccA open reading frame represents a gene encoding a protein of 105,459 Da. This protein was named TccA (SEQ ID NO: 57). The first 12 amino acids of this protein match the N-terminal sequence obtained from the 108 kDa protein (SEQ ID NO: 8) identified above as part of the toxin complex.

tccB 개방 해독 프레임으로부터 추정된 아미노산은 175,716 Da의 단백질을 코딩하는 유전자를 나타낸다. 이 단백질은 TccB (서열 59)로 명명되었다. 이 단백질의 처음 11 개의 아미노산은 추정 분자량이 185 kDa인 단백질 (서열 7)로부터 얻은 N-말단 서열과 일치한다. 유사한 분석 결고, TccB 단백질은 TcbA (서열 12, 37 % 유사 및 28 % 동일), TcdA (서열 47, 35 % 유사 및 28 % 동일) 및 TcaB (서열 26, 32 % 유사 및 26 % 동일)로서 확인된 단백질과 관련된다는 것을 나타내었다 (위스콘신주 매디슨 소재의 Genetics Computer Group (GCG)의 GAP 알고리즘 위스콘신 패키지 버젼 9.0 사용).The amino acid estimated from the tccB open reading frame represents a gene encoding a protein of 175,716 Da. This protein was named TccB (SEQ ID NO: 59). The first 11 amino acids of this protein match the N-terminal sequence obtained from the protein with an estimated molecular weight of 185 kDa (SEQ ID NO: 7). Similar analysis results, TccB protein identified as TcbA (SEQ ID NOs: 12, 37% similar and 28% identical), TcdA (SEQ ID NOs: 47, 35% similar and 28% identical) and TcaB (SEQ ID NOs: 26, 32% similar and 26% identical) The GAP algorithm Wisconsin package version 9.0 from Genetics Computer Group (GCG) of Madison, Wisconsin.

tccC의 추정 아미노산 서열은 이 개방 해독 프레임이 111,694 Da의 단백질을 코딩하는 것을 나타내고 생성 단백질은 TccC (서열 61)로 명명되었다.The putative amino acid sequence of tccC indicates that this open reading frame encodes a protein of 111,694 Da and the resulting protein was named TccC (SEQ ID NO: 61).

〈실시예 12〉<Example 12>

포토랍두스 균주의 특성화Characterization of Photorapduus Strains

본 명세서에 기재된 컬렉션이 포토랍두스 균주로 이루어졌음을 확인하기 위하여, 본 발명의 균주를 포토랍두스에 특징적이고 다른 엔테로박테리아세 (Enterobacteriaceae) 및 제노랍두스 (Xenorhabdus) 종과 구별하게 하는, 식별되는 미생물학적 특징의 측면에서 평가하였다 [Farmer, J.J. 1984. Bergey's Manual of Systemic Bacteriology, vol 1. pp. 510-511. (ed. Kreig N.R. and Holt, J.G.). Williams & Wilkins, Baltimore.; Akhurst and Boemare, 1988, Boemare et al., 1993). 이러한 특유의 특징으로는 그람 음성 간균 균주, 생물체 크기는 폭 0.5 내지 2 ㎛, 길이 2 내지 10 ㎛, 적색/황색 콜로니 착색, 결정 봉입체의 존재, 카탈라제의 존재, 질산염 환원능, 생체 발광성 존재, 성장 배지로부터 염료의 흡수능 보유, 양성의 프로테아제 생성, 성장 온도 범위 37 ℃ 미만, 혐기성 조건 하에 생존 및 활발한 운동성 보유 등이 있다 (표 20). 참고용의 Escherichia coli, 제노랍두스 및 포토랍두스 균주가 비교용으로 모든 시험에 포함되었다. 전체적인 결과는 엔테로박테리아세 과 및 포토랍두스 속의 일부인 모든 균주와 일치하였다.In order to confirm that the collections described herein consisted of photolabose strains, the strains of the present invention are characterized by photolabdues and are distinguished from other Enterobacteriaceae and Xenorhabdus species. In terms of the resulting microbiological characteristics [Farmer, JJ 1984. Bergey's Manual of Systemic Bacteriology, vol 1. pp. 510-511. (ed.Kreig N.R. and Holt, J.G.). Williams & Wilkins, Baltimore .; Akhurst and Boemare, 1988, Boemare et al., 1993). These distinctive features include Gram-negative bacillus strains, organism sizes ranging from 0.5 to 2 μm in width, 2 to 10 μm in length, red / yellow colony staining, presence of crystal inclusions, presence of catalase, nitrate reduction ability, presence of bioluminescence, growth Retention of dye uptake from the medium, formation of positive proteases, growth temperature range below 37 ° C., survival and active motility under anaerobic conditions, and the like (Table 20). Reference Escherichia coli, Genorabdus and Photorapdus strains were included in all tests for comparison. Overall results were consistent with all strains that are part of the genus Enterobacteriaceae and Photorapdus.

발광계를 사용하여 각 균주의 생체 발광을 확인하고, 광 생성을 정량하고 상대적으로 측정하였다. 상대적인 발광 단위 측정을 위해, 각 균주 (세포 및 배지)의 브로쓰를 액체 배양물에 접종한 후 세 간격 (6, 12 및 24 시간)에서 측정하여 배경 발광 (비접종 배지 및 물)과 비교하였다. 각종 브로쓰로부터의 발광을 측정하기 전에, 시퍼 (sipper) 세포를 사용하여 Gilford Systems (오하이오주 소재 Oberlin 제품) 분광계 중에서 흡광도 (560 ㎚)를 측정하여 세포 밀도를 확인하였다. 이어서, 발광도를 측정하기 전에 (광학 밀도를 1.0 단위로 표준화하기 위해) 적합한 희석액을 제조하였다. 계속하여, 희석 브로쓰의 분취액을 큐벳에 넣고 (각각 300 ㎕) Bio-Orbit 1251 발광계 (핀란드 트위쿠 소재의 Bio-Orbit Oy 제품)로 판독하였다. 각 시료에 대한 총 시간은 45 초이었다. 시료를 연속적으로 혼합하면서 (배플드 큐벳에서 회전시킴) 산소 이용 가능성을 제공하기 위하여 판독하였다. 양성 시험은 배경 발광 (약 5 내지 10 단위)의 5 배 이상인 것으로 정하였다. 또한, 콜로니 발광도는 암실에 유지시킨 후 사진 필름 오버레이를 사용하여 가시적으로 측정하였다. 각 균주의 그람 염색 특성은 시판되는 그람 염색 조절 슬라이드 (펜실바니아주 피츠버그 소재의 Fisher Scientific 제품)와 함께 사용되는 그람 염색 키트 (메릴렌드 주의 콕키스빌 소재의 BBL 제품)로 확인하였다. 이어서, Zeiss 현미경 (독일 Carl Zeiss 제품) 100X 오일 침지 대물렌즈 (10X 접안렌즈 및 2X 체 배율을 가짐)를 사용하여 현미경 평가를 실시하였다. 생물체 크기, 세포 내부 및 봉입체 (로그상 성장 후)에 대한 각 균주의 현미경 검사는 오일 침지 및 상 대조 현미경을 갖는 습식 마운트 슬라이드 (10X 접안렌즈, 2X 체 배율, 40X 대물렌즈)를 사용하여 실시하였다 [Akhurst, R.J. and Boemare, N.E. 1990. Entomopathogenic Nematodes in Biological Control (ed. Gaugler, R. and Kaya, H.). pp. 75-90. CRC Press, Boca Raton, USA.; Baghdiguian S., Boyer-Giglio M.H., Thaler, J.O., Bonnot G., Boemare N. 1993. Biol. Cell 79, 177-185]. 콜로니 착색은 제조자의 지시에 따라 제조된 Bacto 영양 아가 (미시간주 디트로이트 소재의 Difco Laboratories 제품) 상에 접종한 후에 관찰하였다. 28 ℃에서 배양하였고, 5 내지 7 일 후에 발생하였다. 효소 카탈라제의 존재를 시험하기 위해서, 시험 생물체의 콜로니를 영양 아가 플레이트로부터 작은 플러그 상에서 제거하고, 유리 시험관의 바닥에 넣었다. 가정용 과산화수소 용액 1 ㎖를 부드럽게 시험관의 측면을 따라 첨가하였다. 기체 (산소로 추정됨)의 기포가 즉시 또는 5 초 내에 발생할 때 양성 반응을 기록하였다. 비접종 영양 아가 및 과산화수소 용액의 대조군도 조사하였다. 질산염 환원을 시험하기 위해서, 각 배양물을 Bacto 질산염 브로쓰 (미시간주 디트로이트 소재의 Difco Laboratories 제품) 10 ㎖에 접종하였다. 28 ℃에서 24 시간 배양한 후, 술파닐산 시약 2 액적 및 알파-나프틸아민 시약 2 액적 (Difco Manual, 10th edition, 미시간주 디트로이트 소재의 Difco Laboratories, 1984 참조)을 가하여 아질산염 생성을 시험하였다. 특유의 핑크 또는 적색의 생성은 질산염으로부터 아질산염이 형성되었음을 나타낸다. 각 균주가 성장 배지로부터 염료를 흡수하는 능력은 염료 중성 레드를 포함하는 Bacto MacConkey 아가; 염료 브로모티몰 블루를 포함하는 Bacto Tergitol-7 아가 및 염료 에오신-Y를 포함하는 Bacto EMB 아가 (미시간주 디트로이트 소재의 Difco Laboratories 제품, 모두 제조자의 지시에 따라 제조함)를 사용하여 시험하였다. 상기 배지 상에서 접종한 후, 28 ℃에서 5 일 동안 배양하여 염료 흡수를 기록하였다. 이들 배지 상에서의 성장은 엔테로박테리아세 과의 특징이다. 각 균주의 운동성은 제조자의 지시에 따라 제조한 Bacto Motility 시험 배지 (미시간주 디트로이트 소재의 Difco Laboratories 제품)의 용액을 사용하여 시험하였다. 버트-스탑 (butt-stab) 접종은 각 균주를 사용하여 실시하고, 운동성은 접종 라인으로부터 퍼지는 성장 확산 영역에 의해 현미경으로 판단하였다. 많은 경우에, 운동성은 습식 마운트 슬라이드 하에 액체 배양물로부터 현미경으로 관찰하였다. 각 균주에 대한 생화학적 영양 평가를 BBL Enterotube II (독일 디킨슨 소재의 Benton 제품)를 사용하여 실시하였다. 제조자 지시에 따르되, 배양은 28 ℃에서 5 일 동안 실시하였다. 그 결과는 앞에서 인용한 포토랍두스에 대한 기록과 일치하였다. 프로테아제 생성은 Bacto 젤라틴 (미시간주 디트로이트 소재의 Difco Laboratories 제품) 플레이트를 제조자의 지시에 따라 제조하여 젤라틴의 가수분해를 함으로써 시험하였다. 배양물을 접종하고 플레이트를 28 ℃에서 5 일 동안 배양하였다. 상이한 온도에서의 성장을 평가하기 위해서, 아가 플레이트 [탈이온수 중의 2 % Bacto-Agar를 갖는 2 % 프로테오스 펩톤 3번 (미시간주 디트로이트 소재의 Difco 제품)를 통상의 접종물 공급원으로 스트리킹하였다. 플레이트를 Nesco (등록 상표) 필름으로 밀봉하고, 3 주 이하 동안 20, 28 및 37 ℃에서 배양하였다. 37 ℃에서 성장을 보이지 않는 플레이트는 1 주 동안 28 ℃ 배양기에 이송한 후 세포 생존성을 보이지 않았다. 포토랍두스 균주에 대한 산소 요구량을 다음과 같이 시험하였다. 유체 티오글리콜레이트 브로쓰 배지 (미시간주 디트로이트 소재의 Difco 제품)로 버트-스탑 접종을 실시하였다. 튜브를 실온에서 1 주 동안 배양한 후, 배양물을 종류 및 성장 정도에 대해 조사하였다. 인디케이터 레사주린은 배지 산화 수준 또는 호기성 생활 영역을 나타낸다 (Difco Manual, 10th edition, Difco Laboratories, 미시간주 디트로이트 소재). 시험된 포토랍두스 균주에 대해 얻은 성장 영역 결과는 통성 혐기성 미생물에 대한 결과와 일치하였다.A luminometer was used to confirm bioluminescence of each strain, quantify light production and measure relative. For determination of relative luminescence units, broths of each strain (cells and media) were inoculated into liquid culture and measured at three intervals (6, 12 and 24 hours) and compared with background luminescence (non-inoculated media and water). . Prior to measuring luminescence from various broths, absorbance (560 nm) was measured in a Gilford Systems (Oberlin, Ohio) spectrometer using a sipper cell to confirm cell density. A suitable dilution was then prepared (to normalize the optical density to 1.0 unit) before measuring the luminescence. Subsequently, aliquots of dilute broth were placed in cuvettes (300 μl each) and read on a Bio-Orbit 1251 luminometer (Bio-Orbit Oy, Twiku, Finland). The total time for each sample was 45 seconds. Samples were read to provide oxygen availability while continuously mixing (rotating in a baffle cuvette). Positive testing was determined to be at least 5 times the background luminescence (about 5 to 10 units). In addition, colony luminescence was measured visually using a photographic film overlay after being maintained in the dark. Gram staining characteristics of each strain were confirmed with Gram staining kit (BBL, Cockisville, Maryland) used with commercially available Gram staining control slides (fisher Scientific, Pittsburgh, PA). Subsequently, microscopic evaluation was performed using a Zeiss microscope (from Carl Zeiss, Germany) 100X oil immersion objective lens (with 10X eyepiece and 2X sieve magnification). Microscopic examination of each strain for organism size, intracellular and inclusion bodies (after log phase growth) was performed using wet mount slides (10X eyepiece, 2X body magnification, 40X objective) with oil immersion and phase contrast microscopes. Akhurst, RJ and Boemare, N.E. 1990. Entomopathogenic Nematodes in Biological Control (ed. Gaugler, R. and Kaya, H.). pp. 75-90. CRC Press, Boca Raton, USA .; Baghdiguian S., Boyer-Giglio M.H., Thaler, J. O., Bonnot G., Boemare N. 1993. Biol. Cell 79, 177-185. Colony staining was observed after inoculation on Bacto nutritional agar (Difco Laboratories, Detroit, Mich.) Prepared according to the manufacturer's instructions. Incubation was at 28 ° C. and occurred after 5-7 days. To test for the presence of enzyme catalase, colonies of test organisms were removed from the nutrient agar plates on a small plug and placed in the bottom of a glass test tube. 1 ml of household hydrogen peroxide solution was gently added along the side of the test tube. Positive responses were recorded when bubbles of gas (estimated oxygen) occurred immediately or within 5 seconds. Controls of vaccinated nutrient agar and hydrogen peroxide solution were also investigated. To test nitrate reduction, each culture was inoculated in 10 ml of Bacto nitrate broth (Difco Laboratories, Detroit, Mich.). After 24 hours incubation at 28 ° C., 2 drops of sulfanylic acid reagent and 2 drops of alpha-naphthylamine reagent (see Difco Manual, 10th edition, Difco Laboratories, Detroit, Michigan, 1984) were tested for nitrite production. The distinctive pink or red formation indicates the formation of nitrite from nitrates. The ability of each strain to absorb dyes from the growth medium can include Bacto MacConkey agar, including dye neutral red; Bacto Tergitol-7 agar with dye bromothymol blue and Bacto EMB agar with dye eosin-Y (Difco Laboratories, Detroit, Mich., All prepared according to manufacturer's instructions) were tested. After inoculation on the medium, the dye uptake was recorded by incubating at 28 ° C. for 5 days. Growth on these media is characteristic of the Enterobacteriaceae family. The motility of each strain was tested using a solution of Bacto Motility test medium (Difco Laboratories, Detroit, Mich.) Prepared according to the manufacturer's instructions. Butt-stab inoculation was performed using each strain, and motility was determined microscopically by the growth diffusion region spread from the inoculation line. In many cases, motility was observed microscopically from liquid culture under wet mount slides. Biochemical nutritional assessment for each strain was carried out using BBL Enterotube II (Benton, Dickinson, Germany). According to the manufacturer's instructions, the incubation was carried out at 28 ° C. for 5 days. The results were in agreement with the record for Photorabdus quoted above. Protease production was tested by hydrolyzing gelatin by preparing Bacto gelatin (Difco Laboratories, Detroit, Mich.) Plates according to the manufacturer's instructions. Cultures were inoculated and plates were incubated at 28 ° C. for 5 days. To assess growth at different temperatures, agar plates (2% Proteose peptone 3 (2 from Difco, Detroit, Mich.) With 2% Bacto-Agar in deionized water) were streaked with a conventional inoculum source. Plates were sealed with Nesco® film and incubated at 20, 28 and 37 ° C. for up to 3 weeks. Plates showing no growth at 37 ° C. did not show cell viability after being transferred to a 28 ° C. incubator for 1 week. Oxygen demand for the Photorabdus strain was tested as follows. Butt-stop inoculation was performed with fluid thioglycolate broth medium (Difco, Detroit, Mich.). After incubation of the tube for 1 week at room temperature, the cultures were examined for type and extent of growth. Indicator resazurin indicates media oxidation levels or aerobic living areas (Difco Manual, 10th edition, Difco Laboratories, Detroit, MI). The growth area results obtained for the photolabduus strains tested were consistent with those for the anaerobic microorganisms.

* - A = 그람 균주, B = 결정 봉입체, C = 생체 발광, D = 세포 형태, E = 운동성, F = 질산염 환원, G = 카탈라제의 존재, H = 젤라틴 가수분해, I = 염료 흡수, J = 착색, K = EMB 아가 상에서의 성장, L = MacConkey 아가 상에서의 성장, M = Tergitol-7 아가 상에서의 성장, N = 통성 혐기성균, O = 20 ℃에서의 성장, P = 28 ℃에서의 성장, Q = 37 ℃에서의 성장, † - +/- = 특징의 양성 또는 음성, rd = 간균, S = 속 기술자 범위 내의 크기, RO = 레드-오렌지색, LR = 담적색, R = 적색, O = 오렌지색, Y = 황색, T = 황갈색, LY = 담황색, YT = 담황갈색, 및 LO = 담오렌지색.*-A = Gram strain, B = Crystal inclusion body, C = bioluminescence, D = cell morphology, E = motility, F = nitrate reduction, G = presence of catalase, H = gelatin hydrolysis, I = dye uptake, J = Coloring, K = growth on EMB agar, L = growth on MacConkey agar, M = growth on Tergitol-7 agar, N = anaerobic bacteria, O = growth at 20 ° C, P = growth at 28 ° C, Q = growth at 37 ° C, †-+/- = positive or negative of features, rd = bacilli, S = size within the genus descriptor range, RO = red-orange, LR = light red, R = red, O = orange , Y = yellow, T = tan, LY = pale yellow, YT = pale yellow, and LO = pale orange.

세포 지방산 분석은 속 및 종 수준에서 박테리아의 특성을 파악하기 위한 식별 수단이고 (Tornabene, T.G. 1985. Lipid Analysis and the Relationship to Chemotaxonomy in Methods in Microbiology, Vol 18, 209-234.; Goodfellow, M. and O'Donnell, A.G. 1993. Roots of Bacterial Systematics in Handbook of New Bacterial Systematics (ed. Goodfellow, M. & O'Donnell, A.G.) pp.3-54. London: Academic Press Ltd., 이들 참고 문헌의 개시 내용은 본 명세서에 참고로 포함됨), 본 발명의 컬렉션이 속 수준에서 관련되었음을 확인하기 위해 사용하였다. Microbial ID (MIDI 제품, 미국 델라웨어주 뉴와크 소재) Microbial Identification System (MIS)을 사용하는 지방산 메틸 에스테르 분석 (FAME)을 위해 배양물을 외부의 계약 실험실에 보냈다. MIS 시스템은 25 ㎜ × 0.2 ㎜ 5 % 메틸페닐 실리콘 융합 실리카 모세관 컬럼을 갖는 Hewlett Packard HP5890A 기체 크로마토그래피로 구성된다. 수소를 운반 기체로 사용하고 화염-이온화 검출기가 자동화 샘플러, 적분기 및 컴퓨터와 함께 기능한다. 컴퓨터는 시료의 지방산 메틸 에스테르를 미생물 지방산 라이브러리 및 공지의 지방산 검정 보정 혼합물과 비교한다. 계약 실험실에서 선별한 균주를 분석 전에 트립티카제 대두 아가 상에서 28 ℃에서 24 시간 동안 성장시켰다. 시료 추출은 표준 FAME 방법에 의해 계약 실험실에서 실시하였다. 포토랍두스 외의 다른 발광 박테리아 군에 대한 균주의 직접적인 확인은 없었다. 1군의 단리물의 지방산 프로파일을 비교하는 클러스터 분석을 실시할 때, 균주 지방산 프로파일은 속 수준에서 관련되었다.Cellular fatty acid analysis is an identification tool for characterizing bacteria at the genus and species level (Tornabene, TG 1985. Lipid Analysis and the Relationship to Chemotaxonomy in Methods in Microbiology, Vol 18, 209-234 .; Goodfellow, M. and O'Donnell, AG 1993. Roots of Bacterial Systematics in Handbook of New Bacterial Systematics (ed. Goodfellow, M. & O'Donnell, AG) pp.3-54.London: Academic Press Ltd., the disclosures of these references (Incorporated herein by reference), the collection of the invention was used to confirm that it was relevant at the genus level. The cultures were sent to an external contract laboratory for fatty acid methyl ester analysis (FAME) using the Microbial ID (MIDI, Newark, Delaware, USA) using the Microbial Identification System (MIS). The MIS system consists of Hewlett Packard HP5890A gas chromatography with 25 mm × 0.2 mm 5% methylphenyl silicone fused silica capillary column. Hydrogen is used as the carrier gas and a flame-ionization detector functions with the automated sampler, integrator and computer. The computer compares the fatty acid methyl ester of the sample with the microbial fatty acid library and known fatty acid assay calibration mixture. Strains selected in contract laboratories were grown on tryticase soybean agar for 24 hours at 28 ° C. prior to analysis. Sampling was performed in a contract laboratory by standard FAME methods. There was no direct identification of strains against other groups of luminescent bacteria other than photolabose. When performing a cluster analysis comparing the fatty acid profiles of Group 1 isolates, strain fatty acid profiles were related at the genus level.

본 발명의 컬렉션에서의 포토랍두스 균주의 진화적 다양성을 각 균주의 게놈 DNA를 사용하여 PCR (폴리머라제 연쇄 반응) 매개 게놈 지문 분석에 의해 측정하였다. 이 기술은 다양한 박테리아 종의 게놈 전반에 존재하는 일군의 반복 DNA 서열을 기초로 한 것이다 (Versalovic, J., Schneider, M., DE Bruijn, F.J. and Lupski, J.R. 1994. Methods Mol. Cell. Biol., 5, 25-40 참고). 이들 서열 중 반복 유전자외 회문 서열 (REP), 장내 박테리아 반복 유전자내 공통 서열 (ERIC) 및 BOX 성분은 박테리아 게놈의 조직에 중요한 역할을 수행하는 것으로 생각된다. 게놈 조직은 선별에 의해 형상화되는 것으로 생각되고, 밀접하게 관련된 박테리아 균주의 게놈 내의 이들 성분의 상이한 분산은 이들 균주의 식별에 사용될 수 있다 (예를 들면, Louws, F.J., Fulbright, D.W., Stephens, C.T. and DE Bruijn, F.J. 1994. Appl. Environ. Micro. 60, 2286-2295). Rep-PCR은 반복 서열 사이에 존재하는 크기가 상이한 DNA 단편을 증폭하기 위해 상기 반복 서열에 상보성인 올리고뉴클레오티드 프라이머를 이용한다. 생성물은 각 균주에 대한 DNA "지문"을 확립하기 위해 전기영동에 의해 분리한다.The evolutionary diversity of the Photorabdus strains in the collection of the present invention was determined by PCR (polymerase chain reaction) mediated genomic fingerprint analysis using the genomic DNA of each strain. This technique is based on a group of repeat DNA sequences that exist throughout the genome of various bacterial species (Versalovic, J., Schneider, M., DE Bruijn, FJ and Lupski, JR 1994. Methods Mol. Cell. Biol. , 5, 25-40). Of these sequences, the repeat extragenic palindromic sequence (REP), the enteric bacterial repeat gene common sequence (ERIC), and the BOX component are believed to play an important role in the organization of the bacterial genome. Genomic tissue is believed to be shaped by selection, and different dispersions of these components in the genome of closely related bacterial strains can be used for identification of these strains (eg Louws, FJ, Fulbright, DW, Stephens, CT). and DE Bruijn, FJ 1994. Appl. Environ. Micro. 60, 2286-2295). Rep-PCR uses oligonucleotide primers complementary to the repeat sequence to amplify DNA fragments of different sizes that exist between the repeat sequences. The product is separated by electrophoresis to establish the DNA "fingerprint" for each strain.

본 발명의 균주로부터 게놈 DNA를 단리하기 위해서, 세포 펠렛을 최종 부피가 10 ㎖가 되도록 TE 완충액 (10 mM Tris-HCl, 1 mM EDTA, pH 8.0) 중에 재현탁시키고나서, 5 M NaCl 12 ㎖를 가하였다. 이 혼합물을 15,000 × g에서 20 분 동안 원심분리하였다. 생성 펠렛을 TE 5.7 ㎖ 및 10 % SDS 300 ㎕ 중에 재현탁시키고 20 ㎎/㎖ 프로테이나제 K 60 ㎕ (Gibco BRL 제품, 뉴욕주 그랜드 아일랜드 소재)을 가하였다. 이 혼합물을 37 ℃에서 1 시간 동안 배양한 후, 리소자임 약 10 ㎎을 가하고, 혼합물을 추가로 45 분 동안 배양하였다. 계속하여, 5M NaCl 1 ㎖ 및 CTAB/NaCl 용액 800 ㎕ (10 % w/v CTAB, 0.7 M NaCl)을 가하고, 혼합물을 65 ℃에서 10 분 동안 배양하고, 부드럽게 진탕시킨 후 배양하고, 추가로 20 분 동안 진탕시켜 세포 물질의 세정을 보조하였다. 동일 부피의 클로로포름/이소아밀 알콜 용액 (24:1, v/v)을 가하고, 부드럽게 혼합한 후 원심분리하였다. 이어서, 동일 부피의 페놀/클로로포름/이소아밀 알콜 (50:49:1)을 사용하여 2 회 추출하였다. 게놈 DNA를 이소프로판올 0.6 부피를 사용하여 침전시켰다. 침전된 DAN를 유리 막대기로 수거하여 70 % 에탄올로 2 회 세척하고, 건조시키고, STE (10 mM Tris-HCl pH 8.0, 10 mM NaCl, 1 mM EDTA) 2 ㎖에 용해시켰다. 이어서, 260 ㎚에서의 광학 밀도에 의해 DNA를 정량하였다. 포토랍두스 게놈 DNA의 rep-PCR 분석을 실시하기 위해서, 다음과 같은 프라이머를 사용하였다: REP1R-I; 5'-IIIICGICGICATCIGGC-3' 및 REP2-I; 5'-ICGICTTATCIGGCCTAC-3'. 다음과 같은 25 ㎕ 반응물을 사용하여 PCR을 실시하였다: 7.75 ㎕ H2O, 2.5 ㎕ 10X LA 완충액 (PanVera Corp. 제품, 위스콘신주 매디슨 소재), 16 ㎕ dNTP 혼합물 (각각 2.5 mM), 각각의 프라이머 1 ㎕ (50 pM/㎕), DMSO 1 ㎕, 게놈 DNA 1.5 ㎕ (농도 0.075 내지 0.480 ㎍/㎕) 및 0.25 ㎕ TaKaRa EX Taq (PanVera Corp. 제품, 위스콘신 매디슨 소재). Perkin Elmer DNA 열 순환기 (Norwalk, CT) 중에서 다음과 같은 조건을 사용하여 PCR 증폭을 실시하였다: 95 ℃/7 분, 이어서 94 ℃/1 분, 44 ℃/1 분, 65 ℃/8 분의 순환 35회 반복, 이어서 65 ℃에서 15 분. 순환 후, 반응물 25 ㎕를 6X 겔 로딩 완충액 (물 중의 0.25 % 브로모페놀 블루, 40 % w/v 수크로스) 5 ㎕에 가하였다. 이어서, 15 × 20 ㎝ 1 % 아가로스 겔을 각각의 반응액 8 ㎕를 사용하여 TBE 완충액 (0.09 M Tris-보레이트, 0.002 M EDTA) 중에서 전개시켰다. 겔을 45 V에서 약 16 시간 동안 전개시켰다. 이어서, 겔을 에티듐 브로마이드 20 ㎍/㎖ 중에서 1 시간 동안 염색시키고, TBE 완충액 중에서 약 3 시간 동안 탈염색시켰다. 겔의 폴라로이드 사진을 UV 조명 하에 인화하였다.To isolate genomic DNA from the strain of the present invention, the cell pellet is resuspended in TE buffer (10 mM Tris-HCl, 1 mM EDTA, pH 8.0) to a final volume of 10 ml and then 12 ml of 5 M NaCl. Was added. This mixture was centrifuged at 15,000 × g for 20 minutes. The resulting pellet was resuspended in 5.7 mL TE and 300 μL 10% SDS and 60 μL 20 mg / mL proteinase K (Gibco BRL, Grand Island, NY) was added. After incubating the mixture at 37 ° C. for 1 hour, about 10 mg of lysozyme was added and the mixture was incubated for an additional 45 minutes. Subsequently, 1 ml of 5 M NaCl and 800 µl of CTAB / NaCl solution (10% w / v CTAB, 0.7 M NaCl) are added, the mixture is incubated at 65 ° C. for 10 minutes, gently shaken and incubated, and an additional 20 Shaking for minutes aided in washing of cellular material. An equal volume of chloroform / isoamyl alcohol solution (24: 1, v / v) was added, mixed gently and centrifuged. Then extracted twice using an equal volume of phenol / chloroform / isoamyl alcohol (50: 49: 1). Genomic DNA was precipitated using 0.6 volume of isopropanol. The precipitated DAN was collected with glass sticks, washed twice with 70% ethanol, dried and dissolved in 2 ml of STE (10 mM Tris-HCl pH 8.0, 10 mM NaCl, 1 mM EDTA). The DNA was then quantified by optical density at 260 nm. In order to perform rep-PCR analysis of photolabdus genomic DNA, the following primers were used: REP1R-I; 5'-IIIICGICGICATCIGGC-3 'and REP2-I; 5'-ICGICTTATCIGGCCTAC-3 '. PCR was performed using the following 25 μl reactions: 7.75 μl H 2 O, 2.5 μl 10X LA buffer (PanVera Corp., Madison, WI), 16 μl dNTP mixture (2.5 mM each), each primer 1 μl (50 pM / μl), 1 μl DMSO, 1.5 μl genomic DNA (concentration 0.075 to 0.480 μg / μl) and 0.25 μl TaKaRa EX Taq (PanVera Corp., Madison, Wisconsin). PCR amplification was carried out in a Perkin Elmer DNA thermal cycler (Norwalk, CT) using the following conditions: 95 ° C./7 min, followed by 94 ° C./1 min, 44 ° C./1 min, 65 ° C./8 min. Repeat 35 times, followed by 15 minutes at 65 ° C. After cycling, 25 μl of the reaction was added to 5 μl of 6 × gel loading buffer (0.25% bromophenol blue, 40% w / v sucrose). A 15 × 20 cm 1% agarose gel was then developed in TBE buffer (0.09 M Tris-borate, 0.002 M EDTA) using 8 μl of each reaction. The gel was run at 45 V for about 16 hours. The gel was then stained for 1 hour in 20 μg / ml ethidium bromide and destained for about 3 hours in TBE buffer. Polaroid pictures of the gel were printed under UV light.

각 염색에 특이적인 크기에서의 밴드의 존재 여부를 사진으로부터 기록하고, 수치 분류 소프트웨어 프로그램인 NTSYS-pc (Exeter Software, 뉴욕주 세타우켓 소재)에 유사 매트릭스로서 입력하였다. 동시에 분석되는 E. coli 균주 HB101 및 잔토모나스 오리재 피브이. 오리재 (Xanthomonas oryzae pv. oryzae)의 대조군은 출판된 문헌에 따른 "지문"을 생성시켰다 (Versalovic, J., Koeuth, T. and Lupski, J.R. 1991. Nucleic Acids Res. 19, 6823-6831; Vera Cruz, C.M., Halda-Alija, L., Louws, F., Skinner, D.Z., George, M.L., Nelson, R.J., DE Bruijn, F.J., Rice, C. and Leach, J.E. 1995. Int. Rice Res. Notes, 20, 23-24.; Vera Cruz, C.M., Ardales, E.Y., Skinner, D.Z., Talag, J., Nelson, R.J., Louws, F.J., Leung, H., Mew, T.W. and Leach, J.E. 1996. Phytopathology). 이어서, NTSYS-pc 내의 일련의 프로그램; 매트릭스의 유사성 계수 (Jaccard 계수 사용)를 생성하기 위한 SIMQUAL (정량 데이터에 대한 유사성) 및 관련 균주를 한데 모으고 페노그램 (phenogram) (도 5)으로 표현될 수 있는 SAHN (연속적인, 응집성의, 하이라키칼 (Heirarchical) 및 네스티드 (Nested)) 클러스터링 [UPGMA (산술평균을 사용하는 비계량 페어-그룹 (Unweighted Pair-Group) 방법을 사용]을 사용하여 포토랍두스 균주로부터의 데이터를 분석하였다. COPH (코페네틱 (cophenetic) 값) 및 MXCOMP (매트릭스 비교) 프로그램을 사용하여 코페네틱값 매트릭스를 생성시키고, 이것과 클러스터링의 기초가 되는 본래의 매트릭스 사이의 관계를 비교하였다. 클러스터 분석에 적합한 양호함의 척도인 (r = 0.8 내지 0.9가 매우 양호하게 적합함을 나타냄) 생성되는 정상화 만텔 (Mantel) 통계치 (r)을 생성시켰다. 본 발명의 경우에 r은 0.919 이었다. 따라서, 본 발명의 컬렉션은 포토랍두스 속의 대표적인 다양한 군의 용이하게 식별가능한 균주로 이루어진 것이다.The presence or absence of a band at a size specific to each stain was recorded from the photographs and entered as a similar matrix in the numerical classification software program NTSYS-pc (Exeter Software, Setauquet, NY). E. coli strains HB101 and Xanthomonas duck fib. A control of duck (Xanthomonas oryzae pv. Oryzae) produced a "fingerprint" according to published literature (Versalovic, J., Koeuth, T. and Lupski, JR 1991. Nucleic Acids Res. 19, 6823-6831; Vera Cruz, CM, Halda-Alija, L., Louws, F., Skinner, DZ, George, ML, Nelson, RJ, DE Bruijn, FJ, Rice, C. and Leach, JE 1995. Int.Rice Res. Notes, 20, 23-24 .; Vera Cruz, CM, Ardales, EY, Skinner, DZ, Talag, J., Nelson, RJ, Louws, FJ, Leung, H., Mew, TW and Leach, JE 1996. Phytopathology). Then a series of programs in NTSYS-pc; SIMQUAL (similarity to quantitative data) and related strains to generate similarity coefficients (using Jaccard coefficients) of the matrix and SAHNs (continuous, cohesive, high) that can be pooled and represented as phenograms (FIG. 5). Data from Photorabdus strains were analyzed using Rakikal and Nested clustering [using UPGMA (Unweighted Pair-Group method using arithmetic mean)]. (Cophenetic values) and the MXCOMP (matrix comparison) program were used to generate a cohenetic matrix and to compare the relationship between this and the original matrix on which clustering is based. A normalized Mantel statistic (r) was produced which was produced phosphorus (r = 0.8 to 0.9 indicating very good suitability), in the case of the present invention r is 0 Therefore, the collection of the present invention consists of easily identifiable strains from a diverse and representative group of the genus Photorapdus.

〈실시예 13〉<Example 13>

다양한 포토랍두스 균주에 의해 생산되는 독소(들)의 살충 효용Insecticidal Utility of Toxin (s) Produced by Various Photoractus Strains

카풋으로 덮여진 델롱 목을 가진 500 ml 트리배플드 플라스크중의, 2% 프로테오스 펩톤 #3 (PP3, 미시간주 디트로이트 소재의 디프코 래버러토리즈 (Difco Laboratories) 제조) 액체 배지 175 ml에 일차 변종 서브클론을 접종하여, 다양한 포토랍두스 균주의 초기 종자 배양물을 제조하였다. 각 종자 배양을 위한 접종물은 오일이 덮여진 아가 사면 배양물 또는 플레이트 배양물로부터 유래되었다. 접종 후, 상기 플라스크를 회전식 진탕기 상에서, 150 rpm에서 16 시간 동안 28℃에서 배양하였다. 이어서 상기 종자 배양물은 각 균주의 정해진 발효를 위한 균일한 접종원으로서 사용되었다. 또한, 로그 후상 (post-log) 종자 배양물을 멸균의 미네랄 오일로 덮고, 멸균의 자석 교반 막대를 장래의 재현탁을 위하여 첨가하며, 배양물을 암실, 실온에서 보관함으로써, 접종물을 독소 생산 상태로 장기간 보존하였다. 활발하게 성장하는 종자 배양물 1% (예를 들어, 신선 배양물 175 ml 당 1.75 ml)를 2% PP3 신선 배지에 첨가함으로써 생산 브로쓰를 접종하였다. 브로쓰는, 실리콘 포움 마개로 밀폐된 500 ml 트리배플드 플라스크 (상기 참조) 또는 2800 ml 배플드 요철면 바닥 플라스크 (500 ml 용량)에서 생산하였다. 생산 플라스크를 상기 조건 하에서 24 내지 48시간 동안 배양하였다. 배양 후, 브로쓰를 멸균의 1 L 폴리에틸렌 병 내로 분배시켜 10℃에서 1 시간 동안 2600 ×g에서 회전시킴으로써, 세포 및 파쇄물 펠렛으로부터 분리시켰다. 액체 브로쓰는 그 후 와트만(Whatman) GF/D (2.7 μm 보유) 및 GF/B (1.0 μm 보유) 유리 여과기를 통하여 진공 여과시켜 파쇄물을 제거하였다. 0.5 μm 개방 도관 여과기를 사용, 접선 유출 극소 여과 장치 (매사추세츠주 노쓰보로 소재의 폴 필트론 (Pall Filtron) 제조)로 브로쓰를 보다 더 정화하였다. 필요시, 브로쓰를 냉각시켜(4℃까지) 2600 × g에서 여러 시간 동안 원심분리시킴으로써 추가로 정화시킬 수 있다. 상기 과정 후, 0.2 μm 니트로셀룰로스 막 여과기를 사용하여 브로쓰를 여과 살균시켰다. 무균 브로쓰는 그 후, 생물학적 분석, 생화학적 분석용으로 직접 사용되었거나 분자량 10000 컷오프 M12 한외여과 장치 (매사추세츠주 베벌리 소재 아미콘 (Amicon) 제조) 또는 분자량 10000의 구멍 크기를 갖는 원심 분리 농축기 (매사추세츠주 베드포드 소재 밀리포어 (Millipore) 제조 및 매사추세츠주 노쓰보로 소재 폴 필트론 제조)를 사용하여 농축 (15배까지)시켰다. 원심 분리 농축기의 경우, 브로쓰를 2000 × g에서 약 2시간 동안 원심분리시켰다. 분자량 10000 투과액을, 상응하는 잔류물에 첨가하여 분자량 10000 초과 성분의 원하는 농축액을 수득하였다. 모래를 채운 히트 블록 (heat block)에서 10분간, 100℃에서 샘플을 가열함으로써, 처리되는 브로쓰 샘플을 가열 불활성화시켰다.In 175 ml of 2% Proteose Peptone # 3 (PP3, Difco Laboratories, Detroit, MI) liquid medium in a 500 ml Tribaffle flask with Kaput Primary strain subclones were inoculated to prepare initial seed cultures of the various photolapse strains. Inoculum for each seed culture was derived from an oil covered agar slope culture or plate culture. After inoculation, the flasks were incubated at 28 ° C. for 16 hours at 150 rpm on a rotary shaker. The seed culture was then used as a uniform inoculum for a given fermentation of each strain. The post-log seed cultures are also covered with sterile mineral oil, a sterile magnetic stir bar is added for future resuspension, and the culture is stored in the dark, at room temperature, thereby inoculating the inoculum toxin production. The state was stored for a long time. Production broth was inoculated by adding 1% of actively growing seed culture (eg, 1.75 ml per 175 ml of fresh culture) to 2% PP3 fresh medium. The broth was produced in a 500 ml tribaffle flask (see above) or a 2800 ml baffle uneven bottom flask (500 ml capacity) sealed with a silicone foam stopper. Production flasks were incubated for 24 to 48 hours under these conditions. After incubation, the broth was dispensed into cells and lysate pellets by dispensing into sterile 1 L polyethylene bottles and spinning at 2600 × g for 1 hour at 10 ° C. The liquid broth was then vacuum filtered through Whatman GF / D (2.7 μm retention) and GF / B (1.0 μm retention) glass filters to remove debris. The broth was further purified using a 0.5 μm open conduit filter with a tangential outflow microfiltration device (Pall Filtron, Northborough, Mass.). If necessary, the broth can be further clarified by cooling (up to 4 ° C.) and centrifuging at 2600 × g for several hours. After this procedure, the broth was filtered and sterilized using a 0.2 μm nitrocellulose membrane filter. Sterile broth was then either used directly for biological, biochemical analysis or a molecular weight 10000 cutoff M12 ultrafiltration apparatus (manufactured by Amicon, Beverly, Mass.) Or a centrifugal concentrator with a pore size of molecular weight 10000 (Massachusetts) Concentrated (up to 15 times) using Millipore, Bedford and Paul Filtron, Notsboro, Mass., USA. For centrifugal concentrators, the broth was centrifuged at 2000 × g for about 2 hours. A molecular weight 10000 permeate was added to the corresponding residue to give the desired concentrate of components with molecular weight greater than 10000. The treated broth sample was heat inactivated by heating the sample at 100 ° C. for 10 minutes in a sand filled heat block.

서로 다른 포토랍두스 균주로부터의 브로쓰(들) 및 독소 복합체(들)은 곤충 집단을 감소시키는 데 유용하며, 기술된 활성물질을, 곤충 불활성화에 효과적인 양만큼 곤충 서식지에 사용하는 것으로 이루어지는 곤충 집단 억제 방법에 사용되었다. 상기와 같이 발효시킨 포토랍두스 균주의 선별군의 브로쓰로부터 관찰된 살충 활성의 범위의 증거는 표 20에 나타나 있다. 브로쓰 농도를 증가시키거나 다른 발효 방법을 사용함으로써 상기 균주에서 부가적인 살충 활성의 검출이 가능하다. 단백질과 관계된 활성과 일관되게, 시험된 모든 균주들의 살충 활성은 열에 불안정하였다 (상기 참고).Broth (s) and toxin complex (s) from different photolabose strains are useful for reducing insect populations, and insects consisting of using the described active substances in insect habitats in an amount effective to inactivate insects. It was used in the population suppression method. Evidence of the range of pesticidal activity observed from broths of the select group of photolabduus strains fermented as above is shown in Table 20. Increasing the broth concentration or using other fermentation methods allows detection of additional pesticidal activity in the strain. Consistent with the activity associated with the protein, the pesticidal activity of all strains tested was heat labile (see above).

다양한 포토랍두스 균주로부터의 배양 브로쓰(들)은 곤충 수에 대하여 차별적인 살충 활성 (치사율 및(또는) 성장 저해율, 성체 출현의 감소)을 나타낸다. 보다 구체적으로, 활성은 딱정벌레 (Coleoptera) 곤충 목의 일원인 옥수수 뿌리벌레 유충 및 목화 바구미 유충에 대하여 나타난다. 딱정벌레 목의 다른 일원으로는 방아벌레, 화분 딱정벌레, 뜀벼룩 갑충, 종자 갑충 및 콜로라도 감자 딱정벌레가 있다. 활성은 별 매미충 및 옥수수 멸구에 대해서도 관찰되는데, 이들은 동시목의 일원이다. 동시목의 다른 일원으로는 멸구, 배나무이, 사과나무이, 개각충, 화이트플라이, 침벌레 및 수많은 숙주 특이 진딧물 균주들이 있다. 브로쓰 및 정제된 독소 복합체(들)은 또한 나비목의 일원인 회색담배나방, 박각시나방 및 유럽 옥수수 천공충에 대해서도 활성을 갖는다. 상기 목의 다른 전형적인 일원으로는 사탕무 행렬구더기, 양배추 자벌레, 블랙 야도충, 옥수수 귀벌레, 사과 나방, 반대좀, 화랑곡나방, 잎말이나방, 배추 벌레, 목화다래나방, 도롱이벌레, 이스턴 텐트 나방, 잔디 포충나방 및 폴 행렬구더기가 있다. 활성은 파리목의 일원인 과일파리 및 모기 유충에 대해서도 나타난다. 파리목의 다른 일원으로는 완두콩 벌레, 당근 파리, 양배추 뿌리 파리, 순무 뿌리 파리, 양파 파리, 학파리 및 집파리와 다양한 모기 종들이 있다. 브로쓰(들) 및 독소 복합체(들)은 또한, 딸기 개미 진드기, 브로드 진드기, 감귤류 적색 진드기, 유럽형 적색 진드기, 배 녹빛 진드기 및 토마토 적갈색 진드기를 포함하는 응애목의 일원인 점박이 거미 진드기에 대해 활성을 나타낸다.Culture broth (s) from various photolabose strains exhibit differential pesticidal activity (decrease in mortality and / or growth inhibition, reduction in adult appearance) with respect to insect numbers. More specifically, activity is shown against corn rootworm larvae and cotton weevil larvae that are members of the Coleoptera insect throat. Other members of the beetle neck include bugs, pollen beetles, jump flea beetles, seed beetles and Colorado potato beetles. Activity is also observed for star cicada and corn extinct, which are members of the same tree. Other members of the same tree include extinction, pear tree, apple tree, beetle, white fly, stingerworm and numerous host specific aphid strains. The broth and purified toxin complex (es) also have activity against gray tobacco moth, horn moth and European corn borer, which are members of the Lepidoptera. Other typical members of the neck include beetroot maggots, cabbage bugs, black beetles, corn ear beetles, apple moths, antagonists, gallery moths, leaf moths, cabbage beetles, cotton beetle moths, salamanders, eastern tent moths and grass. There are insect moths and pole matrix maggots. Activity is also shown for fruit flies and mosquito larvae that are members of the fly. Other members of the fly tree include pea worms, carrot flies, cabbage root flies, turnip root flies, onion flies, school flies and house flies and various mosquito species. The broth (s) and toxin complex (s) are also active against spotted spider mites that are members of mite that include strawberry ant mites, broad mites, citrus red mites, European red mites, pear green mites and tomato reddish brown mites Indicates.

옥수수 뿌리벌레 유충에 대한 활성은 하기와 같이 시험되었다. 포토랍두스 배양 브로쓰(들)(0 내지 15배 농축, 여과 살균), 2% 프로테오스 펩톤 #3, 정제 독소 복합체(들), pH 7.0의 10 mM 인산 나트륨 완충액을 인공 먹이의 표면 (약 1.5 cm2)에 40μl씩 직접 도포하였다[Rose, R. I. 및 McCabe, J. M. (1973). J. Econ. Entomol. 66, (389-400) 참조]. 독소 복합체를 pH 7.0의 10 mM 인산 나트륨 완충액에 희석시켰다. 먹이 플레이트를 무균 플로우 후드에서 공기 건조시키고, 표면 살균된 알로부터 부화시킨 단일, 신생 디아브로티카 운데심푼크타타 호와르디 (Diabrotica undecimpunctata howardi) (써던 옥수수 뿌리벌레, SCR)로 웰을 만연시켰다. 상기 플레이트를 봉인하여 습윤 성장 챔버에 두고 적당한 기간 (3 내지 5일)동안 27℃에서 유지시켰다. 그 후 치사율 및 유충 무게 측정치를 기록하였다. 일반적으로, 모든 연구에서 처리당 16마리의 곤충이 사용되었다. 대조군 치사율은 일반적으로 5% 미만이었다.Activity against corn rootworm larvae was tested as follows. Photolapdus culture broth (s) (0-15 fold concentration, filtration sterilization), 2% proteose peptone # 3, purified toxin complex (s), 10 mM sodium phosphate buffer at pH 7.0 40 μl were applied directly to about 1.5 cm 2 ) [Rose, RI and McCabe, JM (1973). J. Econ. Entomol. 66, (389-400). Toxin complexes were diluted in 10 mM sodium phosphate buffer at pH 7.0. The food plate was air dried in a sterile flow hood and wells were infested with a single, newborn Diabrotica undecimpunctata howardi (Sudden Corn Root, SCR) hatched from surface sterilized eggs. The plates were sealed and placed in a wet growth chamber and kept at 27 ° C. for a suitable period (3 to 5 days). Mortality and larval weight measurements were then recorded. In general, 16 insects were used per treatment in all studies. Control mortality was generally less than 5%.

목화 바구미 (Anthomonas grandis)에 대한 활성은 하기와 같이 시험되었다. 농축 (1 내지 10배) 포토랍두스 브로쓰, 대조군 배지 (2% 프로테오스 펩톤 #3), 정제 독소 복합체(들)(0.23 g/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액을 0.35 g의 인공 먹이 (스톤빌 옐로우 나비목 (Stoneville Yellow lepidopteran) 먹이) 표면에 60 μl씩 도포시켜 건조시켰다. 12 내지 24시간 된 목화 바구미 유충 한마리를 먹이에 놓고, 웰을 봉인시켜 50% 상대 습도하 25℃에서 5일간 유지시켰다. 그 후, 치사율 및 유충 무게를 평가하였다. 대조군 치사율은 0 내지 13%였다.Activity against cotton weevil (Anthomonas grandis) was tested as follows. 0.35 g of concentrated (1-10 fold) photolabose broth, control medium (2% proteose peptone # 3), purified toxin complex (s) (0.23 g / ml) or 10 mM sodium phosphate buffer at pH 7.0 60 μl of the surface of artificial food (Stoneville Yellow lepidopteran food) was applied and dried. One 12 to 24 hour old cotton weevil larva was placed in the feed and the wells were sealed and kept at 25 ° C. for 5 days at 50% relative humidity. Thereafter, mortality and larval weight were evaluated. Control mortality was 0-13%.

모기 유충에 대한 활성은 하기와 같이 시험되었다. 분석은 96 웰 마이크로타이터 플레이트에서 행해졌다. 각 웰에는, 200 μl의 수용액 (10배 농축 포토랍두스 배양 브로쓰(들)), 대조군 배지 (2% 프로테오스 펩톤 #3), 10 mM 인산 나트륨 완충액, 독소 복합체(들)(0.23 mg/ml) 또는 물 및 약 20개의, 1일된 유충 (Aedes aegypti)이 포함되었다. 처리당 6웰을 사용하였다. 결과는 만연시킨 후 3 내지 4일에 해석하였다. 대조군 치사율은 0 내지 20%이었다.Activity against mosquito larvae was tested as follows. Assays were done in 96 well microtiter plates. In each well, 200 μl of an aqueous solution (10-fold concentrated photolabose culture broth (s)), control medium (2% proteose peptone # 3), 10 mM sodium phosphate buffer, toxin complex (s) (0.23 mg / ml) or water and about 20, daily larvae (Aedes aegypti). 6 wells were used per treatment. Results were interpreted three to four days after infestation. Control mortality was 0-20%.

과일파리에 대한 활성은 하기와 같이 시험하였다. 구입한 드로소필라 멜라노가스터 (Drosophila melanogaster) 배지는, 50% 건조 배지와, 물, 대조군 배지 (2% 프로테오스 펩톤 #3), 10배 농축 포토랍두스 배양 브로쓰(들), 정제 독소 복합체(들)(0.23 mg/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액 중 어느 하나의 50% 액체를 사용하여 제조하였다. 이것은 처리당 각각 3개의 리어링 바이알 (rearing vial)에 4.0 ml의 건조 배지를 넣고 4.0 ml의 적절한 액체를 첨가함으로써 성취되었다. 그 후 각 25 ml 바이알에 10개의 후기 영 드로소필라 멜라노가스터 구더기를 첨가하였다. 상기 바이알을 형광등하, 상온에서 실험실 벤치상에 놓아 두었다. 노출 15일 후에, 새끼 또는 성충수를 계산하였다. 물 및 대조 배지와 비교해서 성충 출현은 감소하였다(0 내지 16% 감소).The activity against fruit flies was tested as follows. The Drosophila melanogaster medium purchased was 50% dry medium, water, control medium (2% proteose peptone # 3), 10-fold concentrated photolabose culture broth (s), tablets Prepared using 50% liquid of either toxin complex (s) (0.23 mg / ml) or 10 mM sodium phosphate buffer at pH 7.0. This was accomplished by placing 4.0 ml of dry media in each of three rearing vials and adding 4.0 ml of the appropriate liquid. Then 10 late Young Drosophila melanogas Maggots were added to each 25 ml vial. The vial was placed on a laboratory bench at room temperature under fluorescent lamps. After 15 days of exposure, pups or adult numbers were counted. Adult appearance was reduced (0-16% reduction) compared to water and control medium.

다른 외부 접촉 없이 활성물을 섭취하도록 고안된 섭취 분석으로, 별 매미충 성충 (Macrosteles severini) 및 옥수수 식물벌레 애벌레 (Peregrinus maidis)에 대한 활성을 시험하였다. 활성물/먹이 용액의 저장기는 35 × 10 mm 페트리 디쉬의 바닥 중심에 2개의 홀을 뚫어 만든다. 정사각형의 2인치 파라필름 엠 (등록상표 Parafilm M)을 디쉬 상부를 가로질러 놓고 "O" 링으로 고정시킨다. 그 후, 1 온즈 플라스틱 컵에 약 7마리의 메뚜기를 넣고, 파라필름이 아래에 오도록 저장기를 컵의 상부에 놓는다. 이어서, 시험 용액을 홀을 통하여 저장기에 첨가한다. 10배 농축 포토랍두스 배양 브로쓰(들)를 사용하는 시험에서는, 브로쓰 및 대조군 배지 (2% 프로테오스 펩톤 #3)를 pH 7.0의 10 mM 인산 나트륨 완충액에 대하여 투석시켰으며, 그 결과로서 생기는 용액에 자당 (5%까지)을 첨가하여 대조 치사율을 감소시켰다. 정제 독소 복합체(들)(0.23 mg/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액을 또한 시험하였다. 치사율은 3일째에 기록한다. 분석물은 16/8의 광주기로 상대 습도 70%하 28℃에서 배양기 내에 보존하였다. 분석물은 72시간째에 치사율을 기록하였다. 대조군 치사율은 6% 미만이었다.Ingestion assays designed to consume actives without other external contact were tested for activity against star larvae (Macrosteles severini) and corn plant beetle larvae (Peregrinus maidis). The reservoir of active / feed solution is made by drilling two holes in the bottom center of a 35 × 10 mm Petri dish. A square 2-inch Parafilm M is placed across the top of the dish and secured with an "O" ring. Thereafter, about 7 grasshoppers are placed in a 1 oz. Plastic cup and the reservoir is placed on top of the cup with the parafilm underneath. The test solution is then added to the reservoir through the hole. In a test using 10-fold concentrated photolabose culture broth (s), the broth and control medium (2% proteose peptone # 3) were dialyzed against 10 mM sodium phosphate buffer at pH 7.0 and as a result Sucrose (up to 5%) was added to the resulting solution to reduce control mortality. Purified toxin complex (es) (0.23 mg / ml) or 10 mM sodium phosphate buffer at pH 7.0 was also tested. The mortality rate is recorded on day 3. The analytes were stored in the incubator at 28 ° C. under 70% relative humidity with a 16/8 photoperiod. Analytes recorded mortality at 72 hours. Control mortality was less than 6%.

나비목 유충에 대한 활성은 하기와 같이 시험하였다. 농축(10배) 포토랍두스 배양 브로쓰(들), 대조군 배지 (2% 프로테오스 펩톤 #3), 정제 독소 복합물(들)(0.23 mg/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액을, 표준 인공 나비목 먹이(스톤빌 옐로우 먹이, 약 1.5 cm2) 표면에 40 μl씩 직접적 도포시켰다. 먹이 플레이트를 무균 플로우 후드내에서 공기 건조시켰고, 각 웰을 신생 유충 1마리로 만연시켰다. 유럽 옥수수 천공충 (Ostrinia nubilalis) 및 박각시나방 (Manduca sexta) 알을 구입하여 부화시켰고, 회색담배나방 (Heliothis virescens) 유충은 내부적으로 공급하였다. 유충으로 만연시킨 후, 먹이 플레이트를 봉인하여 습윤 성장 챔버내에 두고 적절한 기간 동안 27℃ 암실에서 유지시켰다. 치사율 및 중량 측정은 5일째에 실시하였다. 일반적으로, 모든 연구에서 처리당 16마리의 곤충이 사용되었다. 대조군 배지의 대조군 치사율은 일반적으로 4 내지 약 12.5%였고, 인산 완충액의 대조군 치사율은 10% 미만이었다.Activity against Lepidoptera larvae was tested as follows. Concentrated (10-fold) photolabose culture broth (s), control medium (2% proteose peptone # 3), purified toxin complex (s) (0.23 mg / ml) or 10 mM sodium phosphate buffer at pH 7.0 40 μl was applied directly to the surface of standard artificial lepidoptera food (Stoneville yellow food, about 1.5 cm 2 ). The food plate was air dried in a sterile flow hood and each well was ramped up with one newborn larva. European corn borer (Ostrinia nubilalis) and Manuca sexta eggs were purchased and hatched, and gray tobacco moth (Heliothis virescens) larvae were supplied internally. After spreading with the larvae, the food plate was sealed and placed in the wet growth chamber and kept in the dark at 27 ° C. for an appropriate period. Lethality and weight measurements were performed on day 5. In general, 16 insects were used per treatment in all studies. The control lethality of the control medium was generally 4 to about 12.5% and the control lethality of the phosphate buffer was less than 10%.

점박이 거미 진드기 (Tetranychus urticae)에 대한 활성은 하기와 같이 측정되었다. 어린 호박 식물을 단일 자엽으로 다듬어 10배 농축 브로쓰(들), 대조군 배지 (2% 프로테오스 펩톤 #3), 정제 독소 복합체(들), pH 7.0의 10 mM 인산 나트륨 완충액을 흘러내릴 정도로 분무시켰다. 건조 후, 식물을 거미 진드기의 혼합 집단으로 만연시키고 실험실 온도 및 습도에서 72시간동안 유지시켰다. 그 후, 대조군의 수준을 결정하기 위하여 살아있는 진드기의 수를 세었다.Activity against spotted spider mite (Tetranychus urticae) was measured as follows. Young pumpkin plants are trimmed to single cotyledons and sprayed to flush 10-fold concentrated broth (s), control medium (2% proteose peptone # 3), purified toxin complex (s), 10 mM sodium phosphate buffer at pH 7.0 I was. After drying, the plants were infested with a mixed population of spider mites and held for 72 hours at laboratory temperature and humidity. The live ticks were then counted to determine the level of the control group.

서로 다른 포토랍두스 균주로부터의 브로쓰의 살충 범위 관측치Insecticidal range observations of broth from different photoractose strains 포토랍두스 종Fotolapus species 감수성* 곤충 종Susceptibility * Insect Species WX-1WX-1 3**, 4, 5, 6, 7, 83 **, 4, 5, 6, 7, 8 WX-2WX-2 2, 42, 4 WX-3WX-3 1, 41, 4 WX-4WX-4 1, 41, 4 WX-5WX-5 44 WX-6WX-6 44 WX-7WX-7 3, 4, 5, 6, 7, 83, 4, 5, 6, 7, 8 WX-8WX-8 1, 2, 41, 2, 4 WX-9WX-9 1, 2, 41, 2, 4 WX-10WX-10 44 WX-11WX-11 1, 2, 41, 2, 4 WX-12WX-12 2, 4, 5, 6, 7, 82, 4, 5, 6, 7, 8 WX-14WX-14 1, 2, 41, 2, 4 WX-15WX-15 1, 2, 41, 2, 4 W30W30 3, 4, 5, 83, 4, 5, 8 NC-1NC-1 1, 2, 3, 4, 5, 6, 7, 8, 9,1, 2, 3, 4, 5, 6, 7, 8, 9, WIRWIR 2, 3, 5, 6, 7, 82, 3, 5, 6, 7, 8 HP88HP88 1, 3, 4, 5, 7, 81, 3, 4, 5, 7, 8 HbHb 3, 4, 5, 7, 83, 4, 5, 7, 8 HmHm 1, 2, 3, 4, 5, 7, 81, 2, 3, 4, 5, 7, 8 H9H9 1, 2, 3, 4, 5, 6, 7, 81, 2, 3, 4, 5, 6, 7, 8 W-14W-14 1, 2, 3, 4, 5, 6, 7, 8, 101, 2, 3, 4, 5, 6, 7, 8, 10 ATCC 43948ATCC 43948 44 ATCC 43949ATCC 43949 44 ATCC 43950ATCC 43950 44 ATCC 43951ATCC 43951 44 ATCC 43952ATCC 43952 44 * = 대조군과 비교하여 25% 이상의 치사율 및(또는) 성장 저해* = At least 25% mortality and / or growth inhibition compared to the control **= 1; 담배 모충, 2; 유럽형 옥수수 천공충, 3; 담배 호른웜, 4; 서던 옥수수 뿌리벌레, 5; 목화 바구미, 6; 모기, 7; 과일파리, 8; 애스터 멸구, 9; 옥수수 식물메뚜기, 10; 점박이 거미 진드기** = 1; Tobacco caterpillar, 2; European corn borer, 3; Tobacco hornworm, 4; Southern Corn Roots, 5; Cotton weevil, 6; Mosquito, 7; Fruit fly, 8; Astor extinction, 9; Corn plant grasshopper, 10; Spotted Spider Mite

실시예 14Example 14

비 W-14 포토랍두스 균주: 정제, 특성화 및 활성 범위Non W-14 Photorapdu Strains: Purification, Characterization, and Scope of Activity

정제refine

하기와 같은 실험 방법은 W-14의 정제를 위해 개발된 것과 유사하며, 생물학적 정량 (실시예 13 참조)에서 결정된 바와 같이 써던 옥수수 뿌리벌레 (SCR)에 대하여 가장 큰 활성을 갖는 분획만을 정제하는 것을 기초로 하여 확립되었다. 일반적으로, 실시예 13에 기술된 바와 같이, 여과시킨 4 내지 20 L의 브로쓰를 수취하여, 아미콘 M-12 여과 장치에 부착되어 있는 아미콘 나선형 한외여과 카트리지 타입 S1Y100을 사용하여 농축시켰다. 잔류물에는 100 kDa을 초과하는 분자 크기로 이루어진 천연 단백질들을 함유하고 있었고, 투과액은 크기 100 kDa 미만의 천연 단백질을 함유하고 있었다. SCR에 대한 활성의 대부분은 100 kDa 잔류물에 포함되어 있었다. 그 후, 잔류물은 10 mM 인산 나트륨 완충액 (pH 7.0)으로 여과물의 A280이 0.100 미만이 될 때까지 계속해서 다이아필터링 (diafiltering)시켰다. 다른 언급이 없는 한, 지금부터의 모든 처리는 10 mM 인산 나트륨 (pH 7.0)으로 한정된 완충액에서 수행하였다. 잔류물은 그 후, 약 0.20 L의 최종 부피까지 농축시켜 날진 필터웨어 (등록상표 Nalgene Filterware)의 0.45 mm 무균 여과 단위를 사용하여 여과시켰다. 여과된 물질을, 퍼셉티브 바이오시스템 스프린트 (등록상표 PerSeptive Biosystem Sprint) HPLC 시스템을 사용하여 완충액으로 평형시킨 퍼셉티브 바이오시스템 포로스 (등록상표 PerSeptive Biosystem Poros) 50 HQ 강력 음이온 교환 매트릭스로 충전시킨 파마시아 (Pharmacia) HR16/10 컬럼에 분당 7.5 ml로 로딩시켰다. 로딩후, A280이 0.100이 될 때까지, 컬럼을 완충액으로 세척하였다. 이어서 0.4 M NaCl을 갖는 완충액을 사용하여 단백질을 분당 2.5 ml로 20분간 전체 용량 50 ml에 대해 컬럼으로부터 용출 (elution)시켰다. 그 후 컬럼은 추가로 20분간 동일한 유출 속도로 1.0 M NaCl을 갖는 완충액을 사용하여 세척시켰다 (최종 용량 50 ml). 0.4 M 및 1.0 M NaCl로 용출시킨 단백질을 별개의 투석 백 (등록상표 스펙트라/포 (Spectra/Por) 막 MWCO:2000에 넣고, 12 L 완충액에서 4℃에서 철야 투석시켰다. SCR에 대한 활성을 가지는 대부분은 0.4 M 분획에 포함되어 있었다. 세파로스 (Sepharose) CL4B (파마시아 제품)로 선 충전시킨 파마시아 XK 26/100 컬럼에 0.4 M 분획 20 ml을, 분당 0.75 ml의 유출 속도를 사용하여 로딩시킴으로써 한층 더 정제시켰다. 분획들은 A280피크 프로파일을 기초로 하여 모아 밀리포아 울트라프리-15 (등록상표 Millipore Ultrafree-15) 원심 분리 여과 장치 바이오맥스-50K (Biomax-50K) NMWL 막을 사용하여 최종 용량 0.75 ml까지 농축시켰다. 단백질 농도는, 소과의 감마 글로불린을 표준물질로 하는 바이오라드 단백질 분석 키트 (Biorad Protein Assay Kit)를 사용하여 결정하였다.The following experimental method is similar to that developed for the purification of W-14 and purifying only those fractions with the highest activity against Southern Corn Root (SCR) as determined in biological quantification (see Example 13). Was established on the basis of In general, as described in Example 13, filtered 4-20 L broth was received and concentrated using an Amicon helical ultrafiltration cartridge type S1Y100 attached to an Amicon M-12 filtration device. The residue contained natural proteins of molecular size greater than 100 kDa, and the permeate contained natural proteins of size less than 100 kDa. Most of the activity for SCR was contained in 100 kDa residues. The residue was then diafiltered with 10 mM sodium phosphate buffer (pH 7.0) until the A 280 of the filtrate was less than 0.100. Unless otherwise noted, all treatments from now on were performed in buffer limited to 10 mM sodium phosphate (pH 7.0). The residue was then concentrated to a final volume of about 0.20 L and filtered using 0.45 mm sterile filtration units from Nalgene Filterware. Pharmacia filled with filtered material with Perceptep Biosystem Poros® 50 HQ strong anion exchange matrix equilibrated with buffer using PerSeptive Biosystem Sprint HPLC system ) Loaded into the HR16 / 10 column at 7.5 ml per minute. After loading, the column was washed with buffer until A 280 was 0.100. Proteins were then eluted from the column at 50 ml total volume for 50 minutes at 2.5 ml per minute using a buffer with 0.4 M NaCl. The column was then washed further with buffer with 1.0 M NaCl at the same effluent rate for 20 minutes (final volume 50 ml). Proteins eluted with 0.4 M and 1.0 M NaCl were placed in separate dialysis bags (Spectra / Por membrane MWCO: 2000) and dialyzed overnight at 4 ° C. in 12 L buffer. Most were contained in a 0.4 M fraction, further by loading 20 ml of 0.4 M fraction at 0.75 ml per minute into a Pharmacia XK 26/100 column prefilled with Sepharose CL4B (from Pharmacia). The fractions were further collected on the basis of the A 280 peak profile and the final dose 0.75 ml using a Millipore Ultrafree-15 centrifugal filtration device Biomax-50K NMWL membrane. Protein concentration was determined using the Biorad Protein Assay Kit, based on bovine gamma globulin as a standard.

특성화Specialization

SCR 독소 복합체의 천연 분자량은 완충액에 있는 세파로스 CL4B로 선충전시킨 파마시아 HR 16/50을 사용하여 결정되었다. 그 후, 컬럼을 독소의 대략적인 천연 분자 크기를 계산하기 위하여 공지된 분자 크기의 단백질을 사용하여 캘리브레이션 (calibration)시켰다. 표 21에 나타낸 것과 같이, 독소 복합체의 분자 크기는 균주 Hb 경우의 777 kDa 내지 균주 WX-14 경우의 1900 kDa의 범위였다. 독소 복합체의 수율 또한 다양하였는데, 균주 WX-12 경우의 리터 당 0.8 mg 내지 균주 Hb 경우의 리터당 7.0 mg을 생산하였다.The natural molecular weight of the SCR toxin complex was determined using Pharmacia HR 16/50 precharged with Sepharose CL4B in buffer. The column was then calibrated using known molecular size proteins to calculate the approximate natural molecular size of the toxin. As shown in Table 21, the molecular size of the toxin complex ranged from 777 kDa for strain Hb to 1900 kDa for strain WX-14. Yields of the toxin complex also varied, producing 0.8 mg per liter of strain WX-12 and 7.0 mg per liter of strain Hb.

독소 복합체에서 발견되는 단백질을 SDS-PAGE 분석을 사용하여 개개의 폴리펩티드 크기를 조사하였다. 일반적으로, 각 균주로부터의 20 mg의 독소 복합체 단백질을 2-15% 폴리아크릴아미드 겔 (인테그레이티드 세퍼레이션 시스템즈 (Integration Separation Systems)) 상에 로딩시켜, 바이오라드 SDS-PAGE 완충액에서 20 mA로 전기 영동시켰다. 전기 영동 완료 후, 바이오라드 쿠마지 블루 R-250 (Coomassie blue R-250, 메탄올: 아세트산: 물 (용량비 40: 10: 40) 혼합 용액에서 2%임)에서 철야 착색시켰다. 그 후 겔을 메탄올: 아세트산: 물 (용량비 40: 10: 40)에서 탈색시켰다. 이어서, 겔을 물로 15분간 헹구고 개인용 분자 역학 레이저 농도계 (등록상표 Molecular Dynamics Personal Laser Densitometer)를 사용하여 주사시켰다. 레인을 정량화하여 200 내지 45 kDa 범위의 바이오라드 고분자량 표준물에 비교하여 분자 크기를 추정하였다.Proteins found in toxin complexes were examined for individual polypeptide sizes using SDS-PAGE analysis. In general, 20 mg of toxin complex protein from each strain was loaded on a 2-15% polyacrylamide gel (Integration Separation Systems) and loaded at 20 mA in Biorad SDS-PAGE buffer. Electrophoresis. After completion of electrophoresis, overnight coloring was performed on Biorad Coomassie blue R-250 (Coomassie blue R-250, methanol: acetic acid: water (2% in a volume ratio of 40: 10: 40) mixed solution). The gel was then decolorized in methanol: acetic acid: water (volume ratio 40:10: 40). The gel was then rinsed with water for 15 minutes and injected using a Personal Molecular Dynamics Personal Laser Densitometer. Lanes were quantified to estimate molecular size compared to Biorad high molecular weight standards ranging from 200 to 45 kDa.

각 균주로부터의 SCR 독소 복합체를 구성하는 개개의 폴리펩티드들의 크기를 표 22에 나타내었다. 개개의 폴리펩티드들의 크기는, 균주 WX-1 경우의 230 kDa 내지 균주 WX-7 경우의 16 kDa 범위였다. 균주 Hb를 제외한 모든 균주는 160 내지 230 kDa, 100 내지 160 kDa 및 50 내지 80 kDa의 독소 복합체를 포함하는 폴리펩티드를 가지고 있었다. 상기 데이타는, 독소 복합체가 펩티드 조성 및 성분 면에서 균주에 따라 다를 수 있지만, 모든 경우에 있어서 독소의 특성이 대형 올리고머 단백질 복합체로 이루어짐을 나타낸다.Table 22 shows the size of the individual polypeptides that make up the SCR toxin complex from each strain. The size of the individual polypeptides ranged from 230 kDa for strain WX-1 to 16 kDa for strain WX-7. All strains except strain Hb had a polypeptide comprising a toxin complex of 160-230 kDa, 100-160 kDa and 50-80 kDa. The data indicate that in all cases the toxin's properties consist of large oligomeric protein complexes, although the toxin complex may vary depending on the strain in terms of peptide composition and composition.

비 W-14 포토랍두스 균주로부터의 독소 복합체의 특성화Characterization of Toxin Complexes from Non-W-14 Photorapid Strains 균주Strain 천연 분자량 근사치a Natural molecular weight approximation a 활성 분획 수득량 (mg/L)b Active fraction yield (mg / L) b H9H9 972,000972,000 1.81.8 HbHb 777,000777,000 7.07.0 HmHm 1,400,0001,400,000 1.11.1 HP88HP88 813,000813,000 2.52.5 NC1NC1 1,092,0001,092,000 3.33.3 WIRWIR 979,000979,000 1.01.0 WX-1WX-1 973,000973,000 0.80.8 WX-2WX-2 951,000951,000 2.22.2 WX-7WX-7 1,000,0001,000,000 1.51.5 WX-12WX-12 898,000898,000 0.40.4 WX-14WX-14 1,900,0001,900,000 1.91.9 W-14W-14 860,000860,000 7.57.5 a 세파로스 CL4B로 충전시킨 파마시아 HR 16/50 컬럼을 사용하여 결정된 천연 분자량a Natural molecular weight determined using a Pharmacia HR 16/50 column packed with Sepharose CL4B b 배양 브로쓰로부터 회수된 독소 복합체의 양b amount of toxin complex recovered from the culture broth

활성 범위Active range

표 23에 나타낸 바와 같이, 균주 Hm 및 H9으로부터 정제된 독소 복합체들을 균주 W-14로부터의 독소 복합체와 비교하여 각종 곤충들에 대한 활성을 시험하였다. 분석은 실시예 13에 기술된 바와 같이 수행하였다. 세가지 모든 균주로부터의 독소 복합체는 담배 버드 웜, 유럽 옥수수 천공충, 써던 옥수수 뿌리 벌레, 및 별 매미충에 대하여 활성을 나타내었다. 또한, 균주 Hm 및 W-14로부터의 독소 복합체는 점박이 거미 진드기에 대한 활성을 나타내었다. 게다가, W-14로부터의 독소 복합체는 모기 유충에 대한 활성도 나타내었다. 상기 데이타는, 독소 복합체가 몇몇 곤충 종 사이에서 유사한 활성을 가지고 있는 반면, 다른 곤충 종에 대한 차별적인 활성을 또한 나타낼 수 있음을 뜻한다.As shown in Table 23, the toxin complexes purified from strains Hm and H9 were compared to the toxin complexes from strain W-14 to test the activity against various insects. The analysis was performed as described in Example 13. Toxin complexes from all three strains showed activity against tobacco bud worms, European corn borer, southern corn root beetle, and star cicada. In addition, toxin complexes from strains Hm and W-14 showed activity against spotted spider mites. In addition, the toxin complex from W-14 also showed activity against mosquito larvae. This data means that while the toxin complex has similar activity among some insect species, it may also exhibit differential activity against other insect species.

비 W-14 포토랍두스로부터의 정제 독소 복합체에서의 펩티드 크기의 근사치 (kDa)Approximate Value of Peptide Size (kDa) in Purified Toxin Complex from Non W-14 Photorapdus H9H9 HbHb HmHm HP88HP88 NC-1NC-1 WIRWIR WX-1WX-1 WX-2WX-2 WX-7WX-7 WX-12WX-12 WX-14WX-14 W-14W-14 180180 150150 170170 170170 180180 170170 230230 200200 200200 180180 210210 190190 170170 140140 140140 160160 170170 160160 190190 170170 180180 160160 180180 180180 160160 139139 100100 140140 140140 120120 170170 150150 110110 140140 160160 170170 140140 130130 8181 130130 110110 110110 160160 120120 8787 139139 120120 160160 120120 120120 7272 129129 4444 8989 110110 110110 7575 130130 110110 150150 9898 100100 6868 110110 1616 7979 9898 8282 4343 110110 100100 130130 8787 9898 4949 100100 7474 7676 6464 3333 9292 9595 120120 8484 8888 4646 8686 6262 5858 3737 2828 8787 8080 110110 7979 8181 3030 8181 5151 5353 3030 2626 8080 6969 9393 7272 7575 2222 7777 4040 4141 2323 7373 4949 9090 6868 6969 2020 7373 3939 3535 2222 5959 4141 7777 6060 6060 1919 6060 3737 3131 2121 5656 3333 6969 5757 5757 5858 3333 2828 1919 5151 6565 5252 5454 4545 3030 2424 1818 3737 6363 4646 4949 3939 2828 2222 1616 3333 6060 4040 4444 3535 2727 3232 5151 3737 3939 2525 2626 4646 3737 2323 4040 3535 3939 2929

포토랍두스 균주들로부터의 정제 독소 복합체의 살충 범위 관측치Insecticidal Range Observations of Purified Toxin Complexes from Photoractose Strains 포토랍두스 균주Photolapux strain 감수성* 곤충 종Susceptibility * Insect Species Hm 독소 복합체Hm toxin complex 1**, 2, 3, 5, 6, 7, 81 **, 2, 3, 5, 6, 7, 8 H9 독소 복합체H9 toxin complex 1, 2, 3, 6, 7, 81, 2, 3, 6, 7, 8 W-14 독소 복합체W-14 Toxin Complex 1, 2, 3, 4, 5, 6, 7, 81, 2, 3, 4, 5, 6, 7, 8 * = >25% 치사율 또는 성장 저해율* = > 25% mortality rate or growth inhibition rate * = >25% 치사율 또는 성장 저해율* = > 25% mortality rate or growth inhibition rate ** = 1; 담배 버드 웜, 2; 유럽형 옥수수 천공충, 3; 서던 옥수수 뿌리벌레, 4; 모기, 5; 점박이 거미 진드기, 6; 애스터 멸구, 7; 과일 파리, 8; 목화 바구미** = 1; Tobacco Bud Worm, 2; European corn borer, 3; Southern Corn Roots, 4; Mosquitoes, 5; Spotted spider mite, 6; Astor extinction, 7; Fruit fly, 8; Cotton weevil

〈실시예 15〉<Example 15>

포토랍두스 단백질 독소 복합체의 하위 분획Subfraction of the Photoractus Protein Toxin Complex

포토랍두스 단백질 독소 복합체를 실시예 14에 기술된 바와 같이 단리시켰다. 다음, 독소 약 10 mg을 pH 7.0의 20 mM Tris-HCl로 평형시킨 모노큐 (MonoQ) 5/5 컬럼에 1 ml/분의 유출 속도로 로딩시켰다. 280 nm에서의 광학상의 농도가 기준선 흡광도로 되돌아갈 때까지 컬럼을 pH 7.0의 20 mM Tris-HCl로 세척시켰다. 컬럼에 부착되어 있는 단백질은, pH 7.0의 20 mM Tris-HCl에 녹아 있는 0 내지 1.0 M 선형 농도 구배 NaCl을 사용, 1 ml/분의 속도로 30분간 용출시켰다. 1 ml의 분획을 모아 써던 옥수수 뿌리벌레 (SCR) 생물학적 정량을 실시하였다(실시예 13 참조). 활성 피크들은 SCR 생물학적 정량에서 각 분획을 차례로 희석시킴으로써 결정하였다. SCR에 대한 두 개의 활성 피크를 관찰하였는데 이들을 A (약 0.2 내지 0.3 M NaCl에서 용출시킴.) 및 B (0.3 내지 0.4 M NaCl에서 용출시킴)로 명명하였다. 활성 피크 A 및 B를 개별적으로 모아 하기 3 단계 처리를 하여 두 피크를 한층 더 정제하였다.Photolapus protein toxin complex was isolated as described in Example 14. About 10 mg of toxin was then loaded into a MonoQ 5/5 column equilibrated with 20 mM Tris-HCl, pH 7.0, at an effluent rate of 1 ml / min. The column was washed with 20 mM Tris-HCl at pH 7.0 until the concentration of the optical phase at 280 nm returned to baseline absorbance. The protein attached to the column was eluted for 30 minutes at a rate of 1 ml / min using a 0 to 1.0 M linear concentration gradient NaCl dissolved in 20 mM Tris-HCl at pH 7.0. A single corn rootworm (SCR) biological quantification was performed by collecting the 1 ml fraction (see Example 13). Activity peaks were determined by diluting each fraction in turn in SCR biological quantification. Two activity peaks for SCR were observed, named A (eluted in about 0.2-0.3 M NaCl) and B (eluted in 0.3-0.4 M NaCl). The active peaks A and B were collected separately and subjected to the following three steps treatment to further refine both peaks.

고형 (NH4)2SO4를 상기 단백질 분획에 첨가하여 최종 농도가 1.7 M이 되게 하였다. 그 후, 단백질을 pH 7의 50 mM 인산 칼륨 완충액에 녹아 있는 1.7 M (NH4)2SO4로 평형시킨 페닐-수퍼로스 (phenyl-Suprose) 5/5 컬럼에 1 ml/분으로 로딩시켰다. 컬럼에 부착되어 있는 단백질들은 1.7 M (NH4)2SO4, 0% 에틸렌 글리콜, pH 7.0의 50 mM 인산 나트륨 내지 25% 에틸렌 글리콜, pH 7.0의 25 mM 인산 나트륨 ((NH4)2SO4부재)의 선형 농도 구배로 0.5 ml/분의 속도에서 용출시켰다. 분획은, pH 7.0의 10 mM 인산 나트륨에 대하여 철야 투석시켰다. SCR에 대한 각 분획에서의 활성을 생물학적 정량으로 결정하였다.Solid (NH 4 ) 2 SO 4 was added to the protein fraction to a final concentration of 1.7 M. The protein was then loaded at 1 ml / min on a phenyl-Suprose 5/5 column equilibrated with 1.7 M (NH 4 ) 2 SO 4 dissolved in 50 mM potassium phosphate buffer at pH 7. The proteins attached to the column are 1.7 M (NH 4 ) 2 SO 4 , 0% ethylene glycol, 50 mM sodium phosphate at pH 7.0 to 25% ethylene glycol, 25 mM sodium phosphate ((NH 4 ) 2 SO 4 at pH 7.0 Eluted at a rate of 0.5 ml / min. Fractions were dialyzed overnight against 10 mM sodium phosphate at pH 7.0. Activity in each fraction for SCR was determined by biological quantitation.

가장 높은 활성을 가지는 분획을 모아 pH 7.0의 20 mM Tris-HCl로 평형시킨 모노큐 5/5 컬럼에 1 ml/분으로 로딩시켰다. 컬럼에 부착되어 있는 단백질들은 pH 7.0의 20 mM Tris-HCl에 녹아 있는, 0 내지 1 M 선형 농도 구배의 NaCl로 1 ml/분의 속도에서 용출시켰다.Fractions with the highest activity were collected and loaded at 1 ml / min on a MonoQ 5/5 column equilibrated with 20 mM Tris-HCl at pH 7.0. Proteins attached to the column were eluted at a rate of 1 ml / min with NaCl in a 0-1 M linear concentration gradient dissolved in 20 mM Tris-HCl at pH 7.0.

정제의 최종 단계를 위하여, 상기 가장 높은 활성을 나타내는 분획을 모아 두 번째 페닐-수퍼로스 5/5 컬럼에 로딩시켰다. 고형 (NH4)2SO4를 최종 농도가 1.7 M이 되게 첨가하였다. 그 후, 용액을 pH 7.0의 50 mM 인산 칼륨 완충액에 녹아 있는 1.7 M (NH4)2SO4로 평형시킨 컬럼상에 1 ml/분으로 로딩시켰다. 컬럼에 부착되어 있는 단백질들은 1.7 M (NH4)2SO4, pH 7.0의 50 mM 인산 칼륨 내지 pH 7.0의 10 mM 인산 칼륨 선형 농도 구배로 0.5 ml/분으로 용출시켰다. 분획들을 pH 7.0의 10 mM 인산 나트륨 완충액에 대하여 철야 투석시켰다. SCR에 대한 각 분획에서의 활성은 생물학적 정량으로 결정하였다.For the final step of purification, the highest active fractions were collected and loaded onto a second phenyl-superrose 5/5 column. Solid (NH 4 ) 2 SO 4 was added to a final concentration of 1.7 M. The solution was then loaded at 1 ml / min on a column equilibrated with 1.7 M (NH 4 ) 2 SO 4 dissolved in 50 mM potassium phosphate buffer at pH 7.0. The proteins attached to the column were eluted at 0.5 ml / min with a linear gradient of 1.7 M (NH 4 ) 2 SO 4 , 50 mM potassium phosphate at pH 7.0 to 10 mM potassium phosphate at pH 7.0. Fractions were dialyzed overnight against 10 mM sodium phosphate buffer at pH 7.0. Activity in each fraction for SCR was determined by biological quantitation.

상기 3단계 처리로, 피크 A로부터 최종 정제된 단백질을 독소 A라 명명하였고, 피크 B로부터 최종 정제된 단백질을 독소 B라 명명하였다.With this three step treatment, the final purified protein from peak A was named toxin A, and the final purified protein from peak B was named toxin B.

독소 A 및 독소 B의 특성화 및 아미노산 서열 결정Characterization and Amino Acid Sequencing of Toxin A and Toxin B

SDS-PAGE에서, 독소 A 및 독소 B는 모두 192 kDa (각각 A1 및 B1으로 명명) 및 58 kDa (각각 A2 및 B2로 명명)인 두 개의 주요 펩티드 (전체 쿠마지 착색 단백질의 〉90%)를 포함하였다. 독소 A 및 독소 B는 모두 천연 PAGE 상에서는 1개의 주요 밴드만을 나타내었는데, 이는 A1 및 A2가 한 단백질 복합체의 서브유닛이며, B1 및 B2는 한 단백질 복합체의 서브유닛이라는 것을 나타낸다. 또한, 독소 A 및 독소 B 모두의 천연 분자량은 겔 여과 크로마토그래피에 의해 860 kDa으로 결정되었다. A1 대 A2의 상대 몰 농도는 SDS-PAGE 겔의 농도계 분석으로 결정한 바, 1 대 1 등량인 것으로 판단되었다. 유사하게, B1 및 B2 펩티드는 동일 몰 농도로 존재하였다.In SDS-PAGE, toxin A and toxin B both contained two major peptides (> 90% of total Kumaji coloring protein), which were both 192 kDa (named A1 and B1) and 58 kDa (named A2 and B2, respectively). Included. Toxin A and toxin B both showed only one major band on natural PAGE, indicating that A1 and A2 are subunits of one protein complex and B1 and B2 are subunits of one protein complex. In addition, the natural molecular weight of both toxin A and toxin B was determined to be 860 kDa by gel filtration chromatography. Relative molar concentrations of A1 to A2 were determined to be one-to-one equivalent, as determined by densitometry analysis of the SDS-PAGE gel. Similarly, the B1 and B2 peptides were present at equal molar concentrations.

독소 A 및 독소 B를 10% SDS-PAGE에서 전기 영동시켰으며, PVDF 막으로 이동시켜 블로팅시켰다. 아미노산 분석 및 N-말단 아미노산 서열 결정을 위하여, 블롯을 하바드 마이크로켐 (Harvard MicroChem) 및 캠브리지 프로켐 (Cambridge ProChem)으로 각각 보냈다. B1의 N-말단 아미노 서열은 서열 1인 tcbA 유전자의 TcbAii영역 (서열 12, 87 내지 99 위치)와 동일하다는 것이 밝혀졌다. 펩티드 B2의 N-말단 특이 서열이 획득되었다(서열: 40). 펩티드 B2의 N-말단 아미노산 서열은 tcbA 유전자로부터 추정된 아미노산 서열의 TcbAiii영역 (서열: 12, 1935 내지 1945 위치)와 동일하였다. 그러므로, B 독소는 동일 유전자 생성물인 TcbA로부터 유래된 것으로 관찰된 두 종의 펩티드 TcbAii및 TcbAiii를 주로 포함하고 있다.Toxin A and Toxin B were electrophoresed on 10% SDS-PAGE and blotted by transfer to PVDF membrane. For amino acid analysis and N-terminal amino acid sequencing, blots were sent to Harvard MicroChem and Cambridge ProChem, respectively. The N-terminal amino sequence of B1 was found to be identical to the TcbA ii region (SEQ ID NOs. 12, 87-99) of the tcbA gene, SEQ ID NO: 1. The N-terminal specific sequence of peptide B2 was obtained (SEQ ID NO: 40). The N-terminal amino acid sequence of peptide B2 was identical to the TcbA iii region (SEQ ID NOs: 12, 1935-1945) of the amino acid sequence estimated from the tcbA gene. Therefore, the B toxin mainly contains two peptides TcbA ii and TcbA iii which have been observed to be derived from the same gene product TcbA.

A2의 N-말단 서열 (서열: 41)은 TcbAiii펩티드 및 다른 펩티드와 비교시 특유하다. A2 펩티드는 TcdAiii로 나타내었다(실시예 17 참조). 서열 6은 서열 40 및 41의 혼합 아미노산 서열로 밝혀졌다.The N-terminal sequence of A2 (SEQ ID NO: 41) is unique when compared to TcbA iii peptides and other peptides. The A2 peptide is shown as TcdA iii (see Example 17). SEQ ID NO: 6 was found to be the mixed amino acid sequence of SEQ ID NO: 40 and 41.

펩티드 A1 및 A2에 대하여 내부 아미노산 서열 결정을 또한 실시하였다. 내부 아미노산 서열 결정을 위하여 10μg의 독소 A를 10% SDS-PAGE에서 전기 영동시키고 PVDF 막에 이동시켜 블로팅시켰다. 블롯을 아미도 블랙으로 착색시킨 후, 각각 TcdAii및 TcdAiii로 나타낸 펩티드 A1 및 A2를 블롯으로부터 오려내어 하바드 마이크로켐 및 캠브리지 프로켐으로 보냈다. 펩티드를 트립신으로 분해시킨 후 HPLC 크로마토그래피를 실시하여, 개개의 펩티드를 분리시켰다. 선택된 트립신 처리 펩티드 단편에 대해 N-말단 아미노산 분석을 수행하였다. 펩티드 A1의 두 가지 내부 아미노산 서열 (TcdAii-PK71, 서열: 38 및 TcdAii-PK44, 서열: 39)은 tcbA 유전자 (서열: 12) TcbAii 영역의 추정 아미노산 서열과 현저한 상동성를 가지고 있음이 판명되었다. 유사하게, 펩티드 A2의 N-말단 서열 (서열: 41) 및 두 가지 내부 서열 (TcdAiii-PK57, 서열: 42 및 TcdAiii-PK20, 서열: 43)은 또한 tcbA 유전자 (서열: 12) TcbAiii영역의 추정 아미노산 서열과의 현저한 상동성를 보였다.Internal amino acid sequencing was also performed for peptides A1 and A2. For internal amino acid sequencing 10 μg of toxin A was electrophoresed on 10% SDS-PAGE and transferred to PVDF membranes for blotting. After blots were stained with amido black, peptides A1 and A2, represented by TcdA ii and TcdA iii , respectively, were cut out of the blot and sent to Harvard microchem and Cambridge prochem. Peptides were digested with trypsin followed by HPLC chromatography to separate individual peptides. N-terminal amino acid analysis was performed on selected trypsin treated peptide fragments. The two internal amino acid sequences of peptide A1 (TcdA ii -PK71, SEQ ID NO: 38 and TcdA ii -PK44, SEQ ID NO: 39) were found to have significant homology with the putative amino acid sequence of the tcbA gene (SEQ ID NO: 12) TcbAii region. . Similarly, the N-terminal sequence of SEQ ID NO: 41 (SEQ ID NO: 41) and the two internal sequences (TcdA iii -PK57, SEQ ID NO: 42 and TcdA iii -PK20, SEQ ID NO: 43) also represent the tcbA gene (SEQ ID NO: 12) TcbA iii There was marked homology with the putative amino acid sequence of the region.

상기 결과들을 요약해 보면, 독소 복합체는 SCR에 대하여 독소 A 및 독소 B의 두 가지 이상의 활성 단백질 독소 복합체들을 가지고 있다. 독소 A 및 독소 B는 천연 분자량 및 서브유닛 분자량에 있어서 유사하지만, 그들 펩티드의 조성은 다르다. 독소 A는 펩티드 TcdAii및 TcdAiii를 주요 펩티드로서 포함하고 있으며, 독소 B는 펩티드 TcbAii및 TcbAiii를 주요 펩티드로서 포함하고 있다.Summarizing the results, the toxin complex has two or more active protein toxin complexes of toxin A and toxin B for SCR. Toxin A and toxin B are similar in their natural and subunit molecular weights, but the composition of these peptides is different. Toxin A contains peptides TcdA ii and TcdA iii as main peptides, and toxin B contains peptides TcbA ii and TcbA iii as main peptides.

독소 C, Tca 펩티드의 정제 및 특성화Purification and Characterization of Toxin C, Tca Peptides

포토랍두스 단백질 독소 복합체를 상기 설명한 바와 같이 분리하였다. 이 다음에, 독소 약 50mg을 2ml/분의 유속에서 pH 7.0의 20mM Tris-HCl로 평형시킨 MonoQ 10/10 칼럼에 가하였다. 280nm에서의 광학 밀도가 기준선 수준으로 돌아갈 때까지 이 칼럼을 pH 7.0의 20mM Tris-HCl로 세척하였다. 이 칼럼에 결합되어 있는 단백질을 60분 동안 2ml/분에서 pH 7.0의 20mM Tris-HCl 중의 0 내지 1M NaCl의 선형 구배를 사용하여 용출시켰다. 2ml의 분획을 모아서 1차 항체로서 pAb TcaBii-syn 항체 (실시예 21 참조)를 사용하여 웨스턴 분석을 하였다. pAb TcaBii-syn 항체와 반응시킨 분획을 모아서 최종 농도가 1.7M이 될때까지 고체 (NH4)2SO4를 첨가하였다. 이어서, 단백질을 1ml/분에서 pH 7의 50mM 인산 칼륨 완충액 중의 1.7M (NH4)2SO4로 평형시킨 페닐-수퍼로스 10/10 칼럼에 가하였다. 이 칼럼에 결합되어 있는 단백질을 120분 동안 1ml/분에서 1.7M (NH4)2SO4, pH 7.0의 50mM 인산 칼륨 내지 pH 7.0의 10mM 인산 칼륨의 선형 구배를 사용하여 용출시켰다. 2ml의 분획을 모아서 pH 7.0의 10mM 인산 나트륨 완충액으로 하룻밤 동안 투석시키고, 1차 항체로서 pAb TcaBii-syn 항체를 사용하여 웨스턴 블롯에 의해 분석하였다.Photolapus protein toxin complex was isolated as described above. About 50 mg of toxin was then added to a MonoQ 10/10 column equilibrated with 20 mM Tris-HCl at pH 7.0 at a flow rate of 2 ml / min. The column was washed with 20 mM Tris-HCl at pH 7.0 until the optical density at 280 nm returned to baseline level. The protein bound to this column was eluted using a linear gradient of 0-1 M NaCl in 20 mM Tris-HCl at pH 7.0 at 2 ml / min for 60 minutes. Fractions of 2 ml were pooled and subjected to Western analysis using pAb TcaB ii- syn antibody (see Example 21) as the primary antibody. Fractions reacted with the pAb TcaB ii- syn antibody were collected and solid (NH 4 ) 2 SO 4 was added until the final concentration was 1.7M. The protein was then added to a phenyl-superrose 10/10 column equilibrated with 1.7 M (NH 4 ) 2 SO 4 in 50 mM potassium phosphate buffer at pH 7 at 1 ml / min. 1.7M (NH 4) at 1ml / min for 120 minutes to a protein that is bound to this column and eluted using a linear gradient of 2 SO 4, 10mM potassium phosphate, 50mM of potassium phosphate of pH 7.0 to pH 7.0. Fractions of 2 ml were combined and dialyzed overnight with 10 mM sodium phosphate buffer at pH 7.0 and analyzed by Western blot using pAb TcaB ii- syn antibody as the primary antibody.

상기 항체와 교차 반응시킨 분획을 모아서 1ml/분에서 pH 7.0의 20 mM Tris-HCl로 평형시킨 MonoQ 5/5 칼럼에 가하였다. 이 칼럼에 결합되어 있는 단백질을 30분 동안 pH 7.0의 20 mM Tris-HCl 중의 0 내지 1M NaCl의 선형 구배에 의해 1ml/분에서 용출시켰다.Fractions cross reacted with the antibody were pooled and added to a MonoQ 5/5 column equilibrated with 20 mM Tris-HCl at pH 7.0 at 1 ml / min. The protein bound to this column was eluted at 1 ml / min by a linear gradient of 0-1 M NaCl in 20 mM Tris-HCl at pH 7.0 for 30 minutes.

상기에서 pAb TcaBii-syn 항체와 반응시킨 분획을 모아서 페닐-수퍼로스 5/5 칼럼에 가하였다. 최종 농도가 1.7M이 될때까지 고체 (NH4)2SO4를 첨가하였다. 이어서, 이 용액을 1ml/분에서 pH 7.0의 50mM 인산 칼륨 완충액 중의 1.7M (NH4)2SO4로 평형시킨 칼럼에 가하였다. 이어서, 이 칼럼에 결합되어 있는 단백질을 60분 동안 1.7M (NH4)2SO4, pH 7.0의 50mM 인산 칼륨 내지 pH 7.0의 10mM 인산 칼륨의 선형 구배를 사용하여 용출시켰다. 분획은 pH 7.0의 10mM 인산 나트륨 완충액으로 하룻밤 동안 투석시켰다.Fractions reacted with the pAb TcaB ii- syn antibody were collected and added to the Phenyl-Superrose 5/5 column. Solid (NH 4 ) 2 SO 4 was added until the final concentration was 1.7M. This solution was then added to a column equilibrated with 1.7 M (NH 4 ) 2 SO 4 in 50 mM potassium phosphate buffer at pH 7.0 at 1 ml / min. The protein bound to this column was then eluted for 60 minutes using a linear gradient of 1.7 M (NH 4 ) 2 SO 4 , 50 mM potassium phosphate at pH 7.0 to 10 mM potassium phosphate at pH 7.0. Fractions were dialyzed overnight with 10 mM sodium phosphate buffer at pH 7.0.

최종 정제 단계에서는, 웨스턴 분석에 의해 상기에서 측정된 pAb TcaBii-syn 항체와 반응시킨 분획을 모아서 1ml/분에서 pH 7.0의 20mM Tris-HCl로 평형시킨 MonoQ 5/5 칼럼에 가하였다. 이 칼럼에 결합되어 있는 단백질은 30분 동안 pH 7.0의 20mM Tris-HCl 중의 0 내지 1M NaCl의 선형 구배에 의해 1ml/분에서 용출시켰다.In the final purification step, fractions reacted with the pAb TcaB ii- syn antibody measured above by Western analysis were collected and added to a MonoQ 5/5 column equilibrated with 20 mM Tris-HCl at pH 7.0 at 1 ml / min. The protein bound to this column was eluted at 1 ml / min by a linear gradient of 0-1 M NaCl in 20 mM Tris-HCl at pH 7.0 for 30 minutes.

최종 정제된 단백질 분획은 SDS-PAGE에 의해 시험된 6개의 주요 펩티디, 165kDa, 90kDa, 64kDa, 62kDa, 58kDa 및 22kDa를 함유하였다. 이와 같이 정제된 분획의 살충 활성의 LD50은 SCR 및 ECB 각각에 대해 100ng 및 500ng으로 측정되었다.The final purified protein fraction contained six major peptides, 165kDa, 90kDa, 64kDa, 62kDa, 58kDa and 22kDa, tested by SDS-PAGE. The LD50 of the pesticidal activity of this purified fraction was determined to be 100ng and 500ng for SCR and ECB, respectively.

상기 펩티드를 PVDF 멤브레인으로 블롯시키고, 블롯들을 각각 Harvard MicroChem 및 Cambridge ProChem에 아미노산 분석 및 5개의 아미노산 N-말단 서열화를 위해 보냈다. 165kDa 펩티드의 N-말단 아미노산 서열은 펩티드 TcaC (서열 2, 1 내지 5 위치)와 동일한 것으로 결정되었다. 90kDa 펩티드의 N-말단 아미노산 서열은 tcaA 유전자 (서열 33, 254 내지 258 위치)의 아미노산 서열에서 유도된 TcaAii영역인 것으로 결정되었다. 64kDa 펩티드의 N-말단 아미노산 서열은 펩티드 TcaBi(서열 3, 1 내지 5 위치)와 동일한 것으로 결정되었다. 62kDa 펩티드의 N-말단 아미노산 서열은 tcaA 유전자 (서열 33, 489 내지 493 위치)의 아미노산 서열에서 유도된 TcaAii영역인 것으로 결정되었다. 58kDa 펩티드의 N-말단 아미노산 서열은 펩티드 TcaBii(서열 5, 1 내지 5 위치)와 동일한 것으로 결정되었다. 22kDa 펩티드 (서열 62)의 N-말단 아미노산 서열은 tcaA 유전자 (서열 34, 98 내지 102 위치)의 아미노산 서열에서 유도된 TcaAiv로 표시된 TcaAi영역인 것으로 결정되었다. 모든 tcaA, tcaB 및 tcaC 유전자가 동일한 tca 오페론에 있다는 것이 주목된다 (도 6A).The peptides were blotted into PVDF membranes and blots were sent to Harvard MicroChem and Cambridge ProChem for amino acid analysis and five amino acid N-terminal sequencing, respectively. The N-terminal amino acid sequence of the 165 kDa peptide was determined to be the same as peptide TcaC (SEQ ID NOS: 2, 1-5 positions). The N-terminal amino acid sequence of the 90 kDa peptide was determined to be the TcaA ii region derived from the amino acid sequence of the tcaA gene (SEQ ID NOs: 33, 254-258). The N-terminal amino acid sequence of the 64 kDa peptide was determined to be identical to the peptide TcaB i (SEQ ID NOS: 3, 1-5 positions). The N-terminal amino acid sequence of the 62 kDa peptide was determined to be the TcaA ii region derived from the amino acid sequence of the tcaA gene (positions 33, 489-493). The N-terminal amino acid sequence of the 58 kDa peptide was determined to be identical to peptide TcaB ii (SEQ ID NOs: 5, 1-5 positions). The N-terminal amino acid sequence of the 22 kDa peptide (SEQ ID NO: 62) was determined to be the TcaA i region designated TcaA iv derived from the amino acid sequence of the tcaA gene (positions 34, 98-102). It is noted that all tcaA, tcaB and tcaC genes are in the same tca operon (FIG. 6A).

정제된 Tca 분획, 정제된 독소 A, 및 정제된 독소 B 5 ㎍을 1차 항체로서 pAb TcaBii-syn 항체, mAb CF52 항체, pAb TcdAii-syn 항체, 및 pAb Tcdiii-syn 항체와 같은 항체를 개별적으로 사용하여 웨스턴 블롯에 의해 분석하였다 (실시예 21). pAb TcaBii-syn 항체와는 정제된 Tca 펩티드 분획만을 반응시키고, 독소 A 및 독소 B는 반응시키지 않는다. mAb CF52 항체와는 독소 B만을 반응시키고, Tca 펩티드 분획 또는 독소 A는 반응시키지 않는다. pAb TcdAii-syn 항체 또는 pAb Tcdiii-syn 항체와는 독소 A만을 반응시키고, Tca 펩티드 분획 또는 독소 B는 반응시키지 않는다. 이는, 정제된 Tca 펩티드 분획에서 관찰된 살충 활성이 독소 A 및 독소 B와는 무관하다는 것을 증명한다. 정제된 Tca 펩티드 분획은 독소 C로 표시되는 제3의 독특한 단백질 독소이다.5 μg of purified Tca fraction, purified toxin A, and purified toxin B as the primary antibody, antibodies such as pAb TcaB ii- syn antibody, mAb CF52 antibody, pAb TcdA ii- syn antibody, and pAb Tcd iii- syn antibody Were analyzed by Western blot using individually (Example 21). Only the purified Tca peptide fraction was reacted with the pAb TcaB ii- syn antibody, but not toxin A and toxin B. Only toxin B is reacted with mAb CF52 antibody but not the Tca peptide fraction or toxin A. Only toxin A is reacted with the pAb TcdA ii- syn antibody or pAb Tcd iii- syn antibody, but not with the Tca peptide fraction or toxin B. This demonstrates that the pesticidal activity observed in the purified Tca peptide fraction is independent of toxin A and toxin B. The purified Tca peptide fraction is the third unique protein toxin represented by toxin C.

〈실시예 16〉<Example 16>

TcbA 펩티드의 분해 및 활성화Degradation and Activation of TcbA Peptides

독소 B 복합체에서 펩티드 TcbAii및 TcbAiii는 단일 유전자 생성물인 TcbA로부터 유래한다(실시예 15). TcbA 펩티드가 TcbAii및 TcbAiii로 프로세싱되는 것은 아마도 포토랍두스 단백질 분해효소(들), 가장 가능성 있게는, 실시예 10에서 기술한 메탈로프로테아제의 작용에 의한 것으로 추정된다. 몇몇 경우에서, 포토랍두스 W-14 브로쓰가 프로세싱되었을 때 펩티드 TcbAii및 TcbAiii뿐만 아니라 TcbA 펩티드도 독소 B 복합체에서 주요 성분으로 존재한다는 것을 알았다. W-14 브로쓰의 독소 복합체 분획으로부터 펩티드 TcbA를 모으기 위해, 독소 B 복합체의 정제에서 기술된 것과 (실시예 15) 동일한 방법을 사용하였다. 최종 정제 물질을 4-20% 농도구배 SDS-PAGE에서 분석하였으며, 주요 펩티드는 농도계로 정량하였다. TcbA, TcbAii및 TcbAiii는 각각 전체 단백질의 58%, 36% 및 6%이었다. 상기 펩티드들의 본질은 SDS-PAGE에서의 각각의 분자 크기와 단일특이 항체를 사용한 웨스턴 블롯 분석으로 확인하였다. 상기 분획의 천연 분자량은 860 kDa으로 결정되었다.Peptides TcbA ii and TcbA iii in the toxin B complex are derived from the single gene product TcbA (Example 15). The processing of the TcbA peptides with TcbA ii and TcbA iii is probably due to the action of photolabose protease (s), most likely the metalloprotease described in Example 10. In some cases, it was found that TcbA peptides, as well as peptides TcbA ii and TcbA iii , were present as major components in the toxin B complex when the Photorabdus W-14 broth was processed. To collect peptide TcbA from the toxin complex fraction of W-14 broth, the same method as described in the purification of toxin B complex (Example 15) was used. The final purified material was analyzed on 4-20% gradient SDS-PAGE and the main peptides were quantified by densitometry. TcbA, TcbA ii and TcbA iii were 58%, 36% and 6% of total protein, respectively. The nature of the peptides was confirmed by Western blot analysis using individual molecular sizes and monospecific antibodies in SDS-PAGE. The natural molecular weight of the fraction was determined to be 860 kDa.

상기 정제 물질에, 38 kDa 및 58 kDa인 정제 W-14 포토랍두스 메탈로프로테아제로 처리하고 (실시예 10) 대조군 효소로서 트립신 (미주리주 소재, 시그마 (Sigma))을 처리함으로써 TcbA의 분해를 평가하였다. 표준 반응물에는, 전체 용량 100 μl 중에 상기 정제 분획 17.5 μg, 1.5 단위 프로테아제, 및 pH 8.0의 0.1 M Tris 완충액이 포함되어 있다. 대조군 반응에서는 프로테아제가 없다. 반응 혼합물을 37℃에서 90분간 방치하였다. 반응 종결시에 20μl를 취하였으며, 4-20% 농도구배 SDS-PAGE에서의 전기 영동 분석을 위하여 SDS-PAGE 샘플 완충액으로 즉시 끓였다. 38 kDa 및 58 kDa 프로테아제 처리 모두에서, 펩티드 TcbAii및 TcbAiii의 양은 약 3배 증가한 반면, TcbA 펩티드의 양은 비례적으로 감소하였음이 SDS-PAGE로부터 결정되었다 (표 24). 선택된 펩티드의 상대적인 감소 및 증가는 웨스턴 블롯 분석으로 확인하였다. 또한, 분해된 물질을 겔 여과시켜 본 결과, 상기 복합체의 천연 분자 크기가 변화하지 않았음을 알 수 있었다. 트립신 처리시, 펩티드 TcbA 및 TcbAii가 작은 펩티드들로 비특이적으로 분해되었다. 이는, 38 kDa 및 58 kDa 포토랍두스 프로테아제가 펩티드 TcbA를 펩티드 TcbAii및 TcbAiii로 특이적으로 프로세싱시킬 수 있음을 나타내는 것이었다. 남아있는 80 μl 반응 혼합물의 프로테아제 처리 및 비처리 대조군을 pH 7.0의 10 mM 인산 나트륨 완충액으로 연속적으로 희석하여 SCR 생물학적 정량으로 분석하였다. 여러 희석물에서의 활성을 비교함으로써 38 kDa 프로테아제 처리시 SCR 살충 활성이 약 3 내지 4배 증가되었음이 나타났다. 또한, 프로테아제 처리에서, 남아있는 곤충들의 성장 저해율은 대조군보다 심각하였다 (표 24).The purification material was treated with purified W-14 photolabose metalloprotease, 38 kDa and 58 kDa (Example 10) and digestion of TcbA by treatment with trypsin (Sigma, Missouri) as a control enzyme. Evaluated. Standard reactants included 17.5 μg of the purified fraction, 1.5 unit protease, and 0.1 M Tris buffer at pH 8.0 in 100 μl total volume. There is no protease in the control reaction. The reaction mixture was left at 37 ° C. for 90 minutes. 20 μl was taken at the end of the reaction and immediately boiled in SDS-PAGE sample buffer for electrophoresis analysis at 4-20% gradient SDS-PAGE. In both 38 kDa and 58 kDa protease treatments, it was determined from SDS-PAGE that the amounts of peptides TcbA ii and TcbA iii increased about threefold, while the amount of TcbA peptides decreased proportionally. Relative decreases and increases in selected peptides were confirmed by Western blot analysis. In addition, as a result of gel filtration of the degraded material, it was found that the natural molecular size of the complex did not change. Upon trypsin treatment, peptides TcbA and TcbA ii were nonspecifically degraded into small peptides. This indicated that the 38 kDa and 58 kDa photolabose proteases could specifically process peptide TcbA with peptides TcbA ii and TcbA iii . Protease treated and untreated controls of the remaining 80 μl reaction mixture were serially diluted with 10 mM sodium phosphate buffer at pH 7.0 and analyzed by SCR biological quantification. Comparing the activity at different dilutions showed that SCR insecticidal activity was increased by about 3 to 4 fold upon treatment with 38 kDa protease. In addition, in protease treatment, the growth inhibition rate of the remaining insects was more severe than the control (Table 24).

프로테아제 처리에 의한 펩티드 TcbA의 펩티드 TcbAii및 TcbAiii에로의 전환 및 활성화.Conversion and activation of peptide TcbA to peptide TcbA ii and TcbA iii by protease treatment. 대조군Control 38 kDa 프로테아제 처리38 kDa protease treatment S0(전체 단백질에 대한 %)S0 (% of total protein) 5858 1818 S1(전체 단백질에 대한 %)S1 (% of total protein) 3636 6464 S9(전체 단백질에 대한 %)S9 (% of total protein) 66 1818 LD50 (μg 단백질)LD50 (μg protein) 2.12.1 0.520.52 SCR 중량 (mg/곤충)*SCR Weight (mg / insect) * 0.20.2 0.10.1 *: 본 분석에서, 규정식 5일 후 살아있는 곤충의 평균 중량의 측정에 의한 성장 저해율을 나타냄.*: In this assay, inhibition of growth is indicated by measurement of the average weight of live insects after 5 days of diet.

SCR 장 프로테아제에 의한 독소 B의 활성화 및 처리Activation and Treatment of Toxin B by SCR Intestinal Protease

단백질 가수분해 활성에 대한 두 번째 증명에 있어서, W-14 독소가 곤충에 의해 처리되는지의 여부를 시험하였다. 포토랍두스 W-14 브로쓰로부터 정제된 독소 B (실시예 15 참조)는 단클론성 항체를 사용하는 SDS-PAGE 및 웨스턴 블롯 분석에 의해 판정된 완전한 TcbA 펩티드로 주로 이루어져 있었다. SCR에 대한 이 분획의 LD50은 약 700ng인 것으로 측정되었다.In a second demonstration of proteolytic activity, it was tested whether the W-14 toxin was processed by insects. Toxin B purified from Photolab Dux W-14 broth (see Example 15) consisted mainly of complete TcbA peptides determined by SDS-PAGE and Western blot analysis using monoclonal antibodies. The LD 50 of this fraction for SCR was determined to be about 700 ng.

SCR 유충은 제4기의 영(instar) 단계 (각 곤충의 총 중량 약 100 내지 125mg)에 이를때까지 콜레옵테란 (coleopteran) 먹이로 성장하였다. SCR 장 성분은 절개 가위 및 핀셋을 사용해서 제거하는 방법으로 모았다. 장 내벽을 감싸고 있는 다량의 지방질을 제거한 후, 약 40개의 장을 100㎕의 무균수가 들어 있는 마이크로 원심 분리기 튜브에서 균질화하였다. 이어서, 이 튜브를 10분 동안 14,000 rpm에서 원심 분리하고, 펠렛은 버렸다. 사용할 때까지 상층액은 -70℃ 동결기에서 저장하였다.SCR larvae were grown on coleopteran feed until the fourth instar stage (about 100-125 mg total weight of each insect). SCR intestinal components were collected by removing them using incision scissors and tweezers. After removing the large amount of fat surrounding the intestinal lining, about 40 intestines were homogenized in a microcentrifuge tube containing 100 μl of sterile water. The tube was then centrifuged at 14,000 rpm for 10 minutes and the pellet discarded. Supernatants were stored in a -70 ° C. freezer until use.

상기에서 정제된 독소 B를 모아진 SCR 장 성분으로 처리함으로써 곤충의 장에 의한 독소 B의 처리를 평가하였다. 이 반응은 100㎕의 총부피 중의 40㎍의 독소 B (1mg/ml), 50㎕의 SCR 장 성분, 및 pH 8.0의 0.1M Tris 완충액을 포함하였다. 대조 반응에서는 SCR 장 성분을 뺐다. 이 반응 혼합물을 37℃에서 하룻밤 동안 배양하였다. 반응 말렵에는, 10㎕를 빼내서 SDS-PAGE 분석을 위해 동일한 부피의 2×SDS-PAGE 시료 완충액과 함께 끓였다. 나머지 90㎕의 반응 혼합물은 pH 7.0의 10mM 인산 나트륨 완충액으로 연속 희석하고, SCR 생분석에 의해 분석하였다. SDS-PAGE 분석은 SCR 장 성분 처리에서 펩티드 TcbA가 보다 작은 펩티드로 완전히 소화되었다는 것을 증명하였다. 변성되지 않은 독소 분획의 분석은 더 큰 펩티드를 절단한다 하더라고 원래의 크기인 약 860kDa가 그대로 남아 있다는 것을 증명하였다. SCR 생분석에서는, 독소 B로 처리된 SCR 장의 LD50이 10배 증가된 약 70ng으로 밝혀졌다. 별도의 실험에서, 프로테아제 K 처리는 독소 활성을 완전히 제거하였다.Treatment of toxin B by the intestine of the insect was evaluated by treating the purified toxin B with the collected SCR intestinal components. This reaction included 40 μg of toxin B (1 mg / ml), 50 μl of SCR intestinal component, and 0.1 M Tris buffer at pH 8.0 in 100 μl total volume. In the control reaction, the SCR field component was subtracted. The reaction mixture was incubated overnight at 37 ° C. At the end of the reaction, 10 μl was removed and boiled with an equal volume of 2 × SDS-PAGE sample buffer for SDS-PAGE analysis. The remaining 90 μl of reaction mixture was serially diluted with 10 mM sodium phosphate buffer at pH 7.0 and analyzed by SCR bioanalysis. SDS-PAGE analysis demonstrated that peptide TcbA was completely digested into smaller peptides in SCR field component treatment. Analysis of the undenatured toxin fraction demonstrated that the original peptide, about 860 kDa, remained intact even though the larger peptide was cleaved. In SCR bioanalysis, the LD50 of SCR intestines treated with toxin B was found to be about 70 ng, a 10-fold increase. In a separate experiment, protease K treatment completely eliminated toxin activity.

〈실시예 17〉<Example 17>

TcdAii펩티드를 코딩하고 있는 유전자 라이브러리의 스크리닝Screening of Gene Libraries Encoding TcdA ii Peptides

서열 17 (내부 펩티드 TcdAii-PT111 N-말단 서열) 및 서열 18 (내부 펩티드 TcdAii-PT79 N-말단 서열)에서 기술된, TcdAii펩티드를 코딩하는 유전자의 클로닝 및 특성화가 완료되었다. 서열 17 (표 25) 및 서열 18 (표 26)의, 아미노산 서열을 코딩하도록 설계된 두 가지 풀의 동의성 올리고뉴클레오티드 및 그러한 서열의 역방향 상보체들을 실시예 8에 기술된 바와 같이 합성하였다. 올리고뉴클레오티드들의 DNA 서열을 하기에 나타내었다.Cloning and characterization of the gene encoding the TcdA ii peptide, described in SEQ ID NO: 17 (internal peptide TcdA ii -PT111 N-terminal sequence) and SEQ ID NO: 18 (internal peptide TcdA ii -PT79 N-terminal sequence), was complete. Two pools of synonymous oligonucleotides designed to encode amino acid sequences and reverse complements of those sequences, SEQ ID NO: 17 (Table 25) and SEQ ID NO: 18 (Table 26), were synthesized as described in Example 8. The DNA sequence of the oligonucleotides is shown below.

서열 17을 위한 동의성 올리고뉴클레오티드Synonym oligonucleotides for SEQ ID NO: 17 P2-PT111P2-PT111 1One 22 33 44 55 66 77 88 아미노산amino acid AlaAla PhePhe AsnAsn IleIle AspAsp AspAsp ValVal SerSer 코돈Codon 5' GCN5 'GCN TT(T/C)TT (T / C) AA(T/C)AA (T / C) AT(T/C/A)AT (T / C / A) GA(T/C)GA (T / C) GA(T/C)GA (T / C) GTN 3'GTN 3 ' P2.3.6.CBP2.3.6.CB 5' GC(A/C/G/T)5 'GC (A / C / G / T) TT(T/C)TT (T / C) AATAAT ATTATT GATGAT GATGAT GT 3'GT 3 ' P2.3.5P2.3.5 5' GC(A/C/G/T)5 'GC (A / C / G / T) TT(T/C)TT (T / C) AA(T/C)AA (T / C) AT(T/C/A)AT (T / C / A) GA(T/C)GA (T / C) GA(T/C)GA (T / C) GT 3'GT 3 ' P2.3.5.RP2.3.5.R 5' AC5 'AC (G/A)TC(G / A) TC (G/A)TC(G / A) TC (T/G/A)AT(T / G / A) AT (G/A)TT(G / A) TT (G/A)AA(G / A) AA (A/C/G/T)GC 3'(A / C / G / T) GC 3 ' P2.3.5.RIP2.3.5.RI 5' ACI5 'ACI TCITCI TCITCI ATIATI TTITTI AAIAAI GC 3'GC 3 ' P2.3R.CBP2.3R.CB 5' CAG5 'CAG (A/G)CT(A / G) CT (A/C)AC(A / C) AC ATCATC ATCATC AATAAT ATTATT AAA 3'AAA 3 '

서열 18을 위한 동의성 올리고뉴클레오티드Synonymous oligonucleotides for SEQ ID NO: 18 P2-PT79P2-PT79 1One 22 33 44 55 66 77 88 99 1010 1111 1212 1313 아미노산amino acid PhePhe IleIle ValVal TyrTyr ThrThr SerSer LeuLeu GlyGly ValVal AsnAsn ProPro AsnAsn AsnAsn 코돈*Codon * 5' TTY5 'TTY ATHATH GTNGTN TAYTAY ACNACN 66 66 GGNGGN GTNGTN AAYAAY CCNCCN AAYAAY AAY 3'AAY 3 ' P2.79.2P2.79.2 5' TTY5 'TTY ATYATY GTKGTK TATTAT ACYACY TCITCI YTRYTR GGYGGY GTKGTK AATAAT CCRCCR AATAAT AAT 3'AAT 3 ' P2.79.3P2.79.3 5' TTT5 'TTT ATTATT GTKGTK TATTAT ACYACY AGYAGY YTRYTR GGYGGY GTKGTK AATAAT CCRCCR AATAAT AAT 3'AAT 3 ' P2.79.R.1P2.79.R.1 5' ATT5 'ATT ATTATT YGGYGG ATTATT MACMAC RCCRCC YARYAR RCTRCT RGTRGT ATAATA MACMAC AATAAT AAA 3'AAA 3 ' P2.79R.CBP2.79R.CB 5' ATT5 'ATT ATTATT YGGYGG ATTATT MACMAC ACCACC CAGCAG RCTRCT GGTGGT ATAATA MACMAC AATAAT AAA 3'AAA 3 ' * 뉴클레오티드의 IUPAC-IUB 코드에 따라서, Y=C 또는 T, H=A, C 또는 T, N=A, C, G 또는 T, K=G 또는 T, R=A 또는 G, 및 M=A 또는 C* Y = C or T, H = A, C or T, N = A, C, G or T, K = G or T, R = A or G, and M = A, depending on the IUPAC-IUB code of the nucleotide Or C

모든 전향/역방향 조합에서, 전향 프라이머로서 P2.3.6CB 또는 P2.3.5 및 역방향 프라이머로서 P2.79.R.1 또는 P2.79R.CB를 사용하고, 주형으로서 포토랍두스 W-14 게놈 DNA를 사용, 본질적으로 실시예 8에 기술된 바와 같이, 폴리머라제 연쇄 반응을 수행하였다. 다른 반응 세트에서는, 모든 전향/역방향 조합에서, 전향 프라이머로서 프라이머 P2.79.2 또는 P2.79.3을 사용하였고, 역방향 프라이머로서 P2.3.5R, P2.3.5RI, 및 P2.3R.CB를 사용하였다. 전향 프라이머로서 P2.3.6.CB, 역방향 프라이머로서 P2.79.R.1 또는 P2.79R.CB를 포함하는 반응에서만 2500 염기쌍의 추정 크기 (아가로스 겔 상의 이동성)를 가지는 비 유사 증폭 생성물이 관찰되었다. 상기 증폭 생성물을 수득하기 위해 사용된 프라이머의 서열은, 펩티드 단편 TcdAii-PT111이 펩티드 단편 TcdAii-PT79의 아미노-인접부위에 있음을 나타낸다.In all forward / reverse combinations, use P2.3.6CB or P2.3.5 as the forward primer and P2.79.R.1 or P2.79R.CB as the reverse primer, and photolabdus W-14 genomic DNA as template Use, essentially as described in Example 8, polymerase chain reaction was carried out. In another reaction set, primers P2.79.2 or P2.79.3 were used as forward primers and P2.3.5R, P2.3.5RI, and P2.3R.CB as forward primers in all forward / reverse combinations. Only similar reactions with P2.3.6.CB as forward primers and P2.79.R.1 or P2.79R.CB as reverse primers had an estimated size of 2500 base pairs (mobility on agarose gels) observed It became. Sequence of the primers used in order to obtain the amplification products, peptide fragments TcdA ii -PT111 a peptide fragment of amino TcdA ii -PT79 - shows that in the vicinity.

2500 bp PCR 생성물은 제조업자의 지시에 따라 플라스미드 벡터 pCRTMII (미국 캘리포니아주 샌 디에고 소재의 인비트로젠 (Invitrogen) 제조)에 라이게이션시켰고, 두가지 단리물 (HS24 및 HS27)의 삽입체 단편의 DNA 서열은 제조자가 제시한 상기 프라이머 및 서열 분석 방법을 사용하여 결정하였다. 두가지 단리물 모두의 서열은 동일하였다. 신규 프라이머는 결정된 서열을 기초로 하여 합성시켰고, 전체 2557 염기의 삽입체 (서열 36)의 서열을 수득하기 위한 추가 서열 분석 반응을 프라이밍하기 위해 상기 신규 프라이머를 사용하였다. 서열 36에 의해 코딩되는 펩티드의 부분 해독으로 서열 37에 공개된 845 아미노산 서열을 얻는다. TcdAii펩티드 단편의 상기 부위의 단백질 상동성 분석에는, 상당한 아미노산 상동성(위스콘신주 매디슨 소재의 제너틱스 컴퓨터 그룹 (Genetics Computer Group, GCG)사의 위스콘신 패키지 버전 8.0을 사용하여 단백질 TcbA (서열 12)의 542 내지 1390 잔기와 68% 유사성, 및 53% 동일성, 또는 위스콘신주 매디슨 소재의 제너틱스 컴퓨터 그룹 (GCG)사의 위스콘신 패키지 버전 9.0을 사용하여 567 내지 1389 잔기와 60% 유사성, 및 54% 동일성)이 나타난다. 따라서, 서열 36에 부분적으로 나타낸 유전자는 TcbA 단백질과 유사하지만 동일하지는 않은 아미노산 서열을 나타내고, TcbA 단백질과 유사하지만 동일하지는 않은 생물학적 활성을 가지고 있다는 것이 명백하다.The 2500 bp PCR product was ligated to the plasmid vector pCR TM II (manufactured by Invitrogen, San Diego, Calif.) According to the manufacturer's instructions, and the DNA of the insert fragments of the two isolates (HS24 and HS27) Sequences were determined using the primers and sequencing methods suggested by the manufacturer. The sequences of both isolates were identical. New primers were synthesized based on the determined sequences, and the new primers were used to prime additional sequencing reactions to obtain sequences of inserts (SEQ ID NO: 36) of a total 2557 bases. Partial translation of the peptide encoded by SEQ ID NO: 36 results in the 845 amino acid sequence disclosed in SEQ ID NO: 37. Protein homology analysis of this site of the TcdA ii peptide fragment includes a significant amino acid homology of the protein TcbA (SEQ ID NO: 12) using Wisconsin package version 8.0 of the Genetics Computer Group (GCG) of Madison, WI. 68% similarity and 53% identity to 542-1390 residues, or 60% similarity and 54% identity to 567-1389 residues using Wisconsin Package Version 9.0 of the Genetics Computer Group (GCG) of Madison, Wisconsin) appear. Thus, the genes partially depicted in SEQ ID NO: 36 exhibit amino acid sequences that are similar but not identical to the TcbA protein and are evident in biological activity similar to, but not identical to, the TcbA protein.

다른 경우에서는, 서열 39(내부 펩티드 TcdAii-PK44 서열) 및 서열 41(TcdAiii58 kDa N-말단 펩티드 서열)에 기술되어 있는 펩티드 TcdAii-PK44 및 TcdAiii58 kDa N-말단 펩티드를 코딩하는 유전자가 단리되었다. 서열 39 (표 28) 및 서열 ID 번호 41 (표 27)에 기술된 바와 같은 아미노산 서열을 코딩하기 위하여 설계된, 두 가지 풀의 동의성 올리고뉴클레오티드 및 그 서열의 역방향 상보체를 실시예 8 및 그들의 DNA 서열에 기술되어 있는 것과 같이 합성하였다.In other cases, the peptides TcdA ii- PK44 and TcdA iii 58 kDa N-terminal peptides described in SEQ ID NO: 39 (internal peptide TcdA ii -PK44 sequence) and SEQ ID NO: 41 (TcdA iii 58 kDa N-terminal peptide sequences) are encoded. Gene was isolated. Two pools of synonymous oligonucleotides and reverse complements of those sequences, designed to encode amino acid sequences as set forth in SEQ ID NO: 39 (Table 28) and SEQ ID NO: 41 (Table 27), are described in Example 8 and their DNA. Synthesis was as described in the sequence.

서열 41을 위한 동의성 올리고뉴클레오티드Synonym oligonucleotides for SEQ ID NO: 41 코돈 #Codon # 1One 22 33 44 55 66 77 88 99 1010 1111 1212 1313 1414 아미노산amino acid LeuLeu ArgArg SerSer AlaAla AsnAsn ThrThr LeuLeu ThrThr AspAsp LeuLeu PhePhe LeuLeu ProPro GlnGln A2.1A2.1 5' YTR5 'YTR CGYCGY AGYAGY GCIGCI AATAAT ACYACY YTRYTR ACYACY GATGAT YTRYTR TTTTTT YTRYTR CCRCCR CA 3'CA 3 ' A2.2A2.2 GCIGCI AATAAT ACIACI YTRYTR ACIACI GAYGAY YTRYTR TTYTTY YTRYTR CCICCI CA 3'CA 3 ' A2.3.RA2.3.R 5' TG5 'TG YGGYGG YARYAR AAAAAA YARYAR RTCRTC RGTRGT YARYAR RGTRGT RTTRTT IGCIGC RCTRCT RCG 3'RCG 3 ' A2.4.RA2.4.R 5' TG5 'TG IGGIGG CAGCAG AAAAAA CAGCAG RTCRTC IGTIGT CAGCAG IGTIGT ATTATT ICG 3'ICG 3 '

서열 39를 위한 동의성 올리고뉴클레오티드Synonym oligonucleotides for SEQ ID NO: 39 아미노산 #amino acid # (8)(8) (9)(9) (10)10 (11)(11) (12)(12) (13)(13) (14)(14) (15)(15) (16)(16) 코돈 #Codon # 1One 22 33 44 55 66 77 88 99 아미노산amino acid GlyGly ProPro ValVal GluGlu IleIle AsnAsn ThrThr AlaAla IleIle A1.44.1A1.44.1 5' GGY5 'GGY CCRCCR GTKGTK GAAGAA ATTATT AATAAT ACCACC GCIGCI AT 3'AT 3 ' A1.44.1RA1.44.1R 5' ATI5 'ATI GCGGCG GTAGTA TTATTA ATTATT TCMTCM ACYACY GGRGGR CC 3'CC 3 ' A1.44.2A1.44.2 5' GGI5 'GGI CCICCI GTIGTI GARGAR ATYATY AAYAAY ACIACI GCIGCI AT 3'AT 3 ' A1.44.2RA1.44.2R 5' ATI5 'ATI GCIGCI GTRGTR TTRTTR ATYATY TCITCI ACIACI GGIGGI CC 3'CC 3 '

모든 전향/역방향 조합에서, 전향 프라이머로서 A1.44.1 또는 A1.44.2 및 역방향 프라이머로서 A2.3R 또는 A2.4R을 사용하고, 주형으로서 포토랍두스 W-14 게놈 DNA를 사용하여, 본질적으로 실시예 8에 기술된 바와 같이 폴리머라제 연쇄 반응을 수행하였다. 다른 반응 세트에서는, 모든 전향/역방향 조합에서, 전향 프라이머로서 프라이머 A2.1 또는 A2.2를 사용하였고, 역방향 프라이머로서 A1.44.1R 및 A1.44.2R을 사용하였다. 전향 프라이머로서 A1.44.1 또는 A1.44.2, 역방향 프라이머로서 A2.3R을 포함하는 반응에서만 1400 염기쌍의 추정 크기 (아가로스 겔 상의 이동성)를 가지는 비 유사 증폭 생성물이 관찰되었다. 상기 증폭 생성물을 수득하기 위해 사용된 프라이머의 서열은 펩티드 단편 TcdAii-PK44가 TcdAiii의 58 kDa 펩티드 단편의 아미노-인접부위에 있음을 나타낸다.In all forward / reverse combinations, essentially using A1.44.1 or A1.44.2 as the forward primer and A2.3R or A2.4R as the reverse primer, and Photorabdus W-14 genomic DNA as the template, essentially The polymerase chain reaction was performed as described in 8. In another reaction set, in all forward / reverse combinations, primers A2.1 or A2.2 were used as forward primers, and A1.44.1R and A1.44.2R were used as reverse primers. Only similar reactions with an estimated size of 1400 base pairs (mobility on agarose gel) were observed in reactions containing A1.44.1 or A1.44.2 as forward primers and A2.3R as reverse primers. The sequence of the primers used to obtain the amplification product indicates that the peptide fragment TcdA ii -PK44 is at the amino-contiguous site of the 58 kDa peptide fragment of TcdA iii .

1400 bp PCR 생성물은 제조자의 지시에 따라 플라스미드 벡터 pCRTMII 라이게이션시켰다. 네가지 단리물의 삽입체 단편의 DNA 서열은, 제조자가 제시한 프라이머와 유사한 서열의 프라이머 및 상기 서열 분석 방법을 사용하여 결정하였다. 모든 단리물들의 핵산 서열은 예상했던 바와 같이 동의성 프라이머 서열에 상응하는 부위에서 달랐으나, 상기 데이타로부터 추정된 아미노산 서열은 상기 결정된 펩티드의 실제 아미노산 서열과 동일하였다 (서열 41 및 39).The 1400 bp PCR product was ligated to the plasmid vector pCR II according to the manufacturer's instructions. DNA sequences of the insert fragments of the four isolates were determined using primers similar in sequence to the primers suggested by the manufacturer and the above sequencing method. The nucleic acid sequences of all isolates differed at sites corresponding to synonymous primer sequences as expected, but the amino acid sequences estimated from the data were identical to the actual amino acid sequences of the peptides determined above (SEQ ID NOs: 41 and 39).

실시예 8에 기술된 바와 같이, 상기 제조된 DNA (서열 36)로 이루어진 식별용 동위원소로 표지된 프로브를 사용하여, W-14 게놈 코스미드 라이브러리의 스크리닝을 실시하여 5개의 하이브리드화 코스미드 단리물, 즉 17D9, 20B10, 21D2, 27B10, 및 26D1을 동정하였다. 상기 코스미드들은, 서열 11 또는 서열 25에 기술된 바와 같은 유전자에 대응하는 프로브로 이전에 동정되었던 코스미드들과는 다른 것들이었다. 제한 효소 분석 및 DNA 블롯 하이브리드화를 실시하여 서열 36의 DNA를 포함하는 부위인, 약 3.7, 3.7, 및 1.1 kbp의 크기를 갖는 3개의 EcoRI 단편를 동정하였다. 본 실시예에서 제조된, 동위 원소 표지된 1.4 kbp DNA 단편를 프로브로 사용하여 W-14 게놈 코스미드 라이브러리를 스크리닝하여, 동일한 5개의 코스미드 (17D9, 20B10, 21D2, 27B10, 및 26D1)를 동정하였다. EcoR1으로 분해된 코스미드 DNA에 대한 DNA 블롯 하이브리드화는 또한, 2.5 kbp TcdAii유전자 프로브에서 보여지는 것과 같이 EcoRI 단편의 동일 서브세트에 대한 하이브리드화를 나타내었는데, 이는 두 단편 모두가 게놈 DNA 상에 코딩되어 있음을 나타내는 것이다.As described in Example 8, five hybridized cosmids were isolated by screening a W-14 genomic cosmid library using an isotopically labeled probe consisting of the DNA (SEQ ID NO: 36) prepared above. Water, 17D9, 20B10, 21D2, 27B10, and 26D1, were identified. The cosmids were different from the cosmids previously identified with probes corresponding to genes as described in SEQ ID NO: 11 or SEQ ID NO: 25. Restriction enzyme analysis and DNA blot hybridization were performed to identify three EcoRI fragments with sizes of about 3.7, 3.7, and 1.1 kbp, which are the sites containing the DNA of SEQ ID NO: 36. The same 14 cosmids (17D9, 20B10, 21D2, 27B10, and 26D1) were identified by screening the W-14 genomic cosmid library using isotope labeled 1.4 kbp DNA fragments prepared in this example as probes. . DNA blot hybridization to cosmid DNA digested with EcoR1 also showed hybridization to the same subset of EcoRI fragments, as shown in the 2.5 kbp TcdA ii gene probe, both fragments on genomic DNA. It is coded.

클로닝된 EcoRI 단편의 DNA 서열 결정으로 2516 아미노산 (서열 47)의 282.9 kDa 단백질을 코딩하는 7551 염기쌍 (서열 46)의 비단속 해독 프레임이 밝혀졌다. 상기 단백질의 아미노산 서열 분석으로, 펩티드 TcdAii의 예상되었던 모든 내부 단편 (서열 17, 18, 37, 38 및 39)와 TcdAiii펩티드 N-말단 (서열 41) 및 모든 TcdAiii내부 펩티드 (서열 42 및 43)가 밝혀졌다. TcdAii및 TcdAiii로 단리 및 동정된 펩티드는 서열 46으로 나타낸, tcdA로 표시된 개방 해독 프레임의 각각의 생성물이다. 또한, 서열 47은, 89 위치에서 출발하여 약 201 kDa 크기 펩티드의 N-말단 서열인 서열 13에 개시된 서열을 예시하는데, 이는 서열 46으로부터 생성된 초기 단백질이 앞에서 밝힌 서열 12에서와 유사한 방식으로 프로세싱됨을 나타낸다. 또한, 상기 단백질은 더한층 분해되어 서열 48에 의해 코딩되고 서열 49 (TcdAii펩티드)로서 개시된 209.2 kDa 크기의 생성물과, 서열 50에 의해 코딩되고 서열 51 (TcdAiii펩티드)로서 개시된 63.6 kDa 크기의 생성물을 생기게 한다. 따라서, 서열 47로 개시된 282.9 kDa 크기의 전길이 단백질로 예시되는 바와 같이, 서열 46의 생성물로부터 유래되는 독소 A (실시예 15)로 동정되는 살충 활성은 프로세싱되어 서열 49 및 51로 개시된 펩티드를 생산하는 것으로 생각된다. 독소 B (실시예 15)로 동정되는 살충 활성은, 서열 12로 개시된 280.6 kDa 단백질로 예시되는 서열 11의 생성물로부터 유래하는 것으로 생각된다. 상기 단백질은 단백질 가수 분해에 의해 프로세싱되어, 서열 52에 의해 코딩되는, 서열 53으로 개시된 207.6 kDa 펩티드와, 서열 54에 의해 코딩되는, 서열 40 및 서열 55로 개시된 N-말단 서열을 가지고 있는 62.9 kDa 펩티드를 생산한다.DNA sequencing of the cloned EcoRI fragment revealed an uninterrupted translation frame of 7551 base pairs (SEQ ID NO: 46) encoding a 282.9 kDa protein of 2516 amino acids (SEQ ID NO: 47). The amino acid sequencing of the protein revealed that all expected internal fragments of peptide TcdA ii (SEQ ID NOs: 17, 18, 37, 38 and 39) and TcdA iii peptide N-terminus (SEQ ID NO: 41) and all TcdA iii internal peptides (SEQ ID NO: 42 and 43). Peptides isolated and identified by TcdA ii and TcdA iii are the respective products of the open reading frame represented by tcdA, shown in SEQ ID NO: 46. In addition, SEQ ID NO: 47 illustrates the sequence set forth in SEQ ID NO: 13, which is the N-terminal sequence of the peptide of about 201 kDa size starting at position 89, wherein the initial protein generated from SEQ ID NO: 46 is processed in a similar manner as in SEQ ID NO: 12 above. It is displayed. In addition, the protein was further digested to a 209.2 kDa size product encoded by SEQ ID NO: 48 and disclosed as SEQ ID NO: 49 (TcdA ii peptide), and a 63.6 kDa size product encoded by SEQ ID NO: 50 and disclosed as SEQ ID NO: 51 (TcdA iii peptide). To produce. Thus, as exemplified by the 282.9 kDa full-length protein disclosed in SEQ ID NO: 47, the pesticidal activity identified as toxin A (Example 15) derived from the product of SEQ ID NO: 46 was processed to produce the peptides disclosed in SEQ ID NOs: 49 and 51. I think. The pesticidal activity identified as toxin B (Example 15) is thought to be derived from the product of SEQ ID NO: 11 exemplified by the 280.6 kDa protein disclosed as SEQ ID NO: 12. The protein was processed by proteolysis to produce a 67.6 kDa peptide having a 207.6 kDa peptide as set out in SEQ ID NO: 53, encoded by SEQ ID NO: 52, and an N-terminal sequence set forth as SEQ ID NO: 40 and SEQ ID NO: 55, encoded by SEQ ID NO: 54 Produces peptides.

서열 12로 개시된 단백질과 서열 47로 개시된 단백질의 아미노산 서열을 비교해 보면, 위스콘신주 매디슨 소재의 제너틱스 컴퓨터 그룹 (GCG)사의 위스콘신 패키지 버전 8.0을 사용하여 69% 유사성 및 54% 동일성, 또는 이 프로그램의 버전 9.0을 사용하여 60% 유사성 및 54% 동일성을 나타낸다. 상기 고도의 진화론적인 관계는 상기 펩티드들의 전체 아미노산 서열을 통하여 일률적이지는 않지만, 단백질의 카르복시-말단 끝으로 갈수록 그 정도가 더 커지는데, 이는 서열 51 (서열 47로부터 유래)과 서열 55(서열 12로부터 유래)로 개시된 펩티드들이 위스콘신주 매드슨 소재의 제너틱스 컴퓨터 그룹 (GCG)사의 위스콘신 패키지 버전 8.0을 사용하여 76% 유사성 및 64% 동일성, 또는 이 프로그램의 버전 9.0을 사용하여 71% 유사성 및 64% 동일성을 가지고 있기 때문이다.Comparing the amino acid sequence of the protein set forth in SEQ ID NO: 12 with the protein set forth in SEQ ID NO: 47, 69% similarity and 54% identity, or of this program, using the Wisconsin Package Version 8.0 of the Genetics Computer Group (GCG) of Madison, Wisconsin Version 9.0 is used to show 60% similarity and 54% identity. This highly evolutionary relationship is not uniform throughout the entire amino acid sequence of the peptides, but becomes greater towards the carboxy-terminal end of the protein, which is SEQ ID NO: 51 (derived from SEQ ID NO: 47) and SEQ ID NO: 55 (SEQ ID NO: 12). Peptides disclosed herein are 76% similarity and 64% identity using Wisconsin package version 8.0 of the Genetics Computer Group (GCG) of Madson, WI, or 71% similarity and 64% using version 9.0 of this program. This is because they have identity.

〈실시예 18〉<Example 18>

포토랍두스 (균주 W-14) 브로쓰의 분무 사용에 의한, 유럽 옥수수 천공충에 의해 야기된 옥수수 식물 잎 손상의 제어Control of Maize Plant Leaf Damage Caused by European Corn Borer by Spray Application of Photorapdus (Strain W-14) Broth

곤충 유충에 의해 야기되는 식물 손상을 감소시키는 포토랍두스 독소(들)의 능력을, 포토랍두스 브로쓰로 처리한 옥수수 식물상에 만연시킨 유럽 옥수수 천공충 (Ostrinia nubilalis)에 의해 야기된 잎 손상을 측정함으로써 증명하였다. 포토랍두스 균주 W-14로부터의 발효 브로쓰를 만들어 실시예 13에 기술된 바와 같이 한외여과 (10000 MW 구멍 크기)를 사용하여 약 10배 농축시켰다. 그 결과 생성된 농축 브로쓰를 0.2 미크론 니트로셀룰로스 막 여과기를 사용하여 여과 살균시켰다. 유사하게 만들어진, 접종시키지 않은 2% 프로테오스 펩톤 #3 샘플을 대조군 목적으로 사용하였다. 옥수수 식물 (번식 계열)은, 온실 내 흙을 사용하지 않는 혼합물을 포함하는 화분에서 종자로부터 식물 단계 7 또는 8까지 성장시켰다(낮 27℃, 밤 22℃, 약 50%의 상대 습도, 낮길이 14시간, 필요시 물/비료 공급). 시험 식물들은, 낮 온도 약 22℃, 밤 온도 약 18℃, 인공 조명 무 및 부분 차광, 약 50%의 상대 습도 및 필요시 물/비료 공급하는 온실에서, 랜덤한 완전 차단 설계 (3 렙/처리, 6 식물/처리)로 준비하였다. 처리 (접종시키지 않은 배지 및 농축 포토랍두스 브로쓰)는 주사기 분무기를 사용하여 나선부 위 (약 6인치)로부터 직접적으로 2.0 ml을 적용하고, 추가로 2.0 ml을 나선부 위 약 30 cm (약 1 걸음)에서 원형 이동으로 도포시켰다. 또한, 식물의 한 집단은 아무 처리도 하지 않았다. 처리물이 마른 후 (약 30분), 12개의 신생 유럽 옥수수 천공충 유충 (알은 구매원으로부터 구입하여 부화시켰음)을 나선부에 직접적으로 적용하였다. 1주일 후, 변형된 구트리 스케일 (Guthrie Scale)을 사용하여 잎에 대한 손상을 기록하였고 [Koziel, M. G., Beland, G. L., Bowman, C., Carozzi, N. B., Crenshaw, R., Crossland, L., Dawson, J., Desai, N., Hill, M., Kadwell, S., Launis, K., Lewis, K., Maddox, D., McPherson, K., Meghji, M. Z., Merlin, E., Rhodes, R., Warren, G. W., Wright, M. 및 Evola, S. V., 1993, Bio/Technology, 11, 194-195 참조], 그 기록을 통계적으로 비교하였다 (T-시험 (LSD) p〈0.05 및 투키의 연구원화 범위 (Tukey's Studentized Range (HSD) 시험 p〈0.1). 결과는 표 29에 예시되어 있다. 참고로, 스코어 1은 손상이 없음을 나타내며, 스코어 2는 바늘구멍이 없이 펴지지 않은 잎 위에 미세한 "윈도 페인 (window pain" 손상을 나타내고, 스코어 5는 길다란 손상의 잎 관통 및(또는) 3개 이상의 잎에 명확한 중앙 엽맥 섭식 (손상 〈 1인치)을 나타낸다. 상기 데이타는 브로쓰 또는 다른 단백질 포함 분획이 분무 가능 제제로 전달되거나 단백질 또는 그의 일부분을 코딩하는 유전자 또는 그의 유도체가 유전자전환된 식물 또는 세균을 통하여 전달될 때, 특정 해충에 대한 방어력을 제공할 수 있음을 나타낸다.The ability of the photolabduus toxin (s) to reduce plant damage caused by insect larvae, and the leaf damage caused by the European corn periphery (Ostrinia nubilalis), which prevailed on corn plants treated with photolabdus broth Proven by measurement. Fermentation broth from Photolabduus strain W-14 was made and concentrated about 10-fold using ultrafiltration (10000 MW pore size) as described in Example 13. The resulting concentrated broth was filtered sterilized using a 0.2 micron nitrocellulose membrane filter. Similarly prepared, uninoculated 2% proteose peptone # 3 samples were used for control purposes. Corn plants (breeding series) were grown from seed to plant stage 7 or 8 in pots containing mixtures without soil in greenhouses (day 27 ° C., night 22 ° C., relative humidity of about 50%, low length 14). Time, water / fertilizer supply if required). The test plants were randomly cut off design (3 reps / treatment) in daytime temperatures of about 22 ° C, night temperatures of about 18 ° C, artificial lightless and partial shading, relative humidity of about 50% and water / fertilizers as needed , 6 plants / treatment). The treatment (uninoculated media and concentrated photolabose broth) was applied 2.0 ml directly from the spiral (approximately 6 inches) using a syringe sprayer, and further 2.0 ml was applied about 30 cm (approx. 1 step) in a circular motion. In addition, one group of plants did no treatment. After the treatment had dried (approximately 30 minutes), twelve new European corn puncture larvae (eg, eggs purchased from the source of purchase) were applied directly to the helix. After one week, damage to the leaves was recorded using a modified Guthrie Scale [Koziel, MG, Beland, GL, Bowman, C., Carozzi, NB, Crenshaw, R., Crossland, L. , Dawson, J., Desai, N., Hill, M., Kadwell, S., Launis, K., Lewis, K., Maddox, D., McPherson, K., Meghji, MZ, Merlin, E., Rhodes, R., Warren, GW, Wright, M. and Evola, SV, 1993, Bio / Technology, 11, 194-195], and the records were statistically compared (T-test (LSD) p <0.05 and Tukey's Studentized Range (HSD) test p <0.1 The results are illustrated in Table 29. For reference, score 1 indicates no damage and score 2 on needles that did not open without needle holes. Indicative of fine "window pain" damage and a score of 5 indicates leaf penetration of elongated damage and / or clear central leaf vein feeding (damage <1 inch) to three or more leaves. When other protein containing fractions is or can be delivered to the spray formulation the gene or its derivative encoding a protein or a portion thereof is passed through the plant or bacterium a gene switch, it indicates that it is possible to provide toughness for a specific pest.

유럽 옥수수 천공충에 의해 야기된 옥수수 상의 잎 손상에 대한 포토랍두스 배양 브로쓰의 효과Effect of Photolab Dose Culture Broth on Leaf Damage on Corn Caused by European Corn Borer 처리process 평균 구트리 스코어Average Gutri Score 비처리Untreated 5.02a 5.02 a 비접종 배지Unvaccinated Badge 5.15a 5.15 a 포토랍두스 브로쓰Potorabdus Broth 2.24b 2.24 b 상이한 문자로 된 평균은 통계학적으로 서로 다름(p〈0.05 또는 p〈0.1).Means with different letters are statistically different (p <0.05 or p <0.1).

〈실시예 19〉<Example 19>

대장균에서의 발현을 위한 유전자들의 유전 공학Genetic Engineering of Genes for Expression in Escherichia Coli

구조물의 요약Summary of the structure

일련의 플라스미드들을 포토랍두스 W-14의 tcbA 유전자를 대장균에서 발현시키기 위하여 제작하였다. 플라스미드의 목록은 표 30에 나타내었다. 각 구조물의 간단한 설명 및 획득된 대장균 발현 데이타의 요약도 나타내었다.A series of plasmids were constructed to express the tcbA gene of Photolapis W-14 in E. coli. A list of plasmids is shown in Table 30. A brief description of each construct and a summary of the E. coli expression data obtained are also shown.

tcbA 유전자 발현용 플라스미드Plasmids for tcbA Gene Expression 플라스미드Plasmid 유전자gene 벡터/선발표지Vector / Selection Cover 구획compartment pDAB2025pDAB2025 tcbAtcbA pBC/ChlpBC / Chl 세포내Intracellular pDAB2026pDAB2026 tcbAtcbA pAcGP67B/AmppAcGP67B / Amp 배큘로바이러스, 분비됨Baculovirus, secreted pDAB2027pDAB2027 tcbAtcbA pET27b/KanpET27b / Kan 페리플라즘Periplasm pDAB2028pDAB2028 tcbAtcbA pET15-tcbApET15-tcbA 세포내Intracellular 약어: Kan=카나마이신, Chl=클로람페니콜, Amp=암피실린Abbreviations: Kan = Kanamycin, Chl = Chloramphenicol, Amp = Ampicillin

pDAB2025의 제작Fabrication of pDAB2025

TcbAii프로브에 하이브리드화하는 큰 EcoRI 단편이 실시예 9에 기술되어 있다. 상기 단편를 pBC (캘리포니아주 라 졸라 소재의 스트라타진 (Stratagene) 제조) 내로 서브클로닝시켜서 pDAB2025를 만들었다. 서열 분석을 해 보면 상기 단편이 8816 염기쌍이라는 것이 나타난다. 상기 단편은 571 위치에서 개시 ATG를, 8086 위치에서 종결 TAA를 가지고 있는 tcbA 유전자를 코딩한다. 그러므로 상기 단편은, ATG의 상류에 570 염기쌍의 포토랍두스 DNA 및 TAA의 하류에 730 염기쌍을 가지고 있다.A large EcoRI fragment that hybridizes to the TcbA ii probe is described in Example 9. The fragment was subcloned into pBC (Stratagene, La Jolla, Calif.) To make pDAB2025. Sequencing revealed that the fragment was 8816 base pairs. The fragment encodes the tcbA gene with the starting ATG at position 571 and the terminating TAA at position 8086. Thus, the fragment has 570 base pairs of photolabose DNA upstream of ATG and 730 base pairs downstream of TAA.

플라스미드 pDAB2026의 제작Construction of Plasmid pDAB2026

5' 프라이머 (S1Ac51)인 5' TTT AAA CCA TGG GAA ACT CAT TAT CAA GCA CTA TC 3' 및 3' 프라이머 (S1Ac31)인 5' TTT AAA GCC GCT TAA CGG ATG GTA TAA CGA ATA TG 3'을 사용하여 tcbA 유전자를 플라스미드 pDAB2025로부터 PCR로 증폭시켰다. 물 57.5 ml, 10X LA 완충액 10 ml, dNTPs 16 ml (각각이 2.5 mM인 원액), 10 pmoles/ml로 각 프라이머 20 ml, W-14 tcbA 유전자를 포함하고 있는 플라스미드 pDAB2025를 300 ng, TaKaRa LA Taq 폴리머라제 1 ml의 반응 조건에서 판베라 (PanVera, 위스콘신주 메디슨 소재)로부터 구입한 TaKaRa LA PCR 키트를 사용하여 PCR을 수행하였다. 싸이클링 조건은 98℃/20초, 68℃/5분, 72℃/10분의 30회 싸이클이었다. 약 7526 bp로 예상되는 PCR 생성물을 TBE 완충액 (100 mM Tris, 90 mM 붕산 (Boric acid), 1 mM EDTA)를 사용한 0.8% 아가로스 겔에서 단리시켜 퀴아젠 (Qiagen, 캘리포니아주 챗스워쓰 소재)으로부터 구입한 Qiaex II 키트를 사용하여 정제하였다. 정제된 tcbA 유전자를 Nco I 및 Not I으로 잘라 배큘로바이러스 이동 벡터인 pAcGP67B (캘리포니아주 산 디에고 소재의 파밍젠 (PharMingen) 제조) 내로 라이게이션시키고, 이를 사용하여 DH5α 대장균을 형질전환시켰다. 그 결과 생성되는 재조합형을 pDAB2026이라 명명하였다. 그 후 tcbA 유전자를 pDAB2026으로부터 잘라내어 pET27b로 옮겨 플라스미드 pDAB2027을 만들었다. tcbA 유전자 내의 미스센스 돌연 변이는 pDAB2027에서 복구되었다.5 'TTT AAA CCA TGG GAA ACT CAT TAT CAA GCA CTA TC 3' with 5 'Primer (S1Ac51) and 5' TTT AAA GCC GCT TAA CGG ATG GTA TAA CGA ATA TG 3 'with 3' Primer (S1Ac31) tcbA gene was amplified by PCR from plasmid pDAB2025. 57.5 ml of water, 10 ml of 10X LA buffer, 16 ml of dNTPs (2.5 mM each), 300 ng of plasmid pDAB2025 containing 20 ml of each primer and W-14 tcbA gene at 10 pmoles / ml, TaKaRa LA Taq PCR was performed using a TaKaRa LA PCR kit purchased from PanVera (Medicine, Wisconsin) at reaction conditions of 1 ml of polymerase. Cycling conditions were 30 cycles of 98 degreeC / 20 second, 68 degreeC / 5 minutes, and 72 degreeC / 10 minutes. The PCR product, expected to be about 7526 bp, was isolated from Qiagen (Qiagen, Chatsworth, CA) by isolating a 0.8% agarose gel using TBE buffer (100 mM Tris, 90 mM Boric acid, 1 mM EDTA). Purification was performed using the purchased Qiaex II kit. The purified tcbA gene was cut into Nco I and Not I and ligated into the baculovirus transfer vector pAcGP67B (manufactured by PharMingen, San Diego, Calif.) And used to transform DH5α Escherichia coli. The resulting recombinant was named pDAB2026. The tcbA gene was then cut out of pDAB2026 and transferred to pET27b to make plasmid pDAB2027. Missense mutations in the tcbA gene were recovered in pDAB2027.

복구된 tcbA 유전자는 서열 11에 나타낸 서열로부터 212에서의 A〉G 변환은 아스파라긴 71을 세린 71로 변화시키고 229에서의 G〉A 변환은 알라닌 77을 트레오닌 77로 변화시키는 두 가지 변화를 포함하고 있다. 상기 변화 모두는 제안된 TcbAiiN-말단의 상류에서 일어난다.The recovered tcbA gene contains two changes from the sequence shown in SEQ ID NO: 11, where the A> G transformation at 212 changes asparagine 71 to serine 71 and the G> A transformation at 229 changes alanine 77 to threonine 77. . All of these changes occur upstream of the proposed TcbA ii N-terminus.

pDAB2028의 제작Fabrication of pDAB2028

pDAB2027의 tcbA 코딩 부위를 벡터 pET15b로 옮겼다. 이는 숏건 (shotgun) 라이게이션법을 사용하여 실시하였으며, DNA는 제한 효소 Nco I 및 Xho I으로 분해하였다. 그 결과 생성되는 재조합형을 pDAB2028라 명명하였다.The tcbA coding region of pDAB2027 was transferred to vector pET15b. This was done using shotgun ligation and DNA was digested with restriction enzymes Nco I and Xho I. The resulting recombinant was named pDAB2028.

대장균에서의 플라스미드 pDAB2028로부터의 TcbA 발현TcbA Expression from Plasmid pDAB2028 in Escherichia Coli

대장균에서의 tcbA의 발현은 Studier 등에 의해 종래에 기술된 방법을 변형시킴으로써 성취되었다 (Studier, F.W., Rosenberg, A., Dunn, J., 및 Dubendorff, J., (1990) Use of T7 RNA polymerase to direct expression of cloned genes. Methods Enzymol., 185: 60-89). 수용성 대장균 세포 균주 BL21 (DE3)를 플라스미드 pDAB2028로 형질전환시켜 100 μg/ml의 암피실린 및 40 mM의 포도당을 함유하는 LB 아가상에 도말하였다. 형질전환시킨 세포들은, 수백개의 단리된 콜로니/플레이트의 밀도가 되도록 도말하였다. 37℃에서 철야 방치한 후 세포를 플레이트로부터 긁어 모아 100 μg/ml의 암피실린을 포함하는 LB 브로쓰에 현탁시켰다. 일반적인 배양 용량은 200 내지 250 ml이었다. 시간 0에서, 배양물 밀도 (OD600)는 실험에 따라 0.05 내지 0.15였다. 배양물은 세 종류의 온도 (22℃, 30℃ 또는 37℃) 중 어느 하나의 온도에서 0.15 내지 0.5의 밀도가 획득될 때까지 흔들어 주었고, 상기 밀도가 획득되었을 때에 1 mM 이소프로필티오-β-갈락토시드 (IPTG)로 유도시켰다. 배양균은 지정된 온도에서 4 내지 5시간 동안 배양시킨 후 처리를 할 때까지 (12 내지 72 시간) 4℃로 옮겨서 방치하였다.Expression of tcbA in E. coli was achieved by modifying methods previously described by Studier et al. (Studier, FW, Rosenberg, A., Dunn, J., and Dubendorff, J., (1990) Use of T7 RNA polymerase to direct expression of cloned genes.Methods Enzymol., 185: 60-89). Water soluble E. coli cell strain BL21 (DE3) was transformed with plasmid pDAB2028 and plated on LB agar containing 100 μg / ml of ampicillin and 40 mM glucose. The transformed cells were plated to the density of hundreds of isolated colonies / plates. After standing overnight at 37 ° C., cells were scraped from the plate and suspended in LB broth containing 100 μg / ml of ampicillin. Typical culture doses were 200 to 250 ml. At time zero, the culture density (OD600) was 0.05 to 0.15 depending on the experiment. Cultures were shaken at any one of three temperatures (22 ° C., 30 ° C. or 37 ° C.) until a density of 0.15 to 0.5 was obtained and 1 mM isopropylthio-β- was obtained when the density was obtained. Induced by galactoside (IPTG). The cultures were incubated at the designated temperature for 4-5 hours and then left to move to 4 ° C. until treatment (12-72 hours).

대장균에서 발현시킨 플라스미드 pDAB2028로부터의 TcbA의 정제 및 특성화Purification and Characterization of TcbA from Plasmid pDAB2028 Expressed in Escherichia Coli

TcbA 펩티드를 발현하는 대장균 배양물을 하기와 같이 처리하였다. 17000 × g에서 원심분리하여 세포를 수확하였으며 배지를 따라 별도의 용기에 모아 두었다.E. coli cultures expressing TcbA peptides were treated as follows. Cells were harvested by centrifugation at 17000 × g and collected in separate containers along the medium.

배지는 M12 (매사추세츠주 베벌리 소재의 아미콘 (Amicon) 제조) 여과 시스템 및 100 kD 분자 크기 컷 오프 여과기를 사용하여 약 8× 농축시켰다. 농축시킨 배지를 음이온 교환 컬럼상에 로딩시켰으며, 부착된 단백질을 1.0 M NaCl로 용출시켰다. 1.0 M NaCl 용출 피크는 써던 옥수수 뿌리 벌레 (SCR) 유충에 대하여 살충 효과를 야기하는 것으로 밝혀졌다 (표 30). 1.0 M NaCl 분획을 pH 7.0의 10 mM 인산 나트륨 완충액에 대하여 투석시켜 농축시켰으며, 세파로스 CL-4B (뉴저지주 피스카타웨이 소재의 파마시아 제조) 상에서 겔 여과시켰다. 천연 W-14 독소 복합체의 추정 분자량 (약 900 kDa)에 대응하는 CL-4B 용출 프로파일의 영역을 모아 농축시켰으며 유충에 대하여 생물학적 정량을 실시하였다. 모아진 900 kDa 분획은 천연 W-14 독소 복합체에 의해 야기되는 것과 유사한 징후를 갖는 살충 활성을 가지는 것으로 밝혀졌다 (하기 31 참조). 이 분획은 프로테이나제 K 및 열처리에 민감하였고, 두 경우 모두에서 활성이 소멸되거나 감소하였는데, 이는 활성이 사실상 단백질성에 의한 것이라는 증거를 제공한다. 또한, 활성 분획은 항-TcbAiii단클론성 항체로 시험시, 면역블롯 분석에서 TcbA 및 TcbAiii펩티드에 대해 면역학적 양성 여부를 시험하였다 (표 31).The medium was concentrated about 8 × using an M12 (Amicon, Beverley, Mass.) Filtration system and a 100 kD molecular size cut off filter. The concentrated medium was loaded on an anion exchange column and the attached protein was eluted with 1.0 M NaCl. A 1.0 M NaCl elution peak was found to cause pesticidal effects against Southern Corn Root Worm (SCR) larvae (Table 30). The 1.0 M NaCl fractions were concentrated by dialysis against 10 mM sodium phosphate buffer at pH 7.0 and gel filtered on Sepharose CL-4B (Pharmacia, Piscataway, NJ). Regions of the CL-4B elution profile corresponding to the estimated molecular weight (about 900 kDa) of the native W-14 toxin complex were collected and concentrated and biological quantification was performed on the larvae. The collected 900 kDa fractions were found to have pesticidal activity with signs similar to those caused by the native W-14 toxin complex (see 31 below). This fraction was sensitive to proteinase K and heat treatment and in both cases activity was lost or decreased, providing evidence that the activity was in fact proteinaceous. In addition, the active fractions were tested immunologically positive for TcbA and TcbA iii peptides in immunoblot assays when tested with anti-TcbA iii monoclonal antibodies (Table 31).

면역블롯 및 SCR 생물학적 정량 결과Immunoblot and SCR Biological Quantification Results 분획Fraction SCR 활성SCR activity 면역블롯Immunoblot 천연 크기Natural size % 치사율% Lethality % 성장 저해율% Growth inhibition 검출되는 펩티드Peptide Detected CL-4B로 추정된 크기Size estimated by CL-4B TcbA 배지 1.0 MTcbA Badge 1.0 M ++++++ ++++++ TcbATcbA 이온 교환Ion exchange TcbA 배지 CL-4BTcbA Badge CL-4B ++++++ ++++++ TcbA, TcbAiii TcbA, TcbA iii ∼900 kDaTo 900 kDa TcbA 배지 CL-4B + 프로테이나제 KTcbA medium CL-4B + proteinase K +++ ++++++ NTNT TcbA 배지 CL-4B + 열처리TcbA Medium CL-4B + Heat Treatment NTNT TcbA 세포 상등액 CL-4BTcbA Cell Supernatant CL-4B ++++++ NTNT ∼900 kDaTo 900 kDa PK = 프로테이나제 K 처리 2시간, 열처리 = 100℃에서 10분, ND = 검출되지 않음, NT = 시험되지 않음. 대조군 샘플과 비교한 치사율 및 성장 저해율의 스코어링 시스템; 5-24% = +, 25-49% = ++, 50-100% = +++.PK = 2 hours of proteinase K treatment, heat treatment = 10 minutes at 100 ° C., ND = not detected, NT = not tested. Scoring system of mortality and growth inhibition compared to control sample; 5-24% = +, 25-49% = + +, 50-100% = + + +.

세포 펠렛을 pH 7.0의 10 mM 인산 나트륨 완충액에 재현탁시켰으며 등록상표 Bio-Neb 세포 네불라이저 (nebulizer, 인디아나주 테라 호트 소재의 글라스-콜 인크. (Glas-Col Inc.) 제조)에 통과시켜 용균시켰다. 펠렛을 DNase로 처리하여 DNA를 제거하였으며, 17000 × g에서 원심분리하여 세포 상등액과 세포 펠렛을 분리시켰다. 상등액 분획을 따라내어 0.2 미크론 여과기를 통하여 여과시켜 큰 입자를 제거하였으며, 음이온 교환 크로마토그래피를 실시하였다. 부착된 단백질을 1.0 M NaCl로 용출시켜 투석시켰으며, 50000 달톤의 분자 크기 컷 오프를 가지는 등록상표 바이오맥스 농축기 (매사추세츠주 베드포드 소재의 밀리포아 코포레이션 제조)를 사용하여 농축시켰다. 농축된 분획은 세파로스 CL-4B 비드로 된 매트릭스를 사용하여 겔 여과 크로마토그래피를 실시하였다. 상기 방식으로 제조된 물질의 생물학적 정량 데이타는 표 30에 예시되어 있으며, TcbA 세포 상등액으로 나타내었다.The cell pellet was resuspended in 10 mM sodium phosphate buffer at pH 7.0 and passed through a trademark Bio-Neb cell nebulizer (Glas-Col Inc., Terahort, IN). Lysate. DNA was removed by treating the pellet with DNase, and the cell supernatant and the cell pellet were separated by centrifugation at 17000 × g. The supernatant fractions were decanted and filtered through a 0.2 micron filter to remove large particles and anion exchange chromatography was performed. The attached protein was dialyzed by eluting with 1.0 M NaCl and concentrated using a trademark Biomax concentrator (Millipoa Corporation, Bedford, Mass.) With a molecular size cut off of 50000 Daltons. The concentrated fractions were subjected to gel filtration chromatography using a matrix of Sepharose CL-4B beads. Biological quantitative data of materials prepared in this manner is illustrated in Table 30 and represented as TcbA cell supernatant.

많은 양의 물질을 다루는 다른 방법에서, 세포 펠렛을 pH 7.0의 10 mM 인산 나트륨 완충액에 재현탁시켰으며, 콘테스 글래스 캄파니 (Kontes Glass Company, 뉴저지주 바인랜드 소재)의 40 ml 조직 분쇄기를 사용하여 완전히 균질화시켰다. 세포 파쇄물은 25000 × g에서 원심분리하여 펠렛화하였고, 세포 상등액을 따라내어 0.2 미크론 여과기를 통과시켰으며, 다공성 HQ 50 비드로 충전시킨 파마시아 10/10 컬럼을 사용하여 음이온 교환 크로마토그래피를 실시하였다. 부착된 단백질은 0.0 내지 1.0 M의 NaCl 농도구배를 실시하여 용출시켰다. TcbA 단백질을 포함하는 분획을 조합시켜 50 kDa 농축기를 사용하여 농축시켰으며, 파마시아 CL-4B 비드로 된 매트릭스를 사용하는 겔 여과 크로마토그래피를 실시하였다. 약 900 kDa의 분자 크기를 가지는 TcbA 올리고머를 포함하는 분획을 모았으며, 상기 분획을 pH 7.3의 20 mM Tris 완충액으로 평형시킨 파마시아 모노 Q 10/10 컬럼을 사용하여 음이온 교환 크로마토그래피를 실시하였다. 재조합 TcbA 단백질을 용출시키기 위하여 0.0 내지 1.0 M 선형 농도 구배의 NaCl이 사용되었다. 재조합 TcbA는 천연 TcbA 올리고머가 모노 Q 10/10 컬럼으로부터 용출되는 것과 동일한 몰 농도인 약 0.3 내지 0.4 M NaCl 염 농도에서 컬럼으로부터 용출되었다. 재조합 TcbA 분획은 표 31에서의 실험과 유사한 생물학적 정량 실험에서 SCR 치사를 유도하는 것으로 밝혀졌다.In another method of handling large amounts of material, the cell pellet was resuspended in 10 mM sodium phosphate buffer at pH 7.0 and used a 40 ml tissue grinder from Kontes Glass Company, Vineland, NJ. Complete homogenization. Cell lysates were pelleted by centrifugation at 25000 × g, the cell supernatant was decanted and passed through a 0.2 micron filter and subjected to anion exchange chromatography using a Pharmacia 10/10 column packed with porous HQ 50 beads. The attached protein was eluted by performing a NaCl concentration gradient of 0.0 to 1.0 M. Fractions containing TcbA protein were combined and concentrated using a 50 kDa concentrator, followed by gel filtration chromatography using a matrix of Pharmacia CL-4B beads. Fractions containing TcbA oligomers having a molecular size of about 900 kDa were collected and subjected to anion exchange chromatography using a Pharmacia mono Q 10/10 column equilibrated with 20 mM Tris buffer at pH 7.3. A 0.0 to 1.0 M linear gradient of NaCl was used to elute the recombinant TcbA protein. Recombinant TcbA was eluted from the column at about 0.3 to 0.4 M NaCl salt concentration, the same molar concentration as that of the native TcbA oligomer eluted from the mono Q 10/10 column. Recombinant TcbA fractions were found to induce SCR lethality in biological quantitative experiments similar to the experiments in Table 31.

발현 구조의 두번째 세트를 제조하고 TcbA 단백질 독소의 발현에 대해 검사하였다.A second set of expression constructs was prepared and tested for expression of TcbA protein toxins.

pDAB2030의 구성: tcbA 코딩 영역에 대한 발현 플라스미드Construction of pDAB2030: Expression Plasmid for tcbA Coding Region

플라스미드 pDAB2028 (본원 참조)는 상업용 벡터 pET15 (Novagen, 위스콘신주 메디슨) 중에 tcbA 코딩 영역을 함유하고, 앰피실린 선택 마커를 코딩한다. 플라스미드 pDAB2030은 카나마이신 선택 마커를 코딩하는 플라스미드로부터 tcbA 코딩 영역을 발현시키도록 제조하였다. 이 제조는 pET27 (Novagen, 위스콘신 메디슨) 카나마이신 선택 플라스미드 및 pDAB2028를 Xba I 및 Xho I로 절단하여 실시한다. 이로써, 플라스미드 pDAB2028로부터 tcbA 코딩 영역을 포함한 전체 다중 클로닝 부위를 얻는다. 두개의 절단된 플라스미드를 혼합하고 라이게이션시켰다. 재조합 플라스미드를 카나마이신 상에서 선택하고 pDAB2028 단편을 함유한 것들을 제한 분석에 의해 확인하였다. 새로운 재조합 플라스미드를 pDAB2030으로 칭한다.Plasmid pDAB2028 (see herein) contains the tcbA coding region in commercial vector pET15 (Novagen, Madison, Wisconsin) and encodes an ampicillin selection marker. Plasmid pDAB2030 was prepared to express the tcbA coding region from the plasmid encoding the kanamycin selection marker. This preparation is performed by cleaving pET27 (Novagen, Wisconsin Madison) kanamycin selective plasmid and pDAB2028 with Xba I and Xho I. This gives the entire multiplex cloning site including the tcbA coding region from plasmid pDAB2028. Two cleaved plasmids were mixed and ligated. Recombinant plasmids were selected on kanamycin and those containing pDAB2028 fragments were identified by restriction analysis. The new recombinant plasmid is called pDAB2030.

플라스미드 pDAB2031의 구성: tcbAi에서 돌연변이의 보정Composition of Plasmid pDAB2031: Correction of Mutations in tcbA i

실시예 19에 기재된 바와 같이 tcbA 코딩 영역의 N-말단에서 두개의 돌연변이 (서열 ID No: 11; 212에서 A〉G가 아스파라긴 71을 세린 71로 변화시킴; 229에서 G〉A가 알라닌 77을 트레오닌 77로 변화시킴)를 다음과 같이 보정하였다. PCR 생성물을 프라이머 TH50 (5' ACC GTC TTC TTT ACG ATC AGT G 3') 및 S1Ac51 (5' TTT AAA CCA TGG GAA ACT CAT TAT CAA GCA CTA TC 3')과 템플릿으로서 pDAB2025를 사용하여 발생시킴으로써 1778 bp 생성물을 얻었다. 이 PCR 생성물을 플라스미드 pCR2.1 (Invitrogen, 캘리포니아주 샌 디에고)로 클로닝하고 클론을 단리하고 서열화하였다. 클론을 NCO I 및 Pin AI로 절단시키고 1670bp 단편을 1% 아가로스겔로부터 정제하였다. 돌연변이된 tcbA 코딩 영역을 함유한 플라스미드 (pDAB 2030)을 NcoI 및 Not I로 절단시키고 Qiaex II (Qiagen, 캘리포니아주 챗스워쓰)를 갖는 0.8% 아가로스 내에서 1670 bp 단편으로부터 정제하였다. 이어서, 보정된 Nco I/Pin AI 단편을 pDAB2030으로 라이게이션시켰다. 라이게이션된 DNA를 DH5α E. coli.로 형질변환시켰다. 클론을 단리하고, 시퀀싱하고 보정되었음을 확인하였다. 이 보정된 tcbA 코딩 영역을 함유한 플라스미드를 pDAB2031로 칭한다.Two mutations at the N-terminus of the tcbA coding region as described in Example 19 (SEQ ID NO: 11; at 212 G changes asparagine 71 to serine 71; at 229 G> A alanine 77 to threonine Change to 77) was corrected as follows. PCR products were generated using primers TH50 (5 'ACC GTC TTC TTT ACG ATC AGT G 3') and S1Ac51 (5 'TTT AAA CCA TGG GAA ACT CAT TAT CAA GCA CTA TC 3') and pDAB2025 as a template to generate 1778 bp The product was obtained. This PCR product was cloned into plasmid pCR2.1 (Invitrogen, San Diego, Calif.) And clones were isolated and sequenced. Clones were cleaved with NCO I and Pin AI and 1670 bp fragment was purified from 1% agarose gel. Plasmids containing the mutated tcbA coding region (pDAB 2030) were digested with NcoI and Not I and purified from 1670 bp fragment in 0.8% agarose with Qiaex II (Qiagen, Chatsworth, CA). The corrected Nco I / Pin AI fragment was then ligated with pDAB2030. The ligated DNA was transformed with DH5α E. coli. Clones were isolated, sequenced and confirmed to be corrected. The plasmid containing this corrected tcbA coding region is called pDAB2031.

pDAB2033 및 pDAB2034의 구성: tcbA에 대한 발현 플라스미드Construction of pDAB2033 and pDAB2034: Expression Plasmid for tcbA

발현 플라스미드 pDAB2025 및 pDAB2027은 모두 박테리오파지 T7 발현 시스템에 좌우된다. 추가 벡터 시스템을 tcbA 유전자 및 그의 유도체의 발테리아성 발현에 사용하였다. 발현 벡터 Trc99a (Pharmacia Biotech, 뉴저지주 핏츠카타웨이)는 pDAB2030 및 2031로부터의 tcbA 코딩 영역과 상용성인 5' Nco I 부위와 다중 클로닝 부위의 강한 trc 프로모터 상류를 함유한다. 그러나, 플라스미드는 상용성 3' 부위를 갖지 않는다. 그러므로, Trc99a의 Hind III 부위를 절단하고 T4 DNA 폴리머라제 (Boehringer Mannheim, 인디애나주 인디애나폴리스)로 처리하여 뭉툭하게 만들었다. 이어서, 벡터 플라스미드를 Nco I로 절단하고 알칼리성 포스파타아제로 처리하였다. 플라스미드 pDAB2030 및 pDAB2031을 각각 Xho I로 절단하고 (tcbA 코딩 영역의 3' 말단에서 절단) T4 DNA 폴리머라제로 처리하여 말단을 뭉툭하게 만들었다. 이어서, 플라스미드를 Nco I로 절단하고, DNA를 페놀로 추출하고, 에탄올 침전시키고, 완충액에 재현탁시켰다. Trc99a과 pDAB2030 및 pDAB2031 플라스미드를 따로따로 혼합하고, 라이게이션하고, DH5α 세포로 형질전환시키고, 앰피실린 및 50 mM 글루코스를 함유한 LB 매질 상에 플레이팅하였다. 재조합 플라스미드를 제한 절단에 의해 확인하였다. 새로운 플라스미드를 pDAB2033 (tcbAi중의 두개의 돌연변이를 갖는 tcbA 코딩 서열을 함유함) 및 pDAB2034 (pDAB2031로부터의 tcbA의 보정된 버젼을 함유함)로 칭한다.Expression plasmids pDAB2025 and pDAB2027 both depend on the bacteriophage T7 expression system. Additional vector systems were used for the bacterial expression of the tcbA gene and its derivatives. The expression vector Trc99a (Pharmacia Biotech, Pittscataway, NJ) contains a strong trc promoter upstream of the 5 ′ Nco I site and multiple cloning sites compatible with the tcbA coding region from pDAB2030 and 2031. However, the plasmid does not have a compatible 3 'site. Therefore, the Hind III site of Trc99a was cut and blunted by treatment with T4 DNA polymerase (Boehringer Mannheim, Indianapolis, Indiana). The vector plasmid was then digested with Nco I and treated with alkaline phosphatase. Plasmids pDAB2030 and pDAB2031 were cut with Xho I (cut at 3 'end of tcbA coding region) respectively and treated with T4 DNA polymerase to blunt the ends. The plasmid was then digested with Nco I, the DNA extracted with phenol, ethanol precipitated and resuspended in buffer. Trc99a and pDAB2030 and pDAB2031 plasmids were mixed separately, ligated, transformed into DH5α cells and plated on LB medium containing ampicillin and 50 mM glucose. Recombinant plasmids were identified by restriction cleavage. The new plasmids are called pDAB2033 (containing the tcbA coding sequence with two mutations in tcbA i ) and pDAB2034 (containing the corrected version of tcbA from pDAB2031).

플라스미드 pDAB2032의 구성: tcbAiiAiii에 대한 발현 플라스미드Construction of Plasmid pDAB2032: Expression Plasmid for tcbA ii A iii

TcbA의 tcbAiiAiii부분을 코딩하는 플라스미드를 플라스미드 pDAB2031과 같은 방식으로 제조하였다. PCR 생성물을 TH42 (5' TAG GTC TCC ATG GCT TTT ATA CAA GGT TAT AGT GAT CTG 3') 및 TH50 (5' ACC GTC TTC TTT ACG ATC AGT G 3') 프라이머 및 템플릿으로서 pDAB2025를 사용하여 발생시켰다. 이로써 tcbAii의 코딩 서열의 개시부에 초기 코돈을 갖는 1521 bp의 생성물을 얻었다. 이 PCR 생성물을 1% 아가로스겔 중에 단리하여 정제하였다. 정제된 생성물을 상기와 같이 pCR2.1로 클로닝하고 보정된 클론을 DNA 서열 분석에 의해 확인하였다. 이 클론을 Nco I 및 Pin AI로 절단시키고, 1414 bp 단편1% 아가로스 중에서 단리하고, 플라스미드 pDAB2030의 Nco I 및 Pin AI 부위로 라이게이션시키고 DH5α E. coli로 형질변환시켰다. TcbAiiAiii를 발현하도록 지정된 이 새로운 플라스미드를 pDAB2032로 칭한다.A plasmid encoding the tcbA ii A iii portion of TcbA was prepared in the same manner as plasmid pDAB2031. PCR products were generated using pDAB2025 as TH42 (5 'TAG GTC TCC ATG GCT TTT ATA CAA GGT TAT AGT GAT CTG 3') and TH50 (5 'ACC GTC TTC TTT ACG ATC AGT G 3') primers and templates. This gave 1521 bp of product with initial codons at the beginning of the coding sequence of tcbA ii . This PCR product was isolated and purified in 1% agarose gel. The purified product was cloned into pCR2.1 as above and the corrected clones were confirmed by DNA sequencing. This clone was cleaved with Nco I and Pin AI, isolated in 1414 bp fragment 1% agarose, ligated to Nco I and Pin AI sites of plasmid pDAB2030 and transformed with DH5α E. coli. This new plasmid designated to express TcbA ii A iii is called pDAB2032.

플라스미드 pDAB2030, pDAB2031 및 pDAB2032로부터 tcbA 및 tcbAiiAiii의 발현Expression of tcbA and tcbA ii A iii from plasmids pDAB2030, pDAB2031 and pDAB2032

플라스미드 pDAB2030, pDAB2031 및 pDAB2032로부터 E. coli에 tcbA를 발현시키는 것을 tcbAiiAiii를 E. coli 균주 HMS174 (DE3) (Novagen, 위스콘신주 메디슨)에서 실시한 것을 제외하고는 본원에 기재한 바와 같이 실시하였다.Expression of tcbA in E. coli from plasmids pDAB2030, pDAB2031 and pDAB2032 was performed as described herein except that tcbA ii A iii was performed in E. coli strain HMS174 (DE3) (Novagen, Madison, Wisconsin). .

플라스미드 pDAB2033으로부터 tcbA의 발현Expression of tcbA from plasmid pDAB2033

플라스미드 pDAB2033을 BL21 세포 (novagen 위스콘신주 메디슨)로 형질변환시키고, 100 ㎍/㎖ 앰피실린 및 50 mM 글루코스를 함유하는 LB 상에 플레이팅하였다. 각 플레이트 상에 수백개의 웰의 분리된 군체가 존재하도록 플레이트를 스프레딩한 후 밤새 30℃ 또는 37℃에서 인큐베이션시켰다. 군체를 플레이트로부터 긁어내고 100 ㎍/㎖ 앰피실린을 함유하지만 글루코스를 함유하지 않은 LB 중에 현탁시켰다. 전형적인 배양액 부피는 단일 1 ℓ 배플 바닥 플라스크 중에 250 ㎖였다. 배양액의 밀도가 0.3 내지 0.6 OD600 ㎚에 이르렀을 때 배양액을 유도시켰다. 이 농도는 플레이트로부터 세포를 현탁시킨 직후 도달하는 경우가 가장 빈번하고 액상 매질 중에서 생장 기간을 필요로 하지 않았다. 2 개의 유도 방법을 사용하였다. 방법 1: 세포를 37℃에서 1 mM IPTG로 유도시켰다. 배양액을 플랫포옴 진탕기 상에서 200 rpm으로 5 시간 동안 진탕하고 수확하였다. 방법 2: 배양액을 30℃에서 25 μM IPTG로 유도시키고 20℃ 또는 30℃에서 15 시간 동안 200 rpm으로 진탕하였다. 배양액을 정제를 위해 사용할 때까지 4℃에 보관하였다.Plasmid pDAB2033 was transformed into BL21 cells (Medicine, Novagen, Wisconsin) and plated on LB containing 100 μg / ml ampicillin and 50 mM glucose. The plates were spread out and incubated overnight at 30 ° C. or 37 ° C. such that there were several hundred wells of isolated colony on each plate. Colonies were scraped from the plates and suspended in LB containing 100 μg / ml ampicillin but no glucose. Typical culture volume was 250 ml in a single 1 l baffle bottom flask. The culture was induced when the density of the culture reached 0.3-0.6 OD600 nm. This concentration is most often reached immediately after suspending cells from the plate and does not require a growth period in the liquid medium. Two induction methods were used. Method 1: Cells were induced with 1 mM IPTG at 37 ° C. The culture was shaken for 5 hours at 200 rpm on a platform shaker and harvested. Method 2: Cultures were induced with 25 μM IPTG at 30 ° C. and shaken at 200 rpm at 20 ° C. or 30 ° C. for 15 hours. Cultures were stored at 4 ° C. until used for purification.

E. coli로부터 TcbA의 정제Purification of TcbA from E. coli

TcbA 및 TcbAiiAiii의 정제, 생물 검정법 및 면역블롯 분석을 본원에 기재된 바와 같이 실시하였다. 몇몇 대표적인 E. coli 발현 실험의 결과를 표 32에 제시하였다. 표 32에 제시된 모든 물질은 배양 배지 분획으로부터 정제하였다. 예측된 고유 분자량은 본원에 기재된 바와 같이 대략 900 kD이다. 샘플의 순도, 오염 단백질에 대한 TcbA의 양은 각각의 제조법에 따라 달랐다.Purification, bioassay and immunoblot analysis of TcbA and TcbA ii A iii were performed as described herein. The results of some representative E. coli expression experiments are shown in Table 32. All materials shown in Table 32 were purified from culture medium fractions. The predicted intrinsic molecular weight is approximately 900 kD as described herein. The purity of the sample, and the amount of TcbA for contaminating proteins, varied with each preparation.

이. 콜리로 부터 생산되고, 배양 배지로부터 정제된TcbA 및 유도체의 생물 검정 활성 및 면역블롯 분석this. Bioassay Activity and Immunoblot Analysis of TcbA and Derivatives Produced from Coli and Purified from Culture Media 플라스미드Plasmid 코딩 부위Coding region 이.콜리균주E. coli strain 써던 옥수수 뿌리벌레 생물 분석 활성Southern Corn Roots Biologically Active 면역 블롯에 의하여 검출된 펩티드Peptides Detected by Immune Blot 먹이에 투여된 단백질(㎍)Protein administered to the food (μg) 성장억제%Growth inhibition 치사율%% Mortality pDAB2030pDAB2030 tcbAtcbA BL21(DE3)BL21 (DE3) -- ++++++ TcbA+TcbAiii TcbA + TcbA iii 1-81-8 pDAB2031pDAB2031 tcbAtcbA BL21(DE3)BL21 (DE3) -- ++++++ TcbA+TcbAiii TcbA + TcbA iii 1-101-10 pDAB2033pDAB2033 tcbAtcbA BL21BL21 -- ++++++ TcbA+TcbAiii TcbA + TcbA iii 1-21-2 pDAB2032pDAB2032 tcbAiiAiii tcbA ii A iii HMS174(DE3)HMS174 (DE3) ++++++ ++ TcbAiiAiii+TcbAiii TcbA ii A iii + TcbA iii 13-2713-27 대조 시료와 비교할 때, 써던 옥수수 뿌리벌레에서의 치사율 및 성장억제에 대한 스코어링 시스템: 5-24 %=+, 25-49%=++, 50-100%=+++Scoring system for mortality and growth inhibition in southern corn rootworms compared to control samples: 5-24% = +, 25-49% = ++, 50-100% = +++

〈실시예 20〉<Example 20>

매트릭스-보조 레이저 흡수 이온화 타임-오브-플라이트 질량 스펙트로스코피를 이용한 독소 펩타이드의 특성화Characterization of Toxin Peptides Using Matrix-Assisted Laser Absorption Ionization Time-of-Flight Mass Spectroscopy

W-14 브로쓰로부터 단리한 독소를 실시예 15에 기재한 바와 같이 단리하였다. 몇몇 경우에 TcaB 단백질 독소를 앞서 기재한 바와 같이 (실시예 15) W-14 브로쓰로부터 단리한 프로테아제 (실시예 16)으로 예비처리하였다. 단백질 분자 질량을 VOYAGER BIOSPECTROMETRY 워크스테이션에서 지연 추출 기술로 매트릭스-보조 레이저 흡수 이온화 타임-오브-플라이트 질량 스펙트로스코피 (이후 MALDI-TOF로 칭함)를 사용하여 결정하였다. 대개 주요 단백질 (5 ㎕ 중의 100 - 500 pmoles)을 아세토니트릴 1 ㎕과 혼합하고 공극 크기가 0.025 μM인 밀리포어 VS 필터 (Millipore Corp. 메사추셋츠주 베드포드) 상에서 0.5 내지 1 시간 동안 투석하였다. 투석은 물에 대해 필터를 부유시켜 수행하고 (광택면이 위로 가도록) 단백질-아세토니트릴 혼합물을 필터 표면 상에 적가하였다. 투석 후, 투석된 단백질을 피펫을 사용하여 제거하고 시나핀산 및 트리플루오로아세트산으로 이루어진 매트릭스와 업자 지시에 따라 혼합하였다. 단백질 및 매트릭스를 약 3 ㎠ 금 도금 샘플 플레이트 (PerSeptive Corp.) 상에서 공결정화시켰다. 하기 조건을 사용하여 결정을 여기시키고 후속 질량 분석을 실시하였다. 레이저 셋팅 3050; 압력 4.55e-07; 저 질량 게이트 1500.0; 음이온 오프; 가속 전압 25,000; 그리드 전압; 90.0%; 가이드 와이어 전압 0.010%; 선형 모드; 및 펄스 지연 시간 350 ns.Toxins isolated from W-14 broth were isolated as described in Example 15. In some cases the TcaB protein toxin was pretreated with protease (Example 16) isolated from W-14 broth as described above (Example 15). Protein molecular mass was determined using matrix-assisted laser absorption ionization time-of-flight mass spectroscopy (hereinafter referred to as MALDI-TOF) as a delayed extraction technique on a VOYAGER BIOSPECTROMETRY workstation. Usually the main protein (100-500 pmoles in 5 μl) was mixed with 1 μl of acetonitrile and dialyzed on a Millipore VS filter (Millipore Corp. Bedford, Mass.) With a pore size of 0.025 μM for 0.5 to 1 hour. Dialysis was performed by suspending the filter against water and dropping the protein-acetonitrile mixture onto the filter surface (with the glossy side up). After dialysis, the dialyzed protein was removed using a pipette and mixed according to the manufacturer's instructions with a matrix consisting of cinafinic acid and trifluoroacetic acid. Proteins and matrices were cocrystallized on about 3 cm 2 gold plated sample plates (PerSeptive Corp.). The crystals were excited using the following conditions and subjected to subsequent mass spectrometry. Laser setting 3050; Pressure 4.55e-07; Low mass gate 1500.0; Anion off; Acceleration voltage 25,000; Grid voltage; 90.0%; Guide wire voltage 0.010%; Linear mode; And pulse delay time 350 ns.

단백질 질량 분석 데이터를 표 33에 제시하였다. MALDI-TOF로부터 얻은 데이터를 유전자 서열 정보로부터 가정한 것과 SDS-PAGE로 앞서 결정한 것과 비교하였다.Protein mass spectrometry data is presented in Table 33. Data obtained from MALDI-TOF was compared with the assumptions made from gene sequence information and those previously determined by SDS-PAGE.

유전자 서열을 기초로하여 MALDI-TOF, SDS-PAGE 및 예측 측정에 의한 펩티드의 분자 분석Molecular analysis of peptides by MALDI-TOF, SDS-PAGE and predictive measurements based on gene sequence 펩티드Peptide 예측 (유전자)Prediction (Gene) SDS PAGESDS PAGE MALDI-TOFMALDI-TOF TcbATcbAi/iiTcbAiiTcbAiii TcbATcbA i / ii TcbA ii TcbA iii 80,634 Da217,710 Da207,698 Da62,943 Da80,634 Da217,710 Da207,698 Da62,943 Da 240,000 Da해석되지 않음201,000 Da58,000 Da240,000 Da Not interpreted 201,000 Da58,000 Da 281,040 Da216,812 Da206,473 Da63,520 Da281,040 Da216,812 Da206,473 Da63,520 Da TcbAiiTcbAiii TcbA ii TcbA iii 209,218 Da63,943 Da209,218 Da63,943 Da 280,634 Da280,634 Da280,634 Da280,634 Da 280,634 Da280,634 Da280,634 Da280,634 Da TcbAiiTcbAiii TcbA ii TcbA iii 생성된 프로테아제생성된 프로테아제Protease Produced Protease 280,634 Da280,634 Da280,634 Da280,634 Da 280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da280,634 Da *TcbAi/ii에서 관찰된 다중 단편인 일반화된 TcbA 데이터Generalized TcbA data, multiple fragments observed on * TcbA i / ii

〈실시예 21〉<Example 21>

펩티드 특이성 다클론성 항체의 생산Production of Peptide Specific Polyclonal Antibodies

W-14 독소 복합체의 9 개의 펩티드 성분, 즉 TcaA, TcaAiii, TcaB, TcaBii, TcaC, TcbAii, TcbAiii, TcdAii및 TcdAiii를 표적으로 선택하고 이에 대해 항체를 생산하였다. 이들 펩티드에 대한 상보성 DNA 및 유도된 아미노산 서열 데이터는 펩티드 중 몇몇 사이의 서열 동일성이 실제함을 나타내었다. 만일 전체 펩티드가 항체 생산을 유도하는 임뮤노겐으로서 사용되었다면, 생성되는 항체는 독소 제조에서 여러 펩티드에 결합할 것이다. 이러한 문제점을 피하기 위해 각각의 원하는 펩티드의 고유 영역에 특이적으로 결합하는 항체를 발생시켰다. 각각의 표적 펩티드의 고유 영역 (서브펩티드)는 하기 기재된 분석을 기초로하여 선택하였다.Nine peptide components of the W-14 toxin complex, namely TcaA, TcaA iii , TcaB, TcaB ii , TcaC, TcbA ii , TcbA iii , TcdA ii and TcdA iii , were selected and antibodies were produced against them. Complementary DNA and derived amino acid sequence data for these peptides indicated that sequence identity between several of the peptides was real. If the entire peptide was used as an immunogen to induce antibody production, the resulting antibody would bind to several peptides in toxin production. To avoid this problem, antibodies were generated that specifically bind to the unique region of each desired peptide. The unique region (subpeptide) of each target peptide was selected based on the assay described below.

각각의 전체 펩티드 서열을 MacVector (상표명) Protein Analysis Tool (IBI Wequence Analysis Software, International Biotechnologies, Inc., 코네티컷트주 뉴헤이브 피.오. 박스 9558)을 사용하여 분석하고 그의 항원 지수를 결정하였다. 이 프로그램은 가능한한 외부에 위치한 아미노산 서열, 즉 항원 부위일 수 있는 영역의 위치를 지정하도록 고안되었다. 이 방법은 친수성, 표면 가능성 및 2차 구조 예측에 따른 골격 가요성 예측으로부터 정보를 조합하여 단백질의 표면 윤곽에 대한 복합적인 예측안을 낸다. 각각의 분석에 대한 점수는 -1.0과 +1.0 사이의 값으로 표준화하였다 (MacVector (상표명) Manual). 항원 지수값을 표적 펩티드의 전체 서열에 대해 얻었다. 각각의 펩티드로부터, 원래 서열로부터 높은 항원 지수를 보인 19개 이상의 아미노산을 커버하는 영역을 재분석하여 측면 잔기 없이 서브펩티드의 항원 지수를 결정하였다. 이 재분석은 펩티드의 항원 지수가 측면 아미노산 잔기에 의해 영향을 받을 수 있기 때문에 필수적이다. 만일 단리된 서브펩티드 서열이 고 항원 지수를 유지하지 않는다면, 새로운 영역을 선택하고 분석을 반복하였다.Each entire peptide sequence was analyzed using the MacVector ™ Protein Analysis Tool (IBI Wequence Analysis Software, International Biotechnologies, Inc., New Haven P. Box. 9558, Connecticut) and its antigen index was determined. The program is designed to locate as far as possible the amino acid sequence, ie the region that may be the antigenic site. This method combines information from skeletal flexibility predictions based on hydrophilicity, surface likelihood, and secondary structure predictions, resulting in complex predictions of the surface contours of proteins. Scores for each analysis were normalized to values between -1.0 and +1.0 (MacVector ™ Manual). Antigen index values were obtained for the entire sequence of the target peptide. From each peptide, the region covering at least 19 amino acids showing a high antigenic index from the original sequence was reanalyzed to determine the antigenic index of the subpeptide without flanking residues. This reanalysis is essential because the antigenic index of the peptide can be affected by flanking amino acid residues. If the isolated subpeptide sequence did not maintain a high antigenic index, a new region was selected and the analysis repeated.

각각의 선택된 서브펩티드 서열을 정렬하고 MacVector (상표명) 정렬 프로그램을 사용하여 모든 7개 표적 펩티드 서열에 대해 비교하였다. 만일 선택된 서브펩티드 서열이 다른 표적 펩티드에 대해 동일성 (20% 이상)을 보이면, 새로운 19 개 이상의 아미노산 영역을 단리하여 재분석하였다. 고 항원 지수를 보이는 19 개 이상의 아미노산을 커버하는 고유의 서브펩티드 서열을 모든 표적 펩티드로부터 선택하였다.Each selected subpeptide sequence was aligned and compared against all seven target peptide sequences using the MacVector ™ alignment program. If the selected subpeptide sequence showed identity (more than 20%) for other target peptides, new 19 or more amino acid regions were isolated and reanalyzed. Unique subpeptide sequences covering at least 19 amino acids showing high antigenic index were selected from all target peptides.

7개 서브펩티드 서열을 제네미드 바이오텍크놀로지 인크. (Genemed Biotechnology Inc.)에 보냈다. 각각의 서브펩티드 상의 마지막 아미노산 잔기는 항원 지수에 뚜렷한 영향을 보이지 않기 때문에 삭제하였다. 시스테인 잔기를 내부 시스테인 잔기를 함유한 TcaBi-syn을 제외하고 각각의 서브펩티드 서열의 N-말단에 첨가하였다. 시스테인 잔기가 존재하면 담체 단백질 (KLH)의 컨쥬게이션이 촉진된다. 적당한 독소 펩티드에 대응한 최종 펩티드 생성물 및 서열 ID NO.를 표 34에 제시하였다.Seven subpeptide sequences were generated by the Genemid Biotechnology Inc. (Genemed Biotechnology Inc.). The last amino acid residue on each subpeptide was deleted because it did not show a clear effect on the antigen index. Cysteine residues were added to the N-terminus of each subpeptide sequence except TcaBi-syn containing internal cysteine residues. The presence of cysteine residues promotes the conjugation of the carrier protein (KLH). The final peptide product and SEQ ID NO. Corresponding to the appropriate toxin peptide are shown in Table 34.

각각의 컨쥬게이트된 합성 펩티드를 제네미드 (Genemed) 가속화 프로그램에 따라 2마리의 토끼에 주입하였다. 1개월 후 검사를 위한 프리 및 포스트 면역 혈청을 얻을 수 있었다.Each conjugated synthetic peptide was injected into two rabbits according to the Genemed Acceleration Program. After 1 month pre and post immune serum were obtained for testing.

각각의 토끼로부터 얻은 프리 및 포스트 면역 혈청 모두의 1차 검사는 제네미드 바이오테크놀로지 인크.가 수행하였다. 제네미드 (Genemed)는 ELISA 및 웨스턴 블롯 기술을 사용하여 각각의 합성 펩티드에 대한 포스트 면역 혈청의 반응을 검색하였다고 보고하였다. 이어서, 혈청을 웨스턴 블롯 분석에 따라 전체 표적 펩티드로 검사하였다. 부분적으로 정제된 포토라드부스 균주 W-14 독소 복합체의 2개 뱃치를 항원으로 사용하였다. 2개의 샘플은 써던 옥수수 뿌리 벌레에 대해 활성을 보였다. SDS-PAGE 겔에 대한 그들의 패턴은 약간 달랐다.The primary test of both pre and post immune sera from each rabbit was performed by Genemid Biotechnology Inc. Genemed reported using ELISA and Western blot techniques to retrieve the response of post immune serum to each synthetic peptide. Serum was then tested with the total target peptide according to Western blot analysis. Two batches of partially purified Photoradbus strain W-14 toxin complex were used as antigens. Two samples showed activity against Southern corn root worms. Their pattern for SDS-PAGE gels was slightly different.

4-20% 구배를 갖는 프리-캐스트 SDS-폴리아크릴아미드 겔 (Integrated Separation Systems, 매사추셋츠주 01760 나틱)을 사용하였다. 1 내지 8 ㎍의 단백질을 각각의 겔 웰에 적용하였다. 전기영동을 실시하고 단백질을 Hybond-ECL (상표명) 니트로셀룰로오즈 막 (Amersham International) 상에 일렉트로블롯팅하였다. 막을 실온에서 1 시간 동안 TBST (25 mM Tris HCl, pH 7.4, 136 mM NaCl, 2.7 mM KCl, 0.1% Tween 20) 중의 10% 우유로 블록킹하였다. 각각의 토끼의 혈청을 10% 우유/TBST 중에서 1:500으로 희석시켰다. 1:50 내지 1:1000의 다른 희석도를 또한 사용하였다. 혈청을 막에 첨가하고, 1 시간 이사 플렛트포옴 진탕기 상에 두었다. 막을 블록킹 용액 또는 TBST로 완전히 세척하였다. 10% 우유/TBST 중의 2차 항원 (호스 래디쉬 퍼옥시다아제에 컨쥬게이트된 염소 항-쥐 IgG)을 1 시간 동안 플렛트포옴 진탕기 상에 둔 막에 적용하였다. 이어서 막을 과량의 TBST로 세척하였다. 단백질의 검색은 ECL (증강 화학형광) 검색 키트 (Amersham International)을 사용하여 실시하였다.A pre-cast SDS-polyacrylamide gel (Integrated Separation Systems, 01760 Natick, Mass.) With a 4-20% gradient was used. 1-8 μg of protein was applied to each gel well. Electrophoresis was performed and proteins were electroblotted onto Hybond-ECL ™ Nitrocellulose membrane (Amersham International). The membrane was blocked with 10% milk in TBST (25 mM Tris HCl, pH 7.4, 136 mM NaCl, 2.7 mM KCl, 0.1% Tween 20) for 1 hour at room temperature. The serum of each rabbit was diluted 1: 500 in 10% milk / TBST. Other dilutions of 1:50 to 1: 1000 were also used. Serum was added to the membrane and placed on a 1 hour moving plate shaker. The membrane was washed thoroughly with blocking solution or TBST. Secondary antigen (goat anti-rat IgG conjugated to horse radish peroxidase) in 10% milk / TBST was applied to the membrane placed on a plateform shaker for 1 hour. The membrane was then washed with excess TBST. Search of proteins was performed using an ECL (enhanced chemifluorescence) search kit (Amersham International).

웨스턴 블롯 분석을 실시하여 각각의 항-합성 펩티드 항체의 결합 특이성을 확인하였다. 모든 합성 다클론성 항체는 포토랍두스 배양 브로쓰로부터 유도된 단백질 분획으로부터 가공된 표적 펩티드 및 가공되지 않은 표적 펩티드 (사용가능한 경우)에 대해 특이성을 보였다. 다양한 항체가 바쿨로스바이러스 발현 구조를 사용하여 박테리아 또는 곤충 세포와 같은 이종 발현 시스템으로부터 유도된 가공되거나 가공되지 않은 재조합 단백질을 인지하는 것으로 보인다. 어느 경우에는 항 TcbAiii-syn 항체가 항-TcdAiii펩티드에 대해 약간의 교차 반응성을 보였다. 두번째 경우에는, 항-TcaC-syn 항체가 W-14 독소 복합체 분획 중의 확인되지 않은 190 kDa 펩티드를 인지하였다.Western blot analysis was performed to confirm the binding specificity of each anti-synthetic peptide antibody. All synthetic polyclonal antibodies showed specificity for the processed and unprocessed target peptides (if available) from protein fractions derived from photolabose culture broth. Various antibodies appear to recognize processed or unprocessed recombinant proteins derived from heterologous expression systems such as bacteria or insect cells using baculosvirus expression constructs. In some cases, the anti-TcbA iii- syn antibody showed some cross reactivity with the anti-TcdA iii peptide. In the second case, the anti-TcaC-syn antibody recognized an unidentified 190 kDa peptide in the W-14 toxin complex fraction.

〈실시예 22〉<Example 22>

포토랍두스 균주의 특성화Characterization of Photorapduus Strains

본원에 기재된 수집물이 포토랍두스 균주를 포함함을 확인하기 위해 본원의 균주를 박테리아 속 포토랍두스의 특성이고 엔테로박테리아네 및 제노랍두스 에스피피.와 다른 인지된 미생물학적 특징 면에서 평가였다 (Farmer, J.J. 1984. Bergey's Manual of Systemic Bacteriology, Vol 1. pp. 510-511. (ed. Kreig N. R. and Holt, J.G.). Williams & Wilkins, Baltimore.; Akhurst and Boemare, 1988, J. Gen. Microbiol. 134, 1835-1845; Forst and Nealson, 1996. Microbiol. Rev. 60, 21-43). 이들 특징적인 성질은 다음과 같다: 그람 염색 음성 로드, 생물 크기, 폭 0.3 - 2 ㎛ 및 길이 2 - 10 ㎛ [필라멘트 (15 - 50 ㎛)와 구형형상이 나타남], 영양 한천 배양기 상의 황색 내지 오렌지색/적색 군체 착색, 결정질 봉입체 존재, 촉매 존재, 질산염 환원 불가능, 생물발광 존재, 생장 배지로부터 염료 흡수 가능, 프로테아제 생성에 대해 양성, 37℃ 이하 온도에서 생장, 혐기성 조건 하에서 생존, 자력 생존 가능 (표 33). 검사 방법은 에스케리키아 콜리, 제노랍두스 및 포토랍두스 균주를 사용하여 체크하였다. 전체 결과는 장박테리아 과 및 포토랍두스 속에 속하는 모든 균주에 대해 일정하였다. DEP1, DEP2 및 DEP3이 American Type Curlture Colection 12301 Parklawn Drive, Rockville, MD 20852 USA (#29304, 29999 및 51583)으로부터 얻은 포토랍두스 균주를 참고함을 주목해야 한다.In order to confirm that the collections described herein include photolabduus strains, the strains of the present application were characterized in terms of photorapids in bacteria and evaluated in terms of recognized microbiological characteristics and other enterobacterial and genorabdus sp. (Farmer, JJ 1984. Bergey's Manual of Systemic Bacteriology, Vol 1. pp. 510-511. (Ed. Kreig NR and Holt, JG). Williams & Wilkins, Baltimore .; Akhurst and Boemare, 1988, J. Gen. Microbiol 134, 1835-1845; Forst and Nealson, 1996. Microbiol. Rev. 60, 21-43). These characteristic properties are as follows: Gram stained negative rod, bio size, 0.3-2 μm in width and 2-10 μm in length (with filaments (15-50 μm) and spherical shape), yellow to orange on nutrient agar incubators Red colony coloring, crystalline inclusions present, catalyst present, nitrate reduction not available, bioluminescence present, dye uptake from growth medium, positive for protease production, growth at temperatures below 37 ° C., survival under anaerobic conditions, magnetic viability (table 33). The test method was checked using Escherichia coli, Genorabdus and Photorabdus strains. The overall results were constant for all strains belonging to the genus Bacteria family and Photorapdus. It should be noted that DEP1, DEP2, and DEP3 refer to photolabose strains obtained from American Type Curlture Colection 12301 Parklawn Drive, Rockville, MD 20852 USA (# 29304, 29999 and 51583).

발광계를 사용하여 이들 포토랍두스 균주와 관련된 생물 발광을 확인하였다. 상대 발광 단위의 존재 또는 부재를 측정하기 위해 각각의 균주 (세포 및 배지)로부터 얻은 브로쓰를 액상 배양액 중에 접종한 3회 간격을 두고 측정하고 (24, 48, 72 시간) 배경 발광 (접종하지 않은 배지)에 비교하였다. 몇몇 제노랍두스 균주를 발광의 음성 대조군으로 검사하였다. 다양한 브로쓰로부터의 발광을 측정하기 전에, 시퍼 세포를 사용하여 길포드 시스템스 (Gilford Systems, Oberlin, 오하이오주) 스펙트로포토미터에서 흡광을 측정하여 (560 nM) 세포 밀도를 확인하였다. 이어서, 생성된 발광 단위를 세포의 밀도에 대해 표준화하였다. 브로쓰의 분취량을 96-웰 미세 적정기 플레이트 (100 ㎕ 각각)에 두고 Packard Lumicount (상표명) 발광계 (Packard Instrument Co., 코네티컷트주 메리덴)에서 판독하였다. 각 샘플에 대한 측정 기간은 0.1 내지 1.0초였다. 샘플을 판독하기 전에 10초 동안 발광기에서 교반하였다. 양성 검사는 5-배 배경 발광으로 결정하였다 (약 1-15 상대광 단위). 그 밖에, 군체 발광도를 포토그래픽 필름 오버레이와 암실에서 적응된 후의 육안으로 확인하였다. 각 균주의 그램스 착색 특성화를 그램스 착색 대조 슬라이드 (Fisher Scientific, 펜실베니아주 핏츠버그)와 함께 사용하는 시판중인 그램스 착색 키트 (BBL, 메릴랜드주 콕키스빌)로 확인하였다. 이어서, Zeiss 현미경 (Carl Zeiss, 독일) 100X 오일 침지 대물 렌즈 (10X 대안 및 2X 대물 확대)를 사용하여 현미경 평가를 실시하였다. 생물 크기, 세포 형태 및 봉입체에 대한 개별 균주의 현미경 검사 (세포 형태와 봉입체는 대수적 성장 후 관찰)는 습식 장착 슬라이드 (10X 대안, 2X 대물 및 40X 대물 확대) 및 파아지 대조 현미경법을 사용하여 ㎛로 실시하였다 (Akhurst, R. J. and Boemare, N.E. 1990. Entomopathogenic Nematodes in Biological Control (ed. Gaugler, R. and Kaya, H.). pp 75-90. CRC Press, Boca Raton, USA.; Baghdiguin S., Boyer-Giglio M. H., Thaler, J.O., Bonnot G., Boemare N. 1993. Biol. Cell 79, 177-185). 군체 착색은 라벨 지시에 따라 제조한 Bacto 영양 한천 배지 (Difco Lboratories, 미시간주 디트로이트) 상에 접종한 후 관찰하였다. 28℃에서 인큐베이션시키고 5일에 품목을 생산하였다. 효소 촉매의 존재를 검사하기 위해 검사 생물의 군체를 영양 한천 배지 플레이트로부터의 작은 플러그 상에 제거하고 유리 검사관의 바닥에 두었다. 가정용 과산화수소 용액 1 ㎖를 튜브 벽을 따라 부드럽게 첨가하였다. 양성 반응을 기포 (산소로 추정)가 나타나는 직후 또는 5초 내에 기록하였다. 접종하지 않은 영양 한천 배지 및 과산화수소 용액의 대조군을 또한 검사하였다. 니트레이트 환원을 검사하기 위해 각각의 배양액을 Bacto Nitrate 브로쓰 (Difco Laboratories, 미시간주 디트로이트) 10 ㎖에 접종하였다. 28℃에서 부드럽게 교반하며 24 시간 동안 인큐베이션시킨 후, 황산 시약 2 방울 및 알파-나프틸아민 시약 2 방울을 첨가하여 니트레이트 생성을 검사하였다 (Difco Manual, 10th edition, Difco Laboratories, 미시간주 디트로이트, 1984 참조). 뚜렷한 분홍색 또는 적색이 발생되는 것은 니트레이트로부터 니트릴이 형성된 것을 나타내는 한편 색 형성이 부족한 것은 균주가 니트레이트 환원 음성임을 나타낸다. 나중 경우에, 미분말 아연을 첨가하여 환원되지 않은 니트레이트의 존재를 추가 확인하고; 니트레이트의 형성 및 적색을 확인하였다. 각 균주가 생장 배지로부터 염료를 흡수하는 능력을 천연 적색 염료를 함유한 Bacto MacConkey 한천 배지; 브로모티몰 청색 염료를 함유한 Bacto Tergitol-7 한천 배지 및 eosin-Y 염료를 함유한 Bacto EMB 한천 배지 (Difco Laboratories (미시간주 디트로이트)로부터 배합한 한천 배지, 모두 라벨 지시에 따라 제조)로 검사하였다. 이들 배지 상에 접종한 후, 28℃에서 5 시간 동안 인큐베이션한 후 염료 흡수를 기록하였다. 이들 배지 상에서의 생장은 장 박테리아 과의 생물의 특징이다. 각 균주의 자동력은 라벨 지시에 따라 제조된 Bacto 자동력 검사 매질 (Difco Laboratories, 미시간주 디트로이트)의 용액을 사용하여 검사하였다. 각각의 균주로 버트-스태브 접종을 실시하고 접종 선으로부터 확산된 생장의 전파 영역으로 자동력을 거시적으로 판정하였다. 프로테아제의 생성은 라벨 지시에 따라 제조된 Bacto 젤라틴 (Difco Laboratories, 미시간주 디트로이트)를 사용하여 젤라틴의 가수분해를 관찰함으로서 검사하였다. 배양액을 접종하고 튜브 또는 플레이트를 28℃에서 5 일 동안 인큐베이션시켰다. 이어서, 젤라틴 가수분해를 실온, 즉 22℃ 미만에서 체크하였다. 여러가지 온도에서 생장을 평가하기 위해, 한천 배지 플레이트 [타리온수 내 Bacto-Agar (Difco, 미시간주 디트로이트) 2%를 갖는 2% 프로테아제 펩톤 #3]를 통상적인 접종원으로부터 스트릭킹하였다. 플레이트를 20, 28 및 37℃에서 3 일 이하로 인큐베이션시켰다. 인큐베이터 온도 수준을 전기 열전쌍으로 체크하고 확실한 온도 세팅을 위해 계측하였다. 포토랍두스 균주를 위한 산소 조건은 하기 방식으로 검사하였다. 유체 티오글리코발트 브로쓰 배지 (Difco, 미시간주 디트로이트)내로 버트-스태브 접종하였다. 튜브를 실온에서 1주 동안 인큐베이션하고 배양액을 생장 유형 정도에 대해 시험하였다. 인디케이터 레사주린은 배지 산절단 또는 호기성 구역이 존재함을 입증한다 (Difco Manual, 10th edition, Difco Laboratories, 미시간주 디트로이트). 검사한 포토랍두스 균주에 대해 얻어진 생장 구역 결과는 생장가능한 혐기성 미생물의 것과 일치하였다. 결과가 불확실한 경우, 유체 티오글리콜레이트 브로쓰 배지의 최종 한천 배지 농도를 0.75%로 올리고 생장 특성을 다시 체크하였다.Luminometers were used to identify bioluminescence associated with these photolapse strains. To determine the presence or absence of relative luminescent units, broths from each strain (cells and media) were measured at three intervals of inoculation in liquid culture (24, 48, 72 hours) and background luminescence (uninoculated) Medium). Several genoviruses strains were tested as negative controls of luminescence. Prior to measuring luminescence from various broths, cipher cells were used to determine (560 nM) cell density by measuring absorption on a spectrophotometer (Gilford Systems, Oberlin, Ohio). The resulting luminescent units were then normalized to the density of the cells. Aliquots of broth were placed in 96-well microtitrator plates (100 μl each) and read on a Packard Lumicount ™ luminometer (Packard Instrument Co., Meriden, CT). The measurement period for each sample was 0.1 to 1.0 second. The sample was stirred in the light emitter for 10 seconds before reading. Positive testing was determined by 5-fold background luminescence (about 1-15 relative light units). In addition, colony luminescence was confirmed visually after adaptation in the photographic film overlay and in the dark. Grams staining characterization of each strain was confirmed with a commercial Grams staining kit (BBL, Cockiesville, MD) used with Grams staining control slides (Fisher Scientific, Pittsburgh, Pennsylvania). Subsequently, microscopic evaluation was performed using a Zeiss microscope (Carl Zeiss, Germany) 100X oil immersion objective lens (10X alternative and 2X objective magnification). Microscopic examination of individual strains for organism size, cell morphology and inclusion bodies (cell morphology and inclusion bodies observed after logarithmic growth) was performed in μm using wet mounting slides (10X alternative, 2X objective and 40X objective magnification) and phage control microscopy. (Akhurst, RJ and Boemare, NE 1990. Entomopathogenic Nematodes in Biological Control (ed. Gaugler, R. and Kaya, H.). Pp 75-90.CRC Press, Boca Raton, USA .; Baghdiguin S., Boyer -Giglio MH, Thaler, JO, Bonnot G., Boemare N. 1993. Biol. Cell 79, 177-185). Colony staining was observed after inoculation on Bacto nutrient agar media (Difco Lboratories, Detroit, Michigan) prepared according to label instructions. Incubate at 28 ° C. and produce item on day 5. Colonies of test organisms were removed on small plugs from nutrient agar media plates and placed at the bottom of glass test tubes to test for the presence of enzyme catalysts. 1 ml of household hydrogen peroxide solution was added gently along the tube wall. Positive responses were recorded immediately after the appearance of bubbles (estimated by oxygen) or within 5 seconds. Controls of uninoculated nutrient agar medium and hydrogen peroxide solution were also examined. Each culture was inoculated in 10 ml of Bacto Nitrate broth (Difco Laboratories, Detroit, Michigan) to test for nitrate reduction. After incubation for 24 hours with gentle stirring at 28 ° C., 2 drops of sulfuric acid reagent and 2 drops of alpha-naphthylamine reagent were added to examine nitrate production (Difco Manual, 10th edition, Difco Laboratories, Detroit, MI, 1984). Reference). A pronounced pink or red color indicates the formation of nitrile from nitrate while the lack of color formation indicates that the strain is nitrate reduction negative. In later cases, fine powder zinc was added to further confirm the presence of unreduced nitrate; Formation of nitrate and redness were observed. Bacto MacConkey agar medium containing natural red dyes, with the ability of each strain to absorb dyes from the growth medium; Bacto Tergitol-7 agar medium containing bromothymol blue dye and Bacto EMB agar medium containing eosin-Y dye (agar medium formulated from Difco Laboratories, Detroit, Michigan, all prepared according to label instructions) . After inoculation on these media, dye uptake was recorded after incubation at 28 ° C. for 5 hours. Growth on these media is characteristic of organisms with enteric bacteria. The automated force of each strain was tested using a solution of Bacto automated force test medium (Difco Laboratories, Detroit, MI) prepared according to label instructions. Butt-stab inoculation was performed with each strain and macroscopic force was determined macroscopically as the propagation region of growth spread from the inoculation line. The production of proteases was examined by observing the hydrolysis of gelatin using Bacto gelatin (Difco Laboratories, Detroit, Mich.) Prepared according to label instructions. Cultures were inoculated and the tubes or plates were incubated at 28 ° C. for 5 days. The gelatin hydrolysis was then checked at room temperature, ie below 22 ° C. To assess growth at various temperatures, agar medium plates (2% protease peptone # 3 with 2% Bacto-Agar (Difco, Detroit, MI) in tarion water) were streaked from conventional inoculum. Plates were incubated at 20, 28 and 37 ° C. for up to 3 days. Incubator temperature levels were checked with an electrical thermocouple and measured for sure temperature setting. Oxygen conditions for the Photorabdus strain were examined in the following manner. Butt-stab inoculation into fluid thioglycobalt broth medium (Difco, Detroit, MI). Tubes were incubated for 1 week at room temperature and cultures tested for growth type extent. Indicator resazurin demonstrates the presence of medium cutting or aerobic zones (Difco Manual, 10th edition, Difco Laboratories, Detroit, Michigan). The growth zone results obtained for the tested photolabduus strains were consistent with those of the growable anaerobic microorganisms. In case of uncertainty, the final agar medium concentration of the fluid thioglycolate broth medium was raised to 0.75% and the growth properties were checked again.

* - A=그람 균주, B=결정 봉입체, C=생체 발광, D=세포 형태, E=운동성, F=질산염 환원, G=카탈라제의 존재, H=젤라틴 가수분해, I=염료 흡수, J=착색, K=EMB 아가 상에서의 성장, L=MacConkey 아가 상에서의 성장, M=Tergitol-7 아가 상에서의 성장, N=통성 혐기성균, O=20℃에서의 성장, P=28℃에서의 성장, Q=37℃에서의 성장, † - +/- = 특징의 양성 또는 음성, rd=간균, S=속 범위 내의 크기, W=백색, CR= 크림색, Y=황색, YT=담황갈색, T=갈색, PO=엷은 오렌지색, O=오렌지색, PR=엷은적색, R=적색.*-A = gram strain, B = crystal inclusion body, C = bioluminescence, D = cell morphology, E = motility, F = nitrate reduction, G = presentation of catalase, H = gelatin hydrolysis, I = dye absorption, J = Coloration, growth on K = EMB agar, growth on L = MacConkey agar, growth on M = Tergitol-7 agar, N = passive anaerobic bacteria, growth at O = 20 ° C., growth at P = 28 ° C., Q = growth at 37 ° C., † − + / − = positive or negative of the characteristic, rd = battery, S = size within genus range, W = white, CR = cream, Y = yellow, YT = pale yellow, T = Brown, PO = pale orange, O = orange, PR = pale red, R = red.

본 발명의 컬렉션에서의 포토랍두스 균주의 진화적 다양성을 각 균주의 게놈 DNA를 사용하여 PCR (폴리머라제 연쇄 반응) 매개 게놈 핑거프린팅의 분석에 의해 측정하였다. 이 기술은 다양한 세균 종의 게놈 전반에 존재하는 일군의 반복 DNA 서열을 기초로 한 것이다 (Versalovic, J., Schneider, M., DE Bruijn, F.J. and Lupski, J.R. 1994. Methods Mol. Cell. Biol., 5, 25-40.). 이들 서열 중 반복 유전자외 회문 서열 (REP), 장내 세균 반복 유전자내 공통 서열 (ERIC) 및 BOX 성분은 세균 게놈의 조직에 중요한 역할을 수행하는 것으로 생각된다. 게놈 조직은 선별에 의해 형상화되는 것으로 생각되고 밀접하게 관련된 세균 균주의 게놈 내의 이들 성분의 상이한 분산은 이들 균주의 식별에 사용될 수 있다 (예를 들면, Louws, F.J., Fulbright, D.W., Stephens, C.T. and DE Bruijn, F.J. 1994. Appl. Environ. Micro. 60, 2286-2295.). Rep-PCR은 반복서열 사이에 존재하는 크기가 상이한 DNA 단편을 증폭하기 위해 상기 반복 서열에 상보성인 올리고뉴클레오티드 프라이머를 이용한다. 생성물은 각 균주에 대한 DNA "핑거프린트"를 확립하기 위해 전기영동에 의해 분리한다.The evolutionary diversity of the Photorabdus strains in the collection of the present invention was determined by analysis of PCR (polymerase chain reaction) mediated genomic fingerprinting using the genomic DNA of each strain. This technique is based on a group of repeating DNA sequences that exist throughout the genome of various bacterial species (Versalovic, J., Schneider, M., DE Bruijn, FJ and Lupski, JR 1994. Methods Mol. Cell. Biol. , 5, 25-40.). Of these sequences, the repeat extragenic palindromic sequence (REP), the enteric bacterial repeat gene common sequence (ERIC), and the BOX component are believed to play an important role in the organization of the bacterial genome. Genomic tissue is believed to be shaped by selection and different dispersions of these components in the genome of closely related bacterial strains can be used for identification of these strains (eg Louws, FJ, Fulbright, DW, Stephens, CT and DE Bruijn, FJ 1994. Appl. Environ. Micro. 60, 2286-2295.). Rep-PCR uses oligonucleotide primers complementary to the repeat sequence to amplify DNA fragments of different sizes that exist between the repeat sequences. The product is separated by electrophoresis to establish a DNA "fingerprint" for each strain.

본 발명의 균주로부터 게놈 DNA를 단리하기 위해서 세포 펠렛을 최종 용량 10 ml이 되도록 TE 완충액 (10 mM Tris-HCl, 1 mM EDTA, pH8.0) 중에 재현탁시키고 5 M NaCl 12 ml를 첨가하였다. 이 혼합물을 15,000 x g에서 20분 동안 원심분리하였다. 생성 펠렛을 TE 5.7 ml 및 10% SDS 300 μl 중에 재현탁시키고 20 mg/ml 프로테이나제 K 60 μl (Gibco BRL 제품, Grand Island, NY)을 첨가하였다. 이 혼합물을 37℃에서 1시간 동안 배양한 후 리소자임 약 10 mg을 첨가하고 혼합물을 추가로 45분 동안 배양하였다. 5M NaCl 1 ml 및 CTAB/NaCl 800 μl 용액 (10% w/v CTAB, 0.7 M NaCl)을 첨가하고 혼합물을 65℃에서 10분 동안 배양하고, 부드럽게 진탕시킨 후 배양하고 추가로 20분 동안 진탕시켜 세포 물질의 클리어링을 도왔다. 동량의 클로로포름/이소아밀 알콜 용액 (24:1, v/v)을 첨가하고 부드럽게 혼합한 후 원심분리하였다. 이어서, 동용량의 페놀/클로로포름/이소아밀 알콜 (50:49:1)을 사용하여 2회 추출하였다. 게놈 DNA를 이소프로판올 0.6 용량을 사용하여 침전시켰다. 침전된 DAN를 유리 막대기로 수거하여 70% 에탄올로 2회 세척하고 건조시켜 STE 2 ml (10 mM Tris-HCl pH8.0, 10 mM NaCl, 1 mM EDTA) 중에 용해시켰다. 이어서, 260 nm에서의 광학 밀도에 의해 DNA를 정량하였다. 포토랍두스 게놈 DNA의 rep-PCR 분석을 실시하기 위해서 다음과 간은 프라이머를 사용하였다: REP1R-I; 5'-IIIICGICGICATCIGGC-3' 및 REP2-I; 5'-ICGICTTATCIGGCCTAC-3'. 다음과 같은 25 μl 반응물을 사용하여 PCR을 실시하였다: 7.75 μl H2O, 2.5 μl 10X LA 완충액 (PanVera Corp., Madison, WI), 16 μl dNTP 믹스 (각각 2.5 mM), 각각의 프라이머 1 μl (50 pM/μl), DMSO μl, 게놈 DNA 1.5 μl (농도 0.075-0.480 μg/μl) 및 0.25 μl TaKaRa EX Taq (PanVera Corp., Madison, WI). Perkin Elmer DNA 열 순환기 (Norwalk, CT) 중에서 다음과 같은 조건을 사용하여 PCR 증폭을 실시하였다: 95℃/7분, 이어서 94℃/1분, 44℃/1분, 65℃/8분의 싸이클의 35회 반복, 이어서 65℃에서 15분. 순환 후에 반응물 25 μl를 6X 겔 로딩 완충액 (물 중의 0.25% 브로모페놀 블루, 40% 수크로스) 5 μl에 첨가하였다. 이어서, 15x20 cm 1% 아가로스 겔을 각각의 반응액 8 μl를 사용하여 TBE 완충액 (0.09 M Tris-보레이트, 0.002 M EDTA) 중에서 전개시켰다. 겔을 45V에서 약 16시간 동안 전개시켰다. 이어서, 겔을 에티듐 브로마이드 20 μg/ml 중에서 1시간 동안 염색시키고 TBE 완충액 중에서 약 3시간 동안 탈염색시켰다. 겔의 폴라로이드 사진을 UV 조명 하에 인화하였다.To isolate genomic DNA from strains of the invention, the cell pellet was resuspended in TE buffer (10 mM Tris-HCl, 1 mM EDTA, pH8.0) to a final dose of 10 ml and 12 ml of 5 M NaCl was added. This mixture was centrifuged at 15,000 xg for 20 minutes. The resulting pellet was resuspended in 5.7 ml TE and 300 μl 10% SDS and 60 μl 20 mg / ml proteinase K (Gibco BRL, Grand Island, NY) was added. The mixture was incubated at 37 ° C. for 1 hour before about 10 mg of lysozyme was added and the mixture was incubated for an additional 45 minutes. 1 ml of 5M NaCl and 800 μl of CTAB / NaCl (10% w / v CTAB, 0.7 M NaCl) were added and the mixture was incubated at 65 ° C. for 10 minutes, gently shaken, incubated and shaken for an additional 20 minutes. Helped clear the cell material. Equal amounts of chloroform / isoamyl alcohol solution (24: 1, v / v) were added and mixed gently before centrifugation. Then extracted twice using the same volume of phenol / chloroform / isoamyl alcohol (50: 49: 1). Genomic DNA was precipitated using 0.6 doses of isopropanol. The precipitated DAN was collected with glass sticks, washed twice with 70% ethanol, dried and dissolved in 2 ml of STE (10 mM Tris-HCl pH8.0, 10 mM NaCl, 1 mM EDTA). The DNA was then quantified by optical density at 260 nm. The following livers used primers to perform rep-PCR analysis of the Photoractus genomic DNA: REP1R-I; 5'-IIIICGICGICATCIGGC-3 'and REP2-I; 5'-ICGICTTATCIGGCCTAC-3 '. PCR was performed using the following 25 μl reactions: 7.75 μl H 2 O, 2.5 μl 10 × LA buffer (PanVera Corp., Madison, Wis.), 16 μl dNTP mix (2.5 mM each), 1 μl of each primer (50 pM / μl), DMSO μl, 1.5 μl genomic DNA (concentration 0.075-0.480 μg / μl) and 0.25 μl TaKaRa EX Taq (PanVera Corp., Madison, Wis.). PCR amplification was carried out in a Perkin Elmer DNA thermal cycler (Norwalk, CT) using the following conditions: 95 ° C./7 min, followed by 94 ° C./1 min, 44 ° C./1 min, 65 ° C./8 min. Of 35 repetitions followed by 15 minutes at 65 ° C. After cycling 25 μl of the reaction was added to 5 μl of 6 × gel loading buffer (0.25% bromophenol blue, 40% sucrose). A 15 × 20 cm 1% agarose gel was then developed in TBE buffer (0.09 M Tris-borate, 0.002 M EDTA) using 8 μl of each reaction. The gel was run at 45V for about 16 hours. The gel was then stained for 1 hour in 20 μg / ml ethidium bromide and destained for about 3 hours in TBE buffer. Polaroid pictures of the gel were printed under UV light.

각 염색에 특이적인 크기에서의 밴드의 존재 여부를 사진으로부터 기록하고 수치 분류 소프트웨어 프로그램인 NTSYS-pc (Exeter Software, Setauket, NY)에 유사성 매트릭스로서 입력하였다. 동시에 분석되는 이. 콜라이 균주 HB101 및 잔토모나스 오리재 피브이. 오리재 (Xanthomonas oryzae pv. oryzae)의 대조군은 출판된 문헌에 따른 "핑거프린트"를 생성시켰다 (Versalovic, J., Koeuth, T. and Lupski, J.R. 1991. Nucleic Acids Res. 19, 6823-6831; Vera Cruz, C.M., Halda-Alija, L., Louws, F., Skinner, D.Z., George, M.L., Nelson, R.J., DE Bruijn, F.J., Rice, C. and Leach, J.E. 1995. Int. Rice Res. Notes, 20, 23-24.; Vera Cruz, C.M., Ardales, E.Y., Skinner, D.Z., Talag, J., Nelson, R.J., Louws, F.J., Leung, H., Mew, T.W. and Leach, J.E. 1996. Phytopathology). 이어서, NTSYS-pc 내의 일련의 프로그램; 매트릭스의 유사성 계수 (Jaccard 계수를 사용)를 생성하기 위한 SIMQUAL (정량 데이터에 대한 유사성) 및 관련 균주를 한데 모으고 페노그램 (phenogram) (도 5)으로 표현될 수 있는 SAHN (연속적인, 응집성의, 헤라키칼 (Heirarchical) 및 네스티드 (Nested)) 클러스터링 [UPGMA (산술평균을 사용하는 비계량 페어-그룹 (Unweighted Pair-Group) 방법을 사용) 방법을 사용하여 포토랍두스 균주로부터의 데이터를 분석하였다. COPH (코페네틱 (cophenetic) 값) 및 MXCOMP (매트릭스 비교) 프로그램을 사용하여 코페네틱값 매트릭스를 생성시켜 이것과 클러스터링의 기초가 되는 본래의 매트릭스 사이의 관계를 비교하였다. 클러스터 분석에 적합한 양호함의 척도인 (r=0.8-0.9가 매우 양호하게 적합함을 나타냄) 생성되는 정상화 만텔 (Mantel) 통계치 (r)을 생성시켰다. 본 발명의 경우에 r은 0.919이었다. 따라서, 본 발명의 컬렉션은 포토랍두스 속의 대표적인 용이하게 식별가능한 균주의 다양한 군으로 이루어진 것이다.The presence or absence of a band at a size specific to each stain was recorded from the photographs and entered as a similarity matrix into the numerical classification software program NTSYS-pc (Exeter Software, Setauket, NY). Teeth analyzed at the same time. E. coli strain HB101 and Xanthomonas duck fib. A control of duck (Xanthomonas oryzae pv. Oryzae) produced a "fingerprint" according to published literature (Versalovic, J., Koeuth, T. and Lupski, JR 1991. Nucleic Acids Res. 19, 6823-6831; Vera Cruz, CM, Halda-Alija, L., Louws, F., Skinner, DZ, George, ML, Nelson, RJ, DE Bruijn, FJ, Rice, C. and Leach, JE 1995. Int.Rice Res.Notes , 20, 23-24 .; Vera Cruz, CM, Ardales, EY, Skinner, DZ, Talag, J., Nelson, RJ, Louws, FJ, Leung, H., Mew, TW and Leach, JE 1996. Phytopathology) . Then a series of programs in NTSYS-pc; SIMQUAL (similarity to quantitative data) and related strains to generate similarity coefficients (using Jaccard coefficients) of the matrix and SAHN (continuous, cohesive, which can be expressed as a phenogram (Figure 5)) Data from photolapidus strains were analyzed using the Heraical and Nested clustering method (UPGMA (using Unweighted Pair-Group method using arithmetic mean)). COPH (cophenetic values) and MXCOMP (matrix comparison) programs were used to generate cophenetic matrixes and to compare the relationship between this and the original matrix on which clustering was based. The resulting normalized Mantel statistic (r) was generated, which is a measure of goodness suitable for cluster analysis (r = 0.8-0.9 indicates very good suitability). R is 0.919 for the present invention. Thus, the collection of the present invention consists of a diverse group of representative easily identifiable strains of the genus Photorapdus.

〈실시예 23〉<Example 23>

다양한 포토랍두스 균주에 의해 생산되는 독소(들)의 살충 효용Insecticidal Utility of Toxin (s) Produced by Various Photoractus Strains

카풋으로 덮여진 델롱 목을 가진 500 ml 트리배플드 플라스크중의, 2% 프로테오스 펩톤 #3 (PP3, 미시간주 디트로이트 소재의 디프코 래버러토리즈 (Difco Laboratories) 제조) 액체 배지 175 ml에 일차 변종 서브클론을 접종하여, 다양한 포토랍두스 균주의 초기 종자 배양물을 제조하였다. 각 종자 배양을 위한 접종물은 오일이 덮여진 아가 사면 배양물 또는 플레이트 배양물로부터 유래되었다. 접종 후, 상기 플라스크를 회전식 진탕기 상에서, 150 rpm에서 16 시간 동안 28℃에서 배양하였다. 이어서 상기 종자 배양물은 각 균주의 정해진 발효를 위한 균일한 접종원으로서 사용되었다. 또한, 로그 후상 (post-log) 종자 배양물을 멸균의 미네랄 오일로 덮고, 멸균의 자석 교반 막대를 장래의 재현탁을 위하여 첨가하며, 배양물을 암실, 실온에서 보관함으로써, 접종물을 독소 생산 상태로 장기간 보존하였다. 활발하게 성장하는 종자 배양물 1% (예를 들어, 신선 배양물 175 ml 당 1.75 ml)를 2% PP3 신선 배지에 첨가함으로써 생산 브로쓰를 접종하였다. 브로쓰는, 실리콘 포움 마개로 밀폐된 500 ml 트리배플드 플라스크 (상기 참조) 또는 2800 ml 배플드 요철면 바닥 플라스크 (500 ml 용량)에서 생산하였다. 생산 플라스크를 상기 조건 하에서 24 내지 72시간 동안 배양하였다. 배양 후, 브로쓰를 멸균의 1 L 폴리에틸렌 병 내로 분배시켜 10℃에서 1 시간 동안 2600 ×g에서 회전시킴으로써, 세포 및 파쇄물 펠렛으로부터 분리시켰다. 액체 브로쓰는 그 후 와트만(Whatman) GF/D (2.7 μm 보유) 및 GF/B (1.0 μm 보유) 유리 여과기를 통하여 진공 여과시켜 파쇄물을 제거하였다. 0.5 μm 개방 도관 여과기를 사용, 접선 유출 극소 여과 장치 (폴 필트론 (Pall Filtron), 매사추세츠주 노쓰보로)로 브로쓰를 보다 더 정화하였다. 필요시, 브로쓰를 냉각시켜(4℃까지) 2600 × g에서 여러 시간 동안 원심분리시킴으로써 추가로 정화시킬 수 있다. 상기 과정 후, 0.2 μm 니트로셀룰로스 막 여과기를 사용하여 브로쓰를 여과 살균시켰다. 무균 브로쓰는 그 후, 생물학적 분석, 생화학적 분석용으로 직접 사용되었거나 분자량 10000 컷오프 M12 한외여과 장치 (Amicon, 매사추세츠주 베벌리) 또는 분자량 10000의 구멍 크기를 갖는 원심 분리 농축기 (Millipore, 매사추세츠주 베드포드)를 사용하여 농축 (10배까지)시켰다. 원심 분리 농축기의 경우, 브로쓰를 2000 × g에서 약 2시간 동안 원심분리시켰다. 분자량 10000 투과액을, 상응하는 잔류물에 첨가하여 분자량 10000 초과 성분의 원하는 농축액을 수득하였다. 모래를 채운 히트 블록 (heat block)에서 10분간, 100℃에서 샘플을 가열함으로써, 처리되는 브로쓰 샘플을 가열 불활성화시켰다.In 175 ml of 2% Proteose Peptone # 3 (PP3, Difco Laboratories, Detroit, MI) liquid medium in a 500 ml Tribaffle flask with Kaput Primary strain subclones were inoculated to prepare initial seed cultures of the various photolapse strains. Inoculum for each seed culture was derived from an oil covered agar slope culture or plate culture. After inoculation, the flasks were incubated at 28 ° C. for 16 hours at 150 rpm on a rotary shaker. The seed culture was then used as a uniform inoculum for a given fermentation of each strain. The post-log seed cultures are also covered with sterile mineral oil, a sterile magnetic stir bar is added for future resuspension, and the culture is stored in the dark, at room temperature, thereby inoculating the inoculum toxin production. The state was stored for a long time. Production broth was inoculated by adding 1% of actively growing seed culture (eg, 1.75 ml per 175 ml of fresh culture) to 2% PP3 fresh medium. The broth was produced in a 500 ml tribaffle flask (see above) or a 2800 ml baffle uneven bottom flask (500 ml capacity) sealed with a silicone foam stopper. Production flasks were incubated for 24 to 72 hours under these conditions. After incubation, the broth was dispensed into cells and lysate pellets by dispensing into sterile 1 L polyethylene bottles and spinning at 2600 × g for 1 hour at 10 ° C. The liquid broth was then vacuum filtered through Whatman GF / D (2.7 μm retention) and GF / B (1.0 μm retention) glass filters to remove debris. The broth was further purified using a 0.5 μm open conduit filter with a tangential outflow microfiltration device (Pall Filtron, Northboro, Mass.). If necessary, the broth can be further clarified by cooling (up to 4 ° C.) and centrifuging at 2600 × g for several hours. After this procedure, the broth was filtered and sterilized using a 0.2 μm nitrocellulose membrane filter. Sterile broth was then used either directly for biological analysis, biochemical analysis or with a 10000 cutoff M12 ultrafiltration device (Amicon, Beverly, Mass.) Or a centrifugal concentrator (Millipore, Bedford, Mass.) With a pore size of 10000. Concentrated (up to 10 times). For centrifugal concentrators, the broth was centrifuged at 2000 × g for about 2 hours. A molecular weight 10000 permeate was added to the corresponding residue to give the desired concentrate of components with molecular weight greater than 10000. The treated broth sample was heat inactivated by heating the sample at 100 ° C. for 10 minutes in a sand filled heat block.

서로 다른 포토랍두스 균주로부터의 브로쓰(들) 및 독소 복합체(들)은 곤충 집단을 감소시키는 데 유용하며, 기술된 활성물질을, 곤충 불활성화에 효과적인 양만큼 곤충 서식지에 사용하는 것으로 이루어지는 곤충 집단 억제 방법에 사용되었다. 상기와 같이 발효시킨 포토랍두스 균주의 선별군의 브로쓰로부터 관찰된 살충 활성의 범위의 증거는 표 36에 나타나 있다. 브로쓰 농도를 증가시키거나 다른 발효 방법을 사용함으로써 상기 균주에서 부가적인 살충 활성의 검출이 가능하다. 단백질과 관계된 활성과 일관되게, 시험된 모든 균주들의 살충 활성은 열에 불안정하였다.Broth (s) and toxin complex (s) from different photolabose strains are useful for reducing insect populations, and insects consisting of using the described active substances in insect habitats in an amount effective to inactivate insects. It was used in the population suppression method. Evidence of the range of pesticidal activity observed from broths of the select group of photolabduus strains fermented as above is shown in Table 36. Increasing the broth concentration or using other fermentation methods allows detection of additional pesticidal activity in the strain. Consistent with the activity associated with the protein, the pesticidal activity of all strains tested was heat labile.

다양한 포토랍두스 균주로부터의 배양 브로쓰(들)은 곤충 수에 대하여 차별적인 살충 활성 (치사율 및(또는) 성장 저해율, 성체 출현의 감소)을 나타낸다. 보다 구체적으로, 활성은 딱정벌레 (Coleoptera) 곤충 목의 일원인 옥수수 뿌리벌레 유충에 대하여 나타난다. 딱정벌레 목의 다른 일원으로는 목화 바구미, 노래기, 방아벌레, 화분 딱정벌레, 뜀벼룩 갑충, 종자 갑충 및 콜로라도 감자 딱정벌레가 있다. 브로쓰 및 정제된 독소 복합체(들)은 또한 나비목의 일원인 회색담배나방, 박각시나방 및 유럽 옥수수 천공충에 대해서도 활성을 갖는다. 상기 목의 다른 전형적인 일원으로는 사탕무 행렬구더기, 양배추 자벌레, 블랙 야도충, 옥수수 귀벌레, 사과 나방, 반대좀, 화랑곡나방, 잎말이나방, 배추 벌레, 목화다래나방, 도롱이벌레, 이스턴 텐트 나방, 잔디 포충나방 및 폴 행렬구더기가 있다. 활성은 딕티오프테라 (또는 블라토데아) 목의 일원인 독일 바퀴벌레에 대해서도 관찰된다. 이 목의 다른 일원은 동양 바퀴벌레 및 어메리칸 바퀴벌레가 있다.Culture broth (s) from various photolabose strains exhibit differential pesticidal activity (decrease in mortality and / or growth inhibition, reduction in adult appearance) with respect to insect numbers. More specifically, activity is shown against corn rootworm larvae that are members of the Coleoptera insect throat. Other members of the beetle neck include cotton weevils, millipedes, worms, pollen beetles, jog beetles, seed beetles, and Colorado potato beetles. The broth and purified toxin complex (es) also have activity against gray tobacco moth, horn moth and European corn borer, which are members of the Lepidoptera. Other typical members of the neck include beetroot maggots, cabbage bugs, black beetles, corn ear beetles, apple moths, antagonists, gallery moths, leaf moths, cabbage beetles, cotton beetle moths, salamanders, eastern tent moths and grass. There are insect moths and pole matrix maggots. Activity is also observed for German cockroaches, a member of the Dictoptera (or Blatodea) neck. Other members of this neck have oriental cockroaches and American cockroaches.

옥수수 뿌리벌레 유충에 대한 활성은 하기와 같이 시험되었다. 포토랍두스 배양 브로쓰(들)(0 내지 15배 농축, 여과 살균), 2% 프로테오스 펩톤 #3, 정제 독소 복합체(들)(0.23 mg/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액을 인공 먹이의 표면 (약 1.5 cm2)에 40μl씩 직접 도포하였다[Rose, R. I. 및 McCabe, J. M. (1973). J. Econ. Entomol. 66, (389-400) 참조]. 독소 복합체를 pH 7.0의 10 mM 인산 나트륨 완충액에 희석시켰다. 먹이 플레이트를 무균 플로우 후드에서 공기 건조시키고, 표면 살균된 알로부터 부화시킨 단일, 신생 디아브로티카 운데심푼크타타 호와르디 (Diabrotica undecimpunctata howardi) (써든 옥수수 뿌리벌레, SCR)로 웰을 만연시켰다. 상기 플레이트를 봉인하여 습윤 성장 챔버에 두고 적당한 기간 (3 내지 5일)동안 27℃에서 유지시켰다. 그 후 치사율 및 유충 무게 측정치를 기록하였다. 일반적으로, 모든 연구에서 처리당 16마리의 곤충이 사용되었다. 대조군 치사율은 일반적으로 5% 미만이었다.Activity against corn rootworm larvae was tested as follows. Photolabose culture broth (s) (0-15 fold concentration, filtration sterilization), 2% proteose peptone # 3, purified toxin complex (s) (0.23 mg / ml) or 10 mM sodium phosphate buffer at pH 7.0 Was applied directly to the surface of the artificial feed (approximately 1.5 cm 2 ) by 40 μl [Rose, RI and McCabe, JM (1973). J. Econ. Entomol. 66, (389-400). Toxin complexes were diluted in 10 mM sodium phosphate buffer at pH 7.0. The food plate was air dried in a sterile flow hood and wells were infested with a single, newborn Diabrotica undecimpunctata howardi (Sudden Corn Root, SCR) hatched from surface sterilized eggs. The plates were sealed and placed in a wet growth chamber and kept at 27 ° C. for a suitable period (3 to 5 days). Mortality and larval weight measurements were then recorded. In general, 16 insects were used per treatment in all studies. Control mortality was generally less than 5%.

나비목 유충에 대한 활성은 하기와 같이 시험하였다. 농축(10배) 포토랍두스 배양 브로쓰(들), 대조군 배지 (2% 프로테오스 펩톤 #3), 정제 독소 복합물(들)(0.23 mg/ml) 또는 pH 7.0의 10 mM 인산 나트륨 완충액을, 표준 인공 나비목 먹이(스톤빌 옐로우 먹이, 약 1.5 cm2) 표면에 40 μl씩 직접 도포시켰다. 먹이 플레이트를 무균 플로우 후드내에서 공기 건조시켰고, 각 웰을 신생 유충 1마리로 만연시켰다. 유럽 옥수수 천공충 (Ostrinia nubilalis) 및 박각시나방 (Manduca sexta) 알을 구입하여 부화시켰고, 회색담배나방 (Heliothis virescens) 유충은 내부적으로 공급하였다. 유충으로 만연시킨 후, 먹이 플레이트를 봉인하여 습윤 성장 챔버내에 두고 적절한 기간 동안 27℃ 암실에서 유지시켰다. 치사율 및 중량 측정은 5일째에 실시하였다. 일반적으로, 모든 연구에서 처리당 16마리의 곤충이 사용되었다. 대조군 배지의 대조군 치사율은 일반적으로 0 내지 12.5%였고, 인산 완충액의 대조군 치사율은 10% 미만이었다.Activity against Lepidoptera larvae was tested as follows. Concentrated (10-fold) photolabose culture broth (s), control medium (2% proteose peptone # 3), purified toxin complex (s) (0.23 mg / ml) or 10 mM sodium phosphate buffer at pH 7.0 40 μl was applied directly to the surface of standard artificial Lepidoptera food (Stoneville yellow food, approximately 1.5 cm 2 ). The food plate was air dried in a sterile flow hood and each well was ramped up with one newborn larva. European corn borer (Ostrinia nubilalis) and Manuca sexta eggs were purchased and hatched, and gray tobacco moth (Heliothis virescens) larvae were supplied internally. After spreading with the larvae, the food plate was sealed and placed in the wet growth chamber and kept in the dark at 27 ° C. for an appropriate period. Lethality and weight measurements were performed on day 5. In general, 16 insects were used per treatment in all studies. Control mortality of control medium was generally 0-12.5% and control mortality of phosphate buffer was less than 10%.

바퀴벌레에 대한 활성은 하기와 같이 시험하였다. 농축(10배) 포토랍두스 배양 브로쓰(들), 대조군 배지 (2% 프로테오스 펩톤 #3)을, 표준 인공 나비목 먹이(스톤빌 옐로우 먹이, 약 1.5 cm2) 표면에 40 μl씩 직접 도포시켰다. 먹이 플레이트를 무균 플로우 후드내에서 공기 건조시켰고, 각 웰을 CO2마취시킨 제1 인스타 독일 바퀴벌레 (Blatella Germanica)로 만연시켰다. 유충으로 만연시킨 후, 먹이 플레이트를 봉인하여 습윤 성장 챔버내에 두고 적절한 기간 동안 27℃ 암실에서 유지시켰다. 치사율 및 중량 측정은 5일째에 실시하였다. 일반적으로, 모든 연구에서 처리당 16마리의 곤충이 사용되었다. 대조군 치사율은 10% 미만이었다.The activity against cockroaches was tested as follows. Concentrated (10-fold) photolabose culture broth (s), control medium (2% proteose peptone # 3) were added directly to the surface of standard artificial lepidoptera feed (Stoneville yellow feed, approximately 1.5 cm 2 ) by 40 μl. Applied. The food plate was air dried in a sterile flow hood and each well was ramped up with a first 2 German cockroach (Blatella Germanica). After spreading with the larvae, the food plate was sealed and placed in the wet growth chamber and kept in the dark at 27 ° C. for an appropriate period. Lethality and weight measurements were performed on day 5. In general, 16 insects were used per treatment in all studies. Control mortality was less than 10%.

상이한 포토랍두스 균주로 부터 브로쓰의 살충 스펙트럼 관찰Insecticidal Spectrum of Broth from Different Photoractus Strains 포토랍두스 균주Photolapux strain 감수성*의 곤충종Susceptibility * Insect Species 피.제알란디카피. 헤피알루스HB-ArgHB 오스웨고HB 레위스톤K-122HMGD인디커스GDPWH-5메기디스HF-85에이. 카우스MP1MP2MP3MP4MP5GL98GL101GL138GL155GL217GL257DEP1DEP2DEP3P. Zealandicopy. Hapialus HB-ArgHB Oswego HB Leviston K-122HMGD Indicus GDPWH-5 Megidis HF-85A. Mouse MP1MP2MP3MP4MP5GL98GL101GL138GL155GL217GL257DEP1DEP2DEP3 1**, 2, 41, 2, 41, 2, 41, 2, 41, 2, 41, 41, 41, 2, 42, 41, 2, 41, 2, 41, 2, 41, 41, 2, 41, 2, 441, 441, 41, 4, 51, 2, 41, 41, 2, 41, 41, 41, 2, 3, 441 ** , 2, 41, 2, 41, 2, 41, 2, 41, 2, 41, 41, 41, 2, 42, 41, 2, 41, 2, 41, 2, 41, 41, 2, 41, 2, 441, 441, 41, 4, 51, 2, 41, 41, 2, 41, 41, 41, 2, 3, 44 *= 대조군에 대한 25% 운동성 및(또는) 생장 억제율**= 1; 회색담배나방, 2; 박각시나방, 3; 유럽 옥수수 천공충, 4; 써던 옥수수 뿌리벌레, 5; 독일 바퀴벌레.* = 25% motility and / or growth inhibition rate relative to the control group ** = 1; Gray tobacco moth, 2; Beetle moth, 3; European Corn Borer, 4; Southern Corn Roots, 5; German cockroach.

〈실시예 24〉<Example 24>

W-14 유전자 프로브를 사용하는 비-W-14 포토랍두스의 서던(Southern) 분석Southern analysis of non-W-14 photoladus using W-14 gene probe

포토랍두스 균주를 2 %의 프로에오제 펩톤 #3 아가 (Difco Laboratories, 미시간주 디트로이트) 상에서 성장시키고, 살충 독소력을 통과후 반복 생분석으로 유지시켰다. 50 ㎖ 세이커 배양물을 2 % 프로테오제 펩톤 #3 배지이 있는 175 ㎖ 배플 플라스크에서 생성시키고, 28 ℃ 및 150 rpm에서 약 24시간 동안 성장시켰다. 이 배양물 15 ㎖를 원심분리하고 (700 x g, 30분), DNA 단리를 위해 (빙수에서 서서히) 해동될 때까지 -20 ℃에서 배지에서 동결시켰다. 해동된 W-14 배양물을 원심분리하고 (900 x g, 15분, 4 ℃), 부유하는 오렌지색 무코폴리사카라이드 물질을 제거하였다. 잔류하는 세포 물질을 원심분리하여 (25,000 x g, 4 ℃), 세균 세포를 펠렛시키고, 배지를 제거하고 따라버렸다.Photolabduus strains were grown on 2% proeoze peptone # 3 agar (Difco Laboratories, Detroit, Michigan) and pesticidal toxins were maintained after repeated bioassay. 50 ml shaker cultures were generated in a 175 ml baffle flask with 2% protease peptone # 3 medium and grown for about 24 hours at 28 ° C. and 150 rpm. 15 ml of this culture were centrifuged (700 × g, 30 min) and frozen in medium at −20 ° C. until thawed (slow in ice water) for DNA isolation. Thawed W-14 cultures were centrifuged (900 × g, 15 min, 4 ° C.) and the floating orange mucopolysaccharide material was removed. Residual cellular material was centrifuged (25,000 × g, 4 ° C.) to pellet bacterial cells, remove media and discard.

전체 DNA를 오수벨 (Ausubel, 1994) 등의 섹션 2.4.1에 기재된 CTAB 방법을 채택하여 단리시켰다. 변형물은 높은 염 쇽크를 포함하였고, 모든 용적은 "미니프렙 (miniprep)" 추천 용적의 10배로 증가하였다. 모든 원심분리는 특별한 지시가 없다면 4 ℃에서 실시하였다. 펠렛된 세균 세포를 TE 완충액 (10 mM 트리스-HCl, 1 mM EDTA, pH 8)에 최종 용적 10 ㎖로 재현탁시키고, 이어서 12 ㎖ 5 M NaCl를 첨가하였다. 이 혼합물을 15,000 x g에서 20분 동안 원심분리하였다. 펠렛을 5.7 ㎖ TE에 재현탁시키고, 300 ㎕ 10 % SDS 및 60 ㎕ 20 mg/㎖의 프로테이나제 K (멸균 증류수), Gibco BRL Products, Grand Island, NY)를 현탁액에 첨가하였다. 혼합물을 37 ℃에서 1시간 동안 배양한 다음, 약 10 mg 리소자임 (Worthington Biochemical Corp., Freehold, NJ)를 첨가하였다. 45분 동안 더 배양한 후, 5 M NaCl 1 ㎖ 및 CTAB/NaCl 용액 (10 % w/v CTAB, 0.7 M NaCl) 800 ㎕를 첨가하였다. 이 침전물을 65 ℃에서 10분 동안 배양하고, 이어서 완만하게 교반시키고 더 배양시키고, 기포형 물질이 맑아지도록 약 20분 동안 교반시켰다. 클로로포름/이소아밀 알콜 용액 (24:1 v/v)의 등가 용적을 첨가하고, 매우 완만하게 혼합하고, 12,000 x g에서 15분 동안 원심분리하여 상들을 분리하였다. 상층 (수성 상)을 널은 보어 피펫으로 완만하게 제거하고, PCI (페놀/클로로포름.이소아밀 알콜; 50:49:1, v/v/v; 1 M 트리스-HCl (pH 8.0, Intermountain Scientific Corporateion, Kayville, UT)으로 평형시킴)의 등가 용적으로 상기와 같이 2회 추출하였다. 0.6 용적의 이소프로판올로 침전시킨 DNA를 유리막대로 완만하게 제거하고, 70 % 에탄올로 2회 세척하고, 2 ㎖ STE (10 mM 트리스-HCl, 10 mM NaCl, 1 mM EDTA, pH 8) 중에 용해시켰다. 이 침전물은 260 nm에서 광학밀도로 측정할 때 2.5 mg/㎖를 함유하였다.Total DNA was isolated using the CTAB method described in Section 2.4.1 of Ausubel, 1994 et al. The modifications included high salt shanks and all volumes increased to 10 times the "miniprep" recommended volume. All centrifugation was carried out at 4 ° C unless otherwise indicated. The pelleted bacterial cells were resuspended in TE buffer (10 mM Tris-HCl, 1 mM EDTA, pH 8) to a final volume of 10 ml, followed by the addition of 12 ml 5 M NaCl. This mixture was centrifuged at 15,000 x g for 20 minutes. The pellet was resuspended in 5.7 ml TE and 300 μl 10% SDS and 60 μl 20 mg / ml proteinase K (sterile distilled water), Gibco BRL Products, Grand Island, NY) were added to the suspension. The mixture was incubated at 37 ° C. for 1 hour and then about 10 mg lysozyme (Worthington Biochemical Corp., Freehold, NJ) was added. After further incubation for 45 minutes, 1 ml of 5 M NaCl and 800 μl of CTAB / NaCl solution (10% w / v CTAB, 0.7 M NaCl) were added. This precipitate was incubated at 65 ° C. for 10 minutes, then gently stirred and further incubated, and stirred for about 20 minutes to clear the foamed material. Equivalent volumes of chloroform / isoamyl alcohol solution (24: 1 v / v) were added, mixed very gently and centrifuged at 12,000 × g for 15 minutes to separate the phases. The upper layer (aqueous phase) was gently removed with a null bore pipette, PCI (phenol / chloroform.isoamyl alcohol; 50: 49: 1, v / v / v; 1 M Tris-HCl (pH 8.0, Intermountain Scientific Corporateion) , Kayville, UT)), extracted twice as above in the equivalent volume of). DNA precipitated with 0.6 volume of isopropanol was gently removed with a glass rod, washed twice with 70% ethanol and dissolved in 2 ml STE (10 mM Tris-HCl, 10 mM NaCl, 1 mM EDTA, pH 8). This precipitate contained 2.5 mg / ml as measured by optical density at 260 nm.

[tc-유전자 특이적 프로브로 하이브리드되는 Bgl II/Hind III 단편의 동정][Identification of Bgl II / Hind III Fragments Hybridized with tc-gene Specific Probes]

게놈 DNA 약 10 ㎍를 Bgl II/Hind III (NEB)의 각각의 약 30 단위로 완결되게 180분 동안 분해시키고, 밤새 동결시키고, 이어서 65 ℃에서 5분 동안 가열하고, 0.8 %의 아가로제 젤 (등록상표 Seakem LE, 1X TEA, 80 볼트, 90분) 중에 전기영동시켰다. DNA를 전술한 바와 같이 브롬화에티듐 (50 ㎍/㎖)으로 염색시키고, 자외선하에 사진을 찍었다. 아가로제 젤 중의 DNA 단편을 정화시키고 (0.2 M HCl 중에서 5분), 변성시키고 (0.5 M NaOH, 1.5 M NaCl 중에서 15분), 중화시키고 (0.5 M 트리스-HCl, pH 8.0, 1.5 M NaCl에서 15분), 각 단계 사이에 증류수로 3회 헹구었다. DNA를 오수벨 (Ausubel, CPMB, op.) 등의 섹션 2.9에 기재된 바와 같이 고급 염 (20X SSC) 프로토콜을 사용하여 써던 블롯으로 겔에서 NYTRAN 나일론 막 (Amersham, Arlington Heights, IL)로 옮겼다. 이어서, 이동시킨 DNA를 자동 가교에 맞추어진 스트라타겐 (Stratagene) UV 스트라타링커(Stratalinker)를 사용하여 나일론 막과 UV 가교시켰다. 막들을 사용할 때까지 25 ℃에서 건조 저장시켰다.About 10 μg of genomic DNA was digested into about 30 units of each of Bgl II / Hind III (NEB) for 180 minutes, frozen overnight, then heated at 65 ° C. for 5 minutes, and 0.8% of agarose gel ( Electrophoresis on Seakem LE, 1X TEA, 80 volts, 90 minutes). DNA was stained with ethidium bromide (50 μg / ml) as described above and photographed under ultraviolet light. DNA fragments in agarose gels are clarified (5 minutes in 0.2 M HCl), denatured (0.5 M NaOH, 15 minutes in 1.5 M NaCl), neutralized (15 in 0.5 M Tris-HCl, pH 8.0, 1.5 M NaCl). Min), rinsed three times with distilled water between each step. DNA was transferred from gels to NYTRAN nylon membranes (Amersham, Arlington Heights, IL) using Southern Blot (20X SSC) protocol as described in Section 2.9 of Ausubel, CPMB, op., Et al. The transferred DNA was then UV crosslinked with the nylon membrane using a Stratagene UV Stratalinker adapted for automatic crosslinking. The membranes were stored dry at 25 ° C. until used.

하이브리다이제이션을 ECL (상표명) 디렉트 (Amersham, Arlington Heights, IL) 라벨링 및 제조자에 의해 제공된 프로토콜을 따라 검출 시스템을 사용하여 수행하였다. 간단하게는, 프로브를 효소 호스 래디쉬 퍼옥시다제에 변성된 DNA를 공유 결합시켜 제조하였다. 일단 라벨링된 프로브를 효소 활성을 유지하는 하이브리다이제이션 조건하에 사용하였다. 0.5xSSC, 0.4 % SDS 및 6 M 우레아 중에 42 ℃에서 각각 20분 동안 2회 부드럽게 세척하여 하이브리드되지 않은 프로브를 제거하였다. 이어서, 이것을 2xSSC 중에 실온에서 각각 5분 동안 2회 세척하였다. 제조자에 의해 지시된 바와 같이, ECL 시약을 사용하여 하이브리드된 DNA 밴드를 검출하였다. 각종 포토랍두스 균주 및 균주 W-14 사이에 유전자 관계를 검출하기 위한 능력에 영향을 주는 몇몇 인자들이 있다. 첫째, 매우 엄격한 조건을 이들 하이브리다이제이션에 사용하였다. 하이브리다이제이션의 엄격성 및 세척 조건을 변화시키는 것은 하이브리다이제이션 밴드의 패턴 및 강도에 영향을 주는 것으로 공지되어 있다. 둘째, 서던 블롯의 블롯 대 블롯 변형은 하이브리다이제이션 밴드 및 분자량 측정치의 유동성에 영향을 준다. 따라서, W-14는 모든 서던 블롯 상의 표준물로서 포함되었다.Hybridization was performed using a detection system following the ECL® Direct (Amersham, Arlington Heights, IL) labeling and protocol provided by the manufacturer. Briefly, probes were prepared by covalently binding the denatured DNA to the enzyme hose radish peroxidase. Once labeled probes were used under hybridization conditions to maintain enzymatic activity. The non-hybrid probe was removed by gentle wash twice at 42 ° C. for 20 minutes each in 0.5 × SSC, 0.4% SDS and 6 M urea. Then it was washed twice for 5 minutes each at room temperature in 2 × SSC. As indicated by the manufacturer, hybridized DNA bands were detected using ECL reagents. There are several factors that affect the ability to detect genetic relationships between various photolabose strains and strain W-14. First, very stringent conditions were used for these hybridizations. Changing the stringency and washing conditions of hybridization is known to affect the pattern and strength of the hybridization band. Second, the blot versus blot modification of the Southern blot affects the fluidity of the hybridization band and molecular weight measurements. Thus, W-14 was included as standard on all Southern blots.

W-14 독성 유전자로부터 유도된 유전자 특이적 프로브를 이들 하이브리다이제이션에 사용하였다. 하기에 프로브가 상응하는 각각의 유전자 서열내에서 특이적 배위를 나열하였다. tcaBi/Bii에 특이적인 프로브: 서열 ID #25의 1174 내지 3642, tcaC에 특이적인 프로브: 서열 ID #25의 3637 내지 6005, tcbA에 특이적인 프로브: 서열 ID #11의 2097 내지 4964, tcdAi에 특이적인 프로브: 서열 ID #46의 1660 내지 4191. 하기 표에 포토랍두스 균주의 서던 블롯 분석을 요약하였다. 프로브의 하이브리다이제이션가 일어나는 경우, 하이브리드된 단편은 W-14 균주에 대해 관찰한 패턴과 동일하거나 또는 상이한 것으로 나타났다.Gene specific probes derived from the W-14 virulence gene were used for these hybridizations. The probes listed below are specific coordination within each corresponding gene sequence. probes specific for tcaBi / B ii : 1174 to 3642 of SEQ ID NO: 25, probes specific for tcaC: 3637 to 6005 of SEQ ID NO: 25, probes specific for tcbA: 2097 to 4964 of SEQ ID NO: 11, tcdA i Probes specific for: 1660 to 4191 of SEQ ID NO: 46. The following table summarizes the Southern blot analysis of the Photorabdus strains. When hybridization of the probes occurred, the hybridized fragments appeared to be the same or different from the pattern observed for the W-14 strain.

포토랍두스 균주의 써던 분석Southern analysis of photolapux strain 균주Strain tcdAtcdA tcbAtcbA tcaCtcaC tcaBi/ii tcaB i / ii WX-1WX-2WX-3WX-4WX-5WX-6WX-7WX-8WX-9WX-10WX-11WX-12WX-14WX-15HP88HmHbH9B2NC-1WIRW30W-14WX-1WX-2WX-3WX-4WX-5WX-6WX-7WX-8WX-9WX-10WX-11WX-12WX-14WX-15HP88HmHbH9B2NC-1WIRW30W-14 DDDDDDDDNDNDNDDDDDDDDDDDDIDDDDDDDDNDNDNDDDDDDDDDDDDI DDDDDDDDDDDDDD-------DIDDDDDDDDDDDDDD ------- DI D-DNDDDNDDDDDDDDDDDIDDDDID-DNDDDNDDDDDDDDDDDIDDDDI DDDDDDDDDDDDDDDD-D-DDDIDDDDDDDDDDDDDDDD-D-DDDI ND=측정않음; - = 하이브리다이즈 산물을 검출할 수 없음;I = 동일한 단편 패턴; D = 상이한 단편 패턴ND = no measurement; -= Unable to detect hybridize product; I = same fragment pattern; D = different fragment patterns

포토랍두스 균주의 써던 분석Southern analysis of photolapux strain 균주Strain tcdAtcdA tcbAtcbA tcaCtcaC tcaBi/ii tcaB i / ii K-122PWH-5인디커스메기디스GDHF-85MP3MP1에이. 카우스HB-ArgHMGDHB 레위스톤HB 오스웨고W-14K-122PWH-5 indicus megidis GDHF-85MP3MP1A. Mouse HB-ArgHMGDHB Leviston HB Oswego W-14 3.3, 2.8+DDDDDDDDDDDI3.3, 2.8 + DDDDDDDDDDDI DDDDDD-++NDDDDIDDDDDD-++ NDDDDI -D3.0DDDDDDDDDDI-D3.0DDDDDDDDDDI ND-I----------IND-I ---------- I ND=측정않음; - = 하이브리다이즈 산물을 검출할 수 없음;I = 동일한 단편 패턴; D = 상이한 단편 패턴ND = no measurement; -= Unable to detect hybridize product; I = same fragment pattern; D = different fragment patterns

포토랍두스 균주의 써던 분석Southern analysis of photolapux strain 균주Strain tcdAtcdA tcbAtcbA tcaCtcaC tcaBi/ii tcaB i / ii GL98GL101GL138GL155GL217GL257MP4MP5피. 헤피알루스피. 제알란디아DEP1DEP2DEP3W-14GL98GL101GL138GL155GL217GL257MP4MP5p. Hephyaluspi. ZealandiaDEP1DEP2DEP3W-14 +---++--++3.8, 2.8+ --- ++-++ 3.8, 2.8 +++--++---2.8+++-++ --- 2.8 DDD-DD--D11.02.8DDD-DD--D11.02.8 ND=측정않음; - = 하이브리다이즈 산물을 검출할 수 없음;I = 동일한 단편 패턴; D = 상이한 단편 패턴, + = 측정되지 않은 하이브리다이제이션 단편 패턴.ND = no measurement; -= Unable to detect hybridize product; I = same fragment pattern; D = different fragment pattern, + = unmeasured hybridization fragment pattern.

이들 분석으로부터, W-14 및 다른 균주 사이의 유전자 단편 크기의 차이에 의해 증명되는 W-14 유전자의 동족체는 이들 역 포토랍두스 전체에 걸쳐 분산되어 있는 것이 명백하다.From these analyzes, it is evident that homologues of the W-14 gene, as evidenced by differences in gene fragment size between W-14 and other strains, are dispersed throughout these inverse photoladus.

〈실시예 25〉<Example 25>

상이한 포토랍두스 균주로부터의 독소 착물 펩티드의 N-말단 아미노산 서열N-terminal amino acid sequence of toxin complex peptides from different photolabose strains

실시예 14에 기재한 바와 같이, 상이한 포토랍두스 균주로부터 단리한 펩티드의 관계를 N-말단 아미노산 서열화에 도입하였다. 몇몇 균주에서의 독소 펩티드 N-말단 아미노산 서열을 W-14 독소와 비교하였다. 표 40에서, 지금까지 비교한 독소 펩티드의 비교는 동일하거나 유사한 (W-14 유전자/펩티드와 40 % 이상의 유사성) 독소 펩티드가 모든 균주에서 존재한다는 것을 보여주었다. 예를 들어, TcaC, SEQ ID NO: 2의 N-말단 아미노산 서열은 HP88에서 160 kDa 펩티드에 대한 것과 동일한 것으로 밝혀졌고, 또한 유사체가 균주 WIR, H9, Hb, WX-1 및 Hm에서 존재하였다. 몇몇 W-14 펩티드 또는 유사체는 다른 균주에서 발견되지 않았지만, 모든 펩티드는 N-말단 차단 또는 낮은 어번던스로 인하여 다른 균주로부터 독소 착물에 대해 서열화되지 않았다. 또한, 많은 다른 N-말단 아미노산 서열 (SEQ ID NOS: 82 내지 88)은 W-14로부터의 펩티드와 유사성이 없는 다른 균주로부터 독소 착물 펩티드에 대해 얻어졌고, 몇몇 경우에서는 서로 동일하였다. 예를 들어, 동일한 아미노산 서열, SEQ ID NO: 82는 HP88 및 Hb 균주에 존재하는 64 kDa 펩티드에 대해 얻었고, NC-1 균주 (SEQ ID NO: 83) 중의 70 kDa 펩티드에 대해 유사한 서열을 얻었다.As described in Example 14, the relationship of peptides isolated from different photolabose strains was introduced in N-terminal amino acid sequencing. Toxin peptide N-terminal amino acid sequences in several strains were compared to W-14 toxin. In Table 40, comparisons of the toxin peptides so far compared showed that the same or similar (at least 40% similarity to the W-14 gene / peptide) toxin peptides were present in all strains. For example, the N-terminal amino acid sequence of TcaC, SEQ ID NO: 2, was found to be identical to that for the 160 kDa peptide in HP88, and analogues were also present in strains WIR, H9, Hb, WX-1 and Hm. Some W-14 peptides or analogs were not found in other strains, but not all peptides were sequenced for toxin complexes from other strains due to N-terminal blockade or low abundance. In addition, many other N-terminal amino acid sequences (SEQ ID NOS: 82-88) were obtained for toxin complex peptides from other strains that were not similar to peptides from W-14, and in some cases were identical to each other. For example, the same amino acid sequence, SEQ ID NO: 82, was obtained for 64 kDa peptides present in HP88 and Hb strains, and similar sequences were obtained for 70 kDa peptides in NC-1 strain (SEQ ID NO: 83).

비W-14 균주로 부터 단리한 단백질 사이의 아미노 말단 서열 상동성 비교Comparison of amino terminal sequence homology between proteins isolated from non-W-14 strains W-14 펩티드W-14 peptide W-14 유전자W-14 gene W-14 서열W-14 sequence 서열order 균주Strain 동일성sameness 상동성Homology TcaAiiTcaAiiiTcaBiTcaBiiTcaCTcbAiiTcbAiiTccATccBTcdAiiTcdAiii?TcaAiiTcaAiiiTcaBiTcaBiiTcaCTcbAiiTcbAiiTccATccBTcdAiiTcdAiii? tcaAtcaAtcaBtcaAtcaAtcbAtcbAtccAtccBtcdAtcdA?tcaAtcaAtcaBtcaAtcaAtcbAtcbAtccAtccBtcdAtcdA? 1543521408741915435214087419 76767273747580777879817676727374758077787981 H9HmH9HmHbHP88WIRH9HmWX-1HbWX-1WX-2WX-14WIRH9NC-1HmHbH9HbHP88H9HmH9HmHbHP88WIRH9HmWX-1HbWX-1WX-2WX-14WIRH9NC-1HmHbH9HbHP88 --61 KDa61 KDa160 KDa-----170 KDa180 KDa180 KDa170 KDa-140 KDa-57 KDa-86 KDa86 KDa--61 KDa61 KDa160 KDa ----- 170 KDa180 KDa180 KDa170 KDa-140 KDa-57 KDa-86 KDa86 KDa 74 KDa71 KDa--160 KDa-170 KDa180 KDa170 KDa170 KDa81 KDa----170 KDa-190 KDa-69 KDa--74 KDa71 KDa--160 KDa-170 KDa180 KDa170 KDa170 KDa81 KDa ---- 170 KDa-190 KDa-69 KDa--

상동성은 W14 유전자/펩티드에 적어도 40%의 유사성이 있는 아미노산 서열을 의미한다. 유사한 잔기는 하기 5개 군 중 하나로 특성화된다 (P,A,G,S,T); (Q,N,E,B,D,Z), (H,K,R), (L,I,V,M), 및 (F,Y,W)Homologous refers to an amino acid sequence having at least 40% similarity to the W14 gene / peptide. Similar residues are characterized in one of five groups (P, A, G, S, T); (Q, N, E, B, D, Z), (H, K, R), (L, I, V, M), and (F, Y, W)

〈실시예 26〉<Example 26>

포토랍두스 균주의 면역학적 분석Immunological Analysis of Photorabdus Strains

포토랍두스 균주의 배열 브로쓰를 센트리프렙-10 한외여과 장치 (Ameicon, Inc. Beverly, MA 01915)를 사용하여 10 내지 15배로 농축하였다. 단백질의 농도는 ㎖ 당 0.3 내지 3.0 mg의 범위이다. 전체 단백질 10 내지 20 ㎍을 프리캐스트 4-20 % 폴리아크릴아미드 겔 (Integrated Separation Systems, Natick, MA 01760)의 웰 각각에 충전하였다. 겔 전기영동법을 겔 당 25 ma에 맞춘 일정한 전류를 사용하여 1.25시간 동안 수행하였다. 겔을 반건조 전기 블로터 (Pharmacia Biotech Inc., Piscataway, NJ 08854)를 사용하여 Hybond-ECL (상표명) 니트로셀루로오스 막 (Amersham Corporation, Arlington Hts, Il 60005)에 전기 블롯시켰다. 일정한 전류를 2.5시간 동안 ㎝ 당 0.75 ma으로 인가하였다. 막을 TBST (25 mM 트리스 HCl pH 7.4, 136 mM NaCl, 2.7 mM KCl, 0.1 % 트윈 20) 중의 10 % 밀크로 실온에서 1시간 동안 차단시켰다. 각 1차 항체를 10 % 밀/TBST 중에서 1:500으로 희석하였다. 1:50 내지 1:1000 사이의 다른 희석액을 또한 사용하였다. 이어서, 이것을 차단 용액 또는 TBST로 철저히 세척하였다. 10 % 밀/TBST 중의 2차 항체 (호르서라디쉬 퍼옥시다제에 공액된 염소 항-쥐 IgG 또는 염소 항-토끼 TgG; BioRad Laboratories, Hercules, CA 94547)의 1:2000 희석액을 막에 도포시키고 이것을 1시간 동안 평면형 진탕기 위에 두었다. 후속해서 막을 과량의 TBST로 세척하였다. 단백질의 검출을 ECL )Enhanced Chemiluminescence) 검출 장치 (Amersham International)를 사용하여 세척하였다.Arrangement broth of the Photorabdus strains were concentrated 10-15 times using Centriprep-10 ultrafiltration apparatus (Ameicon, Inc. Beverly, MA 01915). The concentration of protein ranges from 0.3 to 3.0 mg per ml. 10-20 μg of total protein was filled into each well of a precast 4-20% polyacrylamide gel (Integrated Separation Systems, Natick, MA 01760). Gel electrophoresis was performed for 1.25 hours using a constant current set at 25 ma per gel. Gels were electroblotted onto a Hybond-ECL ™ Nitrocellulose Cell (Amersham Corporation, Arlington Hts, Il 60005) using a semi-dry electric blotter (Pharmacia Biotech Inc., Piscataway, NJ 08854). A constant current was applied at 0.75 ma per cm for 2.5 hours. The membrane was blocked for 1 hour at room temperature with 10% milk in TBST (25 mM Tris HCl pH 7.4, 136 mM NaCl, 2.7 mM KCl, 0.1% Tween 20). Each primary antibody was diluted 1: 500 in 10% wheat / TBST. Other dilutions between 1:50 and 1: 1000 were also used. Then it was washed thoroughly with blocking solution or TBST. A 1: 2000 dilution of a secondary antibody (goat anti-rat IgG or goat anti-rabbit TgG conjugated to horseradish peroxidase in 10% wheat / TBST; BioRad Laboratories, Hercules, CA 94547) was applied to the membrane and this was applied. Placed on a flat shaker for 1 hour. The membrane was subsequently washed with excess TBST. Detection of the protein was washed using an ECL Enhanced Chemiluminescence Detection Device (Amersham International).

W-14 펩티드에 대해 생성된 펩티드 특이적 항체의 패널을 사용하고, 웨스턴 블롯 분석을 사용하여 9개의 비-W-14 포토랍두스 균주로부터 브로쓰의 단백질 조성물을 특성화시켰다. 또한, W-14 유도 독소 착물 중의 TcbAiii단백질을 인식하는 하나의 단클론성 항체 (MAb-C5F2)를 사용하였다. 결과 (표 39)는 이들 브로쓰 중의 단백질의 일부에 대한 항체의 상호 인식을 보여주었다. 몇몇 경우에서, 항체에 의해 인식되는 단백질은 W-14 표적 펩티드와 동일한 크기이었다. 다른 경우에서는 항체에 의해 인식되는 단백질은 W-14 표적 펩티드 보다 작았다. 이 데이타는 비-W-14 포토랍두스의 일부가 W-14 균주와 유사한 단백질을 생성할 수 있다는 것을 나타낸다. 이들 차이는 검출 또는 단백질 가공 또는 분해 과정에 인한 것이다. 균주의 일부는 몇몇 항체에 의해 인식될 수 있는 단백질을 함유하지 않았지만, 농도가 W-14 펩티드에 대해 관찰된 것 보다 상당히 낮았다. 각종 독소 펩티드 유사체에 대해 비교할 때, 이들 결과는 포토랍두스 균주 사이의 펩티드 다양성을 보여주었다.A panel of peptide specific antibodies generated against the W-14 peptide was used and the Western blot analysis was used to characterize the protein composition of the broth from nine non-W-14 photolabose strains. In addition, one monoclonal antibody (MAb-C5F2) that recognizes the TcbA iii protein in the W-14 induced toxin complex was used. The results (Table 39) showed the mutual recognition of antibodies to some of the proteins in these broths. In some cases, the protein recognized by the antibody was the same size as the W-14 target peptide. In other cases, the protein recognized by the antibody was smaller than the W-14 target peptide. This data shows that some of the non-W-14 photolabdus can produce proteins similar to the W-14 strain. These differences are due to detection or protein processing or degradation processes. Some of the strains did not contain proteins that could be recognized by some antibodies, but the concentrations were significantly lower than those observed for W-14 peptides. When compared to the various toxin peptide analogs, these results showed peptide diversity between the Photorabdus strains.

추가의 비-W-14 포토랍두스 균주를 항체로서 배양 브로쓰 및(또는) 부분 정제된 단백질 분획을 사용하여 웨스턴 블롯 분석으로 특성화하였다. 항체의 패널은 MAb-C5F2, MAb-DE1 (인식 TcdAii), PAb-DE2 (인식 TcaB), PAb-TcbA-syn, PAb-, TcaC-syn, PAb TcaBii-syn, PAb-TcbAiii-syn, PAb-TcaBi-syn을 포함한다. 이들 항체는 브로쓰 및 비-W-14 균주의 부분 정체된 분획 중의 단백질과 교차 반응성을 보여주었다.Additional non-W-14 photolabose strains were characterized by western blot analysis using culture broth and / or partially purified protein fractions as antibodies. Panels of antibodies include MAb-C5F2, MAb-DE1 (recognized TcdA ii ), PAb-DE2 (recognized TcaB), PAb-TcbA-syn, PAb-, TcaC-syn, PAb TcaB ii -syn, PAb-TcbA iii -syn , PAb-TcaB i -syn. These antibodies showed cross-reactivity with proteins in partially stagnant fractions of broth and non-W-14 strains.

데이터는 항체를 사용하여 브로쓰 뿐만 아니라 부분 정제된 단백질 분획 중에서 단백질을 동정할 수 있다는 것을 나타낸다.The data indicate that antibodies can be used to identify proteins in broth as well as partially purified protein fractions.

〈실시예 27〉<Example 27>

tcdA 코딩 영역의 세균 발현Bacterial Expression of the tcdA Coding Region

세균 발현에 대한 tcdA 유전자의 엔지니어링Engineering the tcdA Gene for Bacterial Expression

tcdA 코딩 영역 (SEQ ID NO: 46)의 5'및 3'말단을 변형시켜 불균질 발현 벡터로 세그먼트를 삽입하기 위해 유용한 클로닝 부위를 첨가하였다. 말단들을 실시예 8에서 기재한 바와 같이 기본적으로 수행한 폴리머라제 사슬 반응 (PCR) 중의 단일 프라이머를 사용하여 변형시켰다. 하기 기재한 바와 같은 프라이머 세트를 템플레이트로서 코스미드 21D2.4와 결합시켜 사용하여 적절하게 변형된 말단을 갖는 생성물을 생성하였다.The 5 ' and 3 ' ends of the tcdA coding region (SEQ ID NO: 46) were modified to add a cloning site useful for inserting segments into heterogeneous expression vectors. The ends were modified using a single primer in the polymerase chain reaction (PCR), which was performed basically as described in Example 8. A primer set as described below was used in combination with cosmid 21D2.4 as a template to produce a product with suitably modified ends.

제1 프라이머 세트를 사용하여 유전자의 5'말단을 변형시켜 선행 프라이머 A0F1 (5'GAT CGA TCG ATC CAT GGC CAA CGA CGA GTC TGT AAA AGA GAT ACC TGA TG TAT TAA AAA GCC AGT GTG 3')를 사용하여 개시제 코돈에서 단일 nCO i 부위를 삽입하고 역 프라이머 A0R1 (5'GAT CGA TCG TAC GCG GCC GCT GAT TCG ATC GTC GAC CCA TTG ATT TGA GAT CTG GGC GGC GGG TAT CCA GAT AAT AAA CGG AGT CAC 3')을 사용하여 유전자의 나머지의 삽입을 용이하게 하기 위해 단일 Bgl II, Sal I 및 Not I를 첨가하였다.The 5 ' terminus of the gene was modified using the first primer set to use the preceding primer A0F1 (5 ' GAT CGA TCG ATC CAT GGC CAA CGA CGA GTC TGT AAA AGA GAT ACC TGA TG TAT TAA AAA GCC AGT GTG 3 ' ) Insert a single nCO i site in the initiator codon and use reverse primer A0R1 (5 ' GAT CGA TCG TAC GCG GCC GCT GAT TCG ATC GTC GAC CCA TTG ATT TGA GAT CTG GGC GGC GGG TAT CCA GAT AAT AAA CGG AGT CAC 3 ' ) A single Bgl II, Sal I and Not I was added to facilitate insertion of the rest of the gene.

다른 PCR 반응을 추가의 중단 코돈을 첨가하므로써 유전자의 3 말단을 변형시키도록 고안하였다. 선행 프라이머 A0F2 (5'ACT GGC TGC GTC GTC GAC TGG CGG CGA TTT ACT 3')를 사용하여 유전자 중의 단일 Sal I 부위를 가로질러 증폭시키고 후자를 사용하여 변형된 3'말단을 클로닝하였다. 역 프라이머 A0R2 (5'CGA TGC ATG CTG CGG CCG CAG GCC TTC CTC GAG TCA TTA TTT AAT GGT GTA GCG AAT ATG CAA AAT 3')를 사용하여 제2 중단 코돈 (TGA) 및 클로닝 부위 Xho I, Stu I 및 Not I를 삽입하였다. 세균 발현 벡터 pET27b (Novagen, Madison, WI)를 변형시켜 표준 분자 생물학 기술을 사용하여 446 위치에서 Bgl II 부위를 제거하였다.Another PCR reaction was designed to modify the three ends of the gene by adding additional stop codons. Using the preceding primer A0F2 (5 'ACT GGC TGC GTC GTC GAC TGG CGG CGA TTT ACT 3') was amplified across a single Sal I site of the gene by using the latter was cloned into a modified 3 'end. Second stop codon (TGA) and cloning site Xho I, Stu I and using reverse primer A0R2 (5 ' CGA TGC ATG CTG CGG CCG CAG GCC TTC CTC GAG TCA TTA TTT AAT GGT GTA GCG AAT ATG CAA AAT 3 ' ) Not I was inserted. The bacterial expression vector pET27b (Novagen, Madison, Wis.) Was modified to remove the Bgl II site at position 446 using standard molecular biology techniques.

유전자의 5'말단을 변형시키기 위한 제1 증폭 반응 (A0F1 + AOR1)로부터의 497 bp PCR 생성물을 공급자의 지시에 따라 변형된 pET27b에 라이게이션시켰다. 3개의 단리물의 증폭된 부분의 DNA 서열을 공급자의 추천된 프라이머를 사용하고 전술한 방법을 배열하여 측정하였다. 모든 단리물의 서열은 동일하였다.The 497 bp PCR product from the first amplification reaction (A0F1 + AOR1) to modify the 5 ' end of the gene was ligated to the modified pET27b according to the supplier's instructions. DNA sequences of the amplified portions of the three isolates were determined using the recommended primers from the supplier and by arranging the methods described above. The sequences of all isolates were identical.

이어서, 하나의 단리물을 클로닝 벡터로 사용하여 6341 bp Bgl II 내지 Sal I 단편 상에서 tcdA 유전자의 중간 부분을 삽입하였다. 생성된 클론을 MC4로 부르며 모두 그러나 tcdA 코딩 서열의 3'의 대부분을 함유하였다. 마지막으로, 전체 길이의 코딩 영역을 완성하기 위해, 유전자의 3'말단을 변형시키기 위한 제2 PCR 증폭 (A0F2 + A0F2)으로부터의 832 bp PCR 생성물을 표준 분자 생물학 기술에 따라 라이게이션시켜 Sal I 내지 Not I 단편 상에 MC4를 단리하였다. tcdA 코딩 영역은 서열화되었고 완성된 것으로 밝혀졌고, 생성된 플라스미드는 pDAB2035로 칭한다.Then, one isolate was used as the cloning vector to insert the middle portion of the tcdA gene on the 6341 bp Bgl II to Sal I fragment. The resulting clones were called MC4 and contained all but most of the 3 of the tcdA coding sequence. Finally, to complete the full length coding region, 832 bp PCR product from the second PCR amplification (A0F2 + A0F2) for modifying the 3 ' end of the gene was ligated according to standard molecular biology techniques to Sal I to MC4 was isolated on Not I fragment. The tcdA coding region was sequenced and found to be complete, and the resulting plasmid was called pDAB2035.

tcdA의 세균 발현에 대한 플라스미드 pDAB2036, pDAB2037 및 pDAB2038의 구성Constitution of plasmids pDAB2036, pDAB2037 and pDAB2038 for bacterial expression of tcdA

tcdA 코딩 영역을 제한 효소 Nco I 및 Xho I로 플라스미드 pDAB2035로부터 절단시키고 겔을 정제시켰다. 단편을 발현 벡터 pET15의 Nco I 및 Xho I 부위로 라이게이션시켜 플라스미드 pDAB2036을 생성하였다. 또한, pDAB2035를 Nco I 및 Not I로 절단하여 tcdA 코딩 영역을 방출시키고 이것을 발현 벡터 pET28b의 Nco I 및 Not I 위치로 라이게이션시켜 플라스미드 pDAB2037를 생성하였다. 마지막으로, 플라스미드 pDAB2035를 Nco I 및 Stu I로 절단하여 tcdA 영역을 방출시켰다. 이 단편을 발현 벡터 Trc99a로 라이게이션시키고, Hind III로 절단시킨 다음 T4 DNA 폴리머라제로 처리하여 말단을 뭉툭하게 하였다. 이어서, 벡터를 Nco I로 절단시키고 tcdA 단편을 절단한 Nco I/Stu I로 라이게이션시켰다. 생성된 플라스미드는 pDAB2038로 칭한다.The tcdA coding region was cleaved from plasmid pDAB2035 with restriction enzymes Nco I and Xho I and the gel was purified. The fragment was ligated to the Nco I and Xho I sites of the expression vector pET15 to produce plasmid pDAB2036. In addition, pDAB2035 was cleaved with Nco I and Not I to release the tcdA coding region and ligated to the Nco I and Not I positions of the expression vector pET28b to generate plasmid pDAB2037. Finally, plasmid pDAB2035 was cleaved with Nco I and Stu I to release the tcdA region. This fragment was ligated with the expression vector Trc99a, cleaved with Hind III and treated with T4 DNA polymerase to blunt the ends. The vector was then cleaved with Nco I and the tcdA fragment was ligated with the cleaved Nco I / Stu I. The resulting plasmid is called pDAB2038.

플라스미드 pDAB2038로부터의 tcdA의 발현Expression of tcdA from plasmid pDAB2038

플라스미드 pDAB2038를 BL21 세포로 전사시키고 실시예 19에서 플라스미드 pDAB2033에 대해 전술한 바와 같이 발현시켰다.Plasmid pDAB2038 was transcribed into BL21 cells and expressed as described above for plasmid pDAB2033 in Example 19.

E. 콜라이로부터의 tcdA의 정제Purification of tcdA from E. coli

발현 배양물을 10,300 g에서 30분 동안 원심분리하고 상청액을 수집였다. 이것을 2 용적의 H2O로 희석시키고, 10 mM 인산나트륨 완충액 (pH 7.0, 완충액 A)로 평형시킨 공극 50 HQ (Perspective System, MA) 칼럼 (1.6 ㎝ x 10 ㎝)에 7.5 ㎖/분의 유속으로 걸었다. 칼럼을 280 nm에서 광학밀도가 기본선으로 되돌아 갈때까지 완충액 A로 세척하였다. 이어서, 칼럼에 결합된 단백질을 완충액 A 중의 1 M NaCl로 용출시켰다.Expression cultures were centrifuged at 10,300 g for 30 minutes and the supernatants were collected. 7.5 ml / min flow rate on a pore 50 HQ (Perspective System, MA) column (1.6 cm x 10 cm) diluted with 2 volumes H 2 O and equilibrated with 10 mM sodium phosphate buffer (pH 7.0, buffer A). Walked by. The column was washed with Buffer A at 280 nm until the optical density returned to baseline. The protein bound to the column was then eluted with 1 M NaCl in Buffer A.

분획을 완충액 A로 평형시킨 겔 여과 칼럼, 세파로스 CL-4B (2.6 x 100 ㎝)에 분취액 20 ㎖로 충전시켰다. 단백질을 0.75 ㎖/분의 유속으로 완충액 A로 용출시켰다. 체류시간이 260분 및 460분 사이인 분획을 모으고 20 mM 트리스-HCl (pH 7.0, 완충액 B)로 평형시킨 모노 Q 5/5 칼럼에 1 ㎖/분으로 걸었다. 칼럼을 280 nm에서 광학밀도가 기본선으로 되돌아 갈때까지 완충액 A로 세척하였다. 이어서, 칼럼에 결합된 단백질을 완충액 B 중의 1 M NaCl로 용출시켰다. 칼럼에 결합한 단백질을 30분 동안 1 ㎖/분으로 완충액 B 중의 0 내지 1 M NaCl의 선형 구배로 용출하였다. 1 밀리리터 분획을 수집하고, 연속으로 희석하고 SCR 생분석에 도입하였다. 0.1 및 0.3 M NaCl 사이에 용출된 분획은 가장 높은 살충 활성을 갖는 것으로 밝혀졌다. pAb TcdAiii-syn 항체 및 Tcdiii-syn 항체를 사용하는 활성인 분획의 웨스턴 분석에서 펩티드 TcdAiii및 TcdAiii의 존재가 확인되었다.Fractions were charged to a gel filtration column, Sepharose CL-4B (2.6 x 100 cm), equilibrated with Buffer A with 20 ml aliquots. Protein was eluted with Buffer A at a flow rate of 0.75 mL / min. Fractions with retention times between 260 and 460 minutes were collected and walked at 1 ml / min on a mono Q 5/5 column equilibrated with 20 mM Tris-HCl (pH 7.0, Buffer B). The column was washed with Buffer A at 280 nm until the optical density returned to baseline. The protein bound to the column was then eluted with 1 M NaCl in Buffer B. The protein bound to the column was eluted with a linear gradient of 0-1 M NaCl in Buffer B at 1 mL / min for 30 minutes. One milliliter fractions were collected, serially diluted and introduced into SCR bioassay. The fraction eluted between 0.1 and 0.3 M NaCl was found to have the highest pesticidal activity. The pAb TcdA iii -syn antibody and the presence of Tcd iii peptides in Western analysis of the active fractions using an antibody -syn TcdA iii and iii TcdA were confirmed.

DNA SEQUENCE LISTINGDNA SEQUENCE LISTING

(1) GENERAL INFORMATION:(1) GENERAL INFORMATION:

(i) APPLICANT: Ensign, Jerald C(i) APPLICANT: Ensign, Jerald C

Bowen, David JBowen, David J

Petell, JamesPetell, James

Fatig, RaymondFatig, Raymond

Schoonover, SueSchoonover, Sue

ffrench-Constant, Richardffrench-Constant, Richard

Orr, Gregory LOrr, Gregory L

Merlo, Donald JMerlo, Donald J

Roberts, Jean LRoberts, Jean L

Rocheleau, Thomas ARocheleau, Thomas A

(ii) TITLE OF INVENTION: Insecticidal Protein Toxins from(ii) TITLE OF A: Insecticidal Protein Toxins from

PhotorhabdusPhotorhabdus

(iii) NUMBER OF SEQUENCES: 88(iii) NUMBER OF SEQUENCES: 88

(iv) CORRESPONDENCE ADDRESS:(iv) CORRESPONDENCE ADDRESS:

(A) ADDRESSEE: DowElanco(A) ADDRESSEE: DowElanco

(B) STREET: 9330 Zionsville Road(B) STREET: 9330 Zionsville Road

(C) CITY: Indianapolis(C) CITY: Indianapolis

(D) STATE: IN(D) STATE: IN

(E) COUNTRY: US(E) COUNTRY: US

(F) ZIP: 46268(F) ZIP: 46268

(v) COMPUTER READABLE FORM:(v) COMPUTER READABLE FORM:

(A) MEDIUM TYPE: Floppy disk(A) MEDIUM TYPE: Floppy disk

(B) COMPUTER: IBM PC compatible(B) COMPUTER: IBM PC compatible

(C) OPERATING SYSTEM: PC-DOS/MS-DOS(C) OPERATING SYSTEM: PC-DOS / MS-DOS

(D) SOFTWARE: PatentIn Release #1.0, Version #1.30(D) SOFTWARE: Patent In Release # 1.0, Version # 1.30

(vi) CURRENT APPLICATION DATA:(vi) CURRENT APPLICATION DATA:

(A) APPLICATION NUMBER:(A) APPLICATION NUMBER:

(B) FILING DATE:(B) FILING DATE:

(C) CLASSIFICATION:(C) CLASSIFICATION:

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 08/063,615(A) APPLICATION NUMBER: US 08 / 063,615

(B) FILING DATE: 18-MAY-1993(B) FILING DATE: 18-MAY-1993

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 08/395,497(A) APPLICATION NUMBER: US 08 / 395,497

(B) FILING DATE: 28-FEB-1995(B) FILING DATE: 28-FEB-1995

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 60/007,255(A) APPLICATION NUMBER: US 60 / 007,255

(B) FILING DATE: 06-NOV-1995(B) FILING DATE: 06-NOV-1995

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 08/608,423(A) APPLICATION NUMBER: US 08 / 608,423

(B) FILING DATE: 28-FEB-1996(B) FILING DATE: 28-FEB-1996

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 08/705,484(A) APPLICATION NUMBER: US 08 / 705,484

(B) FILING DATE: 28-AUG-1996(B) FILING DATE: 28-AUG-1996

(vii) PRIOR APPLICATION DATA:(vii) PRIOR APPLICATION DATA:

(A) APPLICATION NUMBER: US 08/743,699(A) APPLICATION NUMBER: US 08 / 743,699

(B) FILING DATE: 06-NOV-1996(B) FILING DATE: 06-NOV-1996

(viii) ATTORNEY/AGENT INFORMATION:(viii) ATTORNEY / AGENT INFORMATION:

(A) NAME: Borucki, Andrea T.(A) NAME: Borucki, Andrea T.

(B) REGISTRATION NUMBER: 33651(B) REGISTRATION NUMBER: 33651

(C) REFERENCE/DOCKET NUMBER: 50301E(C) REFERENCE / DOCKET NUMBER: 50301E

(ix) TELECOMMUNICATION INFORMATION:(ix) TELECOMMUNICATION INFORMATION:

(A) TELEPHONE: 317-337-4846(A) TELEPHONE: 317-337-4846

(B) TELEFAX: 317-337-4847(B) TELEFAX: 317-337-4847

(2) INFORMATION FOR SEQ ID NO:1:(2) INFORMATION FOR SEQ ID NO: 1:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 11 amino acids(A) LENGTH: 11 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:1 (TcbAii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 1 (TcbAii N-terminus):

Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly AsnPhe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:2:(2) INFORMATION FOR SEQ ID NO: 2:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:2 (TcaC N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 2 (TcaC N-terminus):

Met Gln Asp Ser Pro Glu Val Ser Ile Thr Thr TrpMet Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Trp

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:3:(2) INFORMATION FOR SEQ ID NO: 3:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 19 amino acids(A) LENGTH: 19 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:3 (TcaBi N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 3 (TcaBi N-terminus):

Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp AlaSer Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp Ala

1 5 10 151 5 10 15

Leu Val AlaLeu val ala

(2) INFORMATION FOR SEQ ID NO:4:(2) INFORMATION FOR SEQ ID NO: 4:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 14 amino acids(A) LENGTH: 14 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:4 (TcaAiii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 4 (TcaAiii N-terminus):

Ala Ser Pro Leu Ser Thr Ser Glu Leu Thr Ser Lys Leu AsnAla Ser Pro Leu Ser Thr Ser Glu Leu Thr Ser Lys Leu Asn

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:5:(2) INFORMATION FOR SEQ ID NO: 5:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 9 amino acids(A) LENGTH: 9 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:5 (TcaBii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 5 (TcaBii N-terminus):

Ala Gly Asp Thr Ala Asn Ile Gly AspAla Gly Asp Thr Ala Asn Ile Gly Asp

1 51 5

(2) INFORMATION FOR SEQ ID NO:6:(2) INFORMATION FOR SEQ ID NO: 6:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:6:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 6:

Leu Gly Gly Ala Ala Thr Leu Leu Asp Leu Leu Leu Pro Gln IleLeu Gly Gly Ala Ala Thr Leu Leu Asp Leu Leu Leu Pro Gln Ile

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:7:(2) INFORMATION FOR SEQ ID NO: 7:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 11 amino acids(A) LENGTH: 11 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:7 (TccB N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 7 (TccB N-terminus):

Met Leu Ser Thr Met Glu Lys Gln Leu Asn GluMet Leu Ser Thr Met Glu Lys Gln Leu Asn Glu

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:8:(2) INFORMATION FOR SEQ ID NO: 8:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 9 amino acids(A) LENGTH: 9 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:8 (TccA N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 8 (TccA N-terminus):

Met Asn Leu Ala Ser Pro Leu Ile SerMet Asn Leu Ala Ser Pro Leu Ile Ser

1 51 5

(2) INFORMATION FOR SEQ ID NO:9:(2) INFORMATION FOR SEQ ID NO: 9:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 16 amino acids(A) LENGTH: 16 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:9:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 9:

Met Ile Asn Leu Asp Ile Asn Glu Gln Asn Lys Ile Met Val Val SerMet Ile Asn Leu Asp Ile Asn Glu Gln Asn Lys Ile Met Val Val Ser

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:10:(2) INFORMATION FOR SEQ ID NO: 10:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS:(C) STRANDEDNESS:

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:10:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 10:

Ala Ala Lys Asp Val Lys Phe Gly Ser Asp Ala Arg Val Lys Met LeuAla Ala Lys Asp Val Lys Phe Gly Ser Asp Ala Arg Val Lys Met Leu

1 5 10 151 5 10 15

Arg Gly Val AsnArg Gly Val Asn

2020

(2) INFORMATION FOR SEQ ID NO:11:(2) INFORMATION FOR SEQ ID NO: 11:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 7515 base pairs(A) LENGTH: 7515 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 1..7515(B) LOCATION: 1..7515

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:11 (tcbA gene):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 11 (tcbA gene):

ATG CAA AAC TCA TTA TCA AGC ACT ATC GAT ACT ATT TGT CAG AAA CTG 48ATG CAA AAC TCA TTA TCA AGC ACT ATC GAT ACT ATT TGT CAG AAA CTG 48

Met Gln Asn Ser Leu Ser Ser Thr Ile Asp Thr Ile Cys Gln Lys LeuMet Gln Asn Ser Leu Ser Ser Thr Ile Asp Thr Ile Cys Gln Lys Leu

1 5 10 151 5 10 15

CAA TTA ACT TGT CCG GCG GAA ATT GCT TTG TAT CCC TTT GAT ACT TTC 96CAA TTA ACT TGT CCG GCG GAA ATT GCT TTG TAT CCC TTT GAT ACT TTC 96

Gln Leu Thr Cys Pro Ala Glu Ile Ala Leu Tyr Pro Phe Asp Thr PheGln Leu Thr Cys Pro Ala Glu Ile Ala Leu Tyr Pro Phe Asp Thr Phe

20 25 3020 25 30

CGG GAA AAA ACT CGG GGA ATG GTT AAT TGG GGG GAA GCA AAA CGG ATT 144CGG GAA AAA ACT CGG GGA ATG GTT AAT TGG GGG GAA GCA AAA CGG ATT 144

Arg Glu Lys Thr Arg Gly Met Val Asn Trp Gly Glu Ala Lys Arg IleArg Glu Lys Thr Arg Gly Met Val Asn Trp Gly Glu Ala Lys Arg Ile

35 40 4535 40 45

TAT GAA ATT GCA CAA GCG GAA CAG GAT AGA AAC CTA CTT CAT GAA AAA 192TAT GAA ATT GCA CAA GCG GAA CAG GAT AGA AAC CTA CTT CAT GAA AAA 192

Tyr Glu Ile Ala Gln Ala Glu Gln Asp Arg Asn Leu Leu His Glu LysTyr Glu Ile Ala Gln Ala Glu Gln Asp Arg Asn Leu Leu His Glu Lys

50 55 6050 55 60

CGT ATT TTT GCC TAT GCT AAT CCG CTG CTG AAA AAC GCT GTT CGG TTG 240CGT ATT TTT GCC TAT GCT AAT CCG CTG CTG AAA AAC GCT GTT CGG TTG 240

Arg Ile Phe Ala Tyr Ala Asn Pro Leu Leu Lys Asn Ala Val Arg LeuArg Ile Phe Ala Tyr Ala Asn Pro Leu Leu Lys Asn Ala Val Arg Leu

65 70 75 8065 70 75 80

GGT ACC CGG CAA ATG TTG GGT TTT ATA CAA GGT TAT AGT GAT CTG TTT 288GGT ACC CGG CAA ATG TTG GGT TTT ATA CAA GGT TAT AGT GAT CTG TTT 288

Gly Thr Arg Gln Met Leu Gly Phe Ile Gln Gly Tyr Ser Asp Leu PheGly Thr Arg Gln Met Leu Gly Phe Ile Gln Gly Tyr Ser Asp Leu Phe

85 90 9585 90 95

GGT AAT CGT GCT GAT AAC TAT GCC GCG CCG GGC TCG GTT GCA TCG ATG 336GGT AAT CGT GCT GAT AAC TAT GCC GCG CCG GGC TCG GTT GCA TCG ATG 336

Gly Asn Arg Ala Asp Asn Tyr Ala Ala Pro Gly Ser Val Ala Ser MetGly Asn Arg Ala Asp Asn Tyr Ala Ala Pro Gly Ser Val Ala Ser Met

100 105 110100 105 110

TTC TCA CCG GCG GCT TAT TTG ACG GAA TTG TAC CGT GAA GCC AAA AAC 384TTC TCA CCG GCG GCT TAT TTG ACG GAA TTG TAC CGT GAA GCC AAA AAC 384

Phe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys AsnPhe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asn

115 120 125115 120 125

TTG CAT GAC AGC AGC TCA ATT TAT TAC CTA GAT AAA CGT CGC CCG GAT 432TTG CAT GAC AGC AGC TCA ATT TAT TAC CTA GAT AAA CGT CGC CCG GAT 432

Leu His Asp Ser Ser Ser Ile Tyr Tyr Leu Asp Lys Arg Arg Pro AspLeu His Asp Ser Ser Ser Ile Tyr Tyr Leu Asp Lys Arg Arg Pro Asp

130 135 140130 135 140

TTA GCA AGC TTA ATG CTC AGC CAG AAA AAT ATG GAT GAG GAA ATT TCA 480TTA GCA AGC TTA ATG CTC AGC CAG AAA AAT ATG GAT GAG GAA ATT TCA 480

Leu Ala Ser Leu Met Leu Ser Gln Lys Asn Met Asp Glu Glu Ile SerLeu Ala Ser Leu Met Leu Ser Gln Lys Asn Met Asp Glu Glu Ile Ser

145 150 155 160145 150 155 160

ACG CTG GCT CTC TCT AAT GAA TTG TGC CTT GCC GGG ATC GAA ACA AAA 528ACG CTG GCT CTC TCT AAT GAA TTG TGC CTT GCC GGG ATC GAA ACA AAA 528

Thr Leu Ala Leu Ser Asn Glu Leu Cys Leu Ala Gly Ile Glu Thr LysThr Leu Ala Leu Ser Asn Glu Leu Cys Leu Ala Gly Ile Glu Thr Lys

165 170 175165 170 175

ACA GGA AAA TCA CAA GAT GAA GTG ATG GAT ATG TTG TCA ACT TAT CGT 576ACA GGA AAA TCA CAA GAT GAA GTG ATG GAT ATG TTG TCA ACT TAT CGT 576

Thr Gly Lys Ser Gln Asp Glu Val Met Asp Met Leu Ser Thr Tyr ArgThr Gly Lys Ser Gln Asp Glu Val Met Asp Met Leu Ser Thr Tyr Arg

180 185 190180 185 190

TTA AGT GGA GAG ACA CCT TAT CAT CAC GCT TAT GAA ACT GTT CGT GAA 624TTA AGT GGA GAG ACA CCT TAT CAT CAC GCT TAT GAA ACT GTT CGT GAA 624

Leu Ser Gly Glu Thr Pro Tyr His His Ala Tyr Glu Thr Val Arg GluLeu Ser Gly Glu Thr Pro Tyr His His Ala Tyr Glu Thr Val Arg Glu

195 200 205195 200 205

ATC GTT CAT GAA CGT GAT CCA GGA TTT CGT CAT TTG TCA CAG GCA CCC 672ATC GTT CAT GAA CGT GAT CCA GGA TTT CGT CAT TTG TCA CAG GCA CCC 672

Ile Val His Glu Arg Asp Pro Gly Phe Arg His Leu Ser Gln Ala ProIle Val His Glu Arg Asp Pro Gly Phe Arg His Leu Ser Gln Ala Pro

210 215 220210 215 220

ATT GTT GCT GCT AAG CTC GAT CCT GTG ACT TTG TTG GGT ATT AGC TCC 720ATT GTT GCT GCT AAG CTC GAT CCT GTG ACT TTG TTG GGT ATT AGC TCC 720

Ile Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser SerIle Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser Ser

225 230 235 240225 230 235 240

CAT ATT TCG CCA GAA CTG TAT AAC TTG CTG ATT GAG GAG ATC CCG GAA 768CAT ATT TCG CCA GAA CTG TAT AAC TTG CTG ATT GAG GAG ATC CCG GAA 768

His Ile Ser Pro Glu Leu Tyr Asn Leu Leu Ile Glu Glu Ile Pro GluHis Ile Ser Pro Glu Leu Tyr Asn Leu Leu Ile Glu Glu Ile Pro Glu

245 250 255245 250 255

AAA GAT GAA GCC GCG CTT GAT ACG CTT TAT AAA ACA AAC TTT GGC GAT 816AAA GAT GAA GCC GCG CTT GAT ACG CTT TAT AAA ACA AAC TTT GGC GAT 816

Lys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly AspLys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly Asp

260 265 270260 265 270

ATT ACT ACT GCT CAG TTA ATG TCC CCA AGT TAT CTG GCC CGG TAT TAT 864ATT ACT ACT GCT CAG TTA ATG TCC CCA AGT TAT CTG GCC CGG TAT TAT 864

Ile Thr Thr Ala Gln Leu Met Ser Pro Ser Tyr Leu Ala Arg Tyr TyrIle Thr Thr Ala Gln Leu Met Ser Pro Ser Tyr Leu Ala Arg Tyr Tyr

275 280 285275 280 285

GGC GTC TCA CCG GAA GAT ATT GCC TAC GTG ACG ACT TCA TTA TCA CAT 912GGC GTC TCA CCG GAA GAT ATT GCC TAC GTG ACG ACT TCA TTA TCA CAT 912

Gly Val Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu Ser HisGly Val Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu Ser His

290 295 300290 295 300

GTT GGA TAT AGC AGT GAT ATT CTG GTT ATT CCG TTG GTC GAT GGT GTG 960GTT GGA TAT AGC AGT GAT ATT CTG GTT ATT CCG TTG GTC GAT GGT GTG 960

Val Gly Tyr Ser Ser Asp Ile Leu Val Ile Pro Leu Val Asp Gly ValVal Gly Tyr Ser Ser Asp Ile Leu Val Ile Pro Leu Val Asp Gly Val

305 310 315 320305 310 315 320

GGT AAG ATG GAA GTA GTT CGT GTT ACC CGA ACA CCA TCG GAT AAT TAT 1008GGT AAG ATG GAA GTA GTT CGT GTT ACC CGA ACA CCA TCG GAT AAT TAT 1008

Gly Lys Met Glu Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn TyrGly Lys Met Glu Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn Tyr

325 330 335325 330 335

ACC AGT CAG ACG AAT TAT ATT GAG CTG TAT CCA CAG GGT GGC GAC AAT 1056ACC AGT CAG ACG AAT TAT ATT GAG CTG TAT CCA CAG GGT GGC GAC AAT 1056

Thr Ser Gln Thr Asn Tyr Ile Glu Leu Tyr Pro Gln Gly Gly Asp AsnThr Ser Gln Thr Asn Tyr Ile Glu Leu Tyr Pro Gln Gly Gly Asp Asn

340 345 350340 345 350

TAT TTG ATC AAA TAC AAT CTA AGC AAT AGT TTT GGT TTG GAT GAT TTT 1104TAT TTG ATC AAA TAC AAT CTA AGC AAT AGT TTT GGT TTG GAT GAT TTT 1104

Tyr Leu Ile Lys Tyr Asn Leu Ser Asn Ser Phe Gly Leu Asp Asp PheTyr Leu Ile Lys Tyr Asn Leu Ser Asn Ser Phe Gly Leu Asp Asp Phe

355 360 365355 360 365

TAT CTG CAA TAT AAA GAT GGT TCC GCT GAT TGG ACT GAG ATT GCC CAT 1152TAT CTG CAA TAT AAA GAT GGT TCC GCT GAT TGG ACT GAG ATT GCC CAT 1152

Tyr Leu Gln Tyr Lys Asp Gly Ser Ala Asp Trp Thr Glu Ile Ala HisTyr Leu Gln Tyr Lys Asp Gly Ser Ala Asp Trp Thr Glu Ile Ala His

370 375 380370 375 380

AAT CCC TAT CCT GAT ATG GTC ATA AAT CAA AAG TAT GAA TCA CAG GCG 1200AAT CCC TAT CCT GAT ATG GTC ATA AAT CAA AAG TAT GAA TCA CAG GCG 1200

Asn Pro Tyr Pro Asp Met Val Ile Asn Gln Lys Tyr Glu Ser Gln AlaAsn Pro Tyr Pro Asp Met Val Ile Asn Gln Lys Tyr Glu Ser Gln Ala

385 390 395 400385 390 395 400

ACA ATC AAA CGT AGT GAC TCT GAC AAT ATA CTC AGT ATA GGG TTA CAA 1248ACA ATC AAA CGT AGT GAC TCT GAC AAT ATA CTC AGT ATA GGG TTA CAA 1248

Thr Ile Lys Arg Ser Asp Ser Asp Asn Ile Leu Ser Ile Gly Leu GlnThr Ile Lys Arg Ser Asp Ser Asp Asn Ile Leu Ser Ile Gly Leu Gln

405 410 415405 410 415

AGA TGG CAT AGC GGT AGT TAT AAT TTT GCC GCC GCC AAT TTT AAA ATT 1296AGA TGG CAT AGC GGT AGT TAT AAT TTT GCC GCC GCC AAT TTT AAA ATT 1296

Arg Trp His Ser Gly Ser Tyr Asn Phe Ala Ala Ala Asn Phe Lys IleArg Trp His Ser Gly Ser Tyr Asn Phe Ala Ala Ala Asn Phe Lys Ile

420 425 430420 425 430

GAC CAA TAC TCC CCG AAA GCT TTC CTG CTT AAA ATG AAT AAG GCT ATT 1344GAC CAA TAC TCC CCG AAA GCT TTC CTG CTT AAA ATG AAT AAG GCT ATT 1344

Asp Gln Tyr Ser Pro Lys Ala Phe Leu Leu Lys Met Asn Lys Ala IleAsp Gln Tyr Ser Pro Lys Ala Phe Leu Leu Lys Met Asn Lys Ala Ile

435 440 445435 440 445

CGG TTG CTC AAA GCT ACC GGC CTC TCT TTT GCT ACG TTG GAG CGT ATT 1392CGG TTG CTC AAA GCT ACC GGC CTC TCT TTT GCT ACG TTG GAG CGT ATT 1392

Arg Leu Leu Lys Ala Thr Gly Leu Ser Phe Ala Thr Leu Glu Arg IleArg Leu Leu Lys Ala Thr Gly Leu Ser Phe Ala Thr Leu Glu Arg Ile

450 455 460450 455 460

GTT GAT AGT GTT AAT AGC ACC AAA TCC ATC ACG GTT GAG GTA TTA AAC 1440GTT GAT AGT GTT AAT AGC ACC AAA TCC ATC ACG GTT GAG GTA TTA AAC 1440

Val Asp Ser Val Asn Ser Thr Lys Ser Ile Thr Val Glu Val Leu AsnVal Asp Ser Val Asn Ser Thr Lys Ser Ile Thr Val Glu Val Leu Asn

465 470 475 480465 470 475 480

AAG GTT TAT CGG GTA AAA TTC TAT ATT GAT CGT TAT GGC ATC AGT GAA 1488AAG GTT TAT CGG GTA AAA TTC TAT ATT GAT CGT TAT GGC ATC AGT GAA 1488

Lys Val Tyr Arg Val Lys Phe Tyr Ile Asp Arg Tyr Gly Ile Ser GluLys Val Tyr Arg Val Lys Phe Tyr Ile Asp Arg Tyr Gly Ile Ser Glu

485 490 495485 490 495

GAG ACA GCC GCT ATT TTG GCT AAT ATT AAT ATC TCT CAG CAA GCT GTT 1536GAG ACA GCC GCT ATT TTG GCT AAT ATT AAT ATC TCT CAG CAA GCT GTT 1536

Glu Thr Ala Ala Ile Leu Ala Asn Ile Asn Ile Ser Gln Gln Ala ValGlu Thr Ala Ala Ile Leu Ala Asn Ile Asn Ile Ser Gln Gln Ala Val

500 505 510500 505 510

GGC AAT CAG CTT AGC CAG TTT GAG CAA CTA TTT AAT CAC CCG CCG CTC 1584GGC AAT CAG CTT AGC CAG TTT GAG CAA CTA TTT AAT CAC CCG CCG CTC 1584

Gly Asn Gln Leu Ser Gln Phe Glu Gln Leu Phe Asn His Pro Pro LeuGly Asn Gln Leu Ser Gln Phe Glu Gln Leu Phe Asn His Pro Pro Leu

515 520 525515 520 525

AAT GGT ATT CGC TAT GAA ATC AGT GAG GAC AAC TCC AAA CAT CTT CCT 1632AAT GGT ATT CGC TAT GAA ATC AGT GAG GAC AAC TCC AAA CAT CTT CCT 1632

Asn Gly Ile Arg Tyr Glu Ile Ser Glu Asp Asn Ser Lys His Leu ProAsn Gly Ile Arg Tyr Glu Ile Ser Glu Asp Asn Ser Lys His Leu Pro

530 535 540530 535 540

AAT CCT GAT CTG AAC CTT AAA CCA GAC AGT ACC GGT GAT GAT CAA CGC 1680AAT CCT GAT CTG AAC CTT AAA CCA GAC AGT ACC GGT GAT GAT CAA CGC 1680

Asn Pro Asp Leu Asn Leu Lys Pro Asp Ser Thr Gly Asp Asp Gln ArgAsn Pro Asp Leu Asn Leu Lys Pro Asp Ser Thr Gly Asp Asp Gln Arg

545 550 555 560545 550 555 560

AAG GCG GTT TTA AAA CGC GCG TTT CAG GTT AAC GCC AGT GAG TTG TAT 1728AAG GCG GTT TTA AAA CGC GCG TTT CAG GTT AAC GCC AGT GAG TTG TAT 1728

Lys Ala Val Leu Lys Arg Ala Phe Gln Val Asn Ala Ser Glu Leu TyrLys Ala Val Leu Lys Arg Ala Phe Gln Val Asn Ala Ser Glu Leu Tyr

565 570 575565 570 575

CAG ATG TTA TTG ATC ACT GAT CGT AAA GAA GAC GGT GTT ATC AAA AAT 1776CAG ATG TTA TTG ATC ACT GAT CGT AAA GAA GAC GGT GTT ATC AAA AAT 1776

Gln Met Leu Leu Ile Thr Asp Arg Lys Glu Asp Gly Val Ile Lys AsnGln Met Leu Leu Ile Thr Asp Arg Lys Glu Asp Gly Val Ile Lys Asn

580 585 590580 585 590

AAC TTA GAG AAT TTG TCT GAT CTG TAT TTG GTT AGT TTG CTG GCC CAG 1824AAC TTA GAG AAT TTG TCT GAT CTG TAT TTG GTT AGT TTG CTG GCC CAG 1824

Asn Leu Glu Asn Leu Ser Asp Leu Tyr Leu Val Ser Leu Leu Ala GlnAsn Leu Glu Asn Leu Ser Asp Leu Tyr Leu Val Ser Leu Leu Ala Gln

595 600 605595 600 605

ATT CAT AAC CTG ACT ATT GCT GAA TTG AAC ATT TTG TTG GTG ATT TGT 1872ATT CAT AAC CTG ACT ATT GCT GAA TTG AAC ATT TTG TTG GTG ATT TGT 1872

Ile His Asn Leu Thr Ile Ala Glu Leu Asn Ile Leu Leu Val Ile CysIle His Asn Leu Thr Ile Ala Glu Leu Asn Ile Leu Leu Val Ile Cys

610 615 620610 615 620

GGC TAT GGC GAC ACC AAC ATT TAT CAG ATT ACC GAC GAT AAT TTA GCC 1920GGC TAT GGC GAC ACC AAC ATT TAT CAG ATT ACC GAC GAT AAT TTA GCC 1920

Gly Tyr Gly Asp Thr Asn Ile Tyr Gln Ile Thr Asp Asp Asn Leu AlaGly Tyr Gly Asp Thr Asn Ile Tyr Gln Ile Thr Asp Asp Asn Leu Ala

625 630 635 640625 630 635 640

AAA ATA GTG GAA ACA TTG TTG TGG ATC ACT CAA TGG TTG AAG ACC CAA 1968AAA ATA GTG GAA ACA TTG TTG TGG ATC ACT CAA TGG TTG AAG ACC CAA 1968

Lys Ile Val Glu Thr Leu Leu Trp Ile Thr Gln Trp Leu Lys Thr GlnLys Ile Val Glu Thr Leu Leu Trp Ile Thr Gln Trp Leu Lys Thr Gln

645 650 655645 650 655

AAA TGG ACA GTT ACC GAC CTG TTT CTG ATG ACC ACG GCC ACT TAC AGC 2016AAA TGG ACA GTT ACC GAC CTG TTT CTG ATG ACC ACG GCC ACT TAC AGC 2016

Lys Trp Thr Val Thr Asp Leu Phe Leu Met Thr Thr Ala Thr Tyr SerLys Trp Thr Val Thr Asp Leu Phe Leu Met Thr Thr Ala Thr Tyr Ser

660 665 670660 665 670

ACC ACT TTA ACG CCA GAA ATT AGC AAT CTG ACG GCT ACG TTG TCT TCA 2064ACC ACT TTA ACG CCA GAA ATT AGC AAT CTG ACG GCT ACG TTG TCT TCA 2064

Thr Thr Leu Thr Pro Glu Ile Ser Asn Leu Thr Ala Thr Leu Ser SerThr Thr Leu Thr Pro Glu Ile Ser Asn Leu Thr Ala Thr Leu Ser Ser

675 680 685675 680 685

ACT TTG CAT GGC AAA GAG AGT CTG ATT GGG GAA GAT CTG AAA AGA GCA 2112ACT TTG CAT GGC AAA GAG AGT CTG ATT GGG GAA GAT CTG AAA AGA GCA 2112

Thr Leu His Gly Lys Glu Ser Leu Ile Gly Glu Asp Leu Lys Arg AlaThr Leu His Gly Lys Glu Ser Leu Ile Gly Glu Asp Leu Lys Arg Ala

690 695 700690 695 700

ATG GCG CCT TGC TTC ACT TCG GCT TTG CAT TTG ACT TCT CAA GAA GTT 2160ATG GCG CCT TGC TTC ACT TCG GCT TTG CAT TTG ACT TCT CAA GAA GTT 2160

Met Ala Pro Cys Phe Thr Ser Ala Leu His Leu Thr Ser Gln Glu ValMet Ala Pro Cys Phe Thr Ser Ala Leu His Leu Thr Ser Gln Glu Val

705 710 715 720705 710 715 720

GCG TAT GAC CTG CTG TTG TGG ATA GAC CAG ATT CAA CCG GCA CAA ATA 2208GCG TAT GAC CTG CTG TTG TGG ATA GAC CAG ATT CAA CCG GCA CAA ATA 2208

Ala Tyr Asp Leu Leu Leu Trp Ile Asp Gln Ile Gln Pro Ala Gln IleAla Tyr Asp Leu Leu Leu Trp Ile Asp Gln Ile Gln Pro Ala Gln Ile

725 730 735725 730 735

ACT GTT GAT GGG TTT TGG GAA GAA GTG CAA ACA ACA CCA ACC AGC TTG 2256ACT GTT GAT GGG TTT TGG GAA GAA GTG CAA ACA ACA CCA ACC AGC TTG 2256

Thr Val Asp Gly Phe Trp Glu Glu Val Gln Thr Thr Pro Thr Ser LeuThr Val Asp Gly Phe Trp Glu Glu Val Gln Thr Thr Pro Thr Ser Leu

740 745 750740 745 750

AAG GTG ATT ACC TTT GCT CAG GTG CTG GCA CAA TTG AGC CTG ATC TAT 2304AAG GTG ATT ACC TTT GCT CAG GTG CTG GCA CAA TTG AGC CTG ATC TAT 2304

Lys Val Ile Thr Phe Ala Gln Val Leu Ala Gln Leu Ser Leu Ile TyrLys Val Ile Thr Phe Ala Gln Val Leu Ala Gln Leu Ser Leu Ile Tyr

755 760 765755 760 765

CGT CGT ATT GGG TTA AGT GAA ACG GAA CTG TCA CTG ATC GTG ACT CAA 2352CGT CGT ATT GGG TTA AGT GAA ACG GAA CTG TCA CTG ATC GTG ACT CAA 2352

Arg Arg Ile Gly Leu Ser Glu Thr Glu Leu Ser Leu Ile Val Thr GlnArg Arg Ile Gly Leu Ser Glu Thr Glu Leu Ser Leu Ile Val Thr Gln

770 775 780770 775 780

TCT TCT CTG CTA GTG GCA GGC AAA AGC ATA CTG GAT CAC GGT CTG TTA 2400TCT TCT CTG CTA GTG GCA GGC AAA AGC ATA CTG GAT CAC GGT CTG TTA 2400

Ser Ser Leu Leu Val Ala Gly Lys Ser Ile Leu Asp His Gly Leu LeuSer Ser Leu Leu Val Ala Gly Lys Ser Ile Leu Asp His Gly Leu Leu

785 790 795 800785 790 795 800

ACC CTG ATG GCC TTG GAA GGT TTT CAT ACC TGG GTT AAT GGC TTG GGG 2448ACC CTG ATG GCC TTG GAA GGT TTT CAT ACC TGG GTT AAT GGC TTG GGG 2448

Thr Leu Met Ala Leu Glu Gly Phe His Thr Trp Val Asn Gly Leu GlyThr Leu Met Ala Leu Glu Gly Phe His Thr Trp Val Asn Gly Leu Gly

805 810 815805 810 815

CAA CAT GCC TCC TTG ATA TTG GCG GCG TTG AAA GAC GGA GCC TTG ACA 2496CAA CAT GCC TCC TTG ATA TTG GCG GCG TTG AAA GAC GGA GCC TTG ACA 2496

Gln His Ala Ser Leu Ile Leu Ala Ala Leu Lys Asp Gly Ala Leu ThrGln His Ala Ser Leu Ile Leu Ala Ala Leu Lys Asp Gly Ala Leu Thr

820 825 830820 825 830

GTT ACC GAT GTA GCA CAA GCT ATG AAT AAG GAG GAA TCT CTC CTA CAA 2544GTT ACC GAT GTA GCA CAA GCT ATG AAT AAG GAG GAA TCT CTC CTA CAA 2544

Val Thr Asp Val Ala Gln Ala Met Asn Lys Glu Glu Ser Leu Leu GlnVal Thr Asp Val Ala Gln Ala Met Asn Lys Glu Glu Ser Leu Leu Gln

835 840 845835 840 845

ATG GCA GCT AAT CAG GTG GAG AAG GAT CTA ACA AAA CTG ACC AGT TGG 2592ATG GCA GCT AAT CAG GTG GAG AAG GAT CTA ACA AAA CTG ACC AGT TGG 2592

Met Ala Ala Asn Gln Val Glu Lys Asp Leu Thr Lys Leu Thr Ser TrpMet Ala Ala Asn Gln Val Glu Lys Asp Leu Thr Lys Leu Thr Ser Trp

850 855 860850 855 860

ACA CAG ATT GAC GCT ATT CTG CAA TGG TTA CAG ATG TCT TCG GCC TTG 2640ACA CAG ATT GAC GCT ATT CTG CAA TGG TTA CAG ATG TCT TCG GCC TTG 2640

Thr Gln Ile Asp Ala Ile Leu Gln Trp Leu Gln Met Ser Ser Ala LeuThr Gln Ile Asp Ala Ile Leu Gln Trp Leu Gln Met Ser Ser Ala Leu

865 870 875 880865 870 875 880

GCG GTT TCT CCA CTG GAT CTG GCA GGG ATG ATG GCC CTG AAA TAT GGG 2688GCG GTT TCT CCA CTG GAT CTG GCA GGG ATG ATG GCC CTG AAA TAT GGG 2688

Ala Val Ser Pro Leu Asp Leu Ala Gly Met Met Ala Leu Lys Tyr GlyAla Val Ser Pro Leu Asp Leu Ala Gly Met Met Ala Leu Lys Tyr Gly

885 890 895885 890 895

ATA GAT CAT AAC TAT GCT GCC TGG CAA GCT GCG GCG GCT GCG CTG ATG 2736ATA GAT CAT AAC TAT GCT GCC TGG CAA GCT GCG GCG GCT GCG CTG ATG 2736

Ile Asp His Asn Tyr Ala Ala Trp Gln Ala Ala Ala Ala Ala Leu MetIle Asp His Asn Tyr Ala Ala Trp Gln Ala Ala Ala Ala Ala Leu Met

900 905 910900 905 910

GCT GAT CAT GCT AAT CAG GCA CAG AAA AAA CTG GAT GAG ACG TTC AGT 2784GCT GAT CAT GCT AAT CAG GCA CAG AAA AAA CTG GAT GAG ACG TTC AGT 2784

Ala Asp His Ala Asn Gln Ala Gln Lys Lys Leu Asp Glu Thr Phe SerAla Asp His Ala Asn Gln Ala Gln Lys Lys Leu Asp Glu Thr Phe Ser

915 920 925915 920 925

AAG GCA TTA TGT AAC TAT TAT ATT AAT GCT GTT GTC GAT AGT GCT GCT 2832AAG GCA TTA TGT AAC TAT TAT ATT AAT GCT GTT GTC GAT AGT GCT GCT 2832

Lys Ala Leu Cys Asn Tyr Tyr Ile Asn Ala Val Val Asp Ser Ala AlaLys Ala Leu Cys Asn Tyr Tyr Ile Asn Ala Val Val Asp Ser Ala Ala

930 935 940930 935 940

GGA GTA CGT GAT CGT AAC GGT TTA TAT ACC TAT TTG CTG ATT GAT AAT 2880GGA GTA CGT GAT CGT AAC GGT TTA TAT ACC TAT TTG CTG ATT GAT AAT 2880

Gly Val Arg Asp Arg Asn Gly Leu Tyr Thr Tyr Leu Leu Ile Asp AsnGly Val Arg Asp Arg Asn Gly Leu Tyr Thr Tyr Leu Leu Ile Asp Asn

945 950 955 960945 950 955 960

CAG GTT TCT GCC GAT GTG ATC ACT TCA CGT ATT GCA GAA GCT ATC GCC 2928CAG GTT TCT GCC GAT GTG ATC ACT TCA CGT ATT GCA GAA GCT ATC GCC 2928

Gln Val Ser Ala Asp Val Ile Thr Ser Arg Ile Ala Glu Ala Ile AlaGln Val Ser Ala Asp Val Ile Thr Ser Arg Ile Ala Glu Ala Ile Ala

965 970 975965 970 975

GGT ATT CAA CTG TAC GTT AAC CGG GCT TTA AAC CGA GAT GAA GGT CAG 2976GGT ATT CAA CTG TAC GTT AAC CGG GCT TTA AAC CGA GAT GAA GGT CAG 2976

Gly Ile Gln Leu Tyr Val Asn Arg Ala Leu Asn Arg Asp Glu Gly GlnGly Ile Gln Leu Tyr Val Asn Arg Ala Leu Asn Arg Asp Glu Gly Gln

980 985 990980 985 990

CTT GCA TCG GAC GTT AGT ACC CGT CAG TTC TTC ACT GAC TGG GAA CGT 3024CTT GCA TCG GAC GTT AGT ACC CGT CAG TTC TTC ACT GAC TGG GAA CGT 3024

Leu Ala Ser Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Glu ArgLeu Ala Ser Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Glu Arg

995 1000 1005995 1000 1005

TAC AAT AAA CGT TAC AGT ACT TGG GCT GGT GTC TCT GAA CTG GTC TAT 3072TAC AAT AAA CGT TAC AGT ACT TGG GCT GGT GTC TCT GAA CTG GTC TAT 3072

Tyr Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Glu Leu Val TyrTyr Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Glu Leu Val Tyr

1010 1015 10201010 1015 1020

TAT CCA GAA AAC TAT GTT GAT CCC ACT CAG CGC ATT GGG CAA ACC AAA 3120TAT CCA GAA AAC TAT GTT GAT CCC ACT CAG CGC ATT GGG CAA ACC AAA 3120

Tyr Pro Glu Asn Tyr Val Asp Pro Thr Gln Arg Ile Gly Gln Thr LysTyr Pro Glu Asn Tyr Val Asp Pro Thr Gln Arg Ile Gly Gln Thr Lys

1025 1030 1035 10401025 1030 1035 1040

ATG ATG GAT GCG CTG TTG CAA TCC ATC AAC CAG AGC CAG CTA AAT GCG 3168ATG ATG GAT GCG CTG TTG CAA TCC ATC AAC CAG AGC CAG CTA AAT GCG 3168

Met Met Asp Ala Leu Leu Gln Ser Ile Asn Gln Ser Gln Leu Asn AlaMet Met Asp Ala Leu Leu Gln Ser Ile Asn Gln Ser Gln Leu Asn Ala

1045 1050 10551045 1050 1055

GAT ACG GTG GAA GAT GCT TTC AAA ACT TAT TTG ACC AGC TTT GAG CAG 3216GAT ACG GTG GAA GAT GCT TTC AAA ACT TAT TTG ACC AGC TTT GAG CAG 3216

Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Ser Phe Glu GlnAsp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Ser Phe Glu Gln

1060 1065 10701060 1065 1070

GTA GCA AAT CTG AAA GTA ATT AGT GCT TAC CAC GAT AAT GTG AAT GTG 3264GTA GCA AAT CTG AAA GTA ATT AGT GCT TAC CAC GAT AAT GTG AAT GTG 3264

Val Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Val Asn ValVal Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Val Asn Val

1075 1080 10851075 1080 1085

GAT CAA GGA TTA ACT TAT TTT ATC GGT ATC GAC CAA GCA GCT CCG GGT 3312GAT CAA GGA TTA ACT TAT TTT ATC GGT ATC GAC CAA GCA GCT CCG GGT 3312

Asp Gln Gly Leu Thr Tyr Phe Ile Gly Ile Asp Gln Ala Ala Pro GlyAsp Gln Gly Leu Thr Tyr Phe Ile Gly Ile Asp Gln Ala Ala Pro Gly

1090 1095 11001090 1095 1100

ACG TAT TAC TGG CGT AGT GTT GAT CAC AGC AAA TGT GAA AAT GGC AAG 3360ACG TAT TAC TGG CGT AGT GTT GAT CAC AGC AAA TGT GAA AAT GGC AAG 3360

Thr Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Cys Glu Asn Gly LysThr Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Cys Glu Asn Gly Lys

1105 1110 1115 11201105 1110 1115 1120

TTT GCC GCT AAT GCT TGG GGT GAG TGG AAT AAA ATT ACC TGT GCT GTC 3408TTT GCC GCT AAT GCT TGG GGT GAG TGG AAT AAA ATT ACC TGT GCT GTC 3408

Phe Ala Ala Asn Ala Trp Gly Glu Trp Asn Lys Ile Thr Cys Ala ValPhe Ala Ala Asn Ala Trp Gly Glu Trp Asn Lys Ile Thr Cys Ala Val

1125 1130 11351125 1130 1135

AAT CCT TGG AAA AAT ATC ATC CGT CCG GTT GTT TAT ATG TCC CGC TTA 3456AAT CCT TGG AAA AAT ATC ATC CGT CCG GTT GTT TAT ATG TCC CGC TTA 3456

Asn Pro Trp Lys Asn Ile Ile Arg Pro Val Val Tyr Met Ser Arg LeuAsn Pro Trp Lys Asn Ile Ile Arg Pro Val Val Tyr Met Ser Arg Leu

1140 1145 11501140 1145 1150

TAT CTG CTA TGG CTG GAG CAG CAA TCA AAG AAA AGT GAT GAT GGT AAA 3504TAT CTG CTA TGG CTG GAG CAG CAA TCA AAG AAA AGT GAT GAT GGT AAA 3504

Tyr Leu Leu Trp Leu Glu Gln Gln Ser Lys Lys Ser Asp Asp Gly LysTyr Leu Leu Trp Leu Glu Gln Gln Ser Lys Lys Ser Asp Asp Gly Lys

1155 1160 11651155 1160 1165

ACC ACG ATT TAT CAA TAT AAC TTA AAA CTG GCT CAT ATT CGT TAC GAC 3552ACC ACG ATT TAT CAA TAT AAC TTA AAA CTG GCT CAT ATT CGT TAC GAC 3552

Thr Thr Ile Tyr Gln Tyr Asn Leu Lys Leu Ala His Ile Arg Tyr AspThr Thr Ile Tyr Gln Tyr Asn Leu Lys Leu Ala His Ile Arg Tyr Asp

1170 1175 11801170 1175 1180

GGT AGT TGG AAT ACA CCA TTT ACT TTT GAT GTG ACA GAA AAG GTA AAA 3600GGT AGT TGG AAT ACA CCA TTT ACT TTT GAT GTG ACA GAA AAG GTA AAA 3600

Gly Ser Trp Asn Thr Pro Phe Thr Phe Asp Val Thr Glu Lys Val LysGly Ser Trp Asn Thr Pro Phe Thr Phe Asp Val Thr Glu Lys Val Lys

1185 1190 1195 12001185 1190 1195 1200

AAT TAC ACG TCG AGT ACT GAT GCT GCT GAA TCT TTA GGG TTG TAT TGT 3648AAT TAC ACG TCG AGT ACT GAT GCT GCT GAA TCT TTA GGG TTG TAT TGT 3648

Asn Tyr Thr Ser Ser Thr Asp Ala Ala Glu Ser Leu Gly Leu Tyr CysAsn Tyr Thr Ser Ser Thr Asp Ala Ala Glu Ser Leu Gly Leu Tyr Cys

1205 1210 12151205 1210 1215

ACT GGT TAT CAA GGG GAA GAC ACT CTA TTA GTT ATG TTC TAT TCG ATG 3696ACT GGT TAT CAA GGG GAA GAC ACT CTA TTA GTT ATG TTC TAT TCG ATG 3696

Thr Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Ser MetThr Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Ser Met

1220 1225 12301220 1225 1230

CAG AGT AGT TAT AGC TCC TAT ACC GAT AAT AAT GCG CCG GTC ACT GGG 3744CAG AGT AGT TAT AGC TCC TAT ACC GAT AAT AAT GCG CCG GTC ACT GGG 3744

Gln Ser Ser Tyr Ser Ser Tyr Thr Asp Asn Asn Ala Pro Val Thr GlyGln Ser Ser Tyr Ser Ser Tyr Thr Asp Asn Asn Ala Pro Val Thr Gly

1235 1240 12451235 1240 1245

CTA TAT ATT TTC GCT GAT ATG TCA TCA GAC AAT ATG ACG AAT GCA CAA 3792CTA TAT ATT TTC GCT GAT ATG TCA TCA GAC AAT ATG ACG AAT GCA CAA 3792

Leu Tyr Ile Phe Ala Asp Met Ser Ser Asp Asn Met Thr Asn Ala GlnLeu Tyr Ile Phe Ala Asp Met Ser Ser Asp Asn Met Thr Asn Ala Gln

1250 1255 12601250 1255 1260

GCA ACT AAC TAT TGG AAT AAC AGT TAT CCG CAA TTT GAT ACT GTG ATG 3840GCA ACT AAC TAT TGG AAT AAC AGT TAT CCG CAA TTT GAT ACT GTG ATG 3840

Ala Thr Asn Tyr Trp Asn Asn Ser Tyr Pro Gln Phe Asp Thr Val MetAla Thr Asn Tyr Trp Asn Asn Ser Tyr Pro Gln Phe Asp Thr Val Met

1265 1270 1275 12801265 1270 1275 1280

GCA GAT CCG GAT AGC GAC AAT AAA AAA GTC ATA ACC AGA AGA GTT AAT 3888GCA GAT CCG GAT AGC GAC AAT AAA AAA GTC ATA ACC AGA AGA GTT AAT 3888

Ala Asp Pro Asp Ser Asp Asn Lys Lys Val Ile Thr Arg Arg Val AsnAla Asp Pro Asp Ser Asp Asn Lys Lys Val Ile Thr Arg Arg Val Asn

1285 1290 12951285 1290 1295

AAC CGT TAT GCG GAG GAT TAT GAA ATT CCT TCC TCT GTG ACA AGT AAC 3936AAC CGT TAT GCG GAG GAT TAT GAA ATT CCT TCC TCT GTG ACA AGT AAC 3936

Asn Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Thr Ser AsnAsn Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Thr Ser Asn

1300 1305 13101300 1305 1310

AGT AAT TAT TCT TGG GGT GAT CAC AGT TTA ACC ATG CTT TAT GGT GGT 3984AGT AAT TAT TCT TGG GGT GAT CAC AGT TTA ACC ATG CTT TAT GGT GGT 3984

Ser Asn Tyr Ser Trp Gly Asp His Ser Leu Thr Met Leu Tyr Gly GlySer Asn Tyr Ser Trp Gly Asp His Ser Leu Thr Met Leu Tyr Gly Gly

1315 1320 13251315 1320 1325

AGT GTT CCT AAT ATT ACT TTT GAA TCG GCG GCA GAA GAT TTA AGG CTA 4032AGT GTT CCT AAT ATT ACT TTT GAA TCG GCG GCA GAA GAT TTA AGG CTA 4032

Ser Val Pro Asn Ile Thr Phe Glu Ser Ala Ala Glu Asp Leu Arg LeuSer Val Pro Asn Ile Thr Phe Glu Ser Ala Ala Glu Asp Leu Arg Leu

1330 1335 13401330 1335 1340

TCT ACC AAT ATG GCA TTG AGT ATT ATT CAT AAT GGA TAT GCG GGA ACC 4080TCT ACC AAT ATG GCA TTG AGT ATT ATT CAT AAT GGA TAT GCG GGA ACC 4080

Ser Thr Asn Met Ala Leu Ser Ile Ile His Asn Gly Tyr Ala Gly ThrSer Thr Asn Met Ala Leu Ser Ile Ile His Asn Gly Tyr Ala Gly Thr

1345 1350 1355 13601345 1350 1355 1360

CGC CGT ATA CAA TGT AAT CTT ATG AAA CAA TAC GCT TCA TTA GGT GAT 4128CGC CGT ATA CAA TGT AAT CTT ATG AAA CAA TAC GCT TCA TTA GGT GAT 4128

Arg Arg Ile Gln Cys Asn Leu Met Lys Gln Tyr Ala Ser Leu Gly AspArg Arg Ile Gln Cys Asn Leu Met Lys Gln Tyr Ala Ser Leu Gly Asp

1365 1370 13751365 1370 1375

AAA TTT ATA ATT TAT GAT TCA TCA TTT GAT GAT GCA AAC CGT TTT AAT 4176AAA TTT ATA ATT TAT GAT TCA TCA TTT GAT GAT GCA AAC CGT TTT AAT 4176

Lys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe AsnLys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe Asn

1380 1385 13901380 1385 1390

CTG GTG CCA TTG TTT AAA TTC GGA AAA GAC GAG AAC TCA GAT GAT AGT 4224CTG GTG CCA TTG TTT AAA TTC GGA AAA GAC GAG AAC TCA GAT GAT AGT 4224

Leu Val Pro Leu Phe Lys Phe Gly Lys Asp Glu Asn Ser Asp Asp SerLeu Val Pro Leu Phe Lys Phe Gly Lys Asp Glu Asn Ser Asp Asp Ser

1395 1400 14051395 1400 1405

ATT TGT ATA TAT AAT GAA AAC CCT TCC TCT GAA GAT AAG AAG TGG TAT 4272ATT TGT ATA TAT AAT GAA AAC CCT TCC TCT GAA GAT AAG AAG TGG TAT 4272

Ile Cys Ile Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp TyrIle Cys Ile Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp Tyr

1410 1415 14201410 1415 1420

TTT TCT TCG AAA GAT GAC AAT AAA ACA GCG GAT TAT AAT GGT GGA ACT 4320TTT TCT TCG AAA GAT GAC AAT AAA ACA GCG GAT TAT AAT GGT GGA ACT 4320

Phe Ser Ser Lys Asp Asp Asn Lys Thr Ala Asp Tyr Asn Gly Gly ThrPhe Ser Ser Lys Asp Asp Asn Lys Thr Ala Asp Tyr Asn Gly Gly Thr

1425 1430 1435 14401425 1430 1435 1440

CAA TGT ATA GAT GCT GGA ACC AGT AAC AAA GAT TTT TAT TAT AAT CTC 4368CAA TGT ATA GAT GCT GGA ACC AGT AAC AAA GAT TTT TAT TAT AAT CTC 4368

Gln Cys Ile Asp Ala Gly Thr Ser Asn Lys Asp Phe Tyr Tyr Asn LeuGln Cys Ile Asp Ala Gly Thr Ser Asn Lys Asp Phe Tyr Tyr Asn Leu

1445 1450 14551445 1450 1455

CAG GAG ATT GAA GTA ATT AGT GTT ACT GGT GGG TAT TGG TCG AGT TAT 4416CAG GAG ATT GAA GTA ATT AGT GTT ACT GGT GGG TAT TGG TCG AGT TAT 4416

Gln Glu Ile Glu Val Ile Ser Val Thr Gly Gly Tyr Trp Ser Ser TyrGln Glu Ile Glu Val Ile Ser Val Thr Gly Gly Tyr Trp Ser Ser Tyr

1460 1465 14701460 1465 1470

AAA ATA TCC AAC CCG ATT AAT ATC AAT ACG GGC ATT GAT AGT GCT AAA 4464AAA ATA TCC AAC CCG ATT AAT ATC AAT ACG GGC ATT GAT AGT GCT AAA 4464

Lys Ile Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala LysLys Ile Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala Lys

1475 1480 14851475 1480 1485

GTA AAA GTC ACC GTA AAA GCG GGT GGT GAC GAT CAA ATC TTT ACT GCT 4512GTA AAA GTC ACC GTA AAA GCG GGT GGT GAC GAT CAA ATC TTT ACT GCT 4512

Val Lys Val Thr Val Lys Ala Gly Gly Asp Asp Gln Ile Phe Thr AlaVal Lys Val Thr Val Lys Ala Gly Gly Asp Asp Gln Ile Phe Thr Ala

1490 1495 15001490 1495 1500

GAT AAT AGT ACC TAT GTT CCT CAG CAA CCG GCA CCC AGT TTT GAG GAG 4560GAT AAT AGT ACC TAT GTT CCT CAG CAA CCG GCA CCC AGT TTT GAG GAG 4560

Asp Asn Ser Thr Tyr Val Pro Gln Gln Pro Ala Pro Ser Phe Glu GluAsp Asn Ser Thr Tyr Val Pro Gln Gln Pro Ala Pro Ser Phe Glu Glu

1505 1510 1515 15201505 1510 1515 1520

ATG ATT TAT CAG TTC AAT AAC CTG ACA ATA GAT TGT AAG AAT TTA AAT 4608ATG ATT TAT CAG TTC AAT AAC CTG ACA ATA GAT TGT AAG AAT TTA AAT 4608

Met Ile Tyr Gln Phe Asn Asn Leu Thr Ile Asp Cys Lys Asn Leu AsnMet Ile Tyr Gln Phe Asn Asn Leu Thr Ile Asp Cys Lys Asn Leu Asn

1525 1530 15351525 1530 1535

TTC ATC GAC AAT CAG GCA CAT ATT GAG ATT GAT TTC ACC GCT ACG GCA 4656TTC ATC GAC AAT CAG GCA CAT ATT GAG ATT GAT TTC ACC GCT ACG GCA 4656

Phe Ile Asp Asn Gln Ala His Ile Glu Ile Asp Phe Thr Ala Thr AlaPhe Ile Asp Asn Gln Ala His Ile Glu Ile Asp Phe Thr Ala Thr Ala

1540 1545 15501540 1545 1550

CAA GAT GGC CGA TTC TTG GGT GCA GAA ACT TTT ATT ATC CCG GTA ACT 4704CAA GAT GGC CGA TTC TTG GGT GCA GAA ACT TTT ATT ATC CCG GTA ACT 4704

Gln Asp Gly Arg Phe Leu Gly Ala Glu Thr Phe Ile Ile Pro Val ThrGln Asp Gly Arg Phe Leu Gly Ala Glu Thr Phe Ile Ile Pro Val Thr

1555 1560 15651555 1560 1565

AAA AAA GTT CTC GGT ACT GAG AAC GTG ATT GCG TTA TAT AGC GAA AAT 4752AAA AAA GTT CTC GGT ACT GAG AAC GTG ATT GCG TTA TAT AGC GAA AAT 4752

Lys Lys Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu AsnLys Lys Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu Asn

1570 1575 15801570 1575 1580

AAC GGT GTT CAA TAT ATG CAA ATT GGC GCA TAT CGT ACC CGT TTG AAT 4800AAC GGT GTT CAA TAT ATG CAA ATT GGC GCA TAT CGT ACC CGT TTG AAT 4800

Asn Gly Val Gln Tyr Met Gln Ile Gly Ala Tyr Arg Thr Arg Leu AsnAsn Gly Val Gln Tyr Met Gln Ile Gly Ala Tyr Arg Thr Arg Leu Asn

1585 1590 1595 16001585 1590 1595 1600

ACG TTA TTC GCT CAA CAG TTG GTT AGC CGT GCT AAT CGT GGC ATT GAT 4848ACG TTA TTC GCT CAA CAG TTG GTT AGC CGT GCT AAT CGT GGC ATT GAT 4848

Thr Leu Phe Ala Gln Gln Leu Val Ser Arg Ala Asn Arg Gly Ile AspThr Leu Phe Ala Gln Gln Leu Val Ser Arg Ala Asn Arg Gly Ile Asp

1605 1610 16151605 1610 1615

GCA GTG CTC AGT ATG GAA ACT CAG AAT ATT CAG GAA CCG CAA TTA GGA 4896GCA GTG CTC AGT ATG GAA ACT CAG AAT ATT CAG GAA CCG CAA TTA GGA 4896

Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu GlyAla Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly

1620 1625 16301620 1625 1630

GCG GGC ACA TAT GTG CAG CTT GTG TTG GAT AAA TAT GAT GAG TCT ATT 4944GCG GGC ACA TAT GTG CAG CTT GTG TTG GAT AAA TAT GAT GAG TCT ATT 4944

Ala Gly Thr Tyr Val Gln Leu Val Leu Asp Lys Tyr Asp Glu Ser IleAla Gly Thr Tyr Val Gln Leu Val Leu Asp Lys Tyr Asp Glu Ser Ile

1635 1640 16451635 1640 1645

CAT GGC ACT AAT AAA AGC TTT GCT ATT GAA TAT GTT GAT ATA TTT AAA 4992CAT GGC ACT AAT AAA AGC TTT GCT ATT GAA TAT GTT GAT ATA TTT AAA 4992

His Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe LysHis Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe Lys

1650 1655 16601650 1655 1660

GAG AAC GAT AGT TTT GTG ATT TAT CAA GGA GAA CTT AGC GAA ACA AGT 5040GAG AAC GAT AGT TTT GTG ATT TAT CAA GGA GAA CTT AGC GAA ACA AGT 5040

Glu Asn Asp Ser Phe Val Ile Tyr Gln Gly Glu Leu Ser Glu Thr SerGlu Asn Asp Ser Phe Val Ile Tyr Gln Gly Glu Leu Ser Glu Thr Ser

1665 1670 1675 16801665 1670 1675 1680

CAA ACT GTT GTG AAA GTT TTC TTA TCC TAT TTT ATA GAG GCG ACT GGA 5088CAA ACT GTT GTG AAA GTT TTC TTA TCC TAT TTT ATA GAG GCG ACT GGA 5088

Gln Thr Val Val Lys Val Phe Leu Ser Tyr Phe Ile Glu Ala Thr GlyGln Thr Val Val Lys Val Phe Leu Ser Tyr Phe Ile Glu Ala Thr Gly

1685 1690 16951685 1690 1695

AAT AAG AAC CAC TTA TGG GTA CGT GCT AAA TAC CAA AAG GAA ACG ACT 5136AAT AAG AAC CAC TTA TGG GTA CGT GCT AAA TAC CAA AAG GAA ACG ACT 5136

Asn Lys Asn His Leu Trp Val Arg Ala Lys Tyr Gln Lys Glu Thr ThrAsn Lys Asn His Leu Trp Val Arg Ala Lys Tyr Gln Lys Glu Thr Thr

1700 1705 17101700 1705 1710

GAT AAG ATC TTG TTC GAC CGT ACT GAT GAG AAA GAT CCG CAC GGT TGG 5184GAT AAG ATC TTG TTC GAC CGT ACT GAT GAG AAA GAT CCG CAC GGT TGG 5184

Asp Lys Ile Leu Phe Asp Arg Thr Asp Glu Lys Asp Pro His Gly TrpAsp Lys Ile Leu Phe Asp Arg Thr Asp Glu Lys Asp Pro His Gly Trp

1715 1720 17251715 1720 1725

TTT CTC AGC GAC GAT CAC AAG ACC TTT AGT GGT CTC TCT TCC GCA CAG 5232TTT CTC AGC GAC GAT CAC AAG ACC TTT AGT GGT CTC TCT TCC GCA CAG 5232

Phe Leu Ser Asp Asp His Lys Thr Phe Ser Gly Leu Ser Ser Ala GlnPhe Leu Ser Asp Asp His Lys Thr Phe Ser Gly Leu Ser Ser Ala Gln

1730 1735 17401730 1735 1740

GCA TTA AAG AAC GAC AGT GAA CCG ATG GAT TTC TCT GGC GCC AAT GCT 5280GCA TTA AAG AAC GAC AGT GAA CCG ATG GAT TTC TCT GGC GCC AAT GCT 5280

Ala Leu Lys Asn Asp Ser Glu Pro Met Asp Phe Ser Gly Ala Asn AlaAla Leu Lys Asn Asp Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ala

1745 1750 1755 17601745 1750 1755 1760

CTC TAT TTC TGG GAA CTG TTC TAT TAC ACG CCG ATG ATG ATG GCT CAT 5328CTC TAT TTC TGG GAA CTG TTC TAT TAC ACG CCG ATG ATG ATG GCT CAT 5328

Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro Met Met Met Ala HisLeu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro Met Met Met Ala His

1765 1770 17751765 1770 1775

CGT TTG TTG CAG GAA CAG AAT TTT GAT GCG GCG AAC CAT TGG TTC CGT 5376CGT TTG TTG CAG GAA CAG AAT TTT GAT GCG GCG AAC CAT TGG TTC CGT 5376

Arg Leu Leu Gln Glu Gln Asn Phe Asp Ala Ala Asn His Trp Phe ArgArg Leu Leu Gln Glu Gln Asn Phe Asp Ala Ala Asn His Trp Phe Arg

1780 1785 17901780 1785 1790

TAT GTC TGG AGT CCA TCC GGT TAT ATC GTT GAT GGT AAA ATT GCT ATC 5424TAT GTC TGG AGT CCA TCC GGT TAT ATC GTT GAT GGT AAA ATT GCT ATC 5424

Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val Asp Gly Lys Ile Ala IleTyr Val Trp Ser Pro Ser Gly Tyr Ile Val Asp Gly Lys Ile Ala Ile

1795 1800 18051795 1800 1805

TAC CAC TGG AAC GTG CGA CCG CTG GAA GAA GAC ACC AGT TGG AAT GCA 5472TAC CAC TGG AAC GTG CGA CCG CTG GAA GAA GAC ACC AGT TGG AAT GCA 5472

Tyr His Trp Asn Val Arg Pro Leu Glu Glu Asp Thr Ser Trp Asn AlaTyr His Trp Asn Val Arg Pro Leu Glu Glu Asp Thr Ser Trp Asn Ala

1810 1815 18201810 1815 1820

CAA CAA CTG GAC TCC ACC GAT CCA GAT GCT GTA GCC CAA GAT GAT CCG 5520CAA CAA CTG GAC TCC ACC GAT CCA GAT GCT GTA GCC CAA GAT GAT CCG 5520

Gln Gln Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln Asp Asp ProGln Gln Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln Asp Asp Pro

1825 1830 1835 18401825 1830 1835 1840

ATG CAC TAC AAG GTG GCT ACC TTT ATG GCG ACG TTG GAT CTG CTA ATG 5568ATG CAC TAC AAG GTG GCT ACC TTT ATG GCG ACG TTG GAT CTG CTA ATG 5568

Met His Tyr Lys Val Ala Thr Phe Met Ala Thr Leu Asp Leu Leu MetMet His Tyr Lys Val Ala Thr Phe Met Ala Thr Leu Asp Leu Leu Met

1845 1850 18551845 1850 1855

GCC CGT GGT GAT GCT GCT TAC CGC CAG TTA GAG CGT GAT ACG TTG GCT 5616GCC CGT GGT GAT GCT GCT TAC CGC CAG TTA GAG CGT GAT ACG TTG GCT 5616

Ala Arg Gly Asp Ala Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu AlaAla Arg Gly Asp Ala Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Ala

1860 1865 18701860 1865 1870

GAA GCT AAA ATG TGG TAT ACA CAG GCG CTT AAT CTG TTG GGT GAT GAG 5664GAA GCT AAA ATG TGG TAT ACA CAG GCG CTT AAT CTG TTG GGT GAT GAG 5664

Glu Ala Lys Met Trp Tyr Thr Gln Ala Leu Asn Leu Leu Gly Asp GluGlu Ala Lys Met Trp Tyr Thr Gln Ala Leu Asn Leu Leu Gly Asp Glu

1875 1880 18851875 1880 1885

CCA CAA GTG ATG CTG AGT ACG ACT TGG GCT AAT CCA ACA TTG GGT AAT 5712CCA CAA GTG ATG CTG AGT ACG ACT TGG GCT AAT CCA ACA TTG GGT AAT 5712

Pro Gln Val Met Leu Ser Thr Thr Trp Ala Asn Pro Thr Leu Gly AsnPro Gln Val Met Leu Ser Thr Thr Trp Ala Asn Pro Thr Leu Gly Asn

1890 1895 19001890 1895 1900

GCT GCT TCA AAA ACC ACA CAG CAG GTT CGT CAG CAA GTG CTT ACC CAG 5760GCT GCT TCA AAA ACC ACA CAG CAG GTT CGT CAG CAA GTG CTT ACC CAG 5760

Ala Ala Ser Lys Thr Thr Gln Gln Val Arg Gln Gln Val Leu Thr GlnAla Ala Ser Lys Thr Thr Gln Gln Val Arg Gln Gln Val Leu Thr Gln

1905 1910 1915 19201905 1910 1915 1920

TTG CGT CTC AAT AGC AGG GTA AAA ACC CCG TTG CTA GGA ACA GCC AAT 5808TTG CGT CTC AAT AGC AGG GTA AAA ACC CCG TTG CTA GGA ACA GCC AAT 5808

Leu Arg Leu Asn Ser Arg Val Lys Thr Pro Leu Leu Gly Thr Ala AsnLeu Arg Leu Asn Ser Arg Val Lys Thr Pro Leu Leu Gly Thr Ala Asn

1925 1930 19351925 1930 1935

TCC CTG ACC GCT TTA TTC CTG CCG CAG GAA AAT AGC AAG CTC AAA GGC 5856TCC CTG ACC GCT TTA TTC CTG CCG CAG GAA AAT AGC AAG CTC AAA GGC 5856

Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn Ser Lys Leu Lys GlySer Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn Ser Lys Leu Lys Gly

1940 1945 19501940 1945 1950

TAC TGG CGG ACA CTG GCG CAG CGT ATG TTT AAT TTA CGT CAT AAT CTG 5904TAC TGG CGG ACA CTG GCG CAG CGT ATG TTT AAT TTA CGT CAT AAT CTG 5904

Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn Leu Arg His Asn LeuTyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn Leu Arg His Asn Leu

1955 1960 19651955 1960 1965

TCG ATT GAC GGC CAG CCG CTC TCC TTG CCG CTG TAT GCT AAA CCG GCT 5952TCG ATT GAC GGC CAG CCG CTC TCC TTG CCG CTG TAT GCT AAA CCG GCT 5952

Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu Tyr Ala Lys Pro AlaSer Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu Tyr Ala Lys Pro Ala

1970 1975 19801970 1975 1980

GAT CCA AAA GCT TTA CTG AGT GCG GCG GTT TCA GCT TCT CAA GGG GGA 6000GAT CCA AAA GCT TTA CTG AGT GCG GCG GTT TCA GCT TCT CAA GGG GGA 6000

Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser Ala Ser Gln Gly GlyAsp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser Ala Ser Gln Gly Gly

1985 1990 1995 20001985 1990 1995 2000

GCC GAC TTG CCG AAG GCG CCG CTG ACT ATT CAC CGC TTC CCT CAA ATG 6048GCC GAC TTG CCG AAG GCG CCG CTG ACT ATT CAC CGC TTC CCT CAA ATG 6048

Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile His Arg Phe Pro Gln MetAla Asp Leu Pro Lys Ala Pro Leu Thr Ile His Arg Phe Pro Gln Met

2005 2010 20152005 2010 2015

CTA GAA GGG GCA CGG GGC TTG GTT AAC CAG CTT ATA CAG TTC GGT AGT 6096CTA GAA GGG GCA CGG GGC TTG GTT AAC CAG CTT ATA CAG TTC GGT AGT 6096

Leu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu Ile Gln Phe Gly SerLeu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu Ile Gln Phe Gly Ser

2020 2025 20302020 2025 2030

TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG GAA GCT ATG AGT CAA 6144TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG GAA GCT ATG AGT CAA 6144

Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala Glu Ala Met Ser GlnSer Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala Glu Ala Met Ser Gln

2035 2040 20452035 2040 2045

CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG ACC AGT ATT CGT ATG 6192CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG ACC AGT ATT CGT ATG 6192

Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu Thr Ser Ile Arg MetLeu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu Thr Ser Ile Arg Met

2050 2055 20602050 2055 2060

CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA AAA ACC GCC TTG CAA 6240CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA AAA ACC GCC TTG CAA 6240

Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu Lys Thr Ala Leu GlnGln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu Lys Thr Ala Leu Gln

2065 2070 2075 20802065 2070 2075 2080

GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC AGC TAT AGC CAA CTG 6288GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC AGC TAT AGC CAA CTG 6288

Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp Ser Tyr Ser Gln LeuVal Ser Leu Ala Gly Val Gln Gln Arg Phe Asp Ser Tyr Ser Gln Leu

2085 2090 20952085 2090 2095

TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CGA GCG CTG GCG TTA CGC 6336TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CGA GCG CTG GCG TTA CGC 6336

Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg Ala Leu Ala Leu ArgTyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg Ala Leu Ala Leu Arg

2100 2105 21102100 2105 2110

TCA GAA TCT GCT ATT GAG TCT CAG GGA GCG CAG ATT TCC CGT ATG GCA 6384TCA GAA TCT GCT ATT GAG TCT CAG GGA GCG CAG ATT TCC CGT ATG GCA 6384

Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln Ile Ser Arg Met AlaSer Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln Ile Ser Arg Met Ala

2115 2120 21252115 2120 2125

GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC GGC CTG GCT GAT GGC 6432GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC GGC CTG GCT GAT GGC 6432

Gly Ala Gly Val Asp Met Ala Pro Asn Ile Phe Gly Leu Ala Asp GlyGly Ala Gly Val Asp Met Ala Pro Asn Ile Phe Gly Leu Ala Asp Gly

2130 2135 21402130 2135 2140

GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC GCT GAC GGT ATT GAG 6480GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC GCT GAC GGT ATT GAG 6480

Gly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile Ala Asp Gly Ile GluGly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile Ala Asp Gly Ile Glu

2145 2150 2155 21602145 2150 2155 2160

TTG AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG AAA GTT GCT CAG TCG 6528TTG AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG AAA GTT GCT CAG TCG 6528

Leu Ser Ala Ser Ala Lys Met Val Asp Ala Glu Lys Val Ala Gln SerLeu Ser Ala Ser Ala Lys Met Val Asp Ala Glu Lys Val Ala Gln Ser

2165 2170 21752165 2170 2175

GAA ATA TAT CGC CGT CGC CGT CAA GAA TGG AAA ATT CAG CGT GAC AAC 6576GAA ATA TAT CGC CGT CGC CGT CAA GAA TGG AAA ATT CAG CGT GAC AAC 6576

Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp AsnGlu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp Asn

2180 2185 21902180 2185 2190

GCA CAA GCG GAG ATT AAC CAG TTA AAC GCG CAA CTG GAA TCA CTG TCT 6624GCA CAA GCG GAG ATT AAC CAG TTA AAC GCG CAA CTG GAA TCA CTG TCT 6624

Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln Leu Glu Ser Leu SerAla Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln Leu Glu Ser Leu Ser

2195 2200 22052195 2200 2205

ATT CGC CGT GAA GCC GCT GAA ATG CAA AAA GAG TAC CTG AAA ACC CAG 6672ATT CGC CGT GAA GCC GCT GAA ATG CAA AAA GAG TAC CTG AAA ACC CAG 6672

Ile Arg Arg Glu Ala Ala Glu Met Gln Lys Glu Tyr Leu Lys Thr GlnIle Arg Arg Glu Ala Ala Glu Met Gln Lys Glu Tyr Leu Lys Thr Gln

2210 2215 22202210 2215 2220

CAA GCT CAG GCG CAG GCA CAA CTT ACT TTC TTA AGA AGC AAA TTC AGT 6720CAA GCT CAG GCG CAG GCA CAA CTT ACT TTC TTA AGA AGC AAA TTC AGT 6720

Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu Arg Ser Lys Phe SerGln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu Arg Ser Lys Phe Ser

2225 2230 2235 22402225 2230 2235 2240

AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG CGT TTG TCA GGT ATT TAT 6768AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG CGT TTG TCA GGT ATT TAT 6768

Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg Leu Ser Gly Ile TyrAsn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg Leu Ser Gly Ile Tyr

2245 2250 22552245 2250 2255

TTC CAG TTC TAT GAC TTG GCC GTA TCA CGT TGC CTG ATG GCA GAG CAA 6816TTC CAG TTC TAT GAC TTG GCC GTA TCA CGT TGC CTG ATG GCA GAG CAA 6816

Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys Leu Met Ala Glu GlnPhe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys Leu Met Ala Glu Gln

2260 2265 22702260 2265 2270

TCC TAT CAA TGG GAA GCT AAT GAT AAT TCC ATT AGC TTT GTC AAA CCG 6864TCC TAT CAA TGG GAA GCT AAT GAT AAT TCC ATT AGC TTT GTC AAA CCG 6864

Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile Ser Phe Val Lys ProSer Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile Ser Phe Val Lys Pro

2275 2280 22852275 2280 2285

GGT GCA TGG CAA GGA ACT TAC GCC GGC TTA TTG TGT GGA GAA GCT TTG 6912GGT GCA TGG CAA GGA ACT TAC GCC GGC TTA TTG TGT GGA GAA GCT TTG 6912

Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Cys Gly Glu Ala LeuGly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Cys Gly Glu Ala Leu

2290 2295 23002290 2295 2300

ATA CAA AAT CTG GCA CAA ATG GAA GAG GCA TAT CTG AAA TGG GAA TCT 6960ATA CAA AAT CTG GCA CAA ATG GAA GAG GCA TAT CTG AAA TGG GAA TCT 6960

Ile Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr Leu Lys Trp Glu SerIle Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr Leu Lys Trp Glu Ser

2305 2310 2315 23202305 2310 2315 2320

CGC GCT TTG GAA GTA GAA CGC ACG GTT TCA TTG GCA GTG GTT TAT GAT 7008CGC GCT TTG GAA GTA GAA CGC ACG GTT TCA TTG GCA GTG GTT TAT GAT 7008

Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Val Val Tyr AspArg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Val Val Tyr Asp

2325 2330 23352325 2330 2335

TCA CTG GAA GGT AAT GAT CGT TTT AAT TTA GCG GAA CAA ATA CCT GCA 7056TCA CTG GAA GGT AAT GAT CGT TTT AAT TTA GCG GAA CAA ATA CCT GCA 7056

Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala Glu Gln Ile Pro AlaSer Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala Glu Gln Ile Pro Ala

2340 2345 23502340 2345 2350

TTA TTG GAT AAG GGG GAG GGA ACA GCA GGA ACT AAA GAA AAT GGG TTA 7104TTA TTG GAT AAG GGG GAG GGA ACA GCA GGA ACT AAA GAA AAT GGG TTA 7104

Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr Lys Glu Asn Gly LeuLeu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr Lys Glu Asn Gly Leu

2355 2360 23652355 2360 2365

TCA TTG GCT AAT GCT ATC CTG TCA GCT TCG GTC AAA TTG TCC GAC TTG 7152TCA TTG GCT AAT GCT ATC CTG TCA GCT TCG GTC AAA TTG TCC GAC TTG 7 152

Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser Val Lys Leu Ser Asp LeuSer Leu Ala Asn Ala Ile Leu Ser Ala Ser Val Lys Leu Ser Asp Leu

2370 2375 23802370 2375 2380

AAA CTG GGA ACG GAT TAT CCA GAC AGT ATC GTT GGT AGC AAC AAG GTT 7200AAA CTG GGA ACG GAT TAT CCA GAC AGT ATC GTT GGT AGC AAC AAG GTT 7200

Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val Gly Ser Asn Lys ValLys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val Gly Ser Asn Lys Val

2385 2390 2395 24002385 2390 2395 2400

CGT CGT ATT AAG CAA ATC AGT GTT TCG CTA CCT GCA TTG GTT GGG CCT 7248CGT CGT ATT AAG CAA ATC AGT GTT TCG CTA CCT GCA TTG GTT GGG CCT 7248

Arg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro Ala Leu Val Gly ProArg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro Ala Leu Val Gly Pro

2405 2410 24152405 2410 2415

TAT CAG GAT GTT CAG GCT ATG CTC AGC TAT GGT GGC AGT ACT CAA TTG 7296TAT CAG GAT GTT CAG GCT ATG CTC AGC TAT GGT GGC AGT ACT CAA TTG 7296

Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly Gly Ser Thr Gln LeuTyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly Gly Ser Thr Gln Leu

2420 2425 24302420 2425 2430

CCG AAA GGT TGT TCA GCG TTG GCT GTG TCT CAT GGT ACC AAT GAT AGT 7344CCG AAA GGT TGT TCA GCG TTG GCT GTG TCT CAT GGT ACC AAT GAT AGT 7344

Pro Lys Gly Cys Ser Ala Leu Ala Val Ser His Gly Thr Asn Asp SerPro Lys Gly Cys Ser Ala Leu Ala Val Ser His Gly Thr Asn Asp Ser

2435 2440 24452435 2440 2445

GGT CAG TTC CAG TTG GAT TTC AAT GAC GGC AAA TAC CTG CCA TTT GAA 7392GGT CAG TTC CAG TTG GAT TTC AAT GAC GGC AAA TAC CTG CCA TTT GAA 7392

Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys Tyr Leu Pro Phe GluGly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys Tyr Leu Pro Phe Glu

2450 2455 24602450 2455 2460

GGT ATT GCT CTT GAT GAT CAG GGT ACA CTG AAT CTT CAA TTT CCG AAT 7440GGT ATT GCT CTT GAT GAT CAG GGT ACA CTG AAT CTT CAA TTT CCG AAT 7440

Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn Leu Gln Phe Pro AsnGly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn Leu Gln Phe Pro Asn

2465 2470 2475 24802465 2470 2475 2480

GCT ACC GAC AAG CAG AAA GCA ATA TTG CAA ACT ATG AGC GAT ATT ATT 7488GCT ACC GAC AAG CAG AAA GCA ATA TTG CAA ACT ATG AGC GAT ATT ATT 7488

Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr Met Ser Asp Ile IleAla Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr Met Ser Asp Ile Ile

2485 2490 24952485 2490 2495

TTG CAT ATT CGT TAT ACC ATC CGT TAA 7515TTG CAT ATT CGT TAT ACC ATC CGT TAA 7515

Leu His Ile Arg Tyr Thr Ile Arg *Leu His Ile Arg Tyr Thr Ile Arg *

2500 25052500 2505

(2) INFORMATION FOR SEQ ID NO:12:(2) INFORMATION FOR SEQ ID NO: 12:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 2504 amino acids(A) LENGTH: 2504 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:12 (TcbA protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 12 (TcbA protein):

Met Gln Asn Ser Leu Ser Ser Thr Ile Asp Thr Ile Cys Gln Lys LeuMet Gln Asn Ser Leu Ser Ser Thr Ile Asp Thr Ile Cys Gln Lys Leu

1 5 10 151 5 10 15

Gln Leu Thr Cys Pro Ala Glu Ile Ala Leu Tyr Pro Phe Asp Thr PheGln Leu Thr Cys Pro Ala Glu Ile Ala Leu Tyr Pro Phe Asp Thr Phe

20 25 3020 25 30

Arg Glu Lys Thr Arg Gly Met Val Asn Trp Gly Glu Ala Lys Arg IleArg Glu Lys Thr Arg Gly Met Val Asn Trp Gly Glu Ala Lys Arg Ile

35 40 4535 40 45

Tyr Glu Ile Ala Gln Ala Glu Gln Asp Arg Asn Leu Leu His Glu LysTyr Glu Ile Ala Gln Ala Glu Gln Asp Arg Asn Leu Leu His Glu Lys

50 55 6050 55 60

Arg Ile Phe Ala Tyr Ala Asn Pro Leu Leu Lys Asn Ala Val Arg LeuArg Ile Phe Ala Tyr Ala Asn Pro Leu Leu Lys Asn Ala Val Arg Leu

65 70 75 8065 70 75 80

Gly Thr Arg Gln Met Leu Gly Phe Ile Gln Gly Tyr Ser Asp Leu PheGly Thr Arg Gln Met Leu Gly Phe Ile Gln Gly Tyr Ser Asp Leu Phe

85 90 9585 90 95

Gly Asn Arg Ala Asp Asn Tyr Ala Ala Pro Gly Ser Val Ala Ser MetGly Asn Arg Ala Asp Asn Tyr Ala Ala Pro Gly Ser Val Ala Ser Met

100 105 110100 105 110

Phe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys AsnPhe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Lys Asn

115 120 125115 120 125

Leu His Asp Ser Ser Ser Ile Tyr Tyr Leu Asp Lys Arg Arg Pro AspLeu His Asp Ser Ser Ser Ile Tyr Tyr Leu Asp Lys Arg Arg Pro Asp

130 135 140130 135 140

Leu Ala Ser Leu Met Leu Ser Gln Lys Asn Met Asp Glu Glu Ile SerLeu Ala Ser Leu Met Leu Ser Gln Lys Asn Met Asp Glu Glu Ile Ser

145 150 155 160145 150 155 160

Thr Leu Ala Leu Ser Asn Glu Leu Cys Leu Ala Gly Ile Glu Thr LysThr Leu Ala Leu Ser Asn Glu Leu Cys Leu Ala Gly Ile Glu Thr Lys

165 170 175165 170 175

Thr Gly Lys Ser Gln Asp Glu Val Met Asp Met Leu Ser Thr Tyr ArgThr Gly Lys Ser Gln Asp Glu Val Met Asp Met Leu Ser Thr Tyr Arg

180 185 190180 185 190

Leu Ser Gly Glu Thr Pro Tyr His His Ala Tyr Glu Thr Val Arg GluLeu Ser Gly Glu Thr Pro Tyr His His Ala Tyr Glu Thr Val Arg Glu

195 200 205195 200 205

Ile Val His Glu Arg Asp Pro Gly Phe Arg His Leu Ser Gln Ala ProIle Val His Glu Arg Asp Pro Gly Phe Arg His Leu Ser Gln Ala Pro

210 215 220210 215 220

Ile Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser SerIle Val Ala Ala Lys Leu Asp Pro Val Thr Leu Leu Gly Ile Ser Ser

225 230 235 240225 230 235 240

His Ile Ser Pro Glu Leu Tyr Asn Leu Leu Ile Glu Glu Ile Pro GluHis Ile Ser Pro Glu Leu Tyr Asn Leu Leu Ile Glu Glu Ile Pro Glu

245 250 255245 250 255

Lys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly AspLys Asp Glu Ala Ala Leu Asp Thr Leu Tyr Lys Thr Asn Phe Gly Asp

260 265 270260 265 270

Ile Thr Thr Ala Gln Leu Met Ser Pro Ser Tyr Leu Ala Arg Tyr TyrIle Thr Thr Ala Gln Leu Met Ser Pro Ser Tyr Leu Ala Arg Tyr Tyr

275 280 285275 280 285

Gly Val Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu Ser HisGly Val Ser Pro Glu Asp Ile Ala Tyr Val Thr Thr Ser Leu Ser His

290 295 300290 295 300

Val Gly Tyr Ser Ser Asp Ile Leu Val Ile Pro Leu Val Asp Gly ValVal Gly Tyr Ser Ser Asp Ile Leu Val Ile Pro Leu Val Asp Gly Val

305 310 315 320305 310 315 320

Gly Lys Met Glu Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn TyrGly Lys Met Glu Val Val Arg Val Thr Arg Thr Pro Ser Asp Asn Tyr

325 330 335325 330 335

Thr Ser Gln Thr Asn Tyr Ile Glu Leu Tyr Pro Gln Gly Gly Asp AsnThr Ser Gln Thr Asn Tyr Ile Glu Leu Tyr Pro Gln Gly Gly Asp Asn

340 345 350340 345 350

Tyr Leu Ile Lys Tyr Asn Leu Ser Asn Ser Phe Gly Leu Asp Asp PheTyr Leu Ile Lys Tyr Asn Leu Ser Asn Ser Phe Gly Leu Asp Asp Phe

355 360 365355 360 365

Tyr Leu Gln Tyr Lys Asp Gly Ser Ala Asp Trp Thr Glu Ile Ala HisTyr Leu Gln Tyr Lys Asp Gly Ser Ala Asp Trp Thr Glu Ile Ala His

370 375 380370 375 380

Asn Pro Tyr Pro Asp Met Val Ile Asn Gln Lys Tyr Glu Ser Gln AlaAsn Pro Tyr Pro Asp Met Val Ile Asn Gln Lys Tyr Glu Ser Gln Ala

385 390 395 400385 390 395 400

Thr Ile Lys Arg Ser Asp Ser Asp Asn Ile Leu Ser Ile Gly Leu GlnThr Ile Lys Arg Ser Asp Ser Asp Asn Ile Leu Ser Ile Gly Leu Gln

405 410 415405 410 415

Arg Trp His Ser Gly Ser Tyr Asn Phe Ala Ala Ala Asn Phe Lys IleArg Trp His Ser Gly Ser Tyr Asn Phe Ala Ala Ala Asn Phe Lys Ile

420 425 430420 425 430

Asp Gln Tyr Ser Pro Lys Ala Phe Leu Leu Lys Met Asn Lys Ala IleAsp Gln Tyr Ser Pro Lys Ala Phe Leu Leu Lys Met Asn Lys Ala Ile

435 440 445435 440 445

Arg Leu Leu Lys Ala Thr Gly Leu Ser Phe Ala Thr Leu Glu Arg IleArg Leu Leu Lys Ala Thr Gly Leu Ser Phe Ala Thr Leu Glu Arg Ile

450 455 460450 455 460

Val Asp Ser Val Asn Ser Thr Lys Ser Ile Thr Val Glu Val Leu AsnVal Asp Ser Val Asn Ser Thr Lys Ser Ile Thr Val Glu Val Leu Asn

465 470 475 480465 470 475 480

Lys Val Tyr Arg Val Lys Phe Tyr Ile Asp Arg Tyr Gly Ile Ser GluLys Val Tyr Arg Val Lys Phe Tyr Ile Asp Arg Tyr Gly Ile Ser Glu

485 490 495485 490 495

Glu Thr Ala Ala Ile Leu Ala Asn Ile Asn Ile Ser Gln Gln Ala ValGlu Thr Ala Ala Ile Leu Ala Asn Ile Asn Ile Ser Gln Gln Ala Val

500 505 510500 505 510

Gly Asn Gln Leu Ser Gln Phe Glu Gln Leu Phe Asn His Pro Pro LeuGly Asn Gln Leu Ser Gln Phe Glu Gln Leu Phe Asn His Pro Pro Leu

515 520 525515 520 525

Asn Gly Ile Arg Tyr Glu Ile Ser Glu Asp Asn Ser Lys His Leu ProAsn Gly Ile Arg Tyr Glu Ile Ser Glu Asp Asn Ser Lys His Leu Pro

530 535 540530 535 540

Asn Pro Asp Leu Asn Leu Lys Pro Asp Ser Thr Gly Asp Asp Gln ArgAsn Pro Asp Leu Asn Leu Lys Pro Asp Ser Thr Gly Asp Asp Gln Arg

545 550 555 560545 550 555 560

Lys Ala Val Leu Lys Arg Ala Phe Gln Val Asn Ala Ser Glu Leu TyrLys Ala Val Leu Lys Arg Ala Phe Gln Val Asn Ala Ser Glu Leu Tyr

565 570 575565 570 575

Gln Met Leu Leu Ile Thr Asp Arg Lys Glu Asp Gly Val Ile Lys AsnGln Met Leu Leu Ile Thr Asp Arg Lys Glu Asp Gly Val Ile Lys Asn

580 585 590580 585 590

Asn Leu Glu Asn Leu Ser Asp Leu Tyr Leu Val Ser Leu Leu Ala GlnAsn Leu Glu Asn Leu Ser Asp Leu Tyr Leu Val Ser Leu Leu Ala Gln

595 600 605595 600 605

Ile His Asn Leu Thr Ile Ala Glu Leu Asn Ile Leu Leu Val Ile CysIle His Asn Leu Thr Ile Ala Glu Leu Asn Ile Leu Leu Val Ile Cys

610 615 620610 615 620

Gly Tyr Gly Asp Thr Asn Ile Tyr Gln Ile Thr Asp Asp Asn Leu AlaGly Tyr Gly Asp Thr Asn Ile Tyr Gln Ile Thr Asp Asp Asn Leu Ala

625 630 635 640625 630 635 640

Lys Ile Val Glu Thr Leu Leu Trp Ile Thr Gln Trp Leu Lys Thr GlnLys Ile Val Glu Thr Leu Leu Trp Ile Thr Gln Trp Leu Lys Thr Gln

645 650 655645 650 655

Lys Trp Thr Val Thr Asp Leu Phe Leu Met Thr Thr Ala Thr Tyr SerLys Trp Thr Val Thr Asp Leu Phe Leu Met Thr Thr Ala Thr Tyr Ser

660 665 670660 665 670

Thr Thr Leu Thr Pro Glu Ile Ser Asn Leu Thr Ala Thr Leu Ser SerThr Thr Leu Thr Pro Glu Ile Ser Asn Leu Thr Ala Thr Leu Ser Ser

675 680 685675 680 685

Thr Leu His Gly Lys Glu Ser Leu Ile Gly Glu Asp Leu Lys Arg AlaThr Leu His Gly Lys Glu Ser Leu Ile Gly Glu Asp Leu Lys Arg Ala

690 695 700690 695 700

Met Ala Pro Cys Phe Thr Ser Ala Leu His Leu Thr Ser Gln Glu ValMet Ala Pro Cys Phe Thr Ser Ala Leu His Leu Thr Ser Gln Glu Val

705 710 715 720705 710 715 720

Ala Tyr Asp Leu Leu Leu Trp Ile Asp Gln Ile Gln Pro Ala Gln IleAla Tyr Asp Leu Leu Leu Trp Ile Asp Gln Ile Gln Pro Ala Gln Ile

725 730 735725 730 735

Thr Val Asp Gly Phe Trp Glu Glu Val Gln Thr Thr Pro Thr Ser LeuThr Val Asp Gly Phe Trp Glu Glu Val Gln Thr Thr Pro Thr Ser Leu

740 745 750740 745 750

Lys Val Ile Thr Phe Ala Gln Val Leu Ala Gln Leu Ser Leu Ile TyrLys Val Ile Thr Phe Ala Gln Val Leu Ala Gln Leu Ser Leu Ile Tyr

755 760 765755 760 765

Arg Arg Ile Gly Leu Ser Glu Thr Glu Leu Ser Leu Ile Val Thr GlnArg Arg Ile Gly Leu Ser Glu Thr Glu Leu Ser Leu Ile Val Thr Gln

770 775 780770 775 780

Ser Ser Leu Leu Val Ala Gly Lys Ser Ile Leu Asp His Gly Leu LeuSer Ser Leu Leu Val Ala Gly Lys Ser Ile Leu Asp His Gly Leu Leu

785 790 795 800785 790 795 800

Thr Leu Met Ala Leu Glu Gly Phe His Thr Trp Val Asn Gly Leu GlyThr Leu Met Ala Leu Glu Gly Phe His Thr Trp Val Asn Gly Leu Gly

805 810 815805 810 815

Gln His Ala Ser Leu Ile Leu Ala Ala Leu Lys Asp Gly Ala Leu ThrGln His Ala Ser Leu Ile Leu Ala Ala Leu Lys Asp Gly Ala Leu Thr

820 825 830820 825 830

Val Thr Asp Val Ala Gln Ala Met Asn Lys Glu Glu Ser Leu Leu GlnVal Thr Asp Val Ala Gln Ala Met Asn Lys Glu Glu Ser Leu Leu Gln

835 840 845835 840 845

Met Ala Ala Asn Gln Val Glu Lys Asp Leu Thr Lys Leu Thr Ser TrpMet Ala Ala Asn Gln Val Glu Lys Asp Leu Thr Lys Leu Thr Ser Trp

850 855 860850 855 860

Thr Gln Ile Asp Ala Ile Leu Gln Trp Leu Gln Met Ser Ser Ala LeuThr Gln Ile Asp Ala Ile Leu Gln Trp Leu Gln Met Ser Ser Ala Leu

865 870 875 880865 870 875 880

Ala Val Ser Pro Leu Asp Leu Ala Gly Met Met Ala Leu Lys Tyr GlyAla Val Ser Pro Leu Asp Leu Ala Gly Met Met Ala Leu Lys Tyr Gly

885 890 895885 890 895

Ile Asp His Asn Tyr Ala Ala Trp Gln Ala Ala Ala Ala Ala Leu MetIle Asp His Asn Tyr Ala Ala Trp Gln Ala Ala Ala Ala Ala Leu Met

900 905 910900 905 910

Ala Asp His Ala Asn Gln Ala Gln Lys Lys Leu Asp Glu Thr Phe SerAla Asp His Ala Asn Gln Ala Gln Lys Lys Leu Asp Glu Thr Phe Ser

915 920 925915 920 925

Lys Ala Leu Cys Asn Tyr Tyr Ile Asn Ala Val Val Asp Ser Ala AlaLys Ala Leu Cys Asn Tyr Tyr Ile Asn Ala Val Val Asp Ser Ala Ala

930 935 940930 935 940

Gly Val Arg Asp Arg Asn Gly Leu Tyr Thr Tyr Leu Leu Ile Asp AsnGly Val Arg Asp Arg Asn Gly Leu Tyr Thr Tyr Leu Leu Ile Asp Asn

945 950 955 960945 950 955 960

Gln Val Ser Ala Asp Val Ile Thr Ser Arg Ile Ala Glu Ala Ile AlaGln Val Ser Ala Asp Val Ile Thr Ser Arg Ile Ala Glu Ala Ile Ala

965 970 975965 970 975

Gly Ile Gln Leu Tyr Val Asn Arg Ala Leu Asn Arg Asp Glu Gly GlnGly Ile Gln Leu Tyr Val Asn Arg Ala Leu Asn Arg Asp Glu Gly Gln

980 985 990980 985 990

Leu Ala Ser Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Glu ArgLeu Ala Ser Asp Val Ser Thr Arg Gln Phe Phe Thr Asp Trp Glu Arg

995 1000 1005995 1000 1005

Tyr Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Glu Leu Val TyrTyr Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Glu Leu Val Tyr

1010 1015 10201010 1015 1020

Tyr Pro Glu Asn Tyr Val Asp Pro Thr Gln Arg Ile Gly Gln Thr LysTyr Pro Glu Asn Tyr Val Asp Pro Thr Gln Arg Ile Gly Gln Thr Lys

1025 1030 1035 10401025 1030 1035 1040

Met Met Asp Ala Leu Leu Gln Ser Ile Asn Gln Ser Gln Leu Asn AlaMet Met Asp Ala Leu Leu Gln Ser Ile Asn Gln Ser Gln Leu Asn Ala

1045 1050 10551045 1050 1055

Asp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Ser Phe Glu GlnAsp Thr Val Glu Asp Ala Phe Lys Thr Tyr Leu Thr Ser Phe Glu Gln

1060 1065 10701060 1065 1070

Val Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Val Asn ValVal Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Val Asn Val

1075 1080 10851075 1080 1085

Asp Gln Gly Leu Thr Tyr Phe Ile Gly Ile Asp Gln Ala Ala Pro GlyAsp Gln Gly Leu Thr Tyr Phe Ile Gly Ile Asp Gln Ala Ala Pro Gly

1090 1095 11001090 1095 1100

Thr Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Cys Glu Asn Gly LysThr Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Cys Glu Asn Gly Lys

1105 1110 1115 11201105 1110 1115 1120

Phe Ala Ala Asn Ala Trp Gly Glu Trp Asn Lys Ile Thr Cys Ala ValPhe Ala Ala Asn Ala Trp Gly Glu Trp Asn Lys Ile Thr Cys Ala Val

1125 1130 11351125 1130 1135

Asn Pro Trp Lys Asn Ile Ile Arg Pro Val Val Tyr Met Ser Arg LeuAsn Pro Trp Lys Asn Ile Ile Arg Pro Val Val Tyr Met Ser Arg Leu

1140 1145 11501140 1145 1150

Tyr Leu Leu Trp Leu Glu Gln Gln Ser Lys Lys Ser Asp Asp Gly LysTyr Leu Leu Trp Leu Glu Gln Gln Ser Lys Lys Ser Asp Asp Gly Lys

1155 1160 11651155 1160 1165

Thr Thr Ile Tyr Gln Tyr Asn Leu Lys Leu Ala His Ile Arg Tyr AspThr Thr Ile Tyr Gln Tyr Asn Leu Lys Leu Ala His Ile Arg Tyr Asp

1170 1175 11801170 1175 1180

Gly Ser Trp Asn Thr Pro Phe Thr Phe Asp Val Thr Glu Lys Val LysGly Ser Trp Asn Thr Pro Phe Thr Phe Asp Val Thr Glu Lys Val Lys

1185 1190 1195 12001185 1190 1195 1200

Asn Tyr Thr Ser Ser Thr Asp Ala Ala Glu Ser Leu Gly Leu Tyr CysAsn Tyr Thr Ser Ser Thr Asp Ala Ala Glu Ser Leu Gly Leu Tyr Cys

1205 1210 12151205 1210 1215

Thr Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Ser MetThr Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Ser Met

1220 1225 12301220 1225 1230

Gln Ser Ser Tyr Ser Ser Tyr Thr Asp Asn Asn Ala Pro Val Thr GlyGln Ser Ser Tyr Ser Ser Tyr Thr Asp Asn Asn Ala Pro Val Thr Gly

1235 1240 12451235 1240 1245

Leu Tyr Ile Phe Ala Asp Met Ser Ser Asp Asn Met Thr Asn Ala GlnLeu Tyr Ile Phe Ala Asp Met Ser Ser Asp Asn Met Thr Asn Ala Gln

1250 1255 12601250 1255 1260

Ala Thr Asn Tyr Trp Asn Asn Ser Tyr Pro Gln Phe Asp Thr Val MetAla Thr Asn Tyr Trp Asn Asn Ser Tyr Pro Gln Phe Asp Thr Val Met

1265 1270 1275 12801265 1270 1275 1280

Ala Asp Pro Asp Ser Asp Asn Lys Lys Val Ile Thr Arg Arg Val AsnAla Asp Pro Asp Ser Asp Asn Lys Lys Val Ile Thr Arg Arg Val Asn

1285 1290 12951285 1290 1295

Asn Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Thr Ser AsnAsn Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Thr Ser Asn

1300 1305 13101300 1305 1310

Ser Asn Tyr Ser Trp Gly Asp His Ser Leu Thr Met Leu Tyr Gly GlySer Asn Tyr Ser Trp Gly Asp His Ser Leu Thr Met Leu Tyr Gly Gly

1315 1320 13251315 1320 1325

Ser Val Pro Asn Ile Thr Phe Glu Ser Ala Ala Glu Asp Leu Arg LeuSer Val Pro Asn Ile Thr Phe Glu Ser Ala Ala Glu Asp Leu Arg Leu

1330 1335 13401330 1335 1340

Ser Thr Asn Met Ala Leu Ser Ile Ile His Asn Gly Tyr Ala Gly ThrSer Thr Asn Met Ala Leu Ser Ile Ile His Asn Gly Tyr Ala Gly Thr

1345 1350 1355 13601345 1350 1355 1360

Arg Arg Ile Gln Cys Asn Leu Met Lys Gln Tyr Ala Ser Leu Gly AspArg Arg Ile Gln Cys Asn Leu Met Lys Gln Tyr Ala Ser Leu Gly Asp

1365 1370 13751365 1370 1375

Lys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe AsnLys Phe Ile Ile Tyr Asp Ser Ser Phe Asp Asp Ala Asn Arg Phe Asn

1380 1385 13901380 1385 1390

Leu Val Pro Leu Phe Lys Phe Gly Lys Asp Glu Asn Ser Asp Asp SerLeu Val Pro Leu Phe Lys Phe Gly Lys Asp Glu Asn Ser Asp Asp Ser

1395 1400 14051395 1400 1405

Ile Cys Ile Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp TyrIle Cys Ile Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp Tyr

1410 1415 14201410 1415 1420

Phe Ser Ser Lys Asp Asp Asn Lys Thr Ala Asp Tyr Asn Gly Gly ThrPhe Ser Ser Lys Asp Asp Asn Lys Thr Ala Asp Tyr Asn Gly Gly Thr

1425 1430 1435 14401425 1430 1435 1440

Gln Cys Ile Asp Ala Gly Thr Ser Asn Lys Asp Phe Tyr Tyr Asn LeuGln Cys Ile Asp Ala Gly Thr Ser Asn Lys Asp Phe Tyr Tyr Asn Leu

1445 1450 14551445 1450 1455

Gln Glu Ile Glu Val Ile Ser Val Thr Gly Gly Tyr Trp Ser Ser TyrGln Glu Ile Glu Val Ile Ser Val Thr Gly Gly Tyr Trp Ser Ser Tyr

1460 1465 14701460 1465 1470

Lys Ile Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala LysLys Ile Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala Lys

1475 1480 14851475 1480 1485

Val Lys Val Thr Val Lys Ala Gly Gly Asp Asp Gln Ile Phe Thr AlaVal Lys Val Thr Val Lys Ala Gly Gly Asp Asp Gln Ile Phe Thr Ala

1490 1495 15001490 1495 1500

Asp Asn Ser Thr Tyr Val Pro Gln Gln Pro Ala Pro Ser Phe Glu GluAsp Asn Ser Thr Tyr Val Pro Gln Gln Pro Ala Pro Ser Phe Glu Glu

1505 1510 1515 15201505 1510 1515 1520

Met Ile Tyr Gln Phe Asn Asn Leu Thr Ile Asp Cys Lys Asn Leu AsnMet Ile Tyr Gln Phe Asn Asn Leu Thr Ile Asp Cys Lys Asn Leu Asn

1525 1530 15351525 1530 1535

Phe Ile Asp Asn Gln Ala His Ile Glu Ile Asp Phe Thr Ala Thr AlaPhe Ile Asp Asn Gln Ala His Ile Glu Ile Asp Phe Thr Ala Thr Ala

1540 1545 15501540 1545 1550

Gln Asp Gly Arg Phe Leu Gly Ala Glu Thr Phe Ile Ile Pro Val ThrGln Asp Gly Arg Phe Leu Gly Ala Glu Thr Phe Ile Ile Pro Val Thr

1555 1560 15651555 1560 1565

Lys Lys Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu AsnLys Lys Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu Asn

1570 1575 15801570 1575 1580

Asn Gly Val Gln Tyr Met Gln Ile Gly Ala Tyr Arg Thr Arg Leu AsnAsn Gly Val Gln Tyr Met Gln Ile Gly Ala Tyr Arg Thr Arg Leu Asn

1585 1590 1595 16001585 1590 1595 1600

Thr Leu Phe Ala Gln Gln Leu Val Ser Arg Ala Asn Arg Gly Ile AspThr Leu Phe Ala Gln Gln Leu Val Ser Arg Ala Asn Arg Gly Ile Asp

1605 1610 16151605 1610 1615

Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu GlyAla Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly

1620 1625 16301620 1625 1630

Ala Gly Thr Tyr Val Gln Leu Val Leu Asp Lys Tyr Asp Glu Ser IleAla Gly Thr Tyr Val Gln Leu Val Leu Asp Lys Tyr Asp Glu Ser Ile

1635 1640 16451635 1640 1645

His Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe LysHis Gly Thr Asn Lys Ser Phe Ala Ile Glu Tyr Val Asp Ile Phe Lys

1650 1655 16601650 1655 1660

Glu Asn Asp Ser Phe Val Ile Tyr Gln Gly Glu Leu Ser Glu Thr SerGlu Asn Asp Ser Phe Val Ile Tyr Gln Gly Glu Leu Ser Glu Thr Ser

1665 1670 1675 16801665 1670 1675 1680

Gln Thr Val Val Lys Val Phe Leu Ser Tyr Phe Ile Glu Ala Thr GlyGln Thr Val Val Lys Val Phe Leu Ser Tyr Phe Ile Glu Ala Thr Gly

1685 1690 16951685 1690 1695

Asn Lys Asn His Leu Trp Val Arg Ala Lys Tyr Gln Lys Glu Thr ThrAsn Lys Asn His Leu Trp Val Arg Ala Lys Tyr Gln Lys Glu Thr Thr

1700 1705 17101700 1705 1710

Asp Lys Ile Leu Phe Asp Arg Thr Asp Glu Lys Asp Pro His Gly TrpAsp Lys Ile Leu Phe Asp Arg Thr Asp Glu Lys Asp Pro His Gly Trp

1715 1720 17251715 1720 1725

Phe Leu Ser Asp Asp His Lys Thr Phe Ser Gly Leu Ser Ser Ala GlnPhe Leu Ser Asp Asp His Lys Thr Phe Ser Gly Leu Ser Ser Ala Gln

1730 1735 17401730 1735 1740

Ala Leu Lys Asn Asp Ser Glu Pro Met Asp Phe Ser Gly Ala Asn AlaAla Leu Lys Asn Asp Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ala

1745 1750 1755 17601745 1750 1755 1760

Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro Met Met Met Ala HisLeu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro Met Met Met Ala His

1765 1770 17751765 1770 1775

Arg Leu Leu Gln Glu Gln Asn Phe Asp Ala Ala Asn His Trp Phe ArgArg Leu Leu Gln Glu Gln Asn Phe Asp Ala Ala Asn His Trp Phe Arg

1780 1785 17901780 1785 1790

Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val Asp Gly Lys Ile Ala IleTyr Val Trp Ser Pro Ser Gly Tyr Ile Val Asp Gly Lys Ile Ala Ile

1795 1800 18051795 1800 1805

Tyr His Trp Asn Val Arg Pro Leu Glu Glu Asp Thr Ser Trp Asn AlaTyr His Trp Asn Val Arg Pro Leu Glu Glu Asp Thr Ser Trp Asn Ala

1810 1815 18201810 1815 1820

Gln Gln Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln Asp Asp ProGln Gln Leu Asp Ser Thr Asp Pro Asp Ala Val Ala Gln Asp Asp Pro

1825 1830 1835 18401825 1830 1835 1840

Met His Tyr Lys Val Ala Thr Phe Met Ala Thr Leu Asp Leu Leu MetMet His Tyr Lys Val Ala Thr Phe Met Ala Thr Leu Asp Leu Leu Met

1845 1850 18551845 1850 1855

Ala Arg Gly Asp Ala Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu AlaAla Arg Gly Asp Ala Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Ala

1860 1865 18701860 1865 1870

Glu Ala Lys Met Trp Tyr Thr Gln Ala Leu Asn Leu Leu Gly Asp GluGlu Ala Lys Met Trp Tyr Thr Gln Ala Leu Asn Leu Leu Gly Asp Glu

1875 1880 18851875 1880 1885

Pro Gln Val Met Leu Ser Thr Thr Trp Ala Asn Pro Thr Leu Gly AsnPro Gln Val Met Leu Ser Thr Thr Trp Ala Asn Pro Thr Leu Gly Asn

1890 1895 19001890 1895 1900

Ala Ala Ser Lys Thr Thr Gln Gln Val Arg Gln Gln Val Leu Thr GlnAla Ala Ser Lys Thr Thr Gln Gln Val Arg Gln Gln Val Leu Thr Gln

1905 1910 1915 19201905 1910 1915 1920

Leu Arg Leu Asn Ser Arg Val Lys Thr Pro Leu Leu Gly Thr Ala AsnLeu Arg Leu Asn Ser Arg Val Lys Thr Pro Leu Leu Gly Thr Ala Asn

1925 1930 19351925 1930 1935

Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn Ser Lys Leu Lys GlySer Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn Ser Lys Leu Lys Gly

1940 1945 19501940 1945 1950

Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn Leu Arg His Asn LeuTyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn Leu Arg His Asn Leu

1955 1960 19651955 1960 1965

Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu Tyr Ala Lys Pro AlaSer Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu Tyr Ala Lys Pro Ala

1970 1975 19801970 1975 1980

Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser Ala Ser Gln Gly GlyAsp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser Ala Ser Gln Gly Gly

1985 1990 1995 20001985 1990 1995 2000

Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile His Arg Phe Pro Gln MetAla Asp Leu Pro Lys Ala Pro Leu Thr Ile His Arg Phe Pro Gln Met

2005 2010 20152005 2010 2015

Leu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu Ile Gln Phe Gly SerLeu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu Ile Gln Phe Gly Ser

2020 2025 20302020 2025 2030

Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala Glu Ala Met Ser GlnSer Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala Glu Ala Met Ser Gln

2035 2040 20452035 2040 2045

Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu Thr Ser Ile Arg MetLeu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu Thr Ser Ile Arg Met

2050 2055 20602050 2055 2060

Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu Lys Thr Ala Leu GlnGln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu Lys Thr Ala Leu Gln

2065 2070 2075 20802065 2070 2075 2080

Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp Ser Tyr Ser Gln LeuVal Ser Leu Ala Gly Val Gln Gln Arg Phe Asp Ser Tyr Ser Gln Leu

2085 2090 20952085 2090 2095

Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg Ala Leu Ala Leu ArgTyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg Ala Leu Ala Leu Arg

2100 2105 21102100 2105 2110

Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln Ile Ser Arg Met AlaSer Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln Ile Ser Arg Met Ala

2115 2120 21252115 2120 2125

Gly Ala Gly Val Asp Met Ala Pro Asn Ile Phe Gly Leu Ala Asp GlyGly Ala Gly Val Asp Met Ala Pro Asn Ile Phe Gly Leu Ala Asp Gly

2130 2135 21402130 2135 2140

Gly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile Ala Asp Gly Ile GluGly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile Ala Asp Gly Ile Glu

2145 2150 2155 21602145 2150 2155 2160

Leu Ser Ala Ser Ala Lys Met Val Asp Ala Glu Lys Val Ala Gln SerLeu Ser Ala Ser Ala Lys Met Val Asp Ala Glu Lys Val Ala Gln Ser

2165 2170 21752165 2170 2175

Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp AsnGlu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys Ile Gln Arg Asp Asn

2180 2185 21902180 2185 2190

Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln Leu Glu Ser Leu SerAla Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln Leu Glu Ser Leu Ser

2195 2200 22052195 2200 2205

Ile Arg Arg Glu Ala Ala Glu Met Gln Lys Glu Tyr Leu Lys Thr GlnIle Arg Arg Glu Ala Ala Glu Met Gln Lys Glu Tyr Leu Lys Thr Gln

2210 2215 22202210 2215 2220

Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu Arg Ser Lys Phe SerGln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu Arg Ser Lys Phe Ser

2225 2230 2235 22402225 2230 2235 2240

Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg Leu Ser Gly Ile TyrAsn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg Leu Ser Gly Ile Tyr

2245 2250 22552245 2250 2255

Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys Leu Met Ala Glu GlnPhe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys Leu Met Ala Glu Gln

2260 2265 22702260 2265 2270

Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile Ser Phe Val Lys ProSer Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile Ser Phe Val Lys Pro

2275 2280 22852275 2280 2285

Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Cys Gly Glu Ala LeuGly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu Cys Gly Glu Ala Leu

2290 2295 23002290 2295 2300

Ile Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr Leu Lys Trp Glu SerIle Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr Leu Lys Trp Glu Ser

2305 2310 2315 23202305 2310 2315 2320

Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Val Val Tyr AspArg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Val Val Tyr Asp

2325 2330 23352325 2330 2335

Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala Glu Gln Ile Pro AlaSer Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala Glu Gln Ile Pro Ala

2340 2345 23502340 2345 2350

Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr Lys Glu Asn Gly LeuLeu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr Lys Glu Asn Gly Leu

2355 2360 23652355 2360 2365

Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser Val Lys Leu Ser Asp LeuSer Leu Ala Asn Ala Ile Leu Ser Ala Ser Val Lys Leu Ser Asp Leu

2370 2375 23802370 2375 2380

Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val Gly Ser Asn Lys ValLys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val Gly Ser Asn Lys Val

2385 2390 2395 24002385 2390 2395 2400

Arg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro Ala Leu Val Gly ProArg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro Ala Leu Val Gly Pro

2405 2410 24152405 2410 2415

Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly Gly Ser Thr Gln LeuTyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly Gly Ser Thr Gln Leu

2420 2425 24302420 2425 2430

Pro Lys Gly Cys Ser Ala Leu Ala Val Ser His Gly Thr Asn Asp SerPro Lys Gly Cys Ser Ala Leu Ala Val Ser His Gly Thr Asn Asp Ser

2435 2440 24452435 2440 2445

Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys Tyr Leu Pro Phe GluGly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys Tyr Leu Pro Phe Glu

2450 2455 24602450 2455 2460

Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn Leu Gln Phe Pro AsnGly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn Leu Gln Phe Pro Asn

2465 2470 2475 24802465 2470 2475 2480

Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr Met Ser Asp Ile IleAla Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr Met Ser Asp Ile Ile

2485 2490 24952485 2490 2495

Leu His Ile Arg Tyr Thr Ile Arg *Leu His Ile Arg Tyr Thr Ile Arg *

2500 25052500 2505

(2) INFORMATION FOR SEQ ID NO:13:(2) INFORMATION FOR SEQ ID NO: 13:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:13 (TcdAii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 13 (TcdAii N-terminus):

Leu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Xaa AlaLeu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Xaa Ala

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:14:(2) INFORMATION FOR SEQ ID NO: 14:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:14 (TcdB N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 14 (TcdB N-terminus):

Met Gln Asn Ser Gln Thr Phe Ser Val Gly Glu LeuMet Gln Asn Ser Gln Thr Phe Ser Val Gly Glu Leu

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:15:(2) INFORMATION FOR SEQ ID NO: 15:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 14 amino acids(A) LENGTH: 14 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:15 (TcaAii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 15 (TcaAii N-terminus):

Ala Gln Asp Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn ThrAla Gln Asp Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:16:(2) INFORMATION FOR SEQ ID NO: 16:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 5 amino acids(A) LENGTH: 5 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:16 (TcbA N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 16 (TcbA N-terminus):

Met Gln Asn Ser LeuMet Gln Asn Ser Leu

1 51 5

(2) INFORMATION FOR SEQ ID NO:17:(2) INFORMATION FOR SEQ ID NO: 17:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 10 amino acids(A) LENGTH: 10 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:17 (TcdAii-PTlll internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 17 (TcdAii-PTlll internal

peptide):peptide):

Ala Phe Asn Ile Asp Asp Val Ser Leu PheAla Phe Asn Ile Asp Asp Val Ser Leu Phe

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:18:(2) INFORMATION FOR SEQ ID NO: 18:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 16 amino acids(A) LENGTH: 16 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:18 (TcdAii- PT79 internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 18 (TcdAii-PT79 internal

peptide):peptide):

Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser AsnPhe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser Asn

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:19:(2) INFORMATION FOR SEQ ID NO: 19:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 21 amino acids(A) LENGTH: 21 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:19 (TcaBi- PT158 internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 19 (TcaBi-PT158 internal

peptide):peptide):

Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile Gly SerIle Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile Gly Ser

1 5 10 151 5 10 15

Leu Gln Leu Phe IleLeu Gln Leu Phe Ile

2020

(2) INFORMATION FOR SEQ ID NO:20:(2) INFORMATION FOR SEQ ID NO: 20:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:20 (TcaBi- PT 108(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 20 (TcaBi-PT 108

internal peptide):internal peptide):

Met Tyr Tyr Ile Gln Ala Gln Gln Leu Leu Gly ProMet Tyr Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:21:(2) INFORMATION FOR SEQ ID NO: 21:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 26 amino acids(A) LENGTH: 26 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:21 (TcbAii- PT103(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 21 (TcbAii-PT103

internal peptide):internal peptide):

Gly Ile Asp Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu ProGly Ile Asp Ala Val Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro

1 5 10 151 5 10 15

Gln Leu Gly Ala Gly Thr Tyr Val Gln LeuGln Leu Gly Ala Gly Thr Tyr Val Gln Leu

20 2520 25

(2) INFORMATION FOR SEQ ID NO:22:(2) INFORMATION FOR SEQ ID NO: 22:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:22 (TcbAii- PT56 internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 22 (TcbAii- PT56 internal

peptide):peptide):

Ile Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala LysIle Ser Asn Pro Ile Asn Ile Asn Thr Gly Ile Asp Ser Ala Lys

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:23:(2) INFORMATION FOR SEQ ID NO: 23:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 13 amino acids(A) LENGTH: 13 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:23 (TcbA- PT81 (a)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 23 (TcbA-PT81 (a)

internal peptide):internal peptide):

Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu LysThr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:24:(2) INFORMATION FOR SEQ ID NO: 24:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 22 amino acids(A) LENGTH: 22 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: peptide(ii) MOLECULE TYPE: peptide

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:24 (TcbAii- PT81 (b)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 24 (TcbAii-PT81 (b)

internal peptide):internal peptide):

Val Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu Asn Asn GlyVal Leu Gly Thr Glu Asn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly

1 5 10 151 5 10 15

Val Gln Tyr Met Gln IleVal Gln Tyr Met Gln Ile

2020

(2) INFORMATION FOR SEQ ID NO:25:(2) INFORMATION FOR SEQ ID NO: 25:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 6054 base pairs(A) LENGTH: 6054 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 1..43(B) LOCATION: 1..43

(D) OTHER INFORMATION: /product= &quot;end of TcaAiii&quot;(D) OTHER INFORMATION: / product = &quot; end of TcaAiii &quot;

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: RBS(A) NAME / KEY: RBS

(B) LOCATION: 51 58(B) LOCATION: 51 58

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 65 3634(B) LOCATION: 65 3634

(D) OTHER INFORMATION: /product= &quot;TcaBi&quot;(D) OTHER INFORMATION: / product = &quot; TcaBi &quot;

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:25:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 25:

A GTA GCC CAA AAC TTA AGT GCC GCA ATC AGC AAT CGT CAG TAACCGGATA 50A GTA GCC CAA AAC TTA AGT GCC GCA ATC AGC AAT CGT CAG TAACCGGATA 50

Val Ala Gln Asn Leu Ser Ala Ala Ile Ser Asn Arg Gln ???Val Ala Gln Asn Leu Ser Ala Ala Ile Ser Asn Arg Gln ???

AAGAAGGAAT TGATT ATG TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA GAA 100AAGAAGGAAT TGATT ATG TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA GAA 100

Met Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys GluMet Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu

1 5 101 5 10

GCG CGC CGT GAT GCA TTG GTT GCT CAT TAT ATT GCT ACT CAG GTG CCC 148GCG CGC CGT GAT GCA TTG GTT GCT CAT TAT ATT GCT ACT CAG GTG CCC 148

Ala Arg Arg Asp Ala Leu Val Ala His Tyr Ile Ala Thr Gln Val ProAla Arg Arg Asp Ala Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro

15 20 2515 20 25

GCA GAT TTA AAA GAG AGT ATC CAG ACC GCG GAT GAT CTG TAC GAA TAT 196GCA GAT TTA AAA GAG AGT ATC CAG ACC GCG GAT GAT CTG TAC GAA TAT 196

Ala Asp Leu Lys Glu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu TyrAla Asp Leu Lys Glu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr

30 35 4030 35 40

CTG TTG CTG GAT ACC AAA ATT AGC GAT CTG GTT ACT ACT TCA CCG CTG 244CTG TTG CTG GAT ACC AAA ATT AGC GAT CTG GTT ACT ACT TCA CCG CTG 244

Leu Leu Leu Asp Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro LeuLeu Leu Leu Asp Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu

45 50 55 6045 50 55 60

TCC GAA GCG ATT GGC AGT CTG CAA TTG TTT ATT CAT CGT GCG ATA GAG 292TCC GAA GCG ATT GGC AGT CTG CAA TTG TTT ATT CAT CGT GCG ATA GAG 292

Ser Glu Ala Ile Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile GluSer Glu Ala Ile Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu

65 70 7565 70 75

GGC TAT GAC GGC ACG CTG GCA GAC TCA GCA AAA CCC TAT TTT GCC GAT 340GGC TAT GAC GGC ACG CTG GCA GAC TCA GCA AAA CCC TAT TTT GCC GAT 340

Gly Tyr Asp Gly Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala AspGly Tyr Asp Gly Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp

80 85 9080 85 90

GAA CAG TTT TTA TAT AAC TGG GAT AGT TTT AAC CAC CGT TAT AGC ACT 388GAA CAG TTT TTA TAT AAC TGG GAT AGT TTT AAC CAC CGT TAT AGC ACT 388

Glu Gln Phe Leu Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser ThrGlu Gln Phe Leu Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr

95 100 10595 100 105

TGG GCT GGC AAG GAA CGG TTG AAA TTC TAT GCC GGG GAT TAT ATT GAT 436TGG GCT GGC AAG GAA CGG TTG AAA TTC TAT GCC GGG GAT TAT ATT GAT 436

Trp Ala Gly Lys Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile AspTrp Ala Gly Lys Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp

110 115 120110 115 120

CCA ACA TTG CGA TTG AAT AAG ACC GAG ATA TTT ACC GCA TTT GAA CAA 484CCA ACA TTG CGA TTG AAT AAG ACC GAG ATA TTT ACC GCA TTT GAA CAA 484

Pro Thr Leu Arg Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu GlnPro Thr Leu Arg Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln

125 130 135 140125 130 135 140

GGT ATT TCT CAA GGG AAA TTA AAA AGT GAA TTA GTC GAA TCT AAA TTA 532GGT ATT TCT CAA GGG AAA TTA AAA AGT GAA TTA GTC GAA TCT AAA TTA 532

Gly Ile Ser Gln Gly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys LeuGly Ile Ser Gln Gly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu

145 150 155145 150 155

CGT GAT TAT CTA ATT AGT TAT GAC ACT TTA GCC ACC CTT GAT TAT ATT 580CGT GAT TAT CTA ATT AGT TAT GAC ACT TTA GCC ACC CTT GAT TAT ATT 580

Arg Asp Tyr Leu Ile Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr IleArg Asp Tyr Leu Ile Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile

160 165 170160 165 170

ACT GCC TGC CAA GGC AAA GAT AAT AAA ACC ATC TTC TTT ATT GGC CGT 628ACT GCC TGC CAA GGC AAA GAT AAT AAA ACC ATC TTC TTT ATT GGC CGT 628

Thr Ala Cys Gln Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly ArgThr Ala Cys Gln Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg

175 180 185175 180 185

ACA CAG AAT GCA CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC 676ACA CAG AAT GCA CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC 676

Thr Gln Asn Ala Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu ValThr Gln Asn Ala Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val

190 195 200190 195 200

ACT GAT GGC GGT AAG TTG AAA CCA GAT CAA TGG TCA GAG TGG CGA GCA 724ACT GAT GGC GGT AAG TTG AAA CCA GAT CAA TGG TCA GAG TGG CGA GCA 724

Thr Asp Gly Gly Lys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg AlaThr Asp Gly Gly Lys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala

205 210 215 220205 210 215 220

ATT AAT GCC GGG ATT AGT GAG GCA TAT TCA GGG CAT GTC GAG CCT TTC 772ATT AAT GCC GGG ATT AGT GAG GCA TAT TCA GGG CAT GTC GAG CCT TTC 772

Ile Asn Ala Gly Ile Ser Glu Ala Tyr Ser Gly His Val Glu Pro PheIle Asn Ala Gly Ile Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe

225 230 235225 230 235

TGG GAA AAT AAC AAG CTG CAC ATC CGT TGG TTT ACT ATC TCG AAA GAA 820TGG GAA AAT AAC AAG CTG CAC ATC CGT TGG TTT ACT ATC TCG AAA GAA 820

Trp Glu Asn Asn Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lys GluTrp Glu Asn Asn Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu

240 245 250240 245 250

GAT AAA ATA GAT TTT GTT TAT AAA AAC ATC TGG GTG ATG AGT AGC GAT 868GAT AAA ATA GAT TTT GTT TAT AAA AAC ATC TGG GTG ATG AGT AGC GAT 868

Asp Lys Ile Asp Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser AspAsp Lys Ile Asp Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp

255 260 265255 260 265

TAT AGC TGG GCA TCA AAG AAA AAA ATC TTG GAA CTT TCT TTT ACT GAC 916TAT AGC TGG GCA TCA AAG AAA AAA ATC TTG GAA CTT TCT TTT ACT GAC 916

Tyr Ser Trp Ala Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr AspTyr Ser Trp Ala Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp

270 275 280270 275 280

TAC AAT AGA GTT GGA GCA ACA GGA TCA TCA AGC CCG ACT GAA GTA GCT 964TAC AAT AGA GTT GGA GCA ACA GGA TCA TCA AGC CCG ACT GAA GTA GCT 964

Tyr Asn Arg Val Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val AlaTyr Asn Arg Val Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala

285 290 295 300285 290 295 300

TCA CAA TAT GGT TCT GAT GCT CAG ATG AAT ATT TCT GAT GAT GGG ACT 1012TCA CAA TAT GGT TCT GAT GCT CAG ATG AAT ATT TCT GAT GAT GGG ACT 1012

Ser Gln Tyr Gly Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly ThrSer Gln Tyr Gly Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr

305 310 315305 310 315

GTA CTT ATT TTT CAG AAT GCC GGC GGA GCT ACT CCC AGT ACT GGA GTG 1060GTA CTT ATT TTT CAG AAT GCC GGC GGA GCT ACT CCC AGT ACT GGA GTG 1060

Val Leu Ile Phe Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly ValVal Leu Ile Phe Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val

320 325 330320 325 330

ACG TTA TGT TAT GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA 1108ACG TTA TGT TAT GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA 1108

Thr Leu Cys Tyr Asp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser ThrThr Leu Cys Tyr Asp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr

335 340 345335 340 345

GGA AGT GCA AAT TTA TCG TCA AAG GAT TAT GCC ACA ACT AAA TTA CGC 1156GGA AGT GCA AAT TTA TCG TCA AAG GAT TAT GCC ACA ACT AAA TTA CGC 1156

Gly Ser Ala Asn Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu ArgGly Ser Ala Asn Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg

350 355 360350 355 360

ATG TGT CAT GGA CAA AGT TAC AAT GAT AAT AAC TAC TGC AAT TTT ACA 1204ATG TGT CAT GGA CAA AGT TAC AAT GAT AAT AAC TAC TGC AAT TTT ACA 1204

Met Cys His Gly Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe ThrMet Cys His Gly Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr

365 370 375 380365 370 375 380

CTC TCT ATT AAT ACA ATA GAA TTC ACC TCC TAC GGC ACA TTC TCA TCA 1252CTC TCT ATT AAT ACA ATA GAA TTC ACC TCC TAC GGC ACA TTC TCA TCA 1252

Leu Ser Ile Asn Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser SerLeu Ser Ile Asn Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser

385 390 395385 390 395

GAT GGA AAA CAA TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC 1300GAT GGA AAA CAA TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC 1300

Asp Gly Lys Gln Phe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu HisAsp Gly Lys Gln Phe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His

400 405 410400 405 410

CTC CCT AAT TAT GTA GAT CTC AAC GCG CTA TTA GAT ATT AGC CTC GAT 1348CTC CCT AAT TAT GTA GAT CTC AAC GCG CTA TTA GAT ATT AGC CTC GAT 1348

Leu Pro Asn Tyr Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu AspLeu Pro Asn Tyr Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp

415 420 425415 420 425

TCA CTA CTT AAT TAT GAC GTT CAG GGG CAG TTT GGC GGA TCT AAT CCG 1396TCA CTA CTT AAT TAT GAC GTT CAG GGG CAG TTT GGC GGA TCT AAT CCG 1396

Ser Leu Leu Asn Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn ProSer Leu Leu Asn Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro

430 435 440430 435 440

GTT GAT AAT TTC AGT GGT CCC TAT GGT ATT TAT CTA TGG GAA ATC TTC 1444GTT GAT AAT TTC AGT GGT CCC TAT GGT ATT TAT CTA TGG GAA ATC TTC 1444

Val Asp Asn Phe Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile PheVal Asp Asn Phe Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe

445 450 455 460445 450 455 460

TTC CAT ATT CCG TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT 1492TTC CAT ATT CCG TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT 1492

Phe His Ile Pro Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln ArgPhe His Ile Pro Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg

465 470 475465 470 475

TAC GAA GAC GCG GAC ACT TGG TAC AAA TAT ATT TTC CGC AGC GCC GGT 1540TAC GAA GAC GCG GAC ACT TGG TAC AAA TAT ATT TTC CGC AGC GCC GGT 1540

Tyr Glu Asp Ala Asp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala GlyTyr Glu Asp Ala Asp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly

480 485 490480 485 490

TAT CGC GAT GCT AAT GGC CAG CTC ATT ATG GAT GGC AGT AAA CCA CGT 1588TAT CGC GAT GCT AAT GGC CAG CTC ATT ATG GAT GGC AGT AAA CCA CGT 1588

Tyr Arg Asp Ala Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro ArgTyr Arg Asp Ala Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg

495 500 505495 500 505

TAT TGG AAT GTG ATG CCA TTG CAA CTG GAT ACC GCA TGG GAT ACC ACA 1636TAT TGG AAT GTG ATG CCA TTG CAA CTG GAT ACC GCA TGG GAT ACC ACA 1636

Tyr Trp Asn Val Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr ThrTyr Trp Asn Val Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr

510 515 520510 515 520

CAG CCC GCC ACC ACT GAT CCA GAT GTG ATC GCT ATG GCG GAC CCG ATG 1684CAG CCC GCC ACC ACT GAT CCA GAT GTG ATC GCT ATG GCG GAC CCG ATG 1684

Gln Pro Ala Thr Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro MetGln Pro Ala Thr Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met

525 530 535 540525 530 535 540

CAT TAC AAG CTG GCG ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC 1732CAT TAC AAG CTG GCG ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC 1732

His Tyr Lys Leu Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile AlaHis Tyr Lys Leu Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala

545 550 555545 550 555

CGA GGC GAC AGC GCT TAC CGT CAA CTT GAA CGC GAT ACT CTA GTC GAA 1780CGA GGC GAC AGC GCT TAC CGT CAA CTT GAA CGC GAT ACT CTA GTC GAA 1780

Arg Gly Asp Ser Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val GluArg Gly Asp Ser Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu

560 565 570560 565 570

GCC AAA ATG TAC TAC ATT CAG GCA CAA CAG CTA CTG GGA CCG CGC CCT 1828GCC AAA ATG TAC TAC ATT CAG GCA CAA CAG CTA CTG GGA CCG CGC CCT 1828

Ala Lys Met Tyr Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg ProAla Lys Met Tyr Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro

575 580 585575 580 585

GAT ATC CAT ACC ACC AAT ACT TGG CCA AAT CCC ACC TTG AGT AAA GAA 1876GAT ATC CAT ACC ACC AAT ACT TGG CCA AAT CCC ACC TTG AGT AAA GAA 1876

Asp Ile His Thr Thr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys GluAsp Ile His Thr Thr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu

590 595 600590 595 600

GCT GGC GCT ATT GCC ACA CCG ACA TTC CTC AGT TCA CCG GAG GTG ATG 1924GCT GGC GCT ATT GCC ACA CCG ACA TTC CTC AGT TCA CCG GAG GTG ATG 1924

Ala Gly Ala Ile Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val MetAla Gly Ala Ile Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met

605 610 615 620605 610 615 620

ACG TTC GCT GCC TGG CTA AGC GCA GGC GAT ACC GCA AAT ATT GGC GAC 1972ACG TTC GCT GCC TGG CTA AGC GCA GGC GAT ACC GCA AAT ATT GGC GAC 1972

Thr Phe Ala Ala Trp Leu Ser Ala Gly Asp Thr Ala Asn Ile Gly AspThr Phe Ala Ala Trp Leu Ser Ala Gly Asp Thr Ala Asn Ile Gly Asp

625 630 635625 630 635

GGT GAT TTC TTG CCA CCG TAC AAC GAT GTA CTA CTC GGT TAC TGG GAT 2020GGT GAT TTC TTG CCA CCG TAC AAC GAT GTA CTA CTC GGT TAC TGG GAT 2020

Gly Asp Phe Leu Pro Pro Tyr Asn Asp Val Leu Leu Gly Tyr Trp AspGly Asp Phe Leu Pro Pro Tyr Asn Asp Val Leu Leu Gly Tyr Trp Asp

640 645 650640 645 650

AAA CTT GAG TTA CGC CTA TAC AAC CTG CGC CAC AAT CTG AGT CTG GAT 2068AAA CTT GAG TTA CGC CTA TAC AAC CTG CGC CAC AAT CTG AGT CTG GAT 2068

Lys Leu Glu Leu Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu AspLys Leu Glu Leu Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp

655 660 665655 660 665

GGT CAA CCG CTA AAT CTG CCA CTG TAT GCC ACG CCG GTA GAC CCG AAA 2116GGT CAA CCG CTA AAT CTG CCA CTG TAT GCC ACG CCG GTA GAC CCG AAA 2 116

Gly Gln Pro Leu Asn Leu Pro Leu Tyr Ala Thr Pro Val Asp Pro LysGly Gln Pro Leu Asn Leu Pro Leu Tyr Ala Thr Pro Val Asp Pro Lys

670 675 680670 675 680

ACC CTG CAA CGC CAG CAA GCC GGA GGG GAC GGT ACA GGC AGT AGT CCG 2164ACC CTG CAA CGC CAG CAA GCC GGA GGG GAC GGT ACA GGC AGT AGT CCG 2164

Thr Leu Gln Arg Gln Gln Ala Gly Gly Asp Gly Thr Gly Ser Ser ProThr Leu Gln Arg Gln Gln Ala Gly Gly Asp Gly Thr Gly Ser Ser Pro

685 690 695 700685 690 695 700

GCT GGT GGT CAA GGC AGT GTT CAG GGC TGG CGC TAT CCG TTA TTG GTA 2212GCT GGT GGT CAA GGC AGT GTT CAG GGC TGG CGC TAT CCG TTA TTG GTA 2212

Ala Gly Gly Gln Gly Ser Val Gln Gly Trp Arg Tyr Pro Leu Leu ValAla Gly Gly Gln Gly Ser Val Gln Gly Trp Arg Tyr Pro Leu Leu Val

705 710 715705 710 715

GAA CGC GCC CGC TCT GCC GTG AGT TTG TTG ACT CAG TTC GGC AAC AGC 2260GAA CGC GCC CGC TCT GCC GTG AGT TTG TTG ACT CAG TTC GGC AAC AGC 2260

Glu Arg Ala Arg Ser Ala Val Ser Leu Leu Thr Gln Phe Gly Asn SerGlu Arg Ala Arg Ser Ala Val Ser Leu Leu Thr Gln Phe Gly Asn Ser

720 725 730720 725 730

TTA CAA ACA ACG TTA GAA CAT CAG GAT AAT GAA AAA ATG ACG ATA CTG 2308TTA CAA ACA ACG TTA GAA CAT CAG GAT AAT GAA AAA ATG ACG ATA CTG 2308

Leu Gln Thr Thr Leu Glu His Gln Asp Asn Glu Lys Met Thr Ile LeuLeu Gln Thr Thr Leu Glu His Gln Asp Asn Glu Lys Met Thr Ile Leu

735 740 745735 740 745

TTG CAG ACT CAA CAG GAA GCC ATC CTG AAA CAT CAG CAC GAT ATA CAA 2356TTG CAG ACT CAA CAG GAA GCC ATC CTG AAA CAT CAG CAC GAT ATA CAA 2356

Leu Gln Thr Gln Gln Glu Ala Ile Leu Lys His Gln His Asp Ile GlnLeu Gln Thr Gln Gln Glu Ala Ile Leu Lys His Gln His Asp Ile Gln

750 755 760750 755 760

CAA AAT AAT CTA AAA GGA TTA CAA CAC AGC CTG ACC GCA TTA CAG GCT 2404CAA AAT AAT CTA AAA GGA TTA CAA CAC AGC CTG ACC GCA TTA CAG GCT 2404

Gln Asn Asn Leu Lys Gly Leu Gln His Ser Leu Thr Ala Leu Gln AlaGln Asn Asn Leu Lys Gly Leu Gln His Ser Leu Thr Ala Leu Gln Ala

765 770 775 780765 770 775 780

AGC CGT GAT GGC GAC ACA TTG CGG CAA AAA CAT TAC AGC GAC CTG ATT 2452AGC CGT GAT GGC GAC ACA TTG CGG CAA AAA CAT TAC AGC GAC CTG ATT 2452

Ser Arg Asp Gly Asp Thr Leu Arg Gln Lys His Tyr Ser Asp Leu IleSer Arg Asp Gly Asp Thr Leu Arg Gln Lys His Tyr Ser Asp Leu Ile

785 790 795785 790 795

AAC GGT GGT CTA TCT GCG GCA GAA ATC GCC GGT CTG ACA CTA CGC AGC 2500AAC GGT GGT CTA TCT GCG GCA GAA ATC GCC GGT CTG ACA CTA CGC AGC 2500

Asn Gly Gly Leu Ser Ala Ala Glu Ile Ala Gly Leu Thr Leu Arg SerAsn Gly Gly Leu Ser Ala Ala Glu Ile Ala Gly Leu Thr Leu Arg Ser

800 805 810800 805 810

ACC GCC ATG ATT ACC AAT GGC GTT GCA ACG GGA TTG CTG ATT GCC GGC 2548ACC GCC ATG ATT ACC AAT GGC GTT GCA ACG GGA TTG CTG ATT GCC GGC 2548

Thr Ala Met Ile Thr Asn Gly Val Ala Thr Gly Leu Leu Ile Ala GlyThr Ala Met Ile Thr Asn Gly Val Ala Thr Gly Leu Leu Ile Ala Gly

815 820 825815 820 825

GGA ATC GCC AAC GCG GTA CCT AAC GTC TTC GGG CTG GCT AAC GGT GGA 2596GGA ATC GCC AAC GCG GTA CCT AAC GTC TTC GGG CTG GCT AAC GGT GGA 2596

Gly Ile Ala Asn Ala Val Pro Asn Val Phe Gly Leu Ala Asn Gly GlyGly Ile Ala Asn Ala Val Pro Asn Val Phe Gly Leu Ala Asn Gly Gly

830 835 840830 835 840

TCG GAA TGG GGA GCG CCA TTA ATT GGC TCC GGG CAA GCA ACC CAA GTT 2644TCG GAA TGG GGA GCG CCA TTA ATT GGC TCC GGG CAA GCA ACC CAA GTT 2644

Ser Glu Trp Gly Ala Pro Leu Ile Gly Ser Gly Gln Ala Thr Gln ValSer Glu Trp Gly Ala Pro Leu Ile Gly Ser Gly Gln Ala Thr Gln Val

845 850 855 860845 850 855 860

GGC GCC GGC ATC CAG GAT CAG AGC GCG GGC ATT TCA GAA GTG ACA GCA 2692GGC GCC GGC ATC CAG GAT CAG AGC GCG GGC ATT TCA GAA GTG ACA GCA 2692

Gly Ala Gly Ile Gln Asp Gln Ser Ala Gly Ile Ser Glu Val Thr AlaGly Ala Gly Ile Gln Asp Gln Ser Ala Gly Ile Ser Glu Val Thr Ala

865 870 875865 870 875

GGC TAT CAG CGT CGT CAG GAA GAA TGG GCA TTG CAA CGG GAT ATT GCT 2740GGC TAT CAG CGT CGT CAG GAA GAA TGG GCA TTG CAA CGG GAT ATT GCT 2740

Gly Tyr Gln Arg Arg Gln Glu Glu Trp Ala Leu Gln Arg Asp Ile AlaGly Tyr Gln Arg Arg Gln Glu Glu Trp Ala Leu Gln Arg Asp Ile Ala

880 885 890880 885 890

GAT AAC GAA ATA ACC CAA CTG GAT GCC CAG ATA CAA AGC CTG CAA GAG 2788GAT AAC GAA ATA ACC CAA CTG GAT GCC CAG ATA CAA AGC CTG CAA GAG 2788

Asp Asn Glu Ile Thr Gln Leu Asp Ala Gln Ile Gln Ser Leu Gln GluAsp Asn Glu Ile Thr Gln Leu Asp Ala Gln Ile Gln Ser Leu Gln Glu

895 900 905895 900 905

CAA ATC ACG ATG GCA CAA AAA CAG ATC ACG CTC TCT GAA ACC GAA CAA 2836CAA ATC ACG ATG GCA CAA AAA CAG ATC ACG CTC TCT GAA ACC GAA CAA 2836

Gln Ile Thr Met Ala Gln Lys Gln Ile Thr Leu Ser Glu Thr Glu GlnGln Ile Thr Met Ala Gln Lys Gln Ile Thr Leu Ser Glu Thr Glu Gln

910 915 920910 915 920

GCG AAT GCC CAA GCG ATT TAT GAC CTG CAA ACC ACT CGT TTT ACC GGG 2884GCG AAT GCC CAA GCG ATT TAT GAC CTG CAA ACC ACT CGT TTT ACC GGG 2884

Ala Asn Ala Gln Ala Ile Tyr Asp Leu Gln Thr Thr Arg Phe Thr GlyAla Asn Ala Gln Ala Ile Tyr Asp Leu Gln Thr Thr Arg Phe Thr Gly

925 930 935 940925 930 935 940

CAG GCA CTG TAT AAC TGG ATG GCC GGT CGT CTC TCC GCG CTC TAT TAC 2932CAG GCA CTG TAT AAC TGG ATG GCC GGT CGT CTC TCC GCG CTC TAT TAC 2932

Gln Ala Leu Tyr Asn Trp Met Ala Gly Arg Leu Ser Ala Leu Tyr TyrGln Ala Leu Tyr Asn Trp Met Ala Gly Arg Leu Ser Ala Leu Tyr Tyr

945 950 955945 950 955

CAA ATG TAT GAT TCC ACT CTG CCA ATC TGT CTC CAG CCA AAA GCC GCA 2980CAA ATG TAT GAT TCC ACT CTG CCA ATC TGT CTC CAG CCA AAA GCC GCA 2980

Gln Met Tyr Asp Ser Thr Leu Pro Ile Cys Leu Gln Pro Lys Ala AlaGln Met Tyr Asp Ser Thr Leu Pro Ile Cys Leu Gln Pro Lys Ala Ala

960 965 970960 965 970

TTA GTA CAG GAA TTA GGC GAG AAA GAG AGC GAC AGT CTT TTC CAG GTT 3028TTA GTA CAG GAA TTA GGC GAG AAA GAG AGC GAC AGT CTT TTC CAG GTT 3028

Leu Val Gln Glu Leu Gly Glu Lys Glu Ser Asp Ser Leu Phe Gln ValLeu Val Gln Glu Leu Gly Glu Lys Glu Ser Asp Ser Leu Phe Gln Val

975 980 985975 980 985

CCG GTG TGG AAT GAT CTG TGG CAA GGG CTG TTA GCA GGA GAA GGT TTA 3076CCG GTG TGG AAT GAT CTG TGG CAA GGG CTG TTA GCA GGA GAA GGT TTA 3076

Pro Val Trp Asn Asp Leu Trp Gln Gly Leu Leu Ala Gly Glu Gly LeuPro Val Trp Asn Asp Leu Trp Gln Gly Leu Leu Ala Gly Glu Gly Leu

990 995 1000990 995 1000

AGT TCA GAG CTA CAG AAA CTG GAT GCC ATC TGG CTT GCA CGT GGT GGT 3124AGT TCA GAG CTA CAG AAA CTG GAT GCC ATC TGG CTT GCA CGT GGT GGT 3124

Ser Ser Glu Leu Gln Lys Leu Asp Ala Ile Trp Leu Ala Arg Gly GlySer Ser Glu Leu Gln Lys Leu Asp Ala Ile Trp Leu Ala Arg Gly Gly

1005 1010 1015 10201005 1010 1015 1020

ATT GGG CTA GAA GCC ATC CGC ACC GTG TCG CTG GAT ACC CTG TTT GGC 3172ATT GGG CTA GAA GCC ATC CGC ACC GTG TCG CTG GAT ACC CTG TTT GGC 3172

Ile Gly Leu Glu Ala Ile Arg Thr Val Ser Leu Asp Thr Leu Phe GlyIle Gly Leu Glu Ala Ile Arg Thr Val Ser Leu Asp Thr Leu Phe Gly

1025 1030 10351025 1030 1035

ACA GGG ACG TTA AGT GAA AAT ATC AAT AAA GTG CTT AAC GGG GAA ACG 3220ACA GGG ACG TTA AGT GAA AAT ATC AAT AAA GTG CTT AAC GGG GAA ACG 3220

Thr Gly Thr Leu Ser Glu Asn Ile Asn Lys Val Leu Asn Gly Glu ThrThr Gly Thr Leu Ser Glu Asn Ile Asn Lys Val Leu Asn Gly Glu Thr

1040 1045 10501040 1045 1050

GTA TCT CCA TCC GGT GGC GTC ACT CTG GCG CTG ACA GGG GAT ATC TTC 3268GTA TCT CCA TCC GGT GGC GTC ACT CTG GCG CTG ACA GGG GAT ATC TTC 3268

Val Ser Pro Ser Gly Gly Val Thr Leu Ala Leu Thr Gly Asp Ile PheVal Ser Pro Ser Gly Gly Val Thr Leu Ala Leu Thr Gly Asp Ile Phe

1055 1060 10651055 1060 1065

CAA GCA ACA CTG GAT TTG AGT CAG CTA GGT TTG GAT AAC TCT TAC AAC 3316CAA GCA ACA CTG GAT TTG AGT CAG CTA GGT TTG GAT AAC TCT TAC AAC 3316

Gln Ala Thr Leu Asp Leu Ser Gln Leu Gly Leu Asp Asn Ser Tyr AsnGln Ala Thr Leu Asp Leu Ser Gln Leu Gly Leu Asp Asn Ser Tyr Asn

1070 1075 10801070 1075 1080

TTG GGT AAC GAG AAG AAA CGT CGT ATT AAA CGT ATC GCC GTC ACC CTG 3364TTG GGT AAC GAG AAG AAA CGT CGT ATT AAA CGT ATC GCC GTC ACC CTG 3364

Leu Gly Asn Glu Lys Lys Arg Arg Ile Lys Arg Ile Ala Val Thr LeuLeu Gly Asn Glu Lys Lys Arg Arg Ile Lys Arg Ile Ala Val Thr Leu

1085 1090 1095 11001085 1090 1095 1100

CCA ACA CTT CTG GGG CCA TAT CAA GAT CTT GAA GCC ACA CTG GTA ATG 3412CCA ACA CTT CTG GGG CCA TAT CAA GAT CTT GAA GCC ACA CTG GTA ATG 3412

Pro Thr Leu Leu Gly Pro Tyr Gln Asp Leu Glu Ala Thr Leu Val MetPro Thr Leu Leu Gly Pro Tyr Gln Asp Leu Glu Ala Thr Leu Val Met

1105 1110 11151105 1110 1115

GGT GCG GAA ATC GCC GCC TTA TCA CAC GGT GTG AAT GAC GGA GGC CGG 3460GGT GCG GAA ATC GCC GCC TTA TCA CAC GGT GTG AAT GAC GGA GGC CGG 3460

Gly Ala Glu Ile Ala Ala Leu Ser His Gly Val Asn Asp Gly Gly ArgGly Ala Glu Ile Ala Ala Leu Ser His Gly Val Asn Asp Gly Gly Arg

1120 1125 11301120 1125 1130

TTT GTT ACC GAC TTT AAC GAC AGC CGT TTT CTG CCT TTT GAA GGT CGA 3508TTT GTT ACC GAC TTT AAC GAC AGC CGT TTT CTG CCT TTT GAA GGT CGA 3508

Phe Val Thr Asp Phe Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly ArgPhe Val Thr Asp Phe Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Arg

1135 1140 11451135 1140 1145

GAT GCA ACA ACC GGC ACA CTG GAG CTC AAT ATT TTC CAT GCG GGT AAA 3556GAT GCA ACA ACC GGC ACA CTG GAG CTC AAT ATT TTC CAT GCG GGT AAA 3556

Asp Ala Thr Thr Gly Thr Leu Glu Leu Asn Ile Phe His Ala Gly LysAsp Ala Thr Thr Gly Thr Leu Glu Leu Asn Ile Phe His Ala Gly Lys

1150 1155 11601150 1155 1160

GAG GGA ACG CAA CAC GAG TTG GTC GCG AAT CTG AGT GAC ATC ATT GTG 3604GAG GGA ACG CAA CAC GAG TTG GTC GCG AAT CTG AGT GAC ATC ATT GTG 3604

Glu Gly Thr Gln His Glu Leu Val Ala Asn Leu Ser Asp Ile Ile ValGlu Gly Thr Gln His Glu Leu Val Ala Asn Leu Ser Asp Ile Ile Val

1165 1170 1175 11801165 1170 1175 1180

CAT CTG AAT TAC ATC ATT CGA GAC GCG TAA ATTTCTTTTC TTTGTCGATT 3654CAT CTG AAT TAC ATC ATT CGA GAC GCG TAA ATTTCTTTTC TTTGTCGATT 3654

His Leu Asn Tyr Ile Ile Arg Asp Ala *His Leu Asn Tyr Ile Ile Arg Asp Ala *

1185 11901185 1190

ACAGGTCCCT ATCAGGGGCC TGTTATTAAG GAGTACTTTA TGCAGGATTC ACCAGAAGTA 3714ACAGGTCCCT ATCAGGGGCC TGTTATTAAG GAGTACTTTA TGCAGGATTC ACCAGAAGTA 3714

TCGATTACAA CGCTGTCACT TCCCAAAGGT GGCGGTGCTA TCAATGGCAT GGGAGAAGCA 3774TCGATTACAA CGCTGTCACT TCCCAAAGGT GGCGGTGCTA TCAATGGCAT GGGAGAAGCA 3774

CTGAATGCTG CCGGCCCTGA TGGAATGGCC TCCCTATCTC TGCCATTACC CCTTTCGACC 3834CTGAATGCTG CCGGCCCTGA TGGAATGGCC TCCCTATCTC TGCCATTACC CCTTTCGACC 3834

GGCAGAGGGA CGGCTCCTGG ATTATCGCTG ATTTACAGCA ACAGTGCAGG TAATGGGCCT 3894GGCAGAGGGA CGGCTCCTGG ATTATCGCTG ATTTACAGCA ACAGTGCAGG TAATGGGCCT 3894

TTCGGCATCG GCTGGCAATG CGGTGTTATG TCCATTAGCC GACGCACCCA ACATGGCATT 3954TTCGGCATCG GCTGGCAATG CGGTGTTATG TCCATTAGCC GACGCACCCA ACATGGCATT 3954

CCACAATACG GTAATGACGA CACGTTCCTA TCCCCACAAG GCGAGGTCAT GAATATCGCC 4014CCACAATACG GTAATGACGA CACGTTCCTA TCCCCACAAG GCGAGGTCAT GAATATCGCC 4014

CTGAATGACC AAGGGCAACC TGATATCCGT CAAGACGTTA AAACGCTGCA AGGCGTTACC 4074CTGAATGACC AAGGGCAACC TGATATCCGT CAAGACGTTA AAACGCTGCA AGGCGTTACC 4074

TTGCCAATTT CCTATACCGT GACCCGCTAT CAAGCCCGCC AGATCCTGGA TTTCAGTAAA 4134TTGCCAATTT CCTATACCGT GACCCGCTAT CAAGCCCGCC AGATCCTGGA TTTCAGTAAA 4134

ATCGAATACT GGCAACCTGC CTCCGGTCAA GAAGGACGCG CTTTCTGGCT GATATCGACA 4194ATCGAATACT GGCAACCTGC CTCCGGTCAA GAAGGACGCG CTTTCTGGCT GATATCGACA 4194

CCGGACGGGC ATCTACACAT CTTAGGGAAA ACCGCGCAGG CTTGTCTGGC AAATCCGCAA 4254CCGGACGGGC ATCTACACAT CTTAGGGAAA ACCGCGCAGG CTTGTCTGGC AAATCCGCAA 4254

AATGACCAAC AAATCGCCCA GTGGTTGCTG GAAGAAACTG TGACGCCAGC CGGTGAACAT 4314AATGACCAAC AAATCGCCCA GTGGTTGCTG GAAGAAACTG TGACGCCAGC CGGTGAACAT 4314

GTCAGCTATC AATATCGAGC CGAAGATGAA GCCCATTGTG ACGACAATGA AAAAACCGCT 4374GTCAGCTATC AATATCGAGC CGAAGATGAA GCCCATTGTG ACGACAATGA AAAAACCGCT 4374

CATCCCAATG TTACCGCACA GCGCTATCTG GTACAGGTGA ACTACAGGCA ACATCAAACC 4434CATCCCAATG TTACCGCACA GCGCTATCTG GTACAGGTGA ACTACAGGCA ACATCAAACC 4434

ACAAGCCAGC CTGTTCGTAC TGGATAACGC ACCTCCCGCA CCGGAAGAGT GGCTGTTTCA 4494ACAAGCCAGC CTGTTCGTAC TGGATAACGC ACCTCCCGCA CCGGAAGAGT GGCTGTTTCA 4494

TCTGGTCTTT GACCACGGTG AGCGCGTACC TCACTTCATA CCGTGCCAAC ATGGGATGCA 4554TCTGGTCTTT GACCACGGTG AGCGCGTACC TCACTTCATA CCGTGCCAAC ATGGGATGCA 4554

GGTACAGCGC AATGGTCTGT ACGCCCGGAT ATCTTCTCTC GCTATGAATA TGGTTTTGAA 4614GGTACAGCGC AATGGTCTGT ACGCCCGGAT ATCTTCTCTC GCTATGAATA TGGTTTTGAA 4614

GTGCGTACTC GCCGCTTATG TCAACAAGTG CTGATGTTTC ACCGCACCGC GCTCATGGCC 4674GTGCGTACTC GCCGCTTATG TCAACAAGTG CTGATGTTTC ACCGCACCGC GCTCATGGCC 4674

GGAGAAGCCA GTACCAATGA CGCCCCGGAA CTGGTTGGAC GCTTAATACT GGAATATGAC 4634GGAGAAGCCA GTACCAATGA CGCCCCGGAA CTGGTTGGAC GCTTAATACT GGAATATGAC 4634

AAAAACGCCA GCGTCACCAC GTTGATTACC ATCCGTCAAT TAAGCCATGA ATCGGACGGG 4794AAAAACGCCA GCGTCACCAC GTTGATTACC ATCCGTCAAT TAAGCCATGA ATCGGACGGG 4794

AGGCCAGTCA CCCAGCCACC ACTAGAACTA GCCTGGCAAC GGTTTGATCT GGAGAAAATC 4854AGGCCAGTCA CCCAGCCACC ACTAGAACTA GCCTGGCAAC GGTTTGATCT GGAGAAAATC 4854

CCGACATGGC AACGCTTTGA CGCACTAGAT AATTTTAACT CGCAGCAACG TTATCAACTG 4865CCGACATGGC AACGCTTTGA CGCACTAGAT AATTTTAACT CGCAGCAACG TTATCAACTG 4865

GTTGATCTGC GGGGAGAAGG GTTGCCAGGT ATGCTGTATC AAGATCGAGG CGCTTGGTGG 4914GTTGATCTGC GGGGAGAAGG GTTGCCAGGT ATGCTGTATC AAGATCGAGG CGCTTGGTGG 4914

TATAAAGCTC CGCAACGTCA GGAAGACGGA GACAGCAATG CCGTCACTTA CGACAAAATC 4974TATAAAGCTC CGCAACGTCA GGAAGACGGA GACAGCAATG CCGTCACTTA CGACAAAATC 4974

GCCCCACTGC CTACCCTACC CAATTTGCAG GATAATGCCT CATTGATGGA TATCAACGGA 5034GCCCCACTGC CTACCCTACC CAATTTGCAG GATAATGCCT CATTGATGGA TATCAACGGA 5034

GACGGCCAAC TGGATTGGGT TGTTACCGCC TCCGGTATTC GCGGATACCA TAGTCAGCAA 5094GACGGCCAAC TGGATTGGGT TGTTACCGCC TCCGGTATTC GCGGATACCA TAGTCAGCAA 5094

CCCGATGGAA AGTGGACGCA CTTTACGCCA ATCAATGCCT TGCCCGTGGA ATATTTTCAT 5214CCCGATGGAA AGTGGACGCA CTTTACGCCA ATCAATGCCT TGCCCGTGGA ATATTTTCAT 5214

CCAAGCATCC AGTTCGCTGA CCTTACCGGG GCAGGCTTAT CTGATTTAGT GTTGATCGGG 5274CCAAGCATCC AGTTCGCTGA CCTTACCGGG GCAGGCTTAT CTGATTTAGT GTTGATCGGG 5274

CCGAAAAGCG TGCGTCTATA TGCCAACCAG CGAAACGGCT GGCGTAAAGG AGAAGATGTC 5334CCGAAAAGCG TGCGTCTATA TGCCAACCAG CGAAACGGCT GGCGTAAAGG AGAAGATGTC 5334

CCCCAATCCA CAGGTATCAC CCTGCCTGTC ACAGGGACCG ATGCCCGCAA ACTGGTGGCT 5394CCCCAATCCA CAGGTATCAC CCTGCCTGTC ACAGGGACCG ATGCCCGCAA ACTGGTGGCT 5394

TTCAGTGATA TGCTCGGTTC CGGTCAACAA CATCTGGTGG AAATCAAGGG TAATCGCGTC 5454TTCAGTGATA TGCTCGGTTC CGGTCAACAA CATCTGGTGG AAATCAAGGG TAATCGCGTC 5454

ACCTGTTGGC CGAATCTAGG GCATGGCCGT TTCGGTCAAC CACTAACTCT GTCAGGATTT 5514ACCTGTTGGC CGAATCTAGG GCATGGCCGT TTCGGTCAAC CACTAACTCT GTCAGGATTT 5514

AGCCAGCCCG AAAATAGCTT CAATCCCGAA CGGCTGTTTC TGGCGGATAT CGACGGCTCC 5574AGCCAGCCCG AAAATAGCTT CAATCCCGAA CGGCTGTTTC TGGCGGATAT CGACGGCTCC 5574

GGCACCACCG ACCTTATCTA TGCGCAATCC GGCTCTTTGC TCATTTATCT CAACCAAAGT 5634GGCACCACCG ACCTTATCTA TGCGCAATCC GGCTCTTTGC TCATTTATCT CAACCAAAGT 5634

GGTAATCAGT TTGATGCCCC GTTGACATTA GCGTTGCCAG AAGGCGTACA ATTTGACAAC 5694GGTAATCAGT TTGATGCCCC GTTGACATTA GCGTTGCCAG AAGGCGTACA ATTTGACAAC 5694

ACTTGCCAAC TTCAAGTCGC CGATATTCAG GGATTAGGGA TAGCCAGCTT GATTCTGACT 5754ACTTGCCAAC TTCAAGTCGC CGATATTCAG GGATTAGGGA TAGCCAGCTT GATTCTGACT 5754

GTGCCACATA TCGCGCCACA TCACTGGCGT TGTGACCTGT CACTGACCAA ACCCTGGTTG 5814GTGCCACATA TCGCGCCACA TCACTGGCGT TGTGACCTGT CACTGACCAA ACCCTGGTTG 5814

TTGAATGTAA TGAACAATAA CCGGGGCGCA CATCACACGC TACATTATCG TAGTTCCGCG 5874TTGAATGTAA TGAACAATAA CCGGGGCGCA CATCACACGC TACATTATCG TAGTTCCGCG 5874

CAATTCTGGT TGGATGAAAA ATTACAGCTC ACCAAAGCAG GCAAATCTCC GGCTTGTTAT 5934CAATTCTGGT TGGATGAAAA ATTACAGCTC ACCAAAGCAG GCAAATCTCC GGCTTGTTAT 5934

CTGCCGTTTC CAATGCATTT GCTATGGTAT ACCGAAATTC AGGATGAAAT CAGCGGCAAC 5994CTGCCGTTTC CAATGCATTT GCTATGGTAT ACCGAAATTC AGGATGAAAT CAGCGGCAAC 5994

CGGCTCACCA GTGAAGTCAA CTACAGCCAC GGCGTCTGGG ATGGTAAAGA GCGGGAATTC 6054CGGCTCACCA GTGAAGTCAA CTACAGCCAC GGCGTCTGGG ATGGTAAAGA GCGGGAATTC 6054

(2) INFORMATION FOR SEQ ID NO:26:(2) INFORMATION FOR SEQ ID NO: 26:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1189 amino acids(A) LENGTH: 1189 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:26 (TcaB protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 26 (TcaB protein):

Met Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg AspMet Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp

1 5 10 151 5 10 15

Ala Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu LysAla Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu Lys

20 25 3020 25 30

Glu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu AspGlu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu Asp

35 40 4535 40 45

Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala IleThr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile

50 55 6050 55 60

Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp GlyGly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp Gly

65 70 75 8065 70 75 80

Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe LeuThr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe Leu

85 90 9585 90 95

Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly LysTyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly Lys

100 105 110100 105 110

Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu ArgGlu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu Arg

115 120 125115 120 125

Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser GlnLeu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser Gln

130 135 140130 135 140

Gly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr LeuGly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr Leu

145 150 155 160145 150 155 160

Ile Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys GlnIle Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys Gln

165 170 175165 170 175

Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn AlaGly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn Ala

180 185 190180 185 190

Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly GlyPro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly Gly

195 200 205195 200 205

Lys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala GlyLys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala Gly

210 215 220210 215 220

Ile Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn AsnIle Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn Asn

225 230 235 240225 230 235 240

Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile AspLys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile Asp

245 250 255245 250 255

Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp AlaPhe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp Ala

260 265 270260 265 270

Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg ValSer Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg Val

275 280 285275 280 285

Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr GlyGly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr Gly

290 295 300290 295 300

Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile PheSer Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile Phe

305 310 315 320305 310 315 320

Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys TyrGln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys Tyr

325 330 335325 330 335

Asp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala AsnAsp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala Asn

340 345 350340 345 350

Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His GlyLeu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His Gly

355 360 365355 360 365

Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile AsnGln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile Asn

370 375 380370 375 380

Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys GlnThr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys Gln

385 390 395 400385 390 395 400

Phe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn TyrPhe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn Tyr

405 410 415405 410 415

Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu AsnVal Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu Asn

420 425 430420 425 430

Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn PheTyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn Phe

435 440 445435 440 445

Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile ProSer Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile Pro

450 455 460450 455 460

Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp AlaPhe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp Ala

465 470 475 480465 470 475 480

Asp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp AlaAsp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp Ala

485 490 495485 490 495

Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn ValAsn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn Val

500 505 510500 505 510

Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala ThrMet Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala Thr

515 520 525515 520 525

Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys LeuThr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys Leu

530 535 540530 535 540

Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp SerAla Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp Ser

545 550 555 560545 550 555 560

Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met TyrAla Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met Tyr

565 570 575565 570 575

Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His ThrTyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His Thr

580 585 590580 585 590

Thr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala IleThr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala Ile

595 600 605595 600 605

Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala AlaAla Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala Ala

610 615 620610 615 620

Trp Leu Ser Ala Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe LeuTrp Leu Ser Ala Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu

625 630 635 640625 630 635 640

Pro Pro Tyr Asn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu LeuPro Pro Tyr Asn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu Leu

645 650 655645 650 655

Arg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro LeuArg Leu Tyr Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu

660 665 670660 665 670

Asn Leu Pro Leu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln ArgAsn Leu Pro Leu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln Arg

675 680 685675 680 685

Gln Gln Ala Gly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly GlnGln Gln Ala Gly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly Gln

690 695 700690 695 700

Gly Ser Val Gln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala ArgGly Ser Val Gln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala Arg

705 710 715 720705 710 715 720

Ser Ala Val Ser Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr ThrSer Ala Val Ser Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr Thr

725 730 735725 730 735

Leu Glu His Gln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr GlnLeu Glu His Gln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr Gln

740 745 750740 745 750

Gln Glu Ala Ile Leu Lys His Gln His Asp Ile Gln Gln Asn Asn LeuGln Glu Ala Ile Leu Lys His Gln His Asp Ile Gln Gln Asn Asn Leu

755 760 765755 760 765

Lys Gly Leu Gln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp GlyLys Gly Leu Gln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp Gly

770 775 780770 775 780

Asp Thr Leu Arg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly LeuAsp Thr Leu Arg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly Leu

785 790 795 800785 790 795 800

Ser Ala Ala Glu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met IleSer Ala Ala Glu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met Ile

805 810 815805 810 815

Thr Asn Gly Val Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala AsnThr Asn Gly Val Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala Asn

820 825 830820 825 830

Ala Val Pro Asn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp GlyAla Val Pro Asn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp Gly

835 840 845835 840 845

Ala Pro Leu Ile Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly IleAla Pro Leu Ile Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly Ile

850 855 860850 855 860

Gln Asp Gln Ser Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln ArgGln Asp Gln Ser Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln Arg

865 870 875 880865 870 875 880

Arg Gln Glu Glu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu IleArg Gln Glu Glu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu Ile

885 890 895885 890 895

Thr Gln Leu Asp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr MetThr Gln Leu Asp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr Met

900 905 910900 905 910

Ala Gln Lys Gln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala GlnAla Gln Lys Gln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala Gln

915 920 925915 920 925

Ala Ile Tyr Asp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu TyrAla Ile Tyr Asp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu Tyr

930 935 940930 935 940

Asn Trp Met Ala Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr AspAsn Trp Met Ala Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr Asp

945 950 955 960945 950 955 960

Ser Thr Leu Pro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln GluSer Thr Leu Pro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln Glu

965 970 975965 970 975

Leu Gly Glu Lys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp AsnLeu Gly Glu Lys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp Asn

980 985 990980 985 990

Asp Leu Trp Gln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu LeuAsp Leu Trp Gln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu Leu

995 1000 1005995 1000 1005

Gln Lys Leu Asp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu GluGln Lys Leu Asp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu Glu

1010 1015 10201010 1015 1020

Ala Ile Arg Thr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr LeuAla Ile Arg Thr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr Leu

1025 1030 1035 10401025 1030 1035 1040

Ser Glu Asn Ile Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro SerSer Glu Asn Ile Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro Ser

1045 1050 10551045 1050 1055

Gly Gly Val Thr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr LeuGly Gly Val Thr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr Leu

1060 1065 10701060 1065 1070

Asp Leu Ser Gln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn GluAsp Leu Ser Gln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn Glu

1075 1080 10851075 1080 1085

Lys Lys Arg Arg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu LeuLys Lys Arg Arg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu Leu

1090 1095 11001090 1095 1100

Gly Pro Tyr Gln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu IleGly Pro Tyr Gln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu Ile

1105 1110 1115 11201105 1110 1115 1120

Ala Ala Leu Ser His Gly Val Asn Asp Gly Gly Arg Phe Val Thr AspAla Ala Leu Ser His Gly Val Asn Asp Gly Gly Arg Phe Val Thr Asp

1125 1130 11351125 1130 1135

Phe Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr ThrPhe Asn Asp Ser Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr Thr

1140 1145 11501140 1145 1150

Gly Thr Leu Glu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr GlnGly Thr Leu Glu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr Gln

1155 1160 11651155 1160 1165

His Glu Leu Val Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn TyrHis Glu Leu Val Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn Tyr

1170 1175 11801170 1175 1180

Ile Ile Arg Asp Ala *Ile Ile Arg Asp Ala *

1185 11901185 1190

(2) INFORMATION FOR SEQ ID NO:27:(2) INFORMATION FOR SEQ ID NO: 27:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1881 base pairs(A) LENGTH: 1881 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 1..1881(B) LOCATION: 1..1881

(D) OTHER INFORMATION: tcaBi(D) OTHER INFORMATION: tcaBi

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:27 (tcaBi coding region):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 27 (tcaBi coding region):

ATG TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA GAA GCG CGC CGT GAT 48ATG TCT GAA TCT TTA TTT ACA CAA ACG TTG AAA GAA GCG CGC CGT GAT 48

Met Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg AspMet Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp

1 5 10 151 5 10 15

GCA TTG GTT GCT CAT TAT ATT GCT ACT CAG GTG CCC GCA GAT TTA AAA 96GCA TTG GTT GCT CAT TAT ATT GCT ACT CAG GTG CCC GCA GAT TTA AAA 96

Ala Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu LysAla Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu Lys

20 25 3020 25 30

GAG AGT ATC CAG ACC GCG GAT GAT CTG TAC GAA TAT CTG TTG CTG GAT 144GAG AGT ATC CAG ACC GCG GAT GAT CTG TAC GAA TAT CTG TTG CTG GAT 144

Glu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu AspGlu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu Asp

35 40 4535 40 45

ACC AAA ATT AGC GAT CTG GTT ACT ACT TCA CCG CTG TCC GAA GCG ATT 192ACC AAA ATT AGC GAT CTG GTT ACT ACT TCA CCG CTG TCC GAA GCG ATT 192

Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala IleThr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile

50 55 6050 55 60

GGC AGT CTG CAA TTG TTT ATT CAT CGT GCG ATA GAG GGC TAT GAC GGC 240GGC AGT CTG CAA TTG TTT ATT CAT CGT GCG ATA GAG GGC TAT GAC GGC 240

Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp GlyGly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp Gly

65 70 75 8065 70 75 80

ACG CTG GCA GAC TCA GCA AAA CCC TAT TTT GCC GAT GAA CAG TTT TTA 288ACG CTG GCA GAC TCA GCA AAA CCC TAT TTT GCC GAT GAA CAG TTT TTA 288

Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe LeuThr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe Leu

85 90 9585 90 95

TAT AAC TGG GAT AGT TTT AAC CAC CGT TAT AGC ACT TGG GCT GGC AAG 336TAT AAC TGG GAT AGT TTT AAC CAC CGT TAT AGC ACT TGG GCT GGC AAG 336

Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly LysTyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly Lys

100 105 110100 105 110

GAA CGG TTG AAA TTC TAT GCC GGG GAT TAT ATT GAT CCA ACA TTG CGA 384GAA CGG TTG AAA TTC TAT GCC GGG GAT TAT ATT GAT CCA ACA TTG CGA 384

Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu ArgGlu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu Arg

115 120 125115 120 125

TTG AAT AAG ACC GAG ATA TTT ACC GCA TTT GAA CAA GGT ATT TCT CAA 432TTG AAT AAG ACC GAG ATA TTT ACC GCA TTT GAA CAA GGT ATT TCT CAA 432

Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser GlnLeu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser Gln

130 135 140130 135 140

GGG AAA TTA AAA AGT GAA TTA GTC GAA TCT AAA TTA CGT GAT TAT CTA 480GGG AAA TTA AAA AGT GAA TTA GTC GAA TCT AAA TTA CGT GAT TAT CTA 480

Gly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr LeuGly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr Leu

145 150 155 160145 150 155 160

ATT AGT TAT GAC ACT TTA GCC ACC CTT GAT TAT ATT ACT GCC TGC CAA 528ATT AGT TAT GAC ACT TTA GCC ACC CTT GAT TAT ATT ACT GCC TGC CAA 528

Ile Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys GlnIle Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys Gln

165 170 175165 170 175

GGC AAA GAT AAT AAA ACC ATC TTC TTT ATT GGC CGT ACA CAG AAT GCA 576GGC AAA GAT AAT AAA ACC ATC TTC TTT ATT GGC CGT ACA CAG AAT GCA 576

Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn AlaGly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn Ala

180 185 190180 185 190

CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC ACT GAT GGC GGT 624CCC TAT GCA TTT TAT TGG CGA AAA TTA ACT TTA GTC ACT GAT GGC GGT 624

Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly GlyPro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly Gly

195 200 205195 200 205

AAG TTG AAA CCA GAT CAA TGG TCA GAG TGG CGA GCA ATT AAT GCC GGG 672AAG TTG AAA CCA GAT CAA TGG TCA GAG TGG CGA GCA ATT AAT GCC GGG 672

Lys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala GlyLys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala Gly

210 215 220210 215 220

ATT AGT GAG GCA TAT TCA GGG CAT GTC GAG CCT TTC TGG GAA AAT AAC 720ATT AGT GAG GCA TAT TCA GGG CAT GTC GAG CCT TTC TGG GAA AAT AAC 720

Ile Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn AsnIle Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn Asn

225 230 235 240225 230 235 240

AAG CTG CAC ATC CGT TGG TTT ACT ATC TCG AAA GAA GAT AAA ATA GAT 768AAG CTG CAC ATC CGT TGG TTT ACT ATC TCG AAA GAA GAT AAA ATA GAT 768

Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile AspLys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile Asp

245 250 255245 250 255

TTT GTT TAT AAA AAC ATC TGG GTG ATG AGT AGC GAT TAT AGC TGG GCA 816TTT GTT TAT AAA AAC ATC TGG GTG ATG AGT AGC GAT TAT AGC TGG GCA 816

Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp AlaPhe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp Ala

260 265 270260 265 270

TCA AAG AAA AAA ATC TTG GAA CTT TCT TTT ACT GAC TAC AAT AGA GTT 864TCA AAG AAA AAA ATC TTG GAA CTT TCT TTT ACT GAC TAC AAT AGA GTT 864

Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg ValSer Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg Val

275 280 285275 280 285

GGA GCA ACA GGA TCA TCA AGC CCG ACT GAA GTA GCT TCA CAA TAT GGT 912GGA GCA ACA GGA TCA TCA AGC CCG ACT GAA GTA GCT TCA CAA TAT GGT 912

Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr GlyGly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr Gly

290 295 300290 295 300

TCT GAT GCT CAG ATG AAT ATT TCT GAT GAT GGG ACT GTA CTT ATT TTT 960TCT GAT GCT CAG ATG AAT ATT TCT GAT GAT GGG ACT GTA CTT ATT TTT 960

Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile PheSer Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile Phe

305 310 315 320305 310 315 320

CAG AAT GCC GGC GGA GCT ACT CCC AGT ACT GGA GTG ACG TTA TGT TAT 1008CAG AAT GCC GGC GGA GCT ACT CCC AGT ACT GGA GTG ACG TTA TGT TAT 1008

Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys TyrGln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys Tyr

325 330 335325 330 335

GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA GGA AGT GCA AAT 1056GAC TCT GGC AAC GTG ATT AAG AAC CTA TCT AGT ACA GGA AGT GCA AAT 1056

Asp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala AsnAsp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala Asn

340 345 350340 345 350

TTA TCG TCA AAG GAT TAT GCC ACA ACT AAA TTA CGC ATG TGT CAT GGA 1104TTA TCG TCA AAG GAT TAT GCC ACA ACT AAA TTA CGC ATG TGT CAT GGA 1104

Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His GlyLeu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His Gly

355 360 365355 360 365

CAA AGT TAC AAT GAT AAT AAC TAC TGC AAT TTT ACA CTC TCT ATT AAT 1152CAA AGT TAC AAT GAT AAT AAC TAC TGC AAT TTT ACA CTC TCT ATT AAT 1152

Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile AsnGln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile Asn

370 375 380370 375 380

ACA ATA GAA TTC ACC TCC TAC GGC ACA TTC TCA TCA GAT GGA AAA CAA 1200ACA ATA GAA TTC ACC TCC TAC GGC ACA TTC TCA TCA GAT GGA AAA CAA 1200

Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys GlnThr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys Gln

385 390 395 400385 390 395 400

TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC CTC CCT AAT TAT 1248TTT ACA CCA CCT TCT GGT TCT GCC ATT GAT TTA CAC CTC CCT AAT TAT 1248

Phe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn TyrPhe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn Tyr

405 410 415405 410 415

GTA GAT CTC AAC GCG CTA TTA GAT ATT AGC CTC GAT TCA CTA CTT AAT 1296GTA GAT CTC AAC GCG CTA TTA GAT ATT AGC CTC GAT TCA CTA CTT AAT 1296

Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu AsnVal Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu Asn

420 425 430420 425 430

TAT GAC GTT CAG GGG CAG TTT GGC GGA TCT AAT CCG GTT GAT AAT TTC 1344TAT GAC GTT CAG GGG CAG TTT GGC GGA TCT AAT CCG GTT GAT AAT TTC 1344

Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn PheTyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn Phe

435 440 445435 440 445

AGT GGT CCC TAT GGT ATT TAT CTA TGG GAA ATC TTC TTC CAT ATT CCG 1392AGT GGT CCC TAT GGT ATT TAT CTA TGG GAA ATC TTC TTC CAT ATT CCG 1392

Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile ProSer Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile Pro

450 455 460450 455 460

TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT TAC GAA GAC GCG 1440TTC CTT GTT ACG GTC CGT ATG CAA ACC GAA CAA CGT TAC GAA GAC GCG 1440

Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp AlaPhe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp Ala

465 470 475 480465 470 475 480

GAC ACT TGG TAC AAA TAT ATT TTC CGC AGC GCC GGT TAT CGC GAT GCT 1488GAC ACT TGG TAC AAA TAT ATT TTC CGC AGC GCC GGT TAT CGC GAT GCT 1488

Asp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp AlaAsp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp Ala

485 490 495485 490 495

AAT GGC CAG CTC ATT ATG GAT GGC AGT AAA CCA CGT TAT TGG AAT GTG 1536AAT GGC CAG CTC ATT ATG GAT GGC AGT AAA CCA CGT TAT TGG AAT GTG 1536

Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn ValAsn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn Val

500 505 510500 505 510

ATG CCA TTG CAA CTG GAT ACC GCA TGG GAT ACC ACA CAG CCC GCC ACC 1584ATG CCA TTG CAA CTG GAT ACC GCA TGG GAT ACC ACA CAG CCC GCC ACC 1584

Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala ThrMet Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala Thr

515 520 525515 520 525

ACT GAT CCA GAT GTG ATC GCT ATG GCG GAC CCG ATG CAT TAC AAG CTG 1632ACT GAT CCA GAT GTG ATC GCT ATG GCG GAC CCG ATG CAT TAC AAG CTG 1632

Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys LeuThr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys Leu

530 535 540530 535 540

GCG ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC CGA GGC GAC AGC 1680GCG ATA TTC CTG CAT ACC CTT GAT CTA TTG ATT GCC CGA GGC GAC AGC 1680

Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp SerAla Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp Ser

545 550 555 560545 550 555 560

GCT TAC CGT CAA CTT GAA CGC GAT ACT CTA GTC GAA GCC AAA ATG TAC 1728GCT TAC CGT CAA CTT GAA CGC GAT ACT CTA GTC GAA GCC AAA ATG TAC 1728

Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met TyrAla Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met Tyr

565 570 575565 570 575

TAC ATT CAG GCA CAA CAG CTA CTG GGA CCG CGC CCT GAT ATC CAT ACC 1776TAC ATT CAG GCA CAA CAG CTA CTG GGA CCG CGC CCT GAT ATC CAT ACC 1776

Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His ThrTyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His Thr

580 585 590580 585 590

ACC AAT ACT TGG CCA AAT CCC ACC TTG AGT AAA GAA GCT GGC GCT ATT 1824ACC AAT ACT TGG CCA AAT CCC ACC TTG AGT AAA GAA GCT GGC GCT ATT 1824

Thr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala IleThr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala Ile

595 600 605595 600 605

GCC ACA CCG ACA TTC CTC AGT TCA CCG GAG GTG ATG ACG TTC GCT GCC 1872GCC ACA CCG ACA TTC CTC AGT TCA CCG GAG GTG ATG ACG TTC GCT GCC 1872

Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala AlaAla Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala Ala

610 615 620610 615 620

TGG CTA AGC 1881TGG CTA AGC 1881

Trp Leu SerTrp Leu Ser

625625

(2) INFORMATION FOR SEQ ID NO:28:(2) INFORMATION FOR SEQ ID NO: 28:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 627 amino acids(A) LENGTH: 627 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:28 (TcaBi protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 28 (TcaBi protein):

Met Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg AspMet Ser Glu Ser Leu Phe Thr Gln Thr Leu Lys Glu Ala Arg Arg Asp

1 5 10 151 5 10 15

Ala Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu LysAla Leu Val Ala His Tyr Ile Ala Thr Gln Val Pro Ala Asp Leu Lys

20 25 3020 25 30

Glu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu AspGlu Ser Ile Gln Thr Ala Asp Asp Leu Tyr Glu Tyr Leu Leu Leu Asp

35 40 4535 40 45

Thr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala IleThr Lys Ile Ser Asp Leu Val Thr Thr Ser Pro Leu Ser Glu Ala Ile

50 55 6050 55 60

Gly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp GlyGly Ser Leu Gln Leu Phe Ile His Arg Ala Ile Glu Gly Tyr Asp Gly

65 70 75 8065 70 75 80

Thr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe LeuThr Leu Ala Asp Ser Ala Lys Pro Tyr Phe Ala Asp Glu Gln Phe Leu

85 90 9585 90 95

Tyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly LysTyr Asn Trp Asp Ser Phe Asn His Arg Tyr Ser Thr Trp Ala Gly Lys

100 105 110100 105 110

Glu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu ArgGlu Arg Leu Lys Phe Tyr Ala Gly Asp Tyr Ile Asp Pro Thr Leu Arg

115 120 125115 120 125

Leu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser GlnLeu Asn Lys Thr Glu Ile Phe Thr Ala Phe Glu Gln Gly Ile Ser Gln

130 135 140130 135 140

Gly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr LeuGly Lys Leu Lys Ser Glu Leu Val Glu Ser Lys Leu Arg Asp Tyr Leu

145 150 155 160145 150 155 160

Ile Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys GlnIle Ser Tyr Asp Thr Leu Ala Thr Leu Asp Tyr Ile Thr Ala Cys Gln

165 170 175165 170 175

Gly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn AlaGly Lys Asp Asn Lys Thr Ile Phe Phe Ile Gly Arg Thr Gln Asn Ala

180 185 190180 185 190

Pro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly GlyPro Tyr Ala Phe Tyr Trp Arg Lys Leu Thr Leu Val Thr Asp Gly Gly

195 200 205195 200 205

Lys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala GlyLys Leu Lys Pro Asp Gln Trp Ser Glu Trp Arg Ala Ile Asn Ala Gly

210 215 220210 215 220

Ile Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn AsnIle Ser Glu Ala Tyr Ser Gly His Val Glu Pro Phe Trp Glu Asn Asn

225 230 235 240225 230 235 240

Lys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile AspLys Leu His Ile Arg Trp Phe Thr Ile Ser Lys Glu Asp Lys Ile Asp

245 250 255245 250 255

Phe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp AlaPhe Val Tyr Lys Asn Ile Trp Val Met Ser Ser Asp Tyr Ser Trp Ala

260 265 270260 265 270

Ser Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg ValSer Lys Lys Lys Ile Leu Glu Leu Ser Phe Thr Asp Tyr Asn Arg Val

275 280 285275 280 285

Gly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr GlyGly Ala Thr Gly Ser Ser Ser Pro Thr Glu Val Ala Ser Gln Tyr Gly

290 295 300290 295 300

Ser Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile PheSer Asp Ala Gln Met Asn Ile Ser Asp Asp Gly Thr Val Leu Ile Phe

305 310 315 320305 310 315 320

Gln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys TyrGln Asn Ala Gly Gly Ala Thr Pro Ser Thr Gly Val Thr Leu Cys Tyr

325 330 335325 330 335

Asp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala AsnAsp Ser Gly Asn Val Ile Lys Asn Leu Ser Ser Thr Gly Ser Ala Asn

340 345 350340 345 350

Leu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His GlyLeu Ser Ser Lys Asp Tyr Ala Thr Thr Lys Leu Arg Met Cys His Gly

355 360 365355 360 365

Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile AsnGln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu Ser Ile Asn

370 375 380370 375 380

Thr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys GlnThr Ile Glu Phe Thr Ser Tyr Gly Thr Phe Ser Ser Asp Gly Lys Gln

385 390 395 400385 390 395 400

Phe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn TyrPhe Thr Pro Pro Ser Gly Ser Ala Ile Asp Leu His Leu Pro Asn Tyr

405 410 415405 410 415

Val Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu AsnVal Asp Leu Asn Ala Leu Leu Asp Ile Ser Leu Asp Ser Leu Leu Asn

420 425 430420 425 430

Tyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn PheTyr Asp Val Gln Gly Gln Phe Gly Gly Ser Asn Pro Val Asp Asn Phe

435 440 445435 440 445

Ser Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile ProSer Gly Pro Tyr Gly Ile Tyr Leu Trp Glu Ile Phe Phe His Ile Pro

450 455 460450 455 460

Phe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp AlaPhe Leu Val Thr Val Arg Met Gln Thr Glu Gln Arg Tyr Glu Asp Ala

465 470 475 480465 470 475 480

Asp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp AlaAsp Thr Trp Tyr Lys Tyr Ile Phe Arg Ser Ala Gly Tyr Arg Asp Ala

485 490 495485 490 495

Asn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn ValAsn Gly Gln Leu Ile Met Asp Gly Ser Lys Pro Arg Tyr Trp Asn Val

500 505 510500 505 510

Met Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala ThrMet Pro Leu Gln Leu Asp Thr Ala Trp Asp Thr Thr Gln Pro Ala Thr

515 520 525515 520 525

Thr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys LeuThr Asp Pro Asp Val Ile Ala Met Ala Asp Pro Met His Tyr Lys Leu

530 535 540530 535 540

Ala Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp SerAla Ile Phe Leu His Thr Leu Asp Leu Leu Ile Ala Arg Gly Asp Ser

545 550 555 560545 550 555 560

Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met TyrAla Tyr Arg Gln Leu Glu Arg Asp Thr Leu Val Glu Ala Lys Met Tyr

565 570 575565 570 575

Tyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His ThrTyr Ile Gln Ala Gln Gln Leu Leu Gly Pro Arg Pro Asp Ile His Thr

580 585 590580 585 590

Thr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala IleThr Asn Thr Trp Pro Asn Pro Thr Leu Ser Lys Glu Ala Gly Ala Ile

595 600 605595 600 605

Ala Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala AlaAla Thr Pro Thr Phe Leu Ser Ser Pro Glu Val Met Thr Phe Ala Ala

610 615 620610 615 620

Trp Leu SerTrp Leu Ser

625625

(2) INFORMATION FOR SEQ ID NO:29:(2) INFORMATION FOR SEQ ID NO: 29:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1689 base pairs(A) LENGTH: 1689 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 1..1689(B) LOCATION: 1..1689

(D) OTHER INFORMATION: tcaBii(D) OTHER INFORMATION: tcaBii

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:29 (tcaBii coding(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 29 (tcaBii coding

regaion):regaion):

GCA GGC GAT ACC GCA AAT ATT GGC GAC GGT GAT TTC TTG CCA CCG TAC 48GCA GGC GAT ACC GCA AAT ATT GGC GAC GGT GAT TTC TTG CCA CCG TAC 48

Ala Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu Pro Pro TyrAla Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu Pro Pro Tyr

1 5 10 151 5 10 15

AAC GAT GTA CTA CTC GGT TAC TGG GAT AAA CTT GAG TTA CGC CTA TAC 96AAC GAT GTA CTA CTC GGT TAC TGG GAT AAA CTT GAG TTA CGC CTA TAC 96

Asn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu Leu Arg Leu TyrAsn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu Leu Arg Leu Tyr

20 25 3020 25 30

AAC CTG CGC CAC AAT CTG AGT CTG GAT GGT CAA CCG CTA AAT CTG CCA 144AAC CTG CGC CAC AAT CTG AGT CTG GAT GGT CAA CCG CTA AAT CTG CCA 144

Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu Asn Leu ProAsn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu Asn Leu Pro

35 40 4535 40 45

CTG TAT GCC ACG CCG GTA GAC CCG AAA ACC CTG CAA CGC CAG CAA GCC 192CTG TAT GCC ACG CCG GTA GAC CCG AAA ACC CTG CAA CGC CAG CAA GCC 192

Leu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln Arg Gln Gln AlaLeu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln Arg Gln Gln Ala

50 55 6050 55 60

GGA GGG GAC GGT ACA GGC AGT AGT CCG GCT GGT GGT CAA GGC AGT GTT 240GGA GGG GAC GGT ACA GGC AGT AGT CCG GCT GGT GGT CAA GGC AGT GTT 240

Gly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly Gln Gly Ser ValGly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly Gln Gly Ser Val

65 70 75 8065 70 75 80

CAG GGC TGG CGC TAT CCG TTA TTG GTA GAA CGC GCC CGC TCT GCC GTG 288CAG GGC TGG CGC TAT CCG TTA TTG GTA GAA CGC GCC CGC TCT GCC GTG 288

Gln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala Arg Ser Ala ValGln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala Arg Ser Ala Val

85 90 9585 90 95

AGT TTG TTG ACT CAG TTC GGC AAC AGC TTA CAA ACA ACG TTA GAA CAT 336AGT TTG TTG ACT CAG TTC GGC AAC AGC TTA CAA ACA ACG TTA GAA CAT 336

Ser Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr Thr Leu Glu HisSer Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr Thr Leu Glu His

100 105 110100 105 110

CAG GAT AAT GAA AAA ATG ACG ATA CTG TTG CAG ACT CAA CAG GAA GCC 384CAG GAT AAT GAA AAA ATG ACG ATA CTG TTG CAG ACT CAA CAG GAA GCC 384

Gln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr Gln Gln Glu AlaGln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr Gln Gln Glu Ala

115 120 125115 120 125

ATC CTG AAA CAT CAG CAC GAT ATA CAA CAA AAT AAT CTA AAA GGA TTA 432ATC CTG AAA CAT CAG CAC GAT ATA CAA CAA AAT AAT CTA AAA GGA TTA 432

Ile Leu Lys His Gln His Asp Ile Gln Gln Asn Asn Leu Lys Gly LeuIle Leu Lys His Gln His Asp Ile Gln Gln Asn Asn Leu Lys Gly Leu

130 135 140130 135 140

CAA CAC AGC CTG ACC GCA TTA CAG GCT AGC CGT GAT GGC GAC ACA TTG 480CAA CAC AGC CTG ACC GCA TTA CAG GCT AGC CGT GAT GGC GAC ACA TTG 480

Gln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp Gly Asp Thr LeuGln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp Gly Asp Thr Leu

145 150 155 160145 150 155 160

CGG CAA AAA CAT TAC AGC GAC CTG ATT AAC GGT GGT CTA TCT GCG GCA 528CGG CAA AAA CAT TAC AGC GAC CTG ATT AAC GGT GGT CTA TCT GCG GCA 528

Arg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly Leu Ser Ala AlaArg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly Leu Ser Ala Ala

165 170 175165 170 175

GAA ATC GCC GGT CTG ACA CTA CGC AGC ACC GCC ATG ATT ACC AAT GGC 576GAA ATC GCC GGT CTG ACA CTA CGC AGC ACC GCC ATG ATT ACC AAT GGC 576

Glu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met Ile Thr Asn GlyGlu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met Ile Thr Asn Gly

180 185 190180 185 190

GTT GCA ACG GGA TTG CTG ATT GCC GGC GGA ATC GCC AAC GCG GTA CCT 624GTT GCA ACG GGA TTG CTG ATT GCC GGC GGA ATC GCC AAC GCG GTA CCT 624

Val Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala Asn Ala Val ProVal Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala Asn Ala Val Pro

195 200 205195 200 205

AAC GTC TTC GGG CTG GCT AAC GGT GGA TCG GAA TGG GGA GCG CCA TTA 672AAC GTC TTC GGG CTG GCT AAC GGT GGA TCG GAA TGG GGA GCG CCA TTA 672

Asn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp Gly Ala Pro LeuAsn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp Gly Ala Pro Leu

210 215 220210 215 220

ATT GGC TCC GGG CAA GCA ACC CAA GTT GGC GCC GGC ATC CAG GAT CAG 720ATT GGC TCC GGG CAA GCA ACC CAA GTT GGC GCC GGC ATC CAG GAT CAG 720

Ile Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly Ile Gln Asp GlnIle Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly Ile Gln Asp Gln

225 230 235 240225 230 235 240

AGC GCG GGC ATT TCA GAA GTG ACA GCA GGC TAT CAG CGT CGT CAG GAA 768AGC GCG GGC ATT TCA GAA GTG ACA GCA GGC TAT CAG CGT CGT CAG GAA 768

Ser Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln Arg Arg Gln GluSer Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln Arg Arg Gln Glu

245 250 255245 250 255

GAA TGG GCA TTG CAA CGG GAT ATT GCT GAT AAC GAA ATA ACC CAA CTG 816GAA TGG GCA TTG CAA CGG GAT ATT GCT GAT AAC GAA ATA ACC CAA CTG 816

Glu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu Ile Thr Gln LeuGlu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu Ile Thr Gln Leu

260 265 270260 265 270

GAT GCC CAG ATA CAA AGC CTG CAA GAG CAA ATC ACG ATG GCA CAA AAA 864GAT GCC CAG ATA CAA AGC CTG CAA GAG CAA ATC ACG ATG GCA CAA AAA 864

Asp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr Met Ala Gln LysAsp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr Met Ala Gln Lys

275 280 285275 280 285

CAG ATC ACG CTC TCT GAA ACC GAA CAA GCG AAT GCC CAA GCG ATT TAT 912CAG ATC ACG CTC TCT GAA ACC GAA CAA GCG AAT GCC CAA GCG ATT TAT 912

Gln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala Gln Ala Ile TyrGln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala Gln Ala Ile Tyr

290 295 300290 295 300

GAC CTG CAA ACC ACT CGT TTT ACC GGG CAG GCA CTG TAT AAC TGG ATG 960GAC CTG CAA ACC ACT CGT TTT ACC GGG CAG GCA CTG TAT AAC TGG ATG 960

Asp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu Tyr Asn Trp MetAsp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu Tyr Asn Trp Met

305 310 315 320305 310 315 320

GCC GGT CGT CTC TCC GCG CTC TAT TAC CAA ATG TAT GAT TCC ACT CTG 1008GCC GGT CGT CTC TCC GCG CTC TAT TAC CAA ATG TAT GAT TCC ACT CTG 1008

Ala Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr Asp Ser Thr LeuAla Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr Asp Ser Thr Leu

325 330 335325 330 335

CCA ATC TGT CTC CAG CCA AAA GCC GCA TTA GTA CAG GAA TTA GGC GAG 1056CCA ATC TGT CTC CAG CCA AAA GCC GCA TTA GTA CAG GAA TTA GGC GAG 1056

Pro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln Glu Leu Gly GluPro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln Glu Leu Gly Glu

340 345 350340 345 350

AAA GAG AGC GAC AGT CTT TTC CAG GTT CCG GTG TGG AAT GAT CTG TGG 1104AAA GAG AGC GAC AGT CTT TTC CAG GTT CCG GTG TGG AAT GAT CTG TGG 1104

Lys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp Asn Asp Leu TrpLys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp Asn Asp Leu Trp

355 360 365355 360 365

CAA GGG CTG TTA GCA GGA GAA GGT TTA AGT TCA GAG CTA CAG AAA CTG 1152CAA GGG CTG TTA GCA GGA GAA GGT TTA AGT TCA GAG CTA CAG AAA CTG 1152

Gln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu Leu Gln Lys LeuGln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu Leu Gln Lys Leu

370 375 380370 375 380

GAT GCC ATC TGG CTT GCA CGT GGT GGT ATT GGG CTA GAA GCC ATC CGC 1200GAT GCC ATC TGG CTT GCA CGT GGT GGT ATT GGG CTA GAA GCC ATC CGC 1200

Asp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu Glu Ala Ile ArgAsp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu Glu Ala Ile Arg

385 390 395 400385 390 395 400

ACC GTG TCG CTG GAT ACC CTG TTT GGC ACA GGG ACG TTA AGT GAA AAT 1248ACC GTG TCG CTG GAT ACC CTG TTT GGC ACA GGG ACG TTA AGT GAA AAT 1248

Thr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr Leu Ser Glu AsnThr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr Leu Ser Glu Asn

405 410 415405 410 415

ATC AAT AAA GTG CTT AAC GGG GAA ACG GTA TCT CCA TCC GGT GGC GTC 1296ATC AAT AAA GTG CTT AAC GGG GAA ACG GTA TCT CCA TCC GGT GGC GTC 1296

Ile Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro Ser Gly Gly ValIle Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro Ser Gly Gly Val

420 425 430420 425 430

ACT CTG GCG CTG ACA GGG GAT ATC TTC CAA GCA ACA CTG GAT TTG AGT 1344ACT CTG GCG CTG ACA GGG GAT ATC TTC CAA GCA ACA CTG GAT TTG AGT 1344

Thr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr Leu Asp Leu SerThr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr Leu Asp Leu Ser

435 440 445435 440 445

CAG CTA GGT TTG GAT AAC TCT TAC AAC TTG GGT AAC GAG AAG AAA CGT 1392CAG CTA GGT TTG GAT AAC TCT TAC AAC TTG GGT AAC GAG AAG AAA CGT 1392

Gln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn Glu Lys Lys ArgGln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn Glu Lys Lys Arg

450 455 460450 455 460

CGT ATT AAA CGT ATC GCC GTC ACC CTG CCA ACA CTT CTG GGG CCA TAT 1440CGT ATT AAA CGT ATC GCC GTC ACC CTG CCA ACA CTT CTG GGG CCA TAT 1440

Arg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu Leu Gly Pro TyrArg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu Leu Gly Pro Tyr

465 470 475 480465 470 475 480

CAA GAT CTT GAA GCC ACA CTG GTA ATG GGT GCG GAA ATC GCC GCC TTA 1488CAA GAT CTT GAA GCC ACA CTG GTA ATG GGT GCG GAA ATC GCC GCC TTA 1488

Gln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu Ile Ala Ala LeuGln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu Ile Ala Ala Leu

485 490 495485 490 495

TCA CAC GGT GTG AAT GAC GGA GGC CGG TTT GTT ACC GAC TTT AAC GAC 1536TCA CAC GGT GTG AAT GAC GGA GGC CGG TTT GTT ACC GAC TTT AAC GAC 1536

Ser His Gly Val Asn Asp Gly Gly Arg Phe Val Thr Asp Phe Asn AspSer His Gly Val Asn Asp Gly Gly Arg Phe Val Thr Asp Phe Asn Asp

500 505 510500 505 510

AGC CGT TTT CTG CCT TTT GAA GGT CGA GAT GCA ACA ACC GGC ACA CTG 1584AGC CGT TTT CTG CCT TTT GAA GGT CGA GAT GCA ACA ACC GGC ACA CTG 1584

Ser Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr Thr Gly Thr LeuSer Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr Thr Gly Thr Leu

515 520 525515 520 525

GAG CTC AAT ATT TTC CAT GCG GGT AAA GAG GGA ACG CAA CAC GAG TTG 1632GAG CTC AAT ATT TTC CAT GCG GGT AAA GAG GGA ACG CAA CAC GAG TTG 1632

Glu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr Gln His Glu LeuGlu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr Gln His Glu Leu

530 535 540530 535 540

GTC GCG AAT CTG AGT GAC ATC ATT GTG CAT CTG AAT TAC ATC ATT CGA 1680GTC GCG AAT CTG AGT GAC ATC ATT GTG CAT CTG AAT TAC ATC ATT CGA 1680

Val Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn Tyr Ile Ile ArgVal Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn Tyr Ile Ile Arg

545 550 555 560545 550 555 560

GAC GCG TAA 1689GAC GCG TAA 1689

Asp Ala *Asp Ala *

(2) INFORMATION FOR SEQ ID NO:30:(2) INFORMATION FOR SEQ ID NO: 30:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 562 amino acids(A) LENGTH: 562 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:30 (TcaBii protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 30 (TcaBii protein):

Ala Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu Pro Pro TyrAla Gly Asp Thr Ala Asn Ile Gly Asp Gly Asp Phe Leu Pro Pro Tyr

1 5 10 151 5 10 15

Asn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu Leu Arg Leu TyrAsn Asp Val Leu Leu Gly Tyr Trp Asp Lys Leu Glu Leu Arg Leu Tyr

20 25 3020 25 30

Asn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu Asn Leu ProAsn Leu Arg His Asn Leu Ser Leu Asp Gly Gln Pro Leu Asn Leu Pro

35 40 4535 40 45

Leu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln Arg Gln Gln AlaLeu Tyr Ala Thr Pro Val Asp Pro Lys Thr Leu Gln Arg Gln Gln Ala

50 55 6050 55 60

Gly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly Gln Gly Ser ValGly Gly Asp Gly Thr Gly Ser Ser Pro Ala Gly Gly Gln Gly Ser Val

65 70 75 8065 70 75 80

Gln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala Arg Ser Ala ValGln Gly Trp Arg Tyr Pro Leu Leu Val Glu Arg Ala Arg Ser Ala Val

85 90 9585 90 95

Ser Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr Thr Leu Glu HisSer Leu Leu Thr Gln Phe Gly Asn Ser Leu Gln Thr Thr Leu Glu His

100 105 110100 105 110

Gln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr Gln Gln Glu AlaGln Asp Asn Glu Lys Met Thr Ile Leu Leu Gln Thr Gln Gln Glu Ala

115 120 125115 120 125

Ile Leu Lys His Gln His Asp Ile Gln Gln Asn Asn Leu Lys Gly LeuIle Leu Lys His Gln His Asp Ile Gln Gln Asn Asn Leu Lys Gly Leu

130 135 140130 135 140

Gln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp Gly Asp Thr LeuGln His Ser Leu Thr Ala Leu Gln Ala Ser Arg Asp Gly Asp Thr Leu

145 150 155 160145 150 155 160

Arg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly Leu Ser Ala AlaArg Gln Lys His Tyr Ser Asp Leu Ile Asn Gly Gly Leu Ser Ala Ala

165 170 175165 170 175

Glu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met Ile Thr Asn GlyGlu Ile Ala Gly Leu Thr Leu Arg Ser Thr Ala Met Ile Thr Asn Gly

180 185 190180 185 190

Val Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala Asn Ala Val ProVal Ala Thr Gly Leu Leu Ile Ala Gly Gly Ile Ala Asn Ala Val Pro

195 200 205195 200 205

Asn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp Gly Ala Pro LeuAsn Val Phe Gly Leu Ala Asn Gly Gly Ser Glu Trp Gly Ala Pro Leu

210 215 220210 215 220

Ile Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly Ile Gln Asp GlnIle Gly Ser Gly Gln Ala Thr Gln Val Gly Ala Gly Ile Gln Asp Gln

225 230 235 240225 230 235 240

Ser Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln Arg Arg Gln GluSer Ala Gly Ile Ser Glu Val Thr Ala Gly Tyr Gln Arg Arg Gln Glu

245 250 255245 250 255

Glu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu Ile Thr Gln LeuGlu Trp Ala Leu Gln Arg Asp Ile Ala Asp Asn Glu Ile Thr Gln Leu

260 265 270260 265 270

Asp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr Met Ala Gln LysAsp Ala Gln Ile Gln Ser Leu Gln Glu Gln Ile Thr Met Ala Gln Lys

275 280 285275 280 285

Gln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala Gln Ala Ile TyrGln Ile Thr Leu Ser Glu Thr Glu Gln Ala Asn Ala Gln Ala Ile Tyr

290 295 300290 295 300

Asp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu Tyr Asn Trp MetAsp Leu Gln Thr Thr Arg Phe Thr Gly Gln Ala Leu Tyr Asn Trp Met

305 310 315 320305 310 315 320

Ala Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr Asp Ser Thr LeuAla Gly Arg Leu Ser Ala Leu Tyr Tyr Gln Met Tyr Asp Ser Thr Leu

325 330 335325 330 335

Pro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln Glu Leu Gly GluPro Ile Cys Leu Gln Pro Lys Ala Ala Leu Val Gln Glu Leu Gly Glu

340 345 350340 345 350

Lys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp Asn Asp Leu TrpLys Glu Ser Asp Ser Leu Phe Gln Val Pro Val Trp Asn Asp Leu Trp

355 360 365355 360 365

Gln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu Leu Gln Lys LeuGln Gly Leu Leu Ala Gly Glu Gly Leu Ser Ser Glu Leu Gln Lys Leu

370 375 380370 375 380

Asp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu Glu Ala Ile ArgAsp Ala Ile Trp Leu Ala Arg Gly Gly Ile Gly Leu Glu Ala Ile Arg

385 390 395 400385 390 395 400

Thr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr Leu Ser Glu AsnThr Val Ser Leu Asp Thr Leu Phe Gly Thr Gly Thr Leu Ser Glu Asn

405 410 415405 410 415

Ile Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro Ser Gly Gly ValIle Asn Lys Val Leu Asn Gly Glu Thr Val Ser Pro Ser Gly Gly Val

420 425 430420 425 430

Thr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr Leu Asp Leu SerThr Leu Ala Leu Thr Gly Asp Ile Phe Gln Ala Thr Leu Asp Leu Ser

435 440 445435 440 445

Gln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn Glu Lys Lys ArgGln Leu Gly Leu Asp Asn Ser Tyr Asn Leu Gly Asn Glu Lys Lys Arg

450 455 460450 455 460

Arg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu Leu Gly Pro TyrArg Ile Lys Arg Ile Ala Val Thr Leu Pro Thr Leu Leu Gly Pro Tyr

465 470 475 480465 470 475 480

Gln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu Ile Ala Ala LeuGln Asp Leu Glu Ala Thr Leu Val Met Gly Ala Glu Ile Ala Ala Leu

485 490 495485 490 495

Ser His Gly Val Asn Asp Gly Gly Arg Phe Val Thr Asp Phe Asn AspSer His Gly Val Asn Asp Gly Gly Arg Phe Val Thr Asp Phe Asn Asp

500 505 510500 505 510

Ser Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr Thr Gly Thr LeuSer Arg Phe Leu Pro Phe Glu Gly Arg Asp Ala Thr Thr Gly Thr Leu

515 520 525515 520 525

Glu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr Gln His Glu LeuGlu Leu Asn Ile Phe His Ala Gly Lys Glu Gly Thr Gln His Glu Leu

530 535 540530 535 540

Val Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn Tyr Ile Ile ArgVal Ala Asn Leu Ser Asp Ile Ile Val His Leu Asn Tyr Ile Ile Arg

545 550 555 560545 550 555 560

Asp Ala *Asp Ala *

(2) INFORMATION FOR SEQ ID NO:31:(2) INFORMATION FOR SEQ ID NO: 31:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 4458 base pairs(A) LENGTH: 4458 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(ix) FEATURE:(ix) FEATURE:

(A) NAME/KEY: CDS(A) NAME / KEY: CDS

(B) LOCATION: 1..4458(B) LOCATION: 1..4458

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:31 (tcac gene):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 31 (tcac gene):

ATG CAG GAT TCA CCA GAA GTA TCG ATT ACA ACG CTG TCA CTT CCC AAA 48ATG CAG GAT TCA CCA GAA GTA TCG ATT ACA ACG CTG TCA CTT CCC AAA 48

Met Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Leu Ser Leu Pro LysMet Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Leu Ser Leu Pro Lys

1 5 10 151 5 10 15

GGT GGC GGT GCT ATC AAT GGC ATG GGA GAA GCA CTG AAT GCT GCC GGC 96GGT GGC GGT GCT ATC AAT GGC ATG GGA GAA GCA CTG AAT GCT GCC GGC 96

Gly Gly Gly Ala Ile Asn Gly Met Gly Glu Ala Leu Asn Ala Ala GlyGly Gly Gly Ala Ile Asn Gly Met Gly Glu Ala Leu Asn Ala Ala Gly

20 25 3020 25 30

CCT GAT GGA ATG GCC TCC CTA TCT CTG CCA TTA CCC CTT TCG ACC GGC 144CCT GAT GGA ATG GCC TCC CTA TCT CTG CCA TTA CCC CTT TCG ACC GGC 144

Pro Asp Gly Met Ala Ser Leu Ser Leu Pro Leu Pro Leu Ser Thr GlyPro Asp Gly Met Ala Ser Leu Ser Leu Pro Leu Pro Leu Ser Thr Gly

35 40 4535 40 45

AGA GGG ACG GCT CCT GGA TTA TCG CTG ATT TAC AGC AAC AGT GCA GGT 192AGA GGG ACG GCT CCT GGA TTA TCG CTG ATT TAC AGC AAC AGT GCA GGT 192

Arg Gly Thr Ala Pro Gly Leu Ser Leu Ile Tyr Ser Asn Ser Ala GlyArg Gly Thr Ala Pro Gly Leu Ser Leu Ile Tyr Ser Asn Ser Ala Gly

50 55 6050 55 60

AAT GGG CCT TTC GGC ATC GGC TGG CAA TGC GGT GTT ATG TCC ATT AGC 240AAT GGG CCT TTC GGC ATC GGC TGG CAA TGC GGT GTT ATG TCC ATT AGC 240

Asn Gly Pro Phe Gly Ile Gly Trp Gln Cys Gly Val Met Ser Ile SerAsn Gly Pro Phe Gly Ile Gly Trp Gln Cys Gly Val Met Ser Ile Ser

65 70 75 8065 70 75 80

CGA CGC ACC CAA CAT GGC ATT CCA CAA TAC GGT AAT GAC GAC ACG TTC 288CGA CGC ACC CAA CAT GGC ATT CCA CAA TAC GGT AAT GAC GAC ACG TTC 288

Arg Arg Thr Gln His Gly Ile Pro Gln Tyr Gly Asn Asp Asp Thr PheArg Arg Thr Gln His Gly Ile Pro Gln Tyr Gly Asn Asp Asp Thr Phe

85 90 9585 90 95

CTA TCC CCA CAA GGC GAG GTC ATG AAT ATC GCC CTG AAT GAC CAA GGG 336CTA TCC CCA CAA GGC GAG GTC ATG AAT ATC GCC CTG AAT GAC CAA GGG 336

Leu Ser Pro Gln Gly Glu Val Met Asn Ile Ala Leu Asn Asp Gln GlyLeu Ser Pro Gln Gly Glu Val Met Asn Ile Ala Leu Asn Asp Gln Gly

100 105 110100 105 110

CAA CCT GAT ATC CGT CAA GAC GTT AAA ACG CTG CAA GGC GTT ACC TTG 384CAA CCT GAT ATC CGT CAA GAC GTT AAA ACG CTG CAA GGC GTT ACC TTG 384

Gln Pro Asp Ile Arg Gln Asp Val Lys Thr Leu Gln Gly Val Thr LeuGln Pro Asp Ile Arg Gln Asp Val Lys Thr Leu Gln Gly Val Thr Leu

115 120 125115 120 125

CCA ATT TCC TAT ACC GTG ACC CGC TAT CAA GCC CGC CAG ATC CTG GAT 432CCA ATT TCC TAT ACC GTG ACC CGC TAT CAA GCC CGC CAG ATC CTG GAT 432

Pro Ile Ser Tyr Thr Val Thr Arg Tyr Gln Ala Arg Gln Ile Leu AspPro Ile Ser Tyr Thr Val Thr Arg Tyr Gln Ala Arg Gln Ile Leu Asp

130 135 140130 135 140

TTC AGT AAA ATC GAA TAC TGG CAA CCT GCC TCC GGT CAA GAA GGA CGC 480TTC AGT AAA ATC GAA TAC TGG CAA CCT GCC TCC GGT CAA GAA GGA CGC 480

Phe Ser Lys Ile Glu Tyr Trp Gln Pro Ala Ser Gly Gln Glu Gly ArgPhe Ser Lys Ile Glu Tyr Trp Gln Pro Ala Ser Gly Gln Glu Gly Arg

145 150 155 160145 150 155 160

GCT TTC TGG CTG ATA TCG ACA CCG GAC GGG CAT CTA CAC ATC TTA GGG 528GCT TTC TGG CTG ATA TCG ACA CCG GAC GGG CAT CTA CAC ATC TTA GGG 528

Ala Phe Trp Leu Ile Ser Thr Pro Asp Gly His Leu His Ile Leu GlyAla Phe Trp Leu Ile Ser Thr Pro Asp Gly His Leu His Ile Leu Gly

165 170 175165 170 175

AAA ACC GCG CAG GCT TGT CTG GCA AAT CCG CAA AAT GAC CAA CAA ATC 576AAA ACC GCG CAG GCT TGT CTG GCA AAT CCG CAA AAT GAC CAA CAA ATC 576

Lys Thr Ala Gln Ala Cys Leu Ala Asn Pro Gln Asn Asp Gln Gln IleLys Thr Ala Gln Ala Cys Leu Ala Asn Pro Gln Asn Asp Gln Gln Ile

180 185 190180 185 190

GCC CAG TGG TTG CTG GAA GAA ACT GTG ACG CCA GCC GGT GAA CAT GTC 624GCC CAG TGG TTG CTG GAA GAA ACT GTG ACG CCA GCC GGT GAA CAT GTC 624

Ala Gln Trp Leu Leu Glu Glu Thr Val Thr Pro Ala Gly Glu His ValAla Gln Trp Leu Leu Glu Glu Thr Val Thr Pro Ala Gly Glu His Val

195 200 205195 200 205

AGC TAT CAA TAT CGA GCC GAA GAT GAA GCC CAT TGT GAC GAC AAT GAA 672AGC TAT CAA TAT CGA GCC GAA GAT GAA GCC CAT TGT GAC GAC AAT GAA 672

Ser Tyr Gln Tyr Arg Ala Glu Asp Glu Ala His Cys Asp Asp Asn GluSer Tyr Gln Tyr Arg Ala Glu Asp Glu Ala His Cys Asp Asp Asn Glu

210 215 220210 215 220

AAA ACC GCT CAT CCC AAT GTT ACC GCA CAG CGC TAT CTG GTA CAG GTG 720AAA ACC GCT CAT CCC AAT GTT ACC GCA CAG CGC TAT CTG GTA CAG GTG 720

Lys Thr Ala His Pro Asn Val Thr Ala Gln Arg Tyr Leu Val Gln ValLys Thr Ala His Pro Asn Val Thr Ala Gln Arg Tyr Leu Val Gln Val

225 230 235 240225 230 235 240

AAC TAC GGC AAC ATC AAA CCA CAA GCC AGC CTG TTC GTA CTG GAT AAC 768AAC TAC GGC AAC ATC AAA CCA CAA GCC AGC CTG TTC GTA CTG GAT AAC 768

Asn Tyr Gly Asn Ile Lys Pro Gln Ala Ser Leu Phe Val Leu Asp AsnAsn Tyr Gly Asn Ile Lys Pro Gln Ala Ser Leu Phe Val Leu Asp Asn

245 250 255245 250 255

GCA CCT CCC GCA CCG GAA GAG TGG CTG TTT CAT CTG GTC TTT GAC CAC 816GCA CCT CCC GCA CCG GAA GAG TGG CTG TTT CAT CTG GTC TTT GAC CAC 816

Ala Pro Pro Ala Pro Glu Glu Trp Leu Phe His Leu Val Phe Asp HisAla Pro Pro Ala Pro Glu Glu Trp Leu Phe His Leu Val Phe Asp His

260 265 270260 265 270

GGT GAG CGC GAT ACC TCA CTT CAT ACC GTG CCA ACA TGG GAT GCA GGT 864GGT GAG CGC GAT ACC TCA CTT CAT ACC GTG CCA ACA TGG GAT GCA GGT 864

Gly Glu Arg Asp Thr Ser Leu His Thr Val Pro Thr Trp Asp Ala GlyGly Glu Arg Asp Thr Ser Leu His Thr Val Pro Thr Trp Asp Ala Gly

275 280 285275 280 285

ACA GCG CAA TGG TCT GTA CGC CCG GAT ATC TTC TCT CGC TAT GAA TAT 912ACA GCG CAA TGG TCT GTA CGC CCG GAT ATC TTC TCT CGC TAT GAA TAT 912

Thr Ala Gln Trp Ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Glu TyrThr Ala Gln Trp Ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Glu Tyr

290 295 300290 295 300

GGT TTT GAA GTG CGT ACT CGC CGC TTA TGT CAA CAA GTG CTG ATG TTT 960GGT TTT GAA GTG CGT ACT CGC CGC TTA TGT CAA CAA GTG CTG ATG TTT 960

Gly Phe Glu Val Arg Thr Arg Arg Leu Cys Gln Gln Val Leu Met PheGly Phe Glu Val Arg Thr Arg Arg Leu Cys Gln Gln Val Leu Met Phe

305 310 315 320305 310 315 320

CAC CGC ACC GCG CTC ATG GCC GGA GAA GCC AGT ACC AAT GAC GCC CCG 1008CAC CGC ACC GCG CTC ATG GCC GGA GAA GCC AGT ACC AAT GAC GCC CCG 1008

His Arg Thr Ala Leu Met Ala Gly Glu Ala Ser Thr Asn Asp Ala ProHis Arg Thr Ala Leu Met Ala Gly Glu Ala Ser Thr Asn Asp Ala Pro

325 330 335325 330 335

GAA CTG GTT GGA CGC TTA ATA CTG GAA TAT GAC AAA AAC GCC AGC GTC 1056GAA CTG GTT GGA CGC TTA ATA CTG GAA TAT GAC AAA AAC GCC AGC GTC 1056

Glu Leu Val Gly Arg Leu Ile Leu Glu Tyr Asp Lys Asn Ala Ser ValGlu Leu Val Gly Arg Leu Ile Leu Glu Tyr Asp Lys Asn Ala Ser Val

340 345 350340 345 350

ACC ACG TTG ATT ACC ATC CGT CAA TTA AGC CAT GAA TCG GAC GGG AGG 1104ACC ACG TTG ATT ACC ATC CGT CAA TTA AGC CAT GAA TCG GAC GGG AGG 1104

Thr Thr Leu Ile Thr Ile Arg Gln Leu Ser His Glu Ser Asp Gly ArgThr Thr Leu Ile Thr Ile Arg Gln Leu Ser His Glu Ser Asp Gly Arg

355 360 365355 360 365

CCA GTC ACC CAG CCA CCA CTA GAA CTA GCC TGG CAA CGG TTT GAT CTG 1152CCA GTC ACC CAG CCA CCA CTA GAA CTA GCC TGG CAA CGG TTT GAT CTG 1152

Pro Val Thr Gln Pro Pro Leu Glu Leu Ala Trp Gln Arg Phe Asp LeuPro Val Thr Gln Pro Pro Leu Glu Leu Ala Trp Gln Arg Phe Asp Leu

370 375 380370 375 380

GAG AAA ATC CCG ACA TGG CAA CGC TTT GAC GCA CTA GAT AAT TTT AAC 1200GAG AAA ATC CCG ACA TGG CAA CGC TTT GAC GCA CTA GAT AAT TTT AAC 1200

Glu Lys Ile Pro Thr Trp Gln Arg Phe Asp Ala Leu Asp Asn Phe AsnGlu Lys Ile Pro Thr Trp Gln Arg Phe Asp Ala Leu Asp Asn Phe Asn

385 390 395 400385 390 395 400

TCG CAG CAA CGT TAT CAA CTG GTT GAT CTG CGG GGA GAA GGG TTG CCA 1248TCG CAG CAA CGT TAT CAA CTG GTT GAT CTG CGG GGA GAA GGG TTG CCA 1248

Ser Gln Gln Arg Tyr Gln Leu Val Asp Leu Arg Gly Glu Gly Leu ProSer Gln Gln Arg Tyr Gln Leu Val Asp Leu Arg Gly Glu Gly Leu Pro

405 410 415405 410 415

GGT ATG CTG TAT CAA GAT CGA GGC GCT TGG TGG TAT AAA GCT CCG CAA 1296GGT ATG CTG TAT CAA GAT CGA GGC GCT TGG TGG TAT AAA GCT CCG CAA 1296

Gly Met Leu Tyr Gln Asp Arg Gly Ala Trp Trp Tyr Lys Ala Pro GlnGly Met Leu Tyr Gln Asp Arg Gly Ala Trp Trp Tyr Lys Ala Pro Gln

420 425 430420 425 430

CGT CAG GAA GAC GGA GAC AGC AAT GCC GTC ACT TAC GAC AAA ATC GCC 1344CGT CAG GAA GAC GGA GAC AGC AAT GCC GTC ACT TAC GAC AAA ATC GCC 1344

Arg Gln Glu Asp Gly Asp Ser Asn Ala Val Thr Tyr Asp Lys Ile AlaArg Gln Glu Asp Gly Asp Ser Asn Ala Val Thr Tyr Asp Lys Ile Ala

435 440 445435 440 445

CCA CTG CCT ACC CTA CCC AAT TTG CAG GAT AAT GCC TCA TTG ATG GAT 1392CCA CTG CCT ACC CTA CCC AAT TTG CAG GAT AAT GCC TCA TTG ATG GAT 1392

Pro Leu Pro Thr Leu Pro Asn Leu Gln Asp Asn Ala Ser Leu Met AspPro Leu Pro Thr Leu Pro Asn Leu Gln Asp Asn Ala Ser Leu Met Asp

450 455 460450 455 460

ATC AAC GGA GAC GGC CAA CTG GAT TGG GTT GTT ACC GCC TCC GGT ATT 1440ATC AAC GGA GAC GGC CAA CTG GAT TGG GTT GTT ACC GCC TCC GGT ATT 1440

Ile Asn Gly Asp Gly Gln Leu Asp Trp Val Val Thr Ala Ser Gly IleIle Asn Gly Asp Gly Gln Leu Asp Trp Val Val Thr Ala Ser Gly Ile

465 470 475 480465 470 475 480

CGC GGA TAC CAT AGT CAG CAA CCC GAT GGA AAG TGG ACG CAC TTT ACG 1488CGC GGA TAC CAT AGT CAG CAA CCC GAT GGA AAG TGG ACG CAC TTT ACG 1488

Arg Gly Tyr His Ser Gln Gln Pro Asp Gly Lys Trp Thr His Phe ThrArg Gly Tyr His Ser Gln Gln Pro Asp Gly Lys Trp Thr His Phe Thr

485 490 495485 490 495

CCA ATC AAT GCC TTG CCC GTG GAA TAT TTT CAT CCA AGC ATC CAG TTC 1536CCA ATC AAT GCC TTG CCC GTG GAA TAT TTT CAT CCA AGC ATC CAG TTC 1536

Pro Ile Asn Ala Leu Pro Val Glu Tyr Phe His Pro Ser Ile Gln PhePro Ile Asn Ala Leu Pro Val Glu Tyr Phe His Pro Ser Ile Gln Phe

500 505 510500 505 510

GCT GAC CTT ACC GGG GCA GGC TTA TCT GAT TTA GTG TTG ATC GGG CCG 1584GCT GAC CTT ACC GGG GCA GGC TTA TCT GAT TTA GTG TTG ATC GGG CCG 1584

Ala Asp Leu Thr Gly Ala Gly Leu Ser Asp Leu Val Leu Ile Gly ProAla Asp Leu Thr Gly Ala Gly Leu Ser Asp Leu Val Leu Ile Gly Pro

515 520 525515 520 525

AAA AGC GTG CGT CTA TAT GCC AAC CAG CGA AAC GGC TGG CGT AAA GGA 1632AAA AGC GTG CGT CTA TAT GCC AAC CAG CGA AAC GGC TGG CGT AAA GGA 1632

Lys Ser Val Arg Leu Tyr Ala Asn Gln Arg Asn Gly Trp Arg Lys GlyLys Ser Val Arg Leu Tyr Ala Asn Gln Arg Asn Gly Trp Arg Lys Gly

530 535 540530 535 540

GAA GAT GTC CCC CAA TCC ACA GGT ATC ACC CTG CCT GTC ACA GGG ACC 1680GAA GAT GTC CCC CAA TCC ACA GGT ATC ACC CTG CCT GTC ACA GGG ACC 1680

Glu Asp Val Pro Gln Ser Thr Gly Ile Thr Leu Pro Val Thr Gly ThrGlu Asp Val Pro Gln Ser Thr Gly Ile Thr Leu Pro Val Thr Gly Thr

545 550 555 560545 550 555 560

GAT GCC CGC AAA CTG GTG GCT TTC AGT GAT ATG CTC GGT TCC GGT CAA 1728GAT GCC CGC AAA CTG GTG GCT TTC AGT GAT ATG CTC GGT TCC GGT CAA 1728

Asp Ala Arg Lys Leu Val Ala Phe Ser Asp Met Leu Gly Ser Gly GlnAsp Ala Arg Lys Leu Val Ala Phe Ser Asp Met Leu Gly Ser Gly Gln

565 570 575565 570 575

CAA CAT CTG GTG GAA ATC AAG GGT AAT CGC GTC ACC TGT TGG CCG AAT 1776CAA CAT CTG GTG GAA ATC AAG GGT AAT CGC GTC ACC TGT TGG CCG AAT 1776

Gln His Leu Val Glu Ile Lys Gly Asn Arg Val Thr Cys Trp Pro AsnGln His Leu Val Glu Ile Lys Gly Asn Arg Val Thr Cys Trp Pro Asn

580 585 590580 585 590

CTA GGG CAT GGC CGT TTC GGT CAA CCA CTA ACT CTG TCA GGA TTT AGC 1824CTA GGG CAT GGC CGT TTC GGT CAA CCA CTA ACT CTG TCA GGA TTT AGC 1824

Leu Gly His Gly Arg Phe Gly Gln Pro Leu Thr Leu Ser Gly Phe SerLeu Gly His Gly Arg Phe Gly Gln Pro Leu Thr Leu Ser Gly Phe Ser

595 600 605595 600 605

CAG CCC GAA AAT AGC TTC AAT CCC GAA CGG CTG TTT CTG GCG GAT ATC 1872CAG CCC GAA AAT AGC TTC AAT CCC GAA CGG CTG TTT CTG GCG GAT ATC 1872

Gln Pro Glu Asn Ser Phe Asn Pro Glu Arg Leu Phe Leu Ala Asp IleGln Pro Glu Asn Ser Phe Asn Pro Glu Arg Leu Phe Leu Ala Asp Ile

610 615 620610 615 620

GAC GGC TCC GGC ACC ACC GAC CTT ATC TAT GCG CAA TCC GGC TCT TTG 1920GAC GGC TCC GGC ACC ACC GAC CTT ATC TAT GCG CAA TCC GGC TCT TTG 1920

Asp Gly Ser Gly Thr Thr Asp Leu Ile Tyr Ala Gln Ser Gly Ser LeuAsp Gly Ser Gly Thr Thr Asp Leu Ile Tyr Ala Gln Ser Gly Ser Leu

625 630 635 640625 630 635 640

CTC ATT TAT CTC AAC CAA AGT GGT AAT CAG TTT GAT GCC CCG TTG ACA 1968CTC ATT TAT CTC AAC CAA AGT GGT AAT CAG TTT GAT GCC CCG TTG ACA 1968

Leu Ile Tyr Leu Asn Gln Ser Gly Asn Gln Phe Asp Ala Pro Leu ThrLeu Ile Tyr Leu Asn Gln Ser Gly Asn Gln Phe Asp Ala Pro Leu Thr

645 650 655645 650 655

TTA GCG TTG CCA GAA GGC GTA CAA TTT GAC AAC ACT TGC CAA CTT CAA 2016TTA GCG TTG CCA GAA GGC GTA CAA TTT GAC AAC ACT TGC CAA CTT CAA 2016

Leu Ala Leu Pro Glu Gly Val Gln Phe Asp Asn Thr Cys Gln Leu GlnLeu Ala Leu Pro Glu Gly Val Gln Phe Asp Asn Thr Cys Gln Leu Gln

660 665 670660 665 670

GTC GCC GAT ATT CAG GGA TTA GGG ATA GCC AGC TTG ATT CTG ACT GTG 2064GTC GCC GAT ATT CAG GGA TTA GGG ATA GCC AGC TTG ATT CTG ACT GTG 2064

Val Ala Asp Ile Gln Gly Leu Gly Ile Ala Ser Leu Ile Leu Thr ValVal Ala Asp Ile Gln Gly Leu Gly Ile Ala Ser Leu Ile Leu Thr Val

675 680 685675 680 685

CCA CAT ATC GCG CCA CAT CAC TGG CGT TGT GAC CTG TCA CTG ACC AAA 2112CCA CAT ATC GCG CCA CAT CAC TGG CGT TGT GAC CTG TCA CTG ACC AAA 2112

Pro His Ile Ala Pro His His Trp Arg Cys Asp Leu Ser Leu Thr LysPro His Ile Ala Pro His His Trp Arg Cys Asp Leu Ser Leu Thr Lys

690 695 700690 695 700

CCC TGG TTG TTG AAT GTA ATG AAC AAT AAC CGG GGC GCA CAT CAC ACG 2160CCC TGG TTG TTG AAT GTA ATG AAC AAT AAC CGG GGC GCA CAT CAC ACG 2160

Pro Trp Leu Leu Asn Val Met Asn Asn Asn Arg Gly Ala His His ThrPro Trp Leu Leu Asn Val Met Asn Asn Asn Arg Gly Ala His His Thr

705 710 715 720705 710 715 720

CTA CAT TAT CGT AGT TCC GCG CAA TTC TGG TTG GAT GAA AAA TTA CAG 2208CTA CAT TAT CGT AGT TCC GCG CAA TTC TGG TTG GAT GAA AAA TTA CAG 2208

Leu His Tyr Arg Ser Ser Ala Gln Phe Trp Leu Asp Glu Lys Leu GlnLeu His Tyr Arg Ser Ser Ala Gln Phe Trp Leu Asp Glu Lys Leu Gln

725 730 735725 730 735

CTC ACC AAA GCA GGC AAA TCT CCG GCT TGT TAT CTG CCG TTT CCA ATG 2256CTC ACC AAA GCA GGC AAA TCT CCG GCT TGT TAT CTG CCG TTT CCA ATG 2256

Leu Thr Lys Ala Gly Lys Ser Pro Ala Cys Tyr Leu Pro Phe Pro MetLeu Thr Lys Ala Gly Lys Ser Pro Ala Cys Tyr Leu Pro Phe Pro Met

740 745 750740 745 750

CAT TTG CTA TGG TAT ACC GAA ATT CAG GAT GAA ATC AGC GGC AAC CGG 2304CAT TTG CTA TGG TAT ACC GAA ATT CAG GAT GAA ATC AGC GGC AAC CGG 2304

His Leu Leu Trp Tyr Thr Glu Ile Gln Asp Glu Ile Ser Gly Asn ArgHis Leu Leu Trp Tyr Thr Glu Ile Gln Asp Glu Ile Ser Gly Asn Arg

755 760 765755 760 765

CTC ACC AGT GAA GTC AAC TAC AGC CAC GGC GTC TGG GAT GGT AAA GAG 2352CTC ACC AGT GAA GTC AAC TAC AGC CAC GGC GTC TGG GAT GGT AAA GAG 2352

Leu Thr Ser Glu Val Asn Tyr Ser His Gly Val Trp Asp Gly Lys GluLeu Thr Ser Glu Val Asn Tyr Ser His Gly Val Trp Asp Gly Lys Glu

770 775 780770 775 780

CGG GAA TTC AGA GGA TTT GGC TGC ATC AAA CAG ACA GAT ACC ACA ACG 2400CGG GAA TTC AGA GGA TTT GGC TGC ATC AAA CAG ACA GAT ACC ACA ACG 2400

Arg Glu Phe Arg Gly Phe Gly Cys Ile Lys Gln Thr Asp Thr Thr ThrArg Glu Phe Arg Gly Phe Gly Cys Ile Lys Gln Thr Asp Thr Thr Thr

785 790 795 800785 790 795 800

TTT TCT CAC GGC ACC GCC CCC GAA CAG GCG GCA CCG TCG CTG AGT ATT 2448TTT TCT CAC GGC ACC GCC CCC GAA CAG GCG GCA CCG TCG CTG AGT ATT 2448

Phe Ser His Gly Thr Ala Pro Glu Gln Ala Ala Pro Ser Leu Ser IlePhe Ser His Gly Thr Ala Pro Glu Gln Ala Ala Pro Ser Leu Ser Ile

805 810 815805 810 815

AGC TGG TTT GCC ACC GGC ATG GAT GAA GTA GAC AGC CAA TTA GCT ACG 2496AGC TGG TTT GCC ACC GGC ATG GAT GAA GTA GAC AGC CAA TTA GCT ACG 2496

Ser Trp Phe Ala Thr Gly Met Asp Glu Val Asp Ser Gln Leu Ala ThrSer Trp Phe Ala Thr Gly Met Asp Glu Val Asp Ser Gln Leu Ala Thr

820 825 830820 825 830

GAA TAT TGG CAG GCA GAC ACG CAA GCT TAT AGC GGA TTT GAA ACC CGT 2544GAA TAT TGG CAG GCA GAC ACG CAA GCT TAT AGC GGA TTT GAA ACC CGT 2544

Glu Tyr Trp Gln Ala Asp Thr Gln Ala Tyr Ser Gly Phe Glu Thr ArgGlu Tyr Trp Gln Ala Asp Thr Gln Ala Tyr Ser Gly Phe Glu Thr Arg

835 840 845835 840 845

TAT ACC GTC TGG GAT CAC ACC AAC CAG ACA GAC CAA GCA TTT ACC CCC 2592TAT ACC GTC TGG GAT CAC ACC AAC CAG ACA GAC CAA GCA TTT ACC CCC 2592

Tyr Thr Val Trp Asp His Thr Asn Gln Thr Asp Gln Ala Phe Thr ProTyr Thr Val Trp Asp His Thr Asn Gln Thr Asp Gln Ala Phe Thr Pro

850 855 860850 855 860

AAT GAG ACA CAA CGT AAC TGG CTG ACG CGA GCG CTT AAA GGC CAA CTG 2640AAT GAG ACA CAA CGT AAC TGG CTG ACG CGA GCG CTT AAA GGC CAA CTG 2640

Asn Glu Thr Gln Arg Asn Trp Leu Thr Arg Ala Leu Lys Gly Gln LeuAsn Glu Thr Gln Arg Asn Trp Leu Thr Arg Ala Leu Lys Gly Gln Leu

865 870 875 880865 870 875 880

CTA CGC ACT GAG CTC TAC GGT CTG GAC GGA ACA GAT AAG CAA ACA GTG 2688CTA CGC ACT GAG CTC TAC GGT CTG GAC GGA ACA GAT AAG CAA ACA GTG 2688

Leu Arg Thr Glu Leu Tyr Gly Leu Asp Gly Thr Asp Lys Gln Thr ValLeu Arg Thr Glu Leu Tyr Gly Leu Asp Gly Thr Asp Lys Gln Thr Val

885 890 895885 890 895

CCT TAT ACC GTC AGT GAA TCG CGC TAT CAG GTA CGC TCT ATT CCC GTA 2736CCT TAT ACC GTC AGT GAA TCG CGC TAT CAG GTA CGC TCT ATT CCC GTA 2736

Pro Tyr Thr Val Ser Glu Ser Arg Tyr Gln Val Arg Ser Ile Pro ValPro Tyr Thr Val Ser Glu Ser Arg Tyr Gln Val Arg Ser Ile Pro Val

900 905 910900 905 910

AAT AAA GAA ACT GAA TTA TCT GCC TGG GTG ACT GCT ATT GAA AAT CGC 2784AAT AAA GAA ACT GAA TTA TCT GCC TGG GTG ACT GCT ATT GAA AAT CGC 2784

Asn Lys Glu Thr Glu Leu Ser Ala Trp Val Thr Ala Ile Glu Asn ArgAsn Lys Glu Thr Glu Leu Ser Ala Trp Val Thr Ala Ile Glu Asn Arg

915 920 925915 920 925

AGC TAC CAC TAT GAA CGT ATC ATC ACT GAC CCA CAG TTC AGC CAG AGT 2832AGC TAC CAC TAT GAA CGT ATC ATC ACT GAC CCA CAG TTC AGC CAG AGT 2832

Ser Tyr His Tyr Glu Arg Ile Ile Thr Asp Pro Gln Phe Ser Gln SerSer Tyr His Tyr Glu Arg Ile Ile Thr Asp Pro Gln Phe Ser Gln Ser

930 935 940930 935 940

ATC AAG TTG CAA CAC GAT ATC TTT GGT CAA TCA CTG CAA AGT GTC GAT 2880ATC AAG TTG CAA CAC GAT ATC TTT GGT CAA TCA CTG CAA AGT GTC GAT 2880

Ile Lys Leu Gln His Asp Ile Phe Gly Gln Ser Leu Gln Ser Val AspIle Lys Leu Gln His Asp Ile Phe Gly Gln Ser Leu Gln Ser Val Asp

945 950 955 960945 950 955 960

ATT GCC TGG CCG CGC CGC GAA AAA CCA GCA GTG AAT CCC TAC CCG CCT 2928ATT GCC TGG CCG CGC CGC GAA AAA CCA GCA GTG AAT CCC TAC CCG CCT 2928

Ile Ala Trp Pro Arg Arg Glu Lys Pro Ala Val Asn Pro Tyr Pro ProIle Ala Trp Pro Arg Arg Glu Lys Pro Ala Val Asn Pro Tyr Pro Pro

965 970 975965 970 975

ACC CTG CCG GAA ACG CTA TTT GAC AGC AGC TAT GAT GAT CAA CAA CAA 2976ACC CTG CCG GAA ACG CTA TTT GAC AGC AGC TAT GAT GAT CAA CAA CAA 2976

Thr Leu Pro Glu Thr Leu Phe Asp Ser Ser Tyr Asp Asp Gln Gln GlnThr Leu Pro Glu Thr Leu Phe Asp Ser Ser Tyr Asp Asp Gln Gln Gln

980 985 990980 985 990

CTA TTA CGT CTG GTG AGA CAA AAA AAT AGC TGG CAT CAC CTG ACT GAT 3024CTA TTA CGT CTG GTG AGA CAA AAA AAT AGC TGG CAT CAC CTG ACT GAT 3024

Leu Leu Arg Leu Val Arg Gln Lys Asn Ser Trp His His Leu Thr AspLeu Leu Arg Leu Val Arg Gln Lys Asn Ser Trp His His Leu Thr Asp

995 1000 1005995 1000 1005

GGG GAA AAC TGG CGA TTA GGT TTA CCG AAT GCA CAA CGC CGT GAT GTT 3072GGG GAA AAC TGG CGA TTA GGT TTA CCG AAT GCA CAA CGC CGT GAT GTT 3072

Gly Glu Asn Trp Arg Leu Gly Leu Pro Asn Ala Gln Arg Arg Asp ValGly Glu Asn Trp Arg Leu Gly Leu Pro Asn Ala Gln Arg Arg Asp Val

1010 1015 10201010 1015 1020

TAT ACT TAT GAC CGG AGC AAA ATT CCA ACC GAA GGG ATT TCC CTT GAA 3120TAT ACT TAT GAC CGG AGC AAA ATT CCA ACC GAA GGG ATT TCC CTT GAA 3120

Tyr Thr Tyr Asp Arg Ser Lys Ile Pro Thr Glu Gly Ile Ser Leu GluTyr Thr Tyr Asp Arg Ser Lys Ile Pro Thr Glu Gly Ile Ser Leu Glu

1025 1030 1035 10401025 1030 1035 1040

ATC TTG CTG AAA GAT GAT GGC CTG CTA GCA GAT GAA AAA GCG GCC GTT 3168ATC TTG CTG AAA GAT GAT GGC CTG CTA GCA GAT GAA AAA GCG GCC GTT 3168

Ile Leu Leu Lys Asp Asp Gly Leu Leu Ala Asp Glu Lys Ala Ala ValIle Leu Leu Lys Asp Asp Gly Leu Leu Ala Asp Glu Lys Ala Ala Val

1045 1050 10551045 1050 1055

TAT CTG GGA CAA CAA CAG ACG TTT TAC ACC GCC GGT CAA GCG GAA GTC 3216TAT CTG GGA CAA CAA CAG ACG TTT TAC ACC GCC GGT CAA GCG GAA GTC 3216

Tyr Leu Gly Gln Gln Gln Thr Phe Tyr Thr Ala Gly Gln Ala Glu ValTyr Leu Gly Gln Gln Gln Thr Phe Tyr Thr Ala Gly Gln Ala Glu Val

1060 1065 10701060 1065 1070

ACT CTA GAA AAA CCC ACG TTA CAA GCA CTG GTC GCG TTC CAA GAA ACC 3264ACT CTA GAA AAA CCC ACG TTA CAA GCA CTG GTC GCG TTC CAA GAA ACC 3264

Thr Leu Glu Lys Pro Thr Leu Gln Ala Leu Val Ala Phe Gln Glu ThrThr Leu Glu Lys Pro Thr Leu Gln Ala Leu Val Ala Phe Gln Glu Thr

1075 1080 10851075 1080 1085

GCC ATG ATG GAC GAT ACC TCA TTA CAG GCG TAT GAA GGC GTG ATT GAA 3312GCC ATG ATG GAC GAT ACC TCA TTA CAG GCG TAT GAA GGC GTG ATT GAA 3312

Ala Met Met Asp Asp Thr Ser Leu Gln Ala Tyr Glu Gly Val Ile GluAla Met Met Asp Asp Thr Ser Leu Gln Ala Tyr Glu Gly Val Ile Glu

1090 1095 11001090 1095 1100

GAG CAA GAG TTG AAT ACC GCG CTG ACA CAG GCC GGT TAT CAG CAA GTC 3360GAG CAA GAG TTG AAT ACC GCG CTG ACA CAG GCC GGT TAT CAG CAA GTC 3360

Glu Gln Glu Leu Asn Thr Ala Leu Thr Gln Ala Gly Tyr Gln Gln ValGlu Gln Glu Leu Asn Thr Ala Leu Thr Gln Ala Gly Tyr Gln Gln Val

1105 1110 1115 11201105 1110 1115 1120

GCG CGG TTG TTT AAT ACC AGA TCA GAA AGC CCG GTA TGG GCG GCA CGG 3408GCG CGG TTG TTT AAT ACC AGA TCA GAA AGC CCG GTA TGG GCG GCA CGG 3408

Ala Arg Leu Phe Asn Thr Arg Ser Glu Ser Pro Val Trp Ala Ala ArgAla Arg Leu Phe Asn Thr Arg Ser Glu Ser Pro Val Trp Ala Ala Arg

1125 1130 11351125 1130 1135

CAA GGT TAT ACC GAT TAC GGT GAC GCC GCA CAG TTC TGG CGG CCT CAG 3456CAA GGT TAT ACC GAT TAC GGT GAC GCC GCA CAG TTC TGG CGG CCT CAG 3456

Gln Gly Tyr Thr Asp Tyr Gly Asp Ala Ala Gln Phe Trp Arg Pro GlnGln Gly Tyr Thr Asp Tyr Gly Asp Ala Ala Gln Phe Trp Arg Pro Gln

1140 1145 11501140 1145 1150

GCT CAG CGT AAC TCG TTG CTG ACA GGG AAA ACC ACA CTG ACC TGG GAT 3504GCT CAG CGT AAC TCG TTG CTG ACA GGG AAA ACC ACA CTG ACC TGG GAT 3504

Ala Gln Arg Asn Ser Leu Leu Thr Gly Lys Thr Thr Leu Thr Trp AspAla Gln Arg Asn Ser Leu Leu Thr Gly Lys Thr Thr Leu Thr Trp Asp

1155 1160 11651155 1160 1165

ACC CAT CAT TGT GTA ATA ATA CAG ACT CAA GAT GCC GCT GGA TTA ACG 3552ACC CAT CAT TGT GTA ATA ATA CAG ACT CAA GAT GCC GCT GGA TTA ACG 3552

Thr His His Cys Val Ile Ile Gln Thr Gln Asp Ala Ala Gly Leu ThrThr His His Cys Val Ile Ile Gln Thr Gln Asp Ala Ala Gly Leu Thr

1170 1175 11801170 1175 1180

ACG CAA GCC CAT TAC GAT TAT CGT TTC CTT ACA CCG GTA CAA CTG ACA 3600ACG CAA GCC CAT TAC GAT TAT CGT TTC CTT ACA CCG GTA CAA CTG ACA 3600

Thr Gln Ala His Tyr Asp Tyr Arg Phe Leu Thr Pro Val Gln Leu ThrThr Gln Ala His Tyr Asp Tyr Arg Phe Leu Thr Pro Val Gln Leu Thr

1185 1190 1195 12001185 1190 1195 1200

GAT ATT AAT GAT AAT CAA CAT ATT GTG ACT CTG GAC GCG CTA GGT CGC 3648GAT ATT AAT GAT AAT CAA CAT ATT GTG ACT CTG GAC GCG CTA GGT CGC 3648

Asp Ile Asn Asp Asn Gln His Ile Val Thr Leu Asp Ala Leu Gly ArgAsp Ile Asn Asp Asn Gln His Ile Val Thr Leu Asp Ala Leu Gly Arg

1205 1210 12151205 1210 1215

GTA ACC ACC AGC CGG TTC TGG GGC ACA GAG GCA GGA CAA GCC GCA GGC 3696GTA ACC ACC AGC CGG TTC TGG GGC ACA GAG GCA GGA CAA GCC GCA GGC 3696

Val Thr Thr Ser Arg Phe Trp Gly Thr Glu Ala Gly Gln Ala Ala GlyVal Thr Thr Ser Arg Phe Trp Gly Thr Glu Ala Gly Gln Ala Ala Gly

1220 1225 12301220 1225 1230

TAT TCC AAC CAG CCC TTC ACA CCA CCG GAC TCC GTA GAT AAA GCG CTG 3744TAT TCC AAC CAG CCC TTC ACA CCA CCG GAC TCC GTA GAT AAA GCG CTG 3744

Tyr Ser Asn Gln Pro Phe Thr Pro Pro Asp Ser Val Asp Lys Ala LeuTyr Ser Asn Gln Pro Phe Thr Pro Pro Asp Ser Val Asp Lys Ala Leu

1235 1240 12451235 1240 1245

GCA TTA ACC GGC GCA CTC CCT GTT GCC CAA TGT TTA GTC TAT GCC GTT 3792GCA TTA ACC GGC GCA CTC CCT GTT GCC CAA TGT TTA GTC TAT GCC GTT 3792

Ala Leu Thr Gly Ala Leu Pro Val Ala Gln Cys Leu Val Tyr Ala ValAla Leu Thr Gly Ala Leu Pro Val Ala Gln Cys Leu Val Tyr Ala Val

1250 1255 12601250 1255 1260

GAT AGC TGG ATG CCG TCG TTA TCT TTG TCT CAG CTT TCT CAG TCA CAA 3840GAT AGC TGG ATG CCG TCG TTA TCT TTG TCT CAG CTT TCT CAG TCA CAA 3840

Asp Ser Trp Met Pro Ser Leu Ser Leu Ser Gln Leu Ser Gln Ser GlnAsp Ser Trp Met Pro Ser Leu Ser Leu Ser Gln Leu Ser Gln Ser Gln

1265 1270 1275 12801265 1270 1275 1280

GAA GAG GCA GAA GCG CTA TGG GCG CAA CTG CGT GCC GCT CAT ATG ATT 3888GAA GAG GCA GAA GCG CTA TGG GCG CAA CTG CGT GCC GCT CAT ATG ATT 3888

Glu Glu Ala Glu Ala Leu Trp Ala Gln Leu Arg Ala Ala His Met IleGlu Glu Ala Glu Ala Leu Trp Ala Gln Leu Arg Ala Ala His Met Ile

1285 1290 12951285 1290 1295

ACC GAA GAT GGG AAA GTG TGT GCG TTA AGC GGG AAA CGA GGA ACA AGC 3936ACC GAA GAT GGG AAA GTG TGT GCG TTA AGC GGG AAA CGA GGA ACA AGC 3936

Thr Glu Asp Gly Lys Val Cys Ala Leu Ser Gly Lys Arg Gly Thr SerThr Glu Asp Gly Lys Val Cys Ala Leu Ser Gly Lys Arg Gly Thr Ser

1300 1305 13101300 1305 1310

CAT CAG AAC CTG ACG ATT CAA CTT ATT TCG CTA TTG GCA AGT ATT CCC 3984CAT CAG AAC CTG ACG ATT CAA CTT ATT TCG CTA TTG GCA AGT ATT CCC 3984

His Gln Asn Leu Thr Ile Gln Leu Ile Ser Leu Leu Ala Ser Ile ProHis Gln Asn Leu Thr Ile Gln Leu Ile Ser Leu Leu Ala Ser Ile Pro

1315 1320 13251315 1320 1325

CGT TTA CCG CCA CAT GTA CTG GGG ATC ACC ACT GAT CGC TAT GAT AGC 4032CGT TTA CCG CCA CAT GTA CTG GGG ATC ACC ACT GAT CGC TAT GAT AGC 4032

Arg Leu Pro Pro His Val Leu Gly Ile Thr Thr Asp Arg Tyr Asp SerArg Leu Pro Pro His Val Leu Gly Ile Thr Thr Asp Arg Tyr Asp Ser

1330 1335 13401330 1335 1340

GAT CCG CAA CAG CAG CAC CAA CAG ACG GTG AGC TTT AGT GAC GGT TTT 4080GAT CCG CAA CAG CAG CAC CAA CAG ACG GTG AGC TTT AGT GAC GGT TTT 4080

Asp Pro Gln Gln Gln His Gln Gln Thr Val Ser Phe Ser Asp Gly PheAsp Pro Gln Gln Gln His Gln Gln Thr Val Ser Phe Ser Asp Gly Phe

1345 1350 1355 13601345 1350 1355 1360

GGC CGG TTA CTC CAG AGT TCA GCT CGT CAT GAG TCA GGT GAT GCC TGG 4128GGC CGG TTA CTC CAG AGT TCA GCT CGT CAT GAG TCA GGT GAT GCC TGG 4128

Gly Arg Leu Leu Gln Ser Ser Ala Arg His Glu Ser Gly Asp Ala TrpGly Arg Leu Leu Gln Ser Ser Ala Arg His Glu Ser Gly Asp Ala Trp

1365 1370 13751365 1370 1375

CAA CGT AAA GAG GAT GGC GGG CTG GTC GTG GAT GCA AAT GGC GTT CTG 4176CAA CGT AAA GAG GAT GGC GGG CTG GTC GTG GAT GCA AAT GGC GTT CTG 4176

Gln Arg Lys Glu Asp Gly Gly Leu Val Val Asp Ala Asn Gly Val LeuGln Arg Lys Glu Asp Gly Gly Leu Val Val Asp Ala Asn Gly Val Leu

1380 1385 13901380 1385 1390

GTC AGT GCC CCT ACA GAC ACC CGA TGG GCC GTT TCC GGT CGC ACA GAA 4224GTC AGT GCC CCT ACA GAC ACC CGA TGG GCC GTT TCC GGT CGC ACA GAA 4224

Val Ser Ala Pro Thr Asp Thr Arg Trp Ala Val Ser Gly Arg Thr GluVal Ser Ala Pro Thr Asp Thr Arg Trp Ala Val Ser Gly Arg Thr Glu

1395 1400 14051395 1400 1405

TAT GAC GAC AAA GGC CAA CCT GTG CGT ACT TAT CAA CCC TAT TTT CTA 4272TAT GAC GAC AAA GGC CAA CCT GTG CGT ACT TAT CAA CCC TAT TTT CTA 4272

Tyr Asp Asp Lys Gly Gln Pro Val Arg Thr Tyr Gln Pro Tyr Phe LeuTyr Asp Asp Lys Gly Gln Pro Val Arg Thr Tyr Gln Pro Tyr Phe Leu

1410 1415 14201410 1415 1420

AAT GAC TGG CGT TAC GTT AGT GAT GAC AGC GCA CGA GAT GAC CTG TTT 4320AAT GAC TGG CGT TAC GTT AGT GAT GAC AGC GCA CGA GAT GAC CTG TTT 4320

Asn Asp Trp Arg Tyr Val Ser Asp Asp Ser Ala Arg Asp Asp Leu PheAsn Asp Trp Arg Tyr Val Ser Asp Asp Ser Ala Arg Asp Asp Leu Phe

1425 1430 1435 14401425 1430 1435 1440

GCC GAT ACC CAC CTT TAT GAT CCA TTG GGA CGG GAA TAC AAA GTC ATC 4368GCC GAT ACC CAC CTT TAT GAT CCA TTG GGA CGG GAA TAC AAA GTC ATC 4368

Ala Asp Thr His Leu Tyr Asp Pro Leu Gly Arg Glu Tyr Lys Val IleAla Asp Thr His Leu Tyr Asp Pro Leu Gly Arg Glu Tyr Lys Val Ile

1445 1450 14551445 1450 1455

ACT GCT AAG AAA TAT TTG CGA GAA AAG CTG TAC ACC CCG TGG TTT ATT 4416ACT GCT AAG AAA TAT TTG CGA GAA AAG CTG TAC ACC CCG TGG TTT ATT 4416

Thr Ala Lys Lys Tyr Leu Arg Glu Lys Leu Tyr Thr Pro Trp Phe IleThr Ala Lys Lys Tyr Leu Arg Glu Lys Leu Tyr Thr Pro Trp Phe Ile

1460 1465 14701460 1465 1470

GTC AGT GAG GAT GAA AAC GAT ACA GCA TCA AGA ACC CCA TAG 4458GTC AGT GAG GAT GAA AAC GAT ACA GCA TCA AGA ACC CCA TAG 4458

Val Ser Glu Asp Glu Asn Asp Thr Ala Ser Arg Thr Pro *Val Ser Glu Asp Glu Asn Asp Thr Ala Ser Arg Thr Pro *

1475 1480 14851475 1480 1485

(2) INFORMATION FOR SEQ ID NO:32:(2) INFORMATION FOR SEQ ID NO: 32:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1485 amino acids(A) LENGTH: 1485 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:32 (TcaC protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 32 (TcaC protein):

Met Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Leu Ser Leu Pro LysMet Gln Asp Ser Pro Glu Val Ser Ile Thr Thr Leu Ser Leu Pro Lys

1 5 10 151 5 10 15

Gly Gly Gly Ala Ile Asn Gly Met Gly Glu Ala Leu Asn Ala Ala GlyGly Gly Gly Ala Ile Asn Gly Met Gly Glu Ala Leu Asn Ala Ala Gly

20 25 3020 25 30

Pro Asp Gly Met Ala Ser Leu Ser Leu Pro Leu Pro Leu Ser Thr GlyPro Asp Gly Met Ala Ser Leu Ser Leu Pro Leu Pro Leu Ser Thr Gly

35 40 4535 40 45

Arg Gly Thr Ala Pro Gly Leu Ser Leu Ile Tyr Ser Asn Ser Ala GlyArg Gly Thr Ala Pro Gly Leu Ser Leu Ile Tyr Ser Asn Ser Ala Gly

50 55 6050 55 60

Asn Gly Pro Phe Gly Ile Gly Trp Gln Cys Gly Val Met Ser Ile SerAsn Gly Pro Phe Gly Ile Gly Trp Gln Cys Gly Val Met Ser Ile Ser

65 70 75 8065 70 75 80

Arg Arg Thr Gln His Gly Ile Pro Gln Tyr Gly Asn Asp Asp Thr PheArg Arg Thr Gln His Gly Ile Pro Gln Tyr Gly Asn Asp Asp Thr Phe

85 90 9585 90 95

Leu Ser Pro Gln Gly Glu Val Met Asn Ile Ala Leu Asn Asp Gln GlyLeu Ser Pro Gln Gly Glu Val Met Asn Ile Ala Leu Asn Asp Gln Gly

100 105 110100 105 110

Gln Pro Asp Ile Arg Gln Asp Val Lys Thr Leu Gln Gly Val Thr LeuGln Pro Asp Ile Arg Gln Asp Val Lys Thr Leu Gln Gly Val Thr Leu

115 120 125115 120 125

Pro Ile Ser Tyr Thr Val Thr Arg Tyr Gln Ala Arg Gln Ile Leu AspPro Ile Ser Tyr Thr Val Thr Arg Tyr Gln Ala Arg Gln Ile Leu Asp

130 135 140130 135 140

Phe Ser Lys Ile Glu Tyr Trp Gln Pro Ala Ser Gly Gln Glu Gly ArgPhe Ser Lys Ile Glu Tyr Trp Gln Pro Ala Ser Gly Gln Glu Gly Arg

145 150 155 160145 150 155 160

Ala Phe Trp Leu Ile Ser Thr Pro Asp Gly His Leu His Ile Leu GlyAla Phe Trp Leu Ile Ser Thr Pro Asp Gly His Leu His Ile Leu Gly

165 170 175165 170 175

Lys Thr Ala Gln Ala Cys Leu Ala Asn Pro Gln Asn Asp Gln Gln IleLys Thr Ala Gln Ala Cys Leu Ala Asn Pro Gln Asn Asp Gln Gln Ile

180 185 190180 185 190

Ala Gln Trp Leu Leu Glu Glu Thr Val Thr Pro Ala Gly Glu His ValAla Gln Trp Leu Leu Glu Glu Thr Val Thr Pro Ala Gly Glu His Val

195 200 205195 200 205

Ser Tyr Gln Tyr Arg Ala Glu Asp Glu Ala His Cys Asp Asp Asn GluSer Tyr Gln Tyr Arg Ala Glu Asp Glu Ala His Cys Asp Asp Asn Glu

210 215 220210 215 220

Lys Thr Ala His Pro Asn Val Thr Ala Gln Arg Tyr Leu Val Gln ValLys Thr Ala His Pro Asn Val Thr Ala Gln Arg Tyr Leu Val Gln Val

225 230 235 240225 230 235 240

Asn Tyr Gly Asn Ile Lys Pro Gln Ala Ser Leu Phe Val Leu Asp AsnAsn Tyr Gly Asn Ile Lys Pro Gln Ala Ser Leu Phe Val Leu Asp Asn

245 250 255245 250 255

Ala Pro Pro Ala Pro Glu Glu Trp Leu Phe His Leu Val Phe Asp HisAla Pro Pro Ala Pro Glu Glu Trp Leu Phe His Leu Val Phe Asp His

260 265 270260 265 270

Gly Glu Arg Asp Thr Ser Leu His Thr Val Pro Thr Trp Asp Ala GlyGly Glu Arg Asp Thr Ser Leu His Thr Val Pro Thr Trp Asp Ala Gly

275 280 285275 280 285

Thr Ala Gln Trp Ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Glu TyrThr Ala Gln Trp Ser Val Arg Pro Asp Ile Phe Ser Arg Tyr Glu Tyr

290 295 300290 295 300

Gly Phe Glu Val Arg Thr Arg Arg Leu Cys Gln Gln Val Leu Met PheGly Phe Glu Val Arg Thr Arg Arg Leu Cys Gln Gln Val Leu Met Phe

305 310 315 320305 310 315 320

His Arg Thr Ala Leu Met Ala Gly Glu Ala Ser Thr Asn Asp Ala ProHis Arg Thr Ala Leu Met Ala Gly Glu Ala Ser Thr Asn Asp Ala Pro

325 330 335325 330 335

Glu Leu Val Gly Arg Leu Ile Leu Glu Tyr Asp Lys Asn Ala Ser ValGlu Leu Val Gly Arg Leu Ile Leu Glu Tyr Asp Lys Asn Ala Ser Val

340 345 350340 345 350

Thr Thr Leu Ile Thr Ile Arg Gln Leu Ser His Glu Ser Asp Gly ArgThr Thr Leu Ile Thr Ile Arg Gln Leu Ser His Glu Ser Asp Gly Arg

355 360 365355 360 365

Pro Val Thr Gln Pro Pro Leu Glu Leu Ala Trp Gln Arg Phe Asp LeuPro Val Thr Gln Pro Pro Leu Glu Leu Ala Trp Gln Arg Phe Asp Leu

370 375 380370 375 380

Glu Lys Ile Pro Thr Trp Gln Arg Phe Asp Ala Leu Asp Asn Phe AsnGlu Lys Ile Pro Thr Trp Gln Arg Phe Asp Ala Leu Asp Asn Phe Asn

385 390 395 400385 390 395 400

Ser Gln Gln Arg Tyr Gln Leu Val Asp Leu Arg Gly Glu Gly Leu ProSer Gln Gln Arg Tyr Gln Leu Val Asp Leu Arg Gly Glu Gly Leu Pro

405 410 415405 410 415

Gly Met Leu Tyr Gln Asp Arg Gly Ala Trp Trp Tyr Lys Ala Pro GlnGly Met Leu Tyr Gln Asp Arg Gly Ala Trp Trp Tyr Lys Ala Pro Gln

420 425 430420 425 430

Arg Gln Glu Asp Gly Asp Ser Asn Ala Val Thr Tyr Asp Lys Ile AlaArg Gln Glu Asp Gly Asp Ser Asn Ala Val Thr Tyr Asp Lys Ile Ala

435 440 445435 440 445

Pro Leu Pro Thr Leu Pro Asn Leu Gln Asp Asn Ala Ser Leu Met AspPro Leu Pro Thr Leu Pro Asn Leu Gln Asp Asn Ala Ser Leu Met Asp

450 455 460450 455 460

Ile Asn Gly Asp Gly Gln Leu Asp Trp Val Val Thr Ala Ser Gly IleIle Asn Gly Asp Gly Gln Leu Asp Trp Val Val Thr Ala Ser Gly Ile

465 470 475 480465 470 475 480

Arg Gly Tyr His Ser Gln Gln Pro Asp Gly Lys Trp Thr His Phe ThrArg Gly Tyr His Ser Gln Gln Pro Asp Gly Lys Trp Thr His Phe Thr

485 490 495485 490 495

Pro Ile Asn Ala Leu Pro Val Glu Tyr Phe His Pro Ser Ile Gln PhePro Ile Asn Ala Leu Pro Val Glu Tyr Phe His Pro Ser Ile Gln Phe

500 505 510500 505 510

Ala Asp Leu Thr Gly Ala Gly Leu Ser Asp Leu Val Leu Ile Gly ProAla Asp Leu Thr Gly Ala Gly Leu Ser Asp Leu Val Leu Ile Gly Pro

515 520 525515 520 525

Lys Ser Val Arg Leu Tyr Ala Asn Gln Arg Asn Gly Trp Arg Lys GlyLys Ser Val Arg Leu Tyr Ala Asn Gln Arg Asn Gly Trp Arg Lys Gly

530 535 540530 535 540

Glu Asp Val Pro Gln Ser Thr Gly Ile Thr Leu Pro Val Thr Gly ThrGlu Asp Val Pro Gln Ser Thr Gly Ile Thr Leu Pro Val Thr Gly Thr

545 550 555 560545 550 555 560

Asp Ala Arg Lys Leu Val Ala Phe Ser Asp Met Leu Gly Ser Gly GlnAsp Ala Arg Lys Leu Val Ala Phe Ser Asp Met Leu Gly Ser Gly Gln

565 570 575565 570 575

Gln His Leu Val Glu Ile Lys Gly Asn Arg Val Thr Cys Trp Pro AsnGln His Leu Val Glu Ile Lys Gly Asn Arg Val Thr Cys Trp Pro Asn

580 585 590580 585 590

Leu Gly His Gly Arg Phe Gly Gln Pro Leu Thr Leu Ser Gly Phe SerLeu Gly His Gly Arg Phe Gly Gln Pro Leu Thr Leu Ser Gly Phe Ser

595 600 605595 600 605

Gln Pro Glu Asn Ser Phe Asn Pro Glu Arg Leu Phe Leu Ala Asp IleGln Pro Glu Asn Ser Phe Asn Pro Glu Arg Leu Phe Leu Ala Asp Ile

610 615 620610 615 620

Asp Gly Ser Gly Thr Thr Asp Leu Ile Tyr Ala Gln Ser Gly Ser LeuAsp Gly Ser Gly Thr Thr Asp Leu Ile Tyr Ala Gln Ser Gly Ser Leu

625 630 635 640625 630 635 640

Leu Ile Tyr Leu Asn Gln Ser Gly Asn Gln Phe Asp Ala Pro Leu ThrLeu Ile Tyr Leu Asn Gln Ser Gly Asn Gln Phe Asp Ala Pro Leu Thr

645 650 655645 650 655

Leu Ala Leu Pro Glu Gly Val Gln Phe Asp Asn Thr Cys Gln Leu GlnLeu Ala Leu Pro Glu Gly Val Gln Phe Asp Asn Thr Cys Gln Leu Gln

660 665 670660 665 670

Val Ala Asp Ile Gln Gly Leu Gly Ile Ala Ser Leu Ile Leu Thr ValVal Ala Asp Ile Gln Gly Leu Gly Ile Ala Ser Leu Ile Leu Thr Val

675 680 685675 680 685

Pro His Ile Ala Pro His His Trp Arg Cys Asp Leu Ser Leu Thr LysPro His Ile Ala Pro His His Trp Arg Cys Asp Leu Ser Leu Thr Lys

690 695 700690 695 700

Pro Trp Leu Leu Asn Val Met Asn Asn Asn Arg Gly Ala His His ThrPro Trp Leu Leu Asn Val Met Asn Asn Asn Arg Gly Ala His His Thr

705 710 715 720705 710 715 720

Leu His Tyr Arg Ser Ser Ala Gln Phe Trp Leu Asp Glu Lys Leu GlnLeu His Tyr Arg Ser Ser Ala Gln Phe Trp Leu Asp Glu Lys Leu Gln

725 730 735725 730 735

Leu Thr Lys Ala Gly Lys Ser Pro Ala Cys Tyr Leu Pro Phe Pro MetLeu Thr Lys Ala Gly Lys Ser Pro Ala Cys Tyr Leu Pro Phe Pro Met

740 745 750740 745 750

His Leu Leu Trp Tyr Thr Glu Ile Gln Asp Glu Ile Ser Gly Asn ArgHis Leu Leu Trp Tyr Thr Glu Ile Gln Asp Glu Ile Ser Gly Asn Arg

755 760 765755 760 765

Leu Thr Ser Glu Val Asn Tyr Ser His Gly Val Trp Asp Gly Lys GluLeu Thr Ser Glu Val Asn Tyr Ser His Gly Val Trp Asp Gly Lys Glu

770 775 780770 775 780

Arg Glu Phe Arg Gly Phe Gly Cys Ile Lys Gln Thr Asp Thr Thr ThrArg Glu Phe Arg Gly Phe Gly Cys Ile Lys Gln Thr Asp Thr Thr Thr

785 790 795 800785 790 795 800

Phe Ser His Gly Thr Ala Pro Glu Gln Ala Ala Pro Ser Leu Ser IlePhe Ser His Gly Thr Ala Pro Glu Gln Ala Ala Pro Ser Leu Ser Ile

805 810 815805 810 815

Ser Trp Phe Ala Thr Gly Met Asp Glu Val Asp Ser Gln Leu Ala ThrSer Trp Phe Ala Thr Gly Met Asp Glu Val Asp Ser Gln Leu Ala Thr

820 825 830820 825 830

Glu Tyr Trp Gln Ala Asp Thr Gln Ala Tyr Ser Gly Phe Glu Thr ArgGlu Tyr Trp Gln Ala Asp Thr Gln Ala Tyr Ser Gly Phe Glu Thr Arg

835 840 845835 840 845

Tyr Thr Val Trp Asp His Thr Asn Gln Thr Asp Gln Ala Phe Thr ProTyr Thr Val Trp Asp His Thr Asn Gln Thr Asp Gln Ala Phe Thr Pro

850 855 860850 855 860

Asn Glu Thr Gln Arg Asn Trp Leu Thr Arg Ala Leu Lys Gly Gln LeuAsn Glu Thr Gln Arg Asn Trp Leu Thr Arg Ala Leu Lys Gly Gln Leu

865 870 875 880865 870 875 880

Leu Arg Thr Glu Leu Tyr Gly Leu Asp Gly Thr Asp Lys Gln Thr ValLeu Arg Thr Glu Leu Tyr Gly Leu Asp Gly Thr Asp Lys Gln Thr Val

885 890 895885 890 895

Pro Tyr Thr Val Ser Glu Ser Arg Tyr Gln Val Arg Ser Ile Pro ValPro Tyr Thr Val Ser Glu Ser Arg Tyr Gln Val Arg Ser Ile Pro Val

900 905 910900 905 910

Asn Lys Glu Thr Glu Leu Ser Ala Trp Val Thr Ala Ile Glu Asn ArgAsn Lys Glu Thr Glu Leu Ser Ala Trp Val Thr Ala Ile Glu Asn Arg

915 920 925915 920 925

Ser Tyr His Tyr Glu Arg Ile Ile Thr Asp Pro Gln Phe Ser Gln SerSer Tyr His Tyr Glu Arg Ile Ile Thr Asp Pro Gln Phe Ser Gln Ser

930 935 940930 935 940

Ile Lys Leu Gln His Asp Ile Phe Gly Gln Ser Leu Gln Ser Val AspIle Lys Leu Gln His Asp Ile Phe Gly Gln Ser Leu Gln Ser Val Asp

945 950 955 960945 950 955 960

Ile Ala Trp Pro Arg Arg Glu Lys Pro Ala Val Asn Pro Tyr Pro ProIle Ala Trp Pro Arg Arg Glu Lys Pro Ala Val Asn Pro Tyr Pro Pro

965 970 975965 970 975

Thr Leu Pro Glu Thr Leu Phe Asp Ser Ser Tyr Asp Asp Gln Gln GlnThr Leu Pro Glu Thr Leu Phe Asp Ser Ser Tyr Asp Asp Gln Gln Gln

980 985 990980 985 990

Leu Leu Arg Leu Val Arg Gln Lys Asn Ser Trp His His Leu Thr AspLeu Leu Arg Leu Val Arg Gln Lys Asn Ser Trp His His Leu Thr Asp

995 1000 1005995 1000 1005

Gly Glu Asn Trp Arg Leu Gly Leu Pro Asn Ala Gln Arg Arg Asp ValGly Glu Asn Trp Arg Leu Gly Leu Pro Asn Ala Gln Arg Arg Asp Val

1010 1015 10201010 1015 1020

Tyr Thr Tyr Asp Arg Ser Lys Ile Pro Thr Glu Gly Ile Ser Leu GluTyr Thr Tyr Asp Arg Ser Lys Ile Pro Thr Glu Gly Ile Ser Leu Glu

1025 1030 1035 10401025 1030 1035 1040

Ile Leu Leu Lys Asp Asp Gly Leu Leu Ala Asp Glu Lys Ala Ala ValIle Leu Leu Lys Asp Asp Gly Leu Leu Ala Asp Glu Lys Ala Ala Val

1045 1050 10551045 1050 1055

Tyr Leu Gly Gln Gln Gln Thr Phe Tyr Thr Ala Gly Gln Ala Glu ValTyr Leu Gly Gln Gln Gln Thr Phe Tyr Thr Ala Gly Gln Ala Glu Val

1060 1065 10701060 1065 1070

Thr Leu Glu Lys Pro Thr Leu Gln Ala Leu Val Ala Phe Gln Glu ThrThr Leu Glu Lys Pro Thr Leu Gln Ala Leu Val Ala Phe Gln Glu Thr

1075 1080 10851075 1080 1085

Ala Met Met Asp Asp Thr Ser Leu Gln Ala Tyr Glu Gly Val Ile GluAla Met Met Asp Asp Thr Ser Leu Gln Ala Tyr Glu Gly Val Ile Glu

1090 1095 11001090 1095 1100

Glu Gln Glu Leu Asn Thr Ala Leu Thr Gln Ala Gly Tyr Gln Gln ValGlu Gln Glu Leu Asn Thr Ala Leu Thr Gln Ala Gly Tyr Gln Gln Val

1105 1110 1115 11201105 1110 1115 1120

Ala Arg Leu Phe Asn Thr Arg Ser Glu Ser Pro Val Trp Ala Ala ArgAla Arg Leu Phe Asn Thr Arg Ser Glu Ser Pro Val Trp Ala Ala Arg

1125 1130 11351125 1130 1135

Gln Gly Tyr Thr Asp Tyr Gly Asp Ala Ala Gln Phe Trp Arg Pro GlnGln Gly Tyr Thr Asp Tyr Gly Asp Ala Ala Gln Phe Trp Arg Pro Gln

1140 1145 11501140 1145 1150

Ala Gln Arg Asn Ser Leu Leu Thr Gly Lys Thr Thr Leu Thr Trp AspAla Gln Arg Asn Ser Leu Leu Thr Gly Lys Thr Thr Leu Thr Trp Asp

1155 1160 11651155 1160 1165

Thr His His Cys Val Ile Ile Gln Thr Gln Asp Ala Ala Gly Leu ThrThr His His Cys Val Ile Ile Gln Thr Gln Asp Ala Ala Gly Leu Thr

1170 1175 11801170 1175 1180

Thr Gln Ala His Tyr Asp Tyr Arg Phe Leu Thr Pro Val Gln Leu ThrThr Gln Ala His Tyr Asp Tyr Arg Phe Leu Thr Pro Val Gln Leu Thr

1185 1190 1195 12001185 1190 1195 1200

Asp Ile Asn Asp Asn Gln His Ile Val Thr Leu Asp Ala Leu Gly ArgAsp Ile Asn Asp Asn Gln His Ile Val Thr Leu Asp Ala Leu Gly Arg

1205 1210 12151205 1210 1215

Val Thr Thr Ser Arg Phe Trp Gly Thr Glu Ala Gly Gln Ala Ala GlyVal Thr Thr Ser Arg Phe Trp Gly Thr Glu Ala Gly Gln Ala Ala Gly

1220 1225 12301220 1225 1230

Tyr Ser Asn Gln Pro Phe Thr Pro Pro Asp Ser Val Asp Lys Ala LeuTyr Ser Asn Gln Pro Phe Thr Pro Pro Asp Ser Val Asp Lys Ala Leu

1235 1240 12451235 1240 1245

Ala Leu Thr Gly Ala Leu Pro Val Ala Gln Cys Leu Val Tyr Ala ValAla Leu Thr Gly Ala Leu Pro Val Ala Gln Cys Leu Val Tyr Ala Val

1250 1255 12601250 1255 1260

Asp Ser Trp Met Pro Ser Leu Ser Leu Ser Gln Leu Ser Gln Ser GlnAsp Ser Trp Met Pro Ser Leu Ser Leu Ser Gln Leu Ser Gln Ser Gln

1265 1270 1275 12801265 1270 1275 1280

Glu Glu Ala Glu Ala Leu Trp Ala Gln Leu Arg Ala Ala His Met IleGlu Glu Ala Glu Ala Leu Trp Ala Gln Leu Arg Ala Ala His Met Ile

1285 1290 12951285 1290 1295

Thr Glu Asp Gly Lys Val Cys Ala Leu Ser Gly Lys Arg Gly Thr SerThr Glu Asp Gly Lys Val Cys Ala Leu Ser Gly Lys Arg Gly Thr Ser

1300 1305 13101300 1305 1310

His Gln Asn Leu Thr Ile Gln Leu Ile Ser Leu Leu Ala Ser Ile ProHis Gln Asn Leu Thr Ile Gln Leu Ile Ser Leu Leu Ala Ser Ile Pro

1315 1320 13251315 1320 1325

Arg Leu Pro Pro His Val Leu Gly Ile Thr Thr Asp Arg Tyr Asp SerArg Leu Pro Pro His Val Leu Gly Ile Thr Thr Asp Arg Tyr Asp Ser

1330 1335 13401330 1335 1340

Asp Pro Gln Gln Gln His Gln Gln Thr Val Ser Phe Ser Asp Gly PheAsp Pro Gln Gln Gln His Gln Gln Thr Val Ser Phe Ser Asp Gly Phe

1345 1350 1355 13601345 1350 1355 1360

Gly Arg Leu Leu Gln Ser Ser Ala Arg His Glu Ser Gly Asp Ala TrpGly Arg Leu Leu Gln Ser Ser Ala Arg His Glu Ser Gly Asp Ala Trp

1365 1370 13751365 1370 1375

Gln Arg Lys Glu Asp Gly Gly Leu Val Val Asp Ala Asn Gly Val LeuGln Arg Lys Glu Asp Gly Gly Leu Val Val Asp Ala Asn Gly Val Leu

1380 1385 13901380 1385 1390

Val Ser Ala Pro Thr Asp Thr Arg Trp Ala Val Ser Gly Arg Thr GluVal Ser Ala Pro Thr Asp Thr Arg Trp Ala Val Ser Gly Arg Thr Glu

1395 1400 14051395 1400 1405

Tyr Asp Asp Lys Gly Gln Pro Val Arg Thr Tyr Gln Pro Tyr Phe LeuTyr Asp Asp Lys Gly Gln Pro Val Arg Thr Tyr Gln Pro Tyr Phe Leu

1410 1415 14201410 1415 1420

Asn Asp Trp Arg Tyr Val Ser Asp Asp Ser Ala Arg Asp Asp Leu PheAsn Asp Trp Arg Tyr Val Ser Asp Asp Ser Ala Arg Asp Asp Leu Phe

1425 1430 1435 14401425 1430 1435 1440

Ala Asp Thr His Leu Tyr Asp Pro Leu Gly Arg Glu Tyr Lys Val IleAla Asp Thr His Leu Tyr Asp Pro Leu Gly Arg Glu Tyr Lys Val Ile

1445 1450 14551445 1450 1455

Thr Ala Lys Lys Tyr Leu Arg Glu Lys Leu Tyr Thr Pro Trp Phe IleThr Ala Lys Lys Tyr Leu Arg Glu Lys Leu Tyr Thr Pro Trp Phe Ile

1460 1465 14701460 1465 1470

Val Ser Glu Asp Glu Asn Asp Thr Ala Ser Arg Thr Pro *Val Ser Glu Asp Glu Asn Asp Thr Ala Ser Arg Thr Pro *

1475 1480 14851475 1480 1485

(2) INFORMATION FOR SEQ ID NO:33:(2) INFORMATION FOR SEQ ID NO: 33:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 3288 base pairs(A) LENGTH: 3288 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:33 (tcaA gene):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 33 (tcaA gene):

ATG GTG ACT GTT ATG CAA AAT AAA ATA TCA TTT TTA TCA GGT ACA TCC 48ATG GTG ACT GTT ATG CAA AAT AAA ATA TCA TTT TTA TCA GGT ACA TCC 48

Met Val Thr Val Met Gln Asn Lys Ile Ser Phe Leu Ser Gly Thr SerMet Val Thr Val Met Gln Asn Lys Ile Ser Phe Leu Ser Gly Thr Ser

1 5 10 151 5 10 15

GAA CAG CCC CTG CTT GAC GCC GGT TAT CAA AAC GTA TTT GAT ATC GCA 96GAA CAG CCC CTG CTT GAC GCC GGT TAT CAA AAC GTA TTT GAT ATC GCA 96

Glu Gln Pro Leu Leu Asp Ala Gly Tyr Gln Asn Val Phe Asp Ile AlaGlu Gln Pro Leu Leu Asp Ala Gly Tyr Gln Asn Val Phe Asp Ile Ala

20 25 3020 25 30

TCA ATC AGC CGG GCT ACT TTC GTT CAA TCC GTT CCC ACC CTG CCC GTT 144TCA ATC AGC CGG GCT ACT TTC GTT CAA TCC GTT CCC ACC CTG CCC GTT 144

Ser Ile Ser Arg Ala Thr Phe Val Gln Ser Val Pro Thr Leu Pro ValSer Ile Ser Arg Ala Thr Phe Val Gln Ser Val Pro Thr Leu Pro Val

35 40 4535 40 45

AAA GAG GCT CAT ACC GTC TAT CGT CAG GCG CGG CAA CGT GCG GAA AAT 192AAA GAG GCT CAT ACC GTC TAT CGT CAG GCG CGG CAA CGT GCG GAA AAT 192

Lys Glu Ala His Thr Val Tyr Arg Gln Ala Arg Gln Arg Ala Glu AsnLys Glu Ala His Thr Val Tyr Arg Gln Ala Arg Gln Arg Ala Glu Asn

50 55 6050 55 60

CTG AAA TCC CTC TAC CGA GCC TGG CAA TTG CGT CAG GAG CCG GTT ATT 240CTG AAA TCC CTC TAC CGA GCC TGG CAA TTG CGT CAG GAG CCG GTT ATT 240

Leu Lys Ser Leu Tyr Arg Ala Trp Gln Leu Arg Gln Glu Pro Val IleLeu Lys Ser Leu Tyr Arg Ala Trp Gln Leu Arg Gln Glu Pro Val Ile

65 70 75 8065 70 75 80

AAA GGG CTG GCT AAA CTT AAC CTA CAA TCC AAC GTT TCT GTG CTT CAA 288AAA GGG CTG GCT AAA CTT AAC CTA CAA TCC AAC GTT TCT GTG CTT CAA 288

Lys Gly Leu Ala Lys Leu Asn Leu Gln Ser Asn Val Ser Val Leu GlnLys Gly Leu Ala Lys Leu Asn Leu Gln Ser Asn Val Ser Val Leu Gln

85 90 9585 90 95

GAT GCT TTG GTA GAG AAT ATT GGC GGT GAT GGG GAT TTC AGC GAT TTA 336GAT GCT TTG GTA GAG AAT ATT GGC GGT GAT GGG GAT TTC AGC GAT TTA 336

Asp Ala Leu Val Glu Asn Ile Gly Gly Asp Gly Asp Phe Ser Asp LeuAsp Ala Leu Val Glu Asn Ile Gly Gly Asp Gly Asp Phe Ser Asp Leu

100 105 110100 105 110

ATG AAC CGT GCC AGT CAA TAT GCT GAC GCT GCC TCT ATT CAA TCC CTA 384ATG AAC CGT GCC AGT CAA TAT GCT GAC GCT GCC TCT ATT CAA TCC CTA 384

Met Asn Arg Ala Ser Gln Tyr Ala Asp Ala Ala Ser Ile Gln Ser LeuMet Asn Arg Ala Ser Gln Tyr Ala Asp Ala Ala Ser Ile Gln Ser Leu

115 120 125115 120 125

TTT TCA CCG GGC CGT TAT GCT TCC GCA CTC TAC AGA GTT GCT AAA GAT 432TTT TCA CCG GGC CGT TAT GCT TCC GCA CTC TAC AGA GTT GCT AAA GAT 432

Phe Ser Pro Gly Arg Tyr Ala Ser Ala Leu Tyr Arg Val Ala Lys AspPhe Ser Pro Gly Arg Tyr Ala Ser Ala Leu Tyr Arg Val Ala Lys Asp

130 135 140130 135 140

CTG CAT AAA TCA GAT TCC AGT TTG CAT ATT GAT AAT CGC CGC GCT GAT 480CTG CAT AAA TCA GAT TCC AGT TTG CAT ATT GAT AAT CGC CGC GCT GAT 480

Leu His Lys Ser Asp Ser Ser Leu His Ile Asp Asn Arg Arg Ala AspLeu His Lys Ser Asp Ser Ser Leu His Ile Asp Asn Arg Arg Ala Asp

145 150 155 160145 150 155 160

CTG AAG GAT CTG ATA TTA AGC GAA ACG ACG ATG AAT AAA GAG GTC ACT 528CTG AAG GAT CTG ATA TTA AGC GAA ACG ACG ATG AAT AAA GAG GTC ACT 528

Leu Lys Asp Leu Ile Leu Ser Glu Thr Thr Met Asn Lys Glu Val ThrLeu Lys Asp Leu Ile Leu Ser Glu Thr Thr Met Asn Lys Glu Val Thr

165 170 175165 170 175

TCC CTT GAT ATC TTG TTG GAT GTG CTA CAA AAA GGC GGT AAA GAT ATT 576TCC CTT GAT ATC TTG TTG GAT GTG CTA CAA AAA GGC GGT AAA GAT ATT 576

Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Lys Gly Gly Lys Asp IleSer Leu Asp Ile Leu Leu Asp Val Leu Gln Lys Gly Gly Lys Asp Ile

180 185 190180 185 190

ACT GAG CTG TCC GGC GCA TTC TTC CCA ATG ACG TTA CCT TAT GAC GAT 624ACT GAG CTG TCC GGC GCA TTC TTC CCA ATG ACG TTA CCT TAT GAC GAT 624

Thr Glu Leu Ser Gly Ala Phe Phe Pro Met Thr Leu Pro Tyr Asp AspThr Glu Leu Ser Gly Ala Phe Phe Pro Met Thr Leu Pro Tyr Asp Asp

195 200 205195 200 205

CAT CTG TCG CAA ATC GAT TCC GCT TTA TCG GCA CAA GCC AGA ACG CTG 672CAT CTG TCG CAA ATC GAT TCC GCT TTA TCG GCA CAA GCC AGA ACG CTG 672

His Leu Ser Gln Ile Asp Ser Ala Leu Ser Ala Gln Ala Arg Thr LeuHis Leu Ser Gln Ile Asp Ser Ala Leu Ser Ala Gln Ala Arg Thr Leu

210 215 220210 215 220

AAC GGT GTG TGG AAT ACT TTG ACA GAT ACC ACG GCA CAA GCG GTT TCA 720AAC GGT GTG TGG AAT ACT TTG ACA GAT ACC ACG GCA CAA GCG GTT TCA 720

Asn Gly Val Trp Asn Thr Leu Thr Asp Thr Thr Ala Gln Ala Val SerAsn Gly Val Trp Asn Thr Leu Thr Asp Thr Thr Ala Gln Ala Val Ser

225 230 235 240225 230 235 240

GAA CAA ACC AGT AAT ACG AAT ACA CGC AAA CTG TTC GCT GCC CAA GAT 768GAA CAA ACC AGT AAT ACG AAT ACA CGC AAA CTG TTC GCT GCC CAA GAT 768

Glu Gln Thr Ser Asn Thr Asn Thr Arg Lys Leu Phe Ala Ala Gln AspGlu Gln Thr Ser Asn Thr Asn Thr Arg Lys Leu Phe Ala Ala Gln Asp

245 250 255245 250 255

GGT AAT CAA GAT ACA TTT TTT TCC GGA AAC ACT TTT TAT TTC AAA GCG 816GGT AAT CAA GAT ACA TTT TTT TCC GGA AAC ACT TTT TAT TTC AAA GCG 816

Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr Phe Tyr Phe Lys AlaGly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr Phe Tyr Phe Lys Ala

260 265 270260 265 270

GTG GGA TTC AGC GGG CAA CCT ATG GTT TAC CTG TCA CAG TAC ACC AGC 864GTG GGA TTC AGC GGG CAA CCT ATG GTT TAC CTG TCA CAG TAC ACC AGC 864

Val Gly Phe Ser Gly Gln Pro Met Val Tyr Leu Ser Gln Tyr Thr SerVal Gly Phe Ser Gly Gln Pro Met Val Tyr Leu Ser Gln Tyr Thr Ser

275 280 285275 280 285

GGG AAC GGC ATT GTC GGC GCA CAA TTG ATT GCA GGT AAT CCA GAC CAA 912GGG AAC GGC ATT GTC GGC GCA CAA TTG ATT GCA GGT AAT CCA GAC CAA 912

Gly Asn Gly Ile Val Gly Ala Gln Leu Ile Ala Gly Asn Pro Asp GlnGly Asn Gly Ile Val Gly Ala Gln Leu Ile Ala Gly Asn Pro Asp Gln

290 295 300290 295 300

GCC GCC GCC GCA ATA GTC GCA CCG TTG AAA CTC ACT TGG TCA ATG GCA 960GCC GCC GCC GCA ATA GTC GCA CCG TTG AAA CTC ACT TGG TCA ATG GCA 960

Ala Ala Ala Ala Ile Val Ala Pro Leu Lys Leu Thr Trp Ser Met AlaAla Ala Ala Ala Ile Val Ala Pro Leu Lys Leu Thr Trp Ser Met Ala

305 310 315 320305 310 315 320

AAA CAG TGT TAC TAC CTC GTC GCT CCC GAT GGT ACA ACG ATG GGA GAC 1008AAA CAG TGT TAC TAC CTC GTC GCT CCC GAT GGT ACA ACG ATG GGA GAC 1008

Lys Gln Cys Tyr Tyr Leu Val Ala Pro Asp Gly Thr Thr Met Gly AspLys Gln Cys Tyr Tyr Leu Val Ala Pro Asp Gly Thr Thr Met Gly Asp

325 330 335325 330 335

GGT AAT GTT CTG ACC GGC TGT TTC TTA AGA GGC AAC AGC CCA ACT AAC 1056GGT AAT GTT CTG ACC GGC TGT TTC TTA AGA GGC AAC AGC CCA ACT AAC 1056

Gly Asn Val Leu Thr Gly Cys Phe Leu Arg Gly Asn Ser Pro Thr AsnGly Asn Val Leu Thr Gly Cys Phe Leu Arg Gly Asn Ser Pro Thr Asn

340 345 350340 345 350

CCG GAT AAA GAC GGT ATT TTT GCT CAG GTA GCC AAC AAA TCA GGC AGT 1104CCG GAT AAA GAC GGT ATT TTT GCT CAG GTA GCC AAC AAA TCA GGC AGT 1104

Pro Asp Lys Asp Gly Ile Phe Ala Gln Val Ala Asn Lys Ser Gly SerPro Asp Lys Asp Gly Ile Phe Ala Gln Val Ala Asn Lys Ser Gly Ser

355 360 365355 360 365

ACT CAG CCT TTG CCA AGC TTC CAT CTG CCG GTC ACA CTG GAA CAC AGC 1152ACT CAG CCT TTG CCA AGC TTC CAT CTG CCG GTC ACA CTG GAA CAC AGC 1152

Thr Gln Pro Leu Pro Ser Phe His Leu Pro Val Thr Leu Glu His SerThr Gln Pro Leu Pro Ser Phe His Leu Pro Val Thr Leu Glu His Ser

370 375 380370 375 380

GAG AAT AAA GAT CAG TAC TAT CTG AAA ACA GAG CAG GGT TAT ATC ACG 1200GAG AAT AAA GAT CAG TAC TAT CTG AAA ACA GAG CAG GGT TAT ATC ACG 1200

Glu Asn Lys Asp Gln Tyr Tyr Leu Lys Thr Glu Gln Gly Tyr Ile ThrGlu Asn Lys Asp Gln Tyr Tyr Leu Lys Thr Glu Gln Gly Tyr Ile Thr

385 390 395 400385 390 395 400

GTA GAT AGT TCC GGA CAG TCA AAT TGG AAA AAC GCG CTG GTT ATC AAT 1248GTA GAT AGT TCC GGA CAG TCA AAT TGG AAA AAC GCG CTG GTT ATC AAT 1248

Val Asp Ser Ser Gly Gln Ser Asn Trp Lys Asn Ala Leu Val Ile AsnVal Asp Ser Ser Gly Gln Ser Asn Trp Lys Asn Ala Leu Val Ile Asn

405 410 415405 410 415

GGG ACA AAA GAC AAG GGG CTG TTA TTA ACC TTT TGC AGC GAT AGC TCA 1296GGG ACA AAA GAC AAG GGG CTG TTA TTA ACC TTT TGC AGC GAT AGC TCA 1296

Gly Thr Lys Asp Lys Gly Leu Leu Leu Thr Phe Cys Ser Asp Ser SerGly Thr Lys Asp Lys Gly Leu Leu Leu Thr Phe Cys Ser Asp Ser Ser

420 425 430420 425 430

GGC ACT CCG ACA AAC CCT GAT GAT GTG ATT CCT CCC GCT ATC AAT GAT 1344GGC ACT CCG ACA AAC CCT GAT GAT GTG ATT CCT CCC GCT ATC AAT GAT 1344

Gly Thr Pro Thr Asn Pro Asp Asp Val Ile Pro Pro Ala Ile Asn AspGly Thr Pro Thr Asn Pro Asp Asp Val Ile Pro Pro Ala Ile Asn Asp

435 440 445435 440 445

ATT CCA TCG CCG CCA GCC CGC GAA ACA CTG TCA CTG ACG CCG GTC AGT 1392ATT CCA TCG CCG CCA GCC CGC GAA ACA CTG TCA CTG ACG CCG GTC AGT 1392

Ile Pro Ser Pro Pro Ala Arg Glu Thr Leu Ser Leu Thr Pro Val SerIle Pro Ser Pro Pro Ala Arg Glu Thr Leu Ser Leu Thr Pro Val Ser

450 455 460450 455 460

TAT CAA TTG ATG ACC AAT CCG GCA CCG ACA GAA GAT GAT ATT ACC AAC 1440TAT CAA TTG ATG ACC AAT CCG GCA CCG ACA GAA GAT GAT ATT ACC AAC 1440

Tyr Gln Leu Met Thr Asn Pro Ala Pro Thr Glu Asp Asp Ile Thr AsnTyr Gln Leu Met Thr Asn Pro Ala Pro Thr Glu Asp Asp Ile Thr Asn

465 470 475 480465 470 475 480

CAT TAT GGT TTT AAC GGC GCT AGC TTA CGG GCT TCT CCA TTG TCA ACC 1488CAT TAT GGT TTT AAC GGC GCT AGC TTA CGG GCT TCT CCA TTG TCA ACC 1488

His Tyr Gly Phe Asn Gly Ala Ser Leu Arg Ala Ser Pro Leu Ser ThrHis Tyr Gly Phe Asn Gly Ala Ser Leu Arg Ala Ser Pro Leu Ser Thr

485 490 495485 490 495

AGC GAG TTG ACC AGC AAA CTG AAT TCT ATC GAT ACT TTC TGT GAG AAG 1536AGC GAG TTG ACC AGC AAA CTG AAT TCT ATC GAT ACT TTC TGT GAG AAG 1536

Ser Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr Phe Cys Glu LysSer Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr Phe Cys Glu Lys

500 505 510500 505 510

ACC CGG TTA AGC TTC AAT CAG TTA ATG GAT TTG ACC GCT CAG CAA TCT 1584ACC CGG TTA AGC TTC AAT CAG TTA ATG GAT TTG ACC GCT CAG CAA TCT 1584

Thr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu Thr Ala Gln Gln SerThr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu Thr Ala Gln Gln Ser

515 520 525515 520 525

TAC AGT CAA AGC AGC ATT GAT GCG AAA GCA GCC AGC CGC TAT GTT CGT 1632TAC AGT CAA AGC AGC ATT GAT GCG AAA GCA GCC AGC CGC TAT GTT CGT 1632

Tyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala Ser Arg Tyr Val ArgTyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala Ser Arg Tyr Val Arg

530 535 540530 535 540

TTT GGG GAA ACC ACC CCA ACC CGC GTC AAT GTC TAC GGT GCC GCT TAT 1680TTT GGG GAA ACC ACC CCA ACC CGC GTC AAT GTC TAC GGT GCC GCT TAT 1680

Phe Gly Glu Thr Thr Pro Thr Arg Val Asn Val Tyr Gly Ala Ala TyrPhe Gly Glu Thr Thr Pro Thr Arg Val Asn Val Tyr Gly Ala Ala Tyr

545 550 555 560545 550 555 560

CTG AAC AGC ACA CTG GCA GAC GCG GCT GAT GGT CAA TAT CTG TGG ATT 1728CTG AAC AGC ACA CTG GCA GAC GCG GCT GAT GGT CAA TAT CTG TGG ATT 1728

Leu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly Gln Tyr Leu Trp IleLeu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly Gln Tyr Leu Trp Ile

565 570 575565 570 575

CAG ACT GAT GGC AAG AGC CTA AAT TTC ACT GAC GAT ACG GTA GTC GCC 1776CAG ACT GAT GGC AAG AGC CTA AAT TTC ACT GAC GAT ACG GTA GTC GCC 1776

Gln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp Asp Thr Val Val AlaGln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp Asp Thr Val Val Ala

580 585 590580 585 590

TTA GCC GGT CGC GCT GAA AAG CTG GTA CGT TTA TCA TCC CAG ACC GGG 1824TTA GCC GGT CGC GCT GAA AAG CTG GTA CGT TTA TCA TCC CAG ACC GGG 1824

Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser Ser Gln Thr GlyLeu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser Ser Gln Thr Gly

595 600 605595 600 605

CTA TCA TTT GAA GAA TTG GAC TGG CTG ATT GCC AAT GCC AGT CGT AGT 1872CTA TCA TTT GAA GAA TTG GAC TGG CTG ATT GCC AAT GCC AGT CGT AGT 1872

Leu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn Ala Ser Arg SerLeu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn Ala Ser Arg Ser

610 615 620610 615 620

GTG CCG GAC CAC CAC GAC AAA ATT GTG CTG GAT AAG CCG GTC CTT GAA 1920GTG CCG GAC CAC CAC GAC AAA ATT GTG CTG GAT AAG CCG GTC CTT GAA 1920

Val Pro Asp His His Asp Lys Ile Val Leu Asp Lys Pro Val Leu GluVal Pro Asp His His Asp Lys Ile Val Leu Asp Lys Pro Val Leu Glu

625 630 635 640625 630 635 640

GCA CTG GCA GAG TAT GTC AGC CTA AAA CAG CGC TAT GGG CTT GAT GCC 1968GCA CTG GCA GAG TAT GTC AGC CTA AAA CAG CGC TAT GGG CTT GAT GCC 1968

Ala Leu Ala Glu Tyr Val Ser Leu Lys Gln Arg Tyr Gly Leu Asp AlaAla Leu Ala Glu Tyr Val Ser Leu Lys Gln Arg Tyr Gly Leu Asp Ala

645 650 655645 650 655

AAT ACC TTT GCG ACC TTC ATT AGT GCA GTA AAT CCT TAT ACG CCA GAT 2016AAT ACC TTT GCG ACC TTC ATT AGT GCA GTA AAT CCT TAT ACG CCA GAT 2016

Asn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn Pro Tyr Thr Pro AspAsn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn Pro Tyr Thr Pro Asp

660 665 670660 665 670

CAG ACA CCC AGT TTC TAT GAA ACC GCT TTC CGC TCT GCC GAC GGT AAT 2064CAG ACA CCC AGT TTC TAT GAA ACC GCT TTC CGC TCT GCC GAC GGT AAT 2064

Gln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser Ala Asp Gly AsnGln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser Ala Asp Gly Asn

675 680 685675 680 685

CAT GTC ATT GCG CTA GGT ACA GAG GTG AAA TAT GCA GAA AAT GAG CAG 2112CAT GTC ATT GCG CTA GGT ACA GAG GTG AAA TAT GCA GAA AAT GAG CAG 2112

His Val Ile Ala Leu Gly Thr Glu Val Lys Tyr Ala Glu Asn Glu GlnHis Val Ile Ala Leu Gly Thr Glu Val Lys Tyr Ala Glu Asn Glu Gln

690 695 700690 695 700

GAT GAG TTA GCC GCC ATA TGC TGC AAA GCA TTG GGT GTC ACC AGT GAT 2160GAT GAG TTA GCC GCC ATA TGC TGC AAA GCA TTG GGT GTC ACC AGT GAT 2160

Asp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu Gly Val Thr Ser AspAsp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu Gly Val Thr Ser Asp

705 710 715 720705 710 715 720

GAA CTG CTC CGT ATT GGT CGC TAT TGC TTC GGT AAT GCA GGC AGT TTT 2208GAA CTG CTC CGT ATT GGT CGC TAT TGC TTC GGT AAT GCA GGC AGT TTT 2208

Glu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly Asn Ala Gly Ser PheGlu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly Asn Ala Gly Ser Phe

725 730 735725 730 735

ACC TTG GAT GAA TAT ACC GCC AGT CAG TTG TAT CGC TTC GGC GCC ATT 2256ACC TTG GAT GAA TAT ACC GCC AGT CAG TTG TAT CGC TTC GGC GCC ATT 2256

Thr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr Arg Phe Gly Ala IleThr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr Arg Phe Gly Ala Ile

740 745 750740 745 750

CCC CGT TTG TTT GGG CTG ACA TTT GCC CAA GCC GAA ATT TTA TGG CGT 2304CCC CGT TTG TTT GGG CTG ACA TTT GCC CAA GCC GAA ATT TTA TGG CGT 2304

Pro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala Glu Ile Leu Trp ArgPro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala Glu Ile Leu Trp Arg

755 760 765755 760 765

CTG ATG GAA GGC GGA AAA GAT ATC TTA TTG CAA CAG TTA GGT CAG GCA 2352CTG ATG GAA GGC GGA AAA GAT ATC TTA TTG CAA CAG TTA GGT CAG GCA 2352

Leu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln Gln Leu Gly Gln AlaLeu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln Gln Leu Gly Gln Ala

770 775 780770 775 780

AAA TCC CTG CAA CCA CTG GCT ATT TTA CGC CGT ACC GAG CAG GTG CTG 2400AAA TCC CTG CAA CCA CTG GCT ATT TTA CGC CGT ACC GAG CAG GTG CTG 2400

Lys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg Thr Glu Gln Val LeuLys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg Thr Glu Gln Val Leu

785 790 795 800785 790 795 800

GAT TGG ATG TCG TCC GTA AAT CTA AGT CTG ACT TAT CTG CAA GGG ATG 2448GAT TGG ATG TCG TCC GTA AAT CTA AGT CTG ACT TAT CTG CAA GGG ATG 2448

Asp Trp Met Ser Ser Val Asn Leu Ser Leu Thr Tyr Leu Gln Gly MetAsp Trp Met Ser Ser Val Asn Leu Ser Leu Thr Tyr Leu Gln Gly Met

805 810 815805 810 815

GTA AGT ACG CAA TGG AGC GGT ACC GCC ACC GCT GAG ATG TTC AAT TTC 2496GTA AGT ACG CAA TGG AGC GGT ACC GCC ACC GCT GAG ATG TTC AAT TTC 2496

Val Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala Glu Met Phe Asn PheVal Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala Glu Met Phe Asn Phe

820 825 830820 825 830

TTG GAA AAC GTT TGT GAC AGC GTG AAT AGT CAA GCT GCC ACT AAA GAA 2544TTG GAA AAC GTT TGT GAC AGC GTG AAT AGT CAA GCT GCC ACT AAA GAA 2544

Leu Glu Asn Val Cys Asp Ser Val Asn Ser Gln Ala Ala Thr Lys GluLeu Glu Asn Val Cys Asp Ser Val Asn Ser Gln Ala Ala Thr Lys Glu

835 840 845835 840 845

ACA ATG GAT TCG GCG TTA CAG CAG AAA GTG CTG CGG GCG CTA AGC GCC 2592ACA ATG GAT TCG GCG TTA CAG CAG AAA GTG CTG CGG GCG CTA AGC GCC 2592

Thr Met Asp Ser Ala Leu Gln Gln Lys Val Leu Arg Ala Leu Ser AlaThr Met Asp Ser Ala Leu Gln Gln Lys Val Leu Arg Ala Leu Ser Ala

850 855 860850 855 860

GGT TTC GGC ATT AAG AGC AAT GTG ATG GGT ATC GTC ACC TTC TGG CTG 2640GGT TTC GGC ATT AAG AGC AAT GTG ATG GGT ATC GTC ACC TTC TGG CTG 2640

Gly Phe Gly Ile Lys Ser Asn Val Met Gly Ile Val Thr Phe Trp LeuGly Phe Gly Ile Lys Ser Asn Val Met Gly Ile Val Thr Phe Trp Leu

865 870 875 880865 870 875 880

GAG AAA ATC ACA ATC GGT AGT GAT AAT CCT TTT ACA TTG GCA AAC TAC 2688GAG AAA ATC ACA ATC GGT AGT GAT AAT CCT TTT ACA TTG GCA AAC TAC 2688

Glu Lys Ile Thr Ile Gly Ser Asp Asn Pro Phe Thr Leu Ala Asn TyrGlu Lys Ile Thr Ile Gly Ser Asp Asn Pro Phe Thr Leu Ala Asn Tyr

885 890 895885 890 895

TGG CAT GAT ATT CAA ACC CTG TTT AGC CAT GAC AAT GCC ACG TTA GAG 2736TGG CAT GAT ATT CAA ACC CTG TTT AGC CAT GAC AAT GCC ACG TTA GAG 2736

Trp His Asp Ile Gln Thr Leu Phe Ser His Asp Asn Ala Thr Leu GluTrp His Asp Ile Gln Thr Leu Phe Ser His Asp Asn Ala Thr Leu Glu

900 905 910900 905 910

TCC TTA CAA ACC GAC ACT TCT CTG GTA ATT GCT ACT CAG CAA CTT AGC 2784TCC TTA CAA ACC GAC ACT TCT CTG GTA ATT GCT ACT CAG CAA CTT AGC 2784

Ser Leu Gln Thr Asp Thr Ser Leu Val Ile Ala Thr Gln Gln Leu SerSer Leu Gln Thr Asp Thr Ser Leu Val Ile Ala Thr Gln Gln Leu Ser

915 920 925915 920 925

CAG CTA GTG TTA ATT GTG AAA TGG CTG AGC CTG ACC GAG CAG GAT CTG 2832CAG CTA GTG TTA ATT GTG AAA TGG CTG AGC CTG ACC GAG CAG GAT CTG 2832

Gln Leu Val Leu Ile Val Lys Trp Leu Ser Leu Thr Glu Gln Asp LeuGln Leu Val Leu Ile Val Lys Trp Leu Ser Leu Thr Glu Gln Asp Leu

930 935 940930 935 940

CAA TTA CTG ACA ACC TAT CCC GAA CGT TTA ATC AAC GGC ATC ACG AAT 2880CAA TTA CTG ACA ACC TAT CCC GAA CGT TTA ATC AAC GGC ATC ACG AAT 2880

Gln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile Asn Gly Ile Thr AsnGln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile Asn Gly Ile Thr Asn

945 950 955 960945 950 955 960

GTT CCT GTA CCC AAT CCG GAG CTA TTA CTC ACG CTA TCA CGT TTT AAG 2928GTT CCT GTA CCC AAT CCG GAG CTA TTA CTC ACG CTA TCA CGT TTT AAG 2928

Val Pro Val Pro Asn Pro Glu Leu Leu Leu Thr Leu Ser Arg Phe LysVal Pro Val Pro Asn Pro Glu Leu Leu Leu Thr Leu Ser Arg Phe Lys

965 970 975965 970 975

CAG TGG GAA ACT CAA GTC ACC GTT TCC CGT GAT GAA GCG ATG CGC TGT 2976CAG TGG GAA ACT CAA GTC ACC GTT TCC CGT GAT GAA GCG ATG CGC TGT 2976

Gln Trp Glu Thr Gln Val Thr Val Ser Arg Asp Glu Ala Met Arg CysGln Trp Glu Thr Gln Val Thr Val Ser Arg Asp Glu Ala Met Arg Cys

980 985 990980 985 990

TTC GAT CAA TTA AAT GCC AAT GAT ATG ACG ACT GAA AAT GCA GGT TCA 3024TTC GAT CAA TTA AAT GCC AAT GAT ATG ACG ACT GAA AAT GCA GGT TCA 3024

Phe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr Glu Asn Ala Gly SerPhe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr Glu Asn Ala Gly Ser

995 1000 1005995 1000 1005

CTG ATC GCC ACA TTG TAT GAG ATG GAT AAA GGT ACG GGA GCG CAA GTT 3072CTG ATC GCC ACA TTG TAT GAG ATG GAT AAA GGT ACG GGA GCG CAA GTT 3072

Leu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly Thr Gly Ala Gln ValLeu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly Thr Gly Ala Gln Val

1010 1015 10201010 1015 1020

AAT ACC TTG CTA TTA GGT GAA AAT AAC TGG CCG AAA AGT TTT ACC TCT 3120AAT ACC TTG CTA TTA GGT GAA AAT AAC TGG CCG AAA AGT TTT ACC TCT 3120

Asn Thr Leu Leu Leu Gly Glu Asn Asn Trp Pro Lys Ser Phe Thr SerAsn Thr Leu Leu Leu Gly Glu Asn Asn Trp Pro Lys Ser Phe Thr Ser

1025 1030 1035 10401025 1030 1035 1040

CTC TGG CAA CTT CTG ACC TGG TTA CGC GTC GGG CAA AGA CTG AAT GTC 3168CTC TGG CAA CTT CTG ACC TGG TTA CGC GTC GGG CAA AGA CTG AAT GTC 3168

Leu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly Gln Arg Leu Asn ValLeu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly Gln Arg Leu Asn Val

1045 1050 10551045 1050 1055

GGT AGT ACC ACT CTG GGC AAT CTG TTG TCC ATG ATG CAA GCA GAC CCT 3216GGT AGT ACC ACT CTG GGC AAT CTG TTG TCC ATG ATG CAA GCA GAC CCT 3216

Gly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met Met Gln Ala Asp ProGly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met Met Gln Ala Asp Pro

1060 1065 10701060 1065 1070

GCT GCC GAG AGT AGC GCT TTA TTG GCA TCA GTA GCC CAA AAC TTA AGT 3264GCT GCC GAG AGT AGC GCT TTA TTG GCA TCA GTA GCC CAA AAC TTA AGT 3264

Ala Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Ala Gln Asn Leu SerAla Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Ala Gln Asn Leu Ser

1075 1080 10851075 1080 1085

GCC GCA ATC AGC AAT CGT CAG TAA 3288GCC GCA ATC AGC AAT CGT CAG TAA 3288

Ala Ala Ile Ser Asn Arg Gln ⅴ?Ala Ala Ile Ser Asn Arg Gln

1090 10951090 1095

(2) INFORMATION FOR SEQ ID NO:34:(2) INFORMATION FOR SEQ ID NO: 34:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1095 amino acids(A) LENGTH: 1095 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:34 (TcaA protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 34 (TcaA protein):

Features From To DescriptionFeatures From To Description

254 267 SEQ ID NO:15254 267 SEQ ID NO: 15

254 492 TcaAii peptide254 492 TcaAii peptide

Met Val Thr Val Met Gln Asn Lys Ile Ser Phe Leu Ser Gly Thr SerMet Val Thr Val Met Gln Asn Lys Ile Ser Phe Leu Ser Gly Thr Ser

1 5 10 151 5 10 15

Glu Gln Pro Leu Leu Asp Ala Gly Tyr Gln Asn Val Phe Asp Ile AlaGlu Gln Pro Leu Leu Asp Ala Gly Tyr Gln Asn Val Phe Asp Ile Ala

20 25 3020 25 30

Ser Ile Ser Arg Ala Thr Phe Val Gln Ser Val Pro Thr Leu Pro ValSer Ile Ser Arg Ala Thr Phe Val Gln Ser Val Pro Thr Leu Pro Val

35 40 4535 40 45

Lys Glu Ala His Thr Val Tyr Arg Gln Ala Arg Gln Arg Ala Glu AsnLys Glu Ala His Thr Val Tyr Arg Gln Ala Arg Gln Arg Ala Glu Asn

50 55 6050 55 60

Leu Lys Ser Leu Tyr Arg Ala Trp Gln Leu Arg Gln Glu Pro Val IleLeu Lys Ser Leu Tyr Arg Ala Trp Gln Leu Arg Gln Glu Pro Val Ile

65 70 75 8065 70 75 80

Lys Gly Leu Ala Lys Leu Asn Leu Gln Ser Asn Val Ser Val Leu GlnLys Gly Leu Ala Lys Leu Asn Leu Gln Ser Asn Val Ser Val Leu Gln

85 90 9585 90 95

Asp Ala Leu Val Glu Asn Ile Gly Gly Asp Gly Asp Phe Ser Asp LeuAsp Ala Leu Val Glu Asn Ile Gly Gly Asp Gly Asp Phe Ser Asp Leu

100 105 110100 105 110

Met Asn Arg Ala Ser Gln Tyr Ala Asp Ala Ala Ser Ile Gln Ser LeuMet Asn Arg Ala Ser Gln Tyr Ala Asp Ala Ala Ser Ile Gln Ser Leu

115 120 125115 120 125

Phe Ser Pro Gly Arg Tyr Ala Ser Ala Leu Tyr Arg Val Ala Lys AspPhe Ser Pro Gly Arg Tyr Ala Ser Ala Leu Tyr Arg Val Ala Lys Asp

130 135 140130 135 140

Leu His Lys Ser Asp Ser Ser Leu His Ile Asp Asn Arg Arg Ala AspLeu His Lys Ser Asp Ser Ser Leu His Ile Asp Asn Arg Arg Ala Asp

145 150 155 160145 150 155 160

Leu Lys Asp Leu Ile Leu Ser Glu Thr Thr Met Asn Lys Glu Val ThrLeu Lys Asp Leu Ile Leu Ser Glu Thr Thr Met Asn Lys Glu Val Thr

165 170 175165 170 175

Ser Leu Asp Ile Leu Leu Asp Val Leu Gln Lys Gly Gly Lys Asp IleSer Leu Asp Ile Leu Leu Asp Val Leu Gln Lys Gly Gly Lys Asp Ile

180 185 190180 185 190

Thr Glu Leu Ser Gly Ala Phe Phe Pro Met Thr Leu Pro Tyr Asp AspThr Glu Leu Ser Gly Ala Phe Phe Pro Met Thr Leu Pro Tyr Asp Asp

195 200 205195 200 205

His Leu Ser Gln Ile Asp Ser Ala Leu Ser Ala Gln Ala Arg Thr LeuHis Leu Ser Gln Ile Asp Ser Ala Leu Ser Ala Gln Ala Arg Thr Leu

210 215 220210 215 220

Asn Gly Val Trp Asn Thr Leu Thr Asp Thr Thr Ala Gln Ala Val SerAsn Gly Val Trp Asn Thr Leu Thr Asp Thr Thr Ala Gln Ala Val Ser

225 230 235 240225 230 235 240

Glu Gln Thr Ser Asn Thr Asn Thr Arg Lys Leu Phe Ala Ala Gln AspGlu Gln Thr Ser Asn Thr Asn Thr Arg Lys Leu Phe Ala Ala Gln Asp

245 250 255245 250 255

Gly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr Phe Tyr Phe Lys AlaGly Asn Gln Asp Thr Phe Phe Ser Gly Asn Thr Phe Tyr Phe Lys Ala

260 265 270260 265 270

Val Gly Phe Ser Gly Gln Pro Met Val Tyr Leu Ser Gln Tyr Thr SerVal Gly Phe Ser Gly Gln Pro Met Val Tyr Leu Ser Gln Tyr Thr Ser

275 280 285275 280 285

Gly Asn Gly Ile Val Gly Ala Gln Leu Ile Ala Gly Asn Pro Asp GlnGly Asn Gly Ile Val Gly Ala Gln Leu Ile Ala Gly Asn Pro Asp Gln

290 295 300290 295 300

Ala Ala Ala Ala Ile Val Ala Pro Leu Lys Leu Thr Trp Ser Met AlaAla Ala Ala Ala Ile Val Ala Pro Leu Lys Leu Thr Trp Ser Met Ala

305 310 315 320305 310 315 320

Lys Gln Cys Tyr Tyr Leu Val Ala Pro Asp Gly Thr Thr Met Gly AspLys Gln Cys Tyr Tyr Leu Val Ala Pro Asp Gly Thr Thr Met Gly Asp

325 330 335325 330 335

Gly Asn Val Leu Thr Gly Cys Phe Leu Arg Gly Asn Ser Pro Thr AsnGly Asn Val Leu Thr Gly Cys Phe Leu Arg Gly Asn Ser Pro Thr Asn

340 345 350340 345 350

Pro Asp Lys Asp Gly Ile Phe Ala Gln Val Ala Asn Lys Ser Gly SerPro Asp Lys Asp Gly Ile Phe Ala Gln Val Ala Asn Lys Ser Gly Ser

355 360 365355 360 365

Thr Gln Pro Leu Pro Ser Phe His Leu Pro Val Thr Leu Glu His SerThr Gln Pro Leu Pro Ser Phe His Leu Pro Val Thr Leu Glu His Ser

370 375 380370 375 380

Glu Asn Lys Asp Gln Tyr Tyr Leu Lys Thr Glu Gln Gly Tyr Ile ThrGlu Asn Lys Asp Gln Tyr Tyr Leu Lys Thr Glu Gln Gly Tyr Ile Thr

385 390 395 400385 390 395 400

Val Asp Ser Ser Gly Gln Ser Asn Trp Lys Asn Ala Leu Val Ile AsnVal Asp Ser Ser Gly Gln Ser Asn Trp Lys Asn Ala Leu Val Ile Asn

405 410 415405 410 415

Gly Thr Lys Asp Lys Gly Leu Leu Leu Thr Phe Cys Ser Asp Ser SerGly Thr Lys Asp Lys Gly Leu Leu Leu Thr Phe Cys Ser Asp Ser Ser

420 425 430420 425 430

Gly Thr Pro Thr Asn Pro Asp Asp Val Ile Pro Pro Ala Ile Asn AspGly Thr Pro Thr Asn Pro Asp Asp Val Ile Pro Pro Ala Ile Asn Asp

435 440 445435 440 445

Ile Pro Ser Pro Pro Ala Arg Glu Thr Leu Ser Leu Thr Pro Val SerIle Pro Ser Pro Pro Ala Arg Glu Thr Leu Ser Leu Thr Pro Val Ser

450 455 460450 455 460

Tyr Gln Leu Met Thr Asn Pro Ala Pro Thr Glu Asp Asp Ile Thr AsnTyr Gln Leu Met Thr Asn Pro Ala Pro Thr Glu Asp Asp Ile Thr Asn

465 470 475 480465 470 475 480

His Tyr Gly Phe Asn Gly Ala Ser Leu Arg Ala Ser Pro Leu Ser ThrHis Tyr Gly Phe Asn Gly Ala Ser Leu Arg Ala Ser Pro Leu Ser Thr

485 490 W4 ≫ 495485 490 W4 »495

Ser Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr Phe Cys Glu LysSer Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr Phe Cys Glu Lys

500 505 510500 505 510

Thr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu Thr Ala Gln Gln SerThr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu Thr Ala Gln Gln Ser

515 520 525515 520 525

Tyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala Ser Arg Tyr Val ArgTyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala Ser Arg Tyr Val Arg

530 535 540530 535 540

Phe Gly Glu Thr Thr Pro Thr Arg Val Asn Val Tyr Gly Ala Ala TyrPhe Gly Glu Thr Thr Pro Thr Arg Val Asn Val Tyr Gly Ala Ala Tyr

545 550 555 560545 550 555 560

Leu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly Gln Tyr Leu Trp IleLeu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly Gln Tyr Leu Trp Ile

565 570 575565 570 575

Gln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp Asp Thr Val Val AlaGln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp Asp Thr Val Val Ala

580 585 590580 585 590

Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser Ser Gln Thr GlyLeu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser Ser Gln Thr Gly

595 600 605595 600 605

Leu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn Ala Ser Arg SerLeu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn Ala Ser Arg Ser

610 615 620610 615 620

Val Pro Asp His His Asp Lys Ile Val Leu Asp Lys Pro Val Leu GluVal Pro Asp His His Asp Lys Ile Val Leu Asp Lys Pro Val Leu Glu

625 630 635 640625 630 635 640

Ala Leu Ala Glu Tyr Val Ser Leu Lys Gln Arg Tyr Gly Leu Asp AlaAla Leu Ala Glu Tyr Val Ser Leu Lys Gln Arg Tyr Gly Leu Asp Ala

645 650 655645 650 655

Asn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn Pro Tyr Thr Pro AspAsn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn Pro Tyr Thr Pro Asp

660 665 670660 665 670

Gln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser Ala Asp Gly AsnGln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser Ala Asp Gly Asn

675 680 685675 680 685

His Val Ile Ala Leu Gly Thr Glu Val Lys Tyr Ala Glu Asn Glu GlnHis Val Ile Ala Leu Gly Thr Glu Val Lys Tyr Ala Glu Asn Glu Gln

690 695 700690 695 700

Asp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu Gly Val Thr Ser AspAsp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu Gly Val Thr Ser Asp

705 710 715 720705 710 715 720

Glu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly Asn Ala Gly Ser PheGlu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly Asn Ala Gly Ser Phe

725 730 735725 730 735

Thr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr Arg Phe Gly Ala IleThr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr Arg Phe Gly Ala Ile

740 745 750740 745 750

Pro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala Glu Ile Leu Trp ArgPro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala Glu Ile Leu Trp Arg

755 760 765755 760 765

Leu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln Gln Leu Gly Gln AlaLeu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln Gln Leu Gly Gln Ala

770 775 780770 775 780

Lys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg Thr Glu Gln Val LeuLys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg Thr Glu Gln Val Leu

785 790 795 800785 790 795 800

Asp Trp Met Ser Ser Val Asn Leu Ser Leu Thr Tyr Leu Gln Gly MetAsp Trp Met Ser Ser Val Asn Leu Ser Leu Thr Tyr Leu Gln Gly Met

805 810 815805 810 815

Val Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala Glu Met Phe Asn PheVal Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala Glu Met Phe Asn Phe

820 825 830820 825 830

Leu Glu Asn Val Cys Asp Ser Val Asn Ser Gln Ala Ala Thr Lys GluLeu Glu Asn Val Cys Asp Ser Val Asn Ser Gln Ala Ala Thr Lys Glu

835 840 845835 840 845

Thr Met Asp Ser Ala Leu Gln Gln Lys Val Leu Arg Ala Leu Ser AlaThr Met Asp Ser Ala Leu Gln Gln Lys Val Leu Arg Ala Leu Ser Ala

850 855 860850 855 860

Gly Phe Gly Ile Lys Ser Asn Val Met Gly Ile Val Thr Phe Trp LeuGly Phe Gly Ile Lys Ser Asn Val Met Gly Ile Val Thr Phe Trp Leu

865 870 875 880865 870 875 880

Glu Lys Ile Thr Ile Gly Ser Asp Asn Pro Phe Thr Leu Ala Asn TyrGlu Lys Ile Thr Ile Gly Ser Asp Asn Pro Phe Thr Leu Ala Asn Tyr

885 890 895885 890 895

Trp His Asp Ile Gln Thr Leu Phe Ser His Asp Asn Ala Thr Leu GluTrp His Asp Ile Gln Thr Leu Phe Ser His Asp Asn Ala Thr Leu Glu

900 905 910900 905 910

Ser Leu Gln Thr Asp Thr Ser Leu Val Ile Ala Thr Gln Gln Leu SerSer Leu Gln Thr Asp Thr Ser Leu Val Ile Ala Thr Gln Gln Leu Ser

915 920 925915 920 925

Gln Leu Val Leu Ile Val Lys Trp Leu Ser Leu Thr Glu Gln Asp LeuGln Leu Val Leu Ile Val Lys Trp Leu Ser Leu Thr Glu Gln Asp Leu

930 935 940930 935 940

Gln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile Asn Gly Ile Thr AsnGln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile Asn Gly Ile Thr Asn

945 950 955 960945 950 955 960

Val Pro Val Pro Asn Pro Glu Leu Leu Leu Thr Leu Ser Arg Phe LysVal Pro Val Pro Asn Pro Glu Leu Leu Leu Thr Leu Ser Arg Phe Lys

965 970 975965 970 975

Gln Trp Glu Thr Gln Val Thr Val Ser Arg Asp Glu Ala Met Arg CysGln Trp Glu Thr Gln Val Thr Val Ser Arg Asp Glu Ala Met Arg Cys

980 985 990980 985 990

Phe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr Glu Asn Ala Gly SerPhe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr Glu Asn Ala Gly Ser

995 1000 1005995 1000 1005

Leu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly Thr Gly Ala Gln ValLeu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly Thr Gly Ala Gln Val

1010 1015 10201010 1015 1020

Asn Thr Leu Leu Leu Gly Glu Asn Asn Trp Pro Lys Ser Phe Thr SerAsn Thr Leu Leu Leu Gly Glu Asn Asn Trp Pro Lys Ser Phe Thr Ser

1025 1030 1035 10401025 1030 1035 1040

Leu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly Gln Arg Leu Asn ValLeu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly Gln Arg Leu Asn Val

1045 1050 10551045 1050 1055

Gly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met Met Gln Ala Asp ProGly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met Met Gln Ala Asp Pro

1060 1065 10701060 1065 1070

Ala Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Ala Gln Asn Leu SerAla Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Ala Gln Asn Leu Ser

1075 1080 10851075 1080 1085

Ala Ala Ile Ser Asn Arg Gln ⅴ?Ala Ala Ile Ser Asn Arg Gln

1090 10951090 1095

(2) INFORMATION FOR SEQ ID NO:35(2) INFORMATION FOR SEQ ID NO: 35

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 603 amino acids(A) LENGTH: 603 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:35 (TcaAiii protein):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 35 (TcaAiii protein):

Pro Leu Ser Thr Ser Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp ThrPro Leu Ser Thr Ser Glu Leu Thr Ser Lys Leu Asn Ser Ile Asp Thr

1 5 10 151 5 10 15

Phe Cys Glu Lys Thr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu ThrPhe Cys Glu Lys Thr Arg Leu Ser Phe Asn Gln Leu Met Asp Leu Thr

20 25 3020 25 30

Ala Gln Gln Ser Tyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala SerAla Gln Gln Ser Tyr Ser Gln Ser Ser Ile Asp Ala Lys Ala Ala Ser

35 40 4535 40 45

Arg Tyr Val Arg Phe Gly Glu Thr Thr Pro Thr Arg Val Asn Val TyrArg Tyr Val Arg Phe Gly Glu Thr Thr Pro Thr Arg Val Asn Val Tyr

50 55 6050 55 60

Gly Ala Ala Tyr Leu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly GlnGly Ala Ala Tyr Leu Asn Ser Thr Leu Ala Asp Ala Ala Asp Gly Gln

65 70 75 8065 70 75 80

Tyr Leu Trp Ile Gln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp AspTyr Leu Trp Ile Gln Thr Asp Gly Lys Ser Leu Asn Phe Thr Asp Asp

85 90 9585 90 95

Thr Val Val Ala Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu SerThr Val Val Ala Leu Ala Gly Arg Ala Glu Lys Leu Val Arg Leu Ser

100 105 110100 105 110

Ser Gln Thr Gly Leu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala AsnSer Gln Thr Gly Leu Ser Phe Glu Glu Leu Asp Trp Leu Ile Ala Asn

115 120 125115 120 125

Ala Ser Arg Ser Val Pro Asp His His Asp Lys Ile Val Leu Asp LysAla Ser Arg Ser Val Pro Asp His His Asp Lys Ile Val Leu Asp Lys

130 135 140130 135 140

Pro Val Leu Glu Ala Leu Ala Glu Tyr Val Ser Leu Lys Gln Arg TyrPro Val Leu Glu Ala Leu Ala Glu Tyr Val Ser Le Le Lys Gln Arg Tyr

145 150 155 160145 150 155 160

Gly Leu Asp Ala Asn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn ProGly Leu Asp Ala Asn Thr Phe Ala Thr Phe Ile Ser Ala Val Asn Pro

165 170 175165 170 175

Tyr Thr Pro Asp Gln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg SerTyr Thr Pro Asp Gln Thr Pro Ser Phe Tyr Glu Thr Ala Phe Arg Ser

180 185 190180 185 190

Ala Asp Gly Asn His Val Ile Ala Leu Gly Thr Glu Val Lys Tyr AlaAla Asp Gly Asn His Val Ile Ala Leu Gly Thr Glu Val Lys Tyr Ala

195 200 205195 200 205

Glu Asn Glu Gln Asp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu GlyGlu Asn Glu Gln Asp Glu Leu Ala Ala Ile Cys Cys Lys Ala Leu Gly

210 215 220210 215 220

Val Thr Ser Asp Glu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly AsnVal Thr Ser Asp Glu Leu Leu Arg Ile Gly Arg Tyr Cys Phe Gly Asn

225 230 235 240225 230 235 240

Ala Gly Arg Phe Thr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr ArgAla Gly Arg Phe Thr Leu Asp Glu Tyr Thr Ala Ser Gln Leu Tyr Arg

245 250 255245 250 255

Phe Gly Ala Ile Pro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala GluPhe Gly Ala Ile Pro Arg Leu Phe Gly Leu Thr Phe Ala Gln Ala Glu

260 265 270260 265 270

Ile Leu Trp Arg Leu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln GlnIle Leu Trp Arg Leu Met Glu Gly Gly Lys Asp Ile Leu Leu Gln Gln

275 280 285275 280 285

Xxx Gly Gln Ala Lys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg ThrXxx Gly Gln Ala Lys Ser Leu Gln Pro Leu Ala Ile Leu Arg Arg Thr

290 295 300290 295 300

Glu Gln Val Leu Asp Trp Met Ser Pro Val Asn Leu Ser Leu Thr TyrGlu Gln Val Leu Asp Trp Met Ser Pro Val Asn Leu Ser Leu Thr Tyr

305 310 315 320305 310 315 320

Leu Gln Gly Met Val Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala GluLeu Gln Gly Met Val Ser Thr Gln Trp Ser Gly Thr Ala Thr Ala Glu

325 330 335325 330 335

Met Phe Asn Phe Leu Glu Asn Val Cys Asp Ser Val Asn Ser Gln AlaMet Phe Asn Phe Leu Glu Asn Val Cys Asp Ser Val Asn Ser Gln Ala

340 345 350340 345 350

Xxx Thr Lys Glu Thr Met Asp Ser Ala Leu Gln Gln Lys Val Leu ArgXxx Thr Lys Glu Thr Met Asp Ser Ala Leu Gln Gln Lys Val Leu Arg

355 360 365355 360 365

Ala Leu Ser Ala Gly Phe Gly Ile Lys Ser Asn Val Met Gly Ile ValAla Leu Ser Ala Gly Phe Gly Ile Lys Ser Asn Val Met Gly Ile Val

370 375 380370 375 380

Thr Phe Trp Leu Glu Lys Ile Thr Ile Gly Arg Asp Asn Pro Phe ThrThr Phe Trp Leu Glu Lys Ile Thr Ile Gly Arg Asp Asn Pro Phe Thr

385 390 395 400385 390 395 400

Leu Ala Asn Tyr Trp His Asp Ile Gln Thr Leu Phe Ser His Asp AsnLeu Ala Asn Tyr Trp His Asp Ile Gln Thr Leu Phe Ser His Asp Asn

405 410 415405 410 415

Ala Thr Leu Glu Ser Leu Gln Thr Asp Thr Ser Leu Val Ile Ala ThrAla Thr Leu Glu Ser Leu Gln Thr Asp Thr Ser Leu Val Ile Ala Thr

420 425 430420 425 430

Gln Gln Leu Ser Gln Leu Val Leu Ile Val Lys Trp Val Ser Leu ThrGln Gln Leu Ser Gln Leu Val Leu Ile Val Lys Trp Val Ser Leu Thr

435 440 445435 440 445

Glu Gln Asp Leu Gln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile AsnGlu Gln Asp Leu Gln Leu Leu Thr Thr Tyr Pro Glu Arg Leu Ile Asn

450 455 460450 455 460

Gly Ile Thr Asn Val Pro Val Pro Asn Pro Glu Leu Leu Leu Thr LeuGly Ile Thr Asn Val Pro Val Pro Asn Pro Glu Leu Leu Leu Thr Leu

465 470 475 480465 470 475 480

Ser Arg Phe Lys Gln Trp Glu Thr Gln Val Thr Val Ser Arg Asp GluSer Arg Phe Lys Gln Trp Glu Thr Gln Val Thr Val Ser Arg Asp Glu

485 490 495485 490 495

Ala Met Arg Cys Phe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr GluAla Met Arg Cys Phe Asp Gln Leu Asn Ala Asn Asp Met Thr Thr Glu

500 505 510500 505 510

Asn Ala Gly Ser Leu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly ThrAsn Ala Gly Ser Leu Ile Ala Thr Leu Tyr Glu Met Asp Lys Gly Thr

515 520 525515 520 525

Gly Ala Gln Val Asn Thr Leu Leu Leu Gly Glu Asn Asn Trp Pro LysGly Ala Gln Val Asn Thr Leu Leu Gly Glu Asn Asn Trp Pro Lys

530 535 540530 535 540

Ser Phe Thr Ser Leu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly GlnSer Phe Thr Ser Leu Trp Gln Leu Leu Thr Trp Leu Arg Val Gly Gln

545 550 555 560545 550 555 560

Arg Leu Asn Val Gly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met MetArg Leu Asn Val Gly Ser Thr Thr Leu Gly Asn Leu Leu Ser Met Met

565 570 575565 570 575

Gln Ala Asp Pro Ala Ala Glu Ser Ser Ala Leu Leu Ala Ser Val AlaGln Ala Asp Pro Ala Ala Glu Ser Ser Ala Leu Leu Ala Ser Val Ala

580 585 590580 585 590

Gln Asn Leu Ser Ala Ala Ile Ser Asn Arg Gln *Gln Asn Leu Ser Ala Ala Ile Ser Asn Arg Gln *

595 600595 600

(2) INFORMATION FOR SEQ ID NO:36:(2) INFORMATION FOR SEQ ID NO: 36:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 2557 base pairs(A) LENGTH: 2557 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:36 (tcdA internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 36 (tcdA internal

fragment):fragment):

GAATTCGGCT TGCGTTTAAT ATTGATGATG TCTCGCTCTT CCGCCTGCTT AAAATTACCG 60GAATTCGGCT TGCGTTTAAT ATTGATGATG TCTCGCTCTT CCGCCTGCTT AAAATTACCG 60

ACCATGATAA TAAAGATGGA AAAATTAAAA ATAACCTAAA GAATCTTTCC AATTTATATA 120ACCATGATAA TAAAGATGGA AAAATTAAAA ATAACCTAAA GAATCTTTCC AATTTATATA 120

TTGGAAAATT ACTGGCAGAT ATTCATCAAT TAACCATTGA TGAACTGGAT TTATTACTGA 180TTGGAAAATT ACTGGCAGAT ATTCATCAAT TAACCATTGA TGAACTGGAT TTATTACTGA 180

TTGCCGTAGG TGAAGGAAAA ACTAATTTAT CCGCTATCAG TGATAAGCAA TTGGCTACCC 240TTGCCGTAGG TGAAGGAAAA ACTAATTTAT CCGCTATCAG TGATAAGCAA TTGGCTACCC 240

TGATCAGAAA ACTCAATACT ATTACCAGCT GGCTACATAC ACAGAAGTGG AGTGTATTCC 300TGATCAGAAA ACTCAATACT ATTACCAGCT GGCTACATAC ACAGAAGTGG AGTGTATTCC 300

AGCTATTTAT CATGACCTCC ACCAGCTATA ACAAAACGCT AACGCCTGAA ATTAAGAATT 360AGCTATTTAT CATGACCTCC ACCAGCTATA ACAAAACGCT AACGCCTGAA ATTAAGAATT 360

TGCTGGATAC CGTCTACCAC GGTTTACAAG GTTTTGATAA AGACAAAGCA GATTTGCTAC 420TGCTGGATAC CGTCTACCAC GGTTTACAAG GTTTTGATAA AGACAAAGCA GATTTGCTAC 420

ATGTCATGGC GCCCTATATT GCGGCCACCT TGCAATTATC ATCGGAAAAT GTCGCCCACT 480ATGTCATGGC GCCCTATATT GCGGCCACCT TGCAATTATC ATCGGAAAAT GTCGCCCACT 480

CGGTACTCCT TTGGGCAGAT AAGTTACAGC CCGGCGACGG CGCAATGACA GCAGAGGGAN 540CGGTACTCCT TTGGGCAGAT AAGTTACAGC CCGGCGACGG CGCAATGACA GCAGAGGGAN 540

TCTGGGACTG GTTGAATACT AAGTATACGC CGGGTTCATC GGAAGCCGTA GAAACGCAGG 600TCTGGGACTG GTTGAATACT AAGTATACGC CGGGTTCATC GGAAGCCGTA GAAACGCAGG 600

AACATATCGT TCAGTATTGT CAGGCTCTGG CACAATTGGA AATGGTTTAC CATTCCACCG 660AACATATCGT TCAGTATTGT CAGGCTCTGG CACAATTGGA AATGGTTTAC CATTCCACCG 660

GCATCAACGA AAACGCCTTC CGTCTATTTG TGACAAAACC AGAGATGTTT GGCGCTGCAA 720GCATCAACGA AAACGCCTTC CGTCTATTTG TGACAAAACC AGAGATGTTT GGCGCTGCAA 720

CTGGAGCAGC GCCCGCGCAT GATGCCCTTT CACTGATTAT GCTGACACGT TTTGCGGATT 780CTGGAGCAGC GCCCGCGCAT GATGCCCTTT CACTGATTAT GCTGACACGT TTTGCGGATT 780

GGGTGAACGC ACTAGGCGAA AAAGCGTCCT CGGTGCTAGC GGCATTTGAA GCTAACTCGT 840GGGTGAACGC ACTAGGCGAA AAAGCGTCCT CGGTGCTAGC GGCATTTGAA GCTAACTCGT 840

TAACGGCAGA ACAACTGGCT GATGCCATGA ATCTTGATGC TAATTTGCTG TTGCAAGCCA 900TAACGGCAGA ACAACTGGCT GATGCCATGA ATCTTGATGC TAATTTGCTG TTGCAAGCCA 900

GTATTCAAGC ACAAAATCAT CAACATCTTC CCCCAGTAAC TCCAGAAAAT GCGTTCTCCT 960GTATTCAAGC ACAAAATCAT CAACATCTTC CCCCAGTAAC TCCAGAAAAT GCGTTCTCCT 960

GTTGGACATC TATCAATACT ATCCTGCAAT GGGTTAATGT CGCACAACAA TTGAAATGTC 1020GTTGGACATC TATCAATACT ATCCTGCAAT GGGTTAATGT CGCACAACAA TTGAAATGTC 1020

GCCCCACAGG GCGTTTCCGC TTTGGTCGGG CTGGATTATA TTCAATCAAT GAAAGAGACA 1080GCCCCACAGG GCGTTTCCGC TTTGGTCGGG CTGGATTATA TTCAATCAAT GAAAGAGACA 1080

CCGACCTATG CCCAGTGGGA AAACGCGGCA GGCGTATTAA CCGCCGGGTT GAATTCAACA 1140CCGACCTATG CCCAGTGGGA AAACGCGGCA GGCGTATTAA CCGCCGGGTT GAATTCAACA 1140

ACAGGCTAAT ACATTACAAC GCTTTTCTGG ATGAATCTCG CAGTGCCGCA TTAAGCACCT 1200ACAGGCTAAT ACATTACAAC GCTTTTCTGG ATGAATCTCG CAGTGCCGCA TTAAGCACCT 1200

ACTATATCCG TCAAGTCGCC AAGGCAGCGG CGGCTATTAA AAGCCGTGAT GACTTGTATC 1260ACTATATCCG TCAAGTCGCC AAGGCAGCGG CGGCTATTAA AAGCCGTGAT GACTTGTATC 1260

AATACTTACT GATTGATAAT CAGGTTTCTG CGGCAATAAA AACCACCCGG ATCGCCGAAG 1320AATACTTACT GATTGATAAT CAGGTTTCTG CGGCAATAAA AACCACCCGG ATCGCCGAAG 1320

CCATTGCCAG TATTCAACTG TACGTCAACC GGGCATTGGA AAATGTGGAA GAAAATGCCA 1380CCATTGCCAG TATTCAACTG TACGTCAACC GGGCATTGGA AAATGTGGAA GAAAATGCCA 1380

ATTCGGGGGT TATCAGCCGC CAATTCTTTA TCGACTGGGA CAAATACAAT AAACGCTACA 1440ATTCGGGGGT TATCAGCCGC CAATTCTTTA TCGACTGGGA CAAATACAAT AAACGCTACA 1440

GCACTTGGGC GGGTGTTTCT CAATTAGTTT ACTACCCGGA AAACTATATT GATCCGACCA 1500GCACTTGGGC GGGTGTTTCT CAATTAGTTT ACTACCCGGA AAACTATATT GATCCGACCA 1500

TGCGTATCGG ACAAACCAAA ATGATGGACG CATTACTGCA ATCCGTCAGC CAAAGCCAAT 1560TGCGTATCGG ACAAACCAAA ATGATGGACG CATTACTGCA ATCCGTCAGC CAAAGCCAAT 1560

TAAACGCCGA TACCGTCGAA GATGCCTTTA TGTCTTATCT GACATCGTTT GAACAAGTGG 1620TAAACGCCGA TACCGTCGAA GATGCCTTTA TGTCTTATCT GACATCGTTT GAACAAGTGG 1620

CTAATCTTAA AGTTATTAGC GCATATCACG ATAATATTAA TAACGATCAA GGGCTGACCT 1680CTAATCTTAA AGTTATTAGC GCATATCACG ATAATATTAA TAACGATCAA GGGCTGACCT 1680

ATTTTATCGG ACTCAGTGAA ACTGATGCCG GTGAATATTA TTGGCGCAGT GTCGATCACA 1740ATTTTATCGG ACTCAGTGAA ACTGATGCCG GTGAATATTA TTGGCGCAGT GTCGATCACA 1740

GTAAATTCAA CGACGGTAAA TTCGCGGCTA ATGCCTGGAG TGAATGGCAT AAAATTGATT 1800GTAAATTCAA CGACGGTAAA TTCGCGGCTA ATGCCTGGAG TGAATGGCAT AAAATTGATT 1800

GTCCAATTAA CCCTTATAAA AGCACTATCC GTCCAGTGAT ATATAAATCC CGCCTGTATC 1860GTCCAATTAA CCCTTATAAA AGCACTATCC GTCCAGTGAT ATATAAATCC CGCCTGTATC 1860

TGCTCTGGTT GGAACAAAAG GAGATCACCA AACAGACAGG AAATAGTAAA GATGGCTATC 1920TGCTCTGGTT GGAACAAAAG GAGATCACCA AACAGACAGG AAATAGTAAA GATGGCTATC 1920

AAACTGAAAC GGATTATCGT TATGAACTAA AATTGGCGCA TATCCGCTAT GATGGCACTT 1980AAACTGAAAC GGATTATCGT TATGAACTAA AATTGGCGCA TATCCGCTAT GATGGCACTT 1980

GGAATACGCC AATCACCTTT GATGTCAATA AAAAAATATC CGAGCTAAAA CTGGAAAAAA 2040GGAATACGCC AATCACCTTT GATGTCAATA AAAAAATATC CGAGCTAAAA CTGGAAAAAA 2040

ATAGAGCGCC CGGACTCTAT TGTGCCGGTT ATCAAGGTGA AGATACGTTG CTGGTGATGT 2100ATAGAGCGCC CGGACTCTAT TGTGCCGGTT ATCAAGGTGA AGATACGTTG CTGGTGATGT 2100

TTTATAACCA ACAAGACACA CTAGATAGTT ATAAAAACGC TTCAATGCAA GGACTATATA 2160TTTATAACCA ACAAGACACA CTAGATAGTT ATAAAAACGC TTCAATGCAA GGACTATATA 2160

TCTTTGCTGA TATGGCATCC AAAGATATGA CCCCAGAACA GAGCAATGTT TATCGGGATA 2220TCTTTGCTGA TATGGCATCC AAAGATATGA CCCCAGAACA GAGCAATGTT TATCGGGATA 2220

ATAGCTATCA ACAATTTGAT ACCAATAATG TCAGAAGAGT GAATAACCGC TATGCAGAGG 2280ATAGCTATCA ACAATTTGAT ACCAATAATG TCAGAAGAGT GAATAACCGC TATGCAGAGG 2280

ATTATGAGAT TCCTTCTTCG GTAAGTAGCC GTAAAGACTA TGGTTGGGGA GATTATTACC 2340ATTATGAGAT TCCTTCTTCG GTAAGTAGCC GTAAAGACTA TGGTTGGGGA GATTATTACC 2340

TCAGCATGGT ATATAACGGA GATATTCCAA CTATCAATTA CAAAGCCGCA TCAAGTGATT 2400TCAGCATGGT ATATAACGGA GATATTCCAA CTATCAATTA CAAAGCCGCA TCAAGTGATT 2400

TAAAAATTTA TATTTCACCA AAATTAAGAA TTATTCATAA TGGATATGAA GGACAGAAGC 2460TAAAAATTTA TATTTCACCA AAATTAAGAA TTATTCATAA TGGATATGAA GGACAGAAGC 2460

GCAATCAATG CAATTTGATG AATAAATATG GCAAACTAGG TGATAAATTT ATTGTGTATA 2520GCAATCAATG CAATTTGATG AATAAATATG GCAAACTAGG TGATAAATTT ATTGTGTATA 2520

CCAGCCTGGG CGTTAATCCG AATAATAAGC CGAATTC 2557CCAGCCTGGG CGTTAATCCG AATAATAAGC CGAATTC 2557

(2) INFORMATION FOR SEQ ID NO:37:(2) INFORMATION FOR SEQ ID NO: 37:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 845 amino acids(A) LENGTH: 845 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein (partial)(ii) MOLECULE TYPE: protein (partial)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:37 (TcdA internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 37 (TcdA internal

peptide):peptide):

Ala Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys Ile ThrAla Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys Ile Thr

1 5 10 151 5 10 15

Asp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys Asn LeuAsp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys Asn Leu

20 25 3020 25 30

Ser Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln Leu ThrSer Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln Leu Thr

35 40 4535 40 45

Ile Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly Lys ThrIle Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly Lys Thr

50 55 6050 55 60

Asn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile Arg LysAsn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile Arg Lys

65 70 75 8065 70 75 80

Leu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser Val PheLeu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser Val Phe

85 90 9585 90 95

Gln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu Thr ProGln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu Thr Pro

100 105 110100 105 110

Glu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln Gly PheGlu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln Gly Phe

115 120 125115 120 125

Asp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr Ile AlaAsp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr Ile Ala

130 135 140130 135 140

Ala Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val Leu LeuAla Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val Leu Leu

145 150 155 160145 150 155 160

Trp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala Glu GlyTrp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala Glu Gly

165 170 175165 170 175

Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser Glu AlaPhe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser Glu Ala

180 185 190180 185 190

Val Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu Ala GlnVal Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu Ala Gln

195 200 205195 200 205

Leu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala Phe ArgLeu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala Phe Arg

210 215 220210 215 220

Leu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly Ala AlaLeu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly Ala Ala

225 230 235 240225 230 235 240

Pro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe Ala AspPro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe Ala Asp

245 250 255245 250 255

Trp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala Ala PheTrp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala Ala Phe

260 265 270260 265 270

Glu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met Asn LeuGlu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met Asn Leu

275 280 285275 280 285

Asp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn His GlnAsp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn His Gln

290 295 300290 295 300

His Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp Thr SerHis Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp Thr Ser

305 310 315 320305 310 315 320

Ile Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu Lys CysIle Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu Lys Cys

325 330 335325 330 335

Arg Pro Thr Gly Arg Phe Arg Phe Gly Arg Ala Gly Leu Tyr Ser IleArg Pro Thr Gly Arg Phe Arg Phe Gly Arg Ala Gly Leu Tyr Ser Ile

340 345 350340 345 350

Asn Glu Arg Asp Thr Asp Leu Cys Pro Val Gly Lys Arg Gly Arg ArgAsn Glu Arg Asp Thr Asp Leu Cys Pro Val Gly Lys Arg Gly Arg Arg

355 360 365355 360 365

Ile Asn Arg Arg Val Glu Phe Asn Asn Arg Leu Ile His Tyr Asn AlaIle Asn Arg Arg Val Glu Phe Asn Asn Arg Leu Ile His Tyr Asn Ala

370 375 380370 375 380

Phe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile ArgPhe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile Arg

385 390 395 400385 390 395 400

Gln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu TyrGln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu Tyr

405 410 415405 410 415

Gln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr ThrGln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr Thr

420 425 430420 425 430

Arg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg AlaArg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg Ala

435 440 445435 440 445

Leu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg GlnLeu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg Gln

450 455 460450 455 460

Phe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp AlaPhe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp Ala

465 470 475 480465 470 475 480

Gly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro ThrGly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro Thr

485 490 495485 490 495

Met Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser ValMet Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser Val

500 505 510500 505 510

Ser Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met SerSer Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met Ser

515 520 525515 520 525

Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser AlaTyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser Ala

530 535 540530 535 540

Tyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile GlyTyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile Gly

545 550 555 560545 550 555 560

Leu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp HisLeu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp His

565 570 575565 570 575

Ser Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu TrpSer Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu Trp

580 585 590580 585 590

His Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg ProHis Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg Pro

595 600 605595 600 605

Val Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys GluVal Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys Glu

610 615 620610 615 620

Ile Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu ThrIle Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu Thr

625 630 635 640625 630 635 640

Asp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly ThrAsp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Thr

645 650 655645 650 655

Trp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu LeuTrp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu Leu

660 665 670660 665 670

Lys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr GlnLys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr Gln

675 680 685675 680 685

Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr LeuGly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr Leu

690 695 700690 695 700

Asp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala AspAsp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala Asp

705 710 715 720705 710 715 720

Met Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg AspMet Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg Asp

725 730 735725 730 735

Asn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn AsnAsn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn Asn

740 745 750740 745 750

Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg LysArg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg Lys

755 760 765755 760 765

Asp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly AspAsp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly Asp

770 775 780770 775 780

Ile Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile TyrIle Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile Tyr

785 790 795 800785 790 795 800

Ile Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln LysIle Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln Lys

805 810 815805 810 815

Arg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp LysArg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp Lys

820 825 830820 825 830

Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn AsnPhe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn

835 840 845835 840 845

(2) INFORMATION FOR SEQ ID NO:38:(2) INFORMATION FOR SEQ ID NO: 38:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 16 amino acids(A) LENGTH: 16 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:38 (TcdAii- pk71(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 38 (TcdAii- pk71

internal peptide):internal peptide):

Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln Phe Ile GlyArg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln Phe Ile Gly

1 5 10 151 5 10 15

LysLys

(2) INFORMATION FOR SEQ ID NO:39:(2) INFORMATION FOR SEQ ID NO: 39:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:39 (TcdAii- pK44(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 39 (TcdAii- pK44

internal peptide):internal peptide):

Gly Thr Ala Thr Asp Val Ser Gly Pro Val Glu Ile Asn Thr AlaGly Thr Ala Thr Asp Val Ser Gly Pro Val Glu Ile Asn Thr Ala

1 5 10 151 5 10 15

Ile Ser Pro Ala LysIle Ser Pro Ala Lys

2020

(2) INFORMATION FOR SEQ ID NO:40:(2) INFORMATION FOR SEQ ID NO: 40:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 11 amino acids(A) LENGTH: 11 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:40 (TcbAiii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 40 (TcbAiii N-terminus):

Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro GlnAla Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:41:(2) INFORMATION FOR SEQ ID NO: 41:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 14 amino acids(A) LENGTH: 14 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:41 (TcdAiii N-terminus):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 41 (TcdAiii N-terminus):

Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro GlnLeu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:42:(2) INFORMATION FOR SEQ ID NO: 42:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 19 amino acids(A) LENGTH: 19 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:42 (TcdA-pk57 internal(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 42 (TcdA-pk57 internal

peptide):peptide):

Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Glu Val TyrArg Ala Leu Glu Val Glu Arg Thr Val Ser Leu Ala Glu Val Tyr

1 5 10 151 5 10 15

Ala Gly Leu GluAla Gly Leu Glu

(2) INFORMATION FOR SEQ ID NO:43:(2) INFORMATION FOR SEQ ID NO: 43:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 11 amino acids(A) LENGTH: 11 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:43 (TcdAiii-pK20(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 43 (TcdAiii-pK20

internal peptide):internal peptide):

Ile Arg Glu Asp Tyr Pro Ala Ser Leu Gly LysIle Arg Glu Asp Tyr Pro Ala Ser Leu Gly Lys

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:44:(2) INFORMATION FOR SEQ ID NO: 44:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 16 amino acids(A) LENGTH: 16 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:44:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 44:

Asp Asp Ser Gly Asp Asp Asp Lys Val Thr Asn Thr Asp Ile His ArgAsp Asp Ser Gly Asp Asp Asp Lys Val Thr Asn Thr Asp Ile His Arg

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:45:(2) INFORMATION FOR SEQ ID NO: 45:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 13 amino acids(A) LENGTH: 13 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:45:(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 45:

Asp Val Xaa Gly Ser Glu Lys Ala Asn Glu Lys Leu LysAsp Val Xaa Gly Ser Glu Lys Ala Asn Glu Lys Leu Lys

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:46:(2) INFORMATION FOR SEQ ID NO: 46:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 7551 base pairs(A) LENGTH: 7551 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:46 (tcdA):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 46 (tcdA):

ATG AAC GAG TCT GTA AAA GAG ATA CCT GAT GTA TTA AAA AGC CAG TGT 48ATG AAC GAG TCT GTA AAA GAG ATA CCT GAT GTA TTA AAA AGC CAG TGT 48

Met Asn Glu Ser Val Lys Glu Ile Pro Asp Val Leu Lys Ser Gln CysMet Asn Glu Ser Val Lys Glu Ile Pro Asp Val Leu Lys Ser Gln Cys

1 5 10 151 5 10 15

GGT TTT AAT TGT CTG ACA GAT ATT AGC CAC AGC TCT TTT AAT GAA TTT 96GGT TTT AAT TGT CTG ACA GAT ATT AGC CAC AGC TCT TTT AAT GAA TTT 96

Gly Phe Asn Cys Leu Thr Asp Ile Ser His Ser Ser Phe Asn Glu PheGly Phe Asn Cys Leu Thr Asp Ile Ser His Ser Ser Phe Asn Glu Phe

20 25 3020 25 30

CGC CAG CAA GTA TCT GAG CAC CTC TCC TGG TCC GAA ACA CAC GAC TTA 144CGC CAG CAA GTA TCT GAG CAC CTC TCC TGG TCC GAA ACA CAC GAC TTA 144

Arg Gln Gln Val Ser Glu His Leu Ser Trp Ser Glu Thr His Asp LeuArg Gln Gln Val Ser Glu His Leu Ser Trp Ser Glu Thr His Asp Leu

35 40 4535 40 45

TAT CAT GAT GCA CAA CAG GCA CAA AAG GAT AAT CGC CTG TAT GAA GCG 192TAT CAT GAT GCA CAA CAG GCA CAA AAG GAT AAT CGC CTG TAT GAA GCG 192

Tyr His Asp Ala Gln Gln Ala Gln Lys Asp Asn Arg Leu Tyr Glu AlaTyr His Asp Ala Gln Gln Ala Gln Lys Asp Asn Arg Leu Tyr Glu Ala

50 55 6050 55 60

CGT ATT CTC AAA CGC GCC AAT CCC CAA TTA CAA AAT GCG GTG CAT CTT 240CGT ATT CTC AAA CGC GCC AAT CCC CAA TTA CAA AAT GCG GTG CAT CTT 240

Arg Ile Leu Lys Arg Ala Asn Pro Gln Leu Gln Asn Ala Val His LeuArg Ile Leu Lys Arg Ala Asn Pro Gln Leu Gln Asn Ala Val His Leu

65 70 75 8065 70 75 80

GCC ATT CTC GCT CCC AAT GCT GAA CTG ATA GGC TAT AAC AAT CAA TTT 288GCC ATT CTC GCT CCC AAT GCT GAA CTG ATA GGC TAT AAC AAT CAA TTT 288

Ala Ile Leu Ala Pro Asn Ala Glu Leu Ile Gly Tyr Asn Asn Gln PheAla Ile Leu Ala Pro Asn Ala Glu Leu Ile Gly Tyr Asn Asn Gln Phe

85 90 9585 90 95

AGC GGT AGA GCC AGT CAA TAT GTT GCG CCG GGT ACC GTT TCT TCC ATG 336AGC GGT AGA GCC AGT CAA TAT GTT GCG CCG GGT ACC GTT TCT TCC ATG 336

Ser Gly Arg Ala Ser Gln Tyr Val Ala Pro Gly Thr Val Ser Ser MetSer Gly Arg Ala Ser Gln Tyr Val Ala Pro Gly Thr Val Ser Ser Met

100 105 110100 105 110

TTC TCC CCC GCC GCT TAT TTG ACT GAA CTT TAT CGT GAA GCA CGC AAT 384TTC TCC CCC GCC GCT TAT TTG ACT GAA CTT TAT CGT GAA GCA CGC AAT 384

Phe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Arg AsnPhe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Arg Asn

115 120 125115 120 125

TTA CAC GCA AGT GAC TCC GTT TAT TAT CTG GAT ACC CGC CGC CCA GAT 432TTA CAC GCA AGT GAC TCC GTT TAT TAT CTG GAT ACC CGC CGC CCA GAT 432

Leu His Ala Ser Asp Ser Val Tyr Tyr Leu Asp Thr Arg Arg Pro AspLeu His Ala Ser Asp Ser Val Tyr Tyr Leu Asp Thr Arg Arg Pro Asp

130 135 140130 135 140

CTC AAA TCA ATG GCG CTC AGT CAG CAA AAT ATG GAT ATA GAA TTA TCC 480CTC AAA TCA ATG GCG CTC AGT CAG CAA AAT ATG GAT ATA GAA TTA TCC 480

Leu Lys Ser Met Ala Leu Ser Gln Gln Asn Met Asp Ile Glu Leu SerLeu Lys Ser Met Ala Leu Ser Gln Gln Asn Met Asp Ile Glu Leu Ser

145 150 155 160145 150 155 160

ACA CTC TCT TTG TCC AAT GAG CTG TTA TTG GAA AGC ATT AAA ACT GAA 528ACA CTC TCT TTG TCC AAT GAG CTG TTA TTG GAA AGC ATT AAA ACT GAA 528

Thr Leu Ser Leu Ser Asn Glu Leu Leu Leu Glu Ser Ile Lys Thr GluThr Leu Ser Leu Ser Asn Glu Leu Leu Leu Glu Ser Ile Lys Thr Glu

165 170 175165 170 175

TCT AAA CTG GAA AAC TAT ACT AAA GTG ATG GAA ATG CTC TCC ACT TTC 576TCT AAA CTG GAA AAC TAT ACT AAA GTG ATG GAA ATG CTC TCC ACT TTC 576

Ser Lys Leu Glu Asn Tyr Thr Lys Val Met Glu Met Leu Ser Thr PheSer Lys Leu Glu Asn Tyr Thr Lys Val Met Glu Met Leu Ser Thr Phe

180 185 190180 185 190

CGT CCT TCC GGC GCA ACG CCT TAT CAT GAT GCT TAT GAA AAT GTG CGT 624CGT CCT TCC GGC GCA ACG CCT TAT CAT GAT GCT TAT GAA AAT GTG CGT 624

Arg Pro Ser Gly Ala Thr Pro Tyr His Asp Ala Tyr Glu Asn Val ArgArg Pro Ser Gly Ala Thr Pro Tyr His Asp Ala Tyr Glu Asn Val Arg

195 200 205195 200 205

GAA GTT ATC CAG CTA CAA GAT CCT GGA CTT GAG CAA CTC AAT GCA TCA 672GAA GTT ATC CAG CTA CAA GAT CCT GGA CTT GAG CAA CTC AAT GCA TCA 672

Glu Val Ile Gln Leu Gln Asp Pro Gly Leu Glu Gln Leu Asn Ala SerGlu Val Ile Gln Leu Gln Asp Pro Gly Leu Glu Gln Leu Asn Ala Ser

210 215 220210 215 220

CCG GCA ATT GCC GGG TTG ATG CAT CAA GCC TCC CTA TTG GGT ATT AAC 720CCG GCA ATT GCC GGG TTG ATG CAT CAA GCC TCC CTA TTG GGT ATT AAC 720

Pro Ala Ile Ala Gly Leu Met His Gln Ala Ser Leu Leu Gly Ile AsnPro Ala Ile Ala Gly Leu Met His Gln Ala Ser Leu Leu Gly Ile Asn

225 230 235 240225 230 235 240

GCT TCA ATC TCG CCT GAG CTA TTT AAT ATT CTG ACG GAG GAG ATT ACC 768GCT TCA ATC TCG CCT GAG CTA TTT AAT ATT CTG ACG GAG GAG ATT ACC 768

Ala Ser Ile Ser Pro Glu Leu Phe Asn Ile Leu Thr Glu Glu Ile ThrAla Ser Ile Ser Pro Glu Leu Phe Asn Ile Leu Thr Glu Glu Ile Thr

245 250 255245 250 255

GAA GGT AAT GCT GAG GAA CTT TAT AAG AAA AAT TTT GGT AAT ATC GAA 816GAA GGT AAT GCT GAG GAA CTT TAT AAG AAA AAT TTT GGT AAT ATC GAA 816

Glu Gly Asn Ala Glu Glu Leu Tyr Lys Lys Asn Phe Gly Asn Ile GluGlu Gly Asn Ala Glu Glu Leu Tyr Lys Lys Asn Phe Gly Asn Ile Glu

260 265 270260 265 270

CCG GCC TCA TTG GCT ATG CCG GAA TAC CTT AAA CGT TAT TAT AAT TTA 864CCG GCC TCA TTG GCT ATG CCG GAA TAC CTT AAA CGT TAT TAT AAT TTA 864

Pro Ala Ser Leu Ala Met Pro Glu Tyr Leu Lys Arg Tyr Tyr Asn LeuPro Ala Ser Leu Ala Met Pro Glu Tyr Leu Lys Arg Tyr Tyr Asn Leu

275 280 285275 280 285

AGC GAT GAA GAA CTT AGT CAG TTT ATT GGT AAA GCC AGC AAT TTT GGT 912AGC GAT GAA GAA CTT AGT CAG TTT ATT GGT AAA GCC AGC AAT TTT GGT 912

Ser Asp Glu Glu Leu Ser Gln Phe Ile Gly Lys Ala Ser Asn Phe GlySer Asp Glu Glu Leu Ser Gln Phe Ile Gly Lys Ala Ser Asn Phe Gly

290 295 300290 295 300

CAA CAG GAA TAT AGT AAT AAC CAA CTT ATT ACT CCG GTA GTC AAC AGC 960CAA CAG GAA TAT AGT AAT AAC CAA CTT ATT ACT CCG GTA GTC AAC AGC 960

Gln Gln Glu Tyr Ser Asn Asn Gln Leu Ile Thr Pro Val Val Asn SerGln Gln Glu Tyr Ser Asn Asn Gln Leu Ile Thr Pro Val Val Asn Ser

305 310 315 320305 310 315 320

AGT GAT GGC ACG GTT AAG GTA TAT CGG ATC ACC CGC GAA TAT ACA ACC 1008AGT GAT GGC ACG GTT AAG GTA TAT CGG ATC ACC CGC GAA TAT ACA ACC 1008

Ser Asp Gly Thr Val Lys Val Tyr Arg Ile Thr Arg Glu Tyr Thr ThrSer Asp Gly Thr Val Lys Val Tyr Arg Ile Thr Arg Glu Tyr Thr Thr

325 330 335325 330 335

AAT GCT TAT CAA ATG GAT GTG GAG CTA TTT CCC TTC GGT GGT GAG AAT 1056AAT GCT TAT CAA ATG GAT GTG GAG CTA TTT CCC TTC GGT GGT GAG AAT 1056

Asn Ala Tyr Gln Met Asp Val Glu Leu Phe Pro Phe Gly Gly Glu AsnAsn Ala Tyr Gln Met Asp Val Glu Leu Phe Pro Phe Gly Glu Glu Asn

340 345 350340 345 350

TAT CGG TTA GAT TAT AAA TTC AAA AAT TTT TAT AAT GCC TCT TAT TTA 1104TAT CGG TTA GAT TAT AAA TTC AAA AAT TTT TAT AAT GCC TCT TAT TTA 1104

Tyr Arg Leu Asp Tyr Lys Phe Lys Asn Phe Tyr Asn Ala Ser Tyr LeuTyr Arg Leu Asp Tyr Lys Phe Lys Asn Phe Tyr Asn Ala Ser Tyr Leu

355 360 365355 360 365

TCC ATC AAG TTA AAT GAT AAA AGA GAA CTT GTT CGA ACT GAA GGC GCT 1152TCC ATC AAG TTA AAT GAT AAA AGA GAA CTT GTT CGA ACT GAA GGC GCT 1152

Ser Ile Lys Leu Asn Asp Lys Arg Glu Leu Val Arg Thr Glu Gly AlaSer Ile Lys Leu Asn Asp Lys Arg Glu Leu Val Arg Thr Glu Gly Ala

370 375 380370 375 380

CCT CAA GTC AAT ATA GAA TAC TCC GCA AAT ATC ACA TTA AAT ACC GCT 1200CCT CAA GTC AAT ATA GAA TAC TCC GCA AAT ATC ACA TTA AAT ACC GCT 1200

Pro Gln Val Asn Ile Glu Tyr Ser Ala Asn Ile Thr Leu Asn Thr AlaPro Gln Val Asn Ile Glu Tyr Ser Ala Asn Ile Thr Leu Asn Thr Ala

385 390 395 400385 390 395 400

GAT ATC AGT CAA CCT TTT GAA ATT GGC CTG ACA CGA GTA CTT CCT TCC 1248GAT ATC AGT CAA CCT TTT GAA ATT GGC CTG ACA CGA GTA CTT CCT TCC 1248

Asp Ile Ser Gln Pro Phe Glu Ile Gly Leu Thr Arg Val Leu Pro SerAsp Ile Ser Gln Pro Phe Glu Ile Gly Leu Thr Arg Val Leu Pro Ser

405 410 415405 410 415

GGT TCT TGG GCA TAT GCC GCC GCA AAA TTT ACC GTT GAA GAG TAT AAC 1296GGT TCT TGG GCA TAT GCC GCC GCA AAA TTT ACC GTT GAA GAG TAT AAC 1296

Gly Ser Trp Ala Tyr Ala Ala Ala Lys Phe Thr Val Glu Glu Tyr AsnGly Ser Trp Ala Tyr Ala Ala Ala Lys Phe Thr Val Glu Glu Tyr Asn

420 425 430420 425 430

CAA TAC TCT TTT CTG CTA AAA CTT AAC AAG GCT ATT CGT CTA TCA CGT 1344CAA TAC TCT TTT CTG CTA AAA CTT AAC AAG GCT ATT CGT CTA TCA CGT 1344

Gln Tyr Ser Phe Leu Leu Lys Leu Asn Lys Ala Ile Arg Leu Ser ArgGln Tyr Ser Phe Leu Leu Lys Leu Asn Lys Ala Ile Arg Leu Ser Arg

435 440 445435 440 445

GCG ACA GAA TTG TCA CCC ACG ATT CTG GAA GGC ATT GTG CGC AGT GTT 1392GCG ACA GAA TTG TCA CCC ACG ATT CTG GAA GGC ATT GTG CGC AGT GTT 1392

Ala Thr Glu Leu Ser Pro Thr Ile Leu Glu Gly Ile Val Arg Ser ValAla Thr Glu Leu Ser Pro Thr Ile Leu Glu Gly Ile Val Arg Ser Val

450 455 460450 455 460

AAT CTA CAA CTG GAT ATC AAC ACA GAC GTA TTA GGT AAA GTT TTT CTG 1440AAT CTA CAA CTG GAT ATC AAC ACA GAC GTA TTA GGT AAA GTT TTT CTG 1440

Asn Leu Gln Leu Asp Ile Asn Thr Asp Val Leu Gly Lys Val Phe LeuAsn Leu Gln Leu Asp Ile Asn Thr Asp Val Leu Gly Lys Val Phe Leu

465 470 475 480465 470 475 480

ACT AAA TAT TAT ATG CAG CGT TAT GCT ATT CAT GCT GAA ACT GCC CTG 1488ACT AAA TAT TAT ATG CAG CGT TAT GCT ATT CAT GCT GAA ACT GCC CTG 1488

Thr Lys Tyr Tyr Met Gln Arg Tyr Ala Ile His Ala Glu Thr Ala LeuThr Lys Tyr Tyr Met Gln Arg Tyr Ala Ile His Ala Glu Thr Ala Leu

485 490 495485 490 495

ATA CTA TGC AAC GCG CCT ATT TCA CAA CGT TCA TAT GAT AAT CAA CCT 1536ATA CTA TGC AAC GCG CCT ATT TCA CAA CGT TCA TAT GAT AAT CAA CCT 1536

Ile Leu Cys Asn Ala Pro Ile Ser Gln Arg Ser Tyr Asp Asn Gln ProIle Leu Cys Asn Ala Pro Ile Ser Gln Arg Ser Tyr Asp Asn Gln Pro

500 505 510500 505 510

AGC CAA TTT GAT CGC CTG TTT AAT ACG CCA TTA CTG AAC GGA CAA TAT 1584AGC CAA TTT GAT CGC CTG TTT AAT ACG CCA TTA CTG AAC GGA CAA TAT 1584

Ser Gln Phe Asp Arg Leu Phe Asn Thr Pro Leu Leu Asn Gly Gln TyrSer Gln Phe Asp Arg Leu Phe Asn Thr Pro Leu Leu Asn Gly Gln Tyr

515 520 525515 520 525

TTT TCT ACC GGC GAT GAG GAG ATT GAT TTA AAT TCA GGT AGC ACC GGC 1632TTT TCT ACC GGC GAT GAG GAG ATT GAT TTA AAT TCA GGT AGC ACC GGC 1632

Phe Ser Thr Gly Asp Glu Glu Ile Asp Leu Asn Ser Gly Ser Thr GlyPhe Ser Thr Gly Asp Glu Glu Ile Asp Leu Asn Ser Gly Ser Thr Gly

530 535 540530 535 540

GAT TGG CGA AAA ACC ATA CTT AAG CGT GCA TTT AAT ATT GAT GAT GTC 1680GAT TGG CGA AAA ACC ATA CTT AAG CGT GCA TTT AAT ATT GAT GAT GTC 1680

Asp Trp Arg Lys Thr Ile Leu Lys Arg Ala Phe Asn Ile Asp Asp ValAsp Trp Arg Lys Thr Ile Leu Lys Arg Ala Phe Asn Ile Asp Asp Val

545 550 555 560545 550 555 560

TCG CTC TTC CGC CTG CTT AAA ATT ACC GAC CAT GAT AAT AAA GAT GGA 1728TCG CTC TTC CGC CTG CTT AAA ATT ACC GAC CAT GAT AAT AAA GAT GGA 1728

Ser Leu Phe Arg Leu Leu Lys Ile Thr Asp His Asp Asn Lys Asp GlySer Leu Phe Arg Leu Leu Lys Ile Thr Asp His Asp Asn Lys Asp Gly

565 570 575565 570 575

AAA ATT AAA AAT AAC CTA AAG AAT CTT TCC AAT TTA TAT ATT GGA AAA 1776AAA ATT AAA AAT AAC CTA AAG AAT CTT TCC AAT TTA TAT ATT GGA AAA 1776

Lys Ile Lys Asn Asn Leu Lys Asn Leu Ser Asn Leu Tyr Ile Gly LysLys Ile Lys Asn Asn Leu Lys Asn Leu Ser Asn Leu Tyr Ile Gly Lys

580 585 590580 585 590

TTA CTG GCA GAT ATT CAT CAA TTA ACC ATT GAT GAA CTG GAT TTA TTA 1824TTA CTG GCA GAT ATT CAT CAA TTA ACC ATT GAT GAA CTG GAT TTA TTA 1824

Leu Leu Ala Asp Ile His Gln Leu Thr Ile Asp Glu Leu Asp Leu LeuLeu Leu Ala Asp Ile His Gln Leu Thr Ile Asp Glu Leu Asp Leu Leu

595 600 605595 600 605

CTG ATT GCC GTA GGT GAA GGA AAA ACT AAT TTA TCC GCT ATC AGT GAT 1872CTG ATT GCC GTA GGT GAA GGA AAA ACT AAT TTA TCC GCT ATC AGT GAT 1872

Leu Ile Ala Val Gly Glu Gly Lys Thr Asn Leu Ser Ala Ile Ser AspLeu Ile Ala Val Gly Glu Gly Lys Thr Asn Leu Ser Ala Ile Ser Asp

610 615 620610 615 620

AAG CAA TTG GCT ACC CTG ATC AGA AAA CTC AAT ACT ATT ACC AGC TGG 1920AAG CAA TTG GCT ACC CTG ATC AGA AAA CTC AAT ACT ATT ACC AGC TGG 1920

Lys Gln Leu Ala Thr Leu Ile Arg Lys Leu Asn Thr Ile Thr Ser TrpLys Gln Leu Ala Thr Leu Ile Arg Lys Leu Asn Thr Ile Thr Ser Trp

625 630 635 640625 630 635 640

CTA CAT ACA CAG AAG TGG AGT GTA TTC CAG CTA TTT ATC ATG ACC TCC 1968CTA CAT ACA CAG AAG TGG AGT GTA TTC CAG CTA TTT ATC ATG ACC TCC 1968

Leu His Thr Gln Lys Trp Ser Val Phe Gln Leu Phe Ile Met Thr SerLeu His Thr Gln Lys Trp Ser Val Phe Gln Leu Phe Ile Met Thr Ser

645 650 655645 650 655

ACC AGC TAT AAC AAA ACG CTA ACG CCT GAA ATT AAG AAT TTG CTG GAT 2016ACC AGC TAT AAC AAA ACG CTA ACG CCT GAA ATT AAG AAT TTG CTG GAT 2016

Thr Ser Tyr Asn Lys Thr Leu Thr Pro Glu Ile Lys Asn Leu Leu AspThr Ser Tyr Asn Lys Thr Leu Thr Pro Glu Ile Lys Asn Leu Leu Asp

660 665 670660 665 670

ACC GTC TAC CAC GGT TTA CAA GGT TTT GAT AAA GAC AAA GCA GAT TTG 2064ACC GTC TAC CAC GGT TTA CAA GGT TTT GAT AAA GAC AAA GCA GAT TTG 2064

Thr Val Tyr His Gly Leu Gln Gly Phe Asp Lys Asp Lys Ala Asp LeuThr Val Tyr His Gly Leu Gln Gly Phe Asp Lys Asp Lys Ala Asp Leu

675 680 685675 680 685

CTA CAT GTC ATG GCG CCC TAT ATT GCG GCC ACC TTG CAA TTA TCA TCG 2112CTA CAT GTC ATG GCG CCC TAT ATT GCG GCC ACC TTG CAA TTA TCA TCG 2112

Leu His Val Met Ala Pro Tyr Ile Ala Ala Thr Leu Gln Leu Ser SerLeu His Val Met Ala Pro Tyr Ile Ala Ala Thr Leu Gln Leu Ser Ser

690 695 700690 695 700

GAA AAT GTC GCC CAC TCG GTA CTC CTT TGG GCA GAT AAG TTA CAG CCC 2160GAA AAT GTC GCC CAC TCG GTA CTC CTT TGG GCA GAT AAG TTA CAG CCC 2160

Glu Asn Val Ala His Ser Val Leu Leu Trp Ala Asp Lys Leu Gln ProGlu Asn Val Ala His Ser Val Leu Leu Trp Ala Asp Lys Leu Gln Pro

705 710 715 720705 710 715 720

GGC GAC GGC GCA ATG ACA GCA GAA AAA TTC TGG GAC TGG TTG AAT ACT 2208GGC GAC GGC GCA ATG ACA GCA GAA AAA TTC TGG GAC TGG TTG AAT ACT 2208

Gly Asp Gly Ala Met Thr Ala Glu Lys Phe Trp Asp Trp Leu Asn ThrGly Asp Gly Ala Met Thr Ala Glu Lys Phe Trp Asp Trp Leu Asn Thr

725 730 735725 730 735

AAG TAT ACG CCG GGT TCA TCG GAA GCC GTA GAA ACG CAG GAA CAT ATC 2256AAG TAT ACG CCG GGT TCA TCG GAA GCC GTA GAA ACG CAG GAA CAT ATC 2256

Lys Tyr Thr Pro Gly Ser Ser Glu Ala Val Glu Thr Gln Glu His IleLys Tyr Thr Pro Gly Ser Ser Glu Ala Val Glu Thr Gln Glu His Ile

740 745 750740 745 750

GTT CAG TAT TGT CAG GCT CTG GCA CAA TTG GAA ATG GTT TAC CAT TCC 2304GTT CAG TAT TGT CAG GCT CTG GCA CAA TTG GAA ATG GTT TAC CAT TCC 2304

Val Gln Tyr Cys Gln Ala Leu Ala Gln Leu Glu Met Val Tyr His SerVal Gln Tyr Cys Gln Ala Leu Ala Gln Leu Glu Met Val Tyr His Ser

755 760 765755 760 765

ACC GGC ATC AAC GAA AAC GCC TTC CGT CTA TTT GTG ACA AAA CCA GAG 2352ACC GGC ATC AAC GAA AAC GCC TTC CGT CTA TTT GTG ACA AAA CCA GAG 2352

Thr Gly Ile Asn Glu Asn Ala Phe Arg Leu Phe Val Thr Lys Pro GluThr Gly Ile Asn Glu Asn Ala Phe Arg Leu Phe Val Thr Lys Pro Glu

770 775 780770 775 780

ATG TTT GGC GCT GCA ACT GGA GCA GCG CCC GCG CAT GAT GCC CTT TCA 2400ATG TTT GGC GCT GCA ACT GGA GCA GCG CCC GCG CAT GAT GCC CTT TCA 2400

Met Phe Gly Ala Ala Thr Gly Ala Ala Pro Ala His Asp Ala Leu SerMet Phe Gly Ala Ala Thr Gly Ala Ala Pro Ala His Asp Ala Leu Ser

785 790 795 800785 790 795 800

CTG ATT ATG CTG ACA CGT TTT GCG GAT TGG GTG AAC GCA CTA GGC GAA 2448CTG ATT ATG CTG ACA CGT TTT GCG GAT TGG GTG AAC GCA CTA GGC GAA 2448

Leu Ile Met Leu Thr Arg Phe Ala Asp Trp Val Asn Ala Leu Gly GluLeu Ile Met Leu Thr Arg Phe Ala Asp Trp Val Asn Ala Leu Gly Glu

805 810 815805 810 815

AAA GCG TCC TCG GTG CTA GCG GCA TTT GAA GCT AAC TCG TTA ACG GCA 2496AAA GCG TCC TCG GTG CTA GCG GCA TTT GAA GCT AAC TCG TTA ACG GCA 2496

Lys Ala Ser Ser Val Leu Ala Ala Phe Glu Ala Asn Ser Leu Thr AlaLys Ala Ser Ser Val Leu Ala Ala Phe Glu Ala Asn Ser Leu Thr Ala

820 825 830820 825 830

GAA CAA CTG GCT GAT GCC ATG AAT CTT GAT GCT AAT TTG CTG TTG CAA 2544GAA CAA CTG GCT GAT GCC ATG AAT CTT GAT GCT AAT TTG CTG TTG CAA 2544

Glu Gln Leu Ala Asp Ala Met Asn Leu Asp Ala Asn Leu Leu Leu GlnGlu Gln Leu Ala Asp Ala Met Asn Leu Asp Ala Asn Leu Leu Leu Gln

835 840 845835 840 845

GCC AGT ATT CAA GCA CAA AAT CAT CAA CAT CTT CCC CCA GTA ACT CCA 2592GCC AGT ATT CAA GCA CAA AAT CAT CAA CAT CTT CCC CCA GTA ACT CCA 2592

Ala Ser Ile Gln Ala Gln Asn His Gln His Leu Pro Pro Val Thr ProAla Ser Ile Gln Ala Gln Asn His Gln His Leu Pro Pro Val Thr Pro

850 855 860850 855 860

GAA AAT GCG TTC TCC TGT TGG ACA TCT ATC AAT ACT ATC CTG CAA TGG 2640GAA AAT GCG TTC TCC TGT TGG ACA TCT ATC AAT ACT ATC CTG CAA TGG 2640

Glu Asn Ala Phe Ser Cys Trp Thr Ser Ile Asn Thr Ile Leu Gln TrpGlu Asn Ala Phe Ser Cys Trp Thr Ser Ile Asn Thr Ile Leu Gln Trp

865 870 875 880865 870 875 880

GTT AAT GTC GCA CAA CAA TTG AAT GTC GCC CCA CAG GGC GTT TCC GCT 2688GTT AAT GTC GCA CAA CAA TTG AAT GTC GCC CCA CAG GGC GTT TCC GCT 2688

Val Asn Val Ala Gln Gln Leu Asn Val Ala Pro Gln Gly Val Ser AlaVal Asn Val Ala Gln Gln Leu Asn Val Ala Pro Gln Gly Val Ser Ala

885 890 895885 890 895

TTG GTC GGG CTG GAT TAT ATT CAA TCA ATG AAA GAG ACA CCG ACC TAT 2736TTG GTC GGG CTG GAT TAT ATT CAA TCA ATG AAA GAG ACA CCG ACC TAT 2736

Leu Val Gly Leu Asp Tyr Ile Gln Ser Met Lys Glu Thr Pro Thr TyrLeu Val Gly Leu Asp Tyr Ile Gln Ser Met Lys Glu Thr Pro Thr Tyr

900 905 910900 905 910

GCC CAG TGG GAA AAC GCG GCA GGC GTA TTA ACC GCC GGG TTG AAT TCA 2784GCC CAG TGG GAA AAC GCG GCA GGC GTA TTA ACC GCC GGG TTG AAT TCA 2784

Ala Gln Trp Glu Asn Ala Ala Gly Val Leu Thr Ala Gly Leu Asn SerAla Gln Trp Glu Asn Ala Ala Gly Val Leu Thr Ala Gly Leu Asn Ser

915 920 925915 920 925

CAA CAG GCT AAT ACA TTA CAC GCT TTT CTG GAT GAA TCT CGC AGT GCC 2832CAA CAG GCT AAT ACA TTA CAC GCT TTT CTG GAT GAA TCT CGC AGT GCC 2832

Gln Gln Ala Asn Thr Leu His Ala Phe Leu Asp Glu Ser Arg Ser AlaGln Gln Ala Asn Thr Leu His Ala Phe Leu Asp Glu Ser Arg Ser Ala

930 935 940930 935 940

GCA TTA AGC ACC TAC TAT ATC CGT CAA GTC GCC AAG GCA GCG GCG GCT 2880GCA TTA AGC ACC TAC TAT ATC CGT CAA GTC GCC AAG GCA GCG GCG GCT 2880

Ala Leu Ser Thr Tyr Tyr Ile Arg Gln Val Ala Lys Ala Ala Ala AlaAla Leu Ser Thr Tyr Tyr Ile Arg Gln Val Ala Lys Ala Ala Ala Ala

945 950 955 960945 950 955 960

ATT AAA AGC CGT GAT GAC TTG TAT CAA TAC TTA CTG ATT GAT AAT CAG 2928ATT AAA AGC CGT GAT GAC TTG TAT CAA TAC TTA CTG ATT GAT AAT CAG 2928

Ile Lys Ser Arg Asp Asp Leu Tyr Gln Tyr Leu Leu Ile Asp Asn GlnIle Lys Ser Arg Asp Asp Leu Tyr Gln Tyr Leu Leu Ile Asp Asn Gln

965 970 975965 970 975

GTT TCT GCG GCA ATA AAA ACC ACC CGG ATC GCC GAA GCC ATT GCC AGT 2976GTT TCT GCG GCA ATA AAA ACC ACC CGG ATC GCC GAA GCC ATT GCC AGT 2976

Val Ser Ala Ala Ile Lys Thr Thr Arg Ile Ala Glu Ala Ile Ala SerVal Ser Ala Ala Ile Lys Thr Thr Arg Ile Ala Glu Ala Ile Ala Ser

980 985 990980 985 990

ATT CAA CTG TAC GTC AAC CGG GCA TTG GAA AAT GTG GAA GAA AAT GCC 3024ATT CAA CTG TAC GTC AAC CGG GCA TTG GAA AAT GTG GAA GAA AAT GCC 3024

Ile Gln Leu Tyr Val Asn Arg Ala Leu Glu Asn Val Glu Glu Asn AlaIle Gln Leu Tyr Val Asn Arg Ala Leu Glu Asn Val Glu Glu Asn Ala

995 1000 1005995 1000 1005

AAT TCG GGG GTT ATC AGC CGC CAA TTC TTT ATC GAC TGG GAC AAA TAC 3072AAT TCG GGG GTT ATC AGC CGC CAA TTC TTT ATC GAC TGG GAC AAA TAC 3072

Asn Ser Gly Val Ile Ser Arg Gln Phe Phe Ile Asp Trp Asp Lys TyrAsn Ser Gly Val Ile Ser Arg Gln Phe Phe Ile Asp Trp Asp Lys Tyr

1010 1015 10201010 1015 1020

AAT AAA CGC TAC AGC ACT TGG GCG GGT GTT TCT CAA TTA GTT TAC TAC 3120AAT AAA CGC TAC AGC ACT TGG GCG GGT GTT TCT CAA TTA GTT TAC TAC 3120

Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Gln Leu Val Tyr TyrAsn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Gln Leu Val Tyr Tyr

1025 1030 1035 10401025 1030 1035 1040

CCG GAA AAC TAT ATT GAT CCG ACC ATG CGT ATC GGA CAA ACC AAA ATG 3168CCG GAA AAC TAT ATT GAT CCG ACC ATG CGT ATC GGA CAA ACC AAA ATG 3168

Pro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile Gly Gln Thr Lys MetPro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile Gly Gln Thr Lys Met

1045 1050 10551045 1050 1055

ATG GAC GCA TTA CTG CAA TCC GTC AGC CAA AGC CAA TTA AAC GCC GAT 3216ATG GAC GCA TTA CTG CAA TCC GTC AGC CAA AGC CAA TTA AAC GCC GAT 3216

Met Asp Ala Leu Leu Gln Ser Val Ser Gln Ser Gln Leu Asn Ala AspMet Asp Ala Leu Leu Gln Ser Val Ser Gln Ser Gln Leu Asn Ala Asp

1060 1065 10701060 1065 1070

ACC GTC GAA GAT GCC TTT ATG TCT TAT CTG ACA TCG TTT GAA CAA GTG 3264ACC GTC GAA GAT GCC TTT ATG TCT TAT CTG ACA TCG TTT GAA CAA GTG 3264

Thr Val Glu Asp Ala Phe Met Ser Tyr Leu Thr Ser Phe Glu Gln ValThr Val Glu Asp Ala Phe Met Ser Tyr Leu Thr Ser Phe Glu Gln Val

1075 1080 10851075 1080 1085

GCT AAT CTT AAA GTT ATT AGC GCA TAT CAC GAT AAT ATT AAT AAC GAT 3312GCT AAT CTT AAA GTT ATT AGC GCA TAT CAC GAT AAT ATT AAT AAC GAT 3312

Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Ile Asn Asn AspAla Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Ile Asn Asn Asp

1090 1095 11001090 1095 1100

CAA GGG CTG ACC TAT TTT ATC GGA CTC AGT GAA ACT GAT GCC GGT GAA 3360CAA GGG CTG ACC TAT TTT ATC GGA CTC AGT GAA ACT GAT GCC GGT GAA 3360

Gln Gly Leu Thr Tyr Phe Ile Gly Leu Ser Glu Thr Asp Ala Gly GluGln Gly Leu Thr Tyr Phe Ile Gly Leu Ser Glu Thr Asp Ala Gly Glu

1105 1110 1115 11201105 1110 1115 1120

TAT TAT TGG CGC AGT GTC GAT CAC AGT AAA TTC AAC GAC GGT AAA TTC 3408TAT TAT TGG CGC AGT GTC GAT CAC AGT AAA TTC AAC GAC GGT AAA TTC 3408

Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Phe Asn Asp Gly Lys PheTyr Tyr Trp Arg Ser Val Asp His Ser Lys Phe Asn Asp Gly Lys Phe

1125 1130 11351125 1130 1135

GCG GCT AAT GCC TGG AGT GAA TGG CAT AAA ATT GAT TGT CCA ATT AAC 3456GCG GCT AAT GCC TGG AGT GAA TGG CAT AAA ATT GAT TGT CCA ATT AAC 3456

Ala Ala Asn Ala Trp Ser Glu Trp His Lys Ile Asp Cys Pro Ile AsnAla Ala Asn Ala Trp Ser Glu Trp His Lys Ile Asp Cys Pro Ile Asn

1140 1145 11501140 1145 1150

CCT TAT AAA AGC ACT ATC CGT CCA GTG ATA TAT AAA TCC CGC CTG TAT 3504CCT TAT AAA AGC ACT ATC CGT CCA GTG ATA TAT AAA TCC CGC CTG TAT 3504

Pro Tyr Lys Ser Thr Ile Arg Pro Val Ile Tyr Lys Ser Arg Leu TyrPro Tyr Lys Ser Thr Ile Arg Pro Val Ile Tyr Lys Ser Arg Leu Tyr

1155 1160 11651155 1160 1165

CTG CTC TGG TTG GAA CAA AAG GAG ATC ACC AAA CAG ACA GGA AAT AGT 3552CTG CTC TGG TTG GAA CAA AAG GAG ATC ACC AAA CAG ACA GGA AAT AGT 3552

Leu Leu Trp Leu Glu Gln Lys Glu Ile Thr Lys Gln Thr Gly Asn SerLeu Leu Trp Leu Glu Gln Lys Glu Ile Thr Lys Gln Thr Gly Asn Ser

1170 1175 11801170 1175 1180

AAA GAT GGC TAT CAA ACT GAA ACG GAT TAT CGT TAT GAA CTA AAA TTG 3600AAA GAT GGC TAT CAA ACT GAA ACG GAT TAT CGT TAT GAA CTA AAA TTG 3600

Lys Asp Gly Tyr Gln Thr Glu Thr Asp Tyr Arg Tyr Glu Leu Lys LeuLys Asp Gly Tyr Gln Thr Glu Thr Asp Tyr Arg Tyr Glu Leu Lys Leu

1185 1190 1195 12001185 1190 1195 1200

GCG CAT ATC CGC TAT GAT GGC ACT TGG AAT ACG CCA ATC ACC TTT GAT 3648GCG CAT ATC CGC TAT GAT GGC ACT TGG AAT ACG CCA ATC ACC TTT GAT 3648

Ala His Ile Arg Tyr Asp Gly Thr Trp Asn Thr Pro Ile Thr Phe AspAla His Ile Arg Tyr Asp Gly Thr Trp Asn Thr Pro Ile Thr Phe Asp

1205 1210 12151205 1210 1215

GTC AAT AAA AAA ATA TCC GAG CTA AAA CTG GAA AAA AAT AGA GCG CCC 3696GTC AAT AAA AAA ATA TCC GAG CTA AAA CTG GAA AAA AAT AGA GCG CCC 3696

Val Asn Lys Lys Ile Ser Glu Leu Lys Leu Glu Lys Asn Arg Ala ProVal Asn Lys Lys Ile Ser Glu Leu Lys Leu Glu Lys Asn Arg Ala Pro

1220 1225 12301220 1225 1230

GGA CTC TAT TGT GCC GGT TAT CAA GGT GAA GAT ACG TTG CTG GTG ATG 3744GGA CTC TAT TGT GCC GGT TAT CAA GGT GAA GAT ACG TTG CTG GTG ATG 3744

Gly Leu Tyr Cys Ala Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val MetGly Leu Tyr Cys Ala Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met

1235 1240 12451235 1240 1245

TTT TAT AAC CAA CAA GAC ACA CTA GAT AGT TAT AAA AAC GCT TCA ATG 3792TTT TAT AAC CAA CAA GAC ACA CTA GAT AGT TAT AAA AAC GCT TCA ATG 3792

Phe Tyr Asn Gln Gln Asp Thr Leu Asp Ser Tyr Lys Asn Ala Ser MetPhe Tyr Asn Gln Gln Asp Thr Leu Asp Ser Tyr Lys Asn Ala Ser Met

1250 1255 12601250 1255 1260

CAA GGA CTA TAT ATC TTT GCT GAT ATG GCA TCC AAA GAT ATG ACC CCA 3840CAA GGA CTA TAT ATC TTT GCT GAT ATG GCA TCC AAA GAT ATG ACC CCA 3840

Gln Gly Leu Tyr Ile Phe Ala Asp Met Ala Ser Lys Asp Met Thr ProGln Gly Leu Tyr Ile Phe Ala Asp Met Ala Ser Lys Asp Met Thr Pro

1265 1270 1275 12801265 1270 1275 1280

GAA CAG AGC AAT GTT TAT CGG GAT AAT AGC TAT CAA CAA TTT GAT ACC 3888GAA CAG AGC AAT GTT TAT CGG GAT AAT AGC TAT CAA CAA TTT GAT ACC 3888

Glu Gln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Gln Gln Phe Asp ThrGlu Gln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Gln Gln Phe Asp Thr

1285 1290 12951285 1290 1295

AAT AAT GTC AGA AGA GTG AAT AAC CGC TAT GCA GAG GAT TAT GAG ATT 3936AAT AAT GTC AGA AGA GTG AAT AAC CGC TAT GCA GAG GAT TAT GAG ATT 3936

Asn Asn Val Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr Glu IleAsn Asn Val Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr Glu Ile

1300 1305 13101300 1305 1310

CCT TCC TCG GTA AGT AGC CGT AAA GAC TAT GGT TGG GGA GAT TAT TAC 3984CCT TCC TCG GTA AGT AGC CGT AAA GAC TAT GGT TGG GGA GAT TAT TAC 3984

Pro Ser Ser Val Ser Ser Arg Lys Asp Tyr Gly Trp Gly Asp Tyr TyrPro Ser Ser Val Ser Ser Arg Lys Asp Tyr Gly Trp Gly Asp Tyr Tyr

1315 1320 13251315 1320 1325

CTC AGC ATG GTA TAT AAC GGA GAT ATT CCA ACT ATC AAT TAC AAA GCC 4032CTC AGC ATG GTA TAT AAC GGA GAT ATT CCA ACT ATC AAT TAC AAA GCC 4032

Leu Ser Met Val Tyr Asn Gly Asp Ile Pro Thr Ile Asn Tyr Lys AlaLeu Ser Met Val Tyr Asn Gly Asp Ile Pro Thr Ile Asn Tyr Lys Ala

1330 1335 13401330 1335 1340

GCA TCA AGT GAT TTA AAA ATC TAT ATC TCA CCA AAA TTA AGA ATT ATT 4080GCA TCA AGT GAT TTA AAA ATC TAT ATC TCA CCA AAA TTA AGA ATT ATT 4080

Ala Ser Ser Asp Leu Lys Ile Tyr Ile Ser Pro Lys Leu Arg Ile IleAla Ser Ser Asp Leu Lys Ile Tyr Ile Ser Pro Lys Leu Arg Ile Ile

1345 1350 1355 13601345 1350 1355 1360

CAT AAT GGA TAT GAA GGA CAG AAG CGC AAT CAA TGC AAT CTG ATG AAT 4128CAT AAT GGA TAT GAA GGA CAG AAG CGC AAT CAA TGC AAT CTG ATG AAT 4 128

His Asn Gly Tyr Glu Gly Gln Lys Arg Asn Gln Cys Asn Leu Met AsnHis Asn Gly Tyr Glu Gly Gln Lys Arg Asn Gln Cys Asn Leu Met Asn

1365 1370 13751365 1370 1375

AAA TAT GGC AAA CTA GGT GAT AAA TTT ATT GTT TAT ACT AGC TTG GGG 4176AAA TAT GGC AAA CTA GGT GAT AAA TTT ATT GTT TAT ACT AGC TTG GGG 4176

Lys Tyr Gly Lys Leu Gly Asp Lys Phe Ile Val Tyr Thr Ser Leu GlyLys Tyr Gly Lys Leu Gly Asp Lys Phe Ile Val Tyr Thr Ser Leu Gly

1380 1385 13901380 1385 1390

GTC AAT CCA AAT AAC TCG TCA AAT AAG CTC ATG TTT TAC CCC GTC TAT 4224GTC AAT CCA AAT AAC TCG TCA AAT AAG CTC ATG TTT TAC CCC GTC TAT 4224

Val Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val TyrVal Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val Tyr

1395 1400 14051395 1400 1405

CAA TAT AGC GGA AAC ACC AGT GGA CTC AAT CAA GGG AGA CTA CTA TTC 4272CAA TAT AGC GGA AAC ACC AGT GGA CTC AAT CAA GGG AGA CTA CTA TTC 4272

Gln Tyr Ser Gly Asn Thr Ser Gly Leu Asn Gln Gly Arg Leu Leu PheGln Tyr Ser Gly Asn Thr Ser Gly Leu Asn Gln Gly Arg Leu Leu Phe

1410 1415 14201410 1415 1420

CAC CGT GAC ACC ACT TAT CCA TCT AAA GTA GAA GCT TGG ATT CCT GGA 4320CAC CGT GAC ACC ACT TAT CCA TCT AAA GTA GAA GCT TGG ATT CCT GGA 4320

His Arg Asp Thr Thr Tyr Pro Ser Lys Val Glu Ala Trp Ile Pro GlyHis Arg Asp Thr Thr Tyr Pro Ser Lys Val Glu Ala Trp Ile Pro Gly

1425 1430 1435 14401425 1430 1435 1440

GCA AAA CGT TCT CTA ACC AAC CAA AAT GCC GCC ATT GGT GAT GAT TAT 4368GCA AAA CGT TCT CTA ACC AAC CAA AAT GCC GCC ATT GGT GAT GAT TAT 4368

Ala Lys Arg Ser Leu Thr Asn Gln Asn Ala Ala Ile Gly Asp Asp TyrAla Lys Arg Ser Leu Thr Asn Gln Asn Ala Ala Ile Gly Asp Asp Tyr

1445 1450 14551445 1450 1455

GCT ACA GAC TCT CTG AAT AAA CCG GAT GAT CTT AAG CAA TAT ATC TTT 4416GCT ACA GAC TCT CTG AAT AAA CCG GAT GAT CTT AAG CAA TAT ATC TTT 4416

Ala Thr Asp Ser Leu Asn Lys Pro Asp Asp Leu Lys Gln Tyr Ile PheAla Thr Asp Ser Leu Asn Lys Pro Asp Asp Leu Lys Gln Tyr Ile Phe

1460 1465 14701460 1465 1470

ATG ACT GAC AGT AAA GGG ACT GCT ACT GAT GTC TCA GGC CCA GTA GAG 4464ATG ACT GAC AGT AAA GGG ACT GCT ACT GAT GTC TCA GGC CCA GTA GAG 4464

Met Thr Asp Ser Lys Gly Thr Ala Thr Asp Val Ser Gly Pro Val GluMet Thr Asp Ser Lys Gly Thr Ala Thr Asp Val Ser Gly Pro Val Glu

1475 1480 14851475 1480 1485

ATT AAT ACT GCA ATT TCT CCA GCA AAA GTT CAG ATA ATA GTC AAA GCG 4512ATT AAT ACT GCA ATT TCT CCA GCA AAA GTT CAG ATA ATA GTC AAA GCG 4512

Ile Asn Thr Ala Ile Ser Pro Ala Lys Val Gln Ile Ile Val Lys AlaIle Asn Thr Ala Ile Ser Pro Ala Lys Val Gln Ile Ile Val Lys Ala

1490 1495 15001490 1495 1500

GGT GGC AAG GAG CAA ACT TTT ACC GCA GAT AAA GAT GTC TCC ATT CAG 4560GGT GGC AAG GAG CAA ACT TTT ACC GCA GAT AAA GAT GTC TCC ATT CAG 4560

Gly Gly Lys Glu Gln Thr Phe Thr Ala Asp Lys Asp Val Ser Ile GlnGly Gly Lys Glu Gln Thr Phe Thr Ala Asp Lys Asp Val Ser Ile Gln

1505 1510 1515 15201505 1510 1515 1520

CCA TCA CCT AGC TTT GAT GAA ATG AAT TAT CAA TTT AAT GCC CTT GAA 4608CCA TCA CCT AGC TTT GAT GAA ATG AAT TAT CAA TTT AAT GCC CTT GAA 4608

Pro Ser Pro Ser Phe Asp Glu Met Asn Tyr Gln Phe Asn Ala Leu GluPro Ser Pro Ser Phe Asp Glu Met Asn Tyr Gln Phe Asn Ala Leu Glu

1525 1530 15351525 1530 1535

ATA GAC GGT TCT GGT CTG AAT TTT ATT AAC AAC TCA GCC AGT ATT GAT 4656ATA GAC GGT TCT GGT CTG AAT TTT ATT AAC AAC TCA GCC AGT ATT GAT 4656

Ile Asp Gly Ser Gly Leu Asn Phe Ile Asn Asn Ser Ala Ser Ile AspIle Asp Gly Ser Gly Leu Asn Phe Ile Asn Asn Ser Ala Ser Ile Asp

1540 1545 15501540 1545 1550

GTT ACT TTT ACC GCA TTT GCG GAG GAT GGC CGC AAA CTG GGT TAT GAA 4704GTT ACT TTT ACC GCA TTT GCG GAG GAT GGC CGC AAA CTG GGT TAT GAA 4704

Val Thr Phe Thr Ala Phe Ala Glu Asp Gly Arg Lys Leu Gly Tyr GluVal Thr Phe Thr Ala Phe Ala Glu Asp Gly Arg Lys Leu Gly Tyr Glu

1555 1560 15651555 1560 1565

AGT TTC AGT ATT CCT GTT ACC CTC AAG GTA AGT ACC GAT AAT GCC CTG 4752AGT TTC AGT ATT CCT GTT ACC CTC AAG GTA AGT ACC GAT AAT GCC CTG 4752

Ser Phe Ser Ile Pro Val Thr Leu Lys Val Ser Thr Asp Asn Ala LeuSer Phe Ser Ile Pro Val Thr Leu Lys Val Ser Thr Asp Asn Ala Leu

1570 1575 15801570 1575 1580

ACC CTG CAC CAT AAT GAA AAT GGT GCG CAA TAT ATG CAA TGG CAA TCC 4800ACC CTG CAC CAT AAT GAA AAT GGT GCG CAA TAT ATG CAA TGG CAA TCC 4800

Thr Leu His His Asn Glu Asn Gly Ala Gln Tyr Met Gln Trp Gln SerThr Leu His His Asn Glu Asn Gly Ala Gln Tyr Met Gln Trp Gln Ser

1585 1590 1595 16001585 1590 1595 1600

TAT CGT ACC CGC CTG AAT ACT CTA TTT GCC CGC CAG TTG GTT GCA CGC 4848TAT CGT ACC CGC CTG AAT ACT CTA TTT GCC CGC CAG TTG GTT GCA CGC 4848

Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Arg Gln Leu Val Ala ArgTyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Arg Gln Leu Val Ala Arg

1605 1610 16151605 1610 1615

GCC ACC ACC GGA ATC GAT ACA ATT CTG AGT ATG GAA ACT CAG AAT ATT 4896GCC ACC ACC GGA ATC GAT ACA ATT CTG AGT ATG GAA ACT CAG AAT ATT 4896

Ala Thr Thr Gly Ile Asp Thr Ile Leu Ser Met Glu Thr Gln Asn IleAla Thr Thr Gly Ile Asp Thr Ile Leu Ser Met Glu Thr Gln Asn Ile

1620 1625 16301620 1625 1630

CAG GAA CCG CAG TTA GGC AAA GGT TTC TAT GCT ACG TTC GTG ATA CCT 4944CAG GAA CCG CAG TTA GGC AAA GGT TTC TAT GCT ACG TTC GTG ATA CCT 4944

Gln Glu Pro Gln Leu Gly Lys Gly Phe Tyr Ala Thr Phe Val Ile ProGln Glu Pro Gln Leu Gly Lys Gly Phe Tyr Ala Thr Phe Val Ile Pro

1635 1640 16451635 1640 1645

CCC TAT AAC CTA TCA ACT CAT GGT GAT GAA CGT TGG TTT AAG CTT TAT 4992CCC TAT AAC CTA TCA ACT CAT GGT GAT GAA CGT TGG TTT AAG CTT TAT 4992

Pro Tyr Asn Leu Ser Thr His Gly Asp Glu Arg Trp Phe Lys Leu TyrPro Tyr Asn Leu Ser Thr His Gly Asp Glu Arg Trp Phe Lys Leu Tyr

1650 1655 16601650 1655 1660

ATC AAA CAT GTT GTT GAT AAT AAT TCA CAT ATT ATC TAT TCA GGC CAG 5040ATC AAA CAT GTT GTT GAT AAT AAT TCA CAT ATT ATC TAT TCA GGC CAG 5040

Ile Lys His Val Val Asp Asn Asn Ser His Ile Ile Tyr Ser Gly GlnIle Lys His Val Val Asp Asn Asn Ser His Ile Ile Tyr Ser Gly Gln

1665 1670 1675 16801665 1670 1675 1680

CTA ACA GAT ACA AAT ATA AAC ATC ACA TTA TTT ATT CCT CTT GAT GAT 5088CTA ACA GAT ACA AAT ATA AAC ATC ACA TTA TTT ATT CCT CTT GAT GAT 5088

Leu Thr Asp Thr Asn Ile Asn Ile Thr Leu Phe Ile Pro Leu Asp AspLeu Thr Asp Thr Asn Ile Asn Ile Thr Leu Phe Ile Pro Leu Asp Asp

1685 1690 16951685 1690 1695

GTC CCA TTG AAT CAA GAT TAT CAC GCC AAG GTT TAT ATG ACC TTC AAG 5136GTC CCA TTG AAT CAA GAT TAT CAC GCC AAG GTT TAT ATG ACC TTC AAG 5136

Val Pro Leu Asn Gln Asp Tyr His Ala Lys Val Tyr Met Thr Phe LysVal Pro Leu Asn Gln Asp Tyr His Ala Lys Val Tyr Met Thr Phe Lys

1700 1705 17101700 1705 1710

AAA TCA CCA TCA GAT GGT ACC TGG TGG GGC CCT CAC TTT GTT AGA GAT 5184AAA TCA CCA TCA GAT GGT ACC TGG TGG GGC CCT CAC TTT GTT AGA GAT 5184

Lys Ser Pro Ser Asp Gly Thr Trp Trp Gly Pro His Phe Val Arg AspLys Ser Pro Ser Asp Gly Thr Trp Trp Gly Pro His Phe Val Arg Asp

1715 1720 17251715 1720 1725

GAT AAA GGA ATA GTA ACA ATA AAC CCT AAA TCC ATT TTG ACC CAT TTT 5232GAT AAA GGA ATA GTA ACA ATA AAC CCT AAA TCC ATT TTG ACC CAT TTT 5232

Asp Lys Gly Ile Val Thr Ile Asn Pro Lys Ser Ile Leu Thr His PheAsp Lys Gly Ile Val Thr Ile Asn Pro Lys Ser Ile Leu Thr His Phe

1730 1735 17401730 1735 1740

GAG AGC GTC AAT GTC CTG AAT AAT ATT AGT AGC GAA CCA ATG GAT TTC 5280GAG AGC GTC AAT GTC CTG AAT AAT ATT AGT AGC GAA CCA ATG GAT TTC 5280

Glu Ser Val Asn Val Leu Asn Asn Ile Ser Ser Glu Pro Met Asp PheGlu Ser Val Asn Val Leu Asn Asn Ile Ser Ser Glu Pro Met Asp Phe

1745 1750 1755 17601745 1750 1755 1760

AGC GGC GCT AAC AGC CTC TAT TTC TGG GAA CTG TTC TAC TAT ACC CCG 5328AGC GGC GCT AAC AGC CTC TAT TTC TGG GAA CTG TTC TAC TAT ACC CCG 5328

Ser Gly Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr ProSer Gly Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro

1765 1770 17751765 1770 1775

ATG CTG GTT GCT CAA CGT TTG CTG CAT GAA CAG AAC TTC GAT GAA GCC 5376ATG CTG GTT GCT CAA CGT TTG CTG CAT GAA CAG AAC TTC GAT GAA GCC 5376

Met Leu Val Ala Gln Arg Leu Leu His Glu Gln Asn Phe Asp Glu AlaMet Leu Val Ala Gln Arg Leu Leu His Glu Gln Asn Phe Asp Glu Ala

1780 1785 17901780 1785 1790

AAC CGT TGG CTG AAA TAT GTC TGG AGT CCA TCC GGT TAT ATT GTC CAC 5424AAC CGT TGG CTG AAA TAT GTC TGG AGT CCA TCC GGT TAT ATT GTC CAC 5424

Asn Arg Trp Leu Lys Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val HisAsn Arg Trp Leu Lys Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val His

1795 1800 18051795 1800 1805

GGC CAG ATT CAG AAC TAC CAG TGG AAC GTC CGC CCG TTA CTG GAA GAC 5472GGC CAG ATT CAG AAC TAC CAG TGG AAC GTC CGC CCG TTA CTG GAA GAC 5472

Gly Gln Ile Gln Asn Tyr Gln Trp Asn Val Arg Pro Leu Leu Glu AspGly Gln Ile Gln Asn Tyr Gln Trp Asn Val Arg Pro Leu Leu Glu Asp

1810 1815 18201810 1815 1820

ACC AGT TGG AAC AGT GAT CCT TTG GAT TCC GTC GAT CCT GAC GCG GTA 5520ACC AGT TGG AAC AGT GAT CCT TTG GAT TCC GTC GAT CCT GAC GCG GTA 5520

Thr Ser Trp Asn Ser Asp Pro Leu Asp Ser Val Asp Pro Asp Ala ValThr Ser Trp Asn Ser Asp Pro Leu Asp Ser Val Asp Pro Asp Ala Val

1825 1830 1835 18401825 1830 1835 1840

GCA CAG CAC GAT CCA ATG CAC TAC AAA GTT TCA ACT TTT ATG CGT ACC 5568GCA CAG CAC GAT CCA ATG CAC TAC AAA GTT TCA ACT TTT ATG CGT ACC 5568

Ala Gln His Asp Pro Met His Tyr Lys Val Ser Thr Phe Met Arg ThrAla Gln His Asp Pro Met His Tyr Lys Val Ser Thr Phe Met Arg Thr

1845 1850 18551845 1850 1855

TTG GAT CTA TTG ATA GCA CGC GGC GAC CAT GCT TAT CGC CAA CTG GAA 5616TTG GAT CTA TTG ATA GCA CGC GGC GAC CAT GCT TAT CGC CAA CTG GAA 5616

Leu Asp Leu Leu Ile Ala Arg Gly Asp His Ala Tyr Arg Gln Leu GluLeu Asp Leu Leu Ile Ala Arg Gly Asp His Ala Tyr Arg Gln Leu Glu

1860 1865 18701860 1865 1870

CGA GAT ACA CTC AAC GAA GCG AAG ATG TGG TAT ATG CAA GCG CTG CAT 5664CGA GAT ACA CTC AAC GAA GCG AAG ATG TGG TAT ATG CAA GCG CTG CAT 5664

Arg Asp Thr Leu Asn Glu Ala Lys Met Trp Tyr Met Gln Ala Leu HisArg Asp Thr Leu Asn Glu Ala Lys Met Trp Tyr Met Gln Ala Leu His

1875 1880 18851875 1880 1885

CTA TTA GGT GAC AAA CCT TAT CTA CCG CTG AGT ACG ACA TGG AGT GAT 5712CTA TTA GGT GAC AAA CCT TAT CTA CCG CTG AGT ACG ACA TGG AGT GAT 5712

Leu Leu Gly Asp Lys Pro Tyr Leu Pro Leu Ser Thr Thr Trp Ser AspLeu Leu Gly Asp Lys Pro Tyr Leu Pro Leu Ser Thr Thr Trp Ser Asp

1890 1895 19001890 1895 1900

CCA CGA CTA GAC AGA GCC GCG GAT ATC ACT ACC CAA AAT GCT CAC GAC 5760CCA CGA CTA GAC AGA GCC GCG GAT ATC ACT ACC CAA AAT GCT CAC GAC 5760

Pro Arg Leu Asp Arg Ala Ala Asp Ile Thr Thr Gln Asn Ala His AspPro Arg Leu Asp Arg Ala Ala Asp Ile Thr Thr Gln Asn Ala His Asp

1905 1910 1915 19201905 1910 1915 1920

AGC GCA ATA GTC GCT CTG CGG CAG AAT ATA CCT ACA CCG GCA CCT TTA 5808AGC GCA ATA GTC GCT CTG CGG CAG AAT ATA CCT ACA CCG GCA CCT TTA 5808

Ser Ala Ile Val Ala Leu Arg Gln Asn Ile Pro Thr Pro Ala Pro LeuSer Ala Ile Val Ala Leu Arg Gln Asn Ile Pro Thr Pro Ala Pro Leu

1925 1930 19351925 1930 1935

TCA TTG CGC AGC GCT AAT ACC CTG ACT GAT CTC TTC CTG CCG CAA ATC 5856TCA TTG CGC AGC GCT AAT ACC CTG ACT GAT CTC TTC CTG CCG CAA ATC 5856

Ser Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln IleSer Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile

1940 1945 19501940 1945 1950

AAT GAA GTG ATG ATG AAT TAC TGG CAG ACA TTA GCT CAG AGA GTA TAC 5904AAT GAA GTG ATG ATG AAT TAC TGG CAG ACA TTA GCT CAG AGA GTA TAC 5904

Asn Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val TyrAsn Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr

1955 1960 19651955 1960 1965

AAT CTG CGT CAT AAC CTC TCT ATC GAC GGC CAG CCG TTA TAT CTG CCA 5952AAT CTG CGT CAT AAC CTC TCT ATC GAC GGC CAG CCG TTA TAT CTG CCA 5952

Asn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu ProAsn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro

1970 1975 19801970 1975 1980

ATC TAT GCC ACA CCG GCC GAT CCG AAA GCG TTA CTC AGC GCC GCC GTT 6000ATC TAT GCC ACA CCG GCC GAT CCG AAA GCG TTA CTC AGC GCC GCC GTT 6000

Ile Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala ValIle Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val

1985 1990 1995 20001985 1990 1995 2000

GCC ACT TCT CAA GGT GGA GGC AAG CTA CCG GAA TCA TTT ATG TCC CTG 6048GCC ACT TCT CAA GGT GGA GGC AAG CTA CCG GAA TCA TTT ATG TCC CTG 6048

Ala Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser LeuAla Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu

2005 2010 20152005 2010 2015

TGG CGT TTC CCG CAC ATG CTG GAA AAT GCG CGC GGC ATG GTT AGC CAG 6096TGG CGT TTC CCG CAC ATG CTG GAA AAT GCG CGC GGC ATG GTT AGC CAG 6096

Trp Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser GlnTrp Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln

2020 2025 20302020 2025 2030

CTC ACC CAG TTC GGC TCC ACG TTA CAA AAT ATT ATC GAA CGT CAG GAC 6144CTC ACC CAG TTC GGC TCC ACG TTA CAA AAT ATT ATC GAA CGT CAG GAC 6144

Leu Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Ile Glu Arg Gln AspLeu Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Glu Arg Gln Asp

2035 2040 20452035 2040 2045

GCG GAA GCG CTC AAT GCG TTA TTA CAA AAT CAG GCC GCC GAG CTG ATA 6192GCG GAA GCG CTC AAT GCG TTA TTA CAA AAT CAG GCC GCC GAG CTG ATA 6192

Ala Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu IleAla Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile

2050 2055 20602050 2055 2060

TTG ACT AAC CTG AGC ATT CAG GAC AAA ACC ATT GAA GAA TTG GAT GCC 6240TTG ACT AAC CTG AGC ATT CAG GAC AAA ACC ATT GAA GAA TTG GAT GCC 6240

Leu Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp AlaLeu Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala

2065 2070 2075 20802065 2070 2075 2080

GAG AAA ACG GTG TTG GAA AAA TCC AAA GCG GGA GCA CAA TCG CGC TTT 6288GAG AAA ACG GTG TTG GAA AAA TCC AAA GCG GGA GCA CAA TCG CGC TTT 6288

Glu Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg PheGlu Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe

2085 2090 20952085 2090 2095

GAT AGC TAC GGC AAA CTG TAC GAT GAG AAT ATC AAC GCC GGT GAA AAC 6336GAT AGC TAC GGC AAA CTG TAC GAT GAG AAT ATC AAC GCC GGT GAA AAC 6336

Asp Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu AsnAsp Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn

2100 2105 21102100 2105 2110

CAA GCC ATG ACG CTA CGA GCG TCC GCC GCC GGG CTT ACC ACG GCA GTT 6384CAA GCC ATG ACG CTA CGA GCG TCC GCC GCC GGG CTT ACC ACG GCA GTT 6384

Gln Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala ValGln Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val

2115 2120 21252115 2120 2125

CAG GCA TCC CGT CTG GCC GGT GCG GCG GCT GAT CTG GTG CCT AAC ATC 6432CAG GCA TCC CGT CTG GCC GGT GCG GCG GCT GAT CTG GTG CCT AAC ATC 6432

Gln Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn IleGln Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile

2130 2135 21402130 2135 2140

TTC GGC TTT GCC GGT GGC GGC AGC CGT TGG GGG GCT ATC GCT GAG GCG 6480TTC GGC TTT GCC GGT GGC GGC AGC CGT TGG GGG GCT ATC GCT GAG GCG 6 480

Phe Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu AlaPhe Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala

2145 2150 2155 21602145 2150 2155 2160

ACA GGT TAT GTG ATG GAA TTC TCC GCG AAT GTT ATG AAC ACC GAA GCG 6528ACA GGT TAT GTG ATG GAA TTC TCC GCG AAT GTT ATG AAC ACC GAA GCG 6528

Thr Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu AlaThr Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala

2165 2170 21752165 2170 2175

GAT AAA ATT AGC CAA TCT GAA ACC TAC CGT CGT CGC CGT CAG GAG TGG 6576GAT AAA ATT AGC CAA TCT GAA ACC TAC CGT CGT CGC CGT CAG GAG TGG 6576

Asp Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu TrpAsp Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp

2180 2185 21902180 2185 2190

GAG ATC CAG CGG AAT AAT GCC GAA GCG GAA TTG AAG CAA ATC GAT GCT 6624GAG ATC CAG CGG AAT AAT GCC GAA GCG GAA TTG AAG CAA ATC GAT GCT 6624

Glu Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp AlaGlu Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala

2195 2200 22052195 2200 2205

CAG CTC AAA TCA CTC GCT GTA CGC CGC GAA GCC GCC GTA TTG CAG AAA 6672CAG CTC AAA TCA CTC GCT GTA CGC CGC GAA GCC GCC GTA TTG CAG AAA 6672

Gln Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln LysGln Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys

2210 2215 22202210 2215 2220

ACC AGT CTG AAA ACC CAA CAA GAA CAG ACC CAA TCT CAA TTG GCC TTC 6720ACC AGT CTG AAA ACC CAA CAA GAA CAG ACC CAA TCT CAA TTG GCC TTC 6720

Thr Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala PheThr Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe

2225 2230 2235 22402225 2230 2235 2240

CTG CAA CGT AAG TTC AGC AAT CAG GCG TTA TAC AAC TGG CTG CGT GGT 6768CTG CAA CGT AAG TTC AGC AAT CAG GCG TTA TAC AAC TGG CTG CGT GGT 6768

Leu Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg GlyLeu Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly

2245 2250 22552245 2250 2255

CGA CTG GCG GCG ATT TAC TTC CAG TTC TAC GAT TTG GCC GTC GCG CGT 6816CGA CTG GCG GCG ATT TAC TTC CAG TTC TAC GAT TTG GCC GTC GCG CGT 6816

Arg Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala ArgArg Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg

2260 2265 22702260 2265 2270

TGC CTG ATG GCA GAA CAA GCT TAC CGT TGG GAA CTC AAT GAT GAC TCT 6864TGC CTG ATG GCA GAA CAA GCT TAC CGT TGG GAA CTC AAT GAT GAC TCT 6864

Cys Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp SerCys Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser

2275 2280 22852275 2280 2285

GCC CGC TTC ATT AAA CCG GGC GCC TGG CAG GGA ACC TAT GCC GGT CTG 6912GCC CGC TTC ATT AAA CCG GGC GCC TGG CAG GGA ACC TAT GCC GGT CTG 6912

Ala Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly LeuAla Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu

2290 2295 23002290 2295 2300

CTT GCA GGT GAA ACC TTG ATG CTG AGT CTG GCA CAA ATG GAA GAC GCT 6960CTT GCA GGT GAA ACC TTG ATG CTG AGT CTG GCA CAA ATG GAA GAC GCT 6960

Leu Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp AlaLeu Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala

2305 2310 2315 23202305 2310 2315 2320

CAT CTG AAA CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCG 7008CAT CTG AAA CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCG 7008

His Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val SerHis Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser

2325 2330 23352325 2330 2335

CTG GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC 7056CTG GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC 7056

Leu Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe SerLeu Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser

2340 2345 23502340 2345 2350

CTG GCT CAG GAA ATT GAC AAG CTG GTG AGT CAA GGT TCA GGC AGT GCC 7104CTG GCT CAG GAA ATT GAC AAG CTG GTG AGT CAA GGT TCA GGC AGT GCC 7104

Leu Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser AlaLeu Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala

2355 2360 23652355 2360 2365

GGC AGT GGT AAT AAT AAT TTG GCG TTC GGC GCC GGC ACG GAC ACT AAA 7152GGC AGT GGT AAT AAT AAT TTG GCG TTC GGC GCC GGC ACG GAC ACT AAA 7 152

Gly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr LysGly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys

2370 2375 23802370 2375 2380

ACC TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTG AAA ATT CGT GAA 7200ACC TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTG AAA ATT CGT GAA 7200

Thr Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg GluThr Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu

2385 2390 2395 24002385 2390 2395 2400

GAT TAC CCG GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC 7248GAT TAC CCG GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC 7248

Asp Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile SerAsp Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser

2405 2410 24152405 2410 2415

GTC ACT TTG CCC GCG CTA CTG GGA CCG TAT CAG GAT GTA CAG GCA ATA 7296GTC ACT TTG CCC GCG CTA CTG GGA CCG TAT CAG GAT GTA CAG GCA ATA 7296

Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala IleVal Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile

2420 2425 24302420 2425 2430

TTG TCT TAC GGC GAT AAA GCC GGA TTA GCT AAC GGC TGT GAA GCG CTG 7344TTG TCT TAC GGC GAT AAA GCC GGA TTA GCT AAC GGC TGT GAA GCG CTG 7344

Leu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala LeuLeu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu

2435 2440 24452435 2440 2445

GCA GTT TCT CAC GGT ATG AAT GAC AGC GGC CAA TTC CAG CTC GAT TTC 7392GCA GTT TCT CAC GGT ATG AAT GAC AGC GGC CAA TTC CAG CTC GAT TTC 7392

Ala Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp PheAla Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe

2450 2455 24602450 2455 2460

AAC GAT GGC AAA TTC CTG CCA TTC GAA GGC ATC GCC ATT GAT CAA GGC 7440AAC GAT GGC AAA TTC CTG CCA TTC GAA GGC ATC GCC ATT GAT CAA GGC 7440

Asn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln GlyAsn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly

2465 2470 2475 24802465 2470 2475 2480

ACG CTG ACA CTG AGC TTC CCA AAT GCA TCT ATG CCG GAG AAA GGT AAA 7488ACG CTG ACA CTG AGC TTC CCA AAT GCA TCT ATG CCG GAG AAA GGT AAA 7488

Thr Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly LysThr Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys

2485 2490 24952485 2490 2495

CAA GCC ACT ATG TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC 7536CAA GCC ACT ATG TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC 7536

Gln Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile ArgGln Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg

2500 2505 25102500 2505 2510

TAC ACC ATT AAA TAA 7551TAC ACC ATT AAA TAA 7551

Tyr Thr Ile Lys ⅴ?Tyr Thr Ile Lys

25162516

(2) INFORMATION FOR SEQ ID NO:47:(2) INFORMATION FOR SEQ ID NO: 47:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 2516 amino acids(A) LENGTH: 2516 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:47 (TcdA):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 47 (TcdA):

Features From To DescriptionFeatures From To Description

Peptide 1 2516 TcdA proteinsPeptide 1 2516 TcdA proteins

Peptide 89 1937 TcdAii peptidePeptide 89 1937 TcdAii peptide

Fragment 89 100 TcdAii N-terminus (SEQFragment 89 100 TcdAii N-terminus (SEQ

ID NO:13)ID NO: 13)

Fragment 284 299 (SEQ ID NO:38)Fragment 284 299 (SEQ ID NO: 38)

Fragment 554 563 (SEQ ID NO:17)Fragment 554 563 (SEQ ID NO: 17)

Fragment 1080 1092 (SEQ ID NO:23;Fragment 1080 1092 (SEQ ID NO: 23;

12/13)12/13)

Fragment 1385 1400 (SEQ ID NO:18)Fragment 1385 1400 (SEQ ID NO: 18)

Fragment 1478 1497 (SEQ ID NO:39)Fragment 1478 1497 (SEQ ID NO: 39)

Fragment 1620 1642 (SEQ ID NO:21;Fragment 1620 1642 (SEQ ID NO: 21;

19/23)19/23)

Fragment 1938 1948 (SEQ ID NO:41)Fragment 1938 1948 (SEQ ID NO: 41)

Peptide 1938 2516 TcdAiii peptidePeptide 1938 2516 TcdAiii peptide

Fragment 2327 2345 (SEQ ID NO:42)Fragment 2327 2345 (SEQ ID NO: 42)

Fragment 2398 2408 (SEQ ID NO:43)Fragment 2398 2408 (SEQ ID NO: 43)

Met Asn Glu Ser Val Lys Glu Ile Pro Asp Val Leu Lys Ser Gln CysMet Asn Glu Ser Val Lys Glu Ile Pro Asp Val Leu Lys Ser Gln Cys

1 5 10 151 5 10 15

Gly Phe Asn Cys Leu Thr Asp Ile Ser His Ser Ser Phe Asn Glu PheGly Phe Asn Cys Leu Thr Asp Ile Ser His Ser Ser Phe Asn Glu Phe

20 25 3020 25 30

Arg Gln Gln Val Ser Glu His Leu Ser Trp Ser Glu Thr His Asp LeuArg Gln Gln Val Ser Glu His Leu Ser Trp Ser Glu Thr His Asp Leu

35 40 4535 40 45

Tyr His Asp Ala Gln Gln Ala Gln Lys Asp Asn Arg Leu Tyr Glu AlaTyr His Asp Ala Gln Gln Ala Gln Lys Asp Asn Arg Leu Tyr Glu Ala

50 55 6050 55 60

Arg Ile Leu Lys Arg Ala Asn Pro Gln Leu Gln Asn Ala Val His LeuArg Ile Leu Lys Arg Ala Asn Pro Gln Leu Gln Asn Ala Val His Leu

65 70 75 8065 70 75 80

Ala Ile Leu Ala Pro Asn Ala Glu Leu Ile Gly Tyr Asn Asn Gln PheAla Ile Leu Ala Pro Asn Ala Glu Leu Ile Gly Tyr Asn Asn Gln Phe

85 90 9585 90 95

Ser Gly Arg Ala Ser Gln Tyr Val Ala Pro Gly Thr Val Ser Ser MetSer Gly Arg Ala Ser Gln Tyr Val Ala Pro Gly Thr Val Ser Ser Met

100 105 110100 105 110

Phe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Arg AsnPhe Ser Pro Ala Ala Tyr Leu Thr Glu Leu Tyr Arg Glu Ala Arg Asn

115 120 125115 120 125

Leu His Ala Ser Asp Ser Val Tyr Tyr Leu Asp Thr Arg Arg Pro AspLeu His Ala Ser Asp Ser Val Tyr Tyr Leu Asp Thr Arg Arg Pro Asp

130 135 140130 135 140

Leu Lys Ser Met Ala Leu Ser Gln Gln Asn Met Asp Ile Glu Leu SerLeu Lys Ser Met Ala Leu Ser Gln Gln Asn Met Asp Ile Glu Leu Ser

145 150 155 160145 150 155 160

Thr Leu Ser Leu Ser Asn Glu Leu Leu Leu Glu Ser Ile Lys Thr GluThr Leu Ser Leu Ser Asn Glu Leu Leu Leu Glu Ser Ile Lys Thr Glu

165 170 175165 170 175

Ser Lys Leu Glu Asn Tyr Thr Lys Val Met Glu Met Leu Ser Thr PheSer Lys Leu Glu Asn Tyr Thr Lys Val Met Glu Met Leu Ser Thr Phe

180 185 190180 185 190

Arg Pro Ser Gly Ala Thr Pro Tyr His Asp Ala Tyr Glu Asn Val ArgArg Pro Ser Gly Ala Thr Pro Tyr His Asp Ala Tyr Glu Asn Val Arg

195 200 205195 200 205

Glu Val Ile Gln Leu Gln Asp Pro Gly Leu Glu Gln Leu Asn Ala SerGlu Val Ile Gln Leu Gln Asp Pro Gly Leu Glu Gln Leu Asn Ala Ser

210 215 220210 215 220

Pro Ala Ile Ala Gly Leu Met His Gln Ala Ser Leu Leu Gly Ile AsnPro Ala Ile Ala Gly Leu Met His Gln Ala Ser Leu Leu Gly Ile Asn

225 230 235 240225 230 235 240

Ala Ser Ile Ser Pro Glu Leu Phe Asn Ile Leu Thr Glu Glu Ile ThrAla Ser Ile Ser Pro Glu Leu Phe Asn Ile Leu Thr Glu Glu Ile Thr

245 250 255245 250 255

Glu Gly Asn Ala Glu Glu Leu Tyr Lys Lys Asn Phe Gly Asn Ile GluGlu Gly Asn Ala Glu Glu Leu Tyr Lys Lys Asn Phe Gly Asn Ile Glu

260 265 270260 265 270

Pro Ala Ser Leu Ala Met Pro Glu Tyr Leu Lys Arg Tyr Tyr Asn LeuPro Ala Ser Leu Ala Met Pro Glu Tyr Leu Lys Arg Tyr Tyr Asn Leu

275 280 285275 280 285

Ser Asp Glu Glu Leu Ser Gln Phe Ile Gly Lys Ala Ser Asn Phe GlySer Asp Glu Glu Leu Ser Gln Phe Ile Gly Lys Ala Ser Asn Phe Gly

290 295 300290 295 300

Gln Gln Glu Tyr Ser Asn Asn Gln Leu Ile Thr Pro Val Val Asn SerGln Gln Glu Tyr Ser Asn Asn Gln Leu Ile Thr Pro Val Val Asn Ser

305 310 315 320305 310 315 320

Ser Asp Gly Thr Val Lys Val Tyr Arg Ile Thr Arg Glu Tyr Thr ThrSer Asp Gly Thr Val Lys Val Tyr Arg Ile Thr Arg Glu Tyr Thr Thr

325 330 335325 330 335

Asn Ala Tyr Gln Met Asp Val Glu Leu Phe Pro Phe Gly Gly Glu AsnAsn Ala Tyr Gln Met Asp Val Glu Leu Phe Pro Phe Gly Glu Glu Asn

340 345 350340 345 350

Tyr Arg Leu Asp Tyr Lys Phe Lys Asn Phe Tyr Asn Ala Ser Tyr LeuTyr Arg Leu Asp Tyr Lys Phe Lys Asn Phe Tyr Asn Ala Ser Tyr Leu

355 360 365355 360 365

Ser Ile Lys Leu Asn Asp Lys Arg Glu Leu Val Arg Thr Glu Gly AlaSer Ile Lys Leu Asn Asp Lys Arg Glu Leu Val Arg Thr Glu Gly Ala

370 375 380370 375 380

Pro Gln Val Asn Ile Glu Tyr Ser Ala Asn Ile Thr Leu Asn Thr AlaPro Gln Val Asn Ile Glu Tyr Ser Ala Asn Ile Thr Leu Asn Thr Ala

385 390 395 400385 390 395 400

Asp Ile Ser Gln Pro Phe Glu Ile Gly Leu Thr Arg Val Leu Pro SerAsp Ile Ser Gln Pro Phe Glu Ile Gly Leu Thr Arg Val Leu Pro Ser

405 410 415405 410 415

Gly Ser Trp Ala Tyr Ala Ala Ala Lys Phe Thr Val Glu Glu Tyr AsnGly Ser Trp Ala Tyr Ala Ala Ala Lys Phe Thr Val Glu Glu Tyr Asn

420 425 430420 425 430

Gln Tyr Ser Phe Leu Leu Lys Leu Asn Lys Ala Ile Arg Leu Ser ArgGln Tyr Ser Phe Leu Leu Lys Leu Asn Lys Ala Ile Arg Leu Ser Arg

435 440 445435 440 445

Ala Thr Glu Leu Ser Pro Thr Ile Leu Glu Gly Ile Val Arg Ser ValAla Thr Glu Leu Ser Pro Thr Ile Leu Glu Gly Ile Val Arg Ser Val

450 455 460450 455 460

Asn Leu Gln Leu Asp Ile Asn Thr Asp Val Leu Gly Lys Val Phe LeuAsn Leu Gln Leu Asp Ile Asn Thr Asp Val Leu Gly Lys Val Phe Leu

465 470 475 480465 470 475 480

Thr Lys Tyr Tyr Met Gln Arg Tyr Ala Ile His Ala Glu Thr Ala LeuThr Lys Tyr Tyr Met Gln Arg Tyr Ala Ile His Ala Glu Thr Ala Leu

485 490 495485 490 495

Ile Leu Cys Asn Ala Pro Ile Ser Gln Arg Ser Tyr Asp Asn Gln ProIle Leu Cys Asn Ala Pro Ile Ser Gln Arg Ser Tyr Asp Asn Gln Pro

500 505 510500 505 510

Ser Gln Phe Asp Arg Leu Phe Asn Thr Pro Leu Leu Asn Gly Gln TyrSer Gln Phe Asp Arg Leu Phe Asn Thr Pro Leu Leu Asn Gly Gln Tyr

515 520 525515 520 525

Phe Ser Thr Gly Asp Glu Glu Ile Asp Leu Asn Ser Gly Ser Thr GlyPhe Ser Thr Gly Asp Glu Glu Ile Asp Leu Asn Ser Gly Ser Thr Gly

530 535 540530 535 540

Asp Trp Arg Lys Thr Ile Leu Lys Arg Ala Phe Asn Ile Asp Asp ValAsp Trp Arg Lys Thr Ile Leu Lys Arg Ala Phe Asn Ile Asp Asp Val

545 550 555 560545 550 555 560

Ser Leu Phe Arg Leu Leu Lys Ile Thr Asp His Asp Asn Lys Asp GlySer Leu Phe Arg Leu Leu Lys Ile Thr Asp His Asp Asn Lys Asp Gly

565 570 575565 570 575

Lys Ile Lys Asn Asn Leu Lys Asn Leu Ser Asn Leu Tyr Ile Gly LysLys Ile Lys Asn Asn Leu Lys Asn Leu Ser Asn Leu Tyr Ile Gly Lys

580 585 590580 585 590

Leu Leu Ala Asp Ile His Gln Leu Thr Ile Asp Glu Leu Asp Leu LeuLeu Leu Ala Asp Ile His Gln Leu Thr Ile Asp Glu Leu Asp Leu Leu

595 600 605595 600 605

Leu Ile Ala Val Gly Glu Gly Lys Thr Asn Leu Ser Ala Ile Ser AspLeu Ile Ala Val Gly Glu Gly Lys Thr Asn Leu Ser Ala Ile Ser Asp

610 615 620610 615 620

Lys Gln Leu Ala Thr Leu Ile Arg Lys Leu Asn Thr Ile Thr Ser TrpLys Gln Leu Ala Thr Leu Ile Arg Lys Leu Asn Thr Ile Thr Ser Trp

625 630 635 640625 630 635 640

Leu His Thr Gln Lys Trp Ser Val Phe Gln Leu Phe Ile Met Thr SerLeu His Thr Gln Lys Trp Ser Val Phe Gln Leu Phe Ile Met Thr Ser

645 650 655645 650 655

Thr Ser Tyr Asn Lys Thr Leu Thr Pro Glu Ile Lys Asn Leu Leu AspThr Ser Tyr Asn Lys Thr Leu Thr Pro Glu Ile Lys Asn Leu Leu Asp

660 665 670660 665 670

Thr Val Tyr His Gly Leu Gln Gly Phe Asp Lys Asp Lys Ala Asp LeuThr Val Tyr His Gly Leu Gln Gly Phe Asp Lys Asp Lys Ala Asp Leu

675 680 685675 680 685

Leu His Val Met Ala Pro Tyr Ile Ala Ala Thr Leu Gln Leu Ser SerLeu His Val Met Ala Pro Tyr Ile Ala Ala Thr Leu Gln Leu Ser Ser

690 695 700690 695 700

Glu Asn Val Ala His Ser Val Leu Leu Trp Ala Asp Lys Leu Gln ProGlu Asn Val Ala His Ser Val Leu Leu Trp Ala Asp Lys Leu Gln Pro

705 710 715 720705 710 715 720

Gly Asp Gly Ala Met Thr Ala Glu Lys Phe Trp Asp Trp Leu Asn ThrGly Asp Gly Ala Met Thr Ala Glu Lys Phe Trp Asp Trp Leu Asn Thr

725 730 735725 730 735

Lys Tyr Thr Pro Gly Ser Ser Glu Ala Val Glu Thr Gln Glu His IleLys Tyr Thr Pro Gly Ser Ser Glu Ala Val Glu Thr Gln Glu His Ile

740 745 750740 745 750

Val Gln Tyr Cys Gln Ala Leu Ala Gln Leu Glu Met Val Tyr His SerVal Gln Tyr Cys Gln Ala Leu Ala Gln Leu Glu Met Val Tyr His Ser

755 760 765755 760 765

Thr Gly Ile Asn Glu Asn Ala Phe Arg Leu Phe Val Thr Lys Pro GluThr Gly Ile Asn Glu Asn Ala Phe Arg Leu Phe Val Thr Lys Pro Glu

770 775 780770 775 780

Met Phe Gly Ala Ala Thr Gly Ala Ala Pro Ala His Asp Ala Leu SerMet Phe Gly Ala Ala Thr Gly Ala Ala Pro Ala His Asp Ala Leu Ser

785 790 795 800785 790 795 800

Leu Ile Met Leu Thr Arg Phe Ala Asp Trp Val Asn Ala Leu Gly GluLeu Ile Met Leu Thr Arg Phe Ala Asp Trp Val Asn Ala Leu Gly Glu

805 810 815805 810 815

Lys Ala Ser Ser Val Leu Ala Ala Phe Glu Ala Asn Ser Leu Thr AlaLys Ala Ser Ser Val Leu Ala Ala Phe Glu Ala Asn Ser Leu Thr Ala

820 825 830820 825 830

Glu Gln Leu Ala Asp Ala Met Asn Leu Asp Ala Asn Leu Leu Leu GlnGlu Gln Leu Ala Asp Ala Met Asn Leu Asp Ala Asn Leu Leu Leu Gln

835 840 845835 840 845

Ala Ser Ile Gln Ala Gln Asn His Gln His Leu Pro Pro Val Thr ProAla Ser Ile Gln Ala Gln Asn His Gln His Leu Pro Pro Val Thr Pro

850 855 860850 855 860

Glu Asn Ala Phe Ser Cys Trp Thr Ser Ile Asn Thr Ile Leu Gln TrpGlu Asn Ala Phe Ser Cys Trp Thr Ser Ile Asn Thr Ile Leu Gln Trp

865 870 875 880865 870 875 880

Val Asn Val Ala Gln Gln Leu Asn Val Ala Pro Gln Gly Val Ser AlaVal Asn Val Ala Gln Gln Leu Asn Val Ala Pro Gln Gly Val Ser Ala

885 890 895885 890 895

Leu Val Gly Leu Asp Tyr Ile Gln Ser Met Lys Glu Thr Pro Thr TyrLeu Val Gly Leu Asp Tyr Ile Gln Ser Met Lys Glu Thr Pro Thr Tyr

900 905 910900 905 910

Ala Gln Trp Glu Asn Ala Ala Gly Val Leu Thr Ala Gly Leu Asn SerAla Gln Trp Glu Asn Ala Ala Gly Val Leu Thr Ala Gly Leu Asn Ser

915 920 925915 920 925

Gln Gln Ala Asn Thr Leu His Ala Phe Leu Asp Glu Ser Arg Ser AlaGln Gln Ala Asn Thr Leu His Ala Phe Leu Asp Glu Ser Arg Ser Ala

930 935 940930 935 940

Ala Leu Ser Thr Tyr Tyr Ile Arg Gln Val Ala Lys Ala Ala Ala AlaAla Leu Ser Thr Tyr Tyr Ile Arg Gln Val Ala Lys Ala Ala Ala Ala

945 950 955 960945 950 955 960

Ile Lys Ser Arg Asp Asp Leu Tyr Gln Tyr Leu Leu Ile Asp Asn GlnIle Lys Ser Arg Asp Asp Leu Tyr Gln Tyr Leu Leu Ile Asp Asn Gln

965 970 975965 970 975

Val Ser Ala Ala Ile Lys Thr Thr Arg Ile Ala Glu Ala Ile Ala SerVal Ser Ala Ala Ile Lys Thr Thr Arg Ile Ala Glu Ala Ile Ala Ser

980 985 990980 985 990

Ile Gln Leu Tyr Val Asn Arg Ala Leu Glu Asn Val Glu Glu Asn AlaIle Gln Leu Tyr Val Asn Arg Ala Leu Glu Asn Val Glu Glu Asn Ala

995 1000 1005995 1000 1005

Asn Ser Gly Val Ile Ser Arg Gln Phe Phe Ile Asp Trp Asp Lys TyrAsn Ser Gly Val Ile Ser Arg Gln Phe Phe Ile Asp Trp Asp Lys Tyr

1010 1015 10201010 1015 1020

Asn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Gln Leu Val Tyr TyrAsn Lys Arg Tyr Ser Thr Trp Ala Gly Val Ser Gln Leu Val Tyr Tyr

1025 1030 1035 10401025 1030 1035 1040

Pro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile Gly Gln Thr Lys MetPro Glu Asn Tyr Ile Asp Pro Thr Met Arg Ile Gly Gln Thr Lys Met

1045 1050 10551045 1050 1055

Met Asp Ala Leu Leu Gln Ser Val Ser Gln Ser Gln Leu Asn Ala AspMet Asp Ala Leu Leu Gln Ser Val Ser Gln Ser Gln Leu Asn Ala Asp

1060 1065 10701060 1065 1070

Thr Val Glu Asp Ala Phe Met Ser Tyr Leu Thr Ser Phe Glu Gln ValThr Val Glu Asp Ala Phe Met Ser Tyr Leu Thr Ser Phe Glu Gln Val

1075 1080 10851075 1080 1085

Ala Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Ile Asn Asn AspAla Asn Leu Lys Val Ile Ser Ala Tyr His Asp Asn Ile Asn Asn Asp

1090 1095 11001090 1095 1100

Gln Gly Leu Thr Tyr Phe Ile Gly Leu Ser Glu Thr Asp Ala Gly GluGln Gly Leu Thr Tyr Phe Ile Gly Leu Ser Glu Thr Asp Ala Gly Glu

1105 1110 1115 11201105 1110 1115 1120

Tyr Tyr Trp Arg Ser Val Asp His Ser Lys Phe Asn Asp Gly Lys PheTyr Tyr Trp Arg Ser Val Asp His Ser Lys Phe Asn Asp Gly Lys Phe

1125 1130 11351125 1130 1135

Ala Ala Asn Ala Trp Ser Glu Trp His Lys Ile Asp Cys Pro Ile AsnAla Ala Asn Ala Trp Ser Glu Trp His Lys Ile Asp Cys Pro Ile Asn

1140 1145 11501140 1145 1150

Pro Tyr Lys Ser Thr Ile Arg Pro Val Ile Tyr Lys Ser Arg Leu TyrPro Tyr Lys Ser Thr Ile Arg Pro Val Ile Tyr Lys Ser Arg Leu Tyr

1155 1160 11651155 1160 1165

Leu Leu Trp Leu Glu Gln Lys Glu Ile Thr Lys Gln Thr Gly Asn SerLeu Leu Trp Leu Glu Gln Lys Glu Ile Thr Lys Gln Thr Gly Asn Ser

1170 1175 11801170 1175 1180

Lys Asp Gly Tyr Gln Thr Glu Thr Asp Tyr Arg Tyr Glu Leu Lys LeuLys Asp Gly Tyr Gln Thr Glu Thr Asp Tyr Arg Tyr Glu Leu Lys Leu

1185 1190 1195 12001185 1190 1195 1200

Ala His Ile Arg Tyr Asp Gly Thr Trp Asn Thr Pro Ile Thr Phe AspAla His Ile Arg Tyr Asp Gly Thr Trp Asn Thr Pro Ile Thr Phe Asp

1205 1210 12151205 1210 1215

Val Asn Lys Lys Ile Ser Glu Leu Lys Leu Glu Lys Asn Arg Ala ProVal Asn Lys Lys Ile Ser Glu Leu Lys Leu Glu Lys Asn Arg Ala Pro

1220 1225 12301220 1225 1230

Gly Leu Tyr Cys Ala Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val MetGly Leu Tyr Cys Ala Gly Tyr Gln Gly Glu Asp Thr Leu Leu Val Met

1235 1240 12451235 1240 1245

Phe Tyr Asn Gln Gln Asp Thr Leu Asp Ser Tyr Lys Asn Ala Ser MetPhe Tyr Asn Gln Gln Asp Thr Leu Asp Ser Tyr Lys Asn Ala Ser Met

1250 1255 12601250 1255 1260

Gln Gly Leu Tyr Ile Phe Ala Asp Met Ala Ser Lys Asp Met Thr ProGln Gly Leu Tyr Ile Phe Ala Asp Met Ala Ser Lys Asp Met Thr Pro

1265 1270 1275 12801265 1270 1275 1280

Glu Gln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Gln Gln Phe Asp ThrGlu Gln Ser Asn Val Tyr Arg Asp Asn Ser Tyr Gln Gln Phe Asp Thr

1285 1290 12951285 1290 1295

Asn Asn Val Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr Glu IleAsn Asn Val Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr Glu Ile

1300 1305 13101300 1305 1310

Pro Ser Ser Val Ser Ser Arg Lys Asp Tyr Gly Trp Gly Asp Tyr TyrPro Ser Ser Val Ser Ser Arg Lys Asp Tyr Gly Trp Gly Asp Tyr Tyr

1315 1320 13251315 1320 1325

Leu Ser Met Val Tyr Asn Gly Asp Ile Pro Thr Ile Asn Tyr Lys AlaLeu Ser Met Val Tyr Asn Gly Asp Ile Pro Thr Ile Asn Tyr Lys Ala

1330 1335 13401330 1335 1340

Ala Ser Ser Asp Leu Lys Ile Tyr Ile Ser Pro Lys Leu Arg Ile IleAla Ser Ser Asp Leu Lys Ile Tyr Ile Ser Pro Lys Leu Arg Ile Ile

1345 1350 1355 13601345 1350 1355 1360

His Asn Gly Tyr Glu Gly Gln Lys Arg Asn Gln Cys Asn Leu Met AsnHis Asn Gly Tyr Glu Gly Gln Lys Arg Asn Gln Cys Asn Leu Met Asn

1365 1370 13751365 1370 1375

Lys Tyr Gly Lys Leu Gly Asp Lys Phe Ile Val Tyr Thr Ser Leu GlyLys Tyr Gly Lys Leu Gly Asp Lys Phe Ile Val Tyr Thr Ser Leu Gly

1380 1385 13901380 1385 1390

Val Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val TyrVal Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val Tyr

1395 1400 14051395 1400 1405

Gln Tyr Ser Gly Asn Thr Ser Gly Leu Asn Gln Gly Arg Leu Leu PheGln Tyr Ser Gly Asn Thr Ser Gly Leu Asn Gln Gly Arg Leu Leu Phe

1410 1415 14201410 1415 1420

His Arg Asp Thr Thr Tyr Pro Ser Lys Val Glu Ala Trp Ile Pro GlyHis Arg Asp Thr Thr Tyr Pro Ser Lys Val Glu Ala Trp Ile Pro Gly

1425 1430 1435 14401425 1430 1435 1440

Ala Lys Arg Ser Leu Thr Asn Gln Asn Ala Ala Ile Gly Asp Asp TyrAla Lys Arg Ser Leu Thr Asn Gln Asn Ala Ala Ile Gly Asp Asp Tyr

1445 1450 14551445 1450 1455

Ala Thr Asp Ser Leu Asn Lys Pro Asp Asp Leu Lys Gln Tyr Ile PheAla Thr Asp Ser Leu Asn Lys Pro Asp Asp Leu Lys Gln Tyr Ile Phe

1460 1465 14701460 1465 1470

Met Thr Asp Ser Lys Gly Thr Ala Thr Asp Val Ser Gly Pro Val GluMet Thr Asp Ser Lys Gly Thr Ala Thr Asp Val Ser Gly Pro Val Glu

1475 1480 14851475 1480 1485

Ile Asn Thr Ala Ile Ser Pro Ala Lys Val Gln Ile Ile Val Lys AlaIle Asn Thr Ala Ile Ser Pro Ala Lys Val Gln Ile Ile Val Lys Ala

1490 1495 15001490 1495 1500

Gly Gly Lys Glu Gln Thr Phe Thr Ala Asp Lys Asp Val Ser Ile GlnGly Gly Lys Glu Gln Thr Phe Thr Ala Asp Lys Asp Val Ser Ile Gln

1505 1510 1515 15201505 1510 1515 1520

Pro Ser Pro Ser Phe Asp Glu Met Asn Tyr Gln Phe Asn Ala Leu GluPro Ser Pro Ser Phe Asp Glu Met Asn Tyr Gln Phe Asn Ala Leu Glu

1525 1530 15351525 1530 1535

Ile Asp Gly Ser Gly Leu Asn Phe Ile Asn Asn Ser Ala Ser Ile AspIle Asp Gly Ser Gly Leu Asn Phe Ile Asn Asn Ser Ala Ser Ile Asp

1540 1545 15501540 1545 1550

Val Thr Phe Thr Ala Phe Ala Glu Asp Gly Arg Lys Leu Gly Tyr GluVal Thr Phe Thr Ala Phe Ala Glu Asp Gly Arg Lys Leu Gly Tyr Glu

1555 1560 15651555 1560 1565

Ser Phe Ser Ile Pro Val Thr Leu Lys Val Ser Thr Asp Asn Ala LeuSer Phe Ser Ile Pro Val Thr Leu Lys Val Ser Thr Asp Asn Ala Leu

1570 1575 15801570 1575 1580

Thr Leu His His Asn Glu Asn Gly Ala Gln Tyr Met Gln Trp Gln SerThr Leu His His Asn Glu Asn Gly Ala Gln Tyr Met Gln Trp Gln Ser

1585 1590 1595 16001585 1590 1595 1600

Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Arg Gln Leu Val Ala ArgTyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Arg Gln Leu Val Ala Arg

1605 1610 16151605 1610 1615

Ala Thr Thr Gly Ile Asp Thr Ile Leu Ser Met Glu Thr Gln Asn IleAla Thr Thr Gly Ile Asp Thr Ile Leu Ser Met Glu Thr Gln Asn Ile

1620 1625 16301620 1625 1630

Gln Glu Pro Gln Leu Gly Lys Gly Phe Tyr Ala Thr Phe Val Ile ProGln Glu Pro Gln Leu Gly Lys Gly Phe Tyr Ala Thr Phe Val Ile Pro

1635 1640 16451635 1640 1645

Pro Tyr Asn Leu Ser Thr His Gly Asp Glu Arg Trp Phe Lys Leu TyrPro Tyr Asn Leu Ser Thr His Gly Asp Glu Arg Trp Phe Lys Leu Tyr

1650 1655 16601650 1655 1660

Ile Lys His Val Val Asp Asn Asn Ser His Ile Ile Tyr Ser Gly GlnIle Lys His Val Val Asp Asn Asn Ser His Ile Ile Tyr Ser Gly Gln

1665 1670 1675 16801665 1670 1675 1680

Leu Thr Asp Thr Asn Ile Asn Ile Thr Leu Phe Ile Pro Leu Asp AspLeu Thr Asp Thr Asn Ile Asn Ile Thr Leu Phe Ile Pro Leu Asp Asp

1685 1690 16951685 1690 1695

Val Pro Leu Asn Gln Asp Tyr His Ala Lys Val Tyr Met Thr Phe LysVal Pro Leu Asn Gln Asp Tyr His Ala Lys Val Tyr Met Thr Phe Lys

1700 1705 17101700 1705 1710

Lys Ser Pro Ser Asp Gly Thr Trp Trp Gly Pro His Phe Val Arg AspLys Ser Pro Ser Asp Gly Thr Trp Trp Gly Pro His Phe Val Arg Asp

1715 1720 17251715 1720 1725

Asp Lys Gly Ile Val Thr Ile Asn Pro Lys Ser Ile Leu Thr His PheAsp Lys Gly Ile Val Thr Ile Asn Pro Lys Ser Ile Leu Thr His Phe

1730 1735 17401730 1735 1740

Glu Ser Val Asn Val Leu Asn Asn Ile Ser Ser Glu Pro Met Asp PheGlu Ser Val Asn Val Leu Asn Asn Ile Ser Ser Glu Pro Met Asp Phe

1745 1750 1755 17601745 1750 1755 1760

Ser Gly Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr ProSer Gly Ala Asn Ser Leu Tyr Phe Trp Glu Leu Phe Tyr Tyr Thr Pro

1765 1770 17751765 1770 1775

Met Leu Val Ala Gln Arg Leu Leu His Glu Gln Asn Phe Asp Glu AlaMet Leu Val Ala Gln Arg Leu Leu His Glu Gln Asn Phe Asp Glu Ala

1780 1785 17901780 1785 1790

Asn Arg Trp Leu Lys Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val HisAsn Arg Trp Leu Lys Tyr Val Trp Ser Pro Ser Gly Tyr Ile Val His

1795 1800 18051795 1800 1805

Gly Gln Ile Gln Asn Tyr Gln Trp Asn Val Arg Pro Leu Leu Glu AspGly Gln Ile Gln Asn Tyr Gln Trp Asn Val Arg Pro Leu Leu Glu Asp

1810 1815 18201810 1815 1820

Thr Ser Trp Asn Ser Asp Pro Leu Asp Ser Val Asp Pro Asp Ala ValThr Ser Trp Asn Ser Asp Pro Leu Asp Ser Val Asp Pro Asp Ala Val

1825 1830 1835 18401825 1830 1835 1840

Ala Gln His Asp Pro Met His Tyr Lys Val Ser Thr Phe Met Arg ThrAla Gln His Asp Pro Met His Tyr Lys Val Ser Thr Phe Met Arg Thr

1845 1850 18551845 1850 1855

Leu Asp Leu Leu Ile Ala Arg Gly Asp His Ala Tyr Arg Gln Leu GluLeu Asp Leu Leu Ile Ala Arg Gly Asp His Ala Tyr Arg Gln Leu Glu

1860 1865 18701860 1865 1870

Arg Asp Thr Leu Asn Glu Ala Lys Met Trp Tyr Met Gln Ala Leu HisArg Asp Thr Leu Asn Glu Ala Lys Met Trp Tyr Met Gln Ala Leu His

1875 1880 18851875 1880 1885

Leu Leu Gly Asp Lys Pro Tyr Leu Pro Leu Ser Thr Thr Trp Ser AspLeu Leu Gly Asp Lys Pro Tyr Leu Pro Leu Ser Thr Thr Trp Ser Asp

1890 1895 19001890 1895 1900

Pro Arg Leu Asp Arg Ala Ala Asp Ile Thr Thr Gln Asn Ala His AspPro Arg Leu Asp Arg Ala Ala Asp Ile Thr Thr Gln Asn Ala His Asp

1905 1910 1915 19201905 1910 1915 1920

Ser Ala Ile Val Ala Leu Arg Gln Asn Ile Pro Thr Pro Ala Pro LeuSer Ala Ile Val Ala Leu Arg Gln Asn Ile Pro Thr Pro Ala Pro Leu

1925 1930 19351925 1930 1935

Ser Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln IleSer Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile

1940 1945 19501940 1945 1950

Asn Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val TyrAsn Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr

1955 1960 19651955 1960 1965

Asn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu ProAsn Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro

1970 1975 19801970 1975 1980

Ile Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala ValIle Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val

1985 1990 1995 20001985 1990 1995 2000

Ala Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser LeuAla Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu

2005 2010 20152005 2010 2015

Trp Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser GlnTrp Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln

2020 2025 20302020 2025 2030

Leu Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Ile Glu Arg Gln AspLeu Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Glu Arg Gln Asp

2035 2040 20452035 2040 2045

Ala Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu IleAla Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile

2050 2055 20602050 2055 2060

Leu Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp AlaLeu Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala

2065 2070 2075 20802065 2070 2075 2080

Glu Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg PheGlu Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe

2085 2090 20952085 2090 2095

Asp Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu AsnAsp Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn

2100 2105 21102100 2105 2110

Gln Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala ValGln Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val

2115 2120 21252115 2120 2125

Gln Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn IleGln Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile

2130 2135 21402130 2135 2140

Phe Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu AlaPhe Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala

2145 2150 2155 21602145 2150 2155 2160

Thr Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu AlaThr Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala

2165 2170 21752165 2170 2175

Asp Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu TrpAsp Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp

2180 2185 21902180 2185 2190

Glu Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp AlaGlu Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala

2195 2200 22052195 2200 2205

Gln Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln LysGln Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys

2210 2215 22202210 2215 2220

Thr Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala PheThr Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe

2225 2230 2235 22402225 2230 2235 2240

Leu Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg GlyLeu Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly

2245 2250 22552245 2250 2255

Arg Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala ArgArg Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg

2260 2265 22702260 2265 2270

Cys Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp SerCys Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser

2275 2280 22852275 2280 2285

Ala Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly LeuAla Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu

2290 2295 23002290 2295 2300

Leu Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp AlaLeu Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala

2305 2310 2315 23202305 2310 2315 2320

His Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val SerHis Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser

2325 2330 23352325 2330 2335

Leu Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe SerLeu Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser

2340 2345 23502340 2345 2350

Leu Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser AlaLeu Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala

2355 2360 23652355 2360 2365

Gly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr LysGly Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys

2370 2375 23802370 2375 2380

Thr Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg GluThr Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu

2385 2390 2395 24002385 2390 2395 2400

Asp Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile SerAsp Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser

2405 2410 24152405 2410 2415

Val Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala IleVal Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile

2420 2425 24302420 2425 2430

Leu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala LeuLeu Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu

2435 2440 24452435 2440 2445

Ala Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp PheAla Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe

2450 2455 24602450 2455 2460

Asn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln GlyAsn Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly

2465 2470 2475 24802465 2470 2475 2480

Thr Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly LysThr Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys

2485 2490 24952485 2490 2495

Gln Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile ArgGln Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg

2500 2505 25102500 2505 2510

Tyr Thr Ile LysTyr Thr Ile Lys

25162516

(2) INFORMATION FOR SEQ ID NO:48:(2) INFORMATION FOR SEQ ID NO: 48:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 5547 base pairs(A) LENGTH: 5547 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:48 (tcdAii coding(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 48 (tcdAii coding

region):region):

CTG ATA GGC TAT AAC AAT CAA TTT AGC GGT AGA GCC AGT CAA TAT GTT 48CTG ATA GGC TAT AAC AAT CAA TTT AGC GGT AGA GCC AGT CAA TAT GTT 48

Leu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Arg Ala Ser Gln Tyr ValLeu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Arg Ala Ser Gln Tyr Val

1 5 10 151 5 10 15

GCG CCG GGT ACC GTT TCT TCC ATG TTC TCC CCC GCC GCT TAT TTG ACT 96GCG CCG GGT ACC GTT TCT TCC ATG TTC TCC CCC GCC GCT TAT TTG ACT 96

Ala Pro Gly Thr Val Ser Ser Met Phe Ser Pro Ala Ala Tyr Leu ThrAla Pro Gly Thr Val Ser Ser Met Phe Ser Pro Ala Ala Tyr Leu Thr

20 25 3020 25 30

GAA CTT TAT CGT GAA GCA CGC AAT TTA CAC GCA AGT GAC TCC GTT TAT 144GAA CTT TAT CGT GAA GCA CGC AAT TTA CAC GCA AGT GAC TCC GTT TAT 144

Glu Leu Tyr Arg Glu Ala Arg Asn Leu His Ala Ser Asp Ser Val TyrGlu Leu Tyr Arg Glu Ala Arg Asn Leu His Ala Ser Asp Ser Val Tyr

35 40 4535 40 45

TAT CTG GAT ACC CGC CGC CCA GAT CTC AAA TCA ATG GCG CTC AGT CAG 192TAT CTG GAT ACC CGC CGC CCA GAT CTC AAA TCA ATG GCG CTC AGT CAG 192

Tyr Leu Asp Thr Arg Arg Pro Asp Leu Lys Ser Met Ala Leu Ser GlnTyr Leu Asp Thr Arg Arg Pro Asp Leu Lys Ser Met Ala Leu Ser Gln

50 55 6050 55 60

CAA AAT ATG GAT ATA GAA TTA TCC ACA CTC TCT TTG TCC AAT GAG CTG 240CAA AAT ATG GAT ATA GAA TTA TCC ACA CTC TCT TTG TCC AAT GAG CTG 240

Gln Asn Met Asp Ile Glu Leu Ser Thr Leu Ser Leu Ser Asn Glu LeuGln Asn Met Asp Ile Glu Leu Ser Thr Leu Ser Leu Ser Asn Glu Leu

65 70 75 8065 70 75 80

TTA TTG GAA AGC ATT AAA ACT GAA TCT AAA CTG GAA AAC TAT ACT AAA 288TTA TTG GAA AGC ATT AAA ACT GAA TCT AAA CTG GAA AAC TAT ACT AAA 288

Leu Leu Glu Ser Ile Lys Thr Glu Ser Lys Leu Glu Asn Tyr Thr LysLeu Leu Glu Ser Ile Lys Thr Glu Ser Lys Leu Glu Asn Tyr Thr Lys

85 90 9585 90 95

GTG ATG GAA ATG CTC TCC ACT TTC CGT CCT TCC GGC GCA ACG CCT TAT 336GTG ATG GAA ATG CTC TCC ACT TTC CGT CCT TCC GGC GCA ACG CCT TAT 336

Val Met Glu Met Leu Ser Thr Phe Arg Pro Ser Gly Ala Thr Pro TyrVal Met Glu Met Leu Ser Thr Phe Arg Pro Ser Gly Ala Thr Pro Tyr

100 105 110100 105 110

CAT GAT GCT TAT GAA AAT GTG CGT GAA GTT ATC CAG CTA CAA GAT CCT 384CAT GAT GCT TAT GAA AAT GTG CGT GAA GTT ATC CAG CTA CAA GAT CCT 384

His Asp Ala Tyr Glu Asn Val Arg Glu Val Ile Gln Leu Gln Asp ProHis Asp Ala Tyr Glu Asn Val Arg Glu Val Ile Gln Leu Gln Asp Pro

115 120 125115 120 125

GGA CTT GAG CAA CTC AAT GCA TCA CCG GCA ATT GCC GGG TTG ATG CAT 432GGA CTT GAG CAA CTC AAT GCA TCA CCG GCA ATT GCC GGG TTG ATG CAT 432

Gly Leu Glu Gln Leu Asn Ala Ser Pro Ala Ile Ala Gly Leu Met HisGly Leu Glu Gln Leu Asn Ala Ser Pro Ala Ile Ala Gly Leu Met His

130 135 140130 135 140

CAA GCC TCC CTA TTG GGT ATT AAC GCT TCA ATC TCG CCT GAG CTA TTT 480CAA GCC TCC CTA TTG GGT ATT AAC GCT TCA ATC TCG CCT GAG CTA TTT 480

Gln Ala Ser Leu Leu Gly Ile Asn Ala Ser Ile Ser Pro Glu Leu PheGln Ala Ser Leu Leu Gly Ile Asn Ala Ser Ile Ser Pro Glu Leu Phe

145 150 155 160145 150 155 160

AAT ATT CTG ACG GAG GAG ATT ACC GAA GGT AAT GCT GAG GAA CTT TAT 528AAT ATT CTG ACG GAG GAG ATT ACC GAA GGT AAT GCT GAG GAA CTT TAT 528

Asn Ile Leu Thr Glu Glu Ile Thr Glu Gly Asn Ala Glu Glu Leu TyrAsn Ile Leu Thr Glu Glu Ile Thr Glu Gly Asn Ala Glu Glu Leu Tyr

165 170 175165 170 175

AAG AAA AAT TTT GGT AAT ATC GAA CCG GCC TCA TTG GCT ATG CCG GAA 576AAG AAA AAT TTT GGT AAT ATC GAA CCG GCC TCA TTG GCT ATG CCG GAA 576

Lys Lys Asn Phe Gly Asn Ile Glu Pro Ala Ser Leu Ala Met Pro GluLys Lys Asn Phe Gly Asn Ile Glu Pro Ala Ser Leu Ala Met Pro Glu

180 185 190180 185 190

TAC CTT AAA CGT TAT TAT AAT TTA AGC GAT GAA GAA CTT AGT CAG TTT 624TAC CTT AAA CGT TAT TAT AAT TTA AGC GAT GAA GAA CTT AGT CAG TTT 624

Tyr Leu Lys Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln PheTyr Leu Lys Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln Phe

195 200 205195 200 205

ATT GGT AAA GCC AGC AAT TTT GGT CAA CAG GAA TAT AGT AAT AAC CAA 672ATT GGT AAA GCC AGC AAT TTT GGT CAA CAG GAA TAT AGT AAT AAC CAA 672

Ile Gly Lys Ala Ser Asn Phe Gly Gln Gln Glu Tyr Ser Asn Asn GlnIle Gly Lys Ala Ser Asn Phe Gly Gln Gln Glu Tyr Ser Asn Asn Gln

210 215 220210 215 220

CTT ATT ACT CCG GTA GTC AAC AGC AGT GAT GGC ACG GTT AAG GTA TAT 720CTT ATT ACT CCG GTA GTC AAC AGC AGT GAT GGC ACG GTT AAG GTA TAT 720

Leu Ile Thr Pro Val Val Asn Ser Ser Asp Gly Thr Val Lys Val TyrLeu Ile Thr Pro Val Val Asn Ser Ser Asp Gly Thr Val Lys Val Tyr

225 230 235 240225 230 235 240

CGG ATC ACC CGC GAA TAT ACA ACC AAT GCT TAT CAA ATG GAT GTG GAG 768CGG ATC ACC CGC GAA TAT ACA ACC AAT GCT TAT CAA ATG GAT GTG GAG 768

Arg Ile Thr Arg Glu Tyr Thr Thr Asn Ala Tyr Gln Met Asp Val GluArg Ile Thr Arg Glu Tyr Thr Thr Asn Ala Tyr Gln Met Asp Val Glu

245 250 255245 250 255

CTA TTT CCC TTC GGT GGT GAG AAT TAT CGG TTA GAT TAT AAA TTC AAA 816CTA TTT CCC TTC GGT GGT GAG AAT TAT CGG TTA GAT TAT AAA TTC AAA 816

Leu Phe Pro Phe Gly Gly Glu Asn Tyr Arg Leu Asp Tyr Lys Phe LysLeu Phe Pro Phe Gly Gly Glu Asn Tyr Arg Leu Asp Tyr Lys Phe Lys

260 265 270260 265 270

AAT TTT TAT AAT GCC TCT TAT TTA TCC ATC AAG TTA AAT GAT AAA AGA 864AAT TTT TAT AAT GCC TCT TAT TTA TCC ATC AAG TTA AAT GAT AAA AGA 864

Asn Phe Tyr Asn Ala Ser Tyr Leu Ser Ile Lys Leu Asn Asp Lys ArgAsn Phe Tyr Asn Ala Ser Tyr Leu Ser Ile Lys Leu Asn Asp Lys Arg

275 280 285275 280 285

GAA CTT GTT CGA ACT GAA GGC GCT CCT CAA GTC AAT ATA GAA TAC TCC 912GAA CTT GTT CGA ACT GAA GGC GCT CCT CAA GTC AAT ATA GAA TAC TCC 912

Glu Leu Val Arg Thr Glu Gly Ala Pro Gln Val Asn Ile Glu Tyr SerGlu Leu Val Arg Thr Glu Gly Ala Pro Gln Val Asn Ile Glu Tyr Ser

290 295 300290 295 300

GCA AAT ATC ACA TTA AAT ACC GCT GAT ATC AGT CAA CCT TTT GAA ATT 960GCA AAT ATC ACA TTA AAT ACC GCT GAT ATC AGT CAA CCT TTT GAA ATT 960

Ala Asn Ile Thr Leu Asn Thr Ala Asp Ile Ser Gln Pro Phe Glu IleAla Asn Ile Thr Leu Asn Thr Ala Asp Ile Ser Gln Pro Phe Glu Ile

305 310 315 320305 310 315 320

GGC CTG ACA CGA GTA CTT CCT TCC GGT TCT TGG GCA TAT GCC GCC GCA 1008GGC CTG ACA CGA GTA CTT CCT TCC GGT TCT TGG GCA TAT GCC GCC GCA 1008

Gly Leu Thr Arg Val Leu Pro Ser Gly Ser Trp Ala Tyr Ala Ala AlaGly Leu Thr Arg Val Leu Pro Ser Gly Ser Trp Ala Tyr Ala Ala Ala

325 330 335325 330 335

AAA TTT ACC GTT GAA GAG TAT AAC CAA TAC TCT TTT CTG CTA AAA CTT 1056AAA TTT ACC GTT GAA GAG TAT AAC CAA TAC TCT TTT CTG CTA AAA CTT 1056

Lys Phe Thr Val Glu Glu Tyr Asn Gln Tyr Ser Phe Leu Leu Lys LeuLys Phe Thr Val Glu Glu Tyr Asn Gln Tyr Ser Phe Leu Leu Lys Leu

340 345 350340 345 350

AAC AAG GCT ATT CGT CTA TCA CGT GCG ACA GAA TTG TCA CCC ACG ATT 1104AAC AAG GCT ATT CGT CTA TCA CGT GCG ACA GAA TTG TCA CCC ACG ATT 1104

Asn Lys Ala Ile Arg Leu Ser Arg Ala Thr Glu Leu Ser Pro Thr IleAsn Lys Ala Ile Arg Leu Ser Arg Ala Thr Glu Leu Ser Pro Thr Ile

355 360 365355 360 365

CTG GAA GGC ATT GTG CGC AGT GTT AAT CTA CAA CTG GAT ATC AAC ACA 1152CTG GAA GGC ATT GTG CGC AGT GTT AAT CTA CAA CTG GAT ATC AAC ACA 1152

Leu Glu Gly Ile Val Arg Ser Val Asn Leu Gln Leu Asp Ile Asn ThrLeu Glu Gly Ile Val Arg Ser Val Asn Leu Gln Leu Asp Ile Asn Thr

370 375 380370 375 380

GAC GTA TTA GGT AAA GTT TTT CTG ACT AAA TAT TAT ATG CAG CGT TAT 1200GAC GTA TTA GGT AAA GTT TTT CTG ACT AAA TAT TAT ATG CAG CGT TAT 1200

Asp Val Leu Gly Lys Val Phe Leu Thr Lys Tyr Tyr Met Gln Arg TyrAsp Val Leu Gly Lys Val Phe Leu Thr Lys Tyr Tyr Met Gln Arg Tyr

385 390 395 400385 390 395 400

GCT ATT CAT GCT GAA ACT GCC CTG ATA CTA TGC AAC GCG CCT ATT TCA 1248GCT ATT CAT GCT GAA ACT GCC CTG ATA CTA TGC AAC GCG CCT ATT TCA 1248

Ala Ile His Ala Glu Thr Ala Leu Ile Leu Cys Asn Ala Pro Ile SerAla Ile His Ala Glu Thr Ala Leu Ile Leu Cys Asn Ala Pro Ile Ser

405 410 415405 410 415

CAA CGT TCA TAT GAT AAT CAA CCT AGC CAA TTT GAT CGC CTG TTT AAT 1296CAA CGT TCA TAT GAT AAT CAA CCT AGC CAA TTT GAT CGC CTG TTT AAT 1296

Gln Arg Ser Tyr Asp Asn Gln Pro Ser Gln Phe Asp Arg Leu Phe AsnGln Arg Ser Tyr Asp Asn Gln Pro Ser Gln Phe Asp Arg Leu Phe Asn

420 425 430420 425 430

ACG CCA TTA CTG AAC GGA CAA TAT TTT TCT ACC GGC GAT GAG GAG ATT 1344ACG CCA TTA CTG AAC GGA CAA TAT TTT TCT ACC GGC GAT GAG GAG ATT 1344

Thr Pro Leu Leu Asn Gly Gln Tyr Phe Ser Thr Gly Asp Glu Glu IleThr Pro Leu Leu Asn Gly Gln Tyr Phe Ser Thr Gly Asp Glu Glu Ile

435 440 445435 440 445

GAT TTA AAT TCA GGT AGC ACC GGC GAT TGG CGA AAA ACC ATA CTT AAG 1392GAT TTA AAT TCA GGT AGC ACC GGC GAT TGG CGA AAA ACC ATA CTT AAG 1392

Asp Leu Asn Ser Gly Ser Thr Gly Asp Trp Arg Lys Thr Ile Leu LysAsp Leu Asn Ser Gly Ser Thr Gly Asp Trp Arg Lys Thr Ile Leu Lys

450 455 460450 455 460

CGT GCA TTT AAT ATT GAT GAT GTC TCG CTC TTC CGC CTG CTT AAA ATT 1440CGT GCA TTT AAT ATT GAT GAT GTC TCG CTC TTC CGC CTG CTT AAA ATT 1440

Arg Ala Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys IleArg Ala Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys Ile

465 470 475 480465 470 475 480

ACC GAC CAT GAT AAT AAA GAT GGA AAA ATT AAA AAT AAC CTA AAG AAT 1488ACC GAC CAT GAT AAT AAA GAT GGA AAA ATT AAA AAT AAC CTA AAG AAT 1488

Thr Asp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys AsnThr Asp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys Asn

485 490 495485 490 495

CTT TCC AAT TTA TAT ATT GGA AAA TTA CTG GCA GAT ATT CAT CAA TTA 1536CTT TCC AAT TTA TAT ATT GGA AAA TTA CTG GCA GAT ATT CAT CAA TTA 1536

Leu Ser Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln LeuLeu Ser Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln Leu

500 505 510500 505 510

ACC ATT GAT GAA CTG GAT TTA TTA CTG ATT GCC GTA GGT GAA GGA AAA 1584ACC ATT GAT GAA CTG GAT TTA TTA CTG ATT GCC GTA GGT GAA GGA AAA 1584

Thr Ile Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly LysThr Ile Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly Lys

515 520 525515 520 525

ACT AAT TTA TCC GCT ATC AGT GAT AAG CAA TTG GCT ACC CTG ATC AGA 1632ACT AAT TTA TCC GCT ATC AGT GAT AAG CAA TTG GCT ACC CTG ATC AGA 1632

Thr Asn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile ArgThr Asn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile Arg

530 535 540530 535 540

AAA CTC AAT ACT ATT ACC AGC TGG CTA CAT ACA CAG AAG TGG AGT GTA 1680AAA CTC AAT ACT ATT ACC AGC TGG CTA CAT ACA CAG AAG TGG AGT GTA 1680

Lys Leu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser ValLys Leu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser Val

545 550 555 560545 550 555 560

TTC CAG CTA TTT ATC ATG ACC TCC ACC AGC TAT AAC AAA ACG CTA ACG 1728TTC CAG CTA TTT ATC ATG ACC TCC ACC AGC TAT AAC AAA ACG CTA ACG 1728

Phe Gln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu ThrPhe Gln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu Thr

565 570 575565 570 575

CCT GAA ATT AAG AAT TTG CTG GAT ACC GTC TAC CAC GGT TTA CAA GGT 1776CCT GAA ATT AAG AAT TTG CTG GAT ACC GTC TAC CAC GGT TTA CAA GGT 1776

Pro Glu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln GlyPro Glu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln Gly

580 585 590580 585 590

TTT GAT AAA GAC AAA GCA GAT TTG CTA CAT GTC ATG GCG CCC TAT ATT 1824TTT GAT AAA GAC AAA GCA GAT TTG CTA CAT GTC ATG GCG CCC TAT ATT 1824

Phe Asp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr IlePhe Asp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr Ile

595 600 605595 600 605

GCG GCC ACC TTG CAA TTA TCA TCG GAA AAT GTC GCC CAC TCG GTA CTC 1872GCG GCC ACC TTG CAA TTA TCA TCG GAA AAT GTC GCC CAC TCG GTA CTC 1872

Ala Ala Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val LeuAla Ala Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val Leu

610 615 620610 615 620

CTT TGG GCA GAT AAG TTA CAG CCC GGC GAC GGC GCA ATG ACA GCA GAA 1920CTT TGG GCA GAT AAG TTA CAG CCC GGC GAC GGC GCA ATG ACA GCA GAA 1920

Leu Trp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala GluLeu Trp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala Glu

625 630 635 640625 630 635 640

AAA TTC TGG GAC TGG TTG AAT ACT AAG TAT ACG CCG GGT TCA TCG GAA 1968AAA TTC TGG GAC TGG TTG AAT ACT AAG TAT ACG CCG GGT TCA TCG GAA 1968

Lys Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser GluLys Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser Glu

645 650 655645 650 655

GCC GTA GAA ACG CAG GAA CAT ATC GTT CAG TAT TGT CAG GCT CTG GCA 2016GCC GTA GAA ACG CAG GAA CAT ATC GTT CAG TAT TGT CAG GCT CTG GCA 2016

Ala Val Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu AlaAla Val Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu Ala

660 665 670660 665 670

CAA TTG GAA ATG GTT TAC CAT TCC ACC GGC ATC AAC GAA AAC GCC TTC 2064CAA TTG GAA ATG GTT TAC CAT TCC ACC GGC ATC AAC GAA AAC GCC TTC 2064

Gln Leu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala PheGln Leu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala Phe

675 680 685675 680 685

CGT CTA TTT GTG ACA AAA CCA GAG ATG TTT GGC GCT GCA ACT GGA GCA 2112CGT CTA TTT GTG ACA AAA CCA GAG ATG TTT GGC GCT GCA ACT GGA GCA 2112

Arg Leu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly AlaArg Leu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly Ala

690 695 700690 695 700

GCG CCC GCG CAT GAT GCC CTT TCA CTG ATT ATG CTG ACA CGT TTT GCG 2160GCG CCC GCG CAT GAT GCC CTT TCA CTG ATT ATG CTG ACA CGT TTT GCG 2160

Ala Pro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe AlaAla Pro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe Ala

705 710 715 720705 710 715 720

GAT TGG GTG AAC GCA CTA GGC GAA AAA GCG TCC TCG GTG CTA GCG GCA 2208GAT TGG GTG AAC GCA CTA GGC GAA AAA GCG TCC TCG GTG CTA GCG GCA 2208

Asp Trp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala AlaAsp Trp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala Ala

725 730 735725 730 735

TTT GAA GCT AAC TCG TTA ACG GCA GAA CAA CTG GCT GAT GCC ATG AAT 2256TTT GAA GCT AAC TCG TTA ACG GCA GAA CAA CTG GCT GAT GCC ATG AAT 2256

Phe Glu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met AsnPhe Glu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met Asn

740 745 750740 745 750

CTT GAT GCT AAT TTG CTG TTG CAA GCC AGT ATT CAA GCA CAA AAT CAT 2304CTT GAT GCT AAT TTG CTG TTG CAA GCC AGT ATT CAA GCA CAA AAT CAT 2304

Leu Asp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn HisLeu Asp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn His

755 760 765755 760 765

CAA CAT CTT CCC CCA GTA ACT CCA GAA AAT GCG TTC TCC TGT TGG ACA 2352CAA CAT CTT CCC CCA GTA ACT CCA GAA AAT GCG TTC TCC TGT TGG ACA 2352

Gln His Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp ThrGln His Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp Thr

770 775 780770 775 780

TCT ATC AAT ACT ATC CTG CAA TGG GTT AAT GTC GCA CAA CAA TTG AAT 2400TCT ATC AAT ACT ATC CTG CAA TGG GTT AAT GTC GCA CAA CAA TTG AAT 2400

Ser Ile Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu AsnSer Ile Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu Asn

785 790 795 800785 790 795 800

GTC GCC CCA CAG GGC GTT TCC GCT TTG GTC GGG CTG GAT TAT ATT CAA 2448GTC GCC CCA CAG GGC GTT TCC GCT TTG GTC GGG CTG GAT TAT ATT CAA 2448

Val Ala Pro Gln Gly Val Ser Ala Leu Val Gly Leu Asp Tyr Ile GlnVal Ala Pro Gln Gly Val Ser Ala Leu Val Gly Leu Asp Tyr Ile Gln

805 810 815805 810 815

TCA ATG AAA GAG ACA CCG ACC TAT GCC CAG TGG GAA AAC GCG GCA GGC 2496TCA ATG AAA GAG ACA CCG ACC TAT GCC CAG TGG GAA AAC GCG GCA GGC 2496

Ser Met Lys Glu Thr Pro Thr Tyr Ala Gln Trp Glu Asn Ala Ala GlySer Met Lys Glu Thr Pro Thr Tyr Ala Gln Trp Glu Asn Ala Ala Gly

820 825 830820 825 830

GTA TTA ACC GCC GGG TTG AAT TCA CAA CAG GCT AAT ACA TTA CAC GCT 2544GTA TTA ACC GCC GGG TTG AAT TCA CAA CAG GCT AAT ACA TTA CAC GCT 2544

Val Leu Thr Ala Gly Leu Asn Ser Gln Gln Ala Asn Thr Leu His AlaVal Leu Thr Ala Gly Leu Asn Ser Gln Gln Ala Asn Thr Leu His Ala

835 840 845835 840 845

TTT CTG GAT GAA TCT CGC AGT GCC GCA TTA AGC ACC TAC TAT ATC CGT 2592TTT CTG GAT GAA TCT CGC AGT GCC GCA TTA AGC ACC TAC TAT ATC CGT 2592

Phe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile ArgPhe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile Arg

850 855 860850 855 860

CAA GTC GCC AAG GCA GCG GCG GCT ATT AAA AGC CGT GAT GAC TTG TAT 2640CAA GTC GCC AAG GCA GCG GCG GCT ATT AAA AGC CGT GAT GAC TTG TAT 2640

Gln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu TyrGln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu Tyr

865 870 875 880865 870 875 880

CAA TAC TTA CTG ATT GAT AAT CAG GTT TCT GCG GCA ATA AAA ACC ACC 2688CAA TAC TTA CTG ATT GAT AAT CAG GTT TCT GCG GCA ATA AAA ACC ACC 2688

Gln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr ThrGln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr Thr

885 890 895885 890 895

CGG ATC GCC GAA GCC ATT GCC AGT ATT CAA CTG TAC GTC AAC CGG GCA 2736CGG ATC GCC GAA GCC ATT GCC AGT ATT CAA CTG TAC GTC AAC CGG GCA 2736

Arg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg AlaArg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg Ala

900 905 910900 905 910

TTG GAA AAT GTG GAA GAA AAT GCC AAT TCG GGG GTT ATC AGC CGC CAA 2784TTG GAA AAT GTG GAA GAA AAT GCC AAT TCG GGG GTT ATC AGC CGC CAA 2784

Leu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg GlnLeu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg Gln

915 920 925915 920 925

TTC TTT ATC GAC TGG GAC AAA TAC AAT AAA CGC TAC AGC ACT TGG GCG 2832TTC TTT ATC GAC TGG GAC AAA TAC AAT AAA CGC TAC AGC ACT TGG GCG 2832

Phe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp AlaPhe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp Ala

930 935 940930 935 940

GGT GTT TCT CAA TTA GTT TAC TAC CCG GAA AAC TAT ATT GAT CCG ACC 2880GGT GTT TCT CAA TTA GTT TAC TAC CCG GAA AAC TAT ATT GAT CCG ACC 2880

Gly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro ThrGly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro Thr

945 950 955 960945 950 955 960

ATG CGT ATC GGA CAA ACC AAA ATG ATG GAC GCA TTA CTG CAA TCC GTC 2928ATG CGT ATC GGA CAA ACC AAA ATG ATG GAC GCA TTA CTG CAA TCC GTC 2928

Met Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser ValMet Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser Val

965 970 975965 970 975

AGC CAA AGC CAA TTA AAC GCC GAT ACC GTC GAA GAT GCC TTT ATG TCT 2976AGC CAA AGC CAA TTA AAC GCC GAT ACC GTC GAA GAT GCC TTT ATG TCT 2976

Ser Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met SerSer Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met Ser

980 985 990980 985 990

TAT CTG ACA TCG TTT GAA CAA GTG GCT AAT CTT AAA GTT ATT AGC GCA 3024TAT CTG ACA TCG TTT GAA CAA GTG GCT AAT CTT AAA GTT ATT AGC GCA 3024

Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser AlaTyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser Ala

995 1000 1005995 1000 1005

TAT CAC GAT AAT ATT AAT AAC GAT CAA GGG CTG ACC TAT TTT ATC GGA 3072TAT CAC GAT AAT ATT AAT AAC GAT CAA GGG CTG ACC TAT TTT ATC GGA 3072

Tyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile GlyTyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile Gly

1010 1015 10201010 1015 1020

CTC AGT GAA ACT GAT GCC GGT GAA TAT TAT TGG CGC AGT GTC GAT CAC 3120CTC AGT GAA ACT GAT GCC GGT GAA TAT TAT TGG CGC AGT GTC GAT CAC 3120

Leu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp HisLeu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp His

1025 1030 1035 10401025 1030 1035 1040

AGT AAA TTC AAC GAC GGT AAA TTC GCG GCT AAT GCC TGG AGT GAA TGG 3168AGT AAA TTC AAC GAC GGT AAA TTC GCG GCT AAT GCC TGG AGT GAA TGG 3168

Ser Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu TrpSer Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu Trp

1045 1050 10551045 1050 1055

CAT AAA ATT GAT TGT CCA ATT AAC CCT TAT AAA AGC ACT ATC CGT CCA 3216CAT AAA ATT GAT TGT CCA ATT AAC CCT TAT AAA AGC ACT ATC CGT CCA 3216

His Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg ProHis Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg Pro

1060 1065 10701060 1065 1070

GTG ATA TAT AAA TCC CGC CTG TAT CTG CTC TGG TTG GAA CAA AAG GAG 3264GTG ATA TAT AAA TCC CGC CTG TAT CTG CTC TGG TTG GAA CAA AAG GAG 3264

Val Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys GluVal Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys Glu

1075 1080 10851075 1080 1085

ATC ACC AAA CAG ACA GGA AAT AGT AAA GAT GGC TAT CAA ACT GAA ACG 3312ATC ACC AAA CAG ACA GGA AAT AGT AAA GAT GGC TAT CAA ACT GAA ACG 3312

Ile Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu ThrIle Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu Thr

1090 1095 11001090 1095 1100

GAT TAT CGT TAT GAA CTA AAA TTG GCG CAT ATC CGC TAT GAT GGC ACT 3360GAT TAT CGT TAT GAA CTA AAA TTG GCG CAT ATC CGC TAT GAT GGC ACT 3360

Asp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly ThrAsp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Thr

1105 1110 1115 11201105 1110 1115 1120

TGG AAT ACG CCA ATC ACC TTT GAT GTC AAT AAA AAA ATA TCC GAG CTA 3408TGG AAT ACG CCA ATC ACC TTT GAT GTC AAT AAA AAA ATA TCC GAG CTA 3408

Trp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu LeuTrp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu Leu

1125 1130 11351125 1130 1135

AAA CTG GAA AAA AAT AGA GCG CCC GGA CTC TAT TGT GCC GGT TAT CAA 3456AAA CTG GAA AAA AAT AGA GCG CCC GGA CTC TAT TGT GCC GGT TAT CAA 3456

Lys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr GlnLys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr Gln

1140 1145 11501140 1145 1150

GGT GAA GAT ACG TTG CTG GTG ATG TTT TAT AAC CAA CAA GAC ACA CTA 3504GGT GAA GAT ACG TTG CTG GTG ATG TTT TAT AAC CAA CAA GAC ACA CTA 3504

Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr LeuGly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr Leu

1155 1160 11651155 1160 1165

GAT AGT TAT AAA AAC GCT TCA ATG CAA GGA CTA TAT ATC TTT GCT GAT 3552GAT AGT TAT AAA AAC GCT TCA ATG CAA GGA CTA TAT ATC TTT GCT GAT 3552

Asp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala AspAsp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala Asp

1170 1175 11801170 1175 1180

ATG GCA TCC AAA GAT ATG ACC CCA GAA CAG AGC AAT GTT TAT CGG GAT 3600ATG GCA TCC AAA GAT ATG ACC CCA GAA CAG AGC AAT GTT TAT CGG GAT 3600

Met Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg AspMet Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg Asp

1185 1190 1195 12001185 1190 1195 1200

AAT AGC TAT CAA CAA TTT GAT ACC AAT AAT GTC AGA AGA GTG AAT AAC 3648AAT AGC TAT CAA CAA TTT GAT ACC AAT AAT GTC AGA AGA GTG AAT AAC 3648

Asn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn AsnAsn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn Asn

1205 1210 12151205 1210 1215

CGC TAT GCA GAG GAT TAT GAG ATT CCT TCC TCG GTA AGT AGC CGT AAA 3696CGC TAT GCA GAG GAT TAT GAG ATT CCT TCC TCG GTA AGT AGC CGT AAA 3696

Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg LysArg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg Lys

1220 1225 12301220 1225 1230

GAC TAT GGT TGG GGA GAT TAT TAC CTC AGC ATG GTA TAT AAC GGA GAT 3744GAC TAT GGT TGG GGA GAT TAT TAC CTC AGC ATG GTA TAT AAC GGA GAT 3744

Asp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly AspAsp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly Asp

1235 1240 12451235 1240 1245

ATT CCA ACT ATC AAT TAC AAA GCC GCA TCA AGT GAT TTA AAA ATC TAT 3792ATT CCA ACT ATC AAT TAC AAA GCC GCA TCA AGT GAT TTA AAA ATC TAT 3792

Ile Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile TyrIle Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile Tyr

1250 1255 12601250 1255 1260

ATC TCA CCA AAA TTA AGA ATT ATT CAT AAT GGA TAT GAA GGA CAG AAG 3840ATC TCA CCA AAA TTA AGA ATT ATT CAT AAT GGA TAT GAA GGA CAG AAG 3840

Ile Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln LysIle Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln Lys

1265 1270 1275 12801265 1270 1275 1280

CGC AAT CAA TGC AAT CTG ATG AAT AAA TAT GGC AAA CTA GGT GAT AAA 3888CGC AAT CAA TGC AAT CTG ATG AAT AAA TAT GGC AAA CTA GGT GAT AAA 3888

Arg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp LysArg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp Lys

1285 1290 12951285 1290 1295

TTT ATT GTT TAT ACT AGC TTG GGG GTC AAT CCA AAT AAC TCG TCA AAT 3936TTT ATT GTT TAT ACT AGC TTG GGG GTC AAT CCA AAT AAC TCG TCA AAT 3936

Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser AsnPhe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser Asn

1300 1305 13101300 1305 1310

AAG CTC ATG TTT TAC CCC GTC TAT CAA TAT AGC GGA AAC ACC AGT GGA 3984AAG CTC ATG TTT TAC CCC GTC TAT CAA TAT AGC GGA AAC ACC AGT GGA 3984

Lys Leu Met Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Thr Ser GlyLys Leu Met Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Thr Ser Gly

1315 1320 13251315 1320 1325

CTC AAT CAA GGG AGA CTA CTA TTC CAC CGT GAC ACC ACT TAT CCA TCT 4032CTC AAT CAA GGG AGA CTA CTA TTC CAC CGT GAC ACC ACT TAT CCA TCT 4032

Leu Asn Gln Gly Arg Leu Leu Phe His Arg Asp Thr Thr Tyr Pro SerLeu Asn Gln Gly Arg Leu Leu Phe His Arg Asp Thr Thr Tyr Pro Ser

1330 1335 13401330 1335 1340

AAA GTA GAA GCT TGG ATT CCT GGA GCA AAA CGT TCT CTA ACC AAC CAA 4080AAA GTA GAA GCT TGG ATT CCT GGA GCA AAA CGT TCT CTA ACC AAC CAA 4080

Lys Val Glu Ala Trp Ile Pro Gly Ala Lys Arg Ser Leu Thr Asn GlnLys Val Glu Ala Trp Ile Pro Gly Ala Lys Arg Ser Leu Thr Asn Gln

1345 1350 1355 13601345 1350 1355 1360

AAT GCC GCC ATT GGT GAT GAT TAT GCT ACA GAC TCT CTG AAT AAA CCG 4128AAT GCC GCC ATT GGT GAT GAT TAT GCT ACA GAC TCT CTG AAT AAA CCG 4128

Asn Ala Ala Ile Gly Asp Asp Tyr Ala Thr Asp Ser Leu Asn Lys ProAsn Ala Ala Ile Gly Asp Asp Tyr Ala Thr Asp Ser Leu Asn Lys Pro

1365 1370 13751365 1370 1375

GAT GAT CTT AAG CAA TAT ATC TTT ATG ACT GAC AGT AAA GGG ACT GCT 4176GAT GAT CTT AAG CAA TAT ATC TTT ATG ACT GAC AGT AAA GGG ACT GCT 4176

Asp Asp Leu Lys Gln Tyr Ile Phe Met Thr Asp Ser Lys Gly Thr AlaAsp Asp Leu Lys Gln Tyr Ile Phe Met Thr Asp Ser Lys Gly Thr Ala

1380 1385 13901380 1385 1390

ACT GAT GTC TCA GGC CCA GTA GAG ATT AAT ACT GCA ATT TCT CCA GCA 4224ACT GAT GTC TCA GGC CCA GTA GAG ATT AAT ACT GCA ATT TCT CCA GCA 4224

Thr Asp Val Ser Gly Pro Val Glu Ile Asn Thr Ala Ile Ser Pro AlaThr Asp Val Ser Gly Pro Val Glu Ile Asn Thr Ala Ile Ser Pro Ala

1395 1400 14051395 1400 1405

AAA GTT CAG ATA ATA GTC AAA GCG GGT GGC AAG GAG CAA ACT TTT ACC 4272AAA GTT CAG ATA ATA GTC AAA GCG GGT GGC AAG GAG CAA ACT TTT ACC 4272

Lys Val Gln Ile Ile Val Lys Ala Gly Gly Lys Glu Gln Thr Phe ThrLys Val Gln Ile Ile Val Lys Ala Gly Gly Lys Glu Gln Thr Phe Thr

1410 1415 14201410 1415 1420

GCA GAT AAA GAT GTC TCC ATT CAG CCA TCA CCT AGC TTT GAT GAA ATG 4320GCA GAT AAA GAT GTC TCC ATT CAG CCA TCA CCT AGC TTT GAT GAA ATG 4320

Ala Asp Lys Asp Val Ser Ile Gln Pro Ser Pro Ser Phe Asp Glu MetAla Asp Lys Asp Val Ser Ile Gln Pro Ser Pro Ser Phe Asp Glu Met

1425 1430 1435 14401425 1430 1435 1440

AAT TAT CAA TTT AAT GCC CTT GAA ATA GAC GGT TCT GGT CTG AAT TTT 4368AAT TAT CAA TTT AAT GCC CTT GAA ATA GAC GGT TCT GGT CTG AAT TTT 4368

Asn Tyr Gln Phe Asn Ala Leu Glu Ile Asp Gly Ser Gly Leu Asn PheAsn Tyr Gln Phe Asn Ala Leu Glu Ile Asp Gly Ser Gly Leu Asn Phe

1445 1450 14551445 1450 1455

ATT AAC AAC TCA GCC AGT ATT GAT GTT ACT TTT ACC GCA TTT GCG GAG 4416ATT AAC AAC TCA GCC AGT ATT GAT GTT ACT TTT ACC GCA TTT GCG GAG 4416

Ile Asn Asn Ser Ala Ser Ile Asp Val Thr Phe Thr Ala Phe Ala GluIle Asn Asn Ser Ala Ser Ile Asp Val Thr Phe Thr Ala Phe Ala Glu

1460 1465 14701460 1465 1470

GAT GGC CGC AAA CTG GGT TAT GAA AGT TTC AGT ATT CCT GTT ACC CTC 4464GAT GGC CGC AAA CTG GGT TAT GAA AGT TTC AGT ATT CCT GTT ACC CTC 4464

Asp Gly Arg Lys Leu Gly Tyr Glu Ser Phe Ser Ile Pro Val Thr LeuAsp Gly Arg Lys Leu Gly Tyr Glu Ser Phe Ser Ile Pro Val Thr Leu

1475 1480 14851475 1480 1485

AAG GTA AGT ACC GAT AAT GCC CTG ACC CTG CAC CAT AAT GAA AAT GGT 4512AAG GTA AGT ACC GAT AAT GCC CTG ACC CTG CAC CAT AAT GAA AAT GGT 4512

Lys Val Ser Thr Asp Asn Ala Leu Thr Leu His His Asn Glu Asn GlyLys Val Ser Thr Asp Asn Ala Leu Thr Leu His His Asn Glu Asn Gly

1490 1495 15001490 1495 1500

GCG CAA TAT ATG CAA TGG CAA TCC TAT CGT ACC CGC CTG AAT ACT CTA 4560GCG CAA TAT ATG CAA TGG CAA TCC TAT CGT ACC CGC CTG AAT ACT CTA 4560

Ala Gln Tyr Met Gln Trp Gln Ser Tyr Arg Thr Arg Leu Asn Thr LeuAla Gln Tyr Met Gln Trp Gln Ser Tyr Arg Thr Arg Leu Asn Thr Leu

1505 1510 1515 15201505 1510 1515 1520

TTT GCC CGC CAG TTG GTT GCA CGC GCC ACC ACC GGA ATC GAT ACA ATT 4608TTT GCC CGC CAG TTG GTT GCA CGC GCC ACC ACC GGA ATC GAT ACA ATT 4608

Phe Ala Arg Gln Leu Val Ala Arg Ala Thr Thr Gly Ile Asp Thr IlePhe Ala Arg Gln Leu Val Ala Arg Ala Thr Thr Gly Ile Asp Thr Ile

1525 1530 15351525 1530 1535

CTG AGT ATG GAA ACT CAG AAT ATT CAG GAA CCG CAG TTA GGC AAA GGT 4656CTG AGT ATG GAA ACT CAG AAT ATT CAG GAA CCG CAG TTA GGC AAA GGT 4656

Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly Lys GlyLeu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly Lys Gly

1540 1545 15501540 1545 1550

TTC TAT GCT ACG TTC GTG ATA CCT CCC TAT AAC CTA TCA ACT CAT GGT 4704TTC TAT GCT ACG TTC GTG ATA CCT CCC TAT AAC CTA TCA ACT CAT GGT 4704

Phe Tyr Ala Thr Phe Val Ile Pro Pro Tyr Asn Leu Ser Thr His GlyPhe Tyr Ala Thr Phe Val Ile Pro Pro Tyr Asn Leu Ser Thr His Gly

1555 1560 15651555 1560 1565

GAT GAA CGT TGG TTT AAG CTT TAT ATC AAA CAT GTT GTT GAT AAT AAT 4752GAT GAA CGT TGG TTT AAG CTT TAT ATC AAA CAT GTT GTT GAT AAT AAT 4752

Asp Glu Arg Trp Phe Lys Leu Tyr Ile Lys His Val Val Asp Asn AsnAsp Glu Arg Trp Phe Lys Leu Tyr Ile Lys His Val Val Asp Asn Asn

1570 1575 15801570 1575 1580

TCA CAT ATT ATC TAT TCA GGC CAG CTA ACA GAT ACA AAT ATA AAC ATC 4800TCA CAT ATT ATC TAT TCA GGC CAG CTA ACA GAT ACA AAT ATA AAC ATC 4800

Ser His Ile Ile Tyr Ser Gly Gln Leu Thr Asp Thr Asn Ile Asn IleSer His Ile Ile Tyr Ser Gly Gln Leu Thr Asp Thr Asn Ile Asn Ile

1585 1590 1595 16001585 1590 1595 1600

ACA TTA TTT ATT CCT CTT GAT GAT GTC CCA TTG AAT CAA GAT TAT CAC 4848ACA TTA TTT ATT CCT CTT GAT GAT GTC CCA TTG AAT CAA GAT TAT CAC 4848

Thr Leu Phe Ile Pro Leu Asp Asp Val Pro Leu Asn Gln Asp Tyr HisThr Leu Phe Ile Pro Leu Asp Asp Val Pro Leu Asn Gln Asp Tyr His

1605 1610 16151605 1610 1615

GCC AAG GTT TAT ATG ACC TTC AAG AAA TCA CCA TCA GAT GGT ACC TGG 4896GCC AAG GTT TAT ATG ACC TTC AAG AAA TCA CCA TCA GAT GGT ACC TGG 4896

Ala Lys Val Tyr Met Thr Phe Lys Lys Ser Pro Ser Asp Gly Thr TrpAla Lys Val Tyr Met Thr Phe Lys Lys Ser Pro Ser Asp Gly Thr Trp

1620 1625 16301620 1625 1630

TGG GGC CCT CAC TTT GTT AGA GAT GAT AAA GGA ATA GTA ACA ATA AAC 4944TGG GGC CCT CAC TTT GTT AGA GAT GAT AAA GGA ATA GTA ACA ATA AAC 4944

Trp Gly Pro His Phe Val Arg Asp Asp Lys Gly Ile Val Thr Ile AsnTrp Gly Pro His Phe Val Arg Asp Asp Lys Gly Ile Val Thr Ile Asn

1635 1640 16451635 1640 1645

CCT AAA TCC ATT TTG ACC CAT TTT GAG AGC GTC AAT GTC CTG AAT AAT 4992CCT AAA TCC ATT TTG ACC CAT TTT GAG AGC GTC AAT GTC CTG AAT AAT 4992

Pro Lys Ser Ile Leu Thr His Phe Glu Ser Val Asn Val Leu Asn AsnPro Lys Ser Ile Leu Thr His Phe Glu Ser Val Asn Val Leu Asn Asn

1650 1655 16601650 1655 1660

ATT AGT AGC GAA CCA ATG GAT TTC AGC GGC GCT AAC AGC CTC TAT TTC 5040ATT AGT AGC GAA CCA ATG GAT TTC AGC GGC GCT AAC AGC CTC TAT TTC 5040

Ile Ser Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ser Leu Tyr PheIle Ser Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ser Leu Tyr Phe

1665 1670 1675 16801665 1670 1675 1680

TGG GAA CTG TTC TAC TAT ACC CCG ATG CTG GTT GCT CAA CGT TTG CTG 5088TGG GAA CTG TTC TAC TAT ACC CCG ATG CTG GTT GCT CAA CGT TTG CTG 5088

Trp Glu Leu Phe Tyr Tyr Thr Pro Met Leu Val Ala Gln Arg Leu LeuTrp Glu Leu Phe Tyr Tyr Thr Pro Met Leu Val Ala Gln Arg Leu Leu

1685 1690 16951685 1690 1695

CAT GAA CAG AAC TTC GAT GAA GCC AAC CGT TGG CTG AAA TAT GTC TGG 5136CAT GAA CAG AAC TTC GAT GAA GCC AAC CGT TGG CTG AAA TAT GTC TGG 5136

His Glu Gln Asn Phe Asp Glu Ala Asn Arg Trp Leu Lys Tyr Val TrpHis Glu Gln Asn Phe Asp Glu Ala Asn Arg Trp Leu Lys Tyr Val Trp

1700 1705 17101700 1705 1710

AGT CCA TCC GGT TAT ATT GTC CAC GGC CAG ATT CAG AAC TAC CAG TGG 5184AGT CCA TCC GGT TAT ATT GTC CAC GGC CAG ATT CAG AAC TAC CAG TGG 5184

Ser Pro Ser Gly Tyr Ile Val His Gly Gln Ile Gln Asn Tyr Gln TrpSer Pro Ser Gly Tyr Ile Val His Gly Gln Ile Gln Asn Tyr Gln Trp

1715 1720 17251715 1720 1725

AAC GTC CGC CCG TTA CTG GAA GAC ACC AGT TGG AAC AGT GAT CCT TTG 5232AAC GTC CGC CCG TTA CTG GAA GAC ACC AGT TGG AAC AGT GAT CCT TTG 5232

Asn Val Arg Pro Leu Leu Glu Asp Thr Ser Trp Asn Ser Asp Pro LeuAsn Val Arg Pro Leu Leu Glu Asp Thr Ser Trp Asn Ser Asp Pro Leu

1730 1735 17401730 1735 1740

GAT TCC GTC GAT CCT GAC GCG GTA GCA CAG CAC GAT CCA ATG CAC TAC 5280GAT TCC GTC GAT CCT GAC GCG GTA GCA CAG CAC GAT CCA ATG CAC TAC 5280

Asp Ser Val Asp Pro Asp Ala Val Ala Gln His Asp Pro Met His TyrAsp Ser Val Asp Pro Asp Ala Val Ala Gln His Asp Pro Met His Tyr

1745 1750 1755 17601745 1750 1755 1760

AAA GTT TCA ACT TTT ATG CGT ACC TTG GAT CTA TTG ATA GCA CGC GGC 5328AAA GTT TCA ACT TTT ATG CGT ACC TTG GAT CTA TTG ATA GCA CGC GGC 5328

Lys Val Ser Thr Phe Met Arg Thr Leu Asp Leu Leu Ile Ala Arg GlyLys Val Ser Thr Phe Met Arg Thr Leu Asp Leu Leu Ile Ala Arg Gly

1765 1770 17751765 1770 1775

GAC CAT GCT TAT CGC CAA CTG GAA CGA GAT ACA CTC AAC GAA GCG AAG 5376GAC CAT GCT TAT CGC CAA CTG GAA CGA GAT ACA CTC AAC GAA GCG AAG 5376

Asp His Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Asn Glu Ala LysAsp His Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Asn Glu Ala Lys

1780 1785 17901780 1785 1790

ATG TGG TAT ATG CAA GCG CTG CAT CTA TTA GGT GAC AAA CCT TAT CTA 5424ATG TGG TAT ATG CAA GCG CTG CAT CTA TTA GGT GAC AAA CCT TAT CTA 5424

Met Trp Tyr Met Gln Ala Leu His Leu Leu Gly Asp Lys Pro Tyr LeuMet Trp Tyr Met Gln Ala Leu His Leu Leu Gly Asp Lys Pro Tyr Leu

1795 1800 18051795 1800 1805

CCG CTG AGT ACG ACA TGG AGT GAT CCA CGA CTA GAC AGA GCC GCG GAT 5472CCG CTG AGT ACG ACA TGG AGT GAT CCA CGA CTA GAC AGA GCC GCG GAT 5472

Pro Leu Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala AspPro Leu Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala Asp

1810 1815 18201810 1815 1820

ATC ACT ACC CAA AAT GCT CAC GAC AGC GCA ATA GTC GCT CTG CGG CAG 5520ATC ACT ACC CAA AAT GCT CAC GAC AGC GCA ATA GTC GCT CTG CGG CAG 5520

Ile Thr Thr Gln Asn Ala His Asp Ser Ala Ile Val Ala Leu Arg GlnIle Thr Thr Gln Asn Ala His Asp Ser Ala Ile Val Ala Leu Arg Gln

1825 1830 1835 18401825 1830 1835 1840

AAT ATA CCT ACA CCG GCA CCT TTA TCA 5547AAT ATA CCT ACA CCG GCA CCT TTA TCA 5547

Asn Ile Pro Thr Pro Ala Pro Leu SerAsn Ile Pro Thr Pro Ala Pro Leu Ser

1845 18491845 1849

(2) INFORMATION FOR SEQ ID NO:49:(2) INFORMATION FOR SEQ ID NO: 49:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1849 amino acids(A) LENGTH: 1849 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:49 (TcdAii):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 49 (TcdAii):

Features From To DescriptionFeatures From To Description

Peptide 1 1849 TcdAii peptidePeptide 1 1849 TcdAii peptide

Fragment 1 12 TcdAii N-terminus (SEQ ID NO:13)Fragment 1 12 TcdAii N-terminus (SEQ ID NO: 13)

Fragment 196 211 (SEQ ID NO:38)Fragment 196 211 (SEQ ID NO: 38)

Fragment 466 475 (SEQ ID NO:17)Fragment 466 475 (SEQ ID NO: 17)

Fragment 993 1004 (SEQ ID NO:23; 12/13)Fragment 993 1004 (SEQ ID NO: 23; 12/13)

Fragment 1297 1312 (SEQ ID NO:18)Fragment 1297 1312 (SEQ ID NO: 18)

Fragment 1390 1409 (SEQ ID NO:39)Fragment 1390 1409 (SEQ ID NO: 39)

Fragment 1532 1554 (SEQ ID NO:21; 19/23)Fragment 1532 1554 (SEQ ID NO: 21; 19/23)

Leu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Arg Ala Ser Gln Tyr ValLeu Ile Gly Tyr Asn Asn Gln Phe Ser Gly Arg Ala Ser Gln Tyr Val

1 5 10 151 5 10 15

Ala Pro Gly Thr Val Ser Ser Met Phe Ser Pro Ala Ala Tyr Leu ThrAla Pro Gly Thr Val Ser Ser Met Phe Ser Pro Ala Ala Tyr Leu Thr

20 25 3020 25 30

Glu Leu Tyr Arg Glu Ala Arg Asn Leu His Ala Ser Asp Ser Val TyrGlu Leu Tyr Arg Glu Ala Arg Asn Leu His Ala Ser Asp Ser Val Tyr

35 40 4535 40 45

Tyr Leu Asp Thr Arg Arg Pro Asp Leu Lys Ser Met Ala Leu Ser GlnTyr Leu Asp Thr Arg Arg Pro Asp Leu Lys Ser Met Ala Leu Ser Gln

50 55 6050 55 60

Gln Asn Met Asp Ile Glu Leu Ser Thr Leu Ser Leu Ser Asn Glu LeuGln Asn Met Asp Ile Glu Leu Ser Thr Leu Ser Leu Ser Asn Glu Leu

65 70 75 8065 70 75 80

Leu Leu Glu Ser Ile Lys Thr Glu Ser Lys Leu Glu Asn Tyr Thr LysLeu Leu Glu Ser Ile Lys Thr Glu Ser Lys Leu Glu Asn Tyr Thr Lys

85 90 9585 90 95

Val Met Glu Met Leu Ser Thr Phe Arg Pro Ser Gly Ala Thr Pro TyrVal Met Glu Met Leu Ser Thr Phe Arg Pro Ser Gly Ala Thr Pro Tyr

100 105 110100 105 110

His Asp Ala Tyr Glu Asn Val Arg Glu Val Ile Gln Leu Gln Asp ProHis Asp Ala Tyr Glu Asn Val Arg Glu Val Ile Gln Leu Gln Asp Pro

115 120 125115 120 125

Gly Leu Glu Gln Leu Asn Ala Ser Pro Ala Ile Ala Gly Leu Met HisGly Leu Glu Gln Leu Asn Ala Ser Pro Ala Ile Ala Gly Leu Met His

130 135 140130 135 140

Gln Ala Ser Leu Leu Gly Ile Asn Ala Ser Ile Ser Pro Glu Leu PheGln Ala Ser Leu Leu Gly Ile Asn Ala Ser Ile Ser Pro Glu Leu Phe

145 150 155 160145 150 155 160

Asn Ile Leu Thr Glu Glu Ile Thr Glu Gly Asn Ala Glu Glu Leu TyrAsn Ile Leu Thr Glu Glu Ile Thr Glu Gly Asn Ala Glu Glu Leu Tyr

165 170 175165 170 175

Lys Lys Asn Phe Gly Asn Ile Glu Pro Ala Ser Leu Ala Met Pro GluLys Lys Asn Phe Gly Asn Ile Glu Pro Ala Ser Leu Ala Met Pro Glu

180 185 190180 185 190

Tyr Leu Lys Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln PheTyr Leu Lys Arg Tyr Tyr Asn Leu Ser Asp Glu Glu Leu Ser Gln Phe

195 200 205195 200 205

Ile Gly Lys Ala Ser Asn Phe Gly Gln Gln Glu Tyr Ser Asn Asn GlnIle Gly Lys Ala Ser Asn Phe Gly Gln Gln Glu Tyr Ser Asn Asn Gln

210 215 220210 215 220

Leu Ile Thr Pro Val Val Asn Ser Ser Asp Gly Thr Val Lys Val TyrLeu Ile Thr Pro Val Val Asn Ser Ser Asp Gly Thr Val Lys Val Tyr

225 230 235 240225 230 235 240

Arg Ile Thr Arg Glu Tyr Thr Thr Asn Ala Tyr Gln Met Asp Val GluArg Ile Thr Arg Glu Tyr Thr Thr Asn Ala Tyr Gln Met Asp Val Glu

245 250 255245 250 255

Leu Phe Pro Phe Gly Gly Glu Asn Tyr Arg Leu Asp Tyr Lys Phe LysLeu Phe Pro Phe Gly Gly Glu Asn Tyr Arg Leu Asp Tyr Lys Phe Lys

260 265 270260 265 270

Asn Phe Tyr Asn Ala Ser Tyr Leu Ser Ile Lys Leu Asn Asp Lys ArgAsn Phe Tyr Asn Ala Ser Tyr Leu Ser Ile Lys Leu Asn Asp Lys Arg

275 280 285275 280 285

Glu Leu Val Arg Thr Glu Gly Ala Pro Gln Val Asn Ile Glu Tyr SerGlu Leu Val Arg Thr Glu Gly Ala Pro Gln Val Asn Ile Glu Tyr Ser

290 295 300290 295 300

Ala Asn Ile Thr Leu Asn Thr Ala Asp Ile Ser Gln Pro Phe Glu IleAla Asn Ile Thr Leu Asn Thr Ala Asp Ile Ser Gln Pro Phe Glu Ile

305 310 315 320305 310 315 320

Gly Leu Thr Arg Val Leu Pro Ser Gly Ser Trp Ala Tyr Ala Ala AlaGly Leu Thr Arg Val Leu Pro Ser Gly Ser Trp Ala Tyr Ala Ala Ala

325 330 335325 330 335

Lys Phe Thr Val Glu Glu Tyr Asn Gln Tyr Ser Phe Leu Leu Lys LeuLys Phe Thr Val Glu Glu Tyr Asn Gln Tyr Ser Phe Leu Leu Lys Leu

340 345 350340 345 350

Asn Lys Ala Ile Arg Leu Ser Arg Ala Thr Glu Leu Ser Pro Thr IleAsn Lys Ala Ile Arg Leu Ser Arg Ala Thr Glu Leu Ser Pro Thr Ile

355 360 365355 360 365

Leu Glu Gly Ile Val Arg Ser Val Asn Leu Gln Leu Asp Ile Asn ThrLeu Glu Gly Ile Val Arg Ser Val Asn Leu Gln Leu Asp Ile Asn Thr

370 375 380370 375 380

Asp Val Leu Gly Lys Val Phe Leu Thr Lys Tyr Tyr Met Gln Arg TyrAsp Val Leu Gly Lys Val Phe Leu Thr Lys Tyr Tyr Met Gln Arg Tyr

385 390 395 400385 390 395 400

Ala Ile His Ala Glu Thr Ala Leu Ile Leu Cys Asn Ala Pro Ile SerAla Ile His Ala Glu Thr Ala Leu Ile Leu Cys Asn Ala Pro Ile Ser

405 410 415405 410 415

Gln Arg Ser Tyr Asp Asn Gln Pro Ser Gln Phe Asp Arg Leu Phe AsnGln Arg Ser Tyr Asp Asn Gln Pro Ser Gln Phe Asp Arg Leu Phe Asn

420 425 430420 425 430

Thr Pro Leu Leu Asn Gly Gln Tyr Phe Ser Thr Gly Asp Glu Glu IleThr Pro Leu Leu Asn Gly Gln Tyr Phe Ser Thr Gly Asp Glu Glu Ile

435 440 445435 440 445

Asp Leu Asn Ser Gly Ser Thr Gly Asp Trp Arg Lys Thr Ile Leu LysAsp Leu Asn Ser Gly Ser Thr Gly Asp Trp Arg Lys Thr Ile Leu Lys

450 455 460450 455 460

Arg Ala Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys IleArg Ala Phe Asn Ile Asp Asp Val Ser Leu Phe Arg Leu Leu Lys Ile

465 470 475 480465 470 475 480

Thr Asp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys AsnThr Asp His Asp Asn Lys Asp Gly Lys Ile Lys Asn Asn Leu Lys Asn

485 490 495485 490 495

Leu Ser Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln LeuLeu Ser Asn Leu Tyr Ile Gly Lys Leu Leu Ala Asp Ile His Gln Leu

500 505 510500 505 510

Thr Ile Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly LysThr Ile Asp Glu Leu Asp Leu Leu Leu Ile Ala Val Gly Glu Gly Lys

515 520 525515 520 525

Thr Asn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile ArgThr Asn Leu Ser Ala Ile Ser Asp Lys Gln Leu Ala Thr Leu Ile Arg

530 535 540530 535 540

Lys Leu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser ValLys Leu Asn Thr Ile Thr Ser Trp Leu His Thr Gln Lys Trp Ser Val

545 550 555 560545 550 555 560

Phe Gln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu ThrPhe Gln Leu Phe Ile Met Thr Ser Thr Ser Tyr Asn Lys Thr Leu Thr

565 570 575565 570 575

Pro Glu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln GlyPro Glu Ile Lys Asn Leu Leu Asp Thr Val Tyr His Gly Leu Gln Gly

580 585 590580 585 590

Phe Asp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr IlePhe Asp Lys Asp Lys Ala Asp Leu Leu His Val Met Ala Pro Tyr Ile

595 600 605595 600 605

Ala Ala Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val LeuAla Ala Thr Leu Gln Leu Ser Ser Glu Asn Val Ala His Ser Val Leu

610 615 620610 615 620

Leu Trp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala GluLeu Trp Ala Asp Lys Leu Gln Pro Gly Asp Gly Ala Met Thr Ala Glu

625 630 635 640625 630 635 640

Lys Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser GluLys Phe Trp Asp Trp Leu Asn Thr Lys Tyr Thr Pro Gly Ser Ser Glu

645 650 655645 650 655

Ala Val Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu AlaAla Val Glu Thr Gln Glu His Ile Val Gln Tyr Cys Gln Ala Leu Ala

660 665 670660 665 670

Gln Leu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala PheGln Leu Glu Met Val Tyr His Ser Thr Gly Ile Asn Glu Asn Ala Phe

675 680 685675 680 685

Arg Leu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly AlaArg Leu Phe Val Thr Lys Pro Glu Met Phe Gly Ala Ala Thr Gly Ala

690 695 700690 695 700

Ala Pro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe AlaAla Pro Ala His Asp Ala Leu Ser Leu Ile Met Leu Thr Arg Phe Ala

705 710 715 720705 710 715 720

Asp Trp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala AlaAsp Trp Val Asn Ala Leu Gly Glu Lys Ala Ser Ser Val Leu Ala Ala

725 730 735725 730 735

Phe Glu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met AsnPhe Glu Ala Asn Ser Leu Thr Ala Glu Gln Leu Ala Asp Ala Met Asn

740 745 750740 745 750

Leu Asp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn HisLeu Asp Ala Asn Leu Leu Leu Gln Ala Ser Ile Gln Ala Gln Asn His

755 760 765755 760 765

Gln His Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp ThrGln His Leu Pro Pro Val Thr Pro Glu Asn Ala Phe Ser Cys Trp Thr

770 775 780770 775 780

Ser Ile Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu AsnSer Ile Asn Thr Ile Leu Gln Trp Val Asn Val Ala Gln Gln Leu Asn

785 790 795 800785 790 795 800

Val Ala Pro Gln Gly Val Ser Ala Leu Val Gly Leu Asp Tyr Ile GlnVal Ala Pro Gln Gly Val Ser Ala Leu Val Gly Leu Asp Tyr Ile Gln

805 810 815805 810 815

Ser Met Lys Glu Thr Pro Thr Tyr Ala Gln Trp Glu Asn Ala Ala GlySer Met Lys Glu Thr Pro Thr Tyr Ala Gln Trp Glu Asn Ala Ala Gly

820 825 830820 825 830

Val Leu Thr Ala Gly Leu Asn Ser Gln Gln Ala Asn Thr Leu His AlaVal Leu Thr Ala Gly Leu Asn Ser Gln Gln Ala Asn Thr Leu His Ala

835 840 845835 840 845

Phe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile ArgPhe Leu Asp Glu Ser Arg Ser Ala Ala Leu Ser Thr Tyr Tyr Ile Arg

850 855 860850 855 860

Gln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu TyrGln Val Ala Lys Ala Ala Ala Ala Ile Lys Ser Arg Asp Asp Leu Tyr

865 870 875 880865 870 875 880

Gln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr ThrGln Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Ala Ile Lys Thr Thr

885 890 895885 890 895

Arg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg AlaArg Ile Ala Glu Ala Ile Ala Ser Ile Gln Leu Tyr Val Asn Arg Ala

900 905 910900 905 910

Leu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg GlnLeu Glu Asn Val Glu Glu Asn Ala Asn Ser Gly Val Ile Ser Arg Gln

915 920 925915 920 925

Phe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp AlaPhe Phe Ile Asp Trp Asp Lys Tyr Asn Lys Arg Tyr Ser Thr Trp Ala

930 935 940930 935 940

Gly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro ThrGly Val Ser Gln Leu Val Tyr Tyr Pro Glu Asn Tyr Ile Asp Pro Thr

945 950 955 960945 950 955 960

Met Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser ValMet Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln Ser Val

965 970 975965 970 975

Ser Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met SerSer Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe Met Ser

980 985 990980 985 990

Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser AlaTyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile Ser Ala

995 1000 1005995 1000 1005

Tyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile GlyTyr His Asp Asn Ile Asn Asn Asp Gln Gly Leu Thr Tyr Phe Ile Gly

1010 1015 10201010 1015 1020

Leu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp HisLeu Ser Glu Thr Asp Ala Gly Glu Tyr Tyr Trp Arg Ser Val Asp His

1025 1030 1035 10401025 1030 1035 1040

Ser Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu TrpSer Lys Phe Asn Asp Gly Lys Phe Ala Ala Asn Ala Trp Ser Glu Trp

1045 1050 10551045 1050 1055

His Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg ProHis Lys Ile Asp Cys Pro Ile Asn Pro Tyr Lys Ser Thr Ile Arg Pro

1060 1065 10701060 1065 1070

Val Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys GluVal Ile Tyr Lys Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln Lys Glu

1075 1080 10851075 1080 1085

Ile Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu ThrIle Thr Lys Gln Thr Gly Asn Ser Lys Asp Gly Tyr Gln Thr Glu Thr

1090 1095 11001090 1095 1100

Asp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly ThrAsp Tyr Arg Tyr Glu Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Thr

1105 1110 1115 11201105 1110 1115 1120

Trp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu LeuTrp Asn Thr Pro Ile Thr Phe Asp Val Asn Lys Lys Ile Ser Glu Leu

1125 1130 11351125 1130 1135

Lys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr GlnLys Leu Glu Lys Asn Arg Ala Pro Gly Leu Tyr Cys Ala Gly Tyr Gln

1140 1145 11501140 1145 1150

Gly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr LeuGly Glu Asp Thr Leu Leu Val Met Phe Tyr Asn Gln Gln Asp Thr Leu

1155 1160 11651155 1160 1165

Asp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala AspAsp Ser Tyr Lys Asn Ala Ser Met Gln Gly Leu Tyr Ile Phe Ala Asp

1170 1175 11801170 1175 1180

Met Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg AspMet Ala Ser Lys Asp Met Thr Pro Glu Gln Ser Asn Val Tyr Arg Asp

1185 1190 1195 12001185 1190 1195 1200

Asn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn AsnAsn Ser Tyr Gln Gln Phe Asp Thr Asn Asn Val Arg Arg Val Asn Asn

1205 1210 12151205 1210 1215

Arg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg LysArg Tyr Ala Glu Asp Tyr Glu Ile Pro Ser Ser Val Ser Ser Arg Lys

1220 1225 12301220 1225 1230

Asp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly AspAsp Tyr Gly Trp Gly Asp Tyr Tyr Leu Ser Met Val Tyr Asn Gly Asp

1235 1240 12451235 1240 1245

Ile Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile TyrIle Pro Thr Ile Asn Tyr Lys Ala Ala Ser Ser Asp Leu Lys Ile Tyr

1250 1255 12601250 1255 1260

Ile Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln LysIle Ser Pro Lys Leu Arg Ile Ile His Asn Gly Tyr Glu Gly Gln Lys

1265 1270 1275 12801265 1270 1275 1280

Arg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp LysArg Asn Gln Cys Asn Leu Met Asn Lys Tyr Gly Lys Leu Gly Asp Lys

1285 1290 12951285 1290 1295

Phe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser AsnPhe Ile Val Tyr Thr Ser Leu Gly Val Asn Pro Asn Asn Ser Ser Asn

1300 1305 13101300 1305 1310

Lys Leu Met Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Thr Ser GlyLys Leu Met Phe Tyr Pro Val Tyr Gln Tyr Ser Gly Asn Thr Ser Gly

1315 1320 13251315 1320 1325

Leu Asn Gln Gly Arg Leu Leu Phe His Arg Asp Thr Thr Tyr Pro SerLeu Asn Gln Gly Arg Leu Leu Phe His Arg Asp Thr Thr Tyr Pro Ser

1330 1335 13401330 1335 1340

Lys Val Glu Ala Trp Ile Pro Gly Ala Lys Arg Ser Leu Thr Asn GlnLys Val Glu Ala Trp Ile Pro Gly Ala Lys Arg Ser Leu Thr Asn Gln

1345 1350 1355 13601345 1350 1355 1360

Asn Ala Ala Ile Gly Asp Asp Tyr Ala Thr Asp Ser Leu Asn Lys ProAsn Ala Ala Ile Gly Asp Asp Tyr Ala Thr Asp Ser Leu Asn Lys Pro

1365 1370 13751365 1370 1375

Asp Asp Leu Lys Gln Tyr Ile Phe Met Thr Asp Ser Lys Gly Thr AlaAsp Asp Leu Lys Gln Tyr Ile Phe Met Thr Asp Ser Lys Gly Thr Ala

1380 1385 13901380 1385 1390

Thr Asp Val Ser Gly Pro Val Glu Ile Asn Thr Ala Ile Ser Pro AlaThr Asp Val Ser Gly Pro Val Glu Ile Asn Thr Ala Ile Ser Pro Ala

1395 1400 14051395 1400 1405

Lys Val Gln Ile Ile Val Lys Ala Gly Gly Lys Glu Gln Thr Phe ThrLys Val Gln Ile Ile Val Lys Ala Gly Gly Lys Glu Gln Thr Phe Thr

1410 1415 14201410 1415 1420

Ala Asp Lys Asp Val Ser Ile Gln Pro Ser Pro Ser Phe Asp Glu MetAla Asp Lys Asp Val Ser Ile Gln Pro Ser Pro Ser Phe Asp Glu Met

1425 1430 1435 14401425 1430 1435 1440

Asn Tyr Gln Phe Asn Ala Leu Glu Ile Asp Gly Ser Gly Leu Asn PheAsn Tyr Gln Phe Asn Ala Leu Glu Ile Asp Gly Ser Gly Leu Asn Phe

1445 1450 14551445 1450 1455

Ile Asn Asn Ser Ala Ser Ile Asp Val Thr Phe Thr Ala Phe Ala GluIle Asn Asn Ser Ala Ser Ile Asp Val Thr Phe Thr Ala Phe Ala Glu

1460 1465 14701460 1465 1470

Asp Gly Arg Lys Leu Gly Tyr Glu Ser Phe Ser Ile Pro Val Thr LeuAsp Gly Arg Lys Leu Gly Tyr Glu Ser Phe Ser Ile Pro Val Thr Leu

1475 1480 14851475 1480 1485

Lys Val Ser Thr Asp Asn Ala Leu Thr Leu His His Asn Glu Asn GlyLys Val Ser Thr Asp Asn Ala Leu Thr Leu His His Asn Glu Asn Gly

1490 1495 15001490 1495 1500

Ala Gln Tyr Met Gln Trp Gln Ser Tyr Arg Thr Arg Leu Asn Thr LeuAla Gln Tyr Met Gln Trp Gln Ser Tyr Arg Thr Arg Leu Asn Thr Leu

1505 1510 1515 15201505 1510 1515 1520

Phe Ala Arg Gln Leu Val Ala Arg Ala Thr Thr Gly Ile Asp Thr IlePhe Ala Arg Gln Leu Val Ala Arg Ala Thr Thr Gly Ile Asp Thr Ile

1525 1530 15351525 1530 1535

Leu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly Lys GlyLeu Ser Met Glu Thr Gln Asn Ile Gln Glu Pro Gln Leu Gly Lys Gly

1540 1545 15501540 1545 1550

Phe Tyr Ala Thr Phe Val Ile Pro Pro Tyr Asn Leu Ser Thr His GlyPhe Tyr Ala Thr Phe Val Ile Pro Pro Tyr Asn Leu Ser Thr His Gly

1555 1560 15651555 1560 1565

Asp Glu Arg Trp Phe Lys Leu Tyr Ile Lys His Val Val Asp Asn AsnAsp Glu Arg Trp Phe Lys Leu Tyr Ile Lys His Val Val Asp Asn Asn

1570 1575 15801570 1575 1580

Ser His Ile Ile Tyr Ser Gly Gln Leu Thr Asp Thr Asn Ile Asn IleSer His Ile Ile Tyr Ser Gly Gln Leu Thr Asp Thr Asn Ile Asn Ile

1585 1590 1595 16001585 1590 1595 1600

Thr Leu Phe Ile Pro Leu Asp Asp Val Pro Leu Asn Gln Asp Tyr HisThr Leu Phe Ile Pro Leu Asp Asp Val Pro Leu Asn Gln Asp Tyr His

1605 1610 16151605 1610 1615

Ala Lys Val Tyr Met Thr Phe Lys Lys Ser Pro Ser Asp Gly Thr TrpAla Lys Val Tyr Met Thr Phe Lys Lys Ser Pro Ser Asp Gly Thr Trp

1620 1625 16301620 1625 1630

Trp Gly Pro His Phe Val Arg Asp Asp Lys Gly Ile Val Thr Ile AsnTrp Gly Pro His Phe Val Arg Asp Asp Lys Gly Ile Val Thr Ile Asn

1635 1640 16451635 1640 1645

Pro Lys Ser Ile Leu Thr His Phe Glu Ser Val Asn Val Leu Asn AsnPro Lys Ser Ile Leu Thr His Phe Glu Ser Val Asn Val Leu Asn Asn

1650 1655 16601650 1655 1660

Ile Ser Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ser Leu Tyr PheIle Ser Ser Glu Pro Met Asp Phe Ser Gly Ala Asn Ser Leu Tyr Phe

1665 1670 1675 16801665 1670 1675 1680

Trp Glu Leu Phe Tyr Tyr Thr Pro Met Leu Val Ala Gln Arg Leu LeuTrp Glu Leu Phe Tyr Tyr Thr Pro Met Leu Val Ala Gln Arg Leu Leu

1685 1690 16951685 1690 1695

His Glu Gln Asn Phe Asp Glu Ala Asn Arg Trp Leu Lys Tyr Val TrpHis Glu Gln Asn Phe Asp Glu Ala Asn Arg Trp Leu Lys Tyr Val Trp

1700 1705 17101700 1705 1710

Ser Pro Ser Gly Tyr Ile Val His Gly Gln Ile Gln Asn Tyr Gln TrpSer Pro Ser Gly Tyr Ile Val His Gly Gln Ile Gln Asn Tyr Gln Trp

1715 1720 17251715 1720 1725

Asn Val Arg Pro Leu Leu Glu Asp Thr Ser Trp Asn Ser Asp Pro LeuAsn Val Arg Pro Leu Leu Glu Asp Thr Ser Trp Asn Ser Asp Pro Leu

1730 1735 17401730 1735 1740

Asp Ser Val Asp Pro Asp Ala Val Ala Gln His Asp Pro Met His TyrAsp Ser Val Asp Pro Asp Ala Val Ala Gln His Asp Pro Met His Tyr

1745 1750 1755 17601745 1750 1755 1760

Lys Val Ser Thr Phe Met Arg Thr Leu Asp Leu Leu Ile Ala Arg GlyLys Val Ser Thr Phe Met Arg Thr Leu Asp Leu Leu Ile Ala Arg Gly

1765 1770 17751765 1770 1775

Asp His Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Asn Glu Ala LysAsp His Ala Tyr Arg Gln Leu Glu Arg Asp Thr Leu Asn Glu Ala Lys

1780 1785 17901780 1785 1790

Met Trp Tyr Met Gln Ala Leu His Leu Leu Gly Asp Lys Pro Tyr LeuMet Trp Tyr Met Gln Ala Leu His Leu Leu Gly Asp Lys Pro Tyr Leu

1795 1800 18051795 1800 1805

Pro Leu Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala AspPro Leu Ser Thr Thr Trp Ser Asp Pro Arg Leu Asp Arg Ala Ala Asp

1810 1815 18201810 1815 1820

Ile Thr Thr Gln Asn Ala His Asp Ser Ala Ile Val Ala Leu Arg GlnIle Thr Thr Gln Asn Ala His Asp Ser Ala Ile Val Ala Leu Arg Gln

1825 1830 1835 18401825 1830 1835 1840

Asn Ile Pro Thr Pro Ala Pro Leu SerAsn Ile Pro Thr Pro Ala Pro Leu Ser

1845 18491845 1849

(2) INFORMATION FOR SEQ ID NO:50:(2) INFORMATION FOR SEQ ID NO: 50:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1740 base pairs(A) LENGTH: 1740 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:50 (tcdAiii coding(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 50 (tcdAiii coding

region):region):

TTG CGC AGC GCT AAT ACC CTG ACT GAT CTC TTC CTG CCG CAA ATC AAT 48TTG CGC AGC GCT AAT ACC CTG ACT GAT CTC TTC CTG CCG CAA ATC AAT 48

Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile AsnLeu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile Asn

1 5 10 151 5 10 15

GAA GTG ATG ATG AAT TAC TGG CAG ACA TTA GCT CAG AGA GTA TAC AAT 96GAA GTG ATG ATG AAT TAC TGG CAG ACA TTA GCT CAG AGA GTA TAC AAT 96

Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr AsnGlu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr Asn

20 25 3020 25 30

CTG CGT CAT AAC CTC TCT ATC GAC GGC CAG CCG TTA TAT CTG CCA ATC 144CTG CGT CAT AAC CTC TCT ATC GAC GGC CAG CCG TTA TAT CTG CCA ATC 144

Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro IleLeu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro Ile

35 40 4535 40 45

TAT GCC ACA CCG GCC GAT CCG AAA GCG TTA CTC AGC GCC GCC GTT GCC 192TAT GCC ACA CCG GCC GAT CCG AAA GCG TTA CTC AGC GCC GCC GTT GCC 192

Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val AlaTyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ala

50 55 6050 55 60

ACT TCT CAA GGT GGA GGC AAG CTA CCG GAA TCA TTT ATG TCC CTG TGG 240ACT TCT CAA GGT GGA GGC AAG CTA CCG GAA TCA TTT ATG TCC CTG TGG 240

Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu TrpThr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu Trp

65 70 75 8065 70 75 80

CGT TTC CCG CAC ATG CTG GAA AAT GCG CGC GGC ATG GTT AGC CAG CTC 288CGT TTC CCG CAC ATG CTG GAA AAT GCG CGC GGC ATG GTT AGC CAG CTC 288

Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln LeuArg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln Leu

85 90 9585 90 95

ACC CAG TTC GGC TCC ACG TTA CAA AAT ATT ATC GAA CGT CAG GAC GCG 336ACC CAG TTC GGC TCC ACG TTA CAA AAT ATT ATC GAA CGT CAG GAC GCG 336

Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Ile Glu Arg Gln Asp AlaThr Gln Phe Gly Ser Thr Leu Gln Asn Ile Glu Arg Gln Asp Ala

100 105 110100 105 110

GAA GCG CTC AAT GCG TTA TTA CAA AAT CAG GCC GCC GAG CTG ATA TTG 384GAA GCG CTC AAT GCG TTA TTA CAA AAT CAG GCC GCC GAG CTG ATA TTG 384

Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile LeuGlu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile Leu

115 120 125115 120 125

ACT AAC CTG AGC ATT CAG GAC AAA ACC ATT GAA GAA TTG GAT GCC GAG 432ACT AAC CTG AGC ATT CAG GAC AAA ACC ATT GAA GAA TTG GAT GCC GAG 432

Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala GluThr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala Glu

130 135 140130 135 140

AAA ACG GTG TTG GAA AAA TCC AAA GCG GGA GCA CAA TCG CGC TTT GAT 480AAA ACG GTG TTG GAA AAA TCC AAA GCG GGA GCA CAA TCG CGC TTT GAT 480

Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe AspLys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe Asp

145 150 155 160145 150 155 160

AGC TAC GGC AAA CTG TAC GAT GAG AAT ATC AAC GCC GGT GAA AAC CAA 528AGC TAC GGC AAA CTG TAC GAT GAG AAT ATC AAC GCC GGT GAA AAC CAA 528

Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn GlnSer Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn Gln

165 170 175165 170 175

GCC ATG ACG CTA CGA GCG TCC GCC GCC GGG CTT ACC ACG GCA GTT CAG 576GCC ATG ACG CTA CGA GCG TCC GCC GCC GGG CTT ACC ACG GCA GTT CAG 576

Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val GlnAla Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val Gln

180 185 190180 185 190

GCA TCC CGT CTG GCC GGT GCG GCG GCT GAT CTG GTG CCT AAC ATC TTC 624GCA TCC CGT CTG GCC GGT GCG GCG GCT GAT CTG GTG CCT AAC ATC TTC 624

Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile PheAla Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile Phe

195 200 205195 200 205

GGC TTT GCC GGT GGC GGC AGC CGT TGG GGG GCT ATC GCT GAG GCG ACA 672GGC TTT GCC GGT GGC GGC AGC CGT TGG GGG GCT ATC GCT GAG GCG ACA 672

Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala ThrGly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala Thr

210 215 220210 215 220

GGT TAT GTG ATG GAA TTC TCC GCG AAT GTT ATG AAC ACC GAA GCG GAT 720GGT TAT GTG ATG GAA TTC TCC GCG AAT GTT ATG AAC ACC GAA GCG GAT 720

Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala AspGly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala Asp

225 230 235 240225 230 235 240

AAA ATT AGC CAA TCT GAA ACC TAC CGT CGT CGC CGT CAG GAG TGG GAG 768AAA ATT AGC CAA TCT GAA ACC TAC CGT CGT CGC CGT CAG GAG TGG GAG 768

Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp GluLys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp Glu

245 250 255245 250 255

ATC CAG CGG AAT AAT GCC GAA GCG GAA TTG AAG CAA ATC GAT GCT CAG 816ATC CAG CGG AAT AAT GCC GAA GCG GAA TTG AAG CAA ATC GAT GCT CAG 816

Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala GlnIle Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala Gln

260 265 270260 265 270

CTC AAA TCA CTC GCT GTA CGC CGC GAA GCC GCC GTA TTG CAG AAA ACC 864CTC AAA TCA CTC GCT GTA CGC CGC GAA GCC GCC GTA TTG CAG AAA ACC 864

Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys ThrLeu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys Thr

275 280 285275 280 285

AGT CTG AAA ACC CAA CAA GAA CAG ACC CAA TCT CAA TTG GCC TTC CTG 912AGT CTG AAA ACC CAA CAA GAA CAG ACC CAA TCT CAA TTG GCC TTC CTG 912

Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe LeuSer Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe Leu

290 295 300290 295 300

CAA CGT AAG TTC AGC AAT CAG GCG TTA TAC AAC TGG CTG CGT GGT CGA 960CAA CGT AAG TTC AGC AAT CAG GCG TTA TAC AAC TGG CTG CGT GGT CGA 960

Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly ArgGln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly Arg

305 310 315 320305 310 315 320

CTG GCG GCG ATT TAC TTC CAG TTC TAC GAT TTG GCC GTC GCG CGT TGC 1008CTG GCG GCG ATT TAC TTC CAG TTC TAC GAT TTG GCC GTC GCG CGT TGC 1008

Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg CysLeu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg Cys

325 330 335325 330 335

CTG ATG GCA GAA CAA GCT TAC CGT TGG GAA CTC AAT GAT GAC TCT GCC 1056CTG ATG GCA GAA CAA GCT TAC CGT TGG GAA CTC AAT GAT GAC TCT GCC 1056

Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser AlaLeu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser Ala

340 345 350340 345 350

CGC TTC ATT AAA CCG GGC GCC TGG CAG GGA ACC TAT GCC GGT CTG CTT 1104CGC TTC ATT AAA CCG GGC GCC TGG CAG GGA ACC TAT GCC GGT CTG CTT 1104

Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu LeuArg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu

355 360 365355 360 365

GCA GGT GAA ACC TTG ATG CTG AGT CTG GCA CAA ATG GAA GAC GCT CAT 1152GCA GGT GAA ACC TTG ATG CTG AGT CTG GCA CAA ATG GAA GAC GCT CAT 1152

Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala HisAla Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala His

370 375 380370 375 380

CTG AAA CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCG CTG 1200CTG AAA CGC GAT AAA CGC GCA TTA GAG GTT GAA CGC ACA GTA TCG CTG 1200

Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser LeuLeu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu

385 390 395 400385 390 395 400

GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC CTG 1248GCC GAA GTT TAT GCA GGA TTA CCA AAA GAT AAC GGT CCA TTT TCC CTG 1248

Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser LeuAla Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser Leu

405 410 415405 410 415

GCT CAG GAA ATT GAC AAG CTG GTG AGT CAA GGT TCA GGC AGT GCC GGC 1296GCT CAG GAA ATT GAC AAG CTG GTG AGT CAA GGT TCA GGC AGT GCC GGC 1296

Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala GlyAla Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala Gly

420 425 430420 425 430

AGT GGT AAT AAT AAT TTG GCG TTC GGC GCC GGC ACG GAC ACT AAA ACC 1344AGT GGT AAT AAT AAT TTG GCG TTC GGC GCC GGC ACG GAC ACT AAA ACC 1344

Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys ThrSer Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys Thr

435 440 445435 440 445

TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTG AAA ATT CGT GAA GAT 1392TCT TTG CAG GCA TCA GTT TCA TTC GCT GAT TTG AAA ATT CGT GAA GAT 1392

Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu AspSer Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu Asp

450 455 460450 455 460

TAC CCG GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC GTC 1440TAC CCG GCA TCG CTT GGC AAA ATT CGA CGT ATC AAA CAG ATC AGC GTC 1440

Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser ValTyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser Val

465 470 475 480465 470 475 480

ACT TTG CCC GCG CTA CTG GGA CCG TAT CAG GAT GTA CAG GCA ATA TTG 1488ACT TTG CCC GCG CTA CTG GGA CCG TAT CAG GAT GTA CAG GCA ATA TTG 1488

Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile LeuThr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile Leu

485 490 495485 490 495

TCT TAC GGC GAT AAA GCC GGA TTA GCT AAC GGC TGT GAA GCG CTG GCA 1536TCT TAC GGC GAT AAA GCC GGA TTA GCT AAC GGC TGT GAA GCG CTG GCA 1536

Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu AlaSer Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu Ala

500 505 510500 505 510

GTT TCT CAC GGT ATG AAT GAC AGC GGC CAA TTC CAG CTC GAT TTC AAC 1584GTT TCT CAC GGT ATG AAT GAC AGC GGC CAA TTC CAG CTC GAT TTC AAC 1584

Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe AsnVal Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn

515 520 525515 520 525

GAT GGC AAA TTC CTG CCA TTC GAA GGC ATC GCC ATT GAT CAA GGC ACG 1632GAT GGC AAA TTC CTG CCA TTC GAA GGC ATC GCC ATT GAT CAA GGC ACG 1632

Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly ThrAsp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly Thr

530 535 540530 535 540

CTG ACA CTG AGC TTC CCA AAT GCA TCT ATG CCG GAG AAA GGT AAA CAA 1680CTG ACA CTG AGC TTC CCA AAT GCA TCT ATG CCG GAG AAA GGT AAA CAA 1680

Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys GlnLeu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys Gln

545 550 555 560545 550 555 560

GCC ACT ATG TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC TAC 1728GCC ACT ATG TTA AAA ACC CTG AAC GAT ATC ATT TTG CAT ATT CGC TAC 1728

Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg TyrAla Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg Tyr

565 570 575565 570 575

ACC ATT AAA TAA 1740ACC ATT AAA TAA 1740

Thr Ile Lys ⅴ?Thr Ile Lys

579579

(2) INFORMATION FOR SEQ ID NO:51:(2) INFORMATION FOR SEQ ID NO: 51:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 579 amino acids(A) LENGTH: 579 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:51 (TcdAiii):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 51 (TcdAiii):

Leu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile AsnLeu Arg Ser Ala Asn Thr Leu Thr Asp Leu Phe Leu Pro Gln Ile Asn

1 5 10 151 5 10 15

Glu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr AsnGlu Val Met Met Asn Tyr Trp Gln Thr Leu Ala Gln Arg Val Tyr Asn

20 25 3020 25 30

Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro IleLeu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Tyr Leu Pro Ile

35 40 4535 40 45

Tyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val AlaTyr Ala Thr Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ala

50 55 6050 55 60

Thr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu TrpThr Ser Gln Gly Gly Gly Lys Leu Pro Glu Ser Phe Met Ser Leu Trp

65 70 75 8065 70 75 80

Arg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln LeuArg Phe Pro His Met Leu Glu Asn Ala Arg Gly Met Val Ser Gln Leu

85 90 9585 90 95

Thr Gln Phe Gly Ser Thr Leu Gln Asn Ile Ile Glu Arg Gln Asp AlaThr Gln Phe Gly Ser Thr Leu Gln Asn Ile Glu Arg Gln Asp Ala

100 105 110100 105 110

Glu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile LeuGlu Ala Leu Asn Ala Leu Leu Gln Asn Gln Ala Ala Glu Leu Ile Leu

115 120 125115 120 125

Thr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala GluThr Asn Leu Ser Ile Gln Asp Lys Thr Ile Glu Glu Leu Asp Ala Glu

130 135 140130 135 140

Lys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe AspLys Thr Val Leu Glu Lys Ser Lys Ala Gly Ala Gln Ser Arg Phe Asp

145 150 155 160145 150 155 160

Ser Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn GlnSer Tyr Gly Lys Leu Tyr Asp Glu Asn Ile Asn Ala Gly Glu Asn Gln

165 170 175165 170 175

Ala Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val GlnAla Met Thr Leu Arg Ala Ser Ala Ala Gly Leu Thr Thr Ala Val Gln

180 185 190180 185 190

Ala Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile PheAla Ser Arg Leu Ala Gly Ala Ala Ala Asp Leu Val Pro Asn Ile Phe

195 200 205195 200 205

Gly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala ThrGly Phe Ala Gly Gly Gly Ser Arg Trp Gly Ala Ile Ala Glu Ala Thr

210 215 220210 215 220

Gly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala AspGly Tyr Val Met Glu Phe Ser Ala Asn Val Met Asn Thr Glu Ala Asp

225 230 235 240225 230 235 240

Lys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp GluLys Ile Ser Gln Ser Glu Thr Tyr Arg Arg Arg Arg Gln Glu Trp Glu

245 250 255245 250 255

Ile Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala GlnIle Gln Arg Asn Asn Ala Glu Ala Glu Leu Lys Gln Ile Asp Ala Gln

260 265 270260 265 270

Leu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys ThrLeu Lys Ser Leu Ala Val Arg Arg Glu Ala Ala Val Leu Gln Lys Thr

275 280 285275 280 285

Ser Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe LeuSer Leu Lys Thr Gln Gln Glu Gln Thr Gln Ser Gln Leu Ala Phe Leu

290 295 300290 295 300

Gln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly ArgGln Arg Lys Phe Ser Asn Gln Ala Leu Tyr Asn Trp Leu Arg Gly Arg

305 310 315 320305 310 315 320

Leu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg CysLeu Ala Ala Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ala Arg Cys

325 330 335325 330 335

Leu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser AlaLeu Met Ala Glu Gln Ala Tyr Arg Trp Glu Leu Asn Asp Asp Ser Ala

340 345 350340 345 350

Arg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu LeuArg Phe Ile Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu

355 360 365355 360 365

Ala Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala HisAla Gly Glu Thr Leu Met Leu Ser Leu Ala Gln Met Glu Asp Ala His

370 375 380370 375 380

Leu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser LeuLeu Lys Arg Asp Lys Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu

385 390 395 400385 390 395 400

Ala Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser LeuAla Glu Val Tyr Ala Gly Leu Pro Lys Asp Asn Gly Pro Phe Ser Leu

405 410 415405 410 415

Ala Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala GlyAla Gln Glu Ile Asp Lys Leu Val Ser Gln Gly Ser Gly Ser Ala Gly

420 425 430420 425 430

Ser Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys ThrSer Gly Asn Asn Asn Leu Ala Phe Gly Ala Gly Thr Asp Thr Lys Thr

435 440 445435 440 445

Ser Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu AspSer Leu Gln Ala Ser Val Ser Phe Ala Asp Leu Lys Ile Arg Glu Asp

450 455 460450 455 460

Tyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser ValTyr Pro Ala Ser Leu Gly Lys Ile Arg Arg Ile Lys Gln Ile Ser Val

465 470 475 480465 470 475 480

Thr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile LeuThr Leu Pro Ala Leu Leu Gly Pro Tyr Gln Asp Val Gln Ala Ile Leu

485 490 495485 490 495

Ser Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu AlaSer Tyr Gly Asp Lys Ala Gly Leu Ala Asn Gly Cys Glu Ala Leu Ala

500 505 510500 505 510

Val Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe AsnVal Ser His Gly Met Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn

515 520 525515 520 525

Asp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly ThrAsp Gly Lys Phe Leu Pro Phe Glu Gly Ile Ala Ile Asp Gln Gly Thr

530 535 540530 535 540

Leu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys GlnLeu Thr Leu Ser Phe Pro Asn Ala Ser Met Pro Glu Lys Gly Lys Gln

545 550 555 560545 550 555 560

Ala Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg TyrAla Thr Met Leu Lys Thr Leu Asn Asp Ile Ile Leu His Ile Arg Tyr

565 570 575565 570 575

Thr Ile Lys ⅴ?Thr Ile Lys

579579

(2) INFORMATION FOR SEQ ID NO:52:(2) INFORMATION FOR SEQ ID NO: 52:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 5532 base pairs(A) LENGTH: 5532 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:52 (tcbAii coding(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 52 (tcbAii coding

region):region):

TTT ATA CAA GGT TAT AGT GAT CTG TTT GGT AAT CGT GCT GAT AAC TAT 48TTT ATA CAA GGT TAT AGT GAT CTG TTT GGT AAT CGT GCT GAT AAC TAT 48

Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala Asp Asn TyrPhe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala Asp Asn Tyr

1 5 10 151 5 10 15

GCC GCG CCG GGC TCG GTT GCA TCG ATG TTC TCA CCG GCG GCT TAT TTG 96GCC GCG CCG GGC TCG GTT GCA TCG ATG TTC TCA CCG GCG GCT TAT TTG 96

Ala Ala Pro Gly Ser Val Ala Ser Met Phe Ser Pro Ala Ala Tyr LeuAla Ala Pro Gly Ser Val Ala Ser Met Phe Ser Pro Ala Ala Tyr Leu

20 25 3020 25 30

ACG GAA TTG TAC CGT GAA GCC AAA AAC TTG CAT GAC AGC AGC TCA ATT 144ACG GAA TTG TAC CGT GAA GCC AAA AAC TTG CAT GAC AGC AGC TCA ATT 144

Thr Glu Leu Tyr Arg Glu Ala Lys Asn Leu His Asp Ser Ser Ser IleThr Glu Leu Tyr Arg Glu Ala Lys Asn Leu His Asp Ser Ser Ser Ile

35 40 4535 40 45

TAT TAC CTA GAT AAA CGT CGC CCG GAT TTA GCA AGC TTA ATG CTC AGC 192TAT TAC CTA GAT AAA CGT CGC CCG GAT TTA GCA AGC TTA ATG CTC AGC 192

Tyr Tyr Leu Asp Lys Arg Arg Pro Asp Leu Ala Ser Leu Met Leu SerTyr Tyr Leu Asp Lys Arg Arg Pro Asp Leu Ala Ser Leu Met Leu Ser

50 55 6050 55 60

CAG AAA AAT ATG GAT GAG GAA ATT TCA ACG CTG GCT CTC TCT AAT GAA 240CAG AAA AAT ATG GAT GAG GAA ATT TCA ACG CTG GCT CTC TCT AAT GAA 240

Gln Lys Asn Met Asp Glu Glu Ile Ser Thr Leu Ala Leu Ser Asn GluGln Lys Asn Met Asp Glu Glu Ile Ser Thr Leu Ala Leu Ser Asn Glu

65 70 75 8065 70 75 80

TTG TGC CTT GCC GGG ATC GAA ACA AAA ACA GGA AAA TCA CAA GAT GAA 288TTG TGC CTT GCC GGG ATC GAA ACA AAA ACA GGA AAA TCA CAA GAT GAA 288

Leu Cys Leu Ala Gly Ile Glu Thr Lys Thr Gly Lys Ser Gln Asp GluLeu Cys Leu Ala Gly Ile Glu Thr Lys Thr Gly Lys Ser Gln Asp Glu

85 90 9585 90 95

GTG ATG GAT ATG TTG TCA ACT TAT CGT TTA AGT GGA GAG ACA CCT TAT 336GTG ATG GAT ATG TTG TCA ACT TAT CGT TTA AGT GGA GAG ACA CCT TAT 336

Val Met Asp Met Leu Ser Thr Tyr Arg Leu Ser Gly Glu Thr Pro TyrVal Met Asp Met Leu Ser Thr Tyr Arg Leu Ser Gly Glu Thr Pro Tyr

100 105 110100 105 110

CAT CAC GCT TAT GAA ACT GTT CGT GAA ATC GTT CAT GAA CGT GAT CCA 384CAT CAC GCT TAT GAA ACT GTT CGT GAA ATC GTT CAT GAA CGT GAT CCA 384

His His Ala Tyr Glu Thr Val Arg Glu Ile Val His Glu Arg Asp ProHis His Ala Tyr Glu Thr Val Arg Glu Ile Val His Glu Arg Asp Pro

115 120 125115 120 125

GGA TTT CGT CAT TTG TCA CAG GCA CCC ATT GTT GCT GCT AAG CTC GAT 432GGA TTT CGT CAT TTG TCA CAG GCA CCC ATT GTT GCT GCT AAG CTC GAT 432

Gly Phe Arg His Leu Ser Gln Ala Pro Ile Val Ala Ala Lys Leu AspGly Phe Arg His Leu Ser Gln Ala Pro Ile Val Ala Ala Lys Leu Asp

130 135 140130 135 140

CCT GTG ACT TTG TTG GGT ATT AGC TCC CAT ATT TCG CCA GAA CTG TAT 480CCT GTG ACT TTG TTG GGT ATT AGC TCC CAT ATT TCG CCA GAA CTG TAT 480

Pro Val Thr Leu Leu Gly Ile Ser Ser His Ile Ser Pro Glu Leu TyrPro Val Thr Leu Leu Gly Ile Ser Ser His Ile Ser Pro Glu Leu Tyr

145 150 155 160145 150 155 160

AAC TTG CTG ATT GAG GAG ATC CCG GAA AAA GAT GAA GCC GCG CTT GAT 528AAC TTG CTG ATT GAG GAG ATC CCG GAA AAA GAT GAA GCC GCG CTT GAT 528

Asn Leu Leu Ile Glu Glu Ile Pro Glu Lys Asp Glu Ala Ala Leu AspAsn Leu Leu Ile Glu Glu Ile Pro Glu Lys Asp Glu Ala Ala Leu Asp

165 170 175165 170 175

ACG CTT TAT AAA ACA AAC TTT GGC GAT ATT ACT ACT GCT CAG TTA ATG 576ACG CTT TAT AAA ACA AAC TTT GGC GAT ATT ACT ACT GCT CAG TTA ATG 576

Thr Leu Tyr Lys Thr Asn Phe Gly Asp Ile Thr Thr Ala Gln Leu MetThr Leu Tyr Lys Thr Asn Phe Gly Asp Ile Thr Thr Ala Gln Leu Met

180 185 190180 185 190

TCC CCA AGT TAT CTG GCC CGG TAT TAT GGC GTC TCA CCG GAA GAT ATT 624TCC CCA AGT TAT CTG GCC CGG TAT TAT GGC GTC TCA CCG GAA GAT ATT 624

Ser Pro Ser Tyr Leu Ala Arg Tyr Tyr Gly Val Ser Pro Glu Asp IleSer Pro Ser Tyr Leu Ala Arg Tyr Tyr Gly Val Ser Pro Glu Asp Ile

195 200 205195 200 205

GCC TAC GTG ACG ACT TCA TTA TCA CAT GTT GGA TAT AGC AGT GAT ATT 672GCC TAC GTG ACG ACT TCA TTA TCA CAT GTT GGA TAT AGC AGT GAT ATT 672

Ala Tyr Val Thr Thr Ser Leu Ser His Val Gly Tyr Ser Ser Asp IleAla Tyr Val Thr Thr Ser Leu Ser His Val Gly Tyr Ser Ser Asp Ile

210 215 220210 215 220

CTG GTT ATT CCG TTG GTC GAT GGT GTG GGT AAG ATG GAA GTA GTT CGT 720CTG GTT ATT CCG TTG GTC GAT GGT GTG GGT AAG ATG GAA GTA GTT CGT 720

Leu Val Ile Pro Leu Val Asp Gly Val Gly Lys Met Glu Val Val ArgLeu Val Ile Pro Leu Val Asp Gly Val Gly Lys Met Glu Val Val Arg

225 230 235 240225 230 235 240

GTT ACC CGA ACA CCA TCG GAT AAT TAT ACC AGT CAG ACG AAT TAT ATT 768GTT ACC CGA ACA CCA TCG GAT AAT TAT ACC AGT CAG ACG AAT TAT ATT 768

Val Thr Arg Thr Pro Ser Asp Asn Tyr Thr Ser Gln Thr Asn Tyr IleVal Thr Arg Thr Pro Ser Asp Asn Tyr Thr Ser Gln Thr Asn Tyr Ile

245 250 255245 250 255

GAG CTG TAT CCA CAG GGT GGC GAC AAT TAT TTG ATC AAA TAC AAT CTA 816GAG CTG TAT CCA CAG GGT GGC GAC AAT TAT TTG ATC AAA TAC AAT CTA 816

Glu Leu Tyr Pro Gln Gly Gly Asp Asn Tyr Leu Ile Lys Tyr Asn LeuGlu Leu Tyr Pro Gln Gly Gly Asp Asn Tyr Leu Ile Lys Tyr Asn Leu

260 265 270260 265 270

AGC AAT AGT TTT GGT TTG GAT GAT TTT TAT CTG CAA TAT AAA GAT GGT 864AGC AAT AGT TTT GGT TTG GAT GAT TTT TAT CTG CAA TAT AAA GAT GGT 864

Ser Asn Ser Phe Gly Leu Asp Asp Phe Tyr Leu Gln Tyr Lys Asp GlySer Asn Ser Phe Gly Leu Asp Asp Phe Tyr Leu Gln Tyr Lys Asp Gly

275 280 285275 280 285

TCC GCT GAT TGG ACT GAG ATT GCC CAT AAT CCC TAT CCT GAT ATG GTC 912TCC GCT GAT TGG ACT GAG ATT GCC CAT AAT CCC TAT CCT GAT ATG GTC 912

Ser Ala Asp Trp Thr Glu Ile Ala His Asn Pro Tyr Pro Asp Met ValSer Ala Asp Trp Thr Glu Ile Ala His Asn Pro Tyr Pro Asp Met Val

290 295 300290 295 300

ATA AAT CAA AAG TAT GAA TCA CAG GCG ACA ATC AAA CGT AGT GAC TCT 960ATA AAT CAA AAG TAT GAA TCA CAG GCG ACA ATC AAA CGT AGT GAC TCT 960

Ile Asn Gln Lys Tyr Glu Ser Gln Ala Thr Ile Lys Arg Ser Asp SerIle Asn Gln Lys Tyr Glu Ser Gln Ala Thr Ile Lys Arg Ser Asp Ser

305 310 315 320305 310 315 320

GAC AAT ATA CTC AGT ATA GGG TTA CAA AGA TGG CAT AGC GGT AGT TAT 1008GAC AAT ATA CTC AGT ATA GGG TTA CAA AGA TGG CAT AGC GGT AGT TAT 1008

Asp Asn Ile Leu Ser Ile Gly Leu Gln Arg Trp His Ser Gly Ser TyrAsp Asn Ile Leu Ser Ile Gly Leu Gln Arg Trp His Ser Gly Ser Tyr

325 330 335325 330 335

AAT TTT GCC GCC GCC AAT TTT AAA ATT GAC CAA TAC TCC CCG AAA GCT 1056AAT TTT GCC GCC GCC AAT TTT AAA ATT GAC CAA TAC TCC CCG AAA GCT 1056

Asn Phe Ala Ala Ala Asn Phe Lys Ile Asp Gln Tyr Ser Pro Lys AlaAsn Phe Ala Ala Ala Asn Phe Lys Ile Asp Gln Tyr Ser Pro Lys Ala

340 345 350340 345 350

TTC CTG CTT AAA ATG AAT AAG GCT ATT CGG TTG CTC AAA GCT ACC GGC 1104TTC CTG CTT AAA ATG AAT AAG GCT ATT CGG TTG CTC AAA GCT ACC GGC 1104

Phe Leu Leu Lys Met Asn Lys Ala Ile Arg Leu Leu Lys Ala Thr GlyPhe Leu Leu Lys Met Asn Lys Ala Ile Arg Leu Leu Lys Ala Thr Gly

355 360 365355 360 365

CTC TCT TTT GCT ACG TTG GAG CGT ATT GTT GAT AGT GTT AAT AGC ACC 1152CTC TCT TTT GCT ACG TTG GAG CGT ATT GTT GAT AGT GTT AAT AGC ACC 1152

Leu Ser Phe Ala Thr Leu Glu Arg Ile Val Asp Ser Val Asn Ser ThrLeu Ser Phe Ala Thr Leu Glu Arg Ile Val Asp Ser Val Asn Ser Thr

370 375 380370 375 380

AAA TCC ATC ACG GTT GAG GTA TTA AAC AAG GTT TAT CGG GTA AAA TTC 1200AAA TCC ATC ACG GTT GAG GTA TTA AAC AAG GTT TAT CGG GTA AAA TTC 1200

Lys Ser Ile Thr Val Glu Val Leu Asn Lys Val Tyr Arg Val Lys PheLys Ser Ile Thr Val Glu Val Leu Asn Lys Val Tyr Arg Val Lys Phe

385 390 395 400385 390 395 400

TAT ATT GAT CGT TAT GGC ATC AGT GAA GAG ACA GCC GCT ATT TTG GCT 1248TAT ATT GAT CGT TAT GGC ATC AGT GAA GAG ACA GCC GCT ATT TTG GCT 1248

Tyr Ile Asp Arg Tyr Gly Ile Ser Glu Glu Thr Ala Ala Ile Leu AlaTyr Ile Asp Arg Tyr Gly Ile Ser Glu Glu Thr Ala Ala Ile Leu Ala

405 410 415405 410 415

AAT ATT AAT ATC TCT CAG CAA GCT GTT GGC AAT CAG CTT AGC CAG TTT 1296AAT ATT AAT ATC TCT CAG CAA GCT GTT GGC AAT CAG CTT AGC CAG TTT 1296

Asn Ile Asn Ile Ser Gln Gln Ala Val Gly Asn Gln Leu Ser Gln PheAsn Ile Asn Ile Ser Gln Gln Ala Val Gly Asn Gln Leu Ser Gln Phe

420 425 430420 425 430

GAG CAA CTA TTT AAT CAC CCG CCG CTC AAT GGT ATT CGC TAT GAA ATC 1344GAG CAA CTA TTT AAT CAC CCG CCG CTC AAT GGT ATT CGC TAT GAA ATC 1344

Glu Gln Leu Phe Asn His Pro Pro Leu Asn Gly Ile Arg Tyr Glu IleGlu Gln Leu Phe Asn His Pro Pro Leu Asn Gly Ile Arg Tyr Glu Ile

435 440 445435 440 445

AGT GAG GAC AAC TCC AAA CAT CTT CCT AAT CCT GAT CTG AAC CTT AAA 1392AGT GAG GAC AAC TCC AAA CAT CTT CCT AAT CCT GAT CTG AAC CTT AAA 1392

Ser Glu Asp Asn Ser Lys His Leu Pro Asn Pro Asp Leu Asn Leu LysSer Glu Asp Asn Ser Lys His Leu Pro Asn Pro Asp Leu Asn Leu Lys

450 455 460450 455 460

CCA GAC AGT ACC GGT GAT GAT CAA CGC AAG GCG GTT TTA AAA CGC GCG 1440CCA GAC AGT ACC GGT GAT GAT CAA CGC AAG GCG GTT TTA AAA CGC GCG 1440

Pro Asp Ser Thr Gly Asp Asp Gln Arg Lys Ala Val Leu Lys Arg AlaPro Asp Ser Thr Gly Asp Asp Gln Arg Lys Ala Val Leu Lys Arg Ala

465 470 475 480465 470 475 480

TTT CAG GTT AAC GCC AGT GAG TTG TAT CAG ATG TTA TTG ATC ACT GAT 1488TTT CAG GTT AAC GCC AGT GAG TTG TAT CAG ATG TTA TTG ATC ACT GAT 1488

Phe Gln Val Asn Ala Ser Glu Leu Tyr Gln Met Leu Leu Ile Thr AspPhe Gln Val Asn Ala Ser Glu Leu Tyr Gln Met Leu Leu Ile Thr Asp

485 490 495485 490 495

CGT AAA GAA GAC GGT GTT ATC AAA AAT AAC TTA GAG AAT TTG TCT GAT 1536CGT AAA GAA GAC GGT GTT ATC AAA AAT AAC TTA GAG AAT TTG TCT GAT 1536

Arg Lys Glu Asp Gly Val Ile Lys Asn Asn Leu Glu Asn Leu Ser AspArg Lys Glu Asp Gly Val Ile Lys Asn Asn Leu Glu Asn Leu Ser Asp

500 505 510500 505 510

CTG TAT TTG GTT AGT TTG CTG GCC CAG ATT CAT AAC CTG ACT ATT GCT 1584CTG TAT TTG GTT AGT TTG CTG GCC CAG ATT CAT AAC CTG ACT ATT GCT 1584

Leu Tyr Leu Val Ser Leu Leu Ala Gln Ile His Asn Leu Thr Ile AlaLeu Tyr Leu Val Ser Leu Leu Ala Gln Ile His Asn Leu Thr Ile Ala

515 520 525515 520 525

GAA TTG AAC ATT TTG TTG GTG ATT TGT GGC TAT GGC GAC ACC AAC ATT 1632GAA TTG AAC ATT TTG TTG GTG ATT TGT GGC TAT GGC GAC ACC AAC ATT 1632

Glu Leu Asn Ile Leu Leu Val Ile Cys Gly Tyr Gly Asp Thr Asn IleGlu Leu Asn Ile Leu Leu Val Ile Cys Gly Tyr Gly Asp Thr Asn Ile

530 535 540530 535 540

TAT CAG ATT ACC GAC GAT AAT TTA GCC AAA ATA GTG GAA ACA TTG TTG 1680TAT CAG ATT ACC GAC GAT AAT TTA GCC AAA ATA GTG GAA ACA TTG TTG 1680

Tyr Gln Ile Thr Asp Asp Asn Leu Ala Lys Ile Val Glu Thr Leu LeuTyr Gln Ile Thr Asp Asp Asn Leu Ala Lys Ile Val Glu Thr Leu Leu

545 550 555 560545 550 555 560

TGG ATC ACT CAA TGG TTG AAG ACC CAA AAA TGG ACA GTT ACC GAC CTG 1728TGG ATC ACT CAA TGG TTG AAG ACC CAA AAA TGG ACA GTT ACC GAC CTG 1728

Trp Ile Thr Gln Trp Leu Lys Thr Gln Lys Trp Thr Val Thr Asp LeuTrp Ile Thr Gln Trp Leu Lys Thr Gln Lys Trp Thr Val Thr Asp Leu

565 570 575565 570 575

TTT CTG ATG ACC ACG GCC ACT TAC AGC ACC ACT TTA ACG CCA GAA ATT 1776TTT CTG ATG ACC ACG GCC ACT TAC AGC ACC ACT TTA ACG CCA GAA ATT 1776

Phe Leu Met Thr Thr Ala Thr Tyr Ser Thr Thr Leu Thr Pro Glu IlePhe Leu Met Thr Thr Ala Thr Tyr Ser Thr Thr Leu Thr Pro Glu Ile

580 585 590580 585 590

AGC AAT CTG ACG GCT ACG TTG TCT TCA ACT TTG CAT GGC AAA GAG AGT 1824AGC AAT CTG ACG GCT ACG TTG TCT TCA ACT TTG CAT GGC AAA GAG AGT 1824

Ser Asn Leu Thr Ala Thr Leu Ser Ser Thr Leu His Gly Lys Glu SerSer Asn Leu Thr Ala Thr Leu Ser Ser Thr Leu His Gly Lys Glu Ser

595 600 605595 600 605

CTG ATT GGG GAA GAT CTG AAA AGA GCA ATG GCG CCT TGC TTC ACT TCG 1872CTG ATT GGG GAA GAT CTG AAA AGA GCA ATG GCG CCT TGC TTC ACT TCG 1872

Leu Ile Gly Glu Asp Leu Lys Arg Ala Met Ala Pro Cys Phe Thr SerLeu Ile Gly Glu Asp Leu Lys Arg Ala Met Ala Pro Cys Phe Thr Ser

610 615 620610 615 620

GCT TTG CAT TTG ACT TCT CAA GAA GTT GCG TAT GAC CTG CTG TTG TGG 1920GCT TTG CAT TTG ACT TCT CAA GAA GTT GCG TAT GAC CTG CTG TTG TGG 1920

Ala Leu His Leu Thr Ser Gln Glu Val Ala Tyr Asp Leu Leu Leu TrpAla Leu His Leu Thr Ser Gln Glu Val Ala Tyr Asp Leu Leu Leu Trp

625 630 635 640625 630 635 640

ATA GAC CAG ATT CAA CCG GCA CAA ATA ACT GTT GAT GGG TTT TGG GAA 1968ATA GAC CAG ATT CAA CCG GCA CAA ATA ACT GTT GAT GGG TTT TGG GAA 1968

Ile Asp Gln Ile Gln Pro Ala Gln Ile Thr Val Asp Gly Phe Trp GluIle Asp Gln Ile Gln Pro Ala Gln Ile Thr Val Asp Gly Phe Trp Glu

645 650 655645 650 655

GAA GTG CAA ACA ACA CCA ACC AGC TTG AAG GTG ATT ACC TTT GCT CAG 2016GAA GTG CAA ACA ACA CCA ACC AGC TTG AAG GTG ATT ACC TTT GCT CAG 2016

Glu Val Gln Thr Thr Pro Thr Ser Leu Lys Val Ile Thr Phe Ala GlnGlu Val Gln Thr Thr Pro Thr Ser Leu Lys Val Ile Thr Phe Ala Gln

660 665 670660 665 670

GTG CTG GCA CAA TTG AGC CTG ATC TAT CGT CGT ATT GGG TTA AGT GAA 2064GTG CTG GCA CAA TTG AGC CTG ATC TAT CGT CGT ATT GGG TTA AGT GAA 2064

Val Leu Ala Gln Leu Ser Leu Ile Tyr Arg Arg Ile Gly Leu Ser GluVal Leu Ala Gln Leu Ser Leu Ile Tyr Arg Arg Ile Gly Leu Ser Glu

675 680 685675 680 685

ACG GAA CTG TCA CTG ATC GTG ACT CAA TCT TCT CTG CTA GTG GCA GGC 2112ACG GAA CTG TCA CTG ATC GTG ACT CAA TCT TCT CTG CTA GTG GCA GGC 2112

Thr Glu Leu Ser Leu Ile Val Thr Gln Ser Ser Leu Leu Val Ala GlyThr Glu Leu Ser Leu Ile Val Thr Gln Ser Ser Leu Leu Val Ala Gly

690 695 700690 695 700

AAA AGC ATA CTG GAT CAC GGT CTG TTA ACC CTG ATG GCC TTG GAA GGT 2160AAA AGC ATA CTG GAT CAC GGT CTG TTA ACC CTG ATG GCC TTG GAA GGT 2160

Lys Ser Ile Leu Asp His Gly Leu Leu Thr Leu Met Ala Leu Glu GlyLys Ser Ile Leu Asp His Gly Leu Leu Thr Leu Met Ala Leu Glu Gly

705 710 715 720705 710 715 720

TTT CAT ACC TGG GTT AAT GGC TTG GGG CAA CAT GCC TCC TTG ATA TTG 2208TTT CAT ACC TGG GTT AAT GGC TTG GGG CAA CAT GCC TCC TTG ATA TTG 2208

Phe His Thr Trp Val Asn Gly Leu Gly Gln His Ala Ser Leu Ile LeuPhe His Thr Trp Val Asn Gly Leu Gly Gln His Ala Ser Leu Ile Leu

725 730 735725 730 735

GCG GCG TTG AAA GAC GGA GCC TTG ACA GTT ACC GAT GTA GCA CAA GCT 2256GCG GCG TTG AAA GAC GGA GCC TTG ACA GTT ACC GAT GTA GCA CAA GCT 2256

Ala Ala Leu Lys Asp Gly Ala Leu Thr Val Thr Asp Val Ala Gln AlaAla Ala Leu Lys Asp Gly Ala Leu Thr Val Thr Asp Val Ala Gln Ala

740 745 750740 745 750

ATG AAT AAG GAG GAA TCT CTC CTA CAA ATG GCA GCT AAT CAG GTG GAG 2304ATG AAT AAG GAG GAA TCT CTC CTA CAA ATG GCA GCT AAT CAG GTG GAG 2304

Met Asn Lys Glu Glu Ser Leu Leu Gln Met Ala Ala Asn Gln Val GluMet Asn Lys Glu Glu Ser Leu Leu Gln Met Ala Ala Asn Gln Val Glu

755 760 765755 760 765

AAG GAT CTA ACA AAA CTG ACC AGT TGG ACA CAG ATT GAC GCT ATT CTG 2352AAG GAT CTA ACA AAA CTG ACC AGT TGG ACA CAG ATT GAC GCT ATT CTG 2352

Lys Asp Leu Thr Lys Leu Thr Ser Trp Thr Gln Ile Asp Ala Ile LeuLys Asp Leu Thr Lys Leu Thr Ser Trp Thr Gln Ile Asp Ala Ile Leu

770 775 780770 775 780

CAA TGG TTA CAG ATG TCT TCG GCC TTG GCG GTT TCT CCA CTG GAT CTG 2400CAA TGG TTA CAG ATG TCT TCG GCC TTG GCG GTT TCT CCA CTG GAT CTG 2400

Gln Trp Leu Gln Met Ser Ser Ala Leu Ala Val Ser Pro Leu Asp LeuGln Trp Leu Gln Met Ser Ser Ala Leu Ala Val Ser Pro Leu Asp Leu

785 790 795 800785 790 795 800

GCA GGG ATG ATG GCC CTG AAA TAT GGG ATA GAT CAT AAC TAT GCT GCC 2448GCA GGG ATG ATG GCC CTG AAA TAT GGG ATA GAT CAT AAC TAT GCT GCC 2448

Ala Gly Met Met Ala Leu Lys Tyr Gly Ile Asp His Asn Tyr Ala AlaAla Gly Met Met Ala Leu Lys Tyr Gly Ile Asp His Asn Tyr Ala Ala

805 810 815805 810 815

TGG CAA GCT GCG GCG GCT GCG CTG ATG GCT GAT CAT GCT AAT CAG GCA 2496TGG CAA GCT GCG GCG GCT GCG CTG ATG GCT GAT CAT GCT AAT CAG GCA 2496

Trp Gln Ala Ala Ala Ala Ala Leu Met Ala Asp His Ala Asn Gln AlaTrp Gln Ala Ala Ala Ala Ala Leu Met Ala Asp His Ala Asn Gln Ala

820 825 830820 825 830

CAG AAA AAA CTG GAT GAG ACG TTC AGT AAG GCA TTA TGT AAC TAT TAT 2544CAG AAA AAA CTG GAT GAG ACG TTC AGT AAG GCA TTA TGT AAC TAT TAT 2544

Gln Lys Lys Leu Asp Glu Thr Phe Ser Lys Ala Leu Cys Asn Tyr TyrGln Lys Lys Leu Asp Glu Thr Phe Ser Lys Ala Leu Cys Asn Tyr Tyr

835 840 845835 840 845

ATT AAT GCT GTT GTC GAT AGT GCT GCT GGA GTA CGT GAT CGT AAC GGT 2592ATT AAT GCT GTT GTC GAT AGT GCT GCT GGA GTA CGT GAT CGT AAC GGT 2592

Ile Asn Ala Val Val Asp Ser Ala Ala Gly Val Arg Asp Arg Asn GlyIle Asn Ala Val Val Asp Ser Ala Ala Gly Val Arg Asp Arg Asn Gly

850 855 860850 855 860

TTA TAT ACC TAT TTG CTG ATT GAT AAT CAG GTT TCT GCC GAT GTG ATC 2640TTA TAT ACC TAT TTG CTG ATT GAT AAT CAG GTT TCT GCC GAT GTG ATC 2640

Leu Tyr Thr Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Asp Val IleLeu Tyr Thr Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Asp Val Ile

865 870 875 880865 870 875 880

ACT TCA CGT ATT GCA GAA GCT ATC GCC GGT ATT CAA CTG TAC GTT AAC 2688ACT TCA CGT ATT GCA GAA GCT ATC GCC GGT ATT CAA CTG TAC GTT AAC 2688

Thr Ser Arg Ile Ala Glu Ala Ile Ala Gly Ile Gln Leu Tyr Val AsnThr Ser Arg Ile Ala Glu Ala Ile Ala Gly Ile Gln Leu Tyr Val Asn

885 890 895885 890 895

CGG GCT TTA AAC CGA GAT GAA GGT CAG CTT GCA TCG GAC GTT AGT ACC 2736CGG GCT TTA AAC CGA GAT GAA GGT CAG CTT GCA TCG GAC GTT AGT ACC 2736

Arg Ala Leu Asn Arg Asp Glu Gly Gln Leu Ala Ser Asp Val Ser ThrArg Ala Leu Asn Arg Asp Glu Gly Gln Leu Ala Ser Asp Val Ser Thr

900 905 910900 905 910

CGT CAG TTC TTC ACT GAC TGG GAA CGT TAC AAT AAA CGT TAC AGT ACT 2784CGT CAG TTC TTC ACT GAC TGG GAA CGT TAC AAT AAA CGT TAC AGT ACT 2784

Arg Gln Phe Phe Thr Asp Trp Glu Arg Tyr Asn Lys Arg Tyr Ser ThrArg Gln Phe Phe Thr Asp Trp Glu Arg Tyr Asn Lys Arg Tyr Ser Thr

915 920 925915 920 925

TGG GCT GGT GTC TCT GAA CTG GTC TAT TAT CCA GAA AAC TAT GTT GAT 2832TGG GCT GGT GTC TCT GAA CTG GTC TAT TAT CCA GAA AAC TAT GTT GAT 2832

Trp Ala Gly Val Ser Glu Leu Val Tyr Tyr Pro Glu Asn Tyr Val AspTrp Ala Gly Val Ser Glu Leu Val Tyr Tyr Pro Glu Asn Tyr Val Asp

930 935 940930 935 940

CCC ACT CAG CGC ATT GGG CAA ACC AAA ATG ATG GAT GCG CTG TTG CAA 2880CCC ACT CAG CGC ATT GGG CAA ACC AAA ATG ATG GAT GCG CTG TTG CAA 2880

Pro Thr Gln Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu GlnPro Thr Gln Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln

945 950 955 960945 950 955 960

TCC ATC AAC CAG AGC CAG CTA AAT GCG GAT ACG GTG GAA GAT GCT TTC 2928TCC ATC AAC CAG AGC CAG CTA AAT GCG GAT ACG GTG GAA GAT GCT TTC 2928

Ser Ile Asn Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala PheSer Ile Asn Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe

965 970 975965 970 975

AAA ACT TAT TTG ACC AGC TTT GAG CAG GTA GCA AAT CTG AAA GTA ATT 2976AAA ACT TAT TTG ACC AGC TTT GAG CAG GTA GCA AAT CTG AAA GTA ATT 2976

Lys Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val IleLys Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile

980 985 990980 985 990

AGT GCT TAC CAC GAT AAT GTG AAT GTG GAT CAA GGA TTA ACT TAT TTT 3024AGT GCT TAC CAC GAT AAT GTG AAT GTG GAT CAA GGA TTA ACT TAT TTT 3024

Ser Ala Tyr His Asp Asn Val Asn Val Asp Gln Gly Leu Thr Tyr PheSer Ala Tyr His Asp Asn Val Asn Val Asp Gln Gly Leu Thr Tyr Phe

995 1000 1005995 1000 1005

ATC GGT ATC GAC CAA GCA GCT CCG GGT ACG TAT TAC TGG CGT AGT GTT 3072ATC GGT ATC GAC CAA GCA GCT CCG GGT ACG TAT TAC TGG CGT AGT GTT 3072

Ile Gly Ile Asp Gln Ala Ala Pro Gly Thr Tyr Tyr Trp Arg Ser ValIle Gly Ile Asp Gln Ala Ala Pro Gly Thr Tyr Tyr Trp Arg Ser Val

1010 1015 10201010 1015 1020

GAT CAC AGC AAA TGT GAA AAT GGC AAG TTT GCC GCT AAT GCT TGG GGT 3120GAT CAC AGC AAA TGT GAA AAT GGC AAG TTT GCC GCT AAT GCT TGG GGT 3120

Asp His Ser Lys Cys Glu Asn Gly Lys Phe Ala Ala Asn Ala Trp GlyAsp His Ser Lys Cys Glu Asn Gly Lys Phe Ala Ala Asn Ala Trp Gly

1025 1030 1035 10401025 1030 1035 1040

GAG TGG AAT AAA ATT ACC TGT GCT GTC AAT CCT TGG AAA AAT ATC ATC 3168GAG TGG AAT AAA ATT ACC TGT GCT GTC AAT CCT TGG AAA AAT ATC ATC 3168

Glu Trp Asn Lys Ile Thr Cys Ala Val Asn Pro Trp Lys Asn Ile IleGlu Trp Asn Lys Ile Thr Cys Ala Val Asn Pro Trp Lys Asn Ile Ile

1045 1050 10551045 1050 1055

CGT CCG GTT GTT TAT ATG TCC CGC TTA TAT CTG CTA TGG CTG GAG CAG 3216CGT CCG GTT GTT TAT ATG TCC CGC TTA TAT CTG CTA TGG CTG GAG CAG 3216

Arg Pro Val Val Tyr Met Ser Arg Leu Tyr Leu Leu Trp Leu Glu GlnArg Pro Val Val Tyr Met Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln

1060 1065 10701060 1065 1070

CAA TCA AAG AAA AGT GAT GAT GGT AAA ACC ACG ATT TAT CAA TAT AAC 3264CAA TCA AAG AAA AGT GAT GAT GGT AAA ACC ACG ATT TAT CAA TAT AAC 3264

Gln Ser Lys Lys Ser Asp Asp Gly Lys Thr Thr Ile Tyr Gln Tyr AsnGln Ser Lys Lys Ser Asp Asp Gly Lys Thr Thr Ile Tyr Gln Tyr Asn

1075 1080 10851075 1080 1085

TTA AAA CTG GCT CAT ATT CGT TAC GAC GGT AGT TGG AAT ACA CCA TTT 3312TTA AAA CTG GCT CAT ATT CGT TAC GAC GGT AGT TGG AAT ACA CCA TTT 3312

Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Ser Trp Asn Thr Pro PheLeu Lys Leu Ala His Ile Arg Tyr Asp Gly Ser Trp Asn Thr Pro Phe

1090 1095 11001090 1095 1100

ACT TTT GAT GTG ACA GAA AAG GTA AAA AAT TAC ACG TCG AGT ACT GAT 3360ACT TTT GAT GTG ACA GAA AAG GTA AAA AAT TAC ACG TCG AGT ACT GAT 3360

Thr Phe Asp Val Thr Glu Lys Val Lys Asn Tyr Thr Ser Ser Thr AspThr Phe Asp Val Thr Glu Lys Val Lys Asn Tyr Thr Ser Ser Thr Asp

1105 1110 1115 11201105 1110 1115 1120

GCT GCT GAA TCT TTA GGG TTG TAT TGT ACT GGT TAT CAA GGG GAA GAC 3408GCT GCT GAA TCT TTA GGG TTG TAT TGT ACT GGT TAT CAA GGG GAA GAC 3408

Ala Ala Glu Ser Leu Gly Leu Tyr Cys Thr Gly Tyr Gln Gly Glu AspAla Ala Glu Ser Leu Gly Leu Tyr Cys Thr Gly Tyr Gln Gly Glu Asp

1125 1130 11351125 1130 1135

ACT CTA TTA GTT ATG TTC TAT TCG ATG CAG AGT AGT TAT AGC TCC TAT 3456ACT CTA TTA GTT ATG TTC TAT TCG ATG CAG AGT AGT TAT AGC TCC TAT 3456

Thr Leu Leu Val Met Phe Tyr Ser Met Gln Ser Ser Tyr Ser Ser TyrThr Leu Leu Val Met Phe Tyr Ser Met Gln Ser Ser Tyr Ser Ser Tyr

1140 1145 11501140 1145 1150

ACC GAT AAT AAT GCG CCG GTC ACT GGG CTA TAT ATT TTC GCT GAT ATG 3504ACC GAT AAT AAT GCG CCG GTC ACT GGG CTA TAT ATT TTC GCT GAT ATG 3504

Thr Asp Asn Asn Ala Pro Val Thr Gly Leu Tyr Ile Phe Ala Asp MetThr Asp Asn Asn Ala Pro Val Thr Gly Leu Tyr Ile Phe Ala Asp Met

1155 1160 11651155 1160 1165

TCA TCA GAC AAT ATG ACG AAT GCA CAA GCA ACT AAC TAT TGG AAT AAC 3552TCA TCA GAC AAT ATG ACG AAT GCA CAA GCA ACT AAC TAT TGG AAT AAC 3552

Ser Ser Asp Asn Met Thr Asn Ala Gln Ala Thr Asn Tyr Trp Asn AsnSer Ser Asp Asn Met Thr Asn Ala Gln Ala Thr Asn Tyr Trp Asn Asn

1170 1175 11801170 1175 1180

AGT TAT CCG CAA TTT GAT ACT GTG ATG GCA GAT CCG GAT AGC GAC AAT 3600AGT TAT CCG CAA TTT GAT ACT GTG ATG GCA GAT CCG GAT AGC GAC AAT 3600

Ser Tyr Pro Gln Phe Asp Thr Val Met Ala Asp Pro Asp Ser Asp AsnSer Tyr Pro Gln Phe Asp Thr Val Met Ala Asp Pro Asp Ser Asp Asn

1185 1190 1195 12001185 1190 1195 1200

AAA AAA GTC ATA ACC AGA AGA GTT AAT AAC CGT TAT GCG GAG GAT TAT 3648AAA AAA GTC ATA ACC AGA AGA GTT AAT AAC CGT TAT GCG GAG GAT TAT 3648

Lys Lys Val Ile Thr Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp TyrLys Lys Val Ile Thr Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr

1205 1210 12151205 1210 1215

GAA ATT CCT TCC TCT GTG ACA AGT AAC AGT AAT TAT TCT TGG GGT GAT 3696GAA ATT CCT TCC TCT GTG ACA AGT AAC AGT AAT TAT TCT TGG GGT GAT 3696

Glu Ile Pro Ser Ser Val Thr Ser Asn Ser Asn Tyr Ser Trp Gly AspGlu Ile Pro Ser Ser Val Thr Ser Asn Ser Asn Tyr Ser Trp Gly Asp

1220 1225 12301220 1225 1230

CAC AGT TTA ACC ATG CTT TAT GGT GGT AGT GTT CCT AAT ATT ACT TTT 3744CAC AGT TTA ACC ATG CTT TAT GGT GGT AGT GTT CCT AAT ATT ACT TTT 3744

His Ser Leu Thr Met Leu Tyr Gly Gly Ser Val Pro Asn Ile Thr PheHis Ser Leu Thr Met Leu Tyr Gly Gly Ser Val Pro Asn Ile Thr Phe

1235 1240 12451235 1240 1245

GAA TCG GCG GCA GAA GAT TTA AGG CTA TCT ACC AAT ATG GCA TTG AGT 3792GAA TCG GCG GCA GAA GAT TTA AGG CTA TCT ACC AAT ATG GCA TTG AGT 3792

Glu Ser Ala Ala Glu Asp Leu Arg Leu Ser Thr Asn Met Ala Leu SerGlu Ser Ala Ala Glu Asp Leu Arg Leu Ser Thr Asn Met Ala Leu Ser

1250 1255 12601250 1255 1260

ATT ATT CAT AAT GGA TAT GCG GGA ACC CGC CGT ATA CAA TGT AAT CTT 3840ATT ATT CAT AAT GGA TAT GCG GGA ACC CGC CGT ATA CAA TGT AAT CTT 3840

Ile Ile His Asn Gly Tyr Ala Gly Thr Arg Arg Ile Gln Cys Asn LeuIle Ile His Asn Gly Tyr Ala Gly Thr Arg Arg Ile Gln Cys Asn Leu

1265 1270 1275 12801265 1270 1275 1280

ATG AAA CAA TAC GCT TCA TTA GGT GAT AAA TTT ATA ATT TAT GAT TCA 3888ATG AAA CAA TAC GCT TCA TTA GGT GAT AAA TTT ATA ATT TAT GAT TCA 3888

Met Lys Gln Tyr Ala Ser Leu Gly Asp Lys Phe Ile Ile Tyr Asp SerMet Lys Gln Tyr Ala Ser Leu Gly Asp Lys Phe Ile Ile Tyr Asp Ser

1285 1290 12951285 1290 1295

TCA TTT GAT GAT GCA AAC CGT TTT AAT CTG GTG CCA TTG TTT AAA TTC 3936TCA TTT GAT GAT GCA AAC CGT TTT AAT CTG GTG CCA TTG TTT AAA TTC 3936

Ser Phe Asp Asp Ala Asn Arg Phe Asn Leu Val Pro Leu Phe Lys PheSer Phe Asp Asp Ala Asn Arg Phe Asn Leu Val Pro Leu Phe Lys Phe

1300 1305 13101300 1305 1310

GGA AAA GAC GAG AAC TCA GAT GAT AGT ATT TGT ATA TAT AAT GAA AAC 3984GGA AAA GAC GAG AAC TCA GAT GAT AGT ATT TGT ATA TAT AAT GAA AAC 3984

Gly Lys Asp Glu Asn Ser Asp Asp Ser Ile Cys Ile Tyr Asn Glu AsnGly Lys Asp Glu Asn Ser Asp Asp Ser Ile Cys Ile Tyr Asn Glu Asn

1315 1320 13251315 1320 1325

CCT TCC TCT GAA GAT AAG AAG TGG TAT TTT TCT TCG AAA GAT GAC AAT 4032CCT TCC TCT GAA GAT AAG AAG TGG TAT TTT TCT TCG AAA GAT GAC AAT 4032

Pro Ser Ser Glu Asp Lys Lys Trp Tyr Phe Ser Ser Lys Asp Asp AsnPro Ser Ser Glu Asp Lys Lys Trp Tyr Phe Ser Ser Lys Asp Asp Asn

1330 1335 13401330 1335 1340

AAA ACA GCG GAT TAT AAT GGT GGA ACT CAA TGT ATA GAT GCT GGA ACC 4080AAA ACA GCG GAT TAT AAT GGT GGA ACT CAA TGT ATA GAT GCT GGA ACC 4080

Lys Thr Ala Asp Tyr Asn Gly Gly Thr Gln Cys Ile Asp Ala Gly ThrLys Thr Ala Asp Tyr Asn Gly Gly Thr Gln Cys Ile Asp Ala Gly Thr

1345 1350 1355 13601345 1350 1355 1360

AGT AAC AAA GAT TTT TAT TAT AAT CTC CAG GAG ATT GAA GTA ATT AGT 4128AGT AAC AAA GAT TTT TAT TAT AAT CTC CAG GAG ATT GAA GTA ATT AGT 4128

Ser Asn Lys Asp Phe Tyr Tyr Asn Leu Gln Glu Ile Glu Val Ile SerSer Asn Lys Asp Phe Tyr Tyr Asn Leu Gln Glu Ile Glu Val Ile Ser

1365 1370 13751365 1370 1375

GTT ACT GGT GGG TAT TGG TCG AGT TAT AAA ATA TCC AAC CCG ATT AAT 4176GTT ACT GGT GGG TAT TGG TCG AGT TAT AAA ATA TCC AAC CCG ATT AAT 4176

Val Thr Gly Gly Tyr Trp Ser Ser Tyr Lys Ile Ser Asn Pro Ile AsnVal Thr Gly Gly Tyr Trp Ser Ser Tyr Lys Ile Ser Asn Pro Ile Asn

1380 1385 13901380 1385 1390

ATC AAT ACG GGC ATT GAT AGT GCT AAA GTA AAA GTC ACC GTA AAA GCG 4224ATC AAT ACG GGC ATT GAT AGT GCT AAA GTA AAA GTC ACC GTA AAA GCG 4224

Ile Asn Thr Gly Ile Asp Ser Ala Lys Val Lys Val Thr Val Lys AlaIle Asn Thr Gly Ile Asp Ser Ala Lys Val Lys Val Thr Val Lys Ala

1395 1400 14051395 1400 1405

GGT GGT GAC GAT CAA ATC TTT ACT GCT GAT AAT AGT ACC TAT GTT CCT 4272GGT GGT GAC GAT CAA ATC TTT ACT GCT GAT AAT AGT ACC TAT GTT CCT 4272

Gly Gly Asp Asp Gln Ile Phe Thr Ala Asp Asn Ser Thr Tyr Val ProGly Gly Asp Asp Gln Ile Phe Thr Ala Asp Asn Ser Thr Tyr Val Pro

1410 1415 14201410 1415 1420

CAG CAA CCG GCA CCC AGT TTT GAG GAG ATG ATT TAT CAG TTC AAT AAC 4320CAG CAA CCG GCA CCC AGT TTT GAG GAG ATG ATT TAT CAG TTC AAT AAC 4320

Gln Gln Pro Ala Pro Ser Phe Glu Glu Met Ile Tyr Gln Phe Asn AsnGln Gln Pro Ala Pro Ser Phe Glu Glu Met Ile Tyr Gln Phe Asn Asn

1425 1430 1435 14401425 1430 1435 1440

CTG ACA ATA GAT TGT AAG AAT TTA AAT TTC ATC GAC AAT CAG GCA CAT 4368CTG ACA ATA GAT TGT AAG AAT TTA AAT TTC ATC GAC AAT CAG GCA CAT 4368

Leu Thr Ile Asp Cys Lys Asn Leu Asn Phe Ile Asp Asn Gln Ala HisLeu Thr Ile Asp Cys Lys Asn Leu Asn Phe Ile Asp Asn Gln Ala His

1445 1450 14551445 1450 1455

ATT GAG ATT GAT TTC ACC GCT ACG GCA CAA GAT GGC CGA TTC TTG GGT 4416ATT GAG ATT GAT TTC ACC GCT ACG GCA CAA GAT GGC CGA TTC TTG GGT 4416

Ile Glu Ile Asp Phe Thr Ala Thr Ala Gln Asp Gly Arg Phe Leu GlyIle Glu Ile Asp Phe Thr Ala Thr Ala Gln Asp Gly Arg Phe Leu Gly

1460 1465 14701460 1465 1470

GCA GAA ACT TTT ATT ATC CCG GTA ACT AAA AAA GTT CTC GGT ACT GAG 4464GCA GAA ACT TTT ATT ATC CCG GTA ACT AAA AAA GTT CTC GGT ACT GAG 4464

Ala Glu Thr Phe Ile Ile Pro Val Thr Lys Lys Val Leu Gly Thr GluAla Glu Thr Phe Ile Ile Pro Val Thr Lys Lys Val Leu Gly Thr Glu

1475 1480 14851475 1480 1485

AAC GTG ATT GCG TTA TAT AGC GAA AAT AAC GGT GTT CAA TAT ATG CAA 4512AAC GTG ATT GCG TTA TAT AGC GAA AAT AAC GGT GTT CAA TAT ATG CAA 4512

Asn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly Val Gln Tyr Met GlnAsn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly Val Gln Tyr Met Gln

1490 1495 15001490 1495 1500

ATT GGC GCA TAT CGT ACC CGT TTG AAT ACG TTA TTC GCT CAA CAG TTG 4560ATT GGC GCA TAT CGT ACC CGT TTG AAT ACG TTA TTC GCT CAA CAG TTG 4560

Ile Gly Ala Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Gln Gln LeuIle Gly Ala Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Gln Gln Leu

1505 1510 1515 15201505 1510 1515 1520

GTT AGC CGT GCT AAT CGT GGC ATT GAT GCA GTG CTC AGT ATG GAA ACT 4608GTT AGC CGT GCT AAT CGT GGC ATT GAT GCA GTG CTC AGT ATG GAA ACT 4608

Val Ser Arg Ala Asn Arg Gly Ile Asp Ala Val Leu Ser Met Glu ThrVal Ser Arg Ala Asn Arg Gly Ile Asp Ala Val Leu Ser Met Glu Thr

1525 1530 15351525 1530 1535

CAG AAT ATT CAG GAA CCG CAA TTA GGA GCG GGC ACA TAT GTG CAG CTT 4656CAG AAT ATT CAG GAA CCG CAA TTA GGA GCG GGC ACA TAT GTG CAG CTT 4656

Gln Asn Ile Gln Glu Pro Gln Leu Gly Ala Gly Thr Tyr Val Gln LeuGln Asn Ile Gln Glu Pro Gln Leu Gly Ala Gly Thr Tyr Val Gln Leu

1540 1545 15501540 1545 1550

GTG TTG GAT AAA TAT GAT GAG TCT ATT CAT GGC ACT AAT AAA AGC TTT 4704GTG TTG GAT AAA TAT GAT GAG TCT ATT CAT GGC ACT AAT AAA AGC TTT 4704

Val Leu Asp Lys Tyr Asp Glu Ser Ile His Gly Thr Asn Lys Ser PheVal Leu Asp Lys Tyr Asp Glu Ser Ile His Gly Thr Asn Lys Ser Phe

1555 1560 15651555 1560 1565

GCT ATT GAA TAT GTT GAT ATA TTT AAA GAG AAC GAT AGT TTT GTG ATT 4752GCT ATT GAA TAT GTT GAT ATA TTT AAA GAG AAC GAT AGT TTT GTG ATT 4752

Ala Ile Glu Tyr Val Asp Ile Phe Lys Glu Asn Asp Ser Phe Val IleAla Ile Glu Tyr Val Asp Ile Phe Lys Glu Asn Asp Ser Phe Val Ile

1570 1575 15801570 1575 1580

TAT CAA GGA GAA CTT AGC GAA ACA AGT CAA ACT GTT GTG AAA GTT TTC 4800TAT CAA GGA GAA CTT AGC GAA ACA AGT CAA ACT GTT GTG AAA GTT TTC 4800

Tyr Gln Gly Glu Leu Ser Glu Thr Ser Gln Thr Val Val Lys Val PheTyr Gln Gly Glu Leu Ser Glu Thr Ser Gln Thr Val Val Lys Val Phe

1585 1590 1595 16001585 1590 1595 1600

TTA TCC TAT TTT ATA GAG GCG ACT GGA AAT AAG AAC CAC TTA TGG GTA 4848TTA TCC TAT TTT ATA GAG GCG ACT GGA AAT AAG AAC CAC TTA TGG GTA 4848

Leu Ser Tyr Phe Ile Glu Ala Thr Gly Asn Lys Asn His Leu Trp ValLeu Ser Tyr Phe Ile Glu Ala Thr Gly Asn Lys Asn His Leu Trp Val

1605 1610 16151605 1610 1615

CGT GCT AAA TAC CAA AAG GAA ACG ACT GAT AAG ATC TTG TTC GAC CGT 4896CGT GCT AAA TAC CAA AAG GAA ACG ACT GAT AAG ATC TTG TTC GAC CGT 4896

Arg Ala Lys Tyr Gln Lys Glu Thr Thr Asp Lys Ile Leu Phe Asp ArgArg Ala Lys Tyr Gln Lys Glu Thr Thr Asp Lys Ile Leu Phe Asp Arg

1620 1625 16301620 1625 1630

ACT GAT GAG AAA GAT CCG CAC GGT TGG TTT CTC AGC GAC GAT CAC AAG 4944ACT GAT GAG AAA GAT CCG CAC GGT TGG TTT CTC AGC GAC GAT CAC AAG 4944

Thr Asp Glu Lys Asp Pro His Gly Trp Phe Leu Ser Asp Asp His LysThr Asp Glu Lys Asp Pro His Gly Trp Phe Leu Ser Asp Asp His Lys

1635 1640 16451635 1640 1645

ACC TTT AGT GGT CTC TCT TCC GCA CAG GCA TTA AAG AAC GAC AGT GAA 4992ACC TTT AGT GGT CTC TCT TCC GCA CAG GCA TTA AAG AAC GAC AGT GAA 4992

Thr Phe Ser Gly Leu Ser Ser Ala Gln Ala Leu Lys Asn Asp Ser GluThr Phe Ser Gly Leu Ser Ser Ala Gln Ala Leu Lys Asn Asp Ser Glu

1650 1655 16601650 1655 1660

CCG ATG GAT TTC TCT GGC GCC AAT GCT CTC TAT TTC TGG GAA CTG TTC 5040CCG ATG GAT TTC TCT GGC GCC AAT GCT CTC TAT TTC TGG GAA CTG TTC 5040

Pro Met Asp Phe Ser Gly Ala Asn Ala Leu Tyr Phe Trp Glu Leu PhePro Met Asp Phe Ser Gly Ala Asn Ala Leu Tyr Phe Trp Glu Leu Phe

1665 1670 1675 16801665 1670 1675 1680

TAT TAC ACG CCG ATG ATG ATG GCT CAT CGT TTG TTG CAG GAA CAG AAT 5088TAT TAC ACG CCG ATG ATG ATG GCT CAT CGT TTG TTG CAG GAA CAG AAT 5088

Tyr Tyr Thr Pro Met Met Met Ala His Arg Leu Leu Gln Glu Gln AsnTyr Tyr Thr Pro Met Met Met Ala His Arg Leu Leu Gln Glu Gln Asn

1685 1690 16951685 1690 1695

TTT GAT GCG GCG AAC CAT TGG TTC CGT TAT GTC TGG AGT CCA TCC GGT 5136TTT GAT GCG GCG AAC CAT TGG TTC CGT TAT GTC TGG AGT CCA TCC GGT 5136

Phe Asp Ala Ala Asn His Trp Phe Arg Tyr Val Trp Ser Pro Ser GlyPhe Asp Ala Ala Asn His Trp Phe Arg Tyr Val Trp Ser Pro Ser Gly

1700 1705 17101700 1705 1710

TAT ATC GTT GAT GGT AAA ATT GCT ATC TAC CAC TGG AAC GTG CGA CCG 5184TAT ATC GTT GAT GGT AAA ATT GCT ATC TAC CAC TGG AAC GTG CGA CCG 5184

Tyr Ile Val Asp Gly Lys Ile Ala Ile Tyr His Trp Asn Val Arg ProTyr Ile Val Asp Gly Lys Ile Ala Ile Tyr His Trp Asn Val Arg Pro

1715 1720 17251715 1720 1725

CTG GAA GAA GAC ACC AGT TGG AAT GCA CAA CAA CTG GAC TCC ACC GAT 5232CTG GAA GAA GAC ACC AGT TGG AAT GCA CAA CAA CTG GAC TCC ACC GAT 5232

Leu Glu Glu Asp Thr Ser Trp Asn Ala Gln Gln Leu Asp Ser Thr AspLeu Glu Glu Asp Thr Ser Trp Asn Ala Gln Gln Leu Asp Ser Thr Asp

1730 1735 17401730 1735 1740

CCA GAT GCT GTA GCC CAA GAT GAT CCG ATG CAC TAC AAG GTG GCT ACC 5280CCA GAT GCT GTA GCC CAA GAT GAT CCG ATG CAC TAC AAG GTG GCT ACC 5280

Pro Asp Ala Val Ala Gln Asp Asp Pro Met His Tyr Lys Val Ala ThrPro Asp Ala Val Ala Gln Asp Asp Pro Met His Tyr Lys Val Ala Thr

1745 1750 1755 17601745 1750 1755 1760

TTT ATG GCG ACG TTG GAT CTG CTA ATG GCC CGT GGT GAT GCT GCT TAC 5328TTT ATG GCG ACG TTG GAT CTG CTA ATG GCC CGT GGT GAT GCT GCT TAC 5328

Phe Met Ala Thr Leu Asp Leu Leu Met Ala Arg Gly Asp Ala Ala TyrPhe Met Ala Thr Leu Asp Leu Leu Met Ala Arg Gly Asp Ala Ala Tyr

1765 1770 17751765 1770 1775

CGC CAG TTA GAG CGT GAT ACG TTG GCT GAA GCT AAA ATG TGG TAT ACA 5376CGC CAG TTA GAG CGT GAT ACG TTG GCT GAA GCT AAA ATG TGG TAT ACA 5376

Arg Gln Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Met Trp Tyr ThrArg Gln Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Met Trp Tyr Thr

1780 1785 17901780 1785 1790

CAG GCG CTT AAT CTG TTG GGT GAT GAG CCA CAA GTG ATG CTG AGT ACG 5424CAG GCG CTT AAT CTG TTG GGT GAT GAG CCA CAA GTG ATG CTG AGT ACG 5424

Gln Ala Leu Asn Leu Leu Gly Asp Glu Pro Gln Val Met Leu Ser ThrGln Ala Leu Asn Leu Leu Gly Asp Glu Pro Gln Val Met Leu Ser Thr

1795 1800 18051795 1800 1805

ACT TGG GCT AAT CCA ACA TTG GGT AAT GCT GCT TCA AAA ACC ACA CAG 5472ACT TGG GCT AAT CCA ACA TTG GGT AAT GCT GCT TCA AAA ACC ACA CAG 5472

Thr Trp Ala Asn Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr GlnThr Trp Ala Asn Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr Gln

1810 1815 18201810 1815 1820

CAG GTT CGT CAG CAA GTG CTT ACC CAG TTG CGT CTC AAT AGC AGG GTA 5520CAG GTT CGT CAG CAA GTG CTT ACC CAG TTG CGT CTC AAT AGC AGG GTA 5520

Gln Val Arg Gln Gln Val Leu Thr Gln Leu Arg Leu Asn Ser Arg ValGln Val Arg Gln Gln Val Leu Thr Gln Leu Arg Leu Asn Ser Arg Val

1825 1830 1835 18401825 1830 1835 1840

AAA ACC CCG TTG 5532AAA ACC CCG TTG 5532

Lys Thr Pro LeuLys Thr Pro Leu

18441844

(2) INFORMATION FOR SEQ ID NO:53:(2) INFORMATION FOR SEQ ID NO: 53:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1844 amino acids(A) LENGTH: 1844 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:53 (TcbAii):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 53 (TcbAii):

Features From To DescriptionFeatures From To Description

Peptide 1 1844 TcbAii peptidePeptide 1 1844 TcbAii peptide

Fragment 1 11 (SEQ ID NO:1)Fragment 1 11 (SEQ ID NO: 1)

Fragment 978 990 (SEQ ID NO:23)Fragment 978 990 (SEQ ID NO: 23)

Fragment 1387 1401 (SEQ ID NO:22)Fragment 1387 1401 (SEQ ID NO: 22)

Fragment 1484 1505 (SEQ ID NO:24)Fragment 1484 1505 (SEQ ID NO: 24)

Fragment 1527 1552 (SEQ ID NO:21)Fragment 1527 1552 (SEQ ID NO: 21)

Phe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala Asp Asn TyrPhe Ile Gln Gly Tyr Ser Asp Leu Phe Gly Asn Arg Ala Asp Asn Tyr

1 5 10 151 5 10 15

Ala Ala Pro Gly Ser Val Ala Ser Met Phe Ser Pro Ala Ala Tyr LeuAla Ala Pro Gly Ser Val Ala Ser Met Phe Ser Pro Ala Ala Tyr Leu

20 25 3020 25 30

Thr Glu Leu Tyr Arg Glu Ala Lys Asn Leu His Asp Ser Ser Ser IleThr Glu Leu Tyr Arg Glu Ala Lys Asn Leu His Asp Ser Ser Ser Ile

35 40 4535 40 45

Tyr Tyr Leu Asp Lys Arg Arg Pro Asp Leu Ala Ser Leu Met Leu SerTyr Tyr Leu Asp Lys Arg Arg Pro Asp Leu Ala Ser Leu Met Leu Ser

50 55 6050 55 60

Gln Lys Asn Met Asp Glu Glu Ile Ser Thr Leu Ala Leu Ser Asn GluGln Lys Asn Met Asp Glu Glu Ile Ser Thr Leu Ala Leu Ser Asn Glu

65 70 75 8065 70 75 80

Leu Cys Leu Ala Gly Ile Glu Thr Lys Thr Gly Lys Ser Gln Asp GluLeu Cys Leu Ala Gly Ile Glu Thr Lys Thr Gly Lys Ser Gln Asp Glu

85 90 9585 90 95

Val Met Asp Met Leu Ser Thr Tyr Arg Leu Ser Gly Glu Thr Pro TyrVal Met Asp Met Leu Ser Thr Tyr Arg Leu Ser Gly Glu Thr Pro Tyr

100 105 110100 105 110

His His Ala Tyr Glu Thr Val Arg Glu Ile Val His Glu Arg Asp ProHis His Ala Tyr Glu Thr Val Arg Glu Ile Val His Glu Arg Asp Pro

115 120 125115 120 125

Gly Phe Arg His Leu Ser Gln Ala Pro Ile Val Ala Ala Lys Leu AspGly Phe Arg His Leu Ser Gln Ala Pro Ile Val Ala Ala Lys Leu Asp

130 135 140130 135 140

Pro Val Thr Leu Leu Gly Ile Ser Ser His Ile Ser Pro Glu Leu TyrPro Val Thr Leu Leu Gly Ile Ser Ser His Ile Ser Pro Glu Leu Tyr

145 150 155 160145 150 155 160

Asn Leu Leu Ile Glu Glu Ile Pro Glu Lys Asp Glu Ala Ala Leu AspAsn Leu Leu Ile Glu Glu Ile Pro Glu Lys Asp Glu Ala Ala Leu Asp

165 170 175165 170 175

Thr Leu Tyr Lys Thr Asn Phe Gly Asp Ile Thr Thr Ala Gln Leu MetThr Leu Tyr Lys Thr Asn Phe Gly Asp Ile Thr Thr Ala Gln Leu Met

180 185 190180 185 190

Ser Pro Ser Tyr Leu Ala Arg Tyr Tyr Gly Val Ser Pro Glu Asp IleSer Pro Ser Tyr Leu Ala Arg Tyr Tyr Gly Val Ser Pro Glu Asp Ile

195 200 205195 200 205

Ala Tyr Val Thr Thr Ser Leu Ser His Val Gly Tyr Ser Ser Asp IleAla Tyr Val Thr Thr Ser Leu Ser His Val Gly Tyr Ser Ser Asp Ile

210 215 220210 215 220

Leu Val Ile Pro Leu Val Asp Gly Val Gly Lys Met Glu Val Val ArgLeu Val Ile Pro Leu Val Asp Gly Val Gly Lys Met Glu Val Val Arg

225 230 235 240225 230 235 240

Val Thr Arg Thr Pro Ser Asp Asn Tyr Thr Ser Gln Thr Asn Tyr IleVal Thr Arg Thr Pro Ser Asp Asn Tyr Thr Ser Gln Thr Asn Tyr Ile

245 250 255245 250 255

Glu Leu Tyr Pro Gln Gly Gly Asp Asn Tyr Leu Ile Lys Tyr Asn LeuGlu Leu Tyr Pro Gln Gly Gly Asp Asn Tyr Leu Ile Lys Tyr Asn Leu

260 265 270260 265 270

Ser Asn Ser Phe Gly Leu Asp Asp Phe Tyr Leu Gln Tyr Lys Asp GlySer Asn Ser Phe Gly Leu Asp Asp Phe Tyr Leu Gln Tyr Lys Asp Gly

275 280 285275 280 285

Ser Ala Asp Trp Thr Glu Ile Ala His Asn Pro Tyr Pro Asp Met ValSer Ala Asp Trp Thr Glu Ile Ala His Asn Pro Tyr Pro Asp Met Val

290 295 300290 295 300

Ile Asn Gln Lys Tyr Glu Ser Gln Ala Thr Ile Lys Arg Ser Asp SerIle Asn Gln Lys Tyr Glu Ser Gln Ala Thr Ile Lys Arg Ser Asp Ser

305 310 315 320305 310 315 320

Asp Asn Ile Leu Ser Ile Gly Leu Gln Arg Trp His Ser Gly Ser TyrAsp Asn Ile Leu Ser Ile Gly Leu Gln Arg Trp His Ser Gly Ser Tyr

325 330 335325 330 335

Asn Phe Ala Ala Ala Asn Phe Lys Ile Asp Gln Tyr Ser Pro Lys AlaAsn Phe Ala Ala Ala Asn Phe Lys Ile Asp Gln Tyr Ser Pro Lys Ala

340 345 350340 345 350

Phe Leu Leu Lys Met Asn Lys Ala Ile Arg Leu Leu Lys Ala Thr GlyPhe Leu Leu Lys Met Asn Lys Ala Ile Arg Leu Leu Lys Ala Thr Gly

355 360 365355 360 365

Leu Ser Phe Ala Thr Leu Glu Arg Ile Val Asp Ser Val Asn Ser ThrLeu Ser Phe Ala Thr Leu Glu Arg Ile Val Asp Ser Val Asn Ser Thr

370 375 380370 375 380

Lys Ser Ile Thr Val Glu Val Leu Asn Lys Val Tyr Arg Val Lys PheLys Ser Ile Thr Val Glu Val Leu Asn Lys Val Tyr Arg Val Lys Phe

385 390 395 400385 390 395 400

Tyr Ile Asp Arg Tyr Gly Ile Ser Glu Glu Thr Ala Ala Ile Leu AlaTyr Ile Asp Arg Tyr Gly Ile Ser Glu Glu Thr Ala Ala Ile Leu Ala

405 410 415405 410 415

Asn Ile Asn Ile Ser Gln Gln Ala Val Gly Asn Gln Leu Ser Gln PheAsn Ile Asn Ile Ser Gln Gln Ala Val Gly Asn Gln Leu Ser Gln Phe

420 425 430420 425 430

Glu Gln Leu Phe Asn His Pro Pro Leu Asn Gly Ile Arg Tyr Glu IleGlu Gln Leu Phe Asn His Pro Pro Leu Asn Gly Ile Arg Tyr Glu Ile

435 440 445435 440 445

Ser Glu Asp Asn Ser Lys His Leu Pro Asn Pro Asp Leu Asn Leu LysSer Glu Asp Asn Ser Lys His Leu Pro Asn Pro Asp Leu Asn Leu Lys

450 455 460450 455 460

Pro Asp Ser Thr Gly Asp Asp Gln Arg Lys Ala Val Leu Lys Arg AlaPro Asp Ser Thr Gly Asp Asp Gln Arg Lys Ala Val Leu Lys Arg Ala

465 470 475 480465 470 475 480

Phe Gln Val Asn Ala Ser Glu Leu Tyr Gln Met Leu Leu Ile Thr AspPhe Gln Val Asn Ala Ser Glu Leu Tyr Gln Met Leu Leu Ile Thr Asp

485 490 495485 490 495

Arg Lys Glu Asp Gly Val Ile Lys Asn Asn Leu Glu Asn Leu Ser AspArg Lys Glu Asp Gly Val Ile Lys Asn Asn Leu Glu Asn Leu Ser Asp

500 505 510500 505 510

Leu Tyr Leu Val Ser Leu Leu Ala Gln Ile His Asn Leu Thr Ile AlaLeu Tyr Leu Val Ser Leu Leu Ala Gln Ile His Asn Leu Thr Ile Ala

515 520 525515 520 525

Glu Leu Asn Ile Leu Leu Val Ile Cys Gly Tyr Gly Asp Thr Asn IleGlu Leu Asn Ile Leu Leu Val Ile Cys Gly Tyr Gly Asp Thr Asn Ile

530 535 540530 535 540

Tyr Gln Ile Thr Asp Asp Asn Leu Ala Lys Ile Val Glu Thr Leu LeuTyr Gln Ile Thr Asp Asp Asn Leu Ala Lys Ile Val Glu Thr Leu Leu

545 550 555 560545 550 555 560

Trp Ile Thr Gln Trp Leu Lys Thr Gln Lys Trp Thr Val Thr Asp LeuTrp Ile Thr Gln Trp Leu Lys Thr Gln Lys Trp Thr Val Thr Asp Leu

565 570 575565 570 575

Phe Leu Met Thr Thr Ala Thr Tyr Ser Thr Thr Leu Thr Pro Glu IlePhe Leu Met Thr Thr Ala Thr Tyr Ser Thr Thr Leu Thr Pro Glu Ile

580 585 590580 585 590

Ser Asn Leu Thr Ala Thr Leu Ser Ser Thr Leu His Gly Lys Glu SerSer Asn Leu Thr Ala Thr Leu Ser Ser Thr Leu His Gly Lys Glu Ser

595 600 605595 600 605

Leu Ile Gly Glu Asp Leu Lys Arg Ala Met Ala Pro Cys Phe Thr SerLeu Ile Gly Glu Asp Leu Lys Arg Ala Met Ala Pro Cys Phe Thr Ser

610 615 620610 615 620

Ala Leu His Leu Thr Ser Gln Glu Val Ala Tyr Asp Leu Leu Leu TrpAla Leu His Leu Thr Ser Gln Glu Val Ala Tyr Asp Leu Leu Leu Trp

625 630 635 640625 630 635 640

Ile Asp Gln Ile Gln Pro Ala Gln Ile Thr Val Asp Gly Phe Trp GluIle Asp Gln Ile Gln Pro Ala Gln Ile Thr Val Asp Gly Phe Trp Glu

645 650 655645 650 655

Glu Val Gln Thr Thr Pro Thr Ser Leu Lys Val Ile Thr Phe Ala GlnGlu Val Gln Thr Thr Pro Thr Ser Leu Lys Val Ile Thr Phe Ala Gln

660 665 670660 665 670

Val Leu Ala Gln Leu Ser Leu Ile Tyr Arg Arg Ile Gly Leu Ser GluVal Leu Ala Gln Leu Ser Leu Ile Tyr Arg Arg Ile Gly Leu Ser Glu

675 680 685675 680 685

Thr Glu Leu Ser Leu Ile Val Thr Gln Ser Ser Leu Leu Val Ala GlyThr Glu Leu Ser Leu Ile Val Thr Gln Ser Ser Leu Leu Val Ala Gly

690 695 700690 695 700

Lys Ser Ile Leu Asp His Gly Leu Leu Thr Leu Met Ala Leu Glu GlyLys Ser Ile Leu Asp His Gly Leu Leu Thr Leu Met Ala Leu Glu Gly

705 710 715 720705 710 715 720

Phe His Thr Trp Val Asn Gly Leu Gly Gln His Ala Ser Leu Ile LeuPhe His Thr Trp Val Asn Gly Leu Gly Gln His Ala Ser Leu Ile Leu

725 730 735725 730 735

Ala Ala Leu Lys Asp Gly Ala Leu Thr Val Thr Asp Val Ala Gln AlaAla Ala Leu Lys Asp Gly Ala Leu Thr Val Thr Asp Val Ala Gln Ala

740 745 750740 745 750

Met Asn Lys Glu Glu Ser Leu Leu Gln Met Ala Ala Asn Gln Val GluMet Asn Lys Glu Glu Ser Leu Leu Gln Met Ala Ala Asn Gln Val Glu

755 760 765755 760 765

Lys Asp Leu Thr Lys Leu Thr Ser Trp Thr Gln Ile Asp Ala Ile LeuLys Asp Leu Thr Lys Leu Thr Ser Trp Thr Gln Ile Asp Ala Ile Leu

770 775 780770 775 780

Gln Trp Leu Gln Met Ser Ser Ala Leu Ala Val Ser Pro Leu Asp LeuGln Trp Leu Gln Met Ser Ser Ala Leu Ala Val Ser Pro Leu Asp Leu

785 790 795 800785 790 795 800

Ala Gly Met Met Ala Leu Lys Tyr Gly Ile Asp His Asn Tyr Ala AlaAla Gly Met Met Ala Leu Lys Tyr Gly Ile Asp His Asn Tyr Ala Ala

805 810 815805 810 815

Trp Gln Ala Ala Ala Ala Ala Leu Met Ala Asp His Ala Asn Gln AlaTrp Gln Ala Ala Ala Ala Ala Leu Met Ala Asp His Ala Asn Gln Ala

820 825 830820 825 830

Gln Lys Lys Leu Asp Glu Thr Phe Ser Lys Ala Leu Cys Asn Tyr TyrGln Lys Lys Leu Asp Glu Thr Phe Ser Lys Ala Leu Cys Asn Tyr Tyr

835 840 845835 840 845

Ile Asn Ala Val Val Asp Ser Ala Ala Gly Val Arg Asp Arg Asn GlyIle Asn Ala Val Val Asp Ser Ala Ala Gly Val Arg Asp Arg Asn Gly

850 855 860850 855 860

Leu Tyr Thr Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Asp Val IleLeu Tyr Thr Tyr Leu Leu Ile Asp Asn Gln Val Ser Ala Asp Val Ile

865 870 875 880865 870 875 880

Thr Ser Arg Ile Ala Glu Ala Ile Ala Gly Ile Gln Leu Tyr Val AsnThr Ser Arg Ile Ala Glu Ala Ile Ala Gly Ile Gln Leu Tyr Val Asn

885 890 895885 890 895

Arg Ala Leu Asn Arg Asp Glu Gly Gln Leu Ala Ser Asp Val Ser ThrArg Ala Leu Asn Arg Asp Glu Gly Gln Leu Ala Ser Asp Val Ser Thr

900 905 910900 905 910

Arg Gln Phe Phe Thr Asp Trp Glu Arg Tyr Asn Lys Arg Tyr Ser ThrArg Gln Phe Phe Thr Asp Trp Glu Arg Tyr Asn Lys Arg Tyr Ser Thr

915 920 925915 920 925

Trp Ala Gly Val Ser Glu Leu Val Tyr Tyr Pro Glu Asn Tyr Val AspTrp Ala Gly Val Ser Glu Leu Val Tyr Tyr Pro Glu Asn Tyr Val Asp

930 935 940930 935 940

Pro Thr Gln Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu GlnPro Thr Gln Arg Ile Gly Gln Thr Lys Met Met Asp Ala Leu Leu Gln

945 950 955 960945 950 955 960

Ser Ile Asn Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala PheSer Ile Asn Gln Ser Gln Leu Asn Ala Asp Thr Val Glu Asp Ala Phe

965 970 975965 970 975

Lys Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val IleLys Thr Tyr Leu Thr Ser Phe Glu Gln Val Ala Asn Leu Lys Val Ile

980 985 990980 985 990

Ser Ala Tyr His Asp Asn Val Asn Val Asp Gln Gly Leu Thr Tyr PheSer Ala Tyr His Asp Asn Val Asn Val Asp Gln Gly Leu Thr Tyr Phe

995 1000 1005995 1000 1005

Ile Gly Ile Asp Gln Ala Ala Pro Gly Thr Tyr Tyr Trp Arg Ser ValIle Gly Ile Asp Gln Ala Ala Pro Gly Thr Tyr Tyr Trp Arg Ser Val

1010 1015 10201010 1015 1020

Asp His Ser Lys Cys Glu Asn Gly Lys Phe Ala Ala Asn Ala Trp GlyAsp His Ser Lys Cys Glu Asn Gly Lys Phe Ala Ala Asn Ala Trp Gly

1025 1030 1035 10401025 1030 1035 1040

Glu Trp Asn Lys Ile Thr Cys Ala Val Asn Pro Trp Lys Asn Ile IleGlu Trp Asn Lys Ile Thr Cys Ala Val Asn Pro Trp Lys Asn Ile Ile

1045 1050 10551045 1050 1055

Arg Pro Val Val Tyr Met Ser Arg Leu Tyr Leu Leu Trp Leu Glu GlnArg Pro Val Val Tyr Met Ser Arg Leu Tyr Leu Leu Trp Leu Glu Gln

1060 1065 10701060 1065 1070

Gln Ser Lys Lys Ser Asp Asp Gly Lys Thr Thr Ile Tyr Gln Tyr AsnGln Ser Lys Lys Ser Asp Asp Gly Lys Thr Thr Ile Tyr Gln Tyr Asn

1075 1080 10851075 1080 1085

Leu Lys Leu Ala His Ile Arg Tyr Asp Gly Ser Trp Asn Thr Pro PheLeu Lys Leu Ala His Ile Arg Tyr Asp Gly Ser Trp Asn Thr Pro Phe

1090 1095 11001090 1095 1100

Thr Phe Asp Val Thr Glu Lys Val Lys Asn Tyr Thr Ser Ser Thr AspThr Phe Asp Val Thr Glu Lys Val Lys Asn Tyr Thr Ser Ser Thr Asp

1105 1110 1115 11201105 1110 1115 1120

Ala Ala Glu Ser Leu Gly Leu Tyr Cys Thr Gly Tyr Gln Gly Glu AspAla Ala Glu Ser Leu Gly Leu Tyr Cys Thr Gly Tyr Gln Gly Glu Asp

1125 1130 11351125 1130 1135

Thr Leu Leu Val Met Phe Tyr Ser Met Gln Ser Ser Tyr Ser Ser TyrThr Leu Leu Val Met Phe Tyr Ser Met Gln Ser Ser Tyr Ser Ser Tyr

1140 1145 11501140 1145 1150

Thr Asp Asn Asn Ala Pro Val Thr Gly Leu Tyr Ile Phe Ala Asp MetThr Asp Asn Asn Ala Pro Val Thr Gly Leu Tyr Ile Phe Ala Asp Met

1155 1160 11651155 1160 1165

Ser Ser Asp Asn Met Thr Asn Ala Gln Ala Thr Asn Tyr Trp Asn AsnSer Ser Asp Asn Met Thr Asn Ala Gln Ala Thr Asn Tyr Trp Asn Asn

1170 1175 11801170 1175 1180

Ser Tyr Pro Gln Phe Asp Thr Val Met Ala Asp Pro Asp Ser Asp AsnSer Tyr Pro Gln Phe Asp Thr Val Met Ala Asp Pro Asp Ser Asp Asn

1185 1190 1195 12001185 1190 1195 1200

Lys Lys Val Ile Thr Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp TyrLys Lys Val Ile Thr Arg Arg Val Asn Asn Arg Tyr Ala Glu Asp Tyr

1205 1210 12151205 1210 1215

Glu Ile Pro Ser Ser Val Thr Ser Asn Ser Asn Tyr Ser Trp Gly AspGlu Ile Pro Ser Ser Val Thr Ser Asn Ser Asn Tyr Ser Trp Gly Asp

1220 1225 12301220 1225 1230

His Ser Leu Thr Met Leu Tyr Gly Gly Ser Val Pro Asn Ile Thr PheHis Ser Leu Thr Met Leu Tyr Gly Gly Ser Val Pro Asn Ile Thr Phe

1235 1240 12451235 1240 1245

Glu Ser Ala Ala Glu Asp Leu Arg Leu Ser Thr Asn Met Ala Leu SerGlu Ser Ala Ala Glu Asp Leu Arg Leu Ser Thr Asn Met Ala Leu Ser

1250 1255 12601250 1255 1260

Ile Ile His Asn Gly Tyr Ala Gly Thr Arg Arg Ile Gln Cys Asn LeuIle Ile His Asn Gly Tyr Ala Gly Thr Arg Arg Ile Gln Cys Asn Leu

1265 1270 1275 12801265 1270 1275 1280

Met Lys Gln Tyr Ala Ser Leu Gly Asp Lys Phe Ile Ile Tyr Asp SerMet Lys Gln Tyr Ala Ser Leu Gly Asp Lys Phe Ile Ile Tyr Asp Ser

1285 1290 12951285 1290 1295

Ser Phe Asp Asp Ala Asn Arg Phe Asn Leu Val Pro Leu Phe Lys PheSer Phe Asp Asp Ala Asn Arg Phe Asn Leu Val Pro Leu Phe Lys Phe

1300 1305 13101300 1305 1310

Gly Lys Asp Glu Asn Ser Asp Asp Ser Ile Cys Ile Tyr Asn Glu AsnGly Lys Asp Glu Asn Ser Asp Asp Ser Ile Cys Ile Tyr Asn Glu Asn

1315 1320 13251315 1320 1325

Pro Ser Ser Glu Asp Lys Lys Trp Tyr Phe Ser Ser Lys Asp Asp AsnPro Ser Ser Glu Asp Lys Lys Trp Tyr Phe Ser Ser Lys Asp Asp Asn

1330 1335 13401330 1335 1340

Lys Thr Ala Asp Tyr Asn Gly Gly Thr Gln Cys Ile Asp Ala Gly ThrLys Thr Ala Asp Tyr Asn Gly Gly Thr Gln Cys Ile Asp Ala Gly Thr

1345 1350 1355 13601345 1350 1355 1360

Ser Asn Lys Asp Phe Tyr Tyr Asn Leu Gln Glu Ile Glu Val Ile SerSer Asn Lys Asp Phe Tyr Tyr Asn Leu Gln Glu Ile Glu Val Ile Ser

1365 1370 13751365 1370 1375

Val Thr Gly Gly Tyr Trp Ser Ser Tyr Lys Ile Ser Asn Pro Ile AsnVal Thr Gly Gly Tyr Trp Ser Ser Tyr Lys Ile Ser Asn Pro Ile Asn

1380 1385 13901380 1385 1390

Ile Asn Thr Gly Ile Asp Ser Ala Lys Val Lys Val Thr Val Lys AlaIle Asn Thr Gly Ile Asp Ser Ala Lys Val Lys Val Thr Val Lys Ala

1395 1400 14051395 1400 1405

Gly Gly Asp Asp Gln Ile Phe Thr Ala Asp Asn Ser Thr Tyr Val ProGly Gly Asp Asp Gln Ile Phe Thr Ala Asp Asn Ser Thr Tyr Val Pro

1410 1415 14201410 1415 1420

Gln Gln Pro Ala Pro Ser Phe Glu Glu Met Ile Tyr Gln Phe Asn AsnGln Gln Pro Ala Pro Ser Phe Glu Glu Met Ile Tyr Gln Phe Asn Asn

1425 1430 1435 14401425 1430 1435 1440

Leu Thr Ile Asp Cys Lys Asn Leu Asn Phe Ile Asp Asn Gln Ala HisLeu Thr Ile Asp Cys Lys Asn Leu Asn Phe Ile Asp Asn Gln Ala His

1445 1450 14551445 1450 1455

Ile Glu Ile Asp Phe Thr Ala Thr Ala Gln Asp Gly Arg Phe Leu GlyIle Glu Ile Asp Phe Thr Ala Thr Ala Gln Asp Gly Arg Phe Leu Gly

1460 1465 14701460 1465 1470

Ala Glu Thr Phe Ile Ile Pro Val Thr Lys Lys Val Leu Gly Thr GluAla Glu Thr Phe Ile Ile Pro Val Thr Lys Lys Val Leu Gly Thr Glu

1475 1480 14851475 1480 1485

Asn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly Val Gln Tyr Met GlnAsn Val Ile Ala Leu Tyr Ser Glu Asn Asn Gly Val Gln Tyr Met Gln

1490 1495 15001490 1495 1500

Ile Gly Ala Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Gln Gln LeuIle Gly Ala Tyr Arg Thr Arg Leu Asn Thr Leu Phe Ala Gln Gln Leu

1505 1510 1515 15201505 1510 1515 1520

Val Ser Arg Ala Asn Arg Gly Ile Asp Ala Val Leu Ser Met Glu ThrVal Ser Arg Ala Asn Arg Gly Ile Asp Ala Val Leu Ser Met Glu Thr

1525 1530 15351525 1530 1535

Gln Asn Ile Gln Glu Pro Gln Leu Gly Ala Gly Thr Tyr Val Gln LeuGln Asn Ile Gln Glu Pro Gln Leu Gly Ala Gly Thr Tyr Val Gln Leu

1540 1545 15501540 1545 1550

Val Leu Asp Lys Tyr Asp Glu Ser Ile His Gly Thr Asn Lys Ser PheVal Leu Asp Lys Tyr Asp Glu Ser Ile His Gly Thr Asn Lys Ser Phe

1555 1560 15651555 1560 1565

Ala Ile Glu Tyr Val Asp Ile Phe Lys Glu Asn Asp Ser Phe Val IleAla Ile Glu Tyr Val Asp Ile Phe Lys Glu Asn Asp Ser Phe Val Ile

1570 1575 15801570 1575 1580

Tyr Gln Gly Glu Leu Ser Glu Thr Ser Gln Thr Val Val Lys Val PheTyr Gln Gly Glu Leu Ser Glu Thr Ser Gln Thr Val Val Lys Val Phe

1585 1590 1595 16001585 1590 1595 1600

Leu Ser Tyr Phe Ile Glu Ala Thr Gly Asn Lys Asn His Leu Trp ValLeu Ser Tyr Phe Ile Glu Ala Thr Gly Asn Lys Asn His Leu Trp Val

1605 1610 16151605 1610 1615

Arg Ala Lys Tyr Gln Lys Glu Thr Thr Asp Lys Ile Leu Phe Asp ArgArg Ala Lys Tyr Gln Lys Glu Thr Thr Asp Lys Ile Leu Phe Asp Arg

1620 1625 16301620 1625 1630

Thr Asp Glu Lys Asp Pro His Gly Trp Phe Leu Ser Asp Asp His LysThr Asp Glu Lys Asp Pro His Gly Trp Phe Leu Ser Asp Asp His Lys

1635 1640 16451635 1640 1645

Thr Phe Ser Gly Leu Ser Ser Ala Gln Ala Leu Lys Asn Asp Ser GluThr Phe Ser Gly Leu Ser Ser Ala Gln Ala Leu Lys Asn Asp Ser Glu

1650 1655 16601650 1655 1660

Pro Met Asp Phe Ser Gly Ala Asn Ala Leu Tyr Phe Trp Glu Leu PhePro Met Asp Phe Ser Gly Ala Asn Ala Leu Tyr Phe Trp Glu Leu Phe

1665 1670 1675 16801665 1670 1675 1680

Tyr Tyr Thr Pro Met Met Met Ala His Arg Leu Leu Gln Glu Gln AsnTyr Tyr Thr Pro Met Met Met Ala His Arg Leu Leu Gln Glu Gln Asn

1685 1690 16951685 1690 1695

Phe Asp Ala Ala Asn His Trp Phe Arg Tyr Val Trp Ser Pro Ser GlyPhe Asp Ala Ala Asn His Trp Phe Arg Tyr Val Trp Ser Pro Ser Gly

1700 1705 17101700 1705 1710

Tyr Ile Val Asp Gly Lys Ile Ala Ile Tyr His Trp Asn Val Arg ProTyr Ile Val Asp Gly Lys Ile Ala Ile Tyr His Trp Asn Val Arg Pro

1715 1720 17251715 1720 1725

Leu Glu Glu Asp Thr Ser Trp Asn Ala Gln Gln Leu Asp Ser Thr AspLeu Glu Glu Asp Thr Ser Trp Asn Ala Gln Gln Leu Asp Ser Thr Asp

1730 1735 17401730 1735 1740

Pro Asp Ala Val Ala Gln Asp Asp Pro Met His Tyr Lys Val Ala ThrPro Asp Ala Val Ala Gln Asp Asp Pro Met His Tyr Lys Val Ala Thr

1745 1750 1755 17601745 1750 1755 1760

Phe Met Ala Thr Leu Asp Leu Leu Met Ala Arg Gly Asp Ala Ala TyrPhe Met Ala Thr Leu Asp Leu Leu Met Ala Arg Gly Asp Ala Ala Tyr

1765 1770 17751765 1770 1775

Arg Gln Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Met Trp Tyr ThrArg Gln Leu Glu Arg Asp Thr Leu Ala Glu Ala Lys Met Trp Tyr Thr

1780 1785 17901780 1785 1790

Gln Ala Leu Asn Leu Leu Gly Asp Glu Pro Gln Val Met Leu Ser ThrGln Ala Leu Asn Leu Leu Gly Asp Glu Pro Gln Val Met Leu Ser Thr

1795 1800 18051795 1800 1805

Thr Trp Ala Asn Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr GlnThr Trp Ala Asn Pro Thr Leu Gly Asn Ala Ala Ser Lys Thr Thr Gln

1810 1815 18201810 1815 1820

Gln Val Arg Gln Gln Val Leu Thr Gln Leu Arg Leu Asn Ser Arg ValGln Val Arg Gln Gln Val Leu Thr Gln Leu Arg Leu Asn Ser Arg Val

1825 1830 1835 18401825 1830 1835 1840

Lys Thr Pro LeuLys Thr Pro Leu

18441844

(2) INFORMATION FOR SEQ ID NO:54:(2) INFORMATION FOR SEQ ID NO: 54:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1722 base pairs(A) LENGTH: 1722 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:54 (tcbAiii coding(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 54 (tcbAiii coding

region):region):

CTA GGA ACA GCC AAT TCC CTG ACC GCT TTA TTC CTG CCG CAG GAA AAT 48CTA GGA ACA GCC AAT TCC CTG ACC GCT TTA TTC CTG CCG CAG GAA AAT 48

Leu Gly Thr Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu AsnLeu Gly Thr Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn

1 5 10 151 5 10 15

AGC AAG CTC AAA GGC TAC TGG CGG ACA CTG GCG CAG CGT ATG TTT AAT 96AGC AAG CTC AAA GGC TAC TGG CGG ACA CTG GCG CAG CGT ATG TTT AAT 96

Ser Lys Leu Lys Gly Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe AsnSer Lys Leu Lys Gly Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn

20 25 3020 25 30

TTA CGT CAT AAT CTG TCG ATT GAC GGC CAG CCG CTC TCC TTG CCG CTG 144TTA CGT CAT AAT CTG TCG ATT GAC GGC CAG CCG CTC TCC TTG CCG CTG 144

Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro LeuLeu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu

35 40 4535 40 45

TAT GCT AAA CCG GCT GAT CCA AAA GCT TTA CTG AGT GCG GCG GTT TCA 192TAT GCT AAA CCG GCT GAT CCA AAA GCT TTA CTG AGT GCG GCG GTT TCA 192

Tyr Ala Lys Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val SerTyr Ala Lys Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser

50 55 6050 55 60

GCT TCT CAA GGG GGA GCC GAC TTG CCG AAG GCG CCG CTG ACT ATT CAC 240GCT TCT CAA GGG GGA GCC GAC TTG CCG AAG GCG CCG CTG ACT ATT CAC 240

Ala Ser Gln Gly Gly Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile HisAla Ser Gln Gly Gly Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile His

65 70 75 8065 70 75 80

CGC TTC CCT CAA ATG CTA GAA GGG GCA CGG GGC TTG GTT AAC CAG CTT 288CGC TTC CCT CAA ATG CTA GAA GGG GCA CGG GGC TTG GTT AAC CAG CTT 288

Arg Phe Pro Gln Met Leu Glu Gly Ala Arg Gly Leu Val Asn Gln LeuArg Phe Pro Gln Met Leu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu

85 90 9585 90 95

ATA CAG TTC GGT AGT TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG 336ATA CAG TTC GGT AGT TCA CTA TTG GGG TAC AGT GAG CGT CAG GAT GCG 336

Ile Gln Phe Gly Ser Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp AlaIle Gln Phe Gly Ser Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala

100 105 110100 105 110

GAA GCT ATG AGT CAA CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG 384GAA GCT ATG AGT CAA CTA CTG CAA ACC CAA GCC AGC GAG TTA ATA CTG 384

Glu Ala Met Ser Gln Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile LeuGlu Ala Met Ser Gln Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu

115 120 125115 120 125

ACC AGT ATT CGT ATG CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA 432ACC AGT ATT CGT ATG CAG GAT AAC CAA TTG GCA GAG CTG GAT TCG GAA 432

Thr Ser Ile Arg Met Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser GluThr Ser Ile Arg Met Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu

130 135 140130 135 140

AAA ACC GCC TTG CAA GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC 480AAA ACC GCC TTG CAA GTC TCT TTA GCT GGA GTG CAA CAA CGG TTT GAC 480

Lys Thr Ala Leu Gln Val Ser Leu Ala Gly Val Gln Gln Arg Phe AspLys Thr Ala Leu Gln Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp

145 150 155 160145 150 155 160

AGC TAT AGC CAA CTG TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CGA 528AGC TAT AGC CAA CTG TAT GAG GAG AAC ATC AAC GCA GGT GAG CAG CGA 528

Ser Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln ArgSer Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg

165 170 175165 170 175

GCG CTG GCG TTA CGC TCA GAA TCT GCT ATT GAG TCT CAG GGA GCG CAG 576GCG CTG GCG TTA CGC TCA GAA TCT GCT ATT GAG TCT CAG GGA GCG CAG 576

Ala Leu Ala Leu Arg Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala GlnAla Leu Ala Leu Arg Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln

180 185 190180 185 190

ATT TCC CGT ATG GCA GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC 624ATT TCC CGT ATG GCA GGC GCG GGT GTT GAT ATG GCA CCA AAT ATC TTC 624

Ile Ser Arg Met Ala Gly Ala Gly Val Asp Met Ala Pro Asn Ile PheIle Ser Arg Met Ala Gly Ala Gly Val Asp Met Ala Pro Asn Ile Phe

195 200 205195 200 205

GGC CTG GCT GAT GGC GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC 672GGC CTG GCT GAT GGC GGC ATG CAT TAT GGT GCT ATT GCC TAT GCC ATC 672

Gly Leu Ala Asp Gly Gly Met His Tyr Gly Ala Ile Ala Tyr Ala IleGly Leu Ala Asp Gly Gly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile

210 215 220210 215 220

GCT GAC GGT ATT GAG TTG AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG 720GCT GAC GGT ATT GAG TTG AGT GCT TCT GCC AAG ATG GTT GAT GCG GAG 720

Ala Asp Gly Ile Glu Leu Ser Ala Ser Ala Lys Met Val Asp Ala GluAla Asp Gly Ile Glu Leu Ser Ala Ser Ala Lys Met Val Asp Ala Glu

225 230 235 240225 230 235 240

AAA GTT GCT CAG TCG GAA ATA TAT CGC CGT CGC CGT CAA GAA TGG AAA 768AAA GTT GCT CAG TCG GAA ATA TAT CGC CGT CGC CGT CAA GAA TGG AAA 768

Lys Val Ala Gln Ser Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp LysLys Val Ala Gln Ser Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys

245 250 255245 250 255

ATT CAG CGT GAC AAC GCA CAA GCG GAG ATT AAC CAG TTA AAC GCG CAA 816ATT CAG CGT GAC AAC GCA CAA GCG GAG ATT AAC CAG TTA AAC GCG CAA 816

Ile Gln Arg Asp Asn Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala GlnIle Gln Arg Asp Asn Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln

260 265 270260 265 270

CTG GAA TCA CTG TCT ATT CGC CGT GAA GCC GCT GAA ATG CAA AAA GAG 864CTG GAA TCA CTG TCT ATT CGC CGT GAA GCC GCT GAA ATG CAA AAA GAG 864

Leu Glu Ser Leu Ser Ile Arg Arg Glu Ala Ala Glu Met Gln Lys GluLeu Glu Ser Leu Ser Ile Arg Arg Glu Ala Ala Glu Met Gln Lys Glu

275 280 285275 280 285

TAC CTG AAA ACC CAG CAA GCT CAG GCG CAG GCA CAA CTT ACT TTC TTA 912TAC CTG AAA ACC CAG CAA GCT CAG GCG CAG GCA CAA CTT ACT TTC TTA 912

Tyr Leu Lys Thr Gln Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe LeuTyr Leu Lys Thr Gln Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu

290 295 300290 295 300

AGA AGC AAA TTC AGT AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG CGT 960AGA AGC AAA TTC AGT AAT CAA GCG TTA TAT AGT TGG TTA CGA GGG CGT 960

Arg Ser Lys Phe Ser Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly ArgArg Ser Lys Phe Ser Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg

305 310 315 320305 310 315 320

TTG TCA GGT ATT TAT TTC CAG TTC TAT GAC TTG GCC GTA TCA CGT TGC 1008TTG TCA GGT ATT TAT TTC CAG TTC TAT GAC TTG GCC GTA TCA CGT TGC 1008

Leu Ser Gly Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg CysLeu Ser Gly Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys

325 330 335325 330 335

CTG ATG GCA GAG CAA TCC TAT CAA TGG GAA GCT AAT GAT AAT TCC ATT 1056CTG ATG GCA GAG CAA TCC TAT CAA TGG GAA GCT AAT GAT AAT TCC ATT 1056

Leu Met Ala Glu Gln Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser IleLeu Met Ala Glu Gln Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile

340 345 350340 345 350

AGC TTT GTC AAA CCG GGT GCA TGG CAA GGA ACT TAC GCC GGC TTA TTG 1104AGC TTT GTC AAA CCG GGT GCA TGG CAA GGA ACT TAC GCC GGC TTA TTG 1104

Ser Phe Val Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu LeuSer Phe Val Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu

355 360 365355 360 365

TGT GGA GAA GCT TTG ATA CAA AAT CTG GCA CAA ATG GAA GAG GCA TAT 1152TGT GGA GAA GCT TTG ATA CAA AAT CTG GCA CAA ATG GAA GAG GCA TAT 1152

Cys Gly Glu Ala Leu Ile Gln Asn Leu Ala Gln Met Glu Glu Ala TyrCys Gly Glu Ala Leu Ile Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr

370 375 380370 375 380

CTG AAA TGG GAA TCT CGC GCT TTG GAA GTA GAA CGC ACG GTT TCA TTG 1200CTG AAA TGG GAA TCT CGC GCT TTG GAA GTA GAA CGC ACG GTT TCA TTG 1200

Leu Lys Trp Glu Ser Arg Ala Leu Glu Val Glu Arg Thr Val Ser LeuLeu Lys Trp Glu Ser Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu

385 390 395 400385 390 395 400

GCA GTG GTT TAT GAT TCA CTG GAA GGT AAT GAT CGT TTT AAT TTA GCG 1248GCA GTG GTT TAT GAT TCA CTG GAA GGT AAT GAT CGT TTT AAT TTA GCG 1248

Ala Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu AlaAla Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala

405 410 415405 410 415

GAA CAA ATA CCT GCA TTA TTG GAT AAG GGG GAG GGA ACA GCA GGA ACT 1296GAA CAA ATA CCT GCA TTA TTG GAT AAG GGG GAG GGA ACA GCA GGA ACT 1296

Glu Gln Ile Pro Ala Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly ThrGlu Gln Ile Pro Ala Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr

420 425 430420 425 430

AAA GAA AAT GGG TTA TCA TTG GCT AAT GCT ATC CTG TCA GCT TCG GTC 1344AAA GAA AAT GGG TTA TCA TTG GCT AAT GCT ATC CTG TCA GCT TCG GTC 1344

Lys Glu Asn Gly Leu Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser ValLys Glu Asn Gly Leu Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser Val

435 440 445435 440 445

AAA TTG TCC GAC TTG AAA CTG GGA ACG GAT TAT CCA GAC AGT ATC GTT 1392AAA TTG TCC GAC TTG AAA CTG GGA ACG GAT TAT CCA GAC AGT ATC GTT 1392

Lys Leu Ser Asp Leu Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile ValLys Leu Ser Asp Leu Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val

450 455 460450 455 460

GGT AGC AAC AAG GTT CGT CGT ATT AAG CAA ATC AGT GTT TCG CTA CCT 1440GGT AGC AAC AAG GTT CGT CGT ATT AAG CAA ATC AGT GTT TCG CTA CCT 1440

Gly Ser Asn Lys Val Arg Arg Ile Lys Gln Ile Ser Val Ser Leu ProGly Ser Asn Lys Val Arg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro

465 470 475 480465 470 475 480

GCA TTG GTT GGG CCT TAT CAG GAT GTT CAG GCT ATG CTC AGC TAT GGT 1488GCA TTG GTT GGG CCT TAT CAG GAT GTT CAG GCT ATG CTC AGC TAT GGT 1488

Ala Leu Val Gly Pro Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr GlyAla Leu Val Gly Pro Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly

485 490 495485 490 495

GGC AGT ACT CAA TTG CCG AAA GGT TGT TCA GCG TTG GCT GTG TCT CAT 1536GGC AGT ACT CAA TTG CCG AAA GGT TGT TCA GCG TTG GCT GTG TCT CAT 1536

Gly Ser Thr Gln Leu Pro Lys Gly Cys Ser Ala Leu Ala Val Ser HisGly Ser Thr Gln Leu Pro Lys Gly Cys Ser Ala Leu Ala Val Ser His

500 505 510500 505 510

GGT ACC AAT GAT AGT GGT CAG TTC CAG TTG GAT TTC AAT GAC GGC AAA 1584GGT ACC AAT GAT AGT GGT CAG TTC CAG TTG GAT TTC AAT GAC GGC AAA 1584

Gly Thr Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly LysGly Thr Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys

515 520 525515 520 525

TAC CTG CCA TTT GAA GGT ATT GCT CTT GAT GAT CAG GGT ACA CTG AAT 1632TAC CTG CCA TTT GAA GGT ATT GCT CTT GAT GAT CAG GGT ACA CTG AAT 1632

Tyr Leu Pro Phe Glu Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu AsnTyr Leu Pro Phe Glu Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn

530 535 540530 535 540

CTT CAA TTT CCG AAT GCT ACC GAC AAG CAG AAA GCA ATA TTG CAA ACT 1680CTT CAA TTT CCG AAT GCT ACC GAC AAG CAG AAA GCA ATA TTG CAA ACT 1680

Leu Gln Phe Pro Asn Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln ThrLeu Gln Phe Pro Asn Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr

545 550 555 560545 550 555 560

ATG AGC GAT ATT ATT TTG CAT ATT CGT TAT ACC ATC CGT TAA 1722ATG AGC GAT ATT ATT TTG CAT ATT CGT TAT ACC ATC CGT TAA 1722

Met Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg ⅴ?Met Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg ⅴ?

565 570 573565 570 573

(2) INFORMATION FOR SEQ ID NO:55:(2) INFORMATION FOR SEQ ID NO: 55:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 573 amino acids(A) LENGTH: 573 amino acids

(B) TYPE: amino acids(B) TYPE: amino acids

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:55 (TcbAiii):(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 55 (TcbAiii):

Leu Gly Thr Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu AsnLeu Gly Thr Ala Asn Ser Leu Thr Ala Leu Phe Leu Pro Gln Glu Asn

1 5 10 151 5 10 15

Ser Lys Leu Lys Gly Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe AsnSer Lys Leu Lys Gly Tyr Trp Arg Thr Leu Ala Gln Arg Met Phe Asn

20 25 3020 25 30

Leu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro LeuLeu Arg His Asn Leu Ser Ile Asp Gly Gln Pro Leu Ser Leu Pro Leu

35 40 4535 40 45

Tyr Ala Lys Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val SerTyr Ala Lys Pro Ala Asp Pro Lys Ala Leu Leu Ser Ala Ala Val Ser

50 55 6050 55 60

Ala Ser Gln Gly Gly Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile HisAla Ser Gln Gly Gly Ala Asp Leu Pro Lys Ala Pro Leu Thr Ile His

65 70 75 8065 70 75 80

Arg Phe Pro Gln Met Leu Glu Gly Ala Arg Gly Leu Val Asn Gln LeuArg Phe Pro Gln Met Leu Glu Gly Ala Arg Gly Leu Val Asn Gln Leu

85 90 9585 90 95

Ile Gln Phe Gly Ser Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp AlaIle Gln Phe Gly Ser Ser Leu Leu Gly Tyr Ser Glu Arg Gln Asp Ala

100 105 110100 105 110

Glu Ala Met Ser Gln Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile LeuGlu Ala Met Ser Gln Leu Leu Gln Thr Gln Ala Ser Glu Leu Ile Leu

115 120 125115 120 125

Thr Ser Ile Arg Met Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser GluThr Ser Ile Arg Met Gln Asp Asn Gln Leu Ala Glu Leu Asp Ser Glu

130 135 140130 135 140

Lys Thr Ala Leu Gln Val Ser Leu Ala Gly Val Gln Gln Arg Phe AspLys Thr Ala Leu Gln Val Ser Leu Ala Gly Val Gln Gln Arg Phe Asp

145 150 155 160145 150 155 160

Ser Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln ArgSer Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala Gly Glu Gln Arg

165 170 175165 170 175

Ala Leu Ala Leu Arg Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala GlnAla Leu Ala Leu Arg Ser Glu Ser Ala Ile Glu Ser Gln Gly Ala Gln

180 185 190180 185 190

Ile Ser Arg Met Ala Gly Ala Gly Val Asp Met Ala Pro Asn Ile PheIle Ser Arg Met Ala Gly Ala Gly Val Asp Met Ala Pro Asn Ile Phe

195 200 205195 200 205

Gly Leu Ala Asp Gly Gly Met His Tyr Gly Ala Ile Ala Tyr Ala IleGly Leu Ala Asp Gly Gly Met His Tyr Gly Ala Ile Ala Tyr Ala Ile

210 215 220210 215 220

Ala Asp Gly Ile Glu Leu Ser Ala Ser Ala Lys Met Val Asp Ala GluAla Asp Gly Ile Glu Leu Ser Ala Ser Ala Lys Met Val Asp Ala Glu

225 230 235 240225 230 235 240

Lys Val Ala Gln Ser Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp LysLys Val Ala Gln Ser Glu Ile Tyr Arg Arg Arg Arg Gln Glu Trp Lys

245 250 255245 250 255

Ile Gln Arg Asp Asn Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala GlnIle Gln Arg Asp Asn Ala Gln Ala Glu Ile Asn Gln Leu Asn Ala Gln

260 265 270260 265 270

Leu Glu Ser Leu Ser Ile Arg Arg Glu Ala Ala Glu Met Gln Lys GluLeu Glu Ser Leu Ser Ile Arg Arg Glu Ala Ala Glu Met Gln Lys Glu

275 280 285275 280 285

Tyr Leu Lys Thr Gln Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe LeuTyr Leu Lys Thr Gln Gln Ala Gln Ala Gln Ala Gln Leu Thr Phe Leu

290 295 300290 295 300

Arg Ser Lys Phe Ser Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly ArgArg Ser Lys Phe Ser Asn Gln Ala Leu Tyr Ser Trp Leu Arg Gly Arg

305 310 315 320305 310 315 320

Leu Ser Gly Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg CysLeu Ser Gly Ile Tyr Phe Gln Phe Tyr Asp Leu Ala Val Ser Arg Cys

325 330 335325 330 335

Leu Met Ala Glu Gln Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser IleLeu Met Ala Glu Gln Ser Tyr Gln Trp Glu Ala Asn Asp Asn Ser Ile

340 345 350340 345 350

Ser Phe Val Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu LeuSer Phe Val Lys Pro Gly Ala Trp Gln Gly Thr Tyr Ala Gly Leu Leu

355 360 365355 360 365

Cys Gly Glu Ala Leu Ile Gln Asn Leu Ala Gln Met Glu Glu Ala TyrCys Gly Glu Ala Leu Ile Gln Asn Leu Ala Gln Met Glu Glu Ala Tyr

370 375 380370 375 380

Leu Lys Trp Glu Ser Arg Ala Leu Glu Val Glu Arg Thr Val Ser LeuLeu Lys Trp Glu Ser Arg Ala Leu Glu Val Glu Arg Thr Val Ser Leu

385 390 395 400385 390 395 400

Ala Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu AlaAla Val Val Tyr Asp Ser Leu Glu Gly Asn Asp Arg Phe Asn Leu Ala

405 410 415405 410 415

Glu Gln Ile Pro Ala Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly ThrGlu Gln Ile Pro Ala Leu Leu Asp Lys Gly Glu Gly Thr Ala Gly Thr

420 425 430420 425 430

Lys Glu Asn Gly Leu Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser ValLys Glu Asn Gly Leu Ser Leu Ala Asn Ala Ile Leu Ser Ala Ser Val

435 440 445435 440 445

Lys Leu Ser Asp Leu Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile ValLys Leu Ser Asp Leu Lys Leu Gly Thr Asp Tyr Pro Asp Ser Ile Val

450 455 460450 455 460

Gly Ser Asn Lys Val Arg Arg Ile Lys Gln Ile Ser Val Ser Leu ProGly Ser Asn Lys Val Arg Arg Ile Lys Gln Ile Ser Val Ser Leu Pro

465 470 475 480465 470 475 480

Ala Leu Val Gly Pro Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr GlyAla Leu Val Gly Pro Tyr Gln Asp Val Gln Ala Met Leu Ser Tyr Gly

485 490 495485 490 495

Gly Ser Thr Gln Leu Pro Lys Gly Cys Ser Ala Leu Ala Val Ser HisGly Ser Thr Gln Leu Pro Lys Gly Cys Ser Ala Leu Ala Val Ser His

500 505 510500 505 510

Gly Thr Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly LysGly Thr Asn Asp Ser Gly Gln Phe Gln Leu Asp Phe Asn Asp Gly Lys

515 520 525515 520 525

Tyr Leu Pro Phe Glu Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu AsnTyr Leu Pro Phe Glu Gly Ile Ala Leu Asp Asp Gln Gly Thr Leu Asn

530 535 540530 535 540

Leu Gln Phe Pro Asn Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln ThrLeu Gln Phe Pro Asn Ala Thr Asp Lys Gln Lys Ala Ile Leu Gln Thr

545 550 555 560545 550 555 560

Met Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg ⅴ?Met Ser Asp Ile Ile Leu His Ile Arg Tyr Thr Ile Arg ⅴ?

565 570 573565 570 573

(2) INFORMATION FOR SEQ ID NO:56(2) INFORMATION FOR SEQ ID NO: 56

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 2994 base pairs(A) LENGTH: 2994 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:56 (tccA)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 56 (tccA)

1 ATG AAT CAA CTC GCC AGT CCC CTG ATT TCC CGC ACC GAA GAG ATC CAC 481 ATG AAT CAA CTC GCC AGT CCC CTG ATT TCC CGC ACC GAA GAG ATC CAC 48

1 Met Asn Gln Leu Ala Ser Pro Leu Ile Ser Arg Thr Glu Glu Ile His 161 Met Asn Gln Leu Ala Ser Pro Leu Ile Ser Arg Thr Glu Glu Ile His 16

49 AAC TTA CCC GGT AAA TTG ACC GAT CTT GGT TAT ACC TCA GTG TTT GAT 9649 AAC TTA CCC GGT AAA TTG ACC GAT CTT GGT TAT ACC TCA GTG TTT GAT 96

17 Asn Leu Pro Gly Lys Leu Thr Asp Leu Gly Tyr Thr Ser Val Phe Asp 3217 Asn Leu Pro Gly Lys Leu Thr Asp Leu Gly Tyr Thr Ser Val Phe Asp 32

97 GTG GTA CGT ATG CCG CGT GAG CGT TTT ATT CGT GAG CAT CGT GCT GAT 14497 GTG GTA CGT ATG CCG CGT GAG CGT TTT ATT CGT GAG CAT CGT GCT GAT 144

33 Val Val Arg Met Pro Arg Glu Arg Phe Ile Arg Glu His Arg Ala Asp 4833 Val Val Arg Met Pro Arg Glu Arg Phe Ile Arg Glu His Arg Ala Asp 48

145 CTC GGG CGC AGT GCT GAA AAA ATG TAT GAC CTG GCA GTG GGC TAT GCT 192145 CTC GGG CGC AGT GCT GAA AAA ATG TAT GAC CTG GCA GTG GGC TAT GCT 192

49 Leu Gly Arg Ser Ala Glu Lys Met Tyr Asp Leu Ala Val Gly Tyr Ala 6449 Leu Gly Arg Ser Ala Glu Lys Met Tyr Asp Leu Ala Val Gly Tyr Ala 64

193 CAT CAG GTG TTA CAC CAT TTT CGC CGT AAT TCT CTT AGT GAA GCT GTT 240193 CAT CAG GTG TTA CAC CAT TTT CGC CGT AAT TCT CTT AGT GAA GCT GTT 240

65 His Gln Val Leu His His Phe Arg Arg Asn Ser Leu Ser Glu Ala Val 8065 His Gln Val Leu His His Phe Arg Arg Asn Ser Leu Ser Glu Ala Val 80

241 CAG TTT GGC TTG AGA AGT CCG TTC TCC GTA TCA GGC CCG GAT TAC GCC 288241 CAG TTT GGC TTG AGA AGT CCG TTC TCC GTA TCA GGC CCG GAT TAC GCC 288

81 Gln Phe Gly Leu Arg Ser Pro Phe Ser Val Ser Gly Pro Asp Tyr Ala 9681 Gln Phe Gly Leu Arg Ser Pro Phe Ser Val Ser Gly Pro Asp Tyr Ala 96

289 AAT CAG TTT CTT GAT GCA AAC ACG GGT TGG AAA GAT AAA GCA CCA AGT 336289 AAT CAG TTT CTT GAT GCA AAC ACG GGT TGG AAA GAT AAA GCA CCA AGT 336

97 Asn Gln Phe Leu Asp Ala Asn Thr Gly Trp Lys Asp Lys Ala Pro Ser 11297 Asn Gln Phe Leu Asp Ala Asn Thr Gly Trp Lys Asp Lys Ala Pro Ser 112

337 GGA TCA CCG GAA GCC AAT GAT GCG CCG GTA GCC TAT CTG ACT CAT ATT 384337 GGA TCA CCG GAA GCC AAT GAT GCG CCG GTA GCC TAT CTG ACT CAT ATT 384

113 Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His Ile 128113 Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His Ile 128

385 TAT CAA TTG GCC CTT GAA CAG GAA AAG AAT GGC GCC ACT ACC ATT ATG 432385 TAT CAA TTG GCC CTT GAA CAG GAA AAG AAT GGC GCC ACT ACC ATT ATG 432

129 Tyr Gln Leu Ala Leu Glu Gln Glu Lys Asn Gly Ala Thr Thr Ile Met 144129 Tyr Gln Leu Ala Leu Glu Gln Glu Lys Asn Gly Ala Thr Thr Ile Met 144

433 AAT ACG CTG GCG GAG CGT CGC CCC GAT CTG GGT GCT TTG TTA ATT AAT 480433 AAT ACG CTG GCG GAG CGT CGC CCC GAT CTG GGT GCT TTG TTA ATT AAT 480

145 Asn Thr Leu Ala Glu Arg Arg Pro Asp Leu Gly Ala Leu Leu Ile Asn 160145 Asn Thr Leu Ala Glu Arg Arg Pro Asp Leu Gly Ala Leu Leu Ile Asn 160

481 GAT AAA GCA ATC AAT GAG GTG ATA CCG CAA TTG CAG TTG GTC AAT GAA 528481 GAT AAA GCA ATC AAT GAG GTG ATA CCG CAA TTG CAG TTG GTC AAT GAA 528

161 Asp Lys Ala Ile Asn Glu Val Ile Pro Gln Leu Gln Leu Val Asn Glu 176161 Asp Lys Ala Ile Asn Glu Val Ile Pro Gln Leu Gln Leu Val Asn Glu 176

529 ATT CTG TCC AAA GCT ATT CAG AAG AAA CTG AGT TTG ACT GAT CTG GAA 576529 ATT CTG TCC AAA GCT ATT CAG AAG AAA CTG AGT TTG ACT GAT CTG GAA 576

177 Ile Leu Ser Lys Ala Ile Gln Lys Lys Leu Ser Leu Thr Asp Leu Glu 192177 Ile Leu Ser Lys Ala Ile Gln Lys Lys Leu Ser Leu Thr Asp Leu Glu 192

577 GCG GTA AAC GCC AGA CTT TCC ACT ACC CGT TAC CCG AAT AAT CTG CCG 624577 GCG GTA AAC GCC AGA CTT TCC ACT ACC CGT TAC CCG AAT AAT CTG CCG 624

193 Ala Val Asn Ala Arg Leu Ser Thr Thr Arg Tyr Pro Asn Asn Leu Pro 208193 Ala Val Asn Ala Arg Leu Ser Thr Thr Arg Tyr Pro Asn Asn Leu Pro 208

625 TAT CAT TAT GGT CAT CAG CAG ATT CAG ACA GCT CAA TCG GTA TTG GGT 672625 TAT CAT TAT GGT CAT CAG CAG ATT CAG ACA GCT CAA TCG GTA TTG GGT 672

209 Tyr His Tyr Gly His Gln Gln Ile Gln Thr Ala Gln Ser Val Leu Gly 224209 Tyr His Tyr Gly His Gln Gln Ile Gln Thr Ala Gln Ser Val Leu Gly 224

673 ACT ACG TTG CAA GAT ATC ACT TTG CCA CAG ACG CTG GAT CTG CCG CAA 720673 ACT ACG TTG CAA GAT ATC ACT TTG CCA CAG ACG CTG GAT CTG CCG CAA 720

225 Thr Thr Leu Gln Asp Ile Thr Leu Pro Gln Thr Leu Asp Leu Pro Gln 240225 Thr Thr Leu Gln Asp Ile Thr Leu Pro Gln Thr Leu Asp Leu Pro Gln 240

721 AAC TTC TGG GCA ACA GCA AAA GGA AAA CTG AGC GAT ACG ACT GCC AGT 768721 AAC TTC TGG GCA ACA GCA AAA GGA AAA CTG AGC GAT ACG ACT GCC AGT 768

241 Asn Phe Trp Ala Thr Ala Lys Gly Lys Leu Ser Asp Thr Thr Ala Ser 256241 Asn Phe Trp Ala Thr Ala Lys Gly Lys Leu Ser Asp Thr Thr Ala Ser 256

769 GCT TTG ACC CGA CTG CAA ATC ATG GCG AGT CAG TTT TCG CCA GAG CAG 816769 GCT TTG ACC CGA CTG CAA ATC ATG GCG AGT CAG TTT TCG CCA GAG CAG 816

257 Ala Leu Thr Arg Leu Gln Ile Met Ala Ser Gln Phe Ser Pro Glu Gln 272257 Ala Leu Thr Arg Leu Gln Ile Met Ala Ser Gln Phe Ser Pro Glu Gln 272

817 CAG AAA ATC ATT ACG GAG ACT GTC GGT CAG GAT TTC TAT CAG CTT AAC 864817 CAG AAA ATC ATT ACG GAG ACT GTC GGT CAG GAT TTC TAT CAG CTT AAC 864

273 Gln Lys Ile Ile Thr Glu Thr Val Gly Gln Asp Phe Tyr Gln Leu Asn 288273 Gln Lys Ile Ile Thr Glu Thr Val Gly Gln Asp Phe Tyr Gln Leu Asn 288

865 TAT GGT GAC AGT TCG CTT ACT GTG AAT AGT TTC AGC GAC ATG ACC ATA 912865 TAT GGT GAC AGT TCG CTT ACT GTG AAT AGT TTC AGC GAC ATG ACC ATA 912

289 Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Met Thr Ile 304289 Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Met Thr Ile 304

913 ATG ACT GAT CGA ACA AGT TTG ACT GTA CCC CAG GTA GAA CTG ATG TTG 960913 ATG ACT GAT CGA ACA AGT TTG ACT GTA CCC CAG GTA GAA CTG ATG TTG 960

305 Met Thr Asp Arg Thr Ser Leu Thr Val Pro Gln Val Glu Leu Met Leu 320305 Met Thr Asp Arg Thr Ser Leu Thr Val Pro Gln Val Glu Leu Met Leu 320

961 TGT TCA ACT GTC GGA GGT TCT ACG GTT GTT AAG TCT GAT AAT GTG AGT961 TGT TCA ACT GTC GGA GGT TCT ACG GTT GTT AAG TCT GAT AAT GTG AGT

10081008

321 Cys Ser Thr Val Gly Gly Ser Thr Val Val Lys Ser Asp Asn Val Ser 336321 Cys Ser Thr Val Gly Gly Ser Thr Val Val Lys Ser Asp Asn Val Ser 336

1009 TCT GGT GAC ACG ACA GCG ACG CCA TTT GCG TAT GGC GCC CGC TTT ATT1009 TCT GGT GAC ACG ACA GCG ACG CCA TTT GCG TAT GGC GCC CGC TTT ATT

10561056

337 Ser Gly Asp Thr Thr Ala Thr Pro Phe Ala Tyr Gly Ala Arg Phe Ile 352337 Ser Gly Asp Thr Thr Ala Thr Pro Phe Ala Tyr Gly Ala Arg Phe Ile 352

1057 CAT GCC GGT AAG CCG GAG GCG ATT ACC CTG AGT CGC AGT GGT GCG GAG1057 CAT GCC GGT AAG CCG GAG GCG ATT ACC CTG AGT CGC AGT GGT GCG GAG

11041104

353 His Ala Gly Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Gly Ala Glu 368353 His Ala Gly Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Gly Ala Glu 368

1105 GCG CAT TTT GCT CTG ACG GTT AAC AAT CTG ACA GAT GAC AAG TTG GAC1105 GCG CAT TTT GCT CTG ACG GTT AAC AAT CTG ACA GAT GAC AAG TTG GAC

11521152

369 Ala His Phe Ala Leu Thr Val Asn Asn Leu Thr Asp Asp Lys Leu Asp 384369 Ala His Phe Ala Leu Thr Val Asn Asn Leu Thr Asp Asp Lys Leu Asp 384

1153 CGT ATT AAC CGC ACA GTG CGC CTG CAA AAA TGG CTG AAT CTG CCT TAT1153 CGT ATT AAC CGC ACA GTG CGC CTG CAA AAA TGG CTG AAT CTG CCT TAT

12001200

385 Arg Ile Asn Arg Thr Val Arg Leu Gln Lys Trp Leu Asn Leu Pro Tyr 400385 Arg Ile Asn Arg Thr Val Arg Leu Gln Lys Trp Leu Asn Leu Pro Tyr 400

1201 GAG GAT ATT GAC CTG TTA GTG ACT TCT GCT ATG GAT GCG GAA ACA GGA1201 GAG GAT ATT GAC CTG TTA GTG ACT TCT GCT ATG GAT GCG GAA ACA GGA

12481248

401 Glu Asp Ile Asp Leu Leu Val Thr Ser Ala Met Asp Ala Glu Thr Gly 416401 Glu Asp Ile Asp Leu Leu Val Thr Ser Ala Met Asp Ala Glu Thr Gly 416

1249 AAT ACC GCG CTG TCG ATG AAC GAC AAT ACG CTG CGT ATG TTG GGA GTG1249 AAT ACC GCG CTG TCG ATG AAC GAC AAT ACG CTG CGT ATG TTG GGA GTG

12961296

417 Asn Thr Ala Leu Ser Met Asn Asp Asn Thr Leu Arg Met Leu Gly Val 432417 Asn Thr Ala Leu Ser Met Asn Asp Asn Thr Leu Arg Met Leu Gly Val 432

1297 TTC AAA CAT TAT CAG GCG AAG TAT GGT GTT AGC GCT AAA CAA TTT GCT1297 TTC AAA CAT TAT CAG GCG AAG TAT GGT GTT AGC GCT AAA CAA TTT GCT

13441344

433 Phe Lys His Tyr Gln Ala Lys Tyr Gly Val Ser Ala Lys Gln Phe Ala 448433 Phe Lys His Tyr Gln Ala Lys Tyr Gly Val Ser Ala Lys Gln Phe Ala 448

1345 GGC TGG CTG CGC GTA GTG GCC CCG TTT GCC ATT ACA CCG GCA ACG CCG1345 GGC TGG CTG CGC GTA GTG GCC CCG TTT GCC ATT ACA CCG GCA ACG CCG

13921392

449 Gly Trp Leu Arg Val Val Ala Pro Phe Ala Ile Thr Pro Ala Thr Pro 464449 Gly Trp Leu Arg Val Val Ala Pro Phe Ala Ile Thr Pro Ala Thr Pro 464

1393 TTT TTA GAC CAA GTG TTT AAC TCC GTC GGC ACC TTT GAT ACA CCG TTT1393 TTT TTA GAC CAA GTG TTT AAC TCC GTC GGC ACC TTT GAT ACA CCG TTT

14401440

465 Phe Leu Asp Gln Val Phe Asn Ser Val Gly Thr Phe Asp Thr Pro Phe 480465 Phe Leu Asp Gln Val Phe Asn Ser Val Gly Thr Phe Asp Thr Pro Phe 480

1441 GTG ATA GAT AAT CAG GAT TTT GTC TAT ACA TTG ACC ACC GGG GGC GAT1441 GTG ATA GAT AAT CAG GAT TTT GTC TAT ACA TTG ACC ACC GGG GGC GAT

14881488

481 Val Ile Asp Asn Gln Asp Phe Val Tyr Thr Leu Thr Thr Gly Gly Asp 496481 Val Ile Asp Asn Gln Asp Phe Val Tyr Thr Leu Thr Thr Gly Gly Asp 496

1489 GGG GCG CGT GTT AAG CAT ATC AGC ACG GCA CTG GGC CTC AAT CAT CGT1489 GGG GCG CGT GTT AAG CAT ATC AGC ACG GCA CTG GGC CTC AAT CAT CGT

15361536

497 Gly Ala Arg Val Lys His Ile Ser Thr Ala Leu Gly Leu Asn His Arg 512497 Gly Ala Arg Val Lys His Ile Ser Thr Ala Leu Gly Leu Asn His Arg 512

1537 CAG TTC CTG TTA TTG GCG GAT AAT ATT GCC CGT CAA CAG GGG AAT GTC1537 CAG TTC CTG TTA TTG GCG GAT AAT ATT GCC CGT CAA CAG GGG AAT GTC

15841584

513 Gln Phe Leu Leu Leu Ala Asp Asn Ile Ala Arg Gln Gln Gly Asn Val 528513 Gln Phe Leu Leu Leu Ala Asp Asn Ile Ala Arg Gln Gln Gly Asn Val 528

1585 ACG CAA AGC ACA CTC AAC TGT AAT CTG TTT GTG GTG TCA GCT TTC TAC1585 ACG CAA AGC ACA CTC AAC TGT AAT CTG TTT GTG GTG TCA GCT TTC TAC

16321632

529 Thr Gln Ser Thr Leu Asn Cys Asn Leu Phe Val Val Ser Ala Phe Tyr 544529 Thr Gln Ser Thr Leu Asn Cys Asn Leu Phe Val Val Ser Ala Phe Tyr 544

1633 CGT CTG GCT AAT TTG GCG CGC ACA TTG GGG ATA AAT CCA GAG TCT TTC1633 CGT CTG GCT AAT TTG GCG CGC ACA TTG GGG ATA AAT CCA GAG TCT TTC

16801680

545 Arg Leu Ala Asn Leu Ala Arg Thr Leu Gly Ile Asn Pro Glu Ser Phe 560545 Arg Leu Ala Asn Leu Ala Arg Thr Leu Gly Ile Asn Pro Glu Ser Phe 560

1681 TGT GCC TTG GTT GAT CGA TTA GAT GCA GGT ACA GGC ATC GTC TGG CAG1681 TGT GCC TTG GTT GAT CGA TTA GAT GCA GGT ACA GGC ATC GTC TGG CAG

17281728

561 Cys Ala Leu Val Asp Arg Leu Asp Ala Gly Thr Gly Ile Val Trp Gln 576561 Cys Ala Leu Val Asp Arg Leu Asp Ala Gly Thr Gly Ile Val Trp Gln 576

1729 CAA TTG GCA GGG AAA CCC ACA ATC ACG GTA CCA CAA AAA GAT TCC CCG1729 CAA TTG GCA GGG AAA CCC ACA ATC ACG GTA CCA CAA AAA GAT TCC CCG

17761776

577 Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser Pro 592577 Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser Pro 592

1777 CTG GCG GCG GAT ATT CTG AGT TTG CTG CAA GCG CTA AGT GCG ATT GCT1777 CTG GCG GCG GAT ATT CTG AGT TTG CTG CAA GCG CTA AGT GCG ATT GCT

18241824

593 Leu Ala Ala Asp Ile Leu Ser Leu Leu Gln Ala Leu Ser Ala Ile Ala 608593 Leu Ala Ala Asp Ile Leu Ser Leu Leu Gln Ala Leu Ser Ala Ile Ala 608

1825 CAA TGG CAA CAA CAG CAC GAT TTA GAA TTT TCA GCA CTG CTT TTG CTG1825 CAA TGG CAA CAA CAG CAC GAT TTA GAA TTT TCA GCA CTG CTT TTG CTG

18721872

609 Gln Trp Gln Gln Gln His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu 624609 Gln Trp Gln Gln Gln His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu 624

1873 TTG AGT GAC AAC CCT ATT TCT ACC TCG CAG GGC ACT GAC GAT CAA TTG1873 TTG AGT GAC AAC CCT ATT TCT ACC TCG CAG GGC ACT GAC GAT CAA TTG

19201920

625 Leu Ser Asp Asn Pro Ile Ser Thr Ser Gln Gly Thr Asp Asp Gln Leu 640625 Leu Ser Asp Asn Pro Ile Ser Thr Ser Gln Gly Thr Asp Asp Gln Leu 640

1921 AAC TTT ATC CGT CAA GTG TGG CAG AAC CTA GGC AGT ACG TTT GTG GGT1921 AAC TTT ATC CGT CAA GTG TGG CAG AAC CTA GGC AGT ACG TTT GTG GGT

19681968

641 Asn Phe Ile Arg Gln Val Trp Gln Asn Leu Gly Ser Thr Phe Val Gly 656641 Asn Phe Ile Arg Gln Val Trp Gln Asn Leu Gly Ser Thr Phe Val Gly 656

1969 GCA ACA TTG TTG TCC CGC AGT GGG GCA CCA TTA GTC GAT ACC AAC GGC1969 GCA ACA TTG TTG TCC CGC AGT GGG GCA CCA TTA GTC GAT ACC AAC GGC

20162016

657 Ala Thr Leu Leu Ser Arg Ser Gly Ala Pro Leu Val Asp Thr Asn Gly 672657 Ala Thr Leu Leu Ser Arg Ser Gly Ala Pro Leu Val Asp Thr Asn Gly 672

2017 CAC GCT ATT GAC TGG TTT GCT CTG CTC TCA GCA GGT AAT AGT CCG CTT2017 CAC GCT ATT GAC TGG TTT GCT CTG CTC TCA GCA GGT AAT AGT CCG CTT

20642064

673 His Ala Ile Asp Trp Phe Ala Leu Leu Ser Ala Gly Asn Ser Pro Leu 688673 His Ala Ile Asp Trp Phe Ala Leu Leu Ser Ala Gly Asn Ser Pro Leu 688

2065 ATC GAT AAG GTT GGT CTG GTG ACT GAT GCT GGC ATA CAA AGT GTT ATA2065 ATC GAT AAG GTT GGT CTG GTG ACT GAT GCT GGC ATA CAA AGT GTT ATA

21122112

689 Ile Asp Lys Val Gly Leu Val Thr Asp Ala Gly Ile Gln Ser Val Ile 704689 Ile Asp Lys Val Gly Leu Val Thr Asp Ala Gly Ile Gln Ser Val Ile 704

2113 GCA ACG GTG GTC AAT ACA CAA AGC TTA TCT GAT GAA GAT AAG AAG CTG2113 GCA ACG GTG GTC AAT ACA CAA AGC TTA TCT GAT GAA GAT AAG AAG CTG

21602160

705 Ala Thr Val Val Asn Thr Gln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720705 Ala Thr Val Val Asn Thr Gln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720

2161 GCA ATC ACT ACT CTG ACT AAT ACG TTG AAT CAG GTA CAG AAA ACT CAA2161 GCA ATC ACT ACT CTG ACT AAT ACG TTG AAT CAG GTA CAG AAA ACT CAA

22082208

721 Ala Ile Thr Thr Leu Thr Asn Thr Leu Asn Gln Val Gln Lys Thr Gln 736721 Ala Ile Thr Thr Leu Thr Asn Thr Leu Asn Gln Val Gln Lys Thr Gln 736

2209 CAG GGC GTG GCC GTC AGT CTG TTG GCG CAG ACT CTG AAC GTG AGT CAG2209 CAG GGC GTG GCC GTC AGT CTG TTG GCG CAG ACT CTG AAC GTG AGT CAG

22562256

737 Gln Gly Val Ala Val Ser Leu Leu Ala Gln Thr Leu Asn Val Ser Gln 752737 Gln Gly Val Ala Val Ser Leu Leu Ala Gln Thr Leu Asn Val Ser Gln 752

2257 TCA CTG CCT GCG TTA TTG TTG CGC TGG AGT GGA CAA ACA ACC TAC CAG2257 TCA CTG CCT GCG TTA TTG TTG CGC TGG AGT GGA CAA ACA ACC TAC CAG

23042304

753 Ser Leu Pro Ala Leu Leu Leu Arg Trp Ser Gly Gln Thr Thr Tyr Gln 768753 Ser Leu Pro Ala Leu Leu Leu Arg Trp Ser Gly Gln Thr Thr Tyr Gln 768

2305 TGG TTG AGT GCG ACT TGG GCA TTG AAG GAT GCC GTT AAG ACT GCC GCC2305 TGG TTG AGT GCG ACT TGG GCA TTG AAG GAT GCC GTT AAG ACT GCC GCC

23522352

769 Trp Leu Ser Ala Thr Trp Ala Leu Lys Asp Ala Val Lys Thr Ala Ala 784769 Trp Leu Ser Ala Thr Trp Ala Leu Lys Asp Ala Val Lys Thr Ala Ala 784

2353 GAT ATT CCC GCT GAC TAT CTG CGT CAA TTA CGT GAA GTG GTA CGC CGC2353 GAT ATT CCC GCT GAC TAT CTG CGT CAA TTA CGT GAA GTG GTA CGC CGC

24002400

785 Asp Ile Pro Ala Asp Tyr Leu Arg Gln Leu Arg Glu Val Val Arg Arg 800785 Asp Ile Pro Ala Asp Tyr Leu Arg Gln Leu Arg Glu Val Val Arg Arg 800

2401 TCC TTG TTG ACC CAA CAA TTC ACG CTG AGT CCT GCA ATG GTG CAA ACC2401 TCC TTG TTG ACC CAA CAA TTC ACG CTG AGT CCT GCA ATG GTG CAA ACC

24482448

801 Ser Leu Leu Thr Gln Gln Phe Thr Leu Ser Pro Ala Met Val Gln Thr 816801 Ser Leu Leu Thr Gln Gln Phe Thr Leu Ser Pro Ala Met Val Gln Thr 816

2449 TTG CTG GAC TAT CCA GCC TAT TTT GGC GCT TCC GCA GAA ACA GTG ACC2449 TTG CTG GAC TAT CCA GCC TAT TTT GGC GCT TCC GCA GAA ACA GTG ACC

24962496

817 Leu Leu Asp Tyr Pro Ala Tyr Phe Gly Ala Ser Ala Glu Thr Val Thr 832817 Leu Leu Asp Tyr Pro Ala Tyr Phe Gly Ala Ser Ala Glu Thr Val Thr 832

2497 GAT ATC AGT TTG TGG ATG CTT TAT ACC CTG AGC TGT TAT AGC GAT TTA2497 GAT ATC AGT TTG TGG ATG CTT TAT ACC CTG AGC TGT TAT AGC GAT TTA

25442544

833 Asp Ile Ser Leu Trp Met Leu Tyr Thr Leu Ser Cys Tyr Ser Asp Leu 848833 Asp Ile Ser Leu Trp Met Leu Tyr Thr Leu Ser Cys Tyr Ser Asp Leu 848

2545 TTG CTC CAA ATG GGT GAA GCT GGT GGT ACC GAA GAT GAT GTA CTG GCC2545 TTG CTC CAA ATG GGT GAA GCT GGT GGT ACC GAA GAT GAT GTA CTG GCC

25922592

849 Leu Leu Gln Met Gly Glu Ala Gly Gly Thr Glu Asp Asp Val Leu Ala 864849 Leu Leu Gln Met Gly Glu Ala Gly Gly Thr Glu Asp Asp Val Leu Ala 864

2593 TAC TTA CGC ACA GCT AAT GCT ACC ACA CCG TTG AGC CAA TCT GAT GCT2593 TAC TTA CGC ACA GCT AAT GCT ACC ACA CCG TTG AGC CAA TCT GAT GCT

26402640

865 Tyr Leu Arg Thr Ala Asn Ala Thr Thr Pro Leu Ser Gln Ser Asp Ala 880865 Tyr Leu Arg Thr Ala Asn Ala Thr Thr Pro Leu Ser Gln Ser Asp Ala 880

2641 GCA CAG ACG TTG GCA ACG CTA TTG GGT TGG GAG GTT AAC GAG TTG CAA2641 GCA CAG ACG TTG GCA ACG CTA TTG GGT TGG GAG GTT AAC GAG TTG CAA

26882688

881 Ala Gln Thr Leu Ala Thr Leu Leu Gly Trp Glu Val Asn Glu Leu Gln 896881 Ala Gln Thr Leu Ala Thr Leu Leu Gly Trp Glu Val Asn Glu Leu Gln 896

2689 GCC GCT TGG TCG GTA TTG GGC GGG ATT GCC AAA ACC ACA CCG CAA CTG2689 GCC GCT TGG TCG GTA TTG GGC GGG ATT GCC AAA ACC ACA CCG CAA CTG

27362736

897 Ala Ala Trp Ser Val Leu Gly Gly Ile Ala Lys Thr Thr Pro Gln Leu 912897 Ala Ala Trp Ser Val Leu Gly Gly Ile Ala Lys Thr Thr Pro Gln Leu 912

2737 GAT GCG CTT CTG CGT TTG CAA CAG GCA CAG AAC CAA ACT GGT CTT GGC2737 GAT GCG CTT CTG CGT TTG CAA CAG GCA CAG AAC CAA ACT GGT CTT GGC

27842784

913 Asp Ala Leu Leu Arg Leu Gln Gln Ala Gln Asn Gln Thr Gly Leu Gly 928913 Asp Ala Leu Leu Arg Leu Gln Gln Ala Gln Asn Gln Thr Gly Leu Gly 928

2785 GTT ACA CAG CAA CAG CAA GGC TAT CTC CTG AGT CGT GAC AGT GAT TAT2785 GTT ACA CAG CAA CAG CAA GGC TAT CTC CTG AGT CGT GAC AGT GAT TAT

28322832

929 Val Thr Gln Gln Gln Gln Gly Tyr Leu Leu Ser Arg Asp Ser Asp Tyr 944929 Val Thr Gln Gln Gln Gln Gly Tyr Leu Leu Ser Arg Asp Ser Asp Tyr 944

2833 ACC CTT TGG CAA AGC ACC GGT CAG GCG CTG GTG GCT GGC GTA TCC CAT2833 ACC CTT TGG CAA AGC ACC GGT CAG GCG CTG GTG GCT GGC GTA TCC CAT

28802880

945 Thr Leu Trp Gln Ser Thr Gly Gln Ala Leu Val Ala Gly Val Ser His 960945 Thr Leu Trp Gln Ser Thr Gly Gln Ala Leu Val Ala Gly Val Ser His 960

2881 GTC AAG GGC AGT AAC TGA GCATGGCAGA GCTCACTACC TGAGTGGATT TGATTT2881 GTC AAG GGC AGT AAC TGA GCATGGCAGA GCTCACTACC TGAGTGGATT TGATTT

29342934

961 Val Lys Gly Ser Asn End 965961 Val Lys Gly Ser Asn End 965

2935 TTCCGTATGG CCTAATGAGG CTATTTCTAA ACCGCCATTT AAGTAAGGCA GATAATTATG2935 TTCCGTATGG CCTAATGAGG CTATTTCTAA ACCGCCATTT AAGTAAGGCA GATAATTATG

29942994

(2) INFORMATION FOR SEQ ID NO:57(2) INFORMATION FOR SEQ ID NO: 57

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 965 amino acids(A) LENGTH: 965 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:57 (TccA peptide)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 57 (TccA peptide)

Features From To DescriptionFeatures From To Description

1 10 SEQ ID NO:81 10 SEQ ID NO: 8

1 Met Asn Gln Leu Ala Ser Pro Leu Ile Ser Arg Thr Glu Glu Ile His 161 Met Asn Gln Leu Ala Ser Pro Leu Ile Ser Arg Thr Glu Glu Ile His 16

17 Asn Leu Pro Gly Lys Leu Thr Asp Leu Gly Tyr Thr Ser Val Phe Asp 3217 Asn Leu Pro Gly Lys Leu Thr Asp Leu Gly Tyr Thr Ser Val Phe Asp 32

33 Val Val Arg Met Pro Arg Glu Arg Phe Ile Arg Glu His Arg Ala Asp 4833 Val Val Arg Met Pro Arg Glu Arg Phe Ile Arg Glu His Arg Ala Asp 48

49 Leu Gly Arg Ser Ala Glu Lys Met Tyr Asp Leu Ala Val Gly Tyr Ala 6449 Leu Gly Arg Ser Ala Glu Lys Met Tyr Asp Leu Ala Val Gly Tyr Ala 64

65 His Gln Val Leu His His Phe Arg Arg Asn Ser Leu Ser Glu Ala Val 8065 His Gln Val Leu His His Phe Arg Arg Asn Ser Leu Ser Glu Ala Val 80

81 Gln Phe Gly Leu Arg Ser Pro Phe Ser Val Ser Gly Pro Asp Tyr Ala 9681 Gln Phe Gly Leu Arg Ser Pro Phe Ser Val Ser Gly Pro Asp Tyr Ala 96

97 Asn Gln Phe Leu Asp Ala Asn Thr Gly Trp Lys Asp Lys Ala Pro Ser 11297 Asn Gln Phe Leu Asp Ala Asn Thr Gly Trp Lys Asp Lys Ala Pro Ser 112

113 Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His Ile 128113 Gly Ser Pro Glu Ala Asn Asp Ala Pro Val Ala Tyr Leu Thr His Ile 128

129 Tyr Gln Leu Ala Leu Glu Gln Glu Lys Asn Gly Ala Thr Thr Ile Met 144129 Tyr Gln Leu Ala Leu Glu Gln Glu Lys Asn Gly Ala Thr Thr Ile Met 144

145 Asn Thr Leu Ala Glu Arg Arg Pro Asp Leu Gly Ala Leu Leu Ile Asn 160145 Asn Thr Leu Ala Glu Arg Arg Pro Asp Leu Gly Ala Leu Leu Ile Asn 160

161 Asp Lys Ala Ile Asn Glu Val Ile Pro Gln Leu Gln Leu Val Asn Glu 176161 Asp Lys Ala Ile Asn Glu Val Ile Pro Gln Leu Gln Leu Val Asn Glu 176

177 Ile Leu Ser Lys Ala Ile Gln Lys Lys Leu Ser Leu Thr Asp Leu Glu 192177 Ile Leu Ser Lys Ala Ile Gln Lys Lys Leu Ser Leu Thr Asp Leu Glu 192

193 Ala Val Asn Ala Arg Leu Ser Thr Thr Arg Tyr Pro Asn Asn Leu Pro 208193 Ala Val Asn Ala Arg Leu Ser Thr Thr Arg Tyr Pro Asn Asn Leu Pro 208

209 Tyr His Tyr Gly His Gln Gln Ile Gln Thr Ala Gln Ser Val Leu Gly 224209 Tyr His Tyr Gly His Gln Gln Ile Gln Thr Ala Gln Ser Val Leu Gly 224

225 Thr Thr Leu Gln Asp Ile Thr Leu Pro Gln Thr Leu Asp Leu Pro Gln 240225 Thr Thr Leu Gln Asp Ile Thr Leu Pro Gln Thr Leu Asp Leu Pro Gln 240

241 Asn Phe Trp Ala Thr Ala Lys Gly Lys Leu Ser Asp Thr Thr Ala Ser 256241 Asn Phe Trp Ala Thr Ala Lys Gly Lys Leu Ser Asp Thr Thr Ala Ser 256

257 Ala Leu Thr Arg Leu Gln Ile Met Ala Ser Gln Phe Ser Pro Glu Gln 272257 Ala Leu Thr Arg Leu Gln Ile Met Ala Ser Gln Phe Ser Pro Glu Gln 272

273 Gln Lys Ile Ile Thr Glu Thr Val Gly Gln Asp Phe Tyr Gln Leu Asn 288273 Gln Lys Ile Ile Thr Glu Thr Val Gly Gln Asp Phe Tyr Gln Leu Asn 288

289 Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Met Thr Ile 304289 Tyr Gly Asp Ser Ser Leu Thr Val Asn Ser Phe Ser Asp Met Thr Ile 304

305 Met Thr Asp Arg Thr Ser Leu Thr Val Pro Gln Val Glu Leu Met Leu 320305 Met Thr Asp Arg Thr Ser Leu Thr Val Pro Gln Val Glu Leu Met Leu 320

321 Cys Ser Thr Val Gly Gly Ser Thr Val Val Lys Ser Asp Asn Val Ser 336321 Cys Ser Thr Val Gly Gly Ser Thr Val Val Lys Ser Asp Asn Val Ser 336

337 Ser Gly Asp Thr Thr Ala Thr Pro Phe Ala Tyr Gly Ala Arg Phe Ile 352337 Ser Gly Asp Thr Thr Ala Thr Pro Phe Ala Tyr Gly Ala Arg Phe Ile 352

353 His Ala Gly Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Gly Ala Glu 368353 His Ala Gly Lys Pro Glu Ala Ile Thr Leu Ser Arg Ser Gly Ala Glu 368

369 Ala His Phe Ala Leu Thr Val Asn Asn Leu Thr Asp Asp Lys Leu Asp 384369 Ala His Phe Ala Leu Thr Val Asn Asn Leu Thr Asp Asp Lys Leu Asp 384

385 Arg Ile Asn Arg Thr Val Arg Leu Gln Lys Trp Leu Asn Leu Pro Tyr 400385 Arg Ile Asn Arg Thr Val Arg Leu Gln Lys Trp Leu Asn Leu Pro Tyr 400

401 Glu Asp Ile Asp Leu Leu Val Thr Ser Ala Met Asp Ala Glu Thr Gly 416401 Glu Asp Ile Asp Leu Leu Val Thr Ser Ala Met Asp Ala Glu Thr Gly 416

417 Asn Thr Ala Leu Ser Met Asn Asp Asn Thr Leu Arg Met Leu Gly Val 432417 Asn Thr Ala Leu Ser Met Asn Asp Asn Thr Leu Arg Met Leu Gly Val 432

433 Phe Lys His Tyr Gln Ala Lys Tyr Gly Val Ser Ala Lys Gln Phe Ala 448433 Phe Lys His Tyr Gln Ala Lys Tyr Gly Val Ser Ala Lys Gln Phe Ala 448

449 Gly Trp Leu Arg Val Val Ala Pro Phe Ala Ile Thr Pro Ala Thr Pro 464449 Gly Trp Leu Arg Val Val Ala Pro Phe Ala Ile Thr Pro Ala Thr Pro 464

465 Phe Leu Asp Gln Val Phe Asn Ser Val Gly Thr Phe Asp Thr Pro Phe 480465 Phe Leu Asp Gln Val Phe Asn Ser Val Gly Thr Phe Asp Thr Pro Phe 480

481 Val Ile Asp Asn Gln Asp Phe Val Tyr Thr Leu Thr Thr Gly Gly Asp 496481 Val Ile Asp Asn Gln Asp Phe Val Tyr Thr Leu Thr Thr Gly Gly Asp 496

497 Gly Ala Arg Val Lys His Ile Ser Thr Ala Leu Gly Leu Asn His Arg 512497 Gly Ala Arg Val Lys His Ile Ser Thr Ala Leu Gly Leu Asn His Arg 512

513 Gln Phe Leu Leu Leu Ala Asp Asn Ile Ala Arg Gln Gln Gly Asn Val 528513 Gln Phe Leu Leu Leu Ala Asp Asn Ile Ala Arg Gln Gln Gly Asn Val 528

529 Thr Gln Ser Thr Leu Asn Cys Asn Leu Phe Val Val Ser Ala Phe Tyr 544529 Thr Gln Ser Thr Leu Asn Cys Asn Leu Phe Val Val Ser Ala Phe Tyr 544

545 Arg Leu Ala Asn Leu Ala Arg Thr Leu Gly Ile Asn Pro Glu Ser Phe 560545 Arg Leu Ala Asn Leu Ala Arg Thr Leu Gly Ile Asn Pro Glu Ser Phe 560

561 Cys Ala Leu Val Asp Arg Leu Asp Ala Gly Thr Gly Ile Val Trp Gln 576561 Cys Ala Leu Val Asp Arg Leu Asp Ala Gly Thr Gly Ile Val Trp Gln 576

577 Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser Pro 592577 Gln Leu Ala Gly Lys Pro Thr Ile Thr Val Pro Gln Lys Asp Ser Pro 592

593 Leu Ala Ala Asp Ile Leu Ser Leu Leu Gln Ala Leu Ser Ala Ile Ala 608593 Leu Ala Ala Asp Ile Leu Ser Leu Leu Gln Ala Leu Ser Ala Ile Ala 608

609 Gln Trp Gln Gln Gln His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu 624609 Gln Trp Gln Gln Gln His Asp Leu Glu Phe Ser Ala Leu Leu Leu Leu 624

625 Leu Ser Asp Asn Pro Ile Ser Thr Ser Gln Gly Thr Asp Asp Gln Leu 640625 Leu Ser Asp Asn Pro Ile Ser Thr Ser Gln Gly Thr Asp Asp Gln Leu 640

641 Asn Phe Ile Arg Gln Val Trp Gln Asn Leu Gly Ser Thr Phe Val Gly 656641 Asn Phe Ile Arg Gln Val Trp Gln Asn Leu Gly Ser Thr Phe Val Gly 656

657 Ala Thr Leu Leu Ser Arg Ser Gly Ala Pro Leu Val Asp Thr Asn Gly 672657 Ala Thr Leu Leu Ser Arg Ser Gly Ala Pro Leu Val Asp Thr Asn Gly 672

673 His Ala Ile Asp Trp Phe Ala Leu Leu Ser Ala Gly Asn Ser Pro Leu 688673 His Ala Ile Asp Trp Phe Ala Leu Leu Ser Ala Gly Asn Ser Pro Leu 688

689 Ile Asp Lys Val Gly Leu Val Thr Asp Ala Gly Ile Gln Ser Val Ile 704689 Ile Asp Lys Val Gly Leu Val Thr Asp Ala Gly Ile Gln Ser Val Ile 704

705 Ala Thr Val Val Asn Thr Gln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720705 Ala Thr Val Val Asn Thr Gln Ser Leu Ser Asp Glu Asp Lys Lys Leu 720

721 Ala Ile Thr Thr Leu Thr Asn Thr Leu Asn Gln Val Gln Lys Thr Gln 736721 Ala Ile Thr Thr Leu Thr Asn Thr Leu Asn Gln Val Gln Lys Thr Gln 736

737 Gln Gly Val Ala Val Ser Leu Leu Ala Gln Thr Leu Asn Val Ser Gln 752737 Gln Gly Val Ala Val Ser Leu Leu Ala Gln Thr Leu Asn Val Ser Gln 752

753 Ser Leu Pro Ala Leu Leu Leu Arg Trp Ser Gly Gln Thr Thr Tyr Gln 768753 Ser Leu Pro Ala Leu Leu Leu Arg Trp Ser Gly Gln Thr Thr Tyr Gln 768

769 Trp Leu Ser Ala Thr Trp Ala Leu Lys Asp Ala Val Lys Thr Ala Ala 784769 Trp Leu Ser Ala Thr Trp Ala Leu Lys Asp Ala Val Lys Thr Ala Ala 784

785 Asp Ile Pro Ala Asp Tyr Leu Arg Gln Leu Arg Glu Val Val Arg Arg 800785 Asp Ile Pro Ala Asp Tyr Leu Arg Gln Leu Arg Glu Val Val Arg Arg 800

801 Ser Leu Leu Thr Gln Gln Phe Thr Leu Ser Pro Ala Met Val Gln Thr 816801 Ser Leu Leu Thr Gln Gln Phe Thr Leu Ser Pro Ala Met Val Gln Thr 816

817 Leu Leu Asp Tyr Pro Ala Tyr Phe Gly Ala Ser Ala Glu Thr Val Thr 832817 Leu Leu Asp Tyr Pro Ala Tyr Phe Gly Ala Ser Ala Glu Thr Val Thr 832

833 Asp Ile Ser Leu Trp Met Leu Tyr Thr Leu Ser Cys Tyr Ser Asp Leu 848833 Asp Ile Ser Leu Trp Met Leu Tyr Thr Leu Ser Cys Tyr Ser Asp Leu 848

849 Leu Leu Gln Met Gly Glu Ala Gly Gly Thr Glu Asp Asp Val Leu Ala 864849 Leu Leu Gln Met Gly Glu Ala Gly Gly Thr Glu Asp Asp Val Leu Ala 864

865 Tyr Leu Arg Thr Ala Asn Ala Thr Thr Pro Leu Ser Gln Ser Asp Ala 880865 Tyr Leu Arg Thr Ala Asn Ala Thr Thr Pro Leu Ser Gln Ser Asp Ala 880

881 Ala Gln Thr Leu Ala Thr Leu Leu Gly Trp Glu Val Asn Glu Leu Gln 896881 Ala Gln Thr Leu Ala Thr Leu Leu Gly Trp Glu Val Asn Glu Leu Gln 896

897 Ala Ala Trp Ser Val Leu Gly Gly Ile Ala Lys Thr Thr Pro Gln Leu 912897 Ala Ala Trp Ser Val Leu Gly Gly Ile Ala Lys Thr Thr Pro Gln Leu 912

913 Asp Ala Leu Leu Arg Leu Gln Gln Ala Gln Asn Gln Thr Gly Leu Gly 928913 Asp Ala Leu Leu Arg Leu Gln Gln Ala Gln Asn Gln Thr Gly Leu Gly 928

929 Val Thr Gln Gln Gln Gln Gly Tyr Leu Leu Ser Arg Asp Ser Asp Tyr 944929 Val Thr Gln Gln Gln Gln Gly Tyr Leu Leu Ser Arg Asp Ser Asp Tyr 944

945 Thr Leu Trp Gln Ser Thr Gly Gln Ala Leu Val Ala Gly Val Ser His 960945 Thr Leu Trp Gln Ser Thr Gly Gln Ala Leu Val Ala Gly Val Ser His 960

961 Val Lys Gly Ser Asn 965961 Val Lys Gly Ser Asn 965

(2) INFORMATION FOR SEQ ID NO:58(2) INFORMATION FOR SEQ ID NO: 58

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 4932 base pairs(A) LENGTH: 4932 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:58 (tccB)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 58 (tccB)

1 ATG TTA TCG ACA ATG GAA AAA CAA CTG AAT GAA TCC CAG CGT GAT GCG 481 ATG TTA TCG ACA ATG GAA AAA CAA CTG AAT GAA TCC CAG CGT GAT GCG 48

1 Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg Asp Ala 161 Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg Asp Ala 16

49 TTG GTG ACT GGC TAT ATG AAT TTT GTG GCG CCG ACG TTG AAA GGC GTC 9649 TTG GTG ACT GGC TAT ATG AAT TTT GTG GCG CCG ACG TTG AAA GGC GTC 96

17 Leu Val Thr Gly Tyr Met Asn Phe Val Ala Pro Thr Leu Lys Gly Val 3217 Leu Val Thr Gly Tyr Met Asn Phe Val Ala Pro Thr Leu Lys Gly Val 32

97 AGT GGT CAG CCG GTG ACG GTG GAA GAT TTA TAC GAA TAT TTG CTG ATT 14497 AGT GGT CAG CCG GTG ACG GTG GAA GAT TTA TAC GAA TAT TTG CTG ATT 144

33 Ser Gly Gln Pro Val Thr Val Glu Asp Leu Tyr Glu Tyr Leu Leu Ile 4833 Ser Gly Gln Pro Val Thr Val Glu Asp Leu Tyr Glu Tyr Leu Leu Ile 48

145 GAC CCG GAA GTG GCT GAT GAG GTT GAG ACG AGT CGG GTA GCA CAA GCG 192145 GAC CCG GAA GTG GCT GAT GAG GTT GAG ACG AGT CGG GTA GCA CAA GCG 192

49 Asp Pro Glu Val Ala Asp Glu Val Glu Thr Ser Arg Val Ala Gln Ala 6449 Asp Pro Glu Val Ala Asp Glu Val Glu Thr Ser Arg Val Ala Gln Ala 64

193 ATT GCC AGC ATA CAG CAA TAT ATG ACT CGT CTG GTC AAC GGC TCT GAA 240193 ATT GCC AGC ATA CAG CAA TAT ATG ACT CGT CTG GTC AAC GGC TCT GAA 240

65 Ile Ala Ser Ile Gln Gln Tyr Met Thr Arg Leu Val Asn Gly Ser Glu 8065 Ile Ala Ser Ile Gln Gln Tyr Met Thr Arg Leu Val Asn Gly Ser Glu 80

241 CCG GGG CGT CAG GCG ATG GAG CCT TCT ACA GCT AAC GAA TGG CGT GAT 288241 CCG GGG CGT CAG GCG ATG GAG CCT TCT ACA GCT AAC GAA TGG CGT GAT 288

81 Pro Gly Arg Gln Ala Met Glu Pro Ser Thr Ala Asn Glu Trp Arg Asp 9681 Pro Gly Arg Gln Ala Met Glu Pro Ser Thr Ala Asn Glu Trp Arg Asp 96

289 AAT GAT AAC CAA TAT GCT ATC TGG GCT GCG GGG GCT GAG GTT CGA AAT 336289 AAT GAT AAC CAA TAT GCT ATC TGG GCT GCG GGG GCT GAG GTT CGA AAT 336

97 Asn Asp Asn Gln Tyr Ala Ile Trp Ala Ala Gly Ala Glu Val Arg Asn 11297 Asn Asp Asn Gln Tyr Ala Ile Trp Ala Ala Gly Ala Glu Val Arg Asn 112

337 TAC GCT GAA AAC TAT ATT TCA CCC ATC ACC CGG CAG GAA AAA AGC CAT 384337 TAC GCT GAA AAC TAT ATT TCA CCC ATC ACC CGG CAG GAA AAA AGC CAT 384

113 Tyr Ala Glu Asn Tyr Ile Ser Pro Ile Thr Arg Gln Glu Lys Ser His 128113 Tyr Ala Glu Asn Tyr Ile Ser Pro Ile Thr Arg Gln Glu Lys Ser His 128

385 TAT TTC TCG GAG CTG GAG ACG ACT TTA AAT CAG AAT CGA CTC GAT CCG 432385 TAT TTC TCG GAG CTG GAG ACG ACT TTA AAT CAG AAT CGA CTC GAT CCG 432

129 Tyr Phe Ser Glu Leu Glu Thr Thr Leu Asn Gln Asn Arg Leu Asp Pro 144129 Tyr Phe Ser Glu Leu Glu Thr Thr Leu Asn Gln Asn Arg Leu Asp Pro 144

433 GAT CGT GTG CAG GAT GCT GTT TTG GCG TAT CTC AAT GAG TTT GAG GCA 480433 GAT CGT GTG CAG GAT GCT GTT TTG GCG TAT CTC AAT GAG TTT GAG GCA 480

145 Asp Arg Val Gln Asp Ala Val Leu Ala Tyr Leu Asn Glu Phe Glu Ala 160145 Asp Arg Val Gln Asp Ala Val Leu Ala Tyr Leu Asn Glu Phe Glu Ala 160

481 GTG AGT AAT CTA TAT GTG CTC AGT GGT TAT ATT AAT CAG GAT AAA TTT 528481 GTG AGT AAT CTA TAT GTG CTC AGT GGT TAT ATT AAT CAG GAT AAA TTT 528

161 Val Ser Asn Leu Tyr Val Leu Ser Gly Tyr Ile Asn Gln Asp Lys Phe 176161 Val Ser Asn Leu Tyr Val Leu Ser Gly Tyr Ile Asn Gln Asp Lys Phe 176

529 GAC CAA GCT ATC TAC TAC TTT ATT GGT CGC ACT ACC ACT AAA CCG TAT 576529 GAC CAA GCT ATC TAC TAC TTT ATT GGT CGC ACT ACC ACT AAA CCG TAT 576

177 Asp Gln Ala Ile Tyr Tyr Phe Ile Gly Arg Thr Thr Thr Lys Pro Tyr 192177 Asp Gln Ala Ile Tyr Tyr Phe Ile Gly Arg Thr Thr Thr Ly Lys Pro Tyr 192

577 CGC TAC TAC TGG CGT CAG ATG GAT TTG AGT AAG AAC CGT CAA GAT CCG 624577 CGC TAC TAC TGG CGT CAG ATG GAT TTG AGT AAG AAC CGT CAA GAT CCG 624

193 Arg Tyr Tyr Trp Arg Gln Met Asp Leu Ser Lys Asn Arg Gln Asp Pro 208193 Arg Tyr Tyr Trp Arg Gln Met Asp Leu Ser Lys Asn Arg Gln Asp Pro 208

625 GCA GGG AAT CCG GTG ACG CCA AAT TGC TGG AAT GAT TGG CAG GAA ATC 672625 GCA GGG AAT CCG GTG ACG CCA AAT TGC TGG AAT GAT TGG CAG GAA ATC 672

209 Ala Gly Asn Pro Val Thr Pro Asn Cys Trp Asn Asp Trp Gln Glu Ile 224209 Ala Gly Asn Pro Val Thr Pro Asn Cys Trp Asn Asp Trp Gln Glu Ile 224

673 ACT TTG CCG CTG TCT GGT GAT ACG GTG CTG GAG CAT ACA GTT CGC CCG 720673 ACT TTG CCG CTG TCT GGT GAT ACG GTG CTG GAG CAT ACA GTT CGC CCG 720

225 Thr Leu Pro Leu Ser Gly Asp Thr Val Leu Glu His Thr Val Arg Pro 240225 Thr Leu Pro Leu Ser Gly Asp Thr Val Leu Glu His Thr Val Arg Pro 240

721 GTA TTT TAT AAT GAT CGA CTA TAT GTG GCT TGG GTT GAG CGT GAC CCG 768721 GTA TTT TAT AAT GAT CGA CTA TAT GTG GCT TGG GTT GAG CGT GAC CCG 768

241 Val Phe Tyr Asn Asp Arg Leu Tyr Val Ala Trp Val Glu Arg Asp Pro 256241 Val Phe Tyr Asn Asp Arg Leu Tyr Val Ala Trp Val Glu Arg Asp Pro 256

769 GCA GTA CAG AAG GAT GCT GAC GGT AAA AAC ATC GGT AAA ACC CAT GCC 816769 GCA GTA CAG AAG GAT GCT GAC GGT AAA AAC ATC GGT AAA ACC CAT GCC 816

257 Ala Val Gln Lys Asp Ala Asp Gly Lys Asn Ile Gly Lys Thr His Ala 272257 Ala Val Gln Lys Asp Ala Asp Gly Lys Asn Ile Gly Lys Thr His Ala 272

817 TAC AAC ATA AAG TTT GGT TAT AAA CGT TAT GAT GAT ACT TGG ACA GCG 864817 TAC AAC ATA AAG TTT GGT TAT AAA CGT TAT GAT GAT ACT TGG ACA GCG 864

273 Tyr Asn Ile Lys Phe Gly Tyr Lys Arg Tyr Asp Asp Thr Trp Thr Ala 288273 Tyr Asn Ile Lys Phe Gly Tyr Lys Arg Tyr Asp Asp Thr Trp Thr Ala 288

865 CCG AAT ACG ACC ACG TTA ATG ACA CAA CAA GCA GGG GAA AGT TCA GAA 912865 CCG AAT ACG ACC ACG TTA ATG ACA CAA CAA GCA GGG GAA AGT TCA GAA 912

289 Pro Asn Thr Thr Thr Leu Met Thr Gln Gln Ala Gly Glu Ser Ser Glu 304289 Pro Asn Thr Thr Thr Leu Met Thr Gln Gln Ala Gly Glu Ser Ser Glu 304

913 ACA CAG CGA TCC AGC CTG CTG ATT GAT GAA TCT AGC ACC ACA TTG CGC 960913 ACA CAG CGA TCC AGC CTG CTG ATT GAT GAA TCT AGC ACC ACA TTG CGC 960

305 Thr Gln Arg Ser Ser Leu Leu Ile Asp Glu Ser Ser Thr Thr Leu Arg 320305 Thr Gln Arg Ser Ser Leu Leu Ile Asp Glu Ser Ser Thr Thr Leu Arg 320

961 CAA GTT AAT CTG TTG GCT ACC ACC GAT TTT AGT ATC GAT CCG ACG GAG961 CAA GTT AAT CTG TTG GCT ACC ACC GAT TTT AGT ATC GAT CCG ACG GAG

10081008

321 Gln Val Asn Leu Leu Ala Thr Thr Asp Phe Ser Ile Asp Pro Thr Glu 336321 Gln Val Asn Leu Leu Ala Thr Thr Asp Phe Ser Ile Asp Pro Thr Glu 336

1009 GAA ACG GAC AGT AAC CCG TAT GGC CGC CTA ATG TTG GGG GTG TTT GTC1009 GAA ACG GAC AGT AAC CCG TAT GGC CGC CTA ATG TTG GGG GTG TTT GTC

10561056

337 Glu Thr Asp Ser Asn Pro Tyr Gly Arg Leu Met Leu Gly Val Phe Val 352337 Glu Thr Asp Ser Asn Pro Tyr Gly Arg Leu Met Leu Gly Val Phe Val 352

1057 CGT CAA TTT GAA GGT GAT GGG GCC AAT AGA AAA AAT AAA CCC GTT GTT1057 CGT CAA TTT GAA GGT GAT GGG GCC AAT AGA AAA AAT AAA CCC GTT GTT

11041104

353 Arg Gln Phe Glu Gly Asp Gly Ala Asn Arg Lys Asn Lys Pro Val Val 368353 Arg Gln Phe Glu Gly Asp Gly Ala Asn Arg Lys Asn Lys Pro Val Val 368

1105 TAT GGT TAT CTC TAT TGT GAC TCA GCT TTC AAT CGT CAT GTT CTC AGG1105 TAT GGT TAT CTC TAT TGT GAC TCA GCT TTC AAT CGT CAT GTT CTC AGG

11521152

369 Tyr Gly Tyr Leu Tyr Cys Asp Ser Ala Phe Asn Arg His Val Leu Arg 384369 Tyr Gly Tyr Leu Tyr Cys Asp Ser Ala Phe Asn Arg His Val Leu Arg 384

1153 CCG TTA AGT AAG AAC TTT TTG TTC AGT ACT TAC CGT GAT GAA ACG GAT1153 CCG TTA AGT AAG AAC TTT TTG TTC AGT ACT TAC CGT GAT GAA ACG GAT

12001200

385 Pro Leu Ser Lys Asn Phe Leu Phe Ser Thr Tyr Arg Asp Glu Thr Asp 400385 Pro Leu Ser Lys Asn Phe Leu Phe Ser Thr Tyr Arg Asp Glu Thr Asp 400

1201 GGT CAA AAC AGC TTG CAA TTT GCG GTA TAC GAT AAA AAG TAT GTA ATT1201 GGT CAA AAC AGC TTG CAA TTT GCG GTA TAC GAT AAA AAG TAT GTA ATT

12481248

401 Gly Gln Asn Ser Leu Gln Phe Ala Val Tyr Asp Lys Lys Tyr Val Ile 416401 Gly Gln Asn Ser Leu Gln Phe Ala Val Tyr Asp Lys Lys Tyr Val Ile 416

1249 ACT AAG GTT GTT ACA GGT GCA ACG GAA GAT CCC GAA AAT ACA GGA TGG1249 ACT AAG GTT GTT ACA GGT GCA ACG GAA GAT CCC GAA AAT ACA GGA TGG

12961296

417 Thr Lys Val Val Thr Gly Ala Thr Glu Asp Pro Glu Asn Thr Gly Trp 432417 Thr Lys Val Val Thr Gly Ala Thr Glu Asp Pro Glu Asn Thr Gly Trp 432

1297 GTA AGT AAA GTT GAT GAC TTG AAA CAA GGC ACT ACT GGG GCC TAT GTG1297 GTA AGT AAA GTT GAT GAC TTG AAA CAA GGC ACT ACT GGG GCC TAT GTG

13441344

433 Val Ser Lys Val Asp Asp Leu Lys Gln Gly Thr Thr Gly Ala Tyr Val 448433 Val Ser Lys Val Asp Asp Leu Lys Gln Gly Thr Thr Gly Ala Tyr Val 448

1345 TAT ATC GAT CAA GAT GGC CTG ACG CTT CAT ATA CAA ACC ACA ACT AAT1345 TAT ATC GAT CAA GAT GGC CTG ACG CTT CAT ATA CAA ACC ACA ACT AAT

13921392

449 Tyr Ile Asp Gln Asp Gly Leu Thr Leu His Ile Gln Thr Thr Thr Asn 464449 Tyr Ile Asp Gln Asp Gly Leu Thr Leu His Ile Gln Thr Thr Thr Asn 464

1393 GGG GAT TTT ATT AAC CGT CAT ACG TTT GGA TAT AAC GAT CTT GTA TAT1393 GGG GAT TTT ATT AAC CGT CAT ACG TTT GGA TAT AAC GAT CTT GTA TAT

14401440

465 Gly Asp Phe Ile Asn Arg His Thr Phe Gly Tyr Asn Asp Leu Val Tyr 480465 Gly Asp Phe Ile Asn Arg His Thr Phe Gly Tyr Asn Asp Leu Val Tyr 480

1441 GAT TCT AAG TCT GGT TAT GGT TTC ACG TGG TCA GGA AAT GAA GGT TTT1441 GAT TCT AAG TCT GGT TAT GGT TTC ACG TGG TCA GGA AAT GAA GGT TTT

14881488

481 Asp Ser Lys Ser Gly Tyr Gly Phe Thr Trp Ser Gly Asn Glu Gly Phe 496481 Asp Ser Lys Ser Gly Tyr Gly Phe Thr Trp Ser Gly Asn Glu Gly Phe 496

1489 TAT CTG GAT TAC CAT GAT GGA AAT TAT TAC ACC TTT CAT AAT GCA ATA1489 TAT CTG GAT TAC CAT GAT GGA AAT TAT TAC ACC TTT CAT AAT GCA ATA

15361536

497 Tyr Leu Asp Tyr His Asp Gly Asn Tyr Tyr Thr Phe His Asn Ala Ile 512497 Tyr Leu Asp Tyr His Asp Gly Asn Tyr Tyr Thr Phe His Asn Ala Ile 512

1537 ATC AAC TAC TAT CCG TCT GGA TAT GGT GGT GGA TCT GTT CCT AAT GGA1537 ATC AAC TAC TAT CCG TCT GGA TAT GGT GGT GGA TCT GTT CCT AAT GGA

15841584

513 Ile Asn Tyr Tyr Pro Ser Gly Tyr Gly Gly Gly Ser Val Pro Asn Gly 528513 Ile Asn Tyr Tyr Pro Ser Gly Tyr Gly Gly Gly Ser Val Pro Asn Gly 528

1585 ACG TGG GCG TTA GAG CAA AGG ATT AAT GAG GGA TGG GCT ATT GCT CCC1585 ACG TGG GCG TTA GAG CAA AGG ATT AAT GAG GGA TGG GCT ATT GCT CCC

16321632

529 Thr Trp Ala Leu Glu Gln Arg Ile Asn Glu Gly Trp Ala Ile Ala Pro 544529 Thr Trp Ala Leu Glu Gln Arg Ile Asn Glu Gly Trp Ala Ile Ala Pro 544

1633 CTG CTT GAT ACT CTC CAT ACT GTT ACT GTG AAG GGC AGT TAT ATC GCT1633 CTG CTT GAT ACT CTC CAT ACT GTT ACT GTG AAG GGC AGT TAT ATC GCT

16801680

545 Leu Leu Asp Thr Leu His Thr Val Thr Val Lys Gly Ser Tyr Ile Ala 560545 Leu Leu Asp Thr Leu His Thr Val Thr Val Lys Gly Ser Tyr Ile Ala 560

1681 TGG GAA GGG GAA ACA CCT ACC GGT TAT AAT CTG TAT ATT CCA GAT GGT1681 TGG GAA GGG GAA ACA CCT ACC GGT TAT AAT CTG TAT ATT CCA GAT GGT

17281728

561 Trp Glu Gly Glu Thr Pro Thr Gly Tyr Asn Leu Tyr Ile Pro Asp Gly 576561 Trp Glu Gly Glu Thr Pro Thr Gly Tyr Asn Leu Tyr Ile Pro Asp Gly 576

1729 ACC GTG TTG CTA GAT TGG TTT GAT AAA ATA AAT TTT GCT ATT GGT CTT1729 ACC GTG TTG CTA GAT TGG TTT GAT AAA ATA AAT TTT GCT ATT GGT CTT

17761776

577 Thr Val Leu Leu Asp Trp Phe Asp Lys Ile Asn Phe Ala Ile Gly Leu 592577 Thr Val Leu Leu Asp Trp Phe Asp Lys Ile Asn Phe Ala Ile Gly Leu 592

1777 AAT AAG CTT GAG TCT GTA TTT ACG TCG CCA GAT TGG CCA ACA CTA ACC1777 AAT AAG CTT GAG TCT GTA TTT ACG TCG CCA GAT TGG CCA ACA CTA ACC

18241824

593 Asn Lys Leu Glu Ser Val Phe Thr Ser Pro Asp Trp Pro Thr Leu Thr 608593 Asn Lys Leu Glu Ser Val Phe Thr Ser Pro Asp Trp Pro Thr Leu Thr 608

1825 ACT ATC AAA AAT TTC AGT AAA ATC GCC GAT AAC CGC AAA TTC TAT CAG1825 ACT ATC AAA AAT TTC AGT AAA ATC GCC GAT AAC CGC AAA TTC TAT CAG

18721872

609 Thr Ile Lys Asn Phe Ser Lys Ile Ala Asp Asn Arg Lys Phe Tyr Gln 624609 Thr Ile Lys Asn Phe Ser Lys Ile Ala Asp Asn Arg Lys Phe Tyr Gln 624

1873 GAA ATC AAT GCT GAG ACG GCG GAT GGA CGC AAC CTG TTT AAA CGT TAC1873 GAA ATC AAT GCT GAG ACG GCG GAT GGA CGC AAC CTG TTT AAA CGT TAC

19201920

625 Glu Ile Asn Ala Glu Thr Ala Asp Gly Arg Asn Leu Phe Lys Arg Tyr 640625 Glu Ile Asn Ala Glu Thr Ala Asp Gly Arg Asn Leu Phe Lys Arg Tyr 640

1921 AGT ACT CAA ACT TTC GGA CTT ACC AGC GGT GCG ACT TAT TCT ACA ACT1921 AGT ACT CAA ACT TTC GGA CTT ACC AGC GGT GCG ACT TAT TCT ACA ACT

19681968

641 Ser Thr Gln Thr Phe Gly Leu Thr Ser Gly Ala Thr Tyr Ser Thr Thr 656641 Ser Thr Gln Thr Phe Gly Leu Thr Ser Gly Ala Thr Tyr Ser Thr Thr 656

1969 TAT ACT TTG TCT GAG GCG GAT TTC TCC ACT GAT CCG GAC AAA AAC TAC1969 TAT ACT TTG TCT GAG GCG GAT TTC TCC ACT GAT CCG GAC AAA AAC TAC

20162016

657 Tyr Thr Leu Ser Glu Ala Asp Phe Ser Thr Asp Pro Asp Lys Asn Tyr 672657 Tyr Thr Leu Ser Glu Ala Asp Phe Ser Thr Asp Pro Asp Lys Asn Tyr 672

2017 CTA CAG GTT TGT TTG AAT GTC GTG TGG GAT CAT TAT GAC CGC CCG TCA2017 CTA CAG GTT TGT TTG AAT GTC GTG TGG GAT CAT TAT GAC CGC CCG TCA

20642064

673 Leu Gln Val Cys Leu Asn Val Val Trp Asp His Tyr Asp Arg Pro Ser 688673 Leu Gln Val Cys Leu Asn Val Val Trp Asp His Tyr Asp Arg Pro Ser 688

2065 GGG AAA AAA GGG GCT TAT TCT TGG GTC AGT AAG TGG TTT AAC GTC TAT2065 GGG AAA AAA GGG GCT TAT TCT TGG GTC AGT AAG TGG TTT AAC GTC TAT

21122112

689 Gly Lys Lys Gly Ala Tyr Ser Trp Val Ser Lys Trp Phe Asn Val Tyr 704689 Gly Lys Lys Gly Ala Tyr Ser Trp Val Ser Lys Trp Phe Asn Val Tyr 704

2113 GTT GCG TTG CAA GAT AGC AAA GCT CCG GAT GCC ATT CCT CGA TTA GTT2113 GTT GCG TTG CAA GAT AGC AAA GCT CCG GAT GCC ATT CCT CGA TTA GTT

21602160

705 Val Ala Leu Gln Asp Ser Lys Ala Pro Asp Ala Ile Pro Arg Leu Val 720705 Val Ala Leu Gln Asp Ser Lys Ala Pro Asp Ala Ile Pro Arg Leu Val 720

2161 TCC CGT TAC GAT AGT AAA CGT GGT CTG GTG CAA TAT CTG GAC TTC TGG2161 TCC CGT TAC GAT AGT AAA CGT GGT CTG GTG CAA TAT CTG GAC TTC TGG

22082208

721 Ser Arg Tyr Asp Ser Lys Arg Gly Leu Val Gln Tyr Leu Asp Phe Trp 736721 Ser Arg Tyr Asp Ser Lys Arg Gly Leu Val Gln Tyr Leu Asp Phe Trp 736

2209 ACC TCA TCA TTA CCC GCG AAA ACC CGT CTT AAC ACC ACC TTT GTG CGT2209 ACC TCA TCA TTA CCC GCG AAA ACC CGT CTT AAC ACC ACC TTT GTG CGT

22562256

737 Thr Ser Ser Leu Pro Ala Lys Thr Arg Leu Asn Thr Thr Phe Val Arg 752737 Thr Ser Ser Leu Pro Ala Lys Thr Arg Leu Asn Thr Thr Phe Val Arg 752

2257 ACT TTG ATT GAG AAG GCT AAT CTG GGG CTG GAT AGT TTG CTG GAT TAC2257 ACT TTG ATT GAG AAG GCT AAT CTG GGG CTG GAT AGT TTG CTG GAT TAC

23042304

753 Thr Leu Ile Glu Lys Ala Asn Leu Gly Leu Asp Ser Leu Leu Asp Tyr 768753 Thr Leu Ile Glu Lys Ala Asn Leu Gly Leu Asp Ser Leu Leu Asp Tyr 768

2305 ACC TTG CAG GCA GAT CCT TCT CTG GAA GCA GAT TTA GTG ACT GAC GGC2305 ACC TTG CAG GCA GAT CCT TCT CTG GAA GCA GAT TTA GTG ACT GAC GGC

23522352

769 Thr Leu Gln Ala Asp Pro Ser Leu Glu Ala Asp Leu Val Thr Asp Gly 784769 Thr Leu Gln Ala Asp Pro Ser Leu Glu Ala Asp Leu Val Thr Asp Gly 784

2353 AAA AGC GAA CCA ATG GAC TTT AAT GGT TCA AAC GGT CTC TAT TTC TGG2353 AAA AGC GAA CCA ATG GAC TTT AAT GGT TCA AAC GGT CTC TAT TTC TGG

24002400

785 Lys Ser Glu Pro Met Asp Phe Asn Gly Ser Asn Gly Leu Tyr Phe Trp 800785 Lys Ser Glu Pro Met Asp Phe Asn Gly Ser Asn Gly Leu Tyr Phe Trp 800

2401 GAA TTG TTC TTT CAC CTG CCG TTT TTG GTT GCT ACA CGC TTT GCC AAC2401 GAA TTG TTC TTT CAC CTG CCG TTT TTG GTT GCT ACA CGC TTT GCC AAC

24482448

801 Glu Leu Phe Phe His Leu Pro Phe Leu Val Ala Thr Arg Phe Ala Asn 816801 Glu Leu Phe Phe His Leu Pro Phe Leu Val Ala Thr Arg Phe Ala Asn 816

2449 GAA CAG CAA TTT TCG CCG GCA CAA AAG AGT TTG CAT TAC ATC TTT GAC2449 GAA CAG CAA TTT TCG CCG GCA CAA AAG AGT TTG CAT TAC ATC TTT GAC

24962496

817 Glu Gln Gln Phe Ser Pro Ala Gln Lys Ser Leu His Tyr Ile Phe Asp 832817 Glu Gln Gln Phe Ser Pro Ala Gln Lys Ser Leu His Tyr Ile Phe Asp 832

2497 CCG GCG ATG AAA AAC AAG CCA CAC AAT GCC CCG GCT TAT TGG AAT GTA2497 CCG GCG ATG AAA AAC AAG CCA CAC AAT GCC CCG GCT TAT TGG AAT GTA

25442544

833 Pro Ala Met Lys Asn Lys Pro His Asn Ala Pro Ala Tyr Trp Asn Val 848833 Pro Ala Met Lys Asn Lys Pro His Asn Ala Pro Ala Tyr Trp Asn Val 848

2545 CGT CCG TTG GTT GAA GGA AAC AGC GAT TTG TCA CGT CAT TTG GAC GAT2545 CGT CCG TTG GTT GAA GGA AAC AGC GAT TTG TCA CGT CAT TTG GAC GAT

25922592

849 Arg Pro Leu Val Glu Gly Asn Ser Asp Leu Ser Arg His Leu Asp Asp 864849 Arg Pro Leu Val Glu Gly Asn Ser Asp Leu Ser Arg His Leu Asp Asp 864

2593 TCT ATA GAC CCA GAT ACT CAA GCT TAT GCT CAT CCG GTG ATA TAC CAG2593 TCT ATA GAC CCA GAT ACT CAA GCT TAT GCT CAT CCG GTG ATA TAC CAG

26402640

865 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln 880865 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln 880

2641 AAA GCG GTG TTT ATT GCC TAT GTC AGT AAC CTG ATT GCT CAG GGA GAT2641 AAA GCG GTG TTT ATT GCC TAT GTC AGT AAC CTG ATT GCT CAG GGA GAT

26882688

881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly Asp 896881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly Asp 896

2689 ATG TGG TAT CGC CAA TTG ACT CGT GAC GGT CTG ACT CAG GCC CGT GTC2689 ATG TGG TAT CGC CAA TTG ACT CGT GAC GGT CTG ACT CAG GCC CGT GTC

27362736

897 Met Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val 912897 Met Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val 912

2737 TAT TAC AAT CTG GCC GCT GAA TTG CTA GGG CCT CGT CCG GAT GTA TCG2737 TAT TAC AAT CTG GCC GCT GAA TTG CTA GGG CCT CGT CCG GAT GTA TCG

27842784

913 Tyr Tyr Asn Leu Ala Ala Glu Leu Leu Gly Pro Arg Pro Asp Val Ser 928913 Tyr Tyr Asn Leu Ala Ala Glu Leu Leu Gly Pro Arg Pro Asp Val Ser 928

2785 CTG AGT AGC ATT TGG ACG CCG CAA ACC CTG GAT ACC TTA GCA GCC GGG2785 CTG AGT AGC ATT TGG ACG CCG CAA ACC CTG GAT ACC TTA GCA GCC GGG

28322832

929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly 944929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly 944

2833 CAA AAA GCG GTT TTA CGT GAT TTT GAG CAC CAG TTG GCT AAT AGT GAT2833 CAA AAA GCG GTT TTA CGT GAT TTT GAG CAC CAG TTG GCT AAT AGT GAT

28802880

945 Gln Lys Ala Val Leu Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp 960945 Gln Lys Ala Val Leu Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp 960

2881 ACC GCT TTA CCC GCA TTG CCG GGC CGC AAT GTC AGC TAC TTG AAA CTG2881 ACC GCT TTA CCC GCA TTG CCG GGC CGC AAT GTC AGC TAC TTG AAA CTG

29282928

961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu 976961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu 976

2929 GCA GAT AAT GGC TAC TTT AAT GAA CCG CTC AAT GTT CTG ATG TTG TCT2929 GCA GAT AAT GGC TAC TTT AAT GAA CCG CTC AAT GTT CTG ATG TTG TCT

29762976

977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Met Leu Ser 992977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Met Leu Ser 992

2977 CAC TGG GAT ACG TTG GAT GCA CGG TTA TAC AAT CTG CGT CAT AAC CTG2977 CAC TGG GAT ACG TTG GAT GCA CGG TTA TAC AAT CTG CGT CAT AAC CTG

30243024

993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg His Asn Leu993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg His Asn Leu

10081008

3025 ACC GTT GAT GGC AAG CCG CTT TCG CTG CCG CTG TAT GCT GCG CCT GTT3025 ACC GTT GAT GGC AAG CCG CTT TCG CTG CCG CTG TAT GCT GCG CCT GTT

30723072

1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val

10241024

3073 GAT CCG GTA GCG TTG TTG GCT CAG CGT GCT CAG TCC GGC ACG TTG ACG3073 GAT CCG GTA GCG TTG TTG GCT CAG CGT GCT CAG TCC GGC ACG TTG ACG

31203120

1025 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr1025 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr

10401040

3121 AAT GGC GTC AGT GGC GCC ATG TTG ACG GTG CCG CCA TAC CGT TTC AGC3121 AAT GGC GTC AGT GGC GCC ATG TTG ACG GTG CCG CCA TAC CGT TTC AGC

31683168

1041 Asn Gly Val Ser Gly Ala Met Leu Thr Val Pro Pro Tyr Arg Phe Ser1041 Asn Gly Val Ser Gly Ala Met Leu Thr Val Pro Pro Tyr Arg Phe Ser

10561056

3169 GCT ATG TTG CCG CGA GCT TAC AGC GCC GTG GGT ACG TTG ACC AGT TTT3169 GCT ATG TTG CCG CGA GCT TAC AGC GCC GTG GGT ACG TTG ACC AGT TTT

32163216

1057 Ala Met Leu Pro Arg Ala Tyr Ser Ala Val Gly Thr Leu Thr Ser Phe1057 Ala Met Leu Pro Arg Ala Tyr Ser Ala Val Gly Thr Leu Thr Ser Phe

10721072

3217 GGT CAG AAC CTG CTT AGT TTG TTG GAA CGT AGC GAA CGA GCC TGT CAA3217 GGT CAG AAC CTG CTT AGT TTG TTG GAA CGT AGC GAA CGA GCC TGT CAA

32643264

1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Cys Gln1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Cys Gln

10881088

3265 GAA GAG TTG GCG CAA CAG CAA CTG TTG GAT ATG TCC AGC TAT GCC ATC3265 GAA GAG TTG GCG CAA CAG CAA CTG TTG GAT ATG TCC AGC TAT GCC ATC

33123312

1089 Glu Glu Leu Ala Gln Gln Gln Leu Leu Asp Met Ser Ser Tyr Ala Ile1089 Glu Glu Leu Ala Gln Gln Gln Leu Leu Asp Met Ser Ser Tyr Ala Ile

11041104

3313 ACG TTG CAA CAA CAG GCG CTG GAT GGA TTG GCG GCA GAT CGT CTG GCG3313 ACG TTG CAA CAA CAG GCG CTG GAT GGA TTG GCG GCA GAT CGT CTG GCG

33603360

1105 Thr Leu Gln Gln Gln Ala Leu Asp Gly Leu Ala Ala Asp Arg Leu Ala1105 Thr Leu Gln Gln Gln Ala Leu Asp Gly Leu Ala Ala Asp Arg Leu Ala

11201120

3361 CTG CTA GCT AGT CAG GCT ACG GCA CAA CAG CGT CAT GAC CAT TAT TAC3361 CTG CTA GCT AGT CAG GCT ACG GCA CAA CGT CAT GAC CAT TAT TAC

34083408

1121 Leu Leu Ala Ser Gln Ala Thr Ala Gln Gln Arg His Asp His Tyr Tyr1121 Leu Leu Ala Ser Gln Ala Thr Ala Gln Gln Arg His Asp His Tyr Tyr

11361136

3409 ACT CTG TAT CAG AAC AAC ATC TCC AGT GCG GAA CAA CTG GTG ATG GAC3409 ACT CTG TAT CAG AAC AAC ATC TCC AGT GCG GAA CAA CTG GTG ATG GAC

34563456

1137 Thr Leu Tyr Gln Asn Asn Ile Ser Ser Ala Glu Gln Leu Val Met Asp1137 Thr Leu Tyr Gln Asn Asn Ile Ser Ser Ala Glu Gln Leu Val Met Asp

11521152

3457 ACC CAA ACG TCA GCA CAA TCC CTG ATT TCT TCT TCC ACT GGT GTA CAA3457 ACC CAA ACG TCA GCA CAA TCC CTG ATT TCT TCT TCC ACT GGT GTA CAA

35043504

1153 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly Val Gln1153 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly Val Gln

11681168

3505 ACT GCC AGT GGG GCA CTG AAA GTG ATC CCG AAT ATC TTT GGT TTG GCT3505 ACT GCC AGT GGG GCA CTG AAA GTG ATC CCG AAT ATC TTT GGT TTG GCT

35523552

1169 Thr Ala Ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala1169 Thr Ala Ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala

11841184

3553 GAT GGC GGC TCG CGC TAT GAA GGA GTA ACG GAA GCG ATT GCC ATC GGG3553 GAT GGC GGC TCG CGC TAT GAA GGA GTA ACG GAA GCG ATT GCC ATC GGG

36003600

1185 Asp Gly Gly Ser Arg Tyr Glu Gly Val Thr Glu Ala Ile Ala Ile Gly1185 Asp Gly Gly Ser Arg Tyr Glu Gly Val Thr Glu Ala Ile Ala Ile Gly

12001200

3601 TTA ATG GCT GCC GGA CAA GCC ACC AGC GTG GTG GCC GAG CGT CTG GCA3601 TTA ATG GCT GCC GGA CAA GCC ACC AGC GTG GTG GCC GAG CGT CTG GCA

36483648

1201 Leu Met Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Ala1201 Leu Met Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Ala

12161216

3649 ACC ACG GAG AAT TAC CGC CGC CGC CGT GAA GAG TGG CAA ATC CAA TAC3649 ACC ACG GAG AAT TAC CGC CGC CGC CGT GAA GAG TGG CAA ATC CAA TAC

36963696

1217 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr1217 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr

12321232

3697 CAG CAG GCA CAG TCT GAG GTC GAC GCA TTA CAG AAA CAG TTG GAT GCG3697 CAG CAG GCA CAG TCT GAG GTC GAC GCA TTA CAG AAA CAG TTG GAT GCG

37443744

1233 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Ala1233 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Ala

12481248

3745 CTG GCA GTG CGC GAG AAA GCA GCT CAA ACT TCC CTG CAA CAG GCG AAG3745 CTG GCA GTG CGC GAG AAA GCA GCT CAA ACT TCC CTG CAA CAG GCG AAG

37923792

1249 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys1249 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys

12641264

3793 GCA CAG CAG GTA CAA ATT CGG ACC ATG CTG ACT TAC TTA ACT ACT CGT3793 GCA CAG CAG GTA CAA ATT CGG ACC ATG CTG ACT TAC TTA ACT ACT CGT

38403840

1265 Ala Gln Gln Val Gln Ile Arg Thr Met Leu Thr Tyr Leu Thr Thr Arg1265 Ala Gln Gln Val Gln Ile Arg Thr Met Leu Thr Tyr Leu Thr Thr Arg

12801280

3841 TTC ACC CAG GCG ACT CTG TAC CAG TGG CTG AGT GGT CAA TTA TCC GCG3841 TTC ACC CAG GCG ACT CTG TAC CAG TGG CTG AGT GGT CAA TTA TCC GCG

38883888

1281 Phe Thr Gln Ala Thr Leu Tyr Gln Trp Leu Ser Gly Gln Leu Ser Ala1281 Phe Thr Gln Ala Thr Leu Tyr Gln Trp Leu Ser Gly Gln Leu Ser Ala

12961296

3889 TTG TAT TAT CAA GCG TAT GAT GCC GTG GTT GCT CTC TGC CTC TCC GCC3889 TTG TAT TAT CAA GCG TAT GAT GCC GTG GTT GCT CTC TGC CTC TCC GCC

39363936

1297 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu Cys Leu Ser Ala1297 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu Cys Leu Ser Ala

13121312

3937 CAA GCT TGC TGG CAG TAT GAA TTG GGT GAT TAC GCT ACC ACT TTT ATC3937 CAA GCT TGC TGG CAG TAT GAA TTG GGT GAT TAC GCT ACC ACT TTT ATC

39843984

1313 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile1313 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile

13281328

3985 CAG ACC GGT ACC TGG AAC GAC CAT TAC CGT GGT TTG CAA GTG GGG GAG3985 CAG ACC GGT ACC TGG AAC GAC CAT TAC CGT GGT TTG CAA GTG GGG GAG

40324032

1329 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Val Gly Glu1329 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Val Gly Glu

13441344

4033 ACA CTG CAA CTC AAT TTG CAT CAG ATG GAA GCG GCC TAT TTA GTT CGT4033 ACA CTG CAA CTC AAT TTG CAT CAG ATG GAA GCG GCC TAT TTA GTT CGT

40804080

1345 Thr Leu Gln Leu Asn Leu His Gln Met Glu Ala Ala Tyr Leu Val Arg1345 Thr Leu Gln Leu Asn Leu His Gln Met Glu Ala Ala Tyr Leu Val Arg

13601360

4081 CAC GAA CGC CGT CTT AAT GTG ATC CGT ACT GTG TCG CTC AAA AGC CTA4081 CAC GAA CGC CGT CTT AAT GTG ATC CGT ACT GTG TCG CTC AAA AGC CTA

41284128

1361 His Glu Arg Arg Leu Asn Val Ile Arg Thr Val Ser Leu Lys Ser Leu1361 His Glu Arg Arg Leu Asn Val Ile Arg Thr Val Ser Leu Lys Ser Leu

13761376

4129 TTG GGT GAT GAT GGT TTT GGT AAG TTA AAA ACC GAA GGC AAA GTC GAC4129 TTG GGT GAT GAT GGT TTT GGT AAG TTA AAA ACC GAA GGC AAA GTC GAC

41764176

1377 Leu Gly Asp Asp Gly Phe Gly Lys Leu Lys Thr Glu Gly Lys Val Asp1377 Leu Gly Asp Asp Gly Phe Gly Lys Leu Lys Thr Glu Gly Lys Val Asp

13921392

4177 TTT CCA TTA AGC GAA AAG CTG TTT GAC AAC GAC TAT CCG GGG CAC TAT4177 TTT CCA TTA AGC GAA AAG CTG TTT GAC AAC GAC TAT CCG GGG CAC TAT

42244224

1393 Phe Pro Leu Ser Glu Lys Leu Phe Asp Asn Asp Tyr Pro Gly His Tyr1393 Phe Pro Leu Ser Glu Lys Leu Phe Asp Asn Asp Tyr Pro Gly His Tyr

14081408

4225 TTG CGC CAG ATT AAA ACT GTG TCA GTG ACG TTG CCG ACG TTA GTC GGG4225 TTG CGC CAG ATT AAA ACT GTG TCA GTG ACG TTG CCG ACG TTA GTC GGG

42724272

1409 Leu Arg Gln Ile Lys Thr Val Ser Val Thr Leu Pro Thr Leu Val Gly1409 Leu Arg Gln Ile Lys Thr Val Ser Val Thr Leu Pro Thr Leu Val Gly

14241424

4273 CCG TAT CAA AAC GTG AAG GCA ACG CTC ACT CAG ACC AGC AGC AGT ATA4273 CCG TAT CAA AAC GTG AAG GCA ACG CTC ACT CAG ACC AGC AGC AGT ATA

43204320

1425 Pro Tyr Gln Asn Val Lys Ala Thr Leu Thr Gln Thr Ser Ser Ser Ile1425 Pro Tyr Gln Asn Val Lys Ala Thr Leu Thr Gln Thr Ser Ser Ser Ile

14401440

4321 TTG TTA GCA GCA GAT ATC AAT GGT GTT AAA CGT CTC AAT GAT CCG ACA4321 TTG TTA GCA GCA GAT ATC AAT GGT GTT AAA CGT CTC AAT GAT CCG ACA

43684368

1441 Leu Leu Ala Ala Asp Ile Asn Gly Val Lys Arg Leu Asn Asp Pro Thr1441 Leu Leu Ala Ala Asp Ile Asn Gly Val Lys Arg Leu Asn Asp Pro Thr

14561456

4369 GGT AAA GAG GGT GAT GCG ACG CAT ATT GTC ACC AAT CTG CGT GCC AGC4369 GGT AAA GAG GGT GAT GCG ACG CAT ATT GTC ACC AAT CTG CGT GCC AGC

44164416

1457 Gly Lys Glu Gly Asp Ala Thr His Ile Val Thr Asn Leu Arg Ala Ser1457 Gly Lys Glu Gly Asp Ala Thr His Ile Val Thr Asn Leu Arg Ala Ser

14721472

4417 CAG CAG GTG GCG CTC TCT TCT GGC ATT AAT GAT GCC GGT AGC TTT GAG4417 CAG CAG GTG GCG CTC TCT TCT GGC ATT AAT GAT GCC GGT AGC TTT GAG

44644464

1473 Gln Gln Val Ala Leu Ser Ser Gly Ile Asn Asp Ala Gly Ser Phe Glu1473 Gln Gln Val Ala Leu Ser Ser Gly Ile Asn Asp Ala Gly Ser Phe Glu

14881488

4465 TTG CGT TTG GAA GAT GAG CGC TAT CTA TCA TTT GAG GGG ACT GGA GCT4465 TTG CGT TTG GAA GAT GAG CGC TAT CTA TCA TTT GAG GGG ACT GGA GCT

45124512

1489 Leu Arg Leu Glu Asp Glu Arg Tyr Leu Ser Phe Glu Gly Thr Gly Ala1489 Leu Arg Leu Glu Asp Glu Arg Tyr Leu Ser Phe Glu Gly Thr Gly Ala

15041504

4513 GTT TCC AAA TGG ACT CTT AAC TTC CCG CGT TCT GTG GAT GAG CAT ATT4513 GTT TCC AAA TGG ACT CTT AAC TTC CCG CGT TCT GTG GAT GAG CAT ATT

45604560

1505 Val Ser Lys Trp Thr Leu Asn Phe Pro Arg Ser Val Asp Glu His Ile1505 Val Ser Lys Trp Thr Leu Asn Phe Pro Arg Ser Val Asp Glu His Ile

15201520

4561 GAC GAT AAG ACA TTG AAA GCG GAT GAG ATG CAG GCC GCA CTG TTG GCG4561 GAC GAT AAG ACA TTG AAA GCG GAT GAG ATG CAG GCC GCA CTG TTG GCG

46084608

1521 Asp Asp Lys Thr Leu Lys Ala Asp Glu Met Gln Ala Ala Leu Leu Ala1521 Asp Asp Lys Thr Leu Lys Ala Asp Glu Met Gln Ala Ala Leu Leu Ala

15361536

4609 AAT ATG GAT GAT GTG CTG GTG CAG GTG CAT TAT ACC GCC TGC GAC GGC4609 AAT ATG GAT GAT GTG CTG GTG CAG GTG CAT TAT ACC GCC TGC GAC GGC

46564656

1537 Asn Met Asp Asp Val Leu Val Gln Val His Tyr Thr Ala Cys Asp Gly1537 Asn Met Asp Asp Val Leu Val Gln Val His Tyr Thr Ala Cys Asp Gly

15521552

4657 GGC GCC AGT TTC GCA AAC CAG GTC AAG AAA ACA CTC TCT TAA CATTAACTTT 47084657 GGC GCC AGT TTC GCA AAC CAG GTC AAG AAA ACA CTC TCT TAA CATTAACTTT 4708

1553 Gly Ala Ser Phe Ala Asn Gln Val Lys Lys Thr Leu Ser End 15651553 Gly Ala Ser Phe Ala Asn Gln Val Lys Lys Thr Leu Ser End 1565

4709 TAACTAATCC CTCCCACTCT GTTCGCCAGA GTGGGAGAAG GTTTGTCATA TCTAAAATCA 47684709 TAACTAATCC CTCCCACTCT GTTCGCCAGA GTGGGAGAAG GTTTGTCATA TCTAAAATCA 4768

4770 ATCTTGCGAT CTTTCTCCAT TTCATTGGAA GGGAAGCTGT AAAACAAATA AGGAATATGA 48284770 ATCTTGCGAT CTTTCTCCAT TTCATTGGAA GGGAAGCTGT AAAACAAATA AGGAATATGA 4828

4829 TATG 49324829 TATG 4932

(2) INFORMATION FOR SEQ ID NO:59(2) INFORMATION FOR SEQ ID NO: 59

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1565 amino acids(A) LENGTH: 1565 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:59 (TccB peptide)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 59 (TccB peptide)

Features From To DescriptionFeatures From To Description

1 Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg Asp Ala1 Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg Asp Ala

1616

17 Leu Val Thr Gly Tyr Met Asn Phe Val Ala Pro Thr Leu Lys Gly Val17 Leu Val Thr Gly Tyr Met Asn Phe Val Ala Pro Thr Leu Lys Gly Val

3232

33 Ser Gly Gln Pro Val Thr Val Glu Asp Leu Tyr Glu Tyr Leu Leu Ile33 Ser Gly Gln Pro Val Thr Val Glu Asp Leu Tyr Glu Tyr Leu Leu Ile

4848

49 Asp Pro Glu Val Ala Asp Glu Val Glu Thr Ser Arg Val Ala Gln Ala49 Asp Pro Glu Val Ala Asp Glu Val Glu Thr Ser Arg Val Ala Gln Ala

6464

65 Ile Ala Ser Ile Gln Gln Tyr Met Thr Arg Leu Val Asn Gly Ser Glu65 Ile Ala Ser Ile Gln Gln Tyr Met Thr Arg Leu Val Asn Gly Ser Glu

8080

81 Pro Gly Arg Gln Ala Met Glu Pro Ser Thr Ala Asn Glu Trp Arg Asp81 Pro Gly Arg Gln Ala Met Glu Pro Ser Thr Ala Asn Glu Trp Arg Asp

9696

97 Asn Asp Asn Gln Tyr Ala Ile Trp Ala Ala Gly Ala Glu Val Arg Asn97 Asn Asp Asn Gln Tyr Ala Ile Trp Ala Ala Gly Ala Glu Val Arg Asn

112112

113 Tyr Ala Glu Asn Tyr Ile Ser Pro Ile Thr Arg Gln Glu Lys Ser His113 Tyr Ala Glu Asn Tyr Ile Ser Pro Ile Thr Arg Gln Glu Lys Ser His

128128

129 Tyr Phe Ser Glu Leu Glu Thr Thr Leu Asn Gln Asn Arg Leu Asp Pro129 Tyr Phe Ser Glu Leu Glu Thr Thr Leu Asn Gln Asn Arg Leu Asp Pro

144144

145 Asp Arg Val Gln Asp Ala Val Leu Ala Tyr Leu Asn Glu Phe Glu Ala145 Asp Arg Val Gln Asp Ala Val Leu Ala Tyr Leu Asn Glu Phe Glu Ala

160160

161 Val Ser Asn Leu Tyr Val Leu Ser Gly Tyr Ile Asn Gln Asp Lys Phe161 Val Ser Asn Leu Tyr Val Leu Ser Gly Tyr Ile Asn Gln Asp Lys Phe

176176

177 Asp Gln Ala Ile Tyr Tyr Phe Ile Gly Arg Thr Thr Thr Lys Pro Tyr177 Asp Gln Ala Ile Tyr Tyr Phe Ile Gly Arg Thr Thr Thr Lys Pro Tyr

192192

193 Arg Tyr Tyr Trp Arg Gln Met Asp Leu Ser Lys Asn Arg Gln Asp Pro193 Arg Tyr Tyr Trp Arg Gln Met Asp Leu Ser Lys Asn Arg Gln Asp Pro

208208

209 Ala Gly Asn Pro Val Thr Pro Asn Cys Trp Asn Asp Trp Gln Glu Ile209 Ala Gly Asn Pro Val Thr Pro Asn Cys Trp Asn Asp Trp Gln Glu Ile

224224

225 Thr Leu Pro Leu Ser Gly Asp Thr Val Leu Glu His Thr Val Arg Pro225 Thr Leu Pro Leu Ser Gly Asp Thr Val Leu Glu His Thr Val Arg Pro

240240

241 Val Phe Tyr Asn Asp Arg Leu Tyr Val Ala Trp Val Glu Arg Asp Pro241 Val Phe Tyr Asn Asp Arg Leu Tyr Val Ala Trp Val Glu Arg Asp Pro

256256

257 Ala Val Gln Lys Asp Ala Asp Gly Lys Asn Ile Gly Lys Thr His Ala257 Ala Val Gln Lys Asp Ala Asp Gly Lys Asn Ile Gly Lys Thr His Ala

272272

273 Tyr Asn Ile Lys Phe Gly Tyr Lys Arg Tyr Asp Asp Thr Trp Thr Ala273 Tyr Asn Ile Lys Phe Gly Tyr Lys Arg Tyr Asp Asp Thr Trp Thr Ala

288288

289 Pro Asn Thr Thr Thr Leu Met Thr Gln Gln Ala Gly Glu Ser Ser Glu289 Pro Asn Thr Thr Thr Leu Met Thr Gln Gln Ala Gly Glu Ser Ser Glu

304304

305 Thr Gln Arg Ser Ser Leu Leu Ile Asp Glu Ser Ser Thr Thr Leu Arg305 Thr Gln Arg Ser Ser Leu Leu Ile Asp Glu Ser Ser Thr Thr Leu Arg

320320

321 Gln Val Asn Leu Leu Ala Thr Thr Asp Phe Ser Ile Asp Pro Thr Glu321 Gln Val Asn Leu Leu Ala Thr Thr Asp Phe Ser Ile Asp Pro Thr Glu

336336

337 Glu Thr Asp Ser Asn Pro Tyr Gly Arg Leu Met Leu Gly Val Phe Val337 Glu Thr Asp Ser Asn Pro Tyr Gly Arg Leu Met Leu Gly Val Phe Val

352352

353 Arg Gln Phe Glu Gly Asp Gly Ala Asn Arg Lys Asn Lys Pro Val Val353 Arg Gln Phe Glu Gly Asp Gly Ala Asn Arg Lys Asn Lys Pro Val Val

368368

369 Tyr Gly Tyr Leu Tyr Cys Asp Ser Ala Phe Asn Arg His Val Leu Arg369 Tyr Gly Tyr Leu Tyr Cys Asp Ser Ala Phe Asn Arg His Val Leu Arg

384384

385 Pro Leu Ser Lys Asn Phe Leu Phe Ser Thr Tyr Arg Asp Glu Thr Asp385 Pro Leu Ser Lys Asn Phe Leu Phe Ser Thr Tyr Arg Asp Glu Thr Asp

400400

401 Gly Gln Asn Ser Leu Gln Phe Ala Val Tyr Asp Lys Lys Tyr Val Ile401 Gly Gln Asn Ser Leu Gln Phe Ala Val Tyr Asp Lys Lys Tyr Val Ile

416416

417 Thr Lys Val Val Thr Gly Ala Thr Glu Asp Pro Glu Asn Thr Gly Trp417 Thr Lys Val Val Thr Gly Ala Thr Glu Asp Pro Glu Asn Thr Gly Trp

432432

433 Val Ser Lys Val Asp Asp Leu Lys Gln Gly Thr Thr Gly Ala Tyr Val433 Val Ser Lys Val Asp Asp Leu Lys Gln Gly Thr Thr Gly Ala Tyr Val

448448

449 Tyr Ile Asp Gln Asp Gly Leu Thr Leu His Ile Gln Thr Thr Thr Asn449 Tyr Ile Asp Gln Asp Gly Leu Thr Leu His Ile Gln Thr Thr Thr Asn

464464

465 Gly Asp Phe Ile Asn Arg His Thr Phe Gly Tyr Asn Asp Leu Val Tyr465 Gly Asp Phe Ile Asn Arg His Thr Phe Gly Tyr Asn Asp Leu Val Tyr

480480

481 Asp Ser Lys Ser Gly Tyr Gly Phe Thr Trp Ser Gly Asn Glu Gly Phe481 Asp Ser Lys Ser Gly Tyr Gly Phe Thr Trp Ser Gly Asn Glu Gly Phe

496496

497 Tyr Leu Asp Tyr His Asp Gly Asn Tyr Tyr Thr Phe His Asn Ala Ile497 Tyr Leu Asp Tyr His Asp Gly Asn Tyr Tyr Thr Phe His Asn Ala Ile

512512

513 Ile Asn Tyr Tyr Pro Ser Gly Tyr Gly Gly Gly Ser Val Pro Asn Gly513 Ile Asn Tyr Tyr Pro Ser Gly Tyr Gly Gly Gly Ser Val Pro Asn Gly

528528

529 Thr Trp Ala Leu Glu Gln Arg Ile Asn Glu Gly Trp Ala Ile Ala Pro529 Thr Trp Ala Leu Glu Gln Arg Ile Asn Glu Gly Trp Ala Ile Ala Pro

544544

545 Leu Leu Asp Thr Leu His Thr Val Thr Val Lys Gly Ser Tyr Ile Ala545 Leu Leu Asp Thr Leu His Thr Val Thr Val Lys Gly Ser Tyr Ile Ala

560560

561 Trp Glu Gly Glu Thr Pro Thr Gly Tyr Asn Leu Tyr Ile Pro Asp Gly561 Trp Glu Gly Glu Thr Pro Thr Gly Tyr Asn Leu Tyr Ile Pro Asp Gly

576576

577 Thr Val Leu Leu Asp Trp Phe Asp Lys Ile Asn Phe Ala Ile Gly Leu577 Thr Val Leu Leu Asp Trp Phe Asp Lys Ile Asn Phe Ala Ile Gly Leu

592592

593 Asn Lys Leu Glu Ser Val Phe Thr Ser Pro Asp Trp Pro Thr Leu Thr593 Asn Lys Leu Glu Ser Val Phe Thr Ser Pro Asp Trp Pro Thr Leu Thr

608608

609 Thr Ile Lys Asn Phe Ser Lys Ile Ala Asp Asn Arg Lys Phe Tyr Gln609 Thr Ile Lys Asn Phe Ser Lys Ile Ala Asp Asn Arg Lys Phe Tyr Gln

624624

625 Glu Ile Asn Ala Glu Thr Ala Asp Gly Arg Asn Leu Phe Lys Arg Tyr625 Glu Ile Asn Ala Glu Thr Ala Asp Gly Arg Asn Leu Phe Lys Arg Tyr

640640

641 Ser Thr Gln Thr Phe Gly Leu Thr Ser Gly Ala Thr Tyr Ser Thr Thr641 Ser Thr Gln Thr Phe Gly Leu Thr Ser Gly Ala Thr Tyr Ser Thr Thr

656656

657 Tyr Thr Leu Ser Glu Ala Asp Phe Ser Thr Asp Pro Asp Lys Asn Tyr657 Tyr Thr Leu Ser Glu Ala Asp Phe Ser Thr Asp Pro Asp Lys Asn Tyr

672672

673 Leu Gln Val Cys Leu Asn Val Val Trp Asp His Tyr Asp Arg Pro Ser673 Leu Gln Val Cys Leu Asn Val Val Trp Asp His Tyr Asp Arg Pro Ser

688688

689 Gly Lys Lys Gly Ala Tyr Ser Trp Val Ser Lys Trp Phe Asn Val Tyr689 Gly Lys Lys Gly Ala Tyr Ser Trp Val Ser Lys Trp Phe Asn Val Tyr

704704

705 Val Ala Leu Gln Asp Ser Lys Ala Pro Asp Ala Ile Pro Arg Leu Val705 Val Ala Leu Gln Asp Ser Lys Ala Pro Asp Ala Ile Pro Arg Leu Val

720720

721 Ser Arg Tyr Asp Ser Lys Arg Gly Leu Val Gln Tyr Leu Asp Phe Trp721 Ser Arg Tyr Asp Ser Lys Arg Gly Leu Val Gln Tyr Leu Asp Phe Trp

736736

737 Thr Ser Ser Leu Pro Ala Lys Thr Arg Leu Asn Thr Thr Phe Val Arg737 Thr Ser Ser Leu Pro Ala Lys Thr Arg Leu Asn Thr Thr Phe Val Arg

752752

753 Thr Leu Ile Glu Lys Ala Asn Leu Gly Leu Asp Ser Leu Leu Asp Tyr753 Thr Leu Ile Glu Lys Ala Asn Leu Gly Leu Asp Ser Leu Leu Asp Tyr

768768

769 Thr Leu Gln Ala Asp Pro Ser Leu Glu Ala Asp Leu Val Thr Asp Gly769 Thr Leu Gln Ala Asp Pro Ser Leu Glu Ala Asp Leu Val Thr Asp Gly

784784

785 Lys Ser Glu Pro Met Asp Phe Asn Gly Ser Asn Gly Leu Tyr Phe Trp785 Lys Ser Glu Pro Met Asp Phe Asn Gly Ser Asn Gly Leu Tyr Phe Trp

800800

801 Glu Leu Phe Phe His Leu Pro Phe Leu Val Ala Thr Arg Phe Ala Asn801 Glu Leu Phe Phe His Leu Pro Phe Leu Val Ala Thr Arg Phe Ala Asn

816816

817 Glu Gln Gln Phe Ser Pro Ala Gln Lys Ser Leu His Tyr Ile Phe Asp817 Glu Gln Gln Phe Ser Pro Ala Gln Lys Ser Leu His Tyr Ile Phe Asp

832832

833 Pro Ala Met Lys Asn Lys Pro His Asn Ala Pro Ala Tyr Trp Asn Val833 Pro Ala Met Lys Asn Lys Pro His Asn Ala Pro Ala Tyr Trp Asn Val

848848

849 Arg Pro Leu Val Glu Gly Asn Ser Asp Leu Ser Arg His Leu Asp Asp849 Arg Pro Leu Val Glu Gly Asn Ser Asp Leu Ser Arg His Leu Asp Asp

864864

865 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln865 Ser Ile Asp Pro Asp Thr Gln Ala Tyr Ala His Pro Val Ile Tyr Gln

880880

881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly Asp881 Lys Ala Val Phe Ile Ala Tyr Val Ser Asn Leu Ile Ala Gln Gly Asp

896896

897 Met Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val897 Met Trp Tyr Arg Gln Leu Thr Arg Asp Gly Leu Thr Gln Ala Arg Val

912912

913 Tyr Tyr Asn Leu Ala Ala Glu Leu Leu Gly Pro Arg Pro Asp Val Ser913 Tyr Tyr Asn Leu Ala Ala Glu Leu Leu Gly Pro Arg Pro Asp Val Ser

928928

929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly929 Leu Ser Ser Ile Trp Thr Pro Gln Thr Leu Asp Thr Leu Ala Ala Gly

944944

945 Gln Lys Ala Val Leu Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp945 Gln Lys Ala Val Leu Arg Asp Phe Glu His Gln Leu Ala Asn Ser Asp

960960

961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu961 Thr Ala Leu Pro Ala Leu Pro Gly Arg Asn Val Ser Tyr Leu Lys Leu

976976

977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Met Leu Ser977 Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val Leu Met Leu Ser

992992

993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg His Asn Leu993 His Trp Asp Thr Leu Asp Ala Arg Leu Tyr Asn Leu Arg His Asn Leu

10081008

1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val1009 Thr Val Asp Gly Lys Pro Leu Ser Leu Pro Leu Tyr Ala Ala Pro Val

10241024

1025 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr1025 Asp Pro Val Ala Leu Leu Ala Gln Arg Ala Gln Ser Gly Thr Leu Thr

10401040

1041 Asn Gly Val Ser Gly Ala Met Leu Thr Val Pro Pro Tyr Arg Phe Ser1041 Asn Gly Val Ser Gly Ala Met Leu Thr Val Pro Pro Tyr Arg Phe Ser

10561056

1057 Ala Met Leu Pro Arg Ala Tyr Ser Ala Val Gly Thr Leu Thr Ser Phe1057 Ala Met Leu Pro Arg Ala Tyr Ser Ala Val Gly Thr Leu Thr Ser Phe

10721072

1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Cys Gln1073 Gly Gln Asn Leu Leu Ser Leu Leu Glu Arg Ser Glu Arg Ala Cys Gln

10881088

1089 Glu Glu Leu Ala Gln Gln Gln Leu Leu Asp Met Ser Ser Tyr Ala Ile1089 Glu Glu Leu Ala Gln Gln Gln Leu Leu Asp Met Ser Ser Tyr Ala Ile

11041104

1105 Thr Leu Gln Gln Gln Ala Leu Asp Gly Leu Ala Ala Asp Arg Leu Ala1105 Thr Leu Gln Gln Gln Ala Leu Asp Gly Leu Ala Ala Asp Arg Leu Ala

11201120

1121 Leu Leu Ala Ser Gln Ala Thr Ala Gln Gln Arg His Asp His Tyr Tyr1121 Leu Leu Ala Ser Gln Ala Thr Ala Gln Gln Arg His Asp His Tyr Tyr

11361136

1137 Thr Leu Tyr Gln Asn Asn Ile Ser Ser Ala Glu Gln Leu Val Met Asp1137 Thr Leu Tyr Gln Asn Asn Ile Ser Ser Ala Glu Gln Leu Val Met Asp

11521152

1153 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly Val Gln1153 Thr Gln Thr Ser Ala Gln Ser Leu Ile Ser Ser Ser Thr Gly Val Gln

11681168

1169 Thr Ala Ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala1169 Thr Ala Ser Gly Ala Leu Lys Val Ile Pro Asn Ile Phe Gly Leu Ala

11841184

1185 Asp Gly Gly Ser Arg Tyr Glu Gly Val Thr Glu Ala Ile Ala Ile Gly1185 Asp Gly Gly Ser Arg Tyr Glu Gly Val Thr Glu Ala Ile Ala Ile Gly

12001200

1201 Leu Met Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Ala1201 Leu Met Ala Ala Gly Gln Ala Thr Ser Val Val Ala Glu Arg Leu Ala

12161216

1217 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr1217 Thr Thr Glu Asn Tyr Arg Arg Arg Arg Glu Glu Trp Gln Ile Gln Tyr

12321232

1233 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Ala1233 Gln Gln Ala Gln Ser Glu Val Asp Ala Leu Gln Lys Gln Leu Asp Ala

12481248

1249 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys1249 Leu Ala Val Arg Glu Lys Ala Ala Gln Thr Ser Leu Gln Gln Ala Lys

12641264

1265 Ala Gln Gln Val Gln Ile Arg Thr Met Leu Thr Tyr Leu Thr Thr Arg1265 Ala Gln Gln Val Gln Ile Arg Thr Met Leu Thr Tyr Leu Thr Thr Arg

12801280

1281 Phe Thr Gln Ala Thr Leu Tyr Gln Trp Leu Ser Gly Gln Leu Ser Ala1281 Phe Thr Gln Ala Thr Leu Tyr Gln Trp Leu Ser Gly Gln Leu Ser Ala

12961296

1297 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu Cys Leu Ser Ala1297 Leu Tyr Tyr Gln Ala Tyr Asp Ala Val Val Ala Leu Cys Leu Ser Ala

13121312

1313 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile1313 Gln Ala Cys Trp Gln Tyr Glu Leu Gly Asp Tyr Ala Thr Thr Phe Ile

13281328

1329 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Val Gly Glu1329 Gln Thr Gly Thr Trp Asn Asp His Tyr Arg Gly Leu Gln Val Gly Glu

13441344

1345 Thr Leu Gln Leu Asn Leu His Gln Met Glu Ala Ala Tyr Leu Val Arg1345 Thr Leu Gln Leu Asn Leu His Gln Met Glu Ala Ala Tyr Leu Val Arg

13601360

1361 His Glu Arg Arg Leu Asn Val Ile Arg Thr Val Ser Leu Lys Ser Leu1361 His Glu Arg Arg Leu Asn Val Ile Arg Thr Val Ser Leu Lys Ser Leu

13761376

1377 Leu Gly Asp Asp Gly Phe Gly Lys Leu Lys Thr Glu Gly Lys Val Asp1377 Leu Gly Asp Asp Gly Phe Gly Lys Leu Lys Thr Glu Gly Lys Val Asp

13921392

1393 Phe Pro Leu Ser Glu Lys Leu Phe Asp Asn Asp Tyr Pro Gly His Tyr1393 Phe Pro Leu Ser Glu Lys Leu Phe Asp Asn Asp Tyr Pro Gly His Tyr

14081408

1409 Leu Arg Gln Ile Lys Thr Val Ser Val Thr Leu Pro Thr Leu Val Gly1409 Leu Arg Gln Ile Lys Thr Val Ser Val Thr Leu Pro Thr Leu Val Gly

14241424

1425 Pro Tyr Gln Asn Val Lys Ala Thr Leu Thr Gln Thr Ser Ser Ser Ile1425 Pro Tyr Gln Asn Val Lys Ala Thr Leu Thr Gln Thr Ser Ser Ser Ile

14401440

1441 Leu Leu Ala Ala Asp Ile Asn Gly Val Lys Arg Leu Asn Asp Pro Thr1441 Leu Leu Ala Ala Asp Ile Asn Gly Val Lys Arg Leu Asn Asp Pro Thr

14561456

1457 Gly Lys Glu Gly Asp Ala Thr His Ile Val Thr Asn Leu Arg Ala Ser1457 Gly Lys Glu Gly Asp Ala Thr His Ile Val Thr Asn Leu Arg Ala Ser

14721472

1473 Gln Gln Val Ala Leu Ser Ser Gly Ile Asn Asp Ala Gly Ser Phe Glu1473 Gln Gln Val Ala Leu Ser Ser Gly Ile Asn Asp Ala Gly Ser Phe Glu

14881488

1489 Leu Arg Leu Glu Asp Glu Arg Tyr Leu Ser Phe Glu Gly Thr Gly Ala1489 Leu Arg Leu Glu Asp Glu Arg Tyr Leu Ser Phe Glu Gly Thr Gly Ala

15041504

1505 Val Ser Lys Trp Thr Leu Asn Phe Pro Arg Ser Val Asp Glu His Ile1505 Val Ser Lys Trp Thr Leu Asn Phe Pro Arg Ser Val Asp Glu His Ile

15201520

1521 Asp Asp Lys Thr Leu Lys Ala Asp Glu Met Gln Ala Ala Leu Leu Ala1521 Asp Asp Lys Thr Leu Lys Ala Asp Glu Met Gln Ala Ala Leu Leu Ala

15361536

1537 Asn Met Asp Asp Val Leu Val Gln Val His Tyr Thr Ala Cys Asp Gly1537 Asn Met Asp Asp Val Leu Val Gln Val His Tyr Thr Ala Cys Asp Gly

15521552

1553 Gly Ala Ser Phe Ala Asn Gln Val Lys Lys Thr Leu Ser 15651553 Gly Ala Ser Phe Ala Asn Gln Val Lys Lys Thr Leu Ser 1565

(2) INFORMATION FOR SEQ ID NO:60(2) INFORMATION FOR SEQ ID NO: 60

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 3132 base pairs(A) LENGTH: 3132 base pairs

(B) TYPE: nucleic acid(B) TYPE: nucleic acid

(C) STRANDEDNESS: double(C) STRANDEDNESS: double

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULE TYPE: DNA (genomic)(ii) MOLECULE TYPE: DNA (genomic)

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:60 (tccC)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 60 (tccC)

1 ATG AGT CCG TCT GAG ACT ACT CTT TAT ACT CAA ACC CCA ACA GTC AGC 481 ATG AGT CCG TCT GAG ACT ACT CTT TAT ACT CAA ACC CCA ACA GTC AGC 48

1 Met Ser Pro Ser Glu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Val Ser 161 Met Ser Pro Ser Glu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Val Ser 16

49 GTG TTA GAT AAT CGC GGT CTG TCC ATT CGT GAT ATT GGT TTT CAC CGT 9649 GTG TTA GAT AAT CGC GGT CTG TCC ATT CGT GAT ATT GGT TTT CAC CGT 96

17 Val Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Ile Gly Phe His Arg 3217 Val Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Ile Gly Phe His Arg 32

97 ATT GTA ATC GGG GGG GAT ACT GAC ACC CGC GTC ACC CGT CAC CAG TAT97 ATT GTA ATC GGG GGG GAT ACT GAC ACC CGC GTC ACC CGT CAC CAG TAT

144144

33 Ile Val Ile Gly Gly Asp Thr Asp Thr Arg Val Thr Arg His Gln Tyr 4833 Ile Val Ile Gly Gly Asp Thr Asp Thr Arg Val Thr Arg His Gln Tyr 48

145 GAT GCC CGT GGA CAC CTG AAC TAC AGT ATT GAC CCA CGC TTG TAT GAT145 GAT GCC CGT GGA CAC CTG AAC TAC AGT ATT GAC CCA CGC TTG TAT GAT

192192

49 Asp Ala Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp 6449 Asp Ala Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp 64

193 GCA AAG CAG GCT GAT AAC TCA GTA AAG CCT AAT TTT GTC TGG CAG CAT193 GCA AAG CAG GCT GAT AAC TCA GTA AAG CCT AAT TTT GTC TGG CAG CAT

240240

65 Ala Lys Gln Ala Asp Asn Ser Val Lys Pro Asn Phe Val Trp Gln His 8065 Ala Lys Gln Ala Asp Asn Ser Val Lys Pro Asn Phe Val Trp Gln His 80

241 GAT CTG GCC GGT CAT GCC CTG CGG ACA GAG AGT GTC GAT GCT GGT CGT241 GAT CTG GCC GGT CAT GCC CTG CGG ACA GAG AGT GTC GAT GCT GGT CGT

288288

81 Asp Leu Ala Gly His Ala Leu Arg Thr Glu Ser Val Asp Ala Gly Arg 9681 Asp Leu Ala Gly His Ala Leu Arg Thr Glu Ser Val Asp Ala Gly Arg 96

289 ACT GTT GCA TTG AAT GAT ATT GAA GGT CGT TCG GTA ATG ACA ATG AAT289 ACT GTT GCA TTG AAT GAT ATT GAA GGT CGT TCG GTA ATG ACA ATG AAT

336336

97 Thr Val Ala Leu Asn Asp Ile Glu Gly Arg Ser Val Met Thr Met Asn97 Thr Val Ala Leu Asn Asp Ile Glu Gly Arg Ser Val Met Thr Met Asn

112112

337 GCG ACC GGT GTT CGT CAG ACC CGT CGC TAT GAA GGC AAC ACC TTG CCC337 GCG ACC GGT GTT CGT CAG ACC CGT CGC TAT GAA GGC AAC ACC TTG CCC

384384

113 Ala Thr Gly Val Arg Gln Thr Arg Arg Tyr Glu Gly Asn Thr Leu Pro113 Ala Thr Gly Val Arg Gln Thr Arg Arg Tyr Glu Gly Asn Thr Leu Pro

128128

385 GGT CGC TTG TTA TCT GTG AGC GAG CAA GTT TTC AAC CAA GAG AGT GCT385 GGT CGC TTG TTA TCT GTG AGC GAG CAA GTT TTC AAC CAA GAG AGT GCT

432432

129 Gly Arg Leu Leu Ser Val Ser Glu Gln Val Phe Asn Gln Glu Ser Ala129 Gly Arg Leu Leu Ser Val Ser Glu Gln Val Phe Asn Gln Glu Ser Ala

144144

433 AAA GTG ACA GAG CGC TTT ATC TGG GCT GGG AAT ACA ACC TCG GAG AAA433 AAA GTG ACA GAG CGC TTT ATC TGG GCT GGG AAT ACA ACC TCG GAG AAA

480480

145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly Asn Thr Thr Ser Glu Lys145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly Asn Thr Thr Ser Glu Lys

160160

481 GAG TAT AAC CTC TCC GGT CTG TGT ATA CGC CAC TAC GAC ACA GCG GGA481 GAG TAT AAC CTC TCC GGT CTG TGT ATA CGC CAC TAC GAC ACA GCG GGA

528528

161 Glu Tyr Asn Leu Ser Gly Leu Cys Ile Arg His Tyr Asp Thr Ala Gly161 Glu Tyr Asn Leu Ser Gly Leu Cys Ile Arg His Tyr Asp Thr Ala Gly

176176

529 GTG ACC CGG TTG ATG AGT CAG TCA CTG GCG GGC GCC ATG CTA TCC CAA529 GTG ACC CGG TTG ATG AGT CAG TCA CTG GCG GGC GCC ATG CTA TCC CAA

576576

177 Val Thr Arg Leu Met Ser Gln Ser Leu Ala Gly Ala Met Leu Ser Gln177 Val Thr Arg Leu Met Ser Gln Ser Leu Ala Gly Ala Met Leu Ser Gln

192192

577 TCT CAC CAA TTG CTG GCG GAA GGG CAG GAG GCT AAC TGG AGC GGT GAC577 TCT CAC CAA TTG CTG GCG GAA GGG CAG GAG GCT AAC TGG AGC GGT GAC

624624

193 Ser His Gln Leu Leu Ala Glu Gly Gln Glu Ala Asn Trp Ser Gly Asp193 Ser His Gln Leu Leu Ala Glu Gly Gln Glu Ala Asn Trp Ser Gly Asp

208208

625 GAC GAA ACT GTC TGG CAG GGA ATG CTG GCA AGT GAG GTC TAT ACG ACA625 GAC GAA ACT GTC TGG CAG GGA ATG CTG GCA AGT GAG GTC TAT ACG ACA

672672

209 Asp Glu Thr Val Trp Gln Gly Met Leu Ala Ser Glu Val Tyr Thr Thr209 Asp Glu Thr Val Trp Gln Gly Met Leu Ala Ser Glu Val Tyr Thr Thr

224224

673 CAA AGT ACC ACT AAT GCC ATC GGG GCT TTA CTG ACC CAA ACC GAT GCG673 CAA AGT ACC ACT AAT GCC ATC GGG GCT TTA CTG ACC CAA ACC GAT GCG

720720

225 Gln Ser Thr Thr Asn Ala Ile Gly Ala Leu Leu Thr Gln Thr Asp Ala225 Gln Ser Thr Thr Asn Ala Ile Gly Ala Leu Leu Thr Gln Thr Asp Ala

240240

721 AAA GGC AAT ATT CAG CGT CTG GCT TAT GAC ATT GCC GGT CAG TTA AAA721 AAA GGC AAT ATT CAG CGT CTG GCT TAT GAC ATT GCC GGT CAG TTA AAA

768768

241 Lys Gly Asn Ile Gln Arg Leu Ala Tyr Asp Ile Ala Gly Gln Leu Lys241 Lys Gly Asn Ile Gln Arg Leu Ala Tyr Asp Ile Ala Gly Gln Leu Lys

256256

769 GGG AGT TGG TTG ACG GTG AAA GGC CAG AGT GAA CAG GTG ATT GTT AAG769 GGG AGT TGG TTG ACG GTG AAA GGC CAG AGT GAA CAG GTG ATT GTT AAG

816816

257 Gly Ser Trp Leu Thr Val Lys Gly Gln Ser Glu Gln Val Ile Val Lys257 Gly Ser Trp Leu Thr Val Lys Gly Gln Ser Glu Gln Val Ile Val Lys

272272

817 TCC CTG AGC TGG TCA GCC GCA GGT CAT AAA TTG CGT GAA GAG CAC GGT817 TCC CTG AGC TGG TCA GCC GCA GGT CAT AAA TTG CGT GAA GAG CAC GGT

864864

273 Ser Leu Ser Trp Ser Ala Ala Gly His Lys Leu Arg Glu Glu His Gly273 Ser Leu Ser Trp Ser Ala Ala Gly His Lys Leu Arg Glu Glu His Gly

288288

865 AAC GGC GTG GTT ACG GAG TAC AGT TAT GAG CCG GAA ACT CAA CGT CTG865 AAC GGC GTG GTT ACG GAG TAC AGT TAT GAG CCG GAA ACT CAA CGT CTG

912912

289 Asn Gly Val Val Thr Glu Tyr Ser Tyr Glu Pro Glu Thr Gln Arg Leu289 Asn Gly Val Val Thr Glu Tyr Ser Tyr Glu Pro Glu Thr Gln Arg Leu

304304

913 ATA GGT ATC ACC ACC CGG CGT GCC GAA GGG AGT CAA TCA GGA GCC AGA913 ATA GGT ATC ACC ACC CGG CGT GCC GAA GGG AGT CAA TCA GGA GCC AGA

960960

305 Ile Gly Ile Thr Thr Arg Arg Ala Glu Gly Ser Gln Ser Gly Ala Arg305 Ile Gly Ile Thr Thr Arg Arg Ala Glu Gly Ser Gln Ser Gly Ala Arg

320320

961 GTA TTG CAG GAT CTA CGC TAT AAG TAT GAT CCG GTG GGG AAT GTT ATC961 GTA TTG CAG GAT CTA CGC TAT AAG TAT GAT CCG GTG GGG AAT GTT ATC

10081008

321 Val Leu Gln Asp Leu Arg Tyr Lys Tyr Asp Pro Val Gly Asn Val Ile 336321 Val Leu Gln Asp Leu Arg Tyr Lys Tyr Asp Pro Val Gly Asn Val Ile 336

1009 AGT ATC CAT AAT GAT GCC GAA GCT ACC CGC TTT TGG CGT AAT CAG AAA1009 AGT ATC CAT AAT GAT GCC GAA GCT ACC CGC TTT TGG CGT AAT CAG AAA

10561056

337 Ser Ile His Asn Asp Ala Glu Ala Thr Arg Phe Trp Arg Asn Gln Lys 352337 Ser Ile His Asn Asp Ala Glu Ala Thr Arg Phe Trp Arg Asn Gln Lys 352

1057 GTG GAG CCG GAG AAT CGC TAT GTT TAT GAT TCT CTG TAT CAG CTT ATG1057 GTG GAG CCG GAG AAT CGC TAT GTT TAT GAT TCT CTG TAT CAG CTT ATG

11041104

353 Val Glu Pro Glu Asn Arg Tyr Val Tyr Asp Ser Leu Tyr Gln Leu Met 368353 Val Glu Pro Glu Asn Arg Tyr Val Tyr Asp Ser Leu Tyr Gln Leu Met 368

1105 AGT GCG ACA GGG CGT GAA ATG GCT AAT ATC GGT CAG CAA AGC AAC CAA1105 AGT GCG ACA GGG CGT GAA ATG GCT AAT ATC GGT CAG CAA AGC AAC CAA

11521152

369 Ser Ala Thr Gly Arg Glu Met Ala Asn Ile Gly Gln Gln Ser Asn Gln369 Ser Ala Thr Gly Arg Glu Met Ala Asn Ile Gly Gln Gln Ser Asn Gln

384384

1153 CTT CCC TCA CCC GTT ATA CCT GTT CCT ACT GAC GAC AGC ACT TAT ACC1153 CTT CCC TCA CCC GTT ATA CCT GTT CCT ACT GAC GAC AGC ACT TAT ACC

12001200

385 Leu Pro Ser Pro Val Ile Pro Val Pro Thr Asp Asp Ser Thr Tyr Thr 400385 Leu Pro Ser Pro Val Ile Pro Val Pro Thr Asp Asp Ser Thr Tyr Thr 400

1201 AAT TAC CTT CGT ACC TAT ACT TAT GAC CGT GGC GGT AAT TTG GTT CAA1201 AAT TAC CTT CGT ACC TAT ACT TAT GAC CGT GGC GGT AAT TTG GTT CAA

12481248

401 Asn Tyr Leu Arg Thr Tyr Thr Tyr Asp Arg Gly Gly Asn Leu Val Gln 416401 Asn Tyr Leu Arg Thr Tyr Thr Tyr Asp Arg Gly Gly Asn Leu Val Gln 416

1249 ATC CGA CAC AGT TCA CCC GCG ACT CAA AAT AGT TAC ACC ACA GAT ATC1249 ATC CGA CAC AGT TCA CCC GCG ACT CAA AAT AGT TAC ACC ACA GAT ATC

12961296

417 Ile Arg His Ser Ser Pro Ala Thr Gln Asn Ser Tyr Thr Thr Asp Ile 432417 Ile Arg His Ser Ser Pro Ala Thr Gln Asn Ser Tyr Thr Thr Asp Ile 432

1297 ACC GTT TCA AGC CGC AGT AAC CGG GCG GTA TTG AGT ACA TTA ACG ACA1297 ACC GTT TCA AGC CGC AGT AAC CGG GCG GTA TTG AGT ACA TTA ACG ACA

13441344

433 Thr Val Ser Ser Arg Ser Asn Arg Ala Val Leu Ser Thr Leu Thr Thr 448433 Thr Val Ser Ser Arg Ser Asn Arg Ala Val Leu Ser Thr Leu Thr Thr 448

1345 GAT CCA ACC CGA GTG GAT GCG CTA TTT GAT TCC GGC GGT CAT CAG AAG1345 GAT CCA ACC CGA GTG GAT GCG CTA TTT GAT TCC GGC GGT CAT CAG AAG

13921392

449 Asp Pro Thr Arg Val Asp Ala Leu Phe Asp Ser Gly Gly His Gln Lys 464449 Asp Pro Thr Arg Val Asp Ala Leu Phe Asp Ser Gly Gly His Gln Lys 464

1393 ATG TTA ATA CCG GGG CAA AAT CTG GAT TGG AAT ATT CGG GGT GAA TTG1393 ATG TTA ATA CCG GGG CAA AAT CTG GAT TGG AAT ATT CGG GGT GAA TTG

14401440

465 Met Leu Ile Pro Gly Gln Asn Leu Asp Trp Asn Ile Arg Gly Glu Leu 480465 Met Leu Ile Pro Gly Gln Asn Leu Asp Trp Asn Ile Arg Gly Glu Leu 480

1441 CAA CGA GTC ACA CCG GTG AGC CGT GAA AAT AGC AGT GAC AGT GAA TGG1441 CAA CGA GTC ACA CCG GTG AGC CGT GAA AAT AGC AGT GAC AGT GAA TGG

14881488

481 Gln Arg Val Thr Pro Val Ser Arg Glu Asn Ser Ser Asp Ser Glu Trp 496481 Gln Arg Val Thr Pro Val Ser Arg Glu Asn Ser Ser Asp Ser Glu Trp 496

1489 TAT CGC TAT AGC AGT GAT GGC ATG CGG CTG CTA AAA GTG AGT GAA CAG1489 TAT CGC TAT AGC AGT GAT GGC ATG CGG CTG CTA AAA GTG AGT GAA CAG

15361536

497 Tyr Arg Tyr Ser Ser Asp Gly Met Arg Leu Leu Lys Val Ser Glu Gln 512497 Tyr Arg Tyr Ser Ser Asp Gly Met Arg Leu Leu Lys Val Ser Glu Gln 512

1537 CAG ACG GGC AAC AGT ACT CAA GTA CAA CGG GTG ACT TAT CTG CCG GGA1537 CAG ACG GGC AAC AGT ACT CAA GTA CAA CGG GTG ACT TAT CTG CCG GGA

15841584

513 Gln Thr Gly Asn Ser Thr Gln Val Gln Arg Val Thr Tyr Leu Pro Gly 528513 Gln Thr Gly Asn Ser Thr Gln Val Gln Arg Val Thr Tyr Leu Pro Gly 528

1585 TTA GAG CTA CGG ACA ACT GGG GTT GCA GAT AAA ACA ACC GAA GAT TTG1585 TTA GAG CTA CGG ACA ACT GGG GTT GCA GAT AAA ACA ACC GAA GAT TTG

16321632

529 Leu Glu Leu Arg Thr Thr Gly Val Ala Asp Lys Thr Thr Glu Asp Leu 544529 Leu Glu Leu Arg Thr Thr Gly Val Ala Asp Lys Thr Thr Glu Asp Leu 544

1633 CAG GTG ATT ACG GTA GGT GAA GCG GGT CGC GCA CAG GTA AGG GTA TTG1633 CAG GTG ATT ACG GTA GGT GAA GCG GGT CGC GCA CAG GTA AGG GTA TTG

16801680

545 Gln Val Ile Thr Val Gly Glu Ala Gly Arg Ala Gln Val Arg Val Leu 560545 Gln Val Ile Thr Val Gly Glu Ala Gly Arg Ala Gln Val Arg Val Leu 560

1681 CAC TGG GAA AGT GGT AAG CCG ACA GAT ATT GAC AAC AAT CAG GTG CGC1681 CAC TGG GAA AGT GGT AAG CCG ACA GAT ATT GAC AAC AAT CAG GTG CGC

17281728

561 His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln Val Arg 576561 His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln Val Arg 576

1729 TAC AGC TAC GAT AAT CTG CTT GGC TCC AGC CAG CTT GAA CTG GAT AGC1729 TAC AGC TAC GAT AAT CTG CTT GGC TCC AGC CAG CTT GAA CTG GAT AGC

17761776

577 Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser 592577 Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser 592

1777 GAA GGG CAG ATT CTC AGT CAG GAA GAG TAT TAT CCG TAT GGC GGT ACG1777 GAA GGG CAG ATT CTC AGT CAG GAA GAG TAT TAT CCG TAT GGC GGT ACG

18241824

593 Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr 608593 Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr 608

1825 GCG ATA TGG GCG GCG AGA AAT CAG ACA GAA GCC AGC TAC AAA TTT ATT1825 GCG ATA TGG GCG GCG AGA AAT CAG ACA GAA GCC AGC TAC AAA TTT ATT

18721872

609 Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile 624609 Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile 624

1873 CGT TAC TCC GGT AAA GAG CGG GAT GCC ACT GGA TTG TAT TAT TAC GGC1873 CGT TAC TCC GGT AAA GAG CGG GAT GCC ACT GGA TTG TAT TAT TAC GGC

19201920

625 Arg Tyr Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly 640625 Arg Tyr Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly 640

1921 TAC CGT TAT TAT CAA CCT TGG GTG GGT CGA TGG TTG AGT GCT GAT CCG1921 TAC CGT TAT TAT CAA CCT TGG GTG GGT CGA TGG TTG AGT GCT GAT CCG

19681968

641 Tyr Arg Tyr Tyr Gln Pro Trp Val Gly Arg Trp Leu Ser Ala Asp Pro 656641 Tyr Arg Tyr Tyr Gln Pro Trp Val Gly Arg Trp Leu Ser Ala Asp Pro 656

1969 GCG GGA ACC GTG GAT GGG CTG AAT TTG TAC CGA ATG GTG AGG AAT AAC1969 GCG GGA ACC GTG GAT GGG CTG AAT TTG TAC CGA ATG GTG AGG AAT AAC

20162016

657 Ala Gly Thr Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn 672657 Ala Gly Thr Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn 672

2017 CCC ATC ACA TTG ACT GAC CAT GAC GGA TTA GCA CCG TCT CCA AAT AGA2017 CCC ATC ACA TTG ACT GAC CAT GAC GGA TTA GCA CCG TCT CCA AAT AGA

20642064

673 Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn Arg 688673 Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn Arg 688

2065 AAT CGA AAT ACA TTT TGG TTT GCT TCA TTT TTG TTT CGT AAA CCT GAT2065 AAT CGA AAT ACA TTT TGG TTT GCT TCA TTT TTG TTT CGT AAA CCT GAT

21122112

689 Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp 704689 Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp 704

2113 GAG GGA ATG TCC GCG TCA ATG AGA CGG GGA CAA AAA ATT GGC AGA GCC2113 GAG GGA ATG TCC GCG TCA ATG AGA CGG GGA CAA AAA ATT GGC AGA GCC

21602160

705 Glu Gly Met Ser Ala Ser Met Arg Arg Gly Gln Lys Ile Gly Arg Ala 720705 Glu Gly Met Ser Ala Ser Met Arg Arg Gly Gln Lys Ile Gly Arg Ala 720

2161 ATT GCC GGC GGG ATT GCG ATT GGC GGT CTT GCG GCT ACC ATT GCC GCT2161 ATT GCC GGC GGG ATT GCG ATT GGC GGT CTT GCG GCT ACC ATT GCC GCT

22082208

721 Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu Ala Ala Thr Ile Ala Ala 736721 Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu Ala Ala Thr Ile Ala Ala 736

2209 ACG GCT GGC GCG GCT ATC CCC GTC ATT CTG GGG GTT GCG GCC GTA GGC2209 ACG GCT GGC GCG GCT ATC CCC GTC ATT CTG GGG GTT GCG GCC GTA GGC

22562256

737 Thr Ala Gly Ala Ala Ile Pro Val Ile Leu Gly Val Ala Ala Val Gly 752737 Thr Ala Gly Ala Ala Ile Pro Val Ile Leu Gly Val Ala Ala Val Gly 752

2257 GCG GGG ATT GGC GCG TTG ATG GGA TAT AAC GTC GGT AGC CTG CTG GAA2257 GCG GGG ATT GGC GCG TTG ATG GGA TAT AAC GTC GGT AGC CTG CTG GAA

23042304

753 Ala Gly Ile Gly Ala Leu Met Gly Tyr Asn Val Gly Ser Leu Leu Glu 768753 Ala Gly Ile Gly Ala Leu Met Gly Tyr Asn Val Gly Ser Leu Leu Glu 768

2305 AAA GGC GGG GCA TTA CTT GCT CGA CTC GTA CAG GGG AAA TCG ACG TTA2305 AAA GGC GGG GCA TTA CTT GCT CGA CTC GTA CAG GGG AAA TCG ACG TTA

23522352

769 Lys Gly Gly Ala Leu Leu Ala Arg Leu Val Gln Gly Lys Ser Thr Leu 784769 Lys Gly Gly Ala Leu Leu Ala Arg Leu Val Gln Gly Lys Ser Thr Leu 784

2353 GTA CAG TCG GCG GCT GGC GCG GCT GCC GGA GCG AGT TCA GCC GCG GCT2353 GTA CAG TCG GCG GCT GGC GCG GCT GCC GGA GCG AGT TCA GCC GCG GCT

24002400

785 Val Gln Ser Ala Ala Gly Ala Ala Ala Gly Ala Ser Ser Ala Ala Ala 800785 Val Gln Ser Ala Ala Gly Ala Ala Ala Gly Ala Ser Ser Ala Ala Ala 800

2401 TAT GGC GCA CGG GCA CAA GGT GTC GGT GTT GCA TCA GCC GCC GGG GCG2401 TAT GGC GCA CGG GCA CAA GGT GTC GGT GTT GCA TCA GCC GCC GGG GCG

24482448

801 Tyr Gly Ala Arg Ala Gln Gly Val Gly Val Ala Ser Ala Ala Gly Ala 816801 Tyr Gly Ala Arg Ala Gln Gly Val Gly Val Ala Ser Ala Ala Gly Ala 816

2449 GTA ACA GGG GCT GTG GGA TCA TGG ATA AAT AAT GCT GAT CGG GGG ATT2449 GTA ACA GGG GCT GTG GGA TCA TGG ATA AAT AAT GCT GAT CGG GGG ATT

24962496

817 Val Thr Gly Ala Val Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile 832817 Val Thr Gly Ala Val Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile 832

2497 GGC GGC GCT ATT GGG GCC GGG AGT GCG GTA GGC ACC ATT GAT ACT ATG2497 GGC GGC GCT ATT GGG GCC GGG AGT GCG GTA GGC ACC ATT GAT ACT ATG

25442544

833 Gly Gly Ala Ile Gly Ala Gly Ser Ala Val Gly Thr Ile Asp Thr Met 848833 Gly Gly Ala Ile Gly Ala Gly Ser Ala Val Gly Thr Ile Asp Thr Met 848

2545 TTA GGG ACT GCC TCT ACC CTT ACC CAT GAA GTC GGG GCA GCG GCG GGT2545 TTA GGG ACT GCC TCT ACC CTT ACC CAT GAA GTC GGG GCA GCG GCG GGT

25922592

849 Leu Gly Thr Ala Ser Thr Leu Thr His Glu Val Gly Ala Ala Ala Gly 864849 Leu Gly Thr Ala Ser Thr Leu Thr His Glu Val Gly Ala Ala Ala Gly 864

2593 GGG GCG GCG GGT GGG ATG ATC ACC GGT ACG CAA GGG AGT ACT CGG GCA2593 GGG GCG GCG GGT GGG ATG ATC ACC GGT ACG CAA GGG AGT ACT CGG GCA

26402640

865 Gly Ala Ala Gly Gly Met Ile Thr Gly Thr Gln Gly Ser Thr Arg Ala 880865 Gly Ala Ala Gly Gly Met Ile Thr Gly Thr Gln Gly Ser Thr Arg Ala 880

2641 GGT ATC CAT GCC GGT ATT GGC ACC TAT TAT GGC TCC TGG ATT GGT TTT2641 GGT ATC CAT GCC GGT ATT GGC ACC TAT TAT GGC TCC TGG ATT GGT TTT

26882688

881 Gly Ile His Ala Gly Ile Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 896881 Gly Ile His Ala Gly Ile Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 896

2689 GGT TTA GAT GTC GCT AGT AAC CCC GCC GGA CAT TTA GCG AAT TAC GCA2689 GGT TTA GAT GTC GCT AGT AAC CCC GCC GGA CAT TTA GCG AAT TAC GCA

27362736

897 Gly Leu Asp Val Ala Ser Asn Pro Ala Gly His Leu Ala Asn Tyr Ala 912897 Gly Leu Asp Val Ala Ser Asn Pro Ala Gly His Leu Ala Asn Tyr Ala 912

2737 GTG GGT TAT GCC GCT GGT TTG GGT GCT GAA ATG GCT GTC AAC AGA ATA2737 GTG GGT TAT GCC GCT GGT TTG GGT GCT GAA ATG GCT GTC AAC AGA ATA

27842784

913 Val Gly Tyr Ala Ala Gly Leu Gly Ala Glu Met Ala Val Asn Arg Ile 928913 Val Gly Tyr Ala Ala Gly Leu Gly Ala Glu Met Ala Val Asn Arg Ile 928

2785 ATG GGT GGT GGA TTT TTG AGT AGG CTC TTA GGC CGG GTT GTC AGC CCA2785 ATG GGT GGT GGA TTT TTG AGT AGG CTC TTA GGC CGG GTT GTC AGC CCA

28322832

929 Met Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly Arg Val Val Ser Pro 944929 Met Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly Arg Val Val Ser Pro 944

2833 TAT GCC GCC GGT TTA GCC AGA CAA TTA GTA CAT TTC AGT GTC GCC AGA2833 TAT GCC GCC GGT TTA GCC AGA CAA TTA GTA CAT TTC AGT GTC GCC AGA

28802880

945 Tyr Ala Ala Gly Leu Ala Arg Gln Leu Val His Phe Ser Val Ala Arg 960945 Tyr Ala Ala Gly Leu Ala Arg Gln Leu Val His Phe Ser Val Ala Arg 960

2881 CCT GTC TTT GAG CCG ATA TTT AGT GTT CTC GGC GGG CTT GTC GGT GGT2881 CCT GTC TTT GAG CCG ATA TTT AGT GTT CTC GGC GGG CTT GTC GGT GGT

29282928

961 Pro Val Phe Glu Pro Ile Phe Ser Val Leu Gly Gly Leu Val Gly Gly 976961 Pro Val Phe Glu Pro Ile Phe Ser Val Leu Gly Gly Leu Val Gly Gly 976

2929 ATT GGA ACT GGC CTG CAC AGA GTG ATG GGA AGA GAG AGT TGG ATT TCC2929 ATT GGA ACT GGC CTG CAC AGA GTG ATG GGA AGA GAG AGT TGG ATT TCC

29762976

977 Ile Gly Thr Gly Leu His Arg Val Met Gly Arg Glu Ser Trp Ile Ser 992977 Ile Gly Thr Gly Leu His Arg Val Met Gly Arg Glu Ser Trp Ile Ser 992

2977 AGA GCG TTA AGT GCT GCC GGT AGT GGT ATA GAT CAT GTC GCT GGC ATG2977 AGA GCG TTA AGT GCT GCC GGT AGT GGT ATA GAT CAT GTC GCT GGC ATG

30243024

993 Arg Ala Leu Ser Ala Ala Gly Ser Gly Ile Asp His Val Ala Gly Met993 Arg Ala Leu Ser Ala Ala Gly Ser Gly Ile Asp His Val Ala Gly Met

10081008

3025 ATT GGT AAT CAG ATC AGA GGC AGG GTC TTG ACC ACA ACC GGG ATC GCT3025 ATT GGT AAT CAG ATC AGA GGC AGG GTC TTG ACC ACA ACC GGG ATC GCT

30723072

1009 Ile Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Ala1009 Ile Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Ala

10241024

3073 AAT GCG ATA GAC TAT GGC ACC AGT GCT GTG GGA GCC GCA CGA CGA GTT3073 AAT GCG ATA GAC TAT GGC ACC AGT GCT GTG GGA GCC GCA CGA CGA GTT

31203120

1025 Asn Ala Ile Asp Tyr Gly Thr Ser Ala Val Gly Ala Ala Arg Arg Val1025 Asn Ala Ile Asp Tyr Gly Thr Ser Ala Val Gly Ala Ala Arg Arg Val

10401040

3121 TTT TCT TTG TAA 31323121 TTT TCT TTG TAA 3132

1041 Phe Ser Leu End 10431041 Phe Ser Leu End 1043

(2) INFORMATION FOR SEQ ID NO:61(2) INFORMATION FOR SEQ ID NO: 61

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 1043 amino acids(A) LENGTH: 1043 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) TOPOLOGY: linear(C) TOPOLOGY: linear

(ii) MOLECULE TYPE: protein(ii) MOLECULE TYPE: protein

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:61 (TccC peptide)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 61 (TccC peptide)

1 Met Ser Pro Ser Glu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Val Ser 161 Met Ser Pro Ser Glu Thr Thr Leu Tyr Thr Gln Thr Pro Thr Val Ser 16

17 Val Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Ile Gly Phe His Arg 3217 Val Leu Asp Asn Arg Gly Leu Ser Ile Arg Asp Ile Gly Phe His Arg 32

33 Ile Val Ile Gly Gly Asp Thr Asp Thr Arg Val Thr Arg His Gln Tyr 4833 Ile Val Ile Gly Gly Asp Thr Asp Thr Arg Val Thr Arg His Gln Tyr 48

49 Asp Ala Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp 6449 Asp Ala Arg Gly His Leu Asn Tyr Ser Ile Asp Pro Arg Leu Tyr Asp 64

65 Ala Lys Gln Ala Asp Asn Ser Val Lys Pro Asn Phe Val Trp Gln His 8065 Ala Lys Gln Ala Asp Asn Ser Val Lys Pro Asn Phe Val Trp Gln His 80

81 Asp Leu Ala Gly His Ala Leu Arg Thr Glu Ser Val Asp Ala Gly Arg 9681 Asp Leu Ala Gly His Ala Leu Arg Thr Glu Ser Val Asp Ala Gly Arg 96

97 Thr Val Ala Leu Asn Asp Ile Glu Gly Arg Ser Val Met Thr Met Asn 11297 Thr Val Ala Leu Asn Asp Ile Glu Gly Arg Ser Val Met Thr Met Asn 112

113 Ala Thr Gly Val Arg Gln Thr Arg Arg Tyr Glu Gly Asn Thr Leu Pro 128113 Ala Thr Gly Val Arg Gln Thr Arg Arg Tyr Glu Gly Asn Thr Leu Pro 128

129 Gly Arg Leu Leu Ser Val Ser Glu Gln Val Phe Asn Gln Glu Ser Ala 144129 Gly Arg Leu Leu Ser Val Ser Glu Gln Val Phe Asn Gln Glu Ser Ala 144

145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly Asn Thr Thr Ser Glu Lys 160145 Lys Val Thr Glu Arg Phe Ile Trp Ala Gly Asn Thr Thr Ser Glu Lys 160

161 Glu Tyr Asn Leu Ser Gly Leu Cys Ile Arg His Tyr Asp Thr Ala Gly 176161 Glu Tyr Asn Leu Ser Gly Leu Cys Ile Arg His Tyr Asp Thr Ala Gly 176

177 Val Thr Arg Leu Met Ser Gln Ser Leu Ala Gly Ala Met Leu Ser Gln 192177 Val Thr Arg Leu Met Ser Gln Ser Leu Ala Gly Ala Met Leu Ser Gln 192

193 Ser His Gln Leu Leu Ala Glu Gly Gln Glu Ala Asn Trp Ser Gly Asp 208193 Ser His Gln Leu Leu Ala Glu Gly Gln Glu Ala Asn Trp Ser Gly Asp 208

209 Asp Glu Thr Val Trp Gln Gly Met Leu Ala Ser Glu Val Tyr Thr Thr 224209 Asp Glu Thr Val Trp Gln Gly Met Leu Ala Ser Glu Val Tyr Thr Thr 224

225 Gln Ser Thr Thr Asn Ala Ile Gly Ala Leu Leu Thr Gln Thr Asp Ala 240225 Gln Ser Thr Thr Asn Ala Ile Gly Ala Leu Leu Thr Gln Thr Asp Ala 240

241 Lys Gly Asn Ile Gln Arg Leu Ala Tyr Asp Ile Ala Gly Gln Leu Lys 256241 Lys Gly Asn Ile Gln Arg Leu Ala Tyr Asp Ile Ala Gly Gln Leu Lys 256

257 Gly Ser Trp Leu Thr Val Lys Gly Gln Ser Glu Gln Val Ile Val Lys 272257 Gly Ser Trp Leu Thr Val Lys Gly Gln Ser Glu Gln Val Ile Val Lys 272

273 Ser Leu Ser Trp Ser Ala Ala Gly His Lys Leu Arg Glu Glu His Gly 288273 Ser Leu Ser Trp Ser Ala Ala Gly His Lys Leu Arg Glu Glu His Gly 288

289 Asn Gly Val Val Thr Glu Tyr Ser Tyr Glu Pro Glu Thr Gln Arg Leu 304289 Asn Gly Val Val Thr Glu Tyr Ser Tyr Glu Pro Glu Thr Gln Arg Leu 304

305 Ile Gly Ile Thr Thr Arg Arg Ala Glu Gly Ser Gln Ser Gly Ala Arg 320305 Ile Gly Ile Thr Thr Arg Arg Ala Glu Gly Ser Gln Ser Gly Ala Arg 320

321 Val Leu Gln Asp Leu Arg Tyr Lys Tyr Asp Pro Val Gly Asn Val Ile 336321 Val Leu Gln Asp Leu Arg Tyr Lys Tyr Asp Pro Val Gly Asn Val Ile 336

337 Ser Ile His Asn Asp Ala Glu Ala Thr Arg Phe Trp Arg Asn Gln Lys 352337 Ser Ile His Asn Asp Ala Glu Ala Thr Arg Phe Trp Arg Asn Gln Lys 352

353 Val Glu Pro Glu Asn Arg Tyr Val Tyr Asp Ser Leu Tyr Gln Leu Met 368353 Val Glu Pro Glu Asn Arg Tyr Val Tyr Asp Ser Leu Tyr Gln Leu Met 368

369 Ser Ala Thr Gly Arg Glu Met Ala Asn Ile Gly Gln Gln Ser Asn Gln 384369 Ser Ala Thr Gly Arg Glu Met Ala Asn Ile Gly Gln Gln Ser Asn Gln 384

385 Leu Pro Ser Pro Val Ile Pro Val Pro Thr Asp Asp Ser Thr Tyr Thr 400385 Leu Pro Ser Pro Val Ile Pro Val Pro Thr Asp Asp Ser Thr Tyr Thr 400

401 Asn Tyr Leu Arg Thr Tyr Thr Tyr Asp Arg Gly Gly Asn Leu Val Gln 416401 Asn Tyr Leu Arg Thr Tyr Thr Tyr Asp Arg Gly Gly Asn Leu Val Gln 416

417 Ile Arg His Ser Ser Pro Ala Thr Gln Asn Ser Tyr Thr Thr Asp Ile 432417 Ile Arg His Ser Ser Pro Ala Thr Gln Asn Ser Tyr Thr Thr Asp Ile 432

433 Thr Val Ser Ser Arg Ser Asn Arg Ala Val Leu Ser Thr Leu Thr Thr 448433 Thr Val Ser Ser Arg Ser Asn Arg Ala Val Leu Ser Thr Leu Thr Thr 448

449 Asp Pro Thr Arg Val Asp Ala Leu Phe Asp Ser Gly Gly His Gln Lys 464449 Asp Pro Thr Arg Val Asp Ala Leu Phe Asp Ser Gly Gly His Gln Lys 464

465 Met Leu Ile Pro Gly Gln Asn Leu Asp Trp Asn Ile Arg Gly Glu Leu 480465 Met Leu Ile Pro Gly Gln Asn Leu Asp Trp Asn Ile Arg Gly Glu Leu 480

481 Gln Arg Val Thr Pro Val Ser Arg Glu Asn Ser Ser Asp Ser Glu Trp 496481 Gln Arg Val Thr Pro Val Ser Arg Glu Asn Ser Ser Asp Ser Glu Trp 496

497 Tyr Arg Tyr Ser Ser Asp Gly Met Arg Leu Leu Lys Val Ser Glu Gln 512497 Tyr Arg Tyr Ser Ser Asp Gly Met Arg Leu Leu Lys Val Ser Glu Gln 512

513 Gln Thr Gly Asn Ser Thr Gln Val Gln Arg Val Thr Tyr Leu Pro Gly 528513 Gln Thr Gly Asn Ser Thr Gln Val Gln Arg Val Thr Tyr Leu Pro Gly 528

529 Leu Glu Leu Arg Thr Thr Gly Val Ala Asp Lys Thr Thr Glu Asp Leu 544529 Leu Glu Leu Arg Thr Thr Gly Val Ala Asp Lys Thr Thr Glu Asp Leu 544

545 Gln Val Ile Thr Val Gly Glu Ala Gly Arg Ala Gln Val Arg Val Leu 560545 Gln Val Ile Thr Val Gly Glu Ala Gly Arg Ala Gln Val Arg Val Leu 560

561 His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln Val Arg 576561 His Trp Glu Ser Gly Lys Pro Thr Asp Ile Asp Asn Asn Gln Val Arg 576

577 Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser 592577 Tyr Ser Tyr Asp Asn Leu Leu Gly Ser Ser Gln Leu Glu Leu Asp Ser 592

593 Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr 608593 Glu Gly Gln Ile Leu Ser Gln Glu Glu Tyr Tyr Pro Tyr Gly Gly Thr 608

609 Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile 624609 Ala Ile Trp Ala Ala Arg Asn Gln Thr Glu Ala Ser Tyr Lys Phe Ile 624

625 Arg Tyr Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly 640625 Arg Tyr Ser Gly Lys Glu Arg Asp Ala Thr Gly Leu Tyr Tyr Tyr Gly 640

641 Tyr Arg Tyr Tyr Gln Pro Trp Val Gly Arg Trp Leu Ser Ala Asp Pro 656641 Tyr Arg Tyr Tyr Gln Pro Trp Val Gly Arg Trp Leu Ser Ala Asp Pro 656

657 Ala Gly Thr Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn 672657 Ala Gly Thr Val Asp Gly Leu Asn Leu Tyr Arg Met Val Arg Asn Asn 672

673 Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn Arg 688673 Pro Ile Thr Leu Thr Asp His Asp Gly Leu Ala Pro Ser Pro Asn Arg 688

689 Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp 704689 Asn Arg Asn Thr Phe Trp Phe Ala Ser Phe Leu Phe Arg Lys Pro Asp 704

705 Glu Gly Met Ser Ala Ser Met Arg Arg Gly Gln Lys Ile Gly Arg Ala 720705 Glu Gly Met Ser Ala Ser Met Arg Arg Gly Gln Lys Ile Gly Arg Ala 720

721 Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu Ala Ala Thr Ile Ala Ala 736721 Ile Ala Gly Gly Ile Ala Ile Gly Gly Leu Ala Ala Thr Ile Ala Ala 736

737 Thr Ala Gly Ala Ala Ile Pro Val Ile Leu Gly Val Ala Ala Val Gly 752737 Thr Ala Gly Ala Ala Ile Pro Val Ile Leu Gly Val Ala Ala Val Gly 752

753 Ala Gly Ile Gly Ala Leu Met Gly Tyr Asn Val Gly Ser Leu Leu Glu 768753 Ala Gly Ile Gly Ala Leu Met Gly Tyr Asn Val Gly Ser Leu Leu Glu 768

769 Lys Gly Gly Ala Leu Leu Ala Arg Leu Val Gln Gly Lys Ser Thr Leu 784769 Lys Gly Gly Ala Leu Leu Ala Arg Leu Val Gln Gly Lys Ser Thr Leu 784

785 Val Gln Ser Ala Ala Gly Ala Ala Ala Gly Ala Ser Ser Ala Ala Ala 800785 Val Gln Ser Ala Ala Gly Ala Ala Ala Gly Ala Ser Ser Ala Ala Ala 800

801 Tyr Gly Ala Arg Ala Gln Gly Val Gly Val Ala Ser Ala Ala Gly Ala 816801 Tyr Gly Ala Arg Ala Gln Gly Val Gly Val Ala Ser Ala Ala Gly Ala 816

817 Val Thr Gly Ala Val Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile 832817 Val Thr Gly Ala Val Gly Ser Trp Ile Asn Asn Ala Asp Arg Gly Ile 832

833 Gly Gly Ala Ile Gly Ala Gly Ser Ala Val Gly Thr Ile Asp Thr Met 848833 Gly Gly Ala Ile Gly Ala Gly Ser Ala Val Gly Thr Ile Asp Thr Met 848

849 Leu Gly Thr Ala Ser Thr Leu Thr His Glu Val Gly Ala Ala Ala Gly 864849 Leu Gly Thr Ala Ser Thr Leu Thr His Glu Val Gly Ala Ala Ala Gly 864

865 Gly Ala Ala Gly Gly Met Ile Thr Gly Thr Gln Gly Ser Thr Arg Ala 880865 Gly Ala Ala Gly Gly Met Ile Thr Gly Thr Gln Gly Ser Thr Arg Ala 880

881 Gly Ile His Ala Gly Ile Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 896881 Gly Ile His Ala Gly Ile Gly Thr Tyr Tyr Gly Ser Trp Ile Gly Phe 896

897 Gly Leu Asp Val Ala Ser Asn Pro Ala Gly His Leu Ala Asn Tyr Ala 912897 Gly Leu Asp Val Ala Ser Asn Pro Ala Gly His Leu Ala Asn Tyr Ala 912

913 Val Gly Tyr Ala Ala Gly Leu Gly Ala Glu Met Ala Val Asn Arg Ile 928913 Val Gly Tyr Ala Ala Gly Leu Gly Ala Glu Met Ala Val Asn Arg Ile 928

929 Met Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly Arg Val Val Ser Pro 944929 Met Gly Gly Gly Phe Leu Ser Arg Leu Leu Gly Arg Val Val Ser Pro 944

945 Tyr Ala Ala Gly Leu Ala Arg Gln Leu Val His Phe Ser Val Ala Arg 960945 Tyr Ala Ala Gly Leu Ala Arg Gln Leu Val His Phe Ser Val Ala Arg 960

961 Pro Val Phe Glu Pro Ile Phe Ser Val Leu Gly Gly Leu Val Gly Gly 976961 Pro Val Phe Glu Pro Ile Phe Ser Val Leu Gly Gly Leu Val Gly Gly 976

977 Ile Gly Thr Gly Leu His Arg Val Met Gly Arg Glu Ser Trp Ile Ser 992977 Ile Gly Thr Gly Leu His Arg Val Met Gly Arg Glu Ser Trp Ile Ser 992

993 Arg Ala Leu Ser Ala Ala Gly Ser Gly Ile Asp His Val Ala Gly Met 1008993 Arg Ala Leu Ser Ala Ala Gly Ser Gly Ile Asp His Val Ala Gly Met 1008

1009 Ile Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Ala 10241009 Ile Gly Asn Gln Ile Arg Gly Arg Val Leu Thr Thr Thr Gly Ile Ala 1024

1025 Asn Ala Ile Asp Tyr Gly Thr Ser Ala Val Gly Ala Ala Arg Arg Val 10401025 Asn Ala Ile Asp Tyr Gly Thr Ser Ala Val Gly Ala Ala Arg Arg Val 1040

1041 Phe Ser Leu 10431041 Phe Ser Leu 1043

(2) INFORMATION FOR SEQ ID NO:62: TcaAiv(2) INFORMATION FOR SEQ ID NO: 62: TcaAiv

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 5 amino acids(A) LENGTH: 5 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:62: TcaAiv(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 62: TcaAiv

Asn Ile Gly Gly AspAsn Ile Gly Gly Asp

1 51 5

(2) INFORMATION FOR SEQ ID NO:63: TcaAii-syn(2) INFORMATION FOR SEQ ID NO: 63: TcaAii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:63: TcaAii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 63: TcaAii-syn

Cys Leu Arg Gly Asn Ser Pro Thr Asn Pro Asp Lys Asp Gly IleCys Leu Arg Gly Asn Ser Pro Thr Asn Pro Asp Lys Asp Gly Ile

1 5 10 151 5 10 15

Phe Ala Gln Val AlaPhe Ala Gln Val Ala

2020

(2) INFORMATION FOR SEQ ID NO:64: TcaAiii-syn(2) INFORMATION FOR SEQ ID NO: 64: TcaAiii-syn

(i) SEQUENCE CHARACTERISTICS;(i) SEQUENCE CHARACTERISTICS;

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: Internal(v) FRAGMENT TYPE: Internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:64: TcaAiii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 64: TcaAiii-syn

Cys Tyr Thr Pro Asp Gln Thr Pro Ser Phe Tyr Glu Thr Ala PheCys Tyr Thr Pro Asp Gln Thr Pro Ser Phe Tyr Glu Thr Ala Phe

1 5 10 151 5 10 15

Arg Ser Ala Asp GlyArg Ser Ala Asp Gly

2020

(2) INFORMATION FOR SEQ ID NO:65: TcaBi-syn(2) INFORMATION FOR SEQ ID NO: 65: TcaBi-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 19 amino acids(A) LENGTH: 19 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: Internal(v) FRAGMENT TYPE: Internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65: TcaBi-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 65: TcaBi-syn

His Gly Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr LeuHis Gly Gln Ser Tyr Asn Asp Asn Asn Tyr Cys Asn Phe Thr Leu

1 5 10 151 5 10 15

Ser Ile Asn ThrSer Ile Asn Thr

1919

(2) INFORMATION FOR SEQ ID NO:66: TcaBii-syn(2) INFORMATION FOR SEQ ID NO: 66: TcaBii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:66: TcaBii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 66: TcaBii-syn

Cys Val Asp Pro Lys Thr Leu Gln Arg Gln Gln Ala Gly Gly AspCys Val Asp Pro Lys Thr Leu Gln Arg Gln Gln Ala Gly Gly Asp

1 5 10 151 5 10 15

Gly Thr Gly Ser SerGly Thr Gly Ser Ser

2020

(2) INFORMATION FOR SEQ ID NO:67: TcaC-syn(2) INFORMATION FOR SEQ ID NO: 67: TcaC-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:67: TcaC-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 67: TcaC-syn

Cys Tyr Lys Ala Pro Gln Arg Gln Glu Asp Gly Asp Ser Asn AlaCys Tyr Lys Ala Pro Gln Arg Gln Glu Asp Gly Asp Ser Asn Ala

1 5 10 151 5 10 15

Val Thr Tyr Asp LysVal Thr Tyr Asp Lys

2020

(2) INFORMATION FOR SEQ ID NO:68: TcbAii-syn(2) INFORMATION FOR SEQ ID NO: 68: TcbAii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:68: TcbAii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 68: TcbAii-syn

Cys Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp Tyr PheCys Tyr Asn Glu Asn Pro Ser Ser Glu Asp Lys Lys Trp Tyr Phe

1 5 10 151 5 10 15

Ser Ser Lys Asp AspSer Ser Lys Asp Asp

2020

(2) INFORMATION FOR SEQ ID NO:69: TcbAiii-syn(2) INFORMATION FOR SEQ ID NO: 69: TcbAiii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:69: TcbAiii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 69: TcbAiii-syn

Cys Phe Asp Ser Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn AlaCys Phe Asp Ser Tyr Ser Gln Leu Tyr Glu Glu Asn Ile Asn Ala

1 5 10 151 5 10 15

Gly Glu Gln Arg AlaGly Glu Gln Arg Ala

2020

(2) INFORMATION FOR SEQ ID NO:70: TcdAii-syn(2) INFORMATION FOR SEQ ID NO: 70: TcdAii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 22 amino acids(A) LENGTH: 22 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:70: TcdAii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 70: TcdAii-syn

Cys Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro ValCys Asn Pro Asn Asn Ser Ser Asn Lys Leu Met Phe Tyr Pro Val

1 5 10 151 5 10 15

Tyr Gln Tyr Ser Gly Asn ThrTyr Gln Tyr Ser Gly Asn Thr

2020

(2) INFORMATION FOR SEQ ID NO:71: TcdAiii-syn(2) INFORMATION FOR SEQ ID NO: 71: TcdAiii-syn

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 20 amino acids(A) LENGTH: 20 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: internal(v) FRAGMENT TYPE: internal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:71: TcdAiii-syn(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 71: TcdAiii-syn

Val Ser Gln Gly Ser Gly Ser Ala Gly Ser Gly Asn Asn Asn LeuVal Ser Gln Gly Ser Gly Ser Ala Gly Ser Gly Asn Asn Asn Leu

1 5 10 151 5 10 15

Ala Phe Gly Ala GlyAla Phe Gly Ala Gly

2020

(2) INFORMATION FOR SEQ ID NO:72:(2) INFORMATION FOR SEQ ID NO: 72:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:72: 160 kDa - Hb(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 72: 160 kDa-Hb

Met Gln Asp Ser Pro Glu Val Ala Ile Thr Thr LeuMet Gln Asp Ser Pro Glu Val Ala Ile Thr Thr Leu

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:73:(2) INFORMATION FOR SEQ ID NO: 73:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 8 amino acids(A) LENGTH: 8 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:73: 170 kDa - WIR(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 73: 170 kDa-WIR

Met Gln Arg Ser Ser Glu Val SerMet Gln Arg Ser Ser Glu Val Ser

1 51 5

(2) INFORMATION FOR SEQ ID NO:74:(2) INFORMATION FOR SEQ ID NO: 74:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:74: 180 kDa - H9(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 74: 180 kDa-H9

Met Gln Asp Ile Pro Glu Val Gln Leu AsnMet Gln Asp Ile Pro Glu Val Gln Leu Asn

1 5 101 5 10

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:75: 170 kDa - Hm(2)(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 75: 170 kDa-Hm (2)

INFORMATION FOR SEQ ID NO:75:INFORMATION FOR SEQ ID NO: 75:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

Met Gln Asp Ser Pro Glu Val Ser Val Thr Gln AsnMet Gln Asp Ser Pro Glu Val Ser Val Thr Gln Asn

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:76:(2) INFORMATION FOR SEQ ID NO: 76:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:76: 74 kDa - H9(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 76: 74 kDa-H9

Ser Glu Ser Leu Phe Thr Gln Ser Leu Lys Glu Ala Arg Arg AspSer Glu Ser Leu Phe Thr Gln Ser Leu Lys Glu Ala Arg Arg Asp

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:77:(2) INFORMATION FOR SEQ ID NO: 77:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 14 amino acids(A) LENGTH: 14 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:77: 71 kDa - Hb(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 77: 71 kDa-Hb

Met Asn Leu Ile Glu Ala Lys Leu Gln Glu Asn Arg Asp AlaMet Asn Leu Ile Glu Ala Lys Leu Gln Glu Asn Arg Asp Ala

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:78:(2) INFORMATION FOR SEQ ID NO: 78:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:78: 170 kDa - H9(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 78: 170 kDa-H9

Met Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg AspMet Leu Ser Thr Met Glu Lys Gln Leu Asn Glu Ser Gln Arg Asp

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:79:(2) INFORMATION FOR SEQ ID NO: 79:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:79: 109 kDa - Hm(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 79: 109 kDa-Hm

Met Leu Asp Ile Met Glu Lys Gln Leu Asn Glu Ser Glu Arg AspMet Leu Asp Ile Met Glu Lys Gln Leu Asn Glu Ser Glu Arg Asp

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:80:(2) INFORMATION FOR SEQ ID NO: 80:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 8 amino acids(A) LENGTH: 8 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:80: 170 kDa - WX-1(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 80: 170 kDa-WX-1

Met Gln Asp Ser Arg Glu Val SerMet Gln Asp Ser Arg Glu Val Ser

1 51 5

(2) INFORMATION FOR SEQ ID NO:81:(2) INFORMATION FOR SEQ ID NO: 81:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 12 amino acids(A) LENGTH: 12 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:81: 69 kDa - H9(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 81: 69 kDa-H9

Leu Arg Ser Ala Xxx Ser Ala Leu Thr Thr Leu LeuLeu Arg Ser Ala Xxx Ser Ala Leu Thr Thr Leu Leu

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:82:(2) INFORMATION FOR SEQ ID NO: 82:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:82: 64 kDa - HP88(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 82: 64 kDa-HP88

Leu Lys Leu Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn ValLeu Lys Leu Ala Asp Asn Gly Tyr Phe Asn Glu Pro Leu Asn Val

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:83:(2) INFORMATION FOR SEQ ID NO: 83:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:83: 70 kDa - NC-1(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 83: 70 kDa-NC-1

Leu Lys Leu Ala Asp Asn Ser Tyr Phe Asn Glu Pro Leu AsnLeu Lys Leu Ala Asp Asn Ser Tyr Phe Asn Glu Pro Leu Asn

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:84:(2) INFORMATION FOR SEQ ID NO: 84:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:84: 60 kDa - WIR(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 84: 60 kDa-WIR

Ser Lys Asp Glu Ser Lys Ala Asp Ser Gln Leu Val Tyr His ThrSer Lys Asp Glu Ser Lys Ala Asp Ser Gln Leu Val Tyr His Thr

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:85:(2) INFORMATION FOR SEQ ID NO: 85:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 14 amino acids(A) LENGTH: 14 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:85: 58 kDa - NC-1(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 85: 58 kDa-NC-1

Met Lys Lys Arg Gly Leu Thr Thr Asn Ala Gly Ala Pro ValMet Lys Lys Arg Gly Leu Thr Thr Asn Ala Gly Ala Pro Val

1 5 101 5 10

(2) INFORMATION FOR SEQ ID NO:86:(2) INFORMATION FOR SEQ ID NO: 86:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:86: 60 kDa - WX-12(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 86: 60 kDa-WX-12

Met Leu Asn Pro Ile Val Arg Lys Phe Glu Tyr Gly Glu His ThrMet Leu Asn Pro Ile Val Arg Lys Phe Glu Tyr Gly Glu His Thr

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:87:(2) INFORMATION FOR SEQ ID NO: 87:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:87: 60 kDa - Hm(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 87: 60 kDa-Hm

Ala Glu Ile Tyr Asn Lys Asp Gly Asn Lys Leu Asp Leu Tyr GlyAla Glu Ile Tyr Asn Lys Asp Gly Asn Lys Leu Asp Leu Tyr Gly

1 5 10 151 5 10 15

(2) INFORMATION FOR SEQ ID NO:88:(2) INFORMATION FOR SEQ ID NO: 88:

(i) SEQUENCE CHARACTERISTICS:(i) SEQUENCE CHARACTERISTICS:

(A) LENGTH: 15 amino acids(A) LENGTH: 15 amino acids

(B) TYPE: amino acid(B) TYPE: amino acid

(C) STRANDEDNESS: single(C) STRANDEDNESS: single

(D) TOPOLOGY: linear(D) TOPOLOGY: linear

(ii) MOLECULAR TYPE: protein(ii) MOLECULAR TYPE: protein

(v) FRAGMENT TYPE: N-terminal(v) FRAGMENT TYPE: N-terminal

(xi) SEQUENCE DESCRIPTION: SEQ ID NO:88: 140 kDa - Hm(xi) SEQUENCE DESCRIPTION: SEQ ID NO: 88: 140 kDa-Hm

Asn Leu Ile Glu Ala Thr Leu Glu Gln Asn Leu Arg Asp AlaAsn Leu Ile Glu Ala Thr Leu Glu Gln Asn Leu Arg Asp Ala

1 5 10 151 5 10 15

Claims (99)

곤충에 대하여 작용 활성을 갖는 포토랍두스 (Photorhabdus) 단백질 독소의 유효량을 포함하는 조성물.A composition comprising an effective amount of a Photorhabdus protein toxin having a functional activity against an insect. 제1항에 있어서, 포토랍두스 독소가포토랍두스의 정제된 배양물, 유전자전환 식물, 바쿨로바이러스, 또는 이종 미생물 숙주에 의해 생산되는 조성물.The composition of claim 1, wherein the photolabduus toxin is produced by a purified culture of photolapus, a transgenic plant, a baculovirus, or a heterologous microbial host. 제2항에 있어서, 포토랍두스 독소가포토랍두스 루미네센스(P. luminescens)의 정제된 배양물에 의해 생산되는 조성물.The method of claim 2, wherein the toxin is a photo picture drawer Douce drawer Douce luminescent composition produced by a culture of purified (P. luminescens). 제2항에 있어서, 독소가 ATCC 55397로 지정된포토랍두스 루미네센스균주의 정제된 배양물로부터 생산되는 조성물.The composition of claim 2, wherein the toxin is produced from a purified culture of photolabduum luminescence strain designated ATCC 55397. 제2항에 있어서, 독소가 W-14로 지정된포토랍두스 루미네센스균주의 정제된 배양물에 의해 생산되는 조성물.3. The composition of claim 2, wherein the toxin is produced by purified culture of photolabduum luminescence strain designated W-14. 제1항에 있어서, 독소가 WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX-11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC# 43948, ATCC# 43949, ATCC# 43950, ATCC# 43951, ATCC# 43952, DEP1, DEP2, DEP3, 피. 지알란드리카, 피. 헤피알루스, HB-Arg, HB 오스웨고, HB 레위스톤, K-122, HMGD, 인디커스, GD, PWH-5, 메기디스, HF-85, 에이. 카우스, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL55, GL217 또는 GL257로 지정된포토랍두스균주의 정제된 배양물에 의해 생산되는 조성물.The method of claim 1, wherein the toxin is WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX- 11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC # 43948, ATCC # 43949, ATCC # 43950, ATCC # 43951, ATCC # 43952, DEP1, DEP2, DEP3, p. Giallanda Rica, p. Hepialus, HB-Arg, HB Oswego, HB Leviston, K-122, HMGD, Indicus, GD, PWH-5, Megidis, HF-85, A. Cowes, MP1, MP2, MP3, MP4 , MP5, GL98, GL101, GL138, GL55, GL217, or GL257 picture specified by the drawer Douce produced by a purified culture of a strain composition. 제2항에 있어서, 독소가 WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX-11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC# 43948, ATCC# 43949, ATCC# 43950, ATCC# 43951, ATCC# 43952, DEP1, DEP2, DEP3, 피. 지알란드리카, 피.헤피알루스, HB-Arg, HB 오스웨고, HB 레위스톤, K-122, HMGD, 인디커스, GD, PWH-5, 메기디스, HF-85, 에이. 카우스, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL55, GL217 또는 GL257로 지정된포토랍두스 루미네센스균주의 정제된 배양물로부터 생산되는 조성물.The method of claim 2, wherein the toxin is WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX- 11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC # 43948, ATCC # 43949, ATCC # 43950, ATCC # 43951, ATCC # 43952, DEP1, DEP2, DEP3, p. Zilandrica, P. Hepialus, HB-Arg, HB Oswego, HB Leviston, K-122, HMGD, Indicus, GD, PWH-5, Megidis, HF-85, A. A composition produced from a purified culture of photolabduum luminescence strains designated as cowes, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL55, GL217 or GL257. 제1항에 있어서, 독소가 서열 12의 아미노산 서열로 표시되는 조성물.The composition of claim 1, wherein the toxin is represented by the amino acid sequence of SEQ ID NO: 12. 제6항에 있어서, 조성물이포토랍두스의 정제된 배양물들로부터 생산된 하나 이상의 독소의 혼합물인 조성물.The method of claim 6, wherein the composition of the mixture composition of one or more toxins produced from cultured waters purification picture drawer Douce. 제1항 또는 제6항에 있어서, 곤충이 나비목 (Lepidoptera), 딱정벌레목 (Coleoptera), 벌목 (Hymenoptera), 파리목 (Diptera), 방시목 (Dictyoptera), 응애목 (Acarina) 또는 동시목 (Homoptera)인 조성물.The method of claim 1 or claim 6, wherein the insect is Lepidoptera (Lepidoptera), Coleoptera (Coleoptera), logging (Hymenoptera), Diptera (Diptera), room simok (Dictyoptera), mites neck (Acarina) or the same time the neck (Homoptera) Phosphorus composition. 제1항 또는 제6항에 있어서, 곤충종이 딱정벌레목에 속하며, 써던 옥수수 뿌리벌레, 웨스턴 옥수수 뿌리벌레, 콜로라도 감자 딱정벌레, 밀웜, 볼 바구미 또는 잔디 땅벌레인 조성물.7. The composition of claim 1 or 6, wherein the insect species belong to the coleoptera and are southern corn rootworm, western corn rootworm, colorado potato beetle, wheat worm, ball weevil or grass grub. 제1항 또는 제6항에 있어서, 곤충종이 나비목에 속하며, 사탕무 행렬구더기, 블랙 야도충, 양배추 자벌레, 코들링 나방, 옥수수 귀벌레, 유럽 옥수수 천공충, 박각시나방 또는 회색담배나방인 조성물.7. A composition according to claim 1 or 6, wherein the insect species belong to Lepidoptera and are beetle maggots, black beetles, cabbage beetle, codling moths, corn beetles, European corn borer, horned moth or gray tobacco moth. 제1항 또는 제6항에 있어서, 독소가 분무성 살충제로서 제형화되는 조성물.7. The composition of claim 1 or 6, wherein the toxin is formulated as a spray pesticide. 제1항 또는 제6항에 있어서, 독소가 미끼 매트릭스로서 제형화되고 지상 또는 지하 미끼 스테이션에 전달되는 조성물.7. The composition of claim 1 or 6, wherein the toxin is formulated as a bait matrix and delivered to the above ground or underground bait station. 포토랍두스속의 정제된 박테리아 배양물에 의해 생산된, 곤충에 대해 작용 활성을 갖는 단백질 독소의 유효량을 곤충에 경구적으로 전달하는 것을 포함하는 곤충 방제 방법. A method for controlling insects comprising orally delivering to the insect an effective amount of a protein toxin having a functional activity against the insect, produced by the purified bacterial culture of the genus Photorapdus . 제15항에 있어서, 박테리아가포토랍두스 루미네센스의 정제된 배양물인 방법.The method of claim 15, wherein the bacterium is a purified culture of photolabduum luminescence . 제15항에 있어서, 독소가 ATCC 55397로 지정된포토랍두스 루미네센스균주의 정제된 배양물로부터 생산되는 방법.16. The method of claim 15, wherein the toxin is produced from a purified culture of photolabduum luminescence strain designated ATCC 55397. 제16항에 있어서, 독소가 W-14로 지정된포토랍두스 루미네센스균주의 정제된 배양물로부터 생산되는 방법.17. The method of claim 16, wherein the toxin is produced from a purified culture of photolabduus luminescence strain designated W-14. 제15항에 있어서, 독소가 WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX-11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC# 43948, ATCC# 43949, ATCC# 43950, ATCC# 43951, ATCC# 43952, DEP1, DEP2, DEP3, 피. 지알란드리카, 피.헤피알루스, HB-Arg, HB 오스웨고, HB 레위스톤, K-122, HMGD, 인디커스, GD, PWH-5, 메기디스, HF-85, 에이. 카우스, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL55, GL217 또는 GL257로 지정된포토랍두스균주의 정제된 배양물로부터 생산되는 방법.The method of claim 15, wherein the toxin is WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX- 11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC # 43948, ATCC # 43949, ATCC # 43950, ATCC # 43951, ATCC # 43952, DEP1, DEP2, DEP3, p. Zilandrica, P. Hepialus, HB-Arg, HB Oswego, HB Leviston, K-122, HMGD, Indicus, GD, PWH-5, Megidis, HF-85, A. Cowes, MP1, method of production from a culture purified in picture drawer Douce strain designated as MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL55, GL217 , or GL257. 제15항에 있어서, 독소가 WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX-11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC# 43948, ATCC# 43949, ATCC# 43950, ATCC# 43951, ATCC# 43952, DEP1, DEP2, DEP3, 피. 지알란드리카, 피.헤피알루스, HB-Arg, HB 오스웨고, HB 레위스톤, K-122, HMGD, 인디커스, GD, PWH-5, 메기디스, HF-85, 에이. 카우스, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL155, GL217 또는 GL257로 지정된포토랍두스 루미네센스균주의 정제된 배양물로부터 생산되는 방법.The method of claim 15, wherein the toxin is WX-1, WX-2, WX-3, WX-4, WX-5, WX-6, WX-7, WX-8, WX-9, WX-10, WX- 11, WX-12, WX-14, WX-15, H9, Hb, Hm, HP88, NC-1, W30, WIR, B2, ATCC # 43948, ATCC # 43949, ATCC # 43950, ATCC # 43951, ATCC # 43952, DEP1, DEP2, DEP3, p. Zilandrica, P. Hepialus, HB-Arg, HB Oswego, HB Leviston, K-122, HMGD, Indicus, GD, PWH-5, Megidis, HF-85, A. The method is produced from purified culture of Photorabdus luminescence strains designated as Kaus, MP1, MP2, MP3, MP4, MP5, GL98, GL101, GL138, GL155, GL217 or GL257. 제19항에 있어서, 하나 이상의 독소의 혼합물이포토랍두스의 정제된 배양물로부터 생산되고 상기 독소가 곤충에 경구적으로 전달되는 방법.20. The method of claim 19, wherein the mixture of one or more toxins is produced from a purified culture of photolabose and the toxins are delivered orally to insects. 제15항에 있어서, 독소가 독소를 코딩하는 유전자로 형질전환된 원핵세포 숙주에 의해 생산되는 방법.The method of claim 15, wherein the toxin is produced by a prokaryotic host transformed with a gene encoding the toxin. 제15항에 있어서, 독소가 독소를 코딩하는 유전자로 형질전환된 진핵세포 숙주에 의해 생산되는 방법.The method of claim 15, wherein the toxin is produced by a eukaryotic host transformed with a gene encoding the toxin. 제23항에 있어서, 진핵세포 숙주가 바쿨로바이러스인 방법.The method of claim 23, wherein the eukaryotic host is baculovirus. 제15항 또는 제19항에 있어서, 곤충이 나비목, 딱정벌레목, 벌목, 파리목, 방시목, 응애목 또는 동시목인 조성물.20. The composition according to claim 15 or 19, wherein the insect is lepidoptera, coleoptera, felling, fly, rapeseed, mite or simulane. 제15항 또는 제19항에 있어서, 곤충종이 딱정벌레목에 속하며, 써던 옥수수 뿌리벌레, 웨스턴 옥수수 뿌리벌레, 콜로라도 감자 딱정벌레, 밀웜, 볼 바구미 또는 잔디 땅벌레인 방법.20. The method of claim 15 or 19, wherein the insect species belong to the coleopteran and are southern corn rootworm, western corn rootworm, Colorado potato beetle, wheat worm, ball weevil or grass grub. 제15항 또는 제19항에 있어서, 곤충종이 나비목에 속하며, 사탕무 행렬구더기, 블랙 야도충, 양배추 자벌레, 코들링 나방, 옥수수 귀벌레, 유럽 옥수수 천공충, 박각시나방 또는 회색담배나방인 방법.20. The method of claim 15 or 19, wherein the insect species belong to Lepidoptera and are beetle maggots, black beetles, cabbage beetle, codling moths, corn beetles, European corn borer, horned moth or gray tobacco moth. 제15항 또는 제19항에 있어서, 독소가 분무성 살충제로서 제형화되는 방법.The method of claim 15 or 19, wherein the toxin is formulated as a spray pesticide. 제15항 또는 제19항에 있어서, 독소가 미끼 매트릭스로서 제형화되고 지상 또는 지하 미끼 스테이션에 전달되는 방법.20. The method of claim 15 or 19, wherein the toxin is formulated as a bait matrix and delivered to the above ground or underground bait station. 포토랍두스또는포토랍두스 루미네센스로부터 유전 물질을 분리하기 위해 사용되는, 서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7, 서열 8, 서열 9, 서열 10, 서열 13, 서열 14, 서열 15, 서열 16, 서열 17, 서열 18, 서열 19, 서열 20, 서열 21, 서열 22, 서열 23, 서열 24, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 62, 서열 72, 서열 73, 서열 74, 서열 75, 서열 76, 서열 77, 서열 78, 서열 79, 서열 80, 서열 81, 서열 82, 서열 83, 서열 84, 서열 85, 서열 86, 서열 87 및 서열 88로 이루어진 군 중에서 선택된 아미노산 서열의 DNA 코딩 영역의 적어도 일부에 상응하는 적어도 하나의 RNA 또는 DNA 올리고뉴클레오티드 분자를 제작하는 단계를 포함하는 단백질 서브유닛을 코딩하는 유전자의 단리 방법.SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, used to separate genetic material from Portobactus or Portobactus luminescence SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40 , SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 62, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84. A protein subunit comprising constructing at least one RNA or DNA oligonucleotide molecule corresponding to at least a portion of a DNA coding region of an amino acid sequence selected from the group consisting of SEQ ID NO: 85, SEQ ID NO: 86, SEQ ID NO: 87, and SEQ ID NO: 88; Isolation Method of Gene Coding. 5' 에서 3' 프로모터, 단백질을 코딩하는 DNA 서열 및 전사 터미네이터를 갖는 키메릭 DNA 구조물을 제작한 다음 키메릭 DNA 구조물을 숙주내로 전달하는 것을 포함하는,포토랍두스속의 정제된 박테리아 배양물에 의해 생산되는 단백질을 원핵세포 또는 진핵세포 숙주내에서 단백질이 곤충에 대해 작용 활성을 가질 수 있는 유효량으로 발현시키는 방법.By purified bacterial culture of the genus Photorapdus comprising constructing a chimeric DNA construct having a 5 'to 3' promoter, a DNA sequence encoding a protein, and a transcription terminator and then delivering the chimeric DNA construct into a host A method of expressing a protein to be produced in a prokaryotic or eukaryotic host in an effective amount such that the protein can have a functional activity against insects. 제31항에 있어서, 단백질이 딱정벌레목, 나비목, 파리목, 동시목, 벌목, 방시목 및 응애목으로 이루어진 군 중에서 선택된 곤충에 대해 작용 활성을 갖는 방법.32. The method of claim 31, wherein the protein has agonistic activity against insects selected from the group consisting of coleoptera, lepidoptera, fly, colo, lumber, locust and mite. 제31항에 있어서, DNA 서열에 의해 코딩되는 단백질이 서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7, 서열 8, 서열 9, 서열 10, 서열 13, 서열 14, 서열 15, 서열 16, 서열 17, 서열 18, 서열 19, 서열 20, 서열 21, 서열 22, 서열 23, 서열 24, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 62, 서열 72, 서열 73, 서열 74, 서열 75, 서열 76, 서열 77, 서열 78, 서열 79, 서열 80, 서열 81, 서열 82, 서열 83, 서열 84, 서열 85, 서열 86, 서열 87 및 서열 88로 이루어진 군 중에서 선택된 N-말단 아미노산 서열을 갖는 방법.The method of claim 31, wherein the protein encoded by the DNA sequence is SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42 , SEQ ID NO: 43, SEQ ID NO: 62, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 86, SEQ ID NO: 87 and SEQ ID NO: 88 having a N-terminal amino acid sequence selected from the group consisting of. 제31항에 있어서, DNA 서열에 의해 코딩되는 단백질이 서열 12, 서열 26, 서열 28, 서열 30, 서열 32, 서열 34, 서열 35, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59 및 서열 61로 이루어진 군 중에서 선택된 아미노산 서열을 포함하는 방법.The protein of claim 31, wherein the protein encoded by the DNA sequence is SEQ ID NO: 12, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, A method comprising an amino acid sequence selected from the group consisting of SEQ ID NO: 57, SEQ ID NO: 59, and SEQ ID NO: 61. 숙주내에서 활성인 5' 에서 3' 전사 프로모터; 곤충에 대해 작용 활성을 갖는 포토랍두스 단백질을 코딩하는 DNA 서열; 및 전사 터미네이터를 포함하는, 원핵세포 또는 진핵세포 숙주내 발현에 적합한 키메릭 DNA 구조물.5 'to 3' transcriptional promoters active in the host; A DNA sequence encoding a photolabduus protein having a functional activity against an insect; And a chimeric DNA construct suitable for expression in a prokaryotic or eukaryotic host, including a transcription terminator. 제35항에 있어서, DNA 서열에 의해 코딩되는 단백질이 서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7, 서열 8, 서열 9, 서열 10, 서열 13, 서열 14, 서열 15, 서열 16, 서열 17, 서열 18, 서열 19, 서열 20, 서열 21, 서열 22, 서열 23, 서열 24, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 62, 서열 72, 서열 73, 서열 74, 서열 75, 서열 76, 서열 77, 서열 78, 서열 79, 서열 80, 서열 81, 서열 82, 서열 83, 서열 84, 서열 85, 서열 86, 서열 87 및 서열 88로 이루어진 군 중에서 선택된 N-말단 아미노산 서열을 갖는 키메릭 DNA 구조물.The method of claim 35, wherein the protein encoded by the DNA sequence is SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19, SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42 , SEQ ID NO: 43, SEQ ID NO: 62, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: A chimeric DNA construct having an N-terminal amino acid sequence selected from the group consisting of 86, SEQ ID NO: 87, and SEQ ID NO: 88. 제35항에 있어서, DNA 서열에 의해 코딩되는 단백질이 서열 12, 서열 26, 서열 28, 서열 30, 서열 32, 서열 34, 서열 35, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59 및 서열 61로 이루어진 군 중에서 선택된 아미노산 서열을 갖는 키메릭 DNA 구조물.The method of claim 35, wherein the protein encoded by the DNA sequence is SEQ ID NO: 12, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, A chimeric DNA construct having an amino acid sequence selected from the group consisting of SEQ ID NO: 57, SEQ ID NO: 59, and SEQ ID NO: 61. 제35항에 있어서,포토랍두스 루미네센스단백질을 코딩하는 DNA 서열이 서열 11, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 46, 서열 48, 서열 50, 서열 52, 서열 54, 서열 56, 서열 58 및 서열 60으로 이루어진 군 중에서 선택되는 키메릭 DNA 구조물. 36. The method of claim 35, wherein the DNA sequence encoding the photolapid luminescence protein is SEQ ID NO: 11, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: A chimeric DNA construct selected from the group consisting of 54, SEQ ID NO: 56, SEQ ID NO: 58, and SEQ ID NO: 60. 제35항에 있어서, 숙주가 바쿨로바이러스 또는 식물 세포인 키메릭 DNA 구조물.36. The chimeric DNA construct of claim 35 wherein the host is a baculovirus or plant cell. 포토랍두스속의 박테리아에 의해 생산되고 곤충에 대해 작용 활성을 갖는 단백질의 유효량을 코딩할 수 있는 DNA 분자를 포함하는, 단리되고 실질적으로 정제된 제제.An isolated and substantially purified formulation comprising a DNA molecule produced by a bacterium in the genus Photorapdus and capable of encoding an effective amount of a protein having a functional activity against insects. 제40항에 있어서, 박테리아가포토랍두스 루미네센스인 제제.41. The formulation according to claim 40, wherein the bacterium is photolabose luminescence . 서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7, 서열 8, 서열 9, 서열 10, 서열 13, 서열 14, 서열 15, 서열 16, 서열 17, 서열 18, 서열 19, 서열 20, 서열 21, 서열 22, 서열 23, 서열 24, 서열 36, 서열 37, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 62, 서열 72, 서열 73, 서열 74, 서열 75, 서열 76, 서열 77, 서열 78, 서열 79, 서열 80, 서열 81, 서열 82, 서열 83, 서열 84, 서열 85, 서열 86, 서열 87 및 서열 88로 이루어진 군 중에서 선택된 N-말단 아미노산 서열을 갖는,포토랍두스또는포토랍두스 루미네센스에 의해 생산된 단백질을 포함하는 정제된 제제.SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 , SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 36, SEQ ID NO: 37, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 62, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: N- selected from the group consisting of 74, SEQ ID NO: 75, SEQ ID NO: 76, SEQ ID NO: 77, SEQ ID NO: 78, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 86, SEQ ID NO: 87, and SEQ ID NO: 88. A purified formulation comprising a protein produced by Photorabdus or Photorabdus luminescence having a terminal amino acid sequence. 서열 1, 서열 2, 서열 3, 서열 4, 서열 5, 서열 6, 서열 7, 서열 8, 서열 9, 서열 10, 서열 13, 서열 14, 서열 15, 서열 16, 서열 17, 서열 18, 서열 19, 서열 20, 서열 21, 서열 22, 서열 23, 서열 24, 서열 38, 서열 39, 서열 40, 서열 41, 서열 42, 서열 43, 서열 62, 서열 72, 서열 73, 서열 74, 서열 75, 서열 76, 서열 77, 서열 78, 서열 79, 서열 80, 서열 81, 서열 82, 서열 83, 서열 84, 서열 85, 서열 86, 서열 87 및 서열 88로 이루어진 군 중에서 선택된 N-말단 아미노산 서열을 갖는 단백질을 포함하는 정제된 단백질 제제.SEQ ID NO: 1, SEQ ID NO: 2, SEQ ID NO: 3, SEQ ID NO: 4, SEQ ID NO: 5, SEQ ID NO: 6, SEQ ID NO: 7, SEQ ID NO: 8, SEQ ID NO: 9, SEQ ID NO: 10, SEQ ID NO: 13, SEQ ID NO: 14, SEQ ID NO: 15, SEQ ID NO: 16, SEQ ID NO: 17, SEQ ID NO: 18, SEQ ID NO: 19 , SEQ ID NO: 20, SEQ ID NO: 21, SEQ ID NO: 22, SEQ ID NO: 23, SEQ ID NO: 24, SEQ ID NO: 38, SEQ ID NO: 39, SEQ ID NO: 40, SEQ ID NO: 41, SEQ ID NO: 42, SEQ ID NO: 43, SEQ ID NO: 62, SEQ ID NO: 72, SEQ ID NO: 73, SEQ ID NO: 74, SEQ ID NO: 75, SEQ ID NO: A protein having an N-terminal amino acid sequence selected from the group consisting of 76, SEQ ID NO: 78, SEQ ID NO: 78, SEQ ID NO: 79, SEQ ID NO: 80, SEQ ID NO: 81, SEQ ID NO: 82, SEQ ID NO: 83, SEQ ID NO: 84, SEQ ID NO: 85, SEQ ID NO: 86, SEQ ID NO: 87, and SEQ ID NO: 88; Purified protein formulation comprising a. 서열 12, 서열 26, 서열 28, 서열 30, 서열 32, 서열 34, 서열 35, 서열 47, 서열 49, 서열 51, 서열 53, 서열 55, 서열 57, 서열 59 및 서열 61로 이루어진 군 중에서 선택된 단백질을 포함하는 정제된 단백질 제제.A protein selected from the group consisting of SEQ ID NO: 12, SEQ ID NO: 26, SEQ ID NO: 28, SEQ ID NO: 30, SEQ ID NO: 32, SEQ ID NO: 34, SEQ ID NO: 35, SEQ ID NO: 47, SEQ ID NO: 49, SEQ ID NO: 51, SEQ ID NO: 53, SEQ ID NO: 55, SEQ ID NO: 57, SEQ ID NO: 59, and SEQ ID NO: 61 Purified protein formulation comprising a. 천연 숙주로부터 단리된, 서열 11, 서열 25, 서열 27, 서열 29, 서열 31, 서열 33, 서열 46, 서열 48, 서열 50, 서열 52, 서열 54, 서열 56, 서열 58 및 서열 60으로 이루어진 군 중에서 선택된 DNA 서열을 포함하는 정제된 DNA 제제.A group consisting of SEQ ID NO: 11, SEQ ID NO: 25, SEQ ID NO: 27, SEQ ID NO: 29, SEQ ID NO: 31, SEQ ID NO: 33, SEQ ID NO: 46, SEQ ID NO: 48, SEQ ID NO: 50, SEQ ID NO: 52, SEQ ID NO: 54, SEQ ID NO: 56, SEQ ID NO: 58, and SEQ ID NO: 60 isolated from the native host Purified DNA preparation comprising a DNA sequence selected from among. 18 kDa 내지 약 230 kDa; 약 160 kDa 내지 약 230 kDa; 100 kDa 내지 약 160 kDa; 약 80 kDa 내지 약 100 kDa; 또는 약 50 kDa 내지 약 80 kDa의 대략적인 분자량을 갖는 적어도 하나의 서브유닛을 갖는포토랍두스 루미네센스단백질을 포함하는 정제된 단백질 제제.18 kDa to about 230 kDa; About 160 kDa to about 230 kDa; 100 kDa to about 160 kDa; About 80 kDa to about 100 kDa; Or a purified protein preparation comprising photolabose luminescence protein having at least one subunit having an approximate molecular weight of about 50 kDa to about 80 kDa. 약 280 kDa의 대략적인 분자량을 갖는 적어도 하나의 서브유닛을 갖는포토랍두스 루미네센스단백질을 포함하는 정제된 단백질 제제.Purified protein formulation comprising a photolapose luminescence protein having at least one subunit having an approximate molecular weight of about 280 kDa. ATCC 55397을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising ATCC 55397. 제48항에 있어서, 배양물이 곤충에 대해 작용 활성을 갖는 단백질 독소를 생산하는 ATCC 55397의 변종인 배양물.49. The culture of claim 48 wherein the culture is a variant of ATCC 55397 that produces protein toxins having functional activity against insects. 곤충에 대해 작용 활성을 갖는 포토랍두스 단백질의 유효량을 발현하는 능력을 식물에 부여하는 키메릭 인공 유전자 구조물을 그의 게놈내에 포함하는 유전자전환 식물.A transgenic plant comprising in its genome a chimeric artificial genetic construct that confers on a plant the ability to express an effective amount of a photolapose protein having an action activity against an insect. 제50항에 있어서, 식물이 미립자 상에 피복된 유전 물질의 세포내로의 직접적인 도입촉진, 아그로박테리아 (Agrobacteria) 기법, 휘스커스 기법 또는 일렉트로포레이션 기법을 사용하여 형질전환되는 유전자전환 식물.51. The transgenic plant of claim 50, wherein the plant is transformed using direct promotion of the genetic material coated on the microparticles into cells, Agrobacteria technique, Whisker technique or electroporation technique. 제50항에 있어서, 선택 마커가 카나마이신, 네오마이신, 글리포세이트, 히그로마이신, 메토트렉세이트, 포스피노트리신(비알로포스), 클로로술푸론, 브로목시닐, 달라폰 등으로 이루어진 군 중에서 선택되는 유전자전환 식물.51. The method of claim 50, wherein the selection marker is selected from the group consisting of kanamycin, neomycin, glyphosate, hygromycin, methotrexate, phosphinothricin (bialophos), chlorosulfuron, bromocinyl, dalapon, and the like. The transgenic plant of choice. 제50항에 있어서, 프로모터가 옥토핀 신타제, 노팔린 신타제, 만노핀 신타제, 35S, 19S, 35T, 리불로스-1,6-비스포스페이트(RUBP) 카르복실라제의 작은 서브유닛(ssu), 베타-콘글리시닌, 파제올린, 알코올 데하이드로게나제(ADH), 열 쇽크, 유비퀴틴, 제인, 올레오신, 나핀 또는 아실 캐리어 단백질(ACP)로 이루어진 군 중에서 선택되는 유전자전환 식물.51. The small subunit of claim 50, wherein the promoter is an octopin synthase, nopalin synthase, mannofin synthase, 35S, 19S, 35T, ribulose-1,6-bisphosphate (RUBP) carboxylase. ), Beta-conglycinin, pazeolin, alcohol dehydrogenase (ADH), heat shank, ubiquitin, zein, oleosin, napin or acyl carrier protein (ACP). 제50항에 있어서, 배아 조직, 칼루스 조직 유형 Ⅰ 또는 Ⅱ, 배축조직, 분열조직 또는 탈분화중의 식물 조직이 유전자전환 식물을 제조하는데 사용되는 유전자전환 식물.51. The transgenic plant of claim 50, wherein an embryonic tissue, callus tissue type I or II, embryonic tissue, meristem, or plant tissue during dedifferentiation is used to make the transgenic plant. 제50항에 있어서, 키메릭 유전자가 곤충에 대해 작용 활성을 갖는 포토랍두스 단백질을 코딩하는 DNA 서열이고, 유전자의 적어도 하나의 코돈이 식물에 바람직한 코돈으로 변형된 유전자전환 식물.51. The transgenic plant of claim 50, wherein the chimeric gene is a DNA sequence encoding a photolabdus protein having a functional activity against an insect, wherein at least one codon of the gene is modified with a codon desired for the plant. 곤충이 섭취하는 유전자전환 식물에 의해 생산된 단백질 독소의 유효량을 곤충에게 경구적으로 전달하는 것을 포함하는 곤충 방제 방법.An insect control method comprising orally delivering an effective amount of a protein toxin produced by a transgenic plant to be consumed by the insect. 포토랍두스속의 정제된 박테리아 배양물로부터의 정제된 DNA 서열을 포함하는 물질의 조성물. Picture drawer compositions of matter comprising a purified DNA sequence from a purified bacterial culture of the genus Douce. H9를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising H9. Hb를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising Hb. Hm을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising Hm. HP88을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HP88. NC-1를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising NC-1. W30을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising W30. WIR을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising WIR. B2를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising B2. 피. 지알란드리카를 포함하는 실질적으로 순수한 미생물 배양물. blood. Substantially pure microbial culture comprising giallandica . 피. 헤피알루스를 포함하는 실질적으로 순수한 미생물 배양물. blood. Substantially pure microbial culture comprising Hepialus . HB-Arg를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HB-Arg. HB 오스웨고를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HB Oswego. HB 레위스톤을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HB Levistone. K-122을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising K-122. HMGD을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HMGD. 인디커스를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising indicus. GD을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GD. PWH-5을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising PWH-5. 메기디스를 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising megidis. HF-85을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising HF-85. 에이. 카우스를 포함하는 실질적으로 순수한 미생물 배양물.a. Substantially pure microbial culture comprising a cow. MP1을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising MP1. MP2을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising MP2. MP3을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising MP3. MP4을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising MP4. MP5을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising MP5. GL98을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL98. GL155을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL155. GL101을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL101. GL138을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL138. GL217을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL217. GL257을 포함하는 실질적으로 순수한 미생물 배양물.Substantially pure microbial culture comprising GL257. a) 6개 이상의 아미노산인 단백질의 단편을 단리하고,a) isolating fragments of proteins that are at least six amino acids, b) 상기 단백질 단편으로 포유류 종을 면역화시키고,b) immunizing a mammalian species with said protein fragment, c) 상기 포유류 종의 비장으로부터 작용 활성을 갖는 단백질 단편에 대한 항체 또는 그를 함유하는 혈청을 회수하는 것을 포함하는, 엔테로박테라카애 과의 박테리아에 의해 제조된 작용 활성을 갖는 단백질의 일부인 단백질 단편에 대한 항체를 제조하는 방법.c) a protein fragment which is part of a protein having a functional activity produced by a bacterium of the Enterobacteraeaceae, comprising recovering an antibody or a serum containing the protein fragment having a functional activity from the spleen of the mammalian species. Method for preparing an antibody. 제90항에 있어서, 상기 단백질 단편이 서열 63, 서열 64, 서열 65, 서열 66, 서열 67, 서열 68, 서열 69, 서열 70 및 서열 71로 이루어진 군 중에서 선택되는 방법.91. The method of claim 90, wherein said protein fragment is selected from the group consisting of SEQ ID NO: 63, SEQ ID NO: 64, SEQ ID NO: 65, SEQ ID NO: 66, SEQ ID NO: 67, SEQ ID NO: 68, SEQ ID NO: 69, SEQ ID NO: 70, and SEQ ID NO: 71. 제90항에 있어서, 상기 박테리아가포토랍두스속인 방법.The method of claim 90, wherein the bacteria are cheated picture drawer Douce. 제90항에 있어서, 상기 박테리아가포토랍두스 루미네센스인 방법.91. The method of claim 90, wherein said bacterium is photolabose luminescence . a) 30개 이상의 뉴클레오티드를 갖는 DNA 서열의 단편을 단리하고,a) isolating fragments of DNA sequence having at least 30 nucleotides, b) 방사성 또는 화학제제로 상기 DNA 단편을 표지하고,b) labeling said DNA fragment with radioactive or chemical agents, c) 엔테로박테라카애 cDNA 또는 엔테로박테라카애 게놈 라이브러리인 DNA 라이브러리에 상기 DNA 단편을 하이브리드시키고,c) hybridizing said DNA fragment to a DNA library that is an enterobacteraeca cDNA or enterobactercae genome library, d) 작용 활성을 갖는 단백질을 코딩하는 라이브러리의 DNA에 하이브리드된 단편을 선별하는 것을 포함하는 엔테로박테라카애 과의 박테리아에 의해 생산된 작용 활성을 갖는 단백질의 일부를 코딩하는 DNA 단편의 선별 방법.d) A method of selecting a DNA fragment encoding a portion of a protein having a functional activity produced by a bacterium of the bacterium Enterobacteraea comprising selecting a fragment hybridized to a DNA of a library encoding a protein having a functional activity. 제94항에 있어서, 상기 박테리아가포토랍두스속인 방법.The method of claim 94, wherein the bacteria are cheated picture drawer Douce. 제95항에 있어서, 상기 박테리아가포토랍두스 루미네센스인 방법.97. The method of claim 95, wherein said bacterium is photolabose luminescence . a) 12개 이상의 뉴클레오티드를 갖는 DNA 단편인 둘 이상의 프라이머를 단리하고,a) isolating at least two primers that are DNA fragments having at least 12 nucleotides, b) 단계 a)의 프라이머를 사용하여, 폴리머라제 연쇄 중합반응 기법으로 엔테로박테라카애 유래의 DNA 단편을 증폭하여, 상기 DNA 단편을 정제하고,b) using the primer of step a) to amplify the DNA fragment derived from Enterobacterae by polymerase chain polymerization technique, to purify the DNA fragment, c) 상기 정제된 DNA 단편을 방사성 또는 화학 제제로 표지하고,c) labeling the purified DNA fragment with a radioactive or chemical agent, d) 엔테로박테라카애 cDNA 또는 엔테로박테라카애 게놈 라이브러리인 DNA 라이브러리에 상기 정제된 DNA 단편을 하이브리드시키고,d) hybridizing the purified DNA fragment to a DNA library that is an Enterobactercae cDNA or Enterobactercae genome library, e) 상기 라이브러리로 부터 정제된 DNA 단편과 동일하거나 더 큰 크기의 DNA 단편을 선별하는 것을 포함하며, 여기서 선별된 DNA 단편 또는 그의 일부는 작용 활성을 갖는 단백질을 코딩하는 것인 엔테로박테라카애 과의 박테리아에 의해 생산된 작용 활성을 갖는 단백질의 일부를 코딩하는 DNA 단편을 선별하는 방법.e) selecting DNA fragments of the same or larger size than the purified DNA fragments from said library, wherein the selected DNA fragment or portion thereof encodes a protein having a functional activity. A method of selecting a DNA fragment encoding a portion of a protein having a functional activity produced by the bacteria of. 제97항에 있어서, 상기 박테리아가포토랍두스속인 방법.The method of claim 97, wherein the bacteria are cheated picture drawer Douce. 제98항에 있어서, 상기 박테리아가포토랍두스 루미네센스인 방법.99. The method of claim 98, wherein said bacterium is photolapux luminescence .
KR1019990701698A 1996-08-29 1997-05-05 Insecticidal Protein Toxins from Photorhabdus KR20000037116A (en)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US08/705,484 1996-08-28
US70548496A 1996-08-29 1996-08-29
US74369996A 1996-11-06 1996-11-06
US08/743,699 1996-11-06
WOPCT/US1996/18003 1996-11-06
PCT/US1996/018003 WO1997017432A1 (en) 1995-11-06 1996-11-06 Insecticidal protein toxins from photorhabdus

Publications (1)

Publication Number Publication Date
KR20000037116A true KR20000037116A (en) 2000-07-05

Family

ID=27107515

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1019990701698A KR20000037116A (en) 1996-08-29 1997-05-05 Insecticidal Protein Toxins from Photorhabdus

Country Status (11)

Country Link
EP (1) EP0970185A4 (en)
JP (1) JP2000515024A (en)
KR (1) KR20000037116A (en)
AR (1) AR007133A1 (en)
AU (1) AU2829997A (en)
CA (1) CA2263819A1 (en)
IL (1) IL128590A0 (en)
SK (1) SK24699A3 (en)
TR (1) TR199901126T2 (en)
TW (1) TW509722B (en)
WO (1) WO1998008932A1 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012169699A1 (en) * 2011-06-09 2012-12-13 경북대학교 산학협력단 Novel insecticidal protein, composition for controlling pests and method for controlling pests using same
KR101246707B1 (en) * 2012-08-01 2013-03-25 ㈜엠알이노베이션 Nematocide compound containing photorhabdus temperata subsp. temperata

Families Citing this family (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK0915909T3 (en) * 1997-05-05 2007-10-08 Dow Agrosciences Llc Insecticidal protein toxins from Xenorhabdus
EP1054972A2 (en) * 1998-02-20 2000-11-29 Novartis Pharma AG. Insecticidal toxins from photorhabdus
US6281413B1 (en) 1998-02-20 2001-08-28 Syngenta Participations Ag Insecticidal toxins from Photorhabdus luminescens and nucleic acid sequences coding therefor
US6174860B1 (en) 1999-04-16 2001-01-16 Novartis Ag Insecticidal toxins and nucleic acid sequences coding therefor
AUPP911399A0 (en) * 1999-03-10 1999-04-01 Commonwealth Scientific And Industrial Research Organisation Plants and feed baits for controlling damage
EP1069134A1 (en) * 1999-07-15 2001-01-17 Wisconsin Alumni Research Foundation Photorhabdus luminescens strains
AR025097A1 (en) * 1999-08-11 2002-11-06 Dow Agrosciences Llc TRANSGENIC PLANTS EXPRESSING THE PHOTORHABDUS TOXIN
AU7461900A (en) * 1999-09-02 2001-03-26 Agresearch Limited Nucleotide sequences
FR2803592A1 (en) 2000-01-06 2001-07-13 Aventis Cropscience Sa NOVEL DERIVATIVES OF 3-HYDROXYPICOLINIC ACID, PROCESS FOR THEIR PREPARATION AND FUNGICIDAL COMPOSITIONS CONTAINING SAME
US6639129B2 (en) 2000-03-24 2003-10-28 Wisconsin Alumni Research Foundation DNA sequences from photorhabdus luminescens
FR2815969B1 (en) 2000-10-30 2004-12-10 Aventis Cropscience Sa TOLERANT PLANTS WITH HERBICIDES BY METABOLIC BYPASS
CN100497378C (en) 2002-03-22 2009-06-10 拜尔生物科学公司 Novel bacillus thuringiensis insecticidal proteins
GB0212423D0 (en) * 2002-05-29 2002-07-10 Univ Bath Toxin Genes and uses thereof
WO2004002223A2 (en) 2002-06-28 2004-01-08 Dow Agrosciences Llc Pesticidally active proteins and polynucleotides obtainable from paenibacillus species
WO2004067750A2 (en) 2003-01-21 2004-08-12 Dow Agrosciences Llc Xenorhabdus tc proteins and genes for pest control
BRPI0406856A (en) 2003-01-21 2005-12-27 Dow Agrosciences Llc Mixture and compatibility of tc proteins for pest control
ES2435079T3 (en) 2005-07-08 2013-12-18 Universidad Nacional Autonoma De Mexico Instituto New bacterial proteins with pesticide activity
US9057072B2 (en) 2009-11-24 2015-06-16 Katholieke Universiteit Leuven, K.U. Leuven R&D Banana promoters
BR112012015706A2 (en) 2009-12-23 2015-09-01 Bayer Ip Gmbh Hppd inhibitor herbicide tolerant plants
CN102770531A (en) 2009-12-23 2012-11-07 拜尔知识产权有限公司 Plants tolerant to HPPD inhibitor herbicides
CA2785211C (en) 2009-12-23 2018-12-11 Bayer Intellectual Property Gmbh Plants tolerant to hppd inhibitor herbicides
EP2516632B1 (en) 2009-12-23 2018-02-14 Bayer Intellectual Property GmbH Plants tolerant to hppd inhibitor herbicides
AR079972A1 (en) 2009-12-23 2012-03-07 Bayer Cropscience Ag TOLERANT PLANTS TO INHIBITING HERBICIDES OF HPPD
US20120311743A1 (en) 2010-02-02 2012-12-06 Bayer Cropscience Ag Soybean transformation using hppd inhibitors as selection agents
ES2588802T3 (en) 2010-11-10 2016-11-04 Bayer Cropscience Ag HPPD variants and usage procedures
AU2012234449B2 (en) 2011-03-25 2016-05-12 Bayer Intellectual Property Gmbh Use of N-(tetrazol-4-yl)- or N-(triazol-3-yl)arylcarboxamides or their salts for controlling unwanted plants in areas of transgenic crop plants being tolerant to hppd inhibitor herbicides
JP5847920B2 (en) 2011-03-25 2016-01-27 バイエル・インテレクチュアル・プロパティ・ゲゼルシャフト・ミット・ベシュレンクテル・ハフツングBayer Intellectual Property GmbH Use of N- (1,2,5-oxadiazol-3-yl) benzamide to control unwanted plants in the area of transgenic crop plants that are resistant to HPPD inhibitor herbicides
EP3683307A3 (en) 2012-09-14 2020-07-29 BASF Agricultural Solutions Seed US LLC Hppd variants and methods of use
CN110172466A (en) 2013-03-07 2019-08-27 巴斯夫农业解决方案种子美国有限责任公司 Toxin gene and its application method
CA2942171C (en) 2014-03-11 2023-05-09 Bayer Cropscience Lp Hppd variants and methods of use
AU2016319093B2 (en) 2015-09-11 2022-11-03 BASF Agricultural Solutions Seed US LLC HPPD variants and methods of use
EP3544991A1 (en) 2016-11-23 2019-10-02 BASF Agricultural Solutions Seed US LLC Axmi669 and axmi991 toxin genes and methods for their use
KR20190095411A (en) 2016-12-22 2019-08-14 바스프 아그리컬쳐럴 솔루션즈 시드 유에스 엘엘씨 Use of CR14 for the control of nematode pests
CA3049775A1 (en) 2017-01-18 2018-07-26 BASF Agricultural Solutions Seed US LLC Bp005 toxin gene and methods for its use
BR112019014720A2 (en) 2017-01-18 2020-04-07 BASF Agricultural Solutions Seed US LLC methods to confer disease resistance on a plant and to increase yield on a plant
BR112019018056A2 (en) 2017-03-07 2020-08-11 BASF Agricultural Solutions Seed US LLC recombinant nucleic acid molecule, expression cassette, host cell, plants, transgenic seeds, recombinant polypeptide, methods for checking tolerance and for controlling weeds, utility product and use of the nucleotide sequence
WO2019083808A1 (en) 2017-10-24 2019-05-02 Basf Se Improvement of herbicide tolerance to hppd inhibitors by down-regulation of putative 4-hydroxyphenylpyruvate reductases in soybean
US11279944B2 (en) 2017-10-24 2022-03-22 BASF Agricultural Solutions Seed US LLC Of herbicide tolerance to 4-hydroxyphenylpyruvate dioxygenase (HPPD) inhibitors by down-regulation of HPPD expression in soybean
CN110338153B (en) * 2019-07-15 2021-08-03 杭州森康林业科技有限公司 Pine wood nematode polypide fixing method for microinjection
JP2022541612A (en) 2019-07-22 2022-09-26 バイエル、アクチエンゲゼルシャフト 5-Amino substituted pyrazoles and triazoles as insecticides
KR20220038402A (en) 2019-07-23 2022-03-28 바이엘 악티엔게젤샤프트 Novel heteroaryl-triazole compounds as pesticides
JP2022541807A (en) 2019-07-23 2022-09-27 バイエル・アクチエンゲゼルシヤフト Novel heteroaryl-triazole compounds as pesticides
EP3701796A1 (en) 2019-08-08 2020-09-02 Bayer AG Active compound combinations
EP4034656A1 (en) 2019-09-26 2022-08-03 Bayer Aktiengesellschaft Rnai-mediated pest control
US20220361492A1 (en) 2019-10-02 2022-11-17 Bayer Aktiengesellschaft Active compound combinations comprising fatty acids
KR20220079905A (en) 2019-10-09 2022-06-14 바이엘 악티엔게젤샤프트 Novel heteroaryl-triazole compounds as pesticides
UY38911A (en) 2019-10-09 2021-05-31 Bayer Ag HETEROARYL-TRIAZOLE COMPOUNDS AS PESTICIDES, FORMULATIONS, USES AND METHODS OF USE OF THEM
JP2023501978A (en) 2019-11-07 2023-01-20 バイエル・アクチエンゲゼルシヤフト Substituted Sulfonylamides for Animal Pest Control
WO2021097162A1 (en) 2019-11-13 2021-05-20 Bayer Cropscience Lp Beneficial combinations with paenibacillus
TW202134226A (en) 2019-11-18 2021-09-16 德商拜耳廠股份有限公司 Novel heteroaryl-triazole compounds as pesticides
WO2021099271A1 (en) 2019-11-18 2021-05-27 Bayer Aktiengesellschaft Active compound combinations comprising fatty acids
TW202136248A (en) 2019-11-25 2021-10-01 德商拜耳廠股份有限公司 Novel heteroaryl-triazole compounds as pesticides
MX2022009333A (en) 2020-01-31 2022-10-07 Pairwise Plants Services Inc Suppression of shade avoidance response in plants.
KR20220143072A (en) 2020-02-18 2022-10-24 바이엘 악티엔게젤샤프트 Heteroaryl-triazole compounds as pesticides
EP3708565A1 (en) 2020-03-04 2020-09-16 Bayer AG Pyrimidinyloxyphenylamidines and the use thereof as fungicides
CA3180157A1 (en) 2020-04-16 2021-10-21 Pairwise Plants Services, Inc. Methods for controlling meristem size for crop improvement
WO2021209490A1 (en) 2020-04-16 2021-10-21 Bayer Aktiengesellschaft Cyclaminephenylaminoquinolines as fungicides
KR20230007398A (en) 2020-04-21 2023-01-12 바이엘 악티엔게젤샤프트 2-(het)aryl-substituted condensed heterocyclic derivatives as pest control agents
AU2021265277A1 (en) * 2020-05-01 2022-12-08 Vestaron Corporation Insecticidal combinations
JP2023538713A (en) 2020-05-06 2023-09-11 バイエル、アクチエンゲゼルシャフト Pyridine(thio)amide as a fungicidal compound
TW202208347A (en) 2020-05-06 2022-03-01 德商拜耳廠股份有限公司 Novel heteroaryl-triazole compounds as pesticides
CN115605462A (en) 2020-05-12 2023-01-13 拜耳公司(De) Triazine and pyrimidine (thio) amides as fungicidal compounds
BR112022023550A2 (en) 2020-05-19 2023-01-03 Bayer Cropscience Ag AZABICYCLIC (THIO)AMIDES AS FUNGICIDAL COMPOUNDS
WO2021247477A1 (en) 2020-06-02 2021-12-09 Pairwise Plants Services, Inc. Methods for controlling meristem size for crop improvement
US20230278994A1 (en) 2020-06-04 2023-09-07 Bayer Aktiengesellschaft Heterocyclyl pyrimidines and triazines as novel fungicides
CA3186659A1 (en) 2020-06-10 2021-12-16 Bayer Aktiengesellschaft Azabicyclyl-substituted heterocycles as fungicides
UY39278A (en) 2020-06-17 2022-01-31 Pairwise Plants Services Inc MERISTEM SIZE CONTROL METHODS FOR CROP IMPROVEMENT
KR20230026388A (en) 2020-06-18 2023-02-24 바이엘 악티엔게젤샤프트 3-(pyridazin-4-yl)-5,6-dihydro-4H-1,2,4-oxadiazine derivatives as fungicides for crop protection
EP4167738A1 (en) 2020-06-18 2023-04-26 Bayer Aktiengesellschaft Composition for use in agriculture
UY39276A (en) 2020-06-19 2022-01-31 Bayer Ag USE OF 1,3,4-OXADIAZOL-2-ILPYRIMIDINE COMPOUNDS TO CONTROL PHYTOPATHOGENIC MICROORGANISMS, METHODS OF USE AND COMPOSITIONS.
UY39275A (en) 2020-06-19 2022-01-31 Bayer Ag 1,3,4-OXADIAZOLE PYRIMIDINES AS FUNGICIDES, PROCESSES AND INTERMEDIARIES FOR THEIR PREPARATION, METHODS OF USE AND USES OF THE SAME
WO2021255089A1 (en) 2020-06-19 2021-12-23 Bayer Aktiengesellschaft 1,3,4-oxadiazole pyrimidines and 1,3,4-oxadiazole pyridines as fungicides
BR112022025692A2 (en) 2020-06-19 2023-02-28 Bayer Ag 1,3,4-OXADIAZOLES AND THEIR DERIVATIVES AS FUNGICIDES
EP3929189A1 (en) 2020-06-25 2021-12-29 Bayer Animal Health GmbH Novel heteroaryl-substituted pyrazine derivatives as pesticides
BR112022026904A2 (en) 2020-07-02 2023-01-24 Bayer Ag HETEROCYCLENE DERIVATIVES AS PEST CONTROL AGENTS
WO2022033991A1 (en) 2020-08-13 2022-02-17 Bayer Aktiengesellschaft 5-amino substituted triazoles as pest control agents
WO2022053453A1 (en) 2020-09-09 2022-03-17 Bayer Aktiengesellschaft Azole carboxamide as pest control agents
WO2022058327A1 (en) 2020-09-15 2022-03-24 Bayer Aktiengesellschaft Substituted ureas and derivatives as new antifungal agents
EP3974414A1 (en) 2020-09-25 2022-03-30 Bayer AG 5-amino substituted pyrazoles and triazoles as pesticides
EP3915971A1 (en) 2020-12-16 2021-12-01 Bayer Aktiengesellschaft Phenyl-s(o)n-phenylamidines and the use thereof as fungicides
WO2022129190A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft (hetero)aryl substituted 1,2,4-oxadiazoles as fungicides
CN116669554A (en) 2020-12-18 2023-08-29 拜耳公司 Use of Dhodh inhibitors for controlling resistant phytopathogenic fungi in crops
WO2022129188A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft 1,2,4-oxadiazol-3-yl pyrimidines as fungicides
WO2022129196A1 (en) 2020-12-18 2022-06-23 Bayer Aktiengesellschaft Heterobicycle substituted 1,2,4-oxadiazoles as fungicides
EP4036083A1 (en) 2021-02-02 2022-08-03 Bayer Aktiengesellschaft 5-oxy substituted heterocycles as pesticides
CN112920261B (en) * 2021-02-02 2022-06-21 安徽农业大学 Preparation and application of tea polypeptide with antibacterial effect
BR112023015909A2 (en) 2021-02-11 2023-11-21 Monsanto Technology Llc METHODS AND COMPOSITIONS FOR MODIFYING CYTOKININ OXIDASE LEVELS IN PLANTS
US20220380792A1 (en) 2021-02-25 2022-12-01 Pairwise Plants Services, Inc Methods and compositions for modifying root architecture in plants
BR112023019400A2 (en) 2021-03-30 2023-12-05 Bayer Ag 3-(HETERO)ARYL-5-CHLORODIFLOROMETHYL-1,2,4-OXADIAZOLE AS A FUNGICIDE
BR112023019788A2 (en) 2021-03-30 2023-11-07 Bayer Ag 3-(HETERO)ARYL-5-CHLORODIFLOROMETHYL-1,2,4-OXADIAZOLE AS A FUNGICIDE
EP4334315A1 (en) 2021-05-06 2024-03-13 Bayer Aktiengesellschaft Alkylamide substituted, annulated imidazoles and use thereof as insecticides
WO2022238391A1 (en) 2021-05-12 2022-11-17 Bayer Aktiengesellschaft 2-(het)aryl-substituted condensed heterocycle derivatives as pest control agents
MX2023014775A (en) 2021-06-17 2024-01-15 Pairwise Plants Services Inc Modification of growth regulating factor family transcription factors in soybean.
UY39827A (en) 2021-06-24 2023-01-31 Pairwise Plants Services Inc MODIFICATION OF UBIQUITIN LIGASE E3 HECT GENES TO IMPROVE PERFORMANCE TRAITS
MX2023014883A (en) 2021-07-01 2024-02-12 Pairwise Plants Services Inc Methods and compositions for enhancing root system development.
CN118076742A (en) 2021-08-12 2024-05-24 成对植物服务股份有限公司 Modification of brassinolide receptor genes to improve yield traits
JP2024529148A (en) 2021-08-13 2024-08-01 バイエル、アクチエンゲゼルシャフト Active compound combinations and antifungal compositions containing them - Patents.com
EP4388110A1 (en) 2021-08-17 2024-06-26 Pairwise Plants Services, Inc. Methods and compositions for modifying cytokinin receptor histidine kinase genes in plants
CA3229873A1 (en) 2021-08-25 2023-03-02 Bayer Aktiengesellschaft Novel pyrazinyl-triazole compounds as pesticides
CA3230167A1 (en) 2021-08-30 2023-03-09 Pairwise Plants Services, Inc. Modification of ubiquitin binding peptidase genes in plants for yield trait improvement
EP4144739A1 (en) 2021-09-02 2023-03-08 Bayer Aktiengesellschaft Anellated pyrazoles as parasiticides
AR126938A1 (en) 2021-09-02 2023-11-29 Pairwise Plants Services Inc METHODS AND COMPOSITIONS TO IMPROVE PLANT ARCHITECTURE AND PERFORMANCE TRAITS
CA3232804A1 (en) 2021-09-21 2023-03-30 Pairwise Plants Services, Inc. Methods and compositions for reducing pod shatter in canola
EP4413127A1 (en) 2021-10-04 2024-08-14 Pairwise Plants Services, Inc. Methods for improving floret fertility and seed yield
EP4413022A2 (en) 2021-10-07 2024-08-14 Pairwise Plants Services, Inc. Methods for improving floret fertility and seed yield
EP4426677A1 (en) 2021-11-03 2024-09-11 Bayer Aktiengesellschaft Bis(hetero)aryl thioether (thio)amides as fungicidal compounds
EP4441049A1 (en) 2021-11-30 2024-10-09 Bayer Aktiengesellschaft Bis(hetero)aryl thioether oxadiazines as fungicidal compounds
AR127904A1 (en) 2021-12-09 2024-03-06 Pairwise Plants Services Inc METHODS TO IMPROVE FLOWER FERTILITY AND SEED YIELD
AR128372A1 (en) 2022-01-31 2024-04-24 Pairwise Plants Services Inc SUPPRESSION OF THE SHADE AVOIDANCE RESPONSE IN PLANTS
WO2023148031A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in cotton
WO2023148035A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in rice
WO2023148030A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in corn
WO2023148029A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in cereals
WO2023148036A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests in soybean
WO2023148028A1 (en) 2022-02-01 2023-08-10 Globachem Nv Methods and compositions for controlling pests
MX2024010647A (en) 2022-03-02 2024-09-06 Pairwise Plants Services Inc Modification of brassinosteroid receptor genes to improve yield traits.
AU2023243430A1 (en) 2022-03-31 2024-10-24 Pairwise Plants Services, Inc. Early flowering rosaceae plants with improved characteristics.
US20230357789A1 (en) 2022-04-07 2023-11-09 Pairwise Plants Services, Inc. Methods and compositions for improving resistance to fusarium head blight
US20230383305A1 (en) 2022-04-21 2023-11-30 Pairwise Plants Services, Inc. Methods and compositions for improving yield traits
US20230348922A1 (en) 2022-05-02 2023-11-02 Pairwise Plants Services, Inc. Methods and compositions for enhancing yield and disease resistance
WO2023213670A1 (en) 2022-05-03 2023-11-09 Bayer Aktiengesellschaft Crystalline forms of (5s)-3-[3-(3-chloro-2-fluorophenoxy)-6-methylpyridazin-4-yl]-5-(2-chloro-4-methylbenzyl)-5,6-dihydro-4h-1,2,4-oxadiazine
AU2023264210A1 (en) 2022-05-03 2024-10-31 Bayer Aktiengesellschaft Use of (5s)-3-[3-(3-chloro-2-fluorophenoxy)-6-methylpyridazin-4-yl]-5-(2-chloro-4-methylbenzyl)-5,6-dihydro-4h-1,2,4-oxadiazine for controlling unwanted microorganisms
WO2023215809A1 (en) 2022-05-05 2023-11-09 Pairwise Plants Services, Inc. Methods and compositions for modifying root architecture and/or improving plant yield traits
AR129709A1 (en) 2022-06-27 2024-09-18 Pairwise Plants Services Inc METHODS AND COMPOSITIONS TO MODIFY SHADE ESCAPE IN PLANTS
AR129749A1 (en) 2022-06-29 2024-09-25 Pairwise Plants Services Inc METHODS AND COMPOSITIONS FOR CONTROLLING MERISTEM SIZE FOR CROP IMPROVEMENT
US20240002873A1 (en) 2022-06-29 2024-01-04 Pairwise Plants Services, Inc. Methods and compositions for controlling meristem size for crop improvement
US20240043857A1 (en) 2022-08-04 2024-02-08 Pairwise Plants Services, Inc. Methods and compositions for improving yield traits
US20240060081A1 (en) 2022-08-11 2024-02-22 Pairwise Plants Services, Inc. Methods and compositions for controlling meristem size for crop improvement
US20240090466A1 (en) 2022-09-08 2024-03-21 Pairwise Plants Services, Inc. Methods and compositions for improving yield characteristics in plants
EP4295688A1 (en) 2022-09-28 2023-12-27 Bayer Aktiengesellschaft Active compound combination
WO2024068519A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068518A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-heteroaryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068520A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
WO2024068517A1 (en) 2022-09-28 2024-04-04 Bayer Aktiengesellschaft 3-(hetero)aryl-5-chlorodifluoromethyl-1,2,4-oxadiazole as fungicide
EP4385326A1 (en) 2022-12-15 2024-06-19 Kimitec Biogorup Biopesticide composition and method for controlling and treating broad spectrum of pests and diseases in plants
WO2024137438A2 (en) 2022-12-19 2024-06-27 BASF Agricultural Solutions Seed US LLC Insect toxin genes and methods for their use
WO2024137446A1 (en) 2022-12-19 2024-06-27 BASF Agricultural Solutions Seed US LLC Methods of identifying and evaluating genes for insect control
WO2024137445A1 (en) 2022-12-20 2024-06-27 BASF Agricultural Solutions Seed US LLC Methods of identifying and evaluating genes for insect control
WO2024173622A1 (en) 2023-02-16 2024-08-22 Pairwise Plants Services, Inc. Methods and compositions for modifying shade avoidance in plants
US20240294933A1 (en) 2023-03-02 2024-09-05 Pairwise Plants Services, Inc. Methods and compositions for modifying shade avoidance in plants
US20240301438A1 (en) 2023-03-09 2024-09-12 Pairwise Plants Services, Inc. Modification of brassinosteroid signaling pathway genes for improving yield traits in plants

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU675335B2 (en) * 1993-06-25 1997-01-30 Commonwealth Scientific And Industrial Research Organisation Toxin gene from xenorhabdus nematophilus
AU7513994A (en) * 1993-07-27 1995-02-28 Agro-Biotech Corporation Novel fungicidal properties of metabolites, culture broth, stilbene derivatives and indole derivatives produced by the bacteria (xenorhabdus) and (photorhabdus) spp.
GB9618083D0 (en) * 1996-08-29 1996-10-09 Mini Agriculture & Fisheries Pesticidal agents

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012169699A1 (en) * 2011-06-09 2012-12-13 경북대학교 산학협력단 Novel insecticidal protein, composition for controlling pests and method for controlling pests using same
KR101246707B1 (en) * 2012-08-01 2013-03-25 ㈜엠알이노베이션 Nematocide compound containing photorhabdus temperata subsp. temperata

Also Published As

Publication number Publication date
WO1998008932A1 (en) 1998-03-05
IL128590A0 (en) 2000-01-31
TR199901126T2 (en) 1999-07-21
CA2263819A1 (en) 1998-03-05
AR007133A1 (en) 1999-10-13
JP2000515024A (en) 2000-11-14
SK24699A3 (en) 2000-04-10
TW509722B (en) 2002-11-11
EP0970185A4 (en) 2003-02-26
EP0970185A1 (en) 2000-01-12
AU2829997A (en) 1998-03-19

Similar Documents

Publication Publication Date Title
KR100354530B1 (en) Insecticidal protein toxins from photolapidus
KR20000037116A (en) Insecticidal Protein Toxins from Photorhabdus
EP0915909B1 (en) Insecticidal protein toxins from xenorhabdus
EP2142009B1 (en) Hemipteran- and coleopteran- active toxin proteins from bacillus thuringiensis
KR20010082543A (en) Optimization of pest resistance genes using dna shuffling
JPH10506532A (en) Novel pesticidal proteins and strains
JPH07503845A (en) Peptides effective in killing insects
US7569748B2 (en) Nucleic acid encoding an insecticidal protein toxin from photorhabdus
US6528484B1 (en) Insecticidal protein toxins from Photorhabdus
JP2805448B2 (en) Insecticidal peptides
US20040138423A1 (en) Insecticidal compounds and methods for selection thereof
EP1130970B1 (en) Insecticidal agents
AU9712501A (en) Insecticidal protein toxins from photorhabdus
Francis et al. Detection of Xylella fastidiosa in insect vectors in California
KR19990071962A (en) Insecticide enzyme
UA82485C2 (en) Insecticide protein toxins from photorhabdus

Legal Events

Date Code Title Description
WITN Application deemed withdrawn, e.g. because no request for examination was filed or no examination fee was paid