CN1842592A - 赋予植物再分化能力的基因及其应用 - Google Patents

赋予植物再分化能力的基因及其应用 Download PDF

Info

Publication number
CN1842592A
CN1842592A CNA2004800222181A CN200480022218A CN1842592A CN 1842592 A CN1842592 A CN 1842592A CN A2004800222181 A CNA2004800222181 A CN A2004800222181A CN 200480022218 A CN200480022218 A CN 200480022218A CN 1842592 A CN1842592 A CN 1842592A
Authority
CN
China
Prior art keywords
leu
val
gly
ala
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2004800222181A
Other languages
English (en)
Other versions
CN100462435C (zh
Inventor
西村明日香
松冈信
芦苅基行
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Honda Motor Co Ltd
Nagoya University NUC
Original Assignee
Honda Motor Co Ltd
Nagoya University NUC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Honda Motor Co Ltd, Nagoya University NUC filed Critical Honda Motor Co Ltd
Publication of CN1842592A publication Critical patent/CN1842592A/zh
Application granted granted Critical
Publication of CN100462435C publication Critical patent/CN100462435C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • C12N15/821Non-antibiotic resistance markers, e.g. morphogenetic, metabolic markers
    • AHUMAN NECESSITIES
    • A01AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
    • A01HNEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
    • A01H4/00Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
    • A01H4/008Methods for regeneration to complete plants
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07HSUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
    • C07H21/00Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
    • C07H21/04Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8209Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0044Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Chemical & Material Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Developmental Biology & Embryology (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Botany (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Environmental Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明应用连锁分析成功地分离并鉴定到与植物的再生能力有关的基因。此外,本发明还公开了用于培育高再生性品种的方法、用于转化不可栽培品种的方法和用于选择转化细胞的方法,这些方法都应用了这些基因。本发明在例如栽培品种改良和使用转化方法的基因分析等领域中是有用的。

Description

赋予植物再分化能力的基因及其应用
技术领域
本发明涉及赋予植物再生能力的基因的分离和鉴定,以及应用这些基因提高再生能力和选择转化细胞的方法。本发明可使得植物的培养特性得到改良并可基于安全性方面的特别考虑而开发转化方法。
背景技术
在适当的条件下,分化的植物组织去分化并在经过细胞分裂后形成愈伤组织(去分化细胞群)。依赖于所述的条件,愈伤组织可以进一步再分化以再生为完整的植物体。这种分化细胞或去分化细胞再生为个体的能力被称为分化全能性,在1930-1950年代对烟草、番茄等的培养研究中最初证实了这一点。组织培养技术是基于这一分化全能性,且已被广泛应用,尤其是在植物育种方面。例如,组织培养技术已经被用于通过细胞融合和胚珠培养生产新品种、缩短育种年限和固定遗传特性。近年来,组织培养技术作为以基因功能分析为目的的人工基因转移(转化方法)中的关键技术已成为分子育种和植物的基础研究所必需的。
分化全能性通常被认为是所有植物都拥有的能力。事实上,已知对于某些植物来说展示这一能力是容易的,对于其它植物来说则是困难的,这取决于植物种类、品种或器官。与双子叶植物相比,单子叶植物包括主要农作物例如水稻、小麦和玉米的组织培养和再生是困难的,因此对于培养包括转化方法的分析而言,再三反复实验是必需的。在水稻中,已经利用特定品种的成熟种子确立了一个相对简单的培养系统,但是具有足够的再生能力的品种是有限的。特别地,可食品种例如Koshihikari和Sasanishiki,以及在热带地区广泛栽培的IR品系品种的再生能力低且通过组织培养再生为植物体困难。提高这些品种的再生能力将不仅对于选择育种和基因特性的研究有用,而且还有可能阐明再生过程的机制。此外,其它不可培养的植物种和品种的再生能力也可能得到提高。
此外,近年来已开发了大量经遗传修饰的农产品(GMO),且它们的栽培面积正逐年增加。同时,许多消费者担心这些农产品的安全性。在GMO的安全性问题的讨论中最主要的问题是它们掺入了抗生素抗性基因。因此,开发不使用抗生素抗性基因的转化方法将减轻目前消费者对GMO的担忧,同时作为无需昂贵的抗生素的简单转化方法对于研究人员可能也是有利的。
发明内容
再生能力取决于作为数量性状(QTL:数量性状基因座)的众多基因间的相互作用,但是迄今为止未有关于从那样的基因的基因座成功分离出具有再生能力的基因的报道。本发明的一个目的是分离和鉴定与植物的再生能力有关的基因、提供应用这些基因改良植物的方法以及应用这些基因作为选择标记的转化方法。
在繁殖用于检测具有再生能力的QTL的杂种群体之前,本发明人选择了将用做该杂种群体的亲本的品种。本发明人选择了在再生能力上有明显差异的两个品种:日本水稻(japonica rice)“Koshihikari”和印度水稻(indica rice)“Kasalath”(图1)。将这两个栽培种杂交产生F1个体,然后用Koshihikari作为回归亲本对它们进行回交,并进行自体受精。生成了BCF1群体的99个品系,并收集BC1F2种子。用每一品系的20粒BC1F2种子在诱导培养基中培养愈伤组织30天后,将生长的愈伤组织转移到再生培养基中并再培养30天。30天之后,测量每粒种子的愈伤组织重量和苗数,用每一品系的20粒种子测定平均值。该平均值被当作再生能力(图1)。采用262个PCR标记得出每一品系的基因型。当基于这些数据进行关于再生能力的QTL分析时,检出了4个具有再生能力增加效应的QTL(图2)。在其中一个QTL中,靠近1号染色体的短臂上的TGS2451标记(PSR1;苗再生启动子1)处,成功地发现Kasalath基因组在Koshihikari的再生能力上具有很大的增加效应(图2)。其次,为了鉴定出PSR1基因的大致基因座,从BC2F1群体中选择出其PSR1区域已被Kasalath的PSR1区域取代的30株个体,用来自这些个体的每一株的10粒种子(BC2F2种子)诱导产生愈伤组织。从生长的愈伤组织提取DNA以利用分子标记测定基因型,通过研究再生能力进行连锁分析。此外,为了对该基因座进行详细说明,采用分子标记对大约3,800粒其中PSR1被隔离的BC3F2种子进行基因型调查,并进行高分辨连锁分析。结果,发现PSR1定位于分子标记3132和P182间的大约50.8kb的区域(图3)。在该区域的基因预测表明在该区域存在4个基因,包括一假定的蛋白质。为了测定这些基因中的哪一个是具有再生能力的基因,构建了Kasalath BAC文库(平均长度120kb),通过PCR筛选分离出了一个包含PSR1区域(BHAL15)的BAC克隆。将位于BHAL15克隆中的合适的限制性酶切位点用以制备包含每一候选基因区域的Kasalath基因组片段,并将它们导入到Koshihikari中。结果发现仅当导入了包含被认为编码铁氧还蛋白亚硝酸还原酶(NiR)的基因的Kasalath基因组片段(图3中的3F)时,Koshihikari的再生能力才提高(图4)。铁氧还蛋白亚硝酸还原酶是一种亚硝酸还原酶,其利用铁氧还蛋白作为电子供体发挥功能,并具备将亚硝酸盐转换为氨的作用。测定了被认为是铁氧还蛋白亚硝酸还原酶基因的遗传区域及其大约2kb的上游区的核苷酸序列并与Kasalath和Koshihikari进行比较,在该核苷酸序列内发现了许多的突变(图5)此外,当通过半定量RT-PCR和实时定量PCR对位于愈伤组织中的这一基因的mRNA表达水平进行测定时,Kasalath中的mRNA的量大约是Koshihikari中的该量的2.5倍(图6中左侧照片的顶部和中部和右侧照片)。使用特异于NiR蛋白的抗体进行的Western印迹分析也表明该NiR蛋白在Kasalath中的储存量比在Koshihikari中的储存量更大(图6中左侧照片的底部)。此外,使用萘乙二胺法和在E.coli中表达的NiR重组蛋白比较每单位蛋白的NiR酶活性,Kasalath的NiR酶活性显示出高于Koshihikari的NiR酶活性大约1.6倍(图7)。上述结果表明Koshihikari和Kasalath之间在再生能力上的差异首先归因于两者在NiR基因的转录调节水平上的差异,其次归因于每分子该合成蛋白在活性上的差异。
将Kasalath PSR1基因的基因组区域导入中赋予了不能再生的Koshihikari以再生能力。这表明当转化Koshihikari时Kasalath PSR1基因可以被用做一个选择标记。更特别地,当将已同时插入了KasalathPSR1基因和一靶基因的载体导入到Koshihikari中时,仅已被导入了PSR1基因的那些细胞将获得再生能力,因此再生的植物体将同时具有被掺入的靶基因。为了证明这一观点,构建了携带有于pBI101二元载体的T-DNA区域中的Kasalath NiR基因组+35S启动子GUS、Kasalath NiR启动子∷NiR cDNA∷NiR终止子+35S启动子GUS、水稻Actin1启动子∷NiR cDNA∷NiR终止子+35S启动子GUS的载体和未携带NiR基因的载体,并将其导入到Koshihikari中。当导入3种类型的包含NiR基因的载体时,在所有情况下都获得了大量的再生个体,且在这些再生个体自其衍生而来的愈伤组织中观察到由于GUS基因所产生的着色(图8)。此外,NiR基因具有代谢对植物有毒性的亚硝酸的特性,应用这一特性也使得NiR基因能被用作高再生性品种的转化标记。更特别地,位于肌动蛋白启动子(该启动子是水稻中的一个高表达启动子)控制下的过表达NiR基因的载体被导入到一个高再生性的Kasalath品种中,并在添加有亚硝酸的培养基中进行培养,所添加的亚硝酸的浓度能抑制普通野生型的生长。只有被转化的细胞由于过表达的NiR基因的效应而生长,且GUS染色仅在这些生长的细胞中被观测到(图9)。这一选择方法的使用使得生产不使用衍生自微生物的抗生素抗性基因(转化细胞的选择标记)的更安全的重组植物成为可能,这被认为是传统的遗传修饰的农产品中的问题所在。此外,因为昂贵的抗生素是不必要的,开发转化体的费用被降低。
更特别地,本发明涉及提高植物再生能力的基因的分离和鉴定和通过应用这些基因提高植物的培养特性,以及使用这些基因作为选择标记的转化。本发明提供了下述[1]-[22]个方面:
[1]涉及植物的再生能力的DNA,其中所述DNA是(a)-(d)中的任一个:
(a)编码一种包含SEQ ID NO:3的氨基酸序列的蛋白质的DNA;
(b)包含SEQ ID NO:1或2的核苷酸序列的编码区的DNA;
(c)编码包含SEQ ID NO:3的氨基酸序列中的一个或多个氨基酸取代、缺失、添加和/或插入的氨基酸序列的蛋白质的DNA;和
(d)在严格条件下与包含SEQ ID NO:1或2的核苷酸序列的DNA杂交的DNA;
[2]编码包含SEQ ID NO:3的氨基酸序列的蛋白质的部分肽的DNA;
[3]包含SEQ ID NO:1或2的核苷酸序列的启动子区域的DNA;
[4]包含[1]或[2]的DNA的载体;
[5]包含[3]的DNA的载体;
[6]携带[4]的载体的宿主细胞;
[7]携带[4]的载体的植物细胞;
[8]包含[7]的植物细胞的植物转化体;
[9]是[8]的植物转化体的后代或克隆的植物转化体;
[10][8]或[9]的植物转化体的繁殖材料;
[11]一种用于制备植物转化体的方法,该方法包括将[1]或[2]的DNA导入植物细胞和从所述植物细胞再生植物的步骤;
[12]由[1]或[2]的DNA所编码的蛋白质;
[13]一种用于制备[12]的蛋白质的方法,该方法包括培养[6]所述的宿主细胞并从所述细胞或其培养物上清收集重组蛋白质的步骤;
[14]与[12]的蛋白质结合的抗体;
[15]包含至少15个与SEQ ID NO:1或2的核苷酸序列互补的连续核苷酸的多核苷酸,或与其互补的序列;
[16]一种用于提高植物的再生能力的方法,该方法包括在植物的细胞中表达[1]或[2]的DNA的步骤;
[17]一种用于改变植物的再生能力的制剂,该制剂包含[1]或[2]的DNA或[4]的载体做为活性成分;
[18]一种用于测定植物细胞的再生能力的方法,该方法包括检测[1]的DNA或[12]的蛋白质在植物细胞中的表达的步骤;
[19]一种用于测定植物细胞的再生能力的方法,该方法包括检测[12]的蛋白质在植物细胞中的活性的步骤;
[20]一种用于提高植物的再生能力的方法,该方法包括调节[12]的内源蛋白在该植物中的活性的步骤;
[21]一种用于选择转化的植物细胞的方法,该方法包括以下步骤:
(a)将包含用做选择标记的[1]或[2]的DNA的载体导入植物细胞中;和(b)培养所述植物细胞并选择已经获得再生能力的植物细胞;和
[22]一种用于改变植物的再生能力的方法,该方法包括通过杂交取代植物中的[1]或[2]的内源DNA的步骤。
本发明提供了编码水稻来源的NiR蛋白的DNA。“Kasalath”的基因组DNA的核苷酸序列示于SEQ ID NO:1中,“Kasalath”的cDNA的核苷酸序列示于SEQ ID NO:2中,由该DNA所编码的蛋白质的氨基酸序列示与SEQ ID NO:3中。“Koshihikari”的基因组DNA的核苷酸序列示于SEQ ID NO:4中,“Koshihikari”的cDNA的核苷酸序列示于SEQ ID NO:5中,由该DNA所编码的蛋白质的氨基酸序列示与SEQ ID NO:6中。
本发明表明了植物的再生能力可以通过调节PSR1基因在植物中的表达或活性而提高。这使得不可培养品种例如Koshihikari的培养成为可能,并使得生产稳定且高再生性的品种成为可能。
术语“再生能力的提高”在本发明中仅指在培养条件下植物的再生能力被提高,且再生个体的形式未改变。这一在再生能力上的提高使得可以将所期望的品种用于各种培养试验中,结果使得新品种和基因的功能性分析得到有效的发展。
在本发明中,术语“植物的PSR1基因”指编码植物的铁氧还蛋白亚硝酸还原酶的NiR基因。“植物的PSR1基因”包含水稻的PSR1基因(图5)和来源于其他植物的PSR1基因。编码本发明的PSR1蛋白的DNA包括基因组DNA、cDNA和化学合成的DNA。基因组DNA和cDNA可以根据本领域技术人员所熟知的常规方法制备。更特别的,基因组DNA可以例如按照如下制备:(1)从具有PSR1基因的水稻品种(例如Koshihikari)提取基因组DNA;(2)构建一个基因组文库(应用载体例如质粒、噬菌体、粘粒、BAC和PAC);(3)发展所述文库;和(4)用基于编码本发明的蛋白质的DNA(例如SEQID NO:1或2)制备的探针进行克隆杂交或噬菌斑杂交。或者,可以通过使用特异于编码本发明的蛋白质的DNA(例如SEQ ID NO:1或2)的引物进行PCR植被基因组DNA。另一方面,可以例如按照如下制备cDNA:(1)基于从具有PSR1基因的水稻品种(例如Koshihikari)提取的mRNA合成cDNA;(2)通过将该合成的cDNA插入到载体例如λZAP中制备一个cDNA文库;(3)发展所述cDNA文库;和(4)如上述进行克隆杂交或噬菌斑杂交。或者,也可以通过PCR制备cDNA。
本发明包括编码SEQ ID NO:3的PSR1蛋白的功能性等价物的蛋白(Kasalath)的DNA。在本申请中,术语“PSR1蛋白的功能性等价物”是指对目标蛋白的表达或活性的修饰使得再生能力提高。
这样的DNA的例子包括编码突变体、衍生物、等位基因、变异体和包含SEQ ID NO:3中一个或多个氨基酸被取代、删除、添加和/或插入的氨基酸序列的同源物的那些DNA。
本领域技术人员所熟知的用于制备编码包含被改变的氨基酸的DNA的方法的例子包括定点诱变(Kramer,W.和Fritz,H.-J.,(1987)“Oligonucleotide-directed construction of mutagenesis via gapped duplexDNA.”Methods in Enzymology,154:350-367)。蛋白质的氨基酸序列也可以在自然界中由于核苷酸序列的突变发生突变。编码其中具有一个或多个氨基酸被取代、缺失和/或添加的天然PSR1蛋白的氨基酸序列的蛋白质的DNA也包括在本发明的DNA中,只要它们编码与天然PSR1蛋白(SEQ ID NO:3)功能性等价的蛋白质。此外,不增加蛋白质的氨基酸序列的改变的核苷酸突变体(退行性突变体)也包括在本发明的DNA的范围内。
编码与SEQ ID NO:3中所述的PSR1蛋白的功能性等价性蛋白的DNA可以通过例如本领域技术人员所熟知的方法来制备,包括使用杂交技术的方法(Southern,E.M.,Journal of Molecular Biology,Vol.98,503,1975.)和聚合酶链式反应(PCR)技术(Saiki,R.K.et al.Science,vol.230,1350-1354,1985;Saiki,R.K.et al.Science,vol.239,487-491,1988)。也就是说,通过使用PSR1基因的核苷酸序列(SEQID NO:2)或其一部分作为探针,并使用与PSR1基因的核苷酸序列(SEQ ID NO:2)特异性杂交的寡核苷酸作为引物,从水稻和其他植物分离出与PSR1基因具有高度同源性的DNA对于本领域技术人员来说是很常规的。这样的可通过杂交技术或PCR技术获得的编码与PSR1蛋白功能性等价的蛋白质的DNA也包括在本发明的DNA的范围内。
优选在严格条件下进行杂交反应以分离这样的DNA。本发明的严格杂交条件包括例如6M尿素、0.4%SDS和0.5x SSC这样的条件,和那些产生相似的严格性的条件。期望当在具备较高的严格性的条件下,例如6M尿素、0.4%SDS、和0.1x SSC的条件下进行杂交时获得具有较高同源性的DNA。在这种条件下分离出的那些DNA被期望编码与PSR1蛋白(SEQ ID NO:3或6)具有高水平的氨基酸同源性蛋白质。在本申请中,高同源性的意思是在整个氨基酸序列上具有至少50%或更高的同一性,更优选70%或更高,更加优选90%或更高(例如95%、96%、97%、98%、99%或更高)。一条氨基酸序或核苷酸序列与另一条氨基酸序列或者核苷酸序列的同源性的程度可以遵循由Karlin和Altschul建立的BLAST算法进行测定(Proc.Natl.Acad.Sci.USA 87:2264-2268,1990;Proc.Natl.Acad.Sci.USA,90:5873,1993)。基于BLAST算法开发了例如BLASTN和BLASTX这样的程序(Altschul SF,et al.J.Mol.Biol.215:403,1990)。为了根据BLASTN对核苷酸序列进行测定,参数被设置为例如得分=100和字长=12。另一方面,用于通过BLASTX对氨基酸序列进行分析的参数包括例如得分=50和字长=3。当应用BLAST和缺口BLAST程序时,使用每一程序的缺省值。用于这种分析的特定技术是本领域中已知的。
可以按照如下评估某一特定的DNA是否编码与植物的再生能力有关的蛋白质。最为常规的方法包括检测DNA的功能,然后进行培养并对再生的能力进行调查。更特别低,所述方法包括在维持了DNA的功能的条件下和在DNA失去功能的条件下进行培养,并比较结果产生的再生能力。如果再生能力不发生变化或几乎相同,则该DNA与再生能力无关。当DNA与再生能力相关时,再生率被进一步提高,这一差别被认为是再生能力的程度。
本发明的DNA可以被用于例如制备重组蛋白和生产再生能力被改变的植物转化体。通常通过以下步骤制备重组蛋白:将编码本发明的蛋白质的DNA插入到一合适的表达载体中;将该载体导入到一合适的细胞中;培养该转化细胞;使得所述细胞能够表达所述重组蛋白并纯化所表达的蛋白质。重组蛋白可以与其他蛋白质一起作为融合蛋白被表达以使得能够容易地被纯化,例如作为与麦芽糖结合蛋白在大肠杆菌(Escherichia coli)中的融合蛋白(New England Biolabs,USA,Pmal载体系列)、作为与谷胱甘肽-S-转移酶(GST)的融合蛋白(Amersham Pharmacia Biotech,pGEX载体系列)或用组氨酸标签(Novagen,pET系列)。对宿主细胞没有限制,只要该细胞适于表达该重组蛋白即可。有可能利用酵母或各种动物、植物或昆虫细胞以及上述的大肠杆菌。可以通过多种本领域技术人员已知的方法将载体导入到宿主细胞当中。例如,利用钙离子的转化方法可以被用于将载体导入E.coli中(Mandel,M.和Higa,A.(1970)Journal of MolecularBiology,53,158-162,Hanahan,D.(1983)Journal of Molecular Biology,166,557-580)。在宿主细胞中表达的重组蛋白可以通过已知的方法进行纯化并从宿主细胞或其培养物上清进行回收。当重组蛋白作为与麦芽糖结合蛋白或其他配偶体(partner)的融合蛋白被表达时,所述重组蛋白能够通过亲合层析容易地被纯化。本发明的蛋白质可以从按照下述通过将本发明的DNA导入到植物中所产生的转化植物来制备。因此,如下述,本发明的转化植物不仅包括导入了本发明的DNA以改变其再生能力的植物,而且包括了导入了本发明的DNA以制备本发明的蛋白质的植物。
所得蛋白质可以用于制备与所述蛋白质结合的抗体。例如,可以通过用本发明的纯化蛋白或其一部分对免疫动物例如兔进行免疫、在一定时期后采集血液并除去血液凝块来制备多克隆抗体。可以通过将骨髓瘤细胞与被上述蛋白质或其一部分免疫的动物的抗体生成细胞相融合、分离表达所需抗体的单克隆细胞(杂交瘤)并从所述细胞除去回收所述抗体来制备单克隆抗体。所获得的抗体可以被用于纯化或检测本发明的蛋白质。因此,本发明包括了与本发明的蛋白质相结合的抗体。这些抗体的使用使得可以将与植物体的再生能力相关的蛋白质的表达位点区分出来,或能够测定某一植物种是否表达与再生能力相关的蛋白质。
当应用本发明的DNA来制备再生能力被提高的转化植物时,将编码本发明的蛋白质的DNA被插入到一合适的载体中,随后将该载体导入到植物细胞中。通过这些步骤所获得的转化的植物细胞随后被再生。导入了所述载体的植物细胞优选具有本发明的DNA的低表达的植物细胞。因此,术语“植物细胞”包括各种形式的植物细胞,例如悬浮培养细胞、原生质体、叶的切片(leaf sections)和愈伤组织。
对用于植物细胞转化的载体没有特别的限制,只要它们能在细胞中表达被插入的基因即可。实例包括“pBI121”、“pBI221”和“pBI101”质粒(全部来自Clontech)。
本发明的载体可以包含一个用于组成型或诱导型表达本发明的蛋白质的启动子。用于组成型表达的启动子的例子包括花椰菜花叶病毒的35S启动子(Odell et al.1985 Nature 313:810),水稻的肌动蛋白启动子(Zhang et al.1991 Plant Cell 3:1155)和玉米的遍在蛋白启动子(Comejo et al.1993 Plant Mol.Biol.23:567)。
用于诱导型表达的启动子的实例包括已知的由于外因启动表达的启动子,例如丝状真菌、细菌和病毒的感染和入侵、低温、高温、干燥、紫外线照射和特殊化合物的喷射。这样的启动子的实例包括通过丝状真菌、细菌和病毒的感染和入侵导入的几丁质基因启动子(Xuet al.1996 Plant Mol.Biol.30:387)和烟草PR蛋白基因启动子(Ohshima et al.1990 Plant Cell 2:95)、低温所诱导的水稻“lip19”基因启动子(Aguan et al.1993 Mol.Gen Genet.240:1)、高温所诱导的水稻″hsp 80″基因和″hsp 72″基因启动子(Van Breusegem et al.1994 Planta193:57)、干燥所诱导的拟南芥″rab 16″基因启动子(Nundy et al.,1990Proc.Natl.Acad.Sci.USA 87:1406)、紫外线照射所诱导的查耳酮合酶基因启动子(Schulze-Lefert et al.1989EMBO J.8:651)和厌氧条件所诱导的玉米乙醇脱氢酶基因启动子(Walker et al.,1987 Proc.Natl.Acad.Sci.USA 84:6624)。此外,水稻的几丁质基因启动子和烟草的PR蛋白基因启动子也能被特定的化合物例如水杨酸所诱导,″rab 16″也能通过喷射脱落酸,一种植物激素被诱导。
此外,所述载体可以包含编码本发明的蛋白质的DNA的启动子。编码本发明的蛋白质的DNA的启动子区域可以通过例如用包含SEQID NO:1或2的核苷酸序列或其一部分的DNA作为探针对基因组文库进行筛选获得。
此外,本发明提供了导入了本发明的载体的转化细胞。除了上述用于制备重组蛋白的细胞外,导入了本发明的载体的细胞包括用于制备转化植物的植物细胞。对于所述植物细胞的类型没有特殊的限制,其实例有拟南芥、水稻、玉米、马铃薯和烟草的细胞。除培养的细胞外,本发明的植物细胞包括植物中的细胞以及原生质体、shootprimordia、multiple shoots和发根(hairy root)中的细胞。可以通过已知的方法将载体导入植物细胞中,例如聚乙烯乙二醇方法、电穿孔、农杆菌介导的转移和微粒轰击。根据植物细胞的类型,可以通过已知的方法从转化的植物细胞再生植物(Toki et al.,(1995)Plant Physiol.100:1503-1507)。例如,用于水稻类植物的转化和再生方法包括:(1)用聚乙烯乙二醇将基因导入原生质体中并再生植物体(适于indica水稻品种)(Datta,S.K.(1995)in“Gene Transfer To Plants”,Potrykus Iand Spangenberg Eds.,pp66-74);(2)用电脉冲将基因导入原生质体中并再生植物体(适于japonica水稻品种)(Toki et al.(1992)Plant Physiol.100,1503-1507);(3)通过微粒轰击直接将基因导入细胞中并再生植物体(Christou et al.(1991)Bio/Technology,9:957-962);和(4)用农杆菌将基因导入并再生植物体(Hiei et al.(1994)Plant J.6:271-282)。这些方法是现有技术中已经建立起来的方法并被广泛地应用于本发明所属的技术领域中。这样的方法可以被适当地用于本发明。
已经获得了在其基因组中含有本发明的DNA的转化植物,因而有可能通过有性繁殖或无性繁殖获得该植物的后代。也有可能从所述植物或其后代或克隆获得繁殖材料(例如种子、果实、穗、块茎、块茎状的根、残株、愈伤组织、和原生质体)以基于这样的材料大量生产所述植物。因此,本发明包括导入了本发明的DNA的植物细胞、含有这些细胞的植物、这些植物的后代或克隆以及该植物及其后代和克隆的繁殖材料。
以这种方式制备的其再生能力被修饰的植物相对于野生型植物其再生能力和产量发生变化。例如,其中导入了位于水稻肌动蛋白启动子控制下的编码PSR1蛋白的DNA的植物被期望在其再生能力上有所提高。本发明的方法的使用可以提高水稻的再生能力,这对于农作物而言是有益的。本发明还有益于高再生型水稻品种的开发。
此外,本发明提供了包含与SEQ ID NO:1或2的核苷酸序列互补的至少15个连续核苷酸的多核苷酸或其互补序列。因此,术语“互补序列”是包含A:T和G:C碱基对的双链DNA的一条链的序列相对于另一条链的序列而言。术语“互补”不限制于某一序列与至少15个连续的核苷酸完全互补的情形,还包括其中核苷酸序列同一性为至少70%、优选至少80%、更优选90%、再更优选95%或更高(例如96%或更高、97%或更高、98%或更高、或99%或更高)。这些DNA作为探针有益于检测或分离本发明的DNA,和用做引物扩增所述DNA。
本发明还提供了用于测在植物中是否存在再生能力的遗传诊断方法。在本发明中,“测定在植物中是否存在再生能力”不仅对于测定迄今为止所栽培的品中是否存在再生能力是有效的,而且还包括了测定在通过杂交和遗传工程技术所制备的新品种中是否存在再生能力。这些方法对于测定japonica水稻品种中是否存在再生能力由其有效。
本发明的用于评估在植物中是否存在再生能力的方法包括检测编码PSR1蛋白的DNA和PSR1蛋白的植物表达水平。例如,如果编码PSR1的DNA或PSR1蛋白的表达水平高于在Koshihikari中的表达水平,则所检测的植物被测定为是拥有再生能力的一个品种。
本发明提供了用于在植物的转化中将PSR1基因作为选择标记的方法。先前被用作转化的植物细胞的选择标记基因的实例包括提供对抗生素潮霉素的抗性的潮霉素磷酸转移酶基因、提供对卡那霉素或庆大霉素的抗性的新霉素磷酸转移酶、提供对除草剂膦丝菌素的抗性的乙酰转移酶基因和提供对双丙氨膦(bialaphos)的抗性的双丙氨膦抗性基因。当使用这些基因时,通过在一种已知的选择培养基中进行培养获得转化的植物细胞,所述选择性培养基包含一种与选择标记基因的类型匹配的选择剂。当将PSR1基因而不是这些药物抗性基因用作选择标记时,如果待转化的植物细胞不具备再生能力,如在Koshihikari中,可以使用所获得的再生能力作为选择性状对转化体进行选择,而不使用用于选择的特殊制剂。也就是说,由于非转化体不能够再生,由于PSR1基因的效应而再生的个体被假定为转化体。此外,当使用PSR1基因作为具有再生能力的植物细胞的选择标记时,可以通过向选择培养基中添加一定浓度的亚硝酸盐对具有再生能力的转化细胞进行选择,该亚硝酸盐将抑制非转化体的生长。上述被用于选择转化体的常规药物抗性基因衍生自微生物;因此,保留了这些抗性基因的经遗传修饰的农产品(GMO)已经增加了人们对于其对生态系统和人体所产生的副作用的担忧。但是,使用本发明的PSR1基因用于选择转化体的方法在减轻此类担忧和开发廉价的遗传修饰农作物方面具有优势。
本申请中所引用的所有现有技术文献通过引用合并到本发明中。
附图说明
图1是表示Koshihikari和Kasalath的基因型的一组照片。左侧的照片表示Koshihikari,右侧的照片表示Kasalath。该图将Koshihikari和Kasalath的再生能力用每克愈伤组织的再生个体数表示。
图2表示染色体上的再生能力QTL的位置。
图3表示再生能力QTL的高精度连锁图谱。
图4是表示互补测验结果的一组照片。左侧的照片表示当载体被单独插入Koshihikari中时的结果,右侧照片表示当Kasalat的3F片段被插入到Koshihikari中时发生的再生。
图5表示与Koshihikari NiR基因组序列相比Kasalath NiR基因组的突变位点。示意图中的阿拉伯数字表示插入或缺失的核苷酸数目。黑框表示编码区。垂直线表示取代位点。加外框部分表示在Koshihikari(顶部)和Kasalath(底部)中的NiR基因序列的比较。框内围住的部分表示Koshihikari和Kasalath间的不同氨基酸。粗斜体所示区域表示叶绿体转运肽结构域,虚线下划线所示区域表示铁氧还蛋白结合域,下划线部分表示4Fe-4S簇。
图6是一组照片和比较Koshihikari和Kasalath的愈伤组织中的NiR基因和NiR蛋白的表达水平的图。在左侧照片中,顶部的一行表示由半定量RT-PCR所检测到的NiR基因,中间一行表示用做表达对照组并由定量RT-PCR所检测到的水稻遍在蛋白1基因(Rubq1),底部一行表示使用NiR蛋白抗体进行的Western印迹杂交所检测到的NiR蛋白。右侧图表示将Rubq1基因的表达水平用做内标通过实时定量RT-PCR测量NiR基因的表达水平的结果。RT-PCR引物位点示于图5中。
图7是比较Koshihikari和Kasalath NiR重组蛋白的酶活性的图。
图8是一张示意图和一组表示用于确认NiR基因作为选择标记的效力的试验结果的照片。该示意图表示用于转化的二元载体的T-DNA区域。照片表示当每一载体被导入Koshihikari中时的再生状态。表格表示再生个体中GUS-染色个体的比例。
图9是显示当由于肌动蛋白启动子而过表达NiR基因的载体被导入Kasalath中时,选择愈伤组织的结果的照片。顶部的照片表示愈伤组织选择的结果。由于亚硝酸盐被添加到培养基中,转化体“a”由于过表达的NiR基因效应而生长,而非转化体“b”的愈伤组织生长被抑制。底部的照片表示愈伤组织“a”和“b”的GUS染色结果。
具体实施方式
本发明将用以下实施例进行详细描述,但其不应被理解为对本发明的限制。
实施例1:测验材料的选择和近-同源品系的制备
在培育用于QTL分析的杂种群体之前,选择用做群体亲本的品种。首先研究了水稻的几个品种和印度水稻的几个品种的平均再生能力,并选择了在再生能力上具有显著差别的两个品种:日本水稻“Koshihikari”和印度水稻“Kasalath”(图1)。将日本品种“Koshihikari”和印度品种“Kasalath”杂交制备F1个体。然后用Koshihikari作为回归亲本对这些个体进行回交,并进行自体受精。生成BC1F1群体后,收集BC1F2种子。用来自每一品系的20粒BC1F2种子在诱导培养基中培养愈伤组织30天,然后将生长的愈伤组织转移至再生培养基中。转移30天之后,测量每粒种子的愈伤组织重量和苗数,用每一品系的20粒种子测定平均值。该平均值被当作再生能力(图1)。采用262个PCR标记测定出每一品系的基因型。
当基于这些数据进行关于再生能力的QTL分析时,检出了4个具有再生能力增加效应的QTL(图2)。在其中一个QTL中,靠近1号染色体的短臂上的TGS2451标记(PSR1;苗再生启动子1)处,成功地发现Kasalath基因组在Koshihikari的再生能力上具有很大的增加效应。用重复回交和MAS制备了一个PSR1近-同源品系(Nil-PSR1:用靠近Kasalath染色体1的TGS2451标记的一个区域对Koshihikari染色体进行了取代的一个品系)。对Nil-PSR1和Koshihikari(对照)的再生能力进行调查,确认了QTL(PSR1)的存在。在其中靠近染色体1的短臂上的TGS2451的一个区域被Kasalath的相应区域取代的一个品系中,其再生能力平均增加了14.7倍。
实施例2  使用PSR1的隔离群体进行高精度连锁分析
从BC2F1群体中选择出30个其PSR1区域已被Kasalath的相应区域取代的个体。使用每种种子(BC2F2种子)的10粒种子,并从愈伤组织提取DNA。使用分子标记阐明基因型,并通过调查再生能力进行连锁分析。此外,为了对具体基因座进行详细说明,约3,800粒其中PSR1被分离的BC3F2种子被用于使用分子标记调查基因型,并进行高精度连锁分析。结果,发现PSR1定位于分子标记3132和P182间的约50.8kb区域(图3)。在这一区域的基因预测表明存在4个基因,包括一假定的蛋白质。为了测定这些基因中的那些是再生能力型基因,构建Kasalath BAC文库(平均长度120kb),通过PCR筛选将一包含PSR1区域(BHAL15)的BAC克隆分离出来。BHAL15克隆中合适的限制性酶切位点被用于制备含有各后选基因区域的Kasalath基因组片段,并将它们导入Koshihikari中。结果发现仅当导入了包含被认为编码了铁氧还蛋白亚硝酸还原酶(NiR)的基因的Kasalath基因组片段(图3中的3F)时,Koshihikari的再生能力才提高(图4)。测定了被认为编码了铁氧还蛋白亚硝酸还原酶的遗传区域及其约2kb的上游区的核苷酸序列并与Kasalath和Koshihikari进行比较,在该核苷酸序列内发现了许多的突变(图5)。
实施例3  提高不可栽培品种的培养特性
Kasalath的PSR1基因区域(或使用基因组序列或使用cDNA序列)被导入Koshihikari中以赋予Koshihikari以再生能力,生成高再生性Koshihikari(图4、8和9)。在这种情形中,PSR启动子和一种组成型启动子例如肌动蛋白启动子作为用于表达PSR1基因的启动子是有效的。
实施例4  PSR1基因和PSR1蛋白的表达分析
当通过半定量RT-PCR和实时定量PCR测定愈伤组织中的NiRmRNA表达水平时,Kasalath中的mRNA的量约为Koshihikari中的2.5倍(图6中左侧照片的顶部和中部的行及右图)。使用特异于NiR蛋白的抗体进行的Western印迹分析也表明NiR蛋白在Kasalath中的储存量较Koshihikari中的储存量更大(图6中左侧照片的底部一行)。此外,用萘基乙二胺方法和其表达由大肠杆菌所诱导的NiR重组蛋白比较每单位蛋白的NiR酶活性,Kasalath NiR蛋白显示出比Koshihikari的NiR蛋白的酶活性高约1.6倍(图7)。上述结果表明Koshihikari和Kasalath间在再生能力上的差异主要是由于在NiR基因的转录调节水平上的差异,其次是由于每分子合成蛋白在活性上的差异。
实施例5  使用再生能力作为选择性状进行转化
将Kasalath PSR1基因导入Koshihikari中能够赋予不能再生的Koshihikari以再生能力。这表明当对Koshihikari进行转化时,KasalathPSR1基因可以被用做一个选择标记。更特别地,当串联插入了Kasalath PSR1基因和一靶基因的载体被导入Koshihikari中时,仅那些导入了PSR1基因的细胞将获得再生能力。因此,再生的植物体应该已经同时掺入了靶基因。为了证明这一观点,构建了携带KasalathNiR基因组+35S启动子GUS、Kasalath NiR启动子∷NiR cDNA∷NiR终止子+35S启动子GUS、水稻Actin1启动子∷NiR cDNA∷NiR终止子+位于pBI101二元载体中的T-DNA区域中的35S启动子GUS的载体和不携带NiR基因的载体,并将它们导入Koshihikari中。结果,当导入3种类型的包含NiR基因的载体时,获得了大量的再生个体,且在这些再生个体自其衍生的愈伤组织中观察到由于GUS基因所产生的着色(图8)。
此外,NiR基因具有代谢对植物有毒性的亚硝酸的特性,应用这一特性也使得NiR基因能被用作高再生性品种的转化标记。更特别地,位于肌动蛋白启动子(该启动子是水稻中的一个高表达启动子)控制下的过表达NiR基因的载体被导入到一个高再生性的Kasalath品种中,并在添加有亚硝酸的培养基中进行培养,所添加的亚硝酸的浓度能抑制普通野生型的生长。只有被转化的细胞由于过表达的NiR基因的效应而生长,且GUS染色仅在这些生长的细胞中被观测到(图9)。这一选择方法的使用相对于其中使用衍生自微生物的抗生素抗性基因作为选择标记的传统方法抗生素的费用减低。此外,该方法使得可以生产更加环保的重组植物,因为该再生植物不含有微生物基因。
工业实用性
近来,应用转化方法开发有用的植物和对基因进行功能分析进展迅速。由于转化方法允许超越生理种类的界限使用基因从而可以制备新的植物,这在基于杂交和选择的传统育种中是不可能实现的。此外,由于基因组序列被接连阐明,转化方法也正被用于基因破裂、表达调节分析等以阐明每一基因的功能。通常,当制备植物转化体时,将同时包含待导入的基因和药物抗性标记基因例如抗生素抗性基因的质粒载体通过农杆菌方法或通过电穿孔导入植物细胞中,并通过药物处理选择出转化细胞。选择出来的转化细胞经过细胞生长再生为植物体。因此,为了应用这样的转化方法,必须建立组织培养技术。组织培养技术不仅在转化方法中尤其有用,而且在使用体细胞克隆变异制备突变体、使用细胞融合或胚珠培育栽培品种、遗传特性的固定、缩短育种年限等方面也尤其有用。
培育技术使用得最多的谷物是水稻,但是在品种间存在的在培育特性上的巨大差异被认为是一个问题。特别地,很难在日本培育主要的品种例如Koshihikari和Akitakomachi,以及许多在热带地区栽培的印度品种,因此这些品种不能被用做组织培养的材料。在品种之间在培育特性上的这些差异是在众多的植物中普遍观察到的现象而并非仅限于水稻,但在阐明其原因方面还没有进展。
本申请的发明人分离了与再生能力有关的基因,使得可以通过使用分子标记对高再生性性状进行有效的选择(标记选择育种),并使得可以应用分子生物学方法提高再生能力(分子育种)。此外,将PSR1基因用做选择标记已经使得生产廉价且兼顾环境的植物转化体成为可能。
谷物例如水稻、玉米、小麦和大麦是人类的主要能量来源,也是对人类最重要的植物。这些谷物都属于Poaceae家族,且可能是从一个共同的祖先进化而来。它们相互间具有高度的遗传同源性(基因组同线性)。在这些谷物中,水稻的基因组最小,这也就是为什么水稻被用做谷物的模型植物的原因。水稻基因存在于水稻的亲缘植物例如小麦和玉米的基因组中,分离自水稻的基因可以容易地分离自小麦和玉米。此外,水稻基因可以被直接用于小麦、玉米等的培育。因此,本发明的基因不仅可以应用于水稻还可应用于多种植物品种。
                           序列表
<110>本田技研工业株式会社
<120>赋予植物再生能力的基因及其应用
<130>H3-A0301P
<150>US 60/491837
<151>2003-07-31
<160>6
<170>PatentIn version 3.1
<210>1
<211>12161
<212>DNA
<213>Oryza sativa
<220>
<221>exon
<222>(6010)..(6418)
<223>
<220>
<221>exon
<222>(10247)..(10601)
<223>
<220>
<221>exon
<222>(10703)..(10991)
<223>
<220>
<221>exon
<222>(11076)..(11813)
<223>
<220>
<221>misc_feature
<222>(4429)..(4429)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4479)..(4479)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4520)..(4520)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4555)..(4555)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4561)..(4561)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4563)..(4563)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4577)..(4578)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4823)..(4823)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(7186)..(7186)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(11994)..(11994)
<223>″n″=a,t,g or c.
<400>1
ctcgagcttt tttgactgcc ctaatcaggc gggttccttg tgggacccac ataatgcttt     60
ttttaatcgc cttcacgggc tgcatgcaaa ctatacggca tgggacttcc actactagaa    120
aaaacgggcg gtcgaaacac gttttcgcag gcaggcaaac cttccacatg tatcttaacg    180
accgtaaaaa tctccaattt tcacaggtgg accacagcac cgttttcgca ggctacattt    240
cgaatcttcc tgggtgctac agtaaaccac ctgcaaaaat actcacggcg ccaaaaaaaa    300
tttccgccag ccccgccccc tccctattca aatcacaaat cacaaattct cacaaatctc    360
atccaaaaac aaaatccaat ccaaaaatcc atacatcaac acaaagcatt ggattcaaat    420
ccacaacatc aatttacaag ttaacatcaa tcaacatgta agctttaaaa cgaaacgtcg    480
tcgtcgccgg caaactcctt tgcatgcggt gccgctgccg cccccctccc cctctgtccg    540
gatttgggag ggagggaggg aggtgtttgc cgccaccacc gccctcccct ctcctcgtag    600
ggccggatct cgggagggag gagaggggag ccgcctccgc acagccatca acgtccgtgc    660
cgccgtcgcc tcgttcgcac caccgccgtt gcttcccctc ctccggccag atctaggagc    720
ggggaggaag agagggggag ccaccgccac cgtcgccccc tcgcgtccgc gccgtcgtca    780
ccgtccacgc cgccgcgtcc gtgccgccgc tgtcgctccc cctcctctgg cgaggaggga    840
gagagaggga gccgtcgcgc cgccgtcgct cccctccttc ggcgaggagg gagagagggg    900
gagggaagag ggatggaggg gaggagagtg gcgctgagag agagagagag agacgctgag    960
gagaggaaat gagtggtggg gaggggtgga ggagaagata aggaggactt agattttttt   1020
ttgggtaggt atgatttttg caggcggacc acataaggtt ccgcctgcga aaatcaattt   1080
tttcacgcag accacttaag aggtccgcat gcgaaaataa aggtattttt ttaggcagac   1140
ctcttaagtg gtccgcctgg aaaaattgat tttcacaagc agatgacgaa aattcacccc   1200
ggtttatatt ttcgaagatg cttcatcgac gacatcgacc gcgtcctcta tgacggcaac   1260
gaccgcgtca ccgacaacgg catcgatcac gtcatctacg atgacaacga ctgcatcaac   1320
tccgcatcac tattgtgatg actgttacat ggcgtagaag aaccaaccaa agtggtggcc   1380
tcatcgccaa cgacgtcctc tgacatatgc aagacgtccc caatggcatc ctcagacatc   1440
tacaaggtgc aagatgctaa caattacagt ttttgtcttc acactgtggc ataaatattt   1500
tttttcgcct tcggctatat tcggctacac ctacaaccac ggttactaca tgatcggctc   1560
catcaacgaa catctataac aacaatcatt gacggaaact ccagtcaaga gcgtctgtgt   1620
catcgctatc ttccatgaca ctcccgctat gactacgtga gggaatagag gagagtcaag   1680
ggacgacacg gaaggagacg taggcaccag gtggaggacc gtccatcaaa gatgcaattg   1740
atgatggtga gttgaagaag atgaagaaat aaaagatttc aaatccagtc gcaatcgttc   1800
gcttcgctcc cgttacgact gagggggaat gttagaagca tagatatatt aattggagat   1860
aagagtcata caaatataga gataagatat catcctagag atagaattct atagataaaa   1920
tagagtccta gagataaatc tactcttact tgtaccccta tatatacccc atgagaggat   1980
caatgcaata caccgagaat acaacaatta gattttttta cagttgtaac tatgatacgt   2040
tgtaatatgc tggatcgggg aagagcgccc gtaatcagtg ccccagagat gtaggtctcg   2100
gctgaactcc attatcaaat accgtacctc ggtgttgtca tcatgtttga atcttctatg   2160
acgtttcttt tgcattcggt tttcgatgtg acttcagggc tggttttata ataatgatta   2220
tagtgctgtg acggcaatcg gttgtgagaa ttagctattc gggtccctcc atgtgatttt   2280
cttgtgattg ggatgtatgg taatgctagg gttttaaggt gtaggattgg tgcatgagag   2340
atcatcactt cacttgtatg accttctctc cttttatatt tttttatcat tctctccttt   2400
tttttataat gctactgaac tagtggaata caggggacta atgcaaaata aaagaaaagt   2460
atcactggtc acggcataca atttagaaag tgtgtgattt aggcatagag ctgaccacga    2520
ccctttacga cttggtcgct cggtttgtta gacgatagat caaccaacaa aagctacgat    2580
acatgatgta cgtgtcagga tacaaatcct tacaaataac aacagttatt gttcgataac    2640
ttttatcagt tgtctaggct taccaatgta taatagaaga tgaaaattcc atattactgg    2700
tatcgatcaa tgctagtaac tctttgagct ttgtctaggt taaaaaaaat tatggatcca    2760
ccatcacaaa aatgaaaaac accggggaaa acaaaaaacc atttaataac agcacaagac    2820
aaaatgatgt taccgtctac ccgagctcct actccgtacc agcacaacca aacgaacagt    2880
acccgccggg tcaggggcac gttcgtaaat ttccctcccg tggctggctg gctgccatct    2940
ctctcagcca gggttggtaa tttcggccgt ttcggtgggt cccgatagta aatgagctcc    3000
agtcaaaacg ccctctgcct cccctcattg cgccacacgc acaccgcatc tagatccaga    3060
tcgaaaaaat cgccatctcg ccgagtcgcc agtcgccgcc tcaacgccgg tcgccgtacc    3120
gccggcgctg cacgcccccc tccaagccgt cgccccatcg cccccagccg cccggtggtg    3180
gggcagcgga tgccgagctt ggcgaggttg ccgaggacga accaggcgag gaggacgagg    3240
atcttgtcga cgagccagag cgggagccac gccatgagca acacggcgag ctcgaacgtg    3300
gacttgccga gcacctcgcc agggaggacg tggacggcgt cgcgcaccac catcgccggg    3360
agggcgctgt ggtcgcagag gtcgagcgac accaccatgc cggagttgcc gcacccgacg    3420
acgagcacct tcttgccgcg gtacgcctcg ccggacttgt agaccgcgac atgcatcacc    3480
tcgctgctat atttgttctt ggactgtgga gacttgctgt cagtgggtgt gttcagaatt    3540
gctgctgcag cttgcagcga atttgtgatg cagcagctac agcttgtatg gctgccgagt    3600
agagcgagtg ttgctatctg ttttttgttc tctttttcag aaatttcgcc cgcaaatttt    3660
aaatttgaat tcaaattttt aaaagaacta gcaaatatgc ccgtgcgttg caccgggtga    3720
atatcaaaca aatattgatg ggtaagattg cttgtgtact tataacacat atgcacaaaa    3780
atattgaata tgtacatacc tcgcaaatat ctccaaattt tatacatatg agttgtgtaa    3840
atcgtgtgag ttccatattg tcatgttgat atggagtatt actgatgagc ccatctatgg    3900
tgataatttt ggaggttgta gctcaacgaa tttgtatttg ctatgtatct caacgttgat    3960
aagtcactac cacaaccatc ggcgaccttt ctcgggatcc aagcatgttg accccgccaa    4020
cgtggcgtcg gtgcagggca ccgagatgaa caccacgggg ctatgtgcct gtccagggtc    4080
atcctaggct taaggccacg acactcaagg acgtggtggg cggcgtcgcg gaggtgctcc    4140
aagcgaacaa gctggccacc aaggaggacg ccgacaaggt ggcggccacc gctatgcaga    4200
acgatgggag gcacgccggt gacgacaagg agctaacacg atccatttag tcccgatccg    4260
agttgatcag gaattcaatc ctgcaccttg cggttacgtt tttcttctcc gcgggaaaag    4320
caatcaccga tggtagggac aaagtgtgtg tgagaacgga ggccaggcca aagtgcgtgc    4380
gagaacggag gctaggccat cgctggattg gatttacgaa tgaaatatng atgtgacgaa    4440
cagaaaatta tcagtttgat ttaattttca taatcgganc tctttaatag gaaaaaaaat    4500
tacatgtacg ttccttcatn gtgcccatgt ccatccggga gtccaggttt attcncaaag    4560
ncncaatcaa cagctannaa tccatgtcct tccccgccgt tccctactct gctttttttt    4620
ctttcatttg aaaccttccg ctatgaattt ctagtcgttc ctagcatcca cgcacacaaa    4680
atagatttcc ctcgcaaggc aaaacataca aatatgagtg catgcaagat attacaaacc    4740
caatccatta aaaatagaac ataattaact ttagcctacc tatctcaata ttggtatatg    4800
cccaaactca aaaggagaaa aancaaacta aaacttttaa taaagtgacc ccaagagata    4860
aaaaggtgat agtaacaaca aaatctcact tgacaatgtc gttgatcagc actattttta    4920
aatattactt aaaaatcttt atatttacct attaaaacaa tgaaaaacag aagatgtttc    4980
ttttttattt acaacagcgt tgtatttagt catgtcctat ctaagagaga aaaatgaatt    5040
taacgaaaag aagctcagaa aaaaaaaaga gaacagggcc accacaccag taatccctat    5100
gttatcaatg aaaaaaaatt tcaatgctag gttttttata agaaaaggtg ataaagtgtt    5160
gaaaaataca gcaggaaatt atatatcttg ctggtttaac attaattcaa gcatatagat    5220
ataaaaatat atcaggctag gaaaggaaaa ggataaaatt ggagagaaaa aggaaaagaa    5280
cagtagagga taaccagcaa aaagatgaaa ggattcgaac ccatgaccta gcgttacaat    5340
tgtttcacag gctaaccaat cgagaatcat cgacgtagtg taatcttgtg tagctacatt    5400
tgaaaaaata tgttttgagc tgaacgttgg tgtgtccgcc cctgcatccg atacatgttg    5460
gagcgtggag cgcggtaata tctccttctc tctcgtcgct ttctgcgtct ccccgtctct    5520
ccttcgccaa cagccgagaa gaggcagaga gagcgccgcc ccccgtccct ctctctccct    5580
ctcgtcctcg cccccatccc tctcgtcttt cccttgccgg cagcagagga ggcggcagcg    5640
acggcttcag ctgctcccac gggccggatc gggcagtggc ggtggcgtcg gcggcttccg    5700
ctggcgaatc cggcgggtga atcgggtgaa atttgggtga cccccgatac aaatcagtgt    5760
tccgataggt aataccctgc tctcagcatc tgcccttttg aattcgccaa gagccagcat    5820
ctgccctttt gaattcgcca agggccagca tctgcccatt tgattttgaa ttcgccaaga    5880
gccagcaaca gcgcccccgc gccccctccc tcctccgcaa taaacagcca cacgcgccgc    5940
ccccatgtcc accctcatcg ccacagcgca ccaccaccac caccaccacc accaccaccg    6000
tctccagcc atg gcc tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac    6051
          Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr
          1               5                   10
ccc cac gcg gca gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc      6099
Pro His Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg
15                  20                  25                  30
ccc gtg cag tcg tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg      6147
Pro Val Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala
                35                  40                  45
gcg gac gag gcc gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag      6195
Ala Asp Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln
            50                  55                  6O
cgg gag ggc cgg tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg      6243
Arg Glu Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu
        65                  70                  75
aac ccg cag gag aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc      6291
Asn Pro Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe
    80                  85                  90
atg gag ggc ggc atc aag gag ctc gcc aag atg ccc atg gag gag atc      6339
Met Glu Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile
95                  100                 105                 110
gag gcc gac aag ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg      6387
Glu Ala Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp
                115                 120                 125
ctc ggc ctc ttc cac cgc cgc aag cat cag t gtatgcctct cttctcttgc      6438
Leu Gly Leu Phe His Arg Arg Lys His Gln
            130                 135
tcctctgatc aacacatttt cttgctttcg ttcggttatt tgtcgcgccg aggaagttaa    6498
ttcgccaaga tattctgcag ttttttttct cgatgcacat tcagcaacct aattaagact    6558
gattaagttg ctgtgatttt tatagcttaa ttacggtctc gtgggtaatg actatttata    6618
ttgagtaaac atggttacct ttgatccaat cacttcacct ccatgtgcca tatatagcca    6678
caggctctac caagtaacac tagtaatatg cccgtgctac gacacggtgg cataataaat    6738
cattaaattt tattataatc aaattaagga tcctaaaatt ggtccaattg ggtgttaatt    6798
cgatgcaggt catataaaaa tatattttag gcaaggtgca attcaagagc atcaaccatt    6858
atatccaatc actttaatat atatttgaag ataacatatg tcggaaaaaa aatgatggag    6918
agctatttca ttaacttgtg agcataaaca gatcaccaga tgatgccacc ataagtcccg    6978
ccacagtaag tgatgcagct catcttgccc taggcgttcg gtctaaccag tagatagaaa    7038
gagtacaaca tagatcgaat gaaaaaaaaa atctccagaa gaaagctcaa ccacattgag    7098
taaattagag caacaatcaa atcgagtcag catatcgtta tgttagcaga accaatcacc    7158
acaatttgtt tctcctcttt atctaagngt tttggccagg ttaaaagcat atatcactat    7218
gttccaagca aacatcggca atggacacgt caaaaataaa tgatcaattg tttctttgag    7278
tacaaaattg acaatggaca ctatgttcct ttgttagaat tctatttgtc agggtaggat    7338
gtagaaaaac ttaactttta gaggaagctt aaatatccgg cataaacttg ctttttcagc    7398
gctctataaa ataattcaac agtgaattgt ccatcttttc taagtgctcc aaaagacact    7458
aagttgaaaa accaggtgaa ccaacagatt gatccacaaa atcttattat tagattattc    7518
acttaaaagc ctgtctttat ttcaaacata taaaaacaga agttattaat cagggaagcg    7578
cttatggcag cctgagcgaa ccagtgatag caagtggtga aaacagtaaa taggatacat    7638
aaaaattata caaggtttct actgtttatc gaaaaaaaat atttgaaaac agtaaatagg    7698
atacataatc gacttccaac ttgtccttat cataacatcc agaatcacaa caagaattgc    7758
aacgaataca tagtcgactt gagctaagaa gtcacaagac ctgtcaaagt aagctgccct    7818
tgatcttgaa gtgaaaggca tattttattg tcttccttgg caaacagata tcactgtctt    7878
cagcagttca gttagataat ccaagatttc tcacggagaa gagcatatca ctcacatcag    7938
tgttgtgccc tccaaatact gagataaact gaattttgtt ctctttgaag catctgcagg    7998
cattaacaat aataatactt tacaaagttt cattgggtct aaactattgt ttgcacatca    8058
tatatatgcc cagaactttt tagcatgata caagggtcct gttcataact catgcctaaa    8118
tctgacaaat ttgtcaaacg acaatataag tcgaattata atgcgtttta gaattgacgc    8178
caaaactttt gctagcgtaa gtaactcttc cacctcccag catgcataca accaacaagc    8238
taaacttttg ttcaaaaaaa tgtacattta tttccttgaa cacagccttt gtagaatatg    8298
attaaaaact catggatgaa tgaaataatg taaaagaatg gtcaaaatga tgaatagtac    8358
aagaagcaac tgtgaacatt tcacctttac ctgactgttc gcaagaaggc cacgtggcag    8418
aaaagccaga aatgcaagaa gcttccctaa ttgatacacc atcaagaaat caatggactc    8478
aacaccagcg tccgcccaga caaaatgaat gcaggcacct aaaatataga accattgact    8538
tttcaacact gaattatata acctgaatat cttgttttgt taacacatct gacaaaatca    8598
gtgcattctg ttccatatag atgtatgcat agctcccata tgttagttga tcgatgagca    8658
tgcaaactat acacacctta cgttactccc tctgtcaaaa aaaatataag cttgtctaga    8718
tacatagcta caaatgctta tatttttgga ttctcttaaa gctgtagaaa cttttatcgc    8778
cccgccatgg caagtcgagc tgccatcccc aatgaaagcc cccacacagg tttcatgccc    8838
tgctgcacaa tattgagcaa ccaaaaatat aataatattt gtgtcagaat ttgaatcaac    8898
cttacagata ctgggtggcc agaaaatcta gtccaagtaa tatcctgaaa aatagcaact    8958
ggcaaatact aaaggcagtg aagagtttcc tttagatcag atgataaaaa aaaatcatat    9018
gttcaatagc aataatcact cacatttttt ttgctgttta gaatttagat aaatagtagt    9078
taaacttcta tagcttgcgt agctaagatc aatggtgatt attagttgaa aaaataatca    9138
aatcatcaaa ctgaggagac ttatacctgc cataagttct gaaatttcaa tgatcctagt    9198
caatatttac tgtatatata gaattaggtc caaaagatga tacttacaat taaggatgtt    9258
gtattgatcg gttcataact caagcttcta tttatcatta atcaaaagct ggatcattca    9318
tgcatatacc tttgccgcac tcaacatagc agctcggagt cttctttgtt cagaagcgag    9378
gaaggagtca acaaataagt actgcaatgt taaacaaacc gacatatcaa atcccaaatt    9438
aagaatgcat gatttattaa tacaggaaat atatgatcaa gtcccaaaaa gtgagtcatg    9498
ttatgtacac tcagtcatca atttcaataa gaatattaac ttgctcattg gtatatggat    9558
ttgattatga cataatttga caatacattt acagaataaa cttgcagtgc tgtgagcata    9618
tgttactaac atgtaaggac cttgttttgc tctgttcaat actcatgttg atcttgatct    9678
gtgtccacat atacctaaat gaaatgaaat caaagaatga ggtttgtagg agtggagttg    9738
gtgaattata gggtagataa tgtcggcaca accgtttgat aagtagtacg agtactttat    9798
ttggcgccac cgcgccagca tcagatgtgt ggcctttgca ctgattgaac ccaaaagaaa    9858
aaaaaaagtc gttttggtcc cacacaattc tacttcatct gcaggatgta cagaaggtta    9918
catatctatt ctgttctatg ctctgtttac atttataagg gctcacttgg tggctgtcat    9978
tggttggctg gtgcggtata ttactaatag gttttttaat ggcatatatg ttcttaaaat   10038
aaaccagaaa agcaaaagat caactatctt agccacacca atgaaatgga atatactgaa   10098
ctgtcacggc taaaattctc ttcagtcacc tggcccagct ggagccgtgg gctcgtcgtc   10158
ttttctaaac atgtactagt attttggggg cccacagtga atttggccca aaatgctgac   10218
agccgctcta cggctctacg ctgtgcag at  ggg cgg ttc atg atg cgg ctg      10269
                               Tyr Gly Arg Phe Met Met Arg Leu
                                           140
aag ctg cca aac ggt gtg acg acg agc gag cag acg agg tac ctg gcg     10317
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145                 150                 155                 160
agc gtg atc gag gcg tac ggc aag gag ggc tgc gcc gac gtg aca acc     10365
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
                165                 170                 175
cgc cag aac tgg cag atc cgc ggc gtc acg ctc ccc gac gtg ccg gcc      10413
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
            180                 185                 190
atc ctc gac ggg ctc aac gcc gtc ggc ctc acc agc ctc cag agc ggc      10461
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
        195                 200                 205
atg gac aac gtc cgc aac ccc gtc ggc aac ccg ctc gcc ggc atc gac      10509
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
    210                 215                 220
ccc gac gag atc gtc gac acg cga tcc tac acc aac ctc ctc tcc tcc      10557
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225                 230                 235                 240
tac atc acc agc aac ttc cag ggc aac ccc acc atc acc aac ct           10601
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu
                245                 250
gtgagtgatc gaatcaactt gatcatgctc tgtgctgtgc tgttcgtgtc gtctctgacg    10661
acatgtttgt tgaatttgtt gttgctgcgt gctgttggca g g ccg agg aag tgg      10715
                                                Pro Arg Lys Trp
aac gtg tgc gtg atc ggg tcg cac gat ctg tac gag cac ccg cac atc      10763
Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His Ile
260                 265                 270                 275
aac gac ctc gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg ttc      10811
Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly Phe
                280                 285                 290
aac ctc ctt gtc ggc ggg ttc atc agc ccc aag agg tgg gag gag gcg      10859
Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu Ala
            295                 300                 305
ctg ccg ctg gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg tgc      10907
Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val Cys
        310                 315                 320
aag gcc gtt ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac cgc      10955
Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn Arg
    325                 330                 335
cag aag acc cgc atg atg tgg ctc atc gac gaa ctt gtgagcctcc           11001
Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu
340                 345                 350
attcatccac gccattgact gaattacgta tgtcccaatg ttcttatcag ttaattgcgg    11061
tgttggcatt gcag gga atg gag gct ttt cgg tcg gag gtg gag aag agg      11111
                Gly Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg
                            355                 360
atg ccg aac ggc gtg ctg gag cgc gct gcg ccg gac gac ctc atc gac      11159
Met Pro Asn Gly Val Leu Glu Arg Ala Ala Pro Asp Asp Leu Ile Asp
    365                 370                 375
aag aaa tgg cag agg agg gac tac ctc ggc gtg cac ccg cag aag cag      11207
Lys Lys Trp Gln Arg Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln
380                 385                 390                 395
gaa ggg atg tcc tac gtc ggc ctg cac gtg ccc gtc ggc cgg gtg cag      11255
Glu Gly Met Ser Tyr Val Gly Leu His Val Pro Val Gly Arg Val Gln
                400                 405                 410
gcg gcg gac atg ttc gag ctc gcc cgc ctt gcc gac gag tat ggc tcc      11303
Ala Ala Asp Met Phe Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser
            415                 420                 425
ggc gag ctc cgc ctc acc gtg gag cag aac atc gtg atc ccg aac gtc      11351
Gly Glu Leu Arg Leu Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val
        430                 435                 440
aag aac gag aag gtg gag gcg ctg ctc gcc gag ccg ctg ctt cag aag      11399
Lys Asn Glu Lys Val Glu Ala Leu Leu Ala Glu Pro Leu Leu Gln Lys
    445                 450                 455
ttc tcc ccg cag ccg tcg ctg ctg ctc aag ggc ctg gtc gcg tgc acc      11447
Phe Ser Pro Gln Pro Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr
460                 465                 470                 475
ggc aac cag ttc tgc ggc cag gcc atc atc gag acg aag cag cgg gcg      11495
Gly Asn Gln Phe Cys Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala
                480                 485                 490
ctg ctg gtg acg tcg cag gtg gag aag ctc gtg tcg gtg ccc cgg gcg      11543
Leu Leu Val Thr Ser Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala
            495                 500                 505
gtg cgg atg cac tgg acc ggc tgc ccc aac agc tgc ggc cag gtg cag      11591
Val Arg Met His Trp Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln
        510                 515                 520
gtc gcc gac atc ggc ttc atg ggc tgc ctc acc aag gat agc gcc ggc      11639
Val Ala Asp Ile Gly Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly
    525                 530                 535
aag atc gtc gag gcg gcc gac atc ttc gtc ggc ggc cgc gtc ggc agc      11687
Lys Ile Val Glu Ala Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser
540                 545                 550                 555
gac tcg cac ctc gcc ggc gcg tac aag aag tcc gtg ccg tgc gac gag      11735
Asp Ser His Leu Ala Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu
                560                 565                 570
ctg gcg ccg atc gtc gcc gac atc ctg gtc gag cgg ttc ggg gcc gtg      11783
Leu Ala Pro Ile Val Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val
            575                 580                 585
cgg agg gag agg gag gag gac gag gag tag gagcacagac tggggtggtt        11833
Arg Arg Glu Arg Glu Glu Asp Glu Glu
        590                  595
tgcttgctcc ggtgatctct cgccgtcctt gtaaagtaga cgacaatatg ccttcgccca  11893
tggcacgctt gtactgtcac gttttggttt gatcttgtag cccaaaagtt gtgttcattc  11953
tcgttacagt cttacagagg atgattgatt gataaataaa naagaaacag attctgcaac  12013
tgttcatcgc tgttcctaaa tctgatttcg cgatagtatc ttgtctgacc tgtcccaatc  12073
gcagtgctaa aaccatataa tcttgcaagc aaatgaaatt gaaagagttc aatgcaacca  12133
ctaacggtct aacaacatga taaggcct                                     12161
<210>2
<211>2519
<212>DNA
<213>Oryza sativa
<220>
<221>CDS
<222>(532)..(2322)
<223>
<400>2
tatctccttc tctctcgtcg ctttctgcgt ctccccgtct ctccttcgcc aacagccgag     60
aagaggcaga gagagcgccg ccccccgtcc ctctctctcc ctctcgtcct cgcccccatc    120
cctctcgtct ttcccttgcc ggcagcagag gaggcggcag cgacggcttc agctgctccc    180
acgggccgga tcgggcagtg gcggtggcgt cggcggcttc cgctggcgaa tccggcgggt    240
gaatcgggtg aaatttgggt gacccccgat acaaatcagt gttccgatag gtaataccct    300
gctctcagca tctgcccttt tgaattcgcc aagagccagc atctgccctt ttgaattcgc    360
caagggccag catctgccca tttgattttg aattcgccaa gagccagcaa cagcgccccc    420
gcgccccctc cctcctccgc aataaacagc cacacgcgcc gcccccatgt ccaccctcat    480
cgccacagcg caccaccacc accaccacca ccaccaccac cgtctccagc c atg gcc     537
                                                         Met Ala
                                                         1
tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac ccc cac gcg gca      585
Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His Ala Ala
        5                   10                  15
gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc ccc gtg cag tcg      633
Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val Gln Ser
    20                  25                  30
tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg gcg gac gag gcc      681
Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp Glu Ala
35                  40                  45                  50
gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag cgg gag ggc cgg      729
Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu Gly Arg
                55                  60                  65
tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg aac ccg cag gag      777
Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro Gln Glu
            70                  75                  80
aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc atg gag ggc ggc      825
Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu Gly Gly
        85                  90                  95
atc aag gag ctc gcc aag atg ccc atg gag gag atc gag gcc gac aag      873
Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala Asp Lys
    100                 105                 110
ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg ctc ggc ctc ttc      921
Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly Leu Phe
115                 120                 125                 130
cac cgc cgc aag cat cag tat ggg cgg ttc atg atg cgg ctg aag ctg      969
His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu Lys Leu
                135                 140                 145
cca aac ggt gtg acg acg agc gag cag acg agg tac ctg gcg agc gtg     1017
Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala Ser Val
            150                 155                 160
atc gag gcg tac ggc aag gag ggc tgc gcc gac gtg aca acc cgc cag     1065
Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr Arg Gln
        165                 170                 175
aac tgg cag atc cgc ggc gtc acg ctc ccc gac gtg ccg gcc atc ctc     1113
Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala Ile Leu
    180                 185                 190
gac ggg ctc aac gcc gtc ggc ctc acc agc ctc cag agc ggc atg gac     1161
Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly Met Asp
195                 200                 205                 210
aac gtc cgc aac ccc gtc ggc aac ccg ctc gcc ggc atc gac ccc gac     1209
Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp Pro Asp
                215                 220                 225
gag atc gtc gac acg cga tcc tac acc aac ctc ctc tcc tcc tac atc     1257
Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser Tyr Ile
            230                 235                 240
acc agc aac ttc cag ggc aac ccc acc atc acc aac ctg ccg agg aag     1305
Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro Arg Lys
        245                 250                 255
tgg aac gtg tgc gtg atc ggg tcg cac gat ctg tac gag cac ccg cac     1353
Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His
    260                 265                 270
atc aac gac ctc gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg     1401
Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly
275                 280                 285                 290
ttc aac ctc ctt gtc ggc ggg ttc atc agc ccc aag agg tgg gag gag      1449
Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu
                295                 300                 305
gcg ctg ccg ctg gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg      1497
Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val
            310                 315                 320
tgc aag gcc gtt ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac      1545
Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn
        325                 330                 335
cgc cag aag acc cgc atg atg tgg ctc atc gac gaa ctt gga atg gag      1593
Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly Met Glu
    340                 345                 350
gct ttt cgg tcg gag gtg gag aag agg atg ccg aac ggc gtg ctg gag      1641
Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu
355                 360                 365                 370
cgc gct gcg ccg gac gac ctc atc gac aag aaa tgg cag agg agg gac      1689
Arg Ala Ala Pro Asp Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp
                375                 380                 385
tac ctc ggc gtg cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc      1737
Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly
            390                 395                 400
ctg cac gtg ccc gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc      1785
Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu
        405                 410                 415
gcc cgc ctt gcc gac gag tat ggc tcc ggc gag ctc cgc ctc acc gtg      1833
Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val
    420                 425                 430
gag cag aac atc gtg atc ccg aac gtc aag aac gag aag gtg gag gcg      1881
Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala
435                 440                 445                 450
ctg ctc gcc gag ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg      1929
Leu Leu Ala Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu
                455                 460                 465
ctg ctc aag ggc ctg gtc gcg tgc acc ggc aac cag ttc tgc ggc cag      1977
Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln
            470                 475                 480
gcc atc atc gag acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg      2025
Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val
        485                 490                 495
gag aag ctc gtg tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc      2073
Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly
    500                 505                 510
tgc ccc aac agc tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg      2121
Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met
515                 520                 525                 530
ggc tgc ctc acc aag gac agc gcc ggc aag atc gtc gag gcg gcc gac      2169
Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp
                535                 540                 545
atc ttc gtc ggc ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg      2217
Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala
            550                 555                 560
tac aag aag tcc gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac      2265
Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp
        565                 570                 575
atc ctg gtc gag cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac      2313
Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp
    580                 585                 590
gag gag tag gagcacagac tggggtggtt tgcttgctcc ggtgatctct              2362
Glu Glu
595
cgccgtcctt gtaaagtaga cgacaatatg ccttcgccca tggcacgctt gtactgtcac    2422
gttttggttt gatcttgtag cccaaaagtt gtgttcattc tcgttacagt cttacagagg    2482
atgattgatt gataaataaa gaagaaacag attctgc                             2519
<210>3
<211>596
<212>PRT
<213>Oryza sativa
<400>3
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1               5                   10                  15
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
            20                  25                  30
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
        35                  40                  45
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
    50                  55                  60
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65                  70                  75                  80
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
                85                  90                  95
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
            100                 105                 110
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
        115                 120                 125
Leu Phe His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu
    130                 135                 140
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145                 150                 155                 160
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
                165                 170                 175
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
            180                 185                 190
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
        195                 200                 205
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
    210                 215                 220
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225                 230                 235                 240
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro
                245                 250                 255
Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His
            260                 265                 270
Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys
        275                 280                 285
Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp
    290                 295                 300
Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile
305                 310                 315                 320
Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg
                325                 330                 335
Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly
            340                 345                 350
Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val
        355                 360                 365
Leu Glu Arg Ala Ala Pro Asp Asp Leu Ile Asp Lys Lys Trp Gln Arg
    370                 375                 380
Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr
385                 390                 395                 400
Val Gly Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe
                405                 410                 415
Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu
            420                 425                 430
Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val
        435                 440                 445
Glu Ala Leu Leu Ala Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro
    450                 455                 460
Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys
465                 470                 475                 480
Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser
                485                 490                 495
Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp
            500                 505                 510
Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly
        515                 520                 525
Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala
    530                 535                 540
Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala
545                 550                 555                 560
Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val
                565                 570                 575
Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu
            580                 585                 590
Glu Asp Glu Glu
        595
<210>4
<211>12179
<212>DNA
<213>Oryza sativa
<220>
<221>exon
<222>(6001)..(6409)
<223>
<220>
<221>exon
<222>(10255)..(10609)
<223>
<220>
<221>exon
<222>(10712)..(11000)
<223>
<220>
<221>exon
<222>(11094)..(11831)
<223>
<400>4
ctcgagcttt tttgactgcc ctaatcaggc gggttccttg tgggacccac ataatgcttt     60
ttttaatcgc cttcacgggc tgcatgcaaa ctatacggcg tggtacttcc actactagaa    120
aaaacgggct tttcgcaggc gggcaaacct tccgcatgta tattaacgac cgtaaaaatc    180
tccaattttc acaggtggac cccagcaccg cctgcgaaaa taattttcgc aggctgcatt    240
tcgaatcttc ctgggtgcta cagtaaacca cctgcgaaaa tactcacggc gccaaaaaaa    300
aaatttccgc cagccccgcc ccctccctat tcaaatcaca aattctcaca aatctcatcc    360
aaaaacaaaa ttcaatccaa aaatccatac atcaacacaa agcattggat tcaaatccac    420
aacatcaatt tacaagttaa catcaatcaa catgtaagct ttaaaacgaa acgtcgtcgt    480
cgccggcaaa ctccttttgc atgcggtgcc gccgccgccc ccctcccccc tctgtccgga    540
tttgggaggg agggaggtgt ttgccgccac caccgccctc ccctctcctc gtagggccgg    600
atctcgggag ggaggagagg ggagccgcct ccgcacagcc atcaacgtcc gtgccgccgt    660
cgcctcgttc gcaccaccgc cgttgcttcc cctcctccgg ccagatctag gagcggggag    720
gaagagaggg ggagccaccg ccaccgtcgc cccctcgcgt ccgcgccgtc gtcaccgtcc    780
acgccgccgc gtccgtgccg ccgctgtcgc tccccctcct ctggcgagga gggagagaga    840
gggagccgtc gcgccgccgt cgctcccctc cttcggcgag gagggagaga gggggaggga    900
agagggatgg aggggaggag agtggcgctg agagagagag agagagacgc tgaggagagg    960
aaatgagtgg tggggagggg tggaggagaa gataaggagg acttagattt tttttttggg   1020
taagtatgat ttttgcaggc ggaccacata aggttccgcc tgcgaaaatc aattttttcg   1080
cgcagaccac ttaagaggtc cgcatgcgaa aataaaggta tttttttagg cggacctctt   1140
aagtggtccg cctggaaaaa ttgattttcg caagcggatg acgaaaattc accccggttt   1200
atattttcga agatgcttca tcgacgacat cgactgcgtc ctctatgaca gcaacgaccg   1260
cgtcaccgac gacggcatcg atcacgtcat ctacgatgac aatgactgca tcaactccgc   1320
atcactattg tgatgactgt tacacggcgt agaagaacca accaaagtgg tggcttcatc   1380
gccaacgacg tcctctaaca tatgcaagac gtccccaatg gcatcctctg acatctacaa   1440
ggtgcaagat gctaacaatt acagtttttg tcttcacact gtggcataaa tatttttttt   1500
caccttcggc tatatgcggc tacacctaca accacggtta ctacatgatc ggctccatca   1560
acgaacatct ataacaacaa tcattgatgg aaactctagt caaagcgtct gtgtcatcgc   1620
tatcatccat gacactcccg ctatgactac gtgagggaat agataagagt caagggacga    1680
cacggaagga gacgtaggca ccaggtggag gaccatccat caaagatgca attgatgatg    1740
gtgagttgaa gaagatgaag aaataaaata tttcaaatcc agtcgcaatc attcgcttcg    1800
ctcccgttac gactgagggg gaatgttaga agcatagata tattaattgg agataagagt    1860
catacaaata tagagataag atatcatcct agagatagaa tcctagagat aaaatatagt    1920
cctagagata aatctactct tacttgtacc cctatatata ccccatgaga ggatcaatgc    1980
aatacaccga gaatacaaca attagatttt tctacggttg taactataat acgctgtaat    2040
atgctggatc ggggaagagc gcccgtaatc agtgccccag agatgtaggt ctcggttgaa    2100
ctccattatc aaataccgta cctcggtgtc gtcatcatgt ttgaatcttc tatgacgttt    2160
cttttgcatt cggttttcga tgtgacttcg gggctggttt tataacaatg attatagtgc    2220
tgttgacggc aatcggttgt gagaattagc tattcgggtc cctccatgtg attttcttgt    2280
gattgggatg tatggtaatg ctagggtttt aaggtgtagg attggtgcat gagagatcat    2340
cacttcactt gtatgacctt ctctcctttt atattttttt atcattctct cctttttttt    2400
ataatgctac tgaactagtg gaatacaggg gactaatgca aaataaaaga aaagtatcac    2460
tggtcacggc atataattta gaaagtgtgt gatttaggca tagggctgac catgaccctt    2520
tacgacttgg tcgctcggtt tgttagacga tagatcaacc aacaaaagct acgatacatg    2580
atgtacgtgt caggatacaa atccttacaa ataacaacag ttattgttcg ataactatca    2640
gttgtctagg cttaccaatg tataatagaa gatgaaaatt ccatattact ggtatcgttc    2700
aatgctagta actctttgag ctttgtctag gttaaaaaaa aaattatgga tccaccatca    2760
caaaaatgaa aaacaccggg gaaaacaaaa aaccatttga tagcagcaca agacaaaatg    2820
atgttaccgt ctacccgagc tcctactccg taccagcaca accaaacgaa cagtacccgc    2880
cggaccaggg gcacgttcgt aaatttccct cccgtggctg gctggctgcc atctctctca    2940
accagggttg gtaatttcgg ccgtttcggt gggtcccgat agtaaatgag ctccggtcaa    3000
aacgccctcc gcctcccctc attgcgccgc acgcacaccg catctagatc cagatcgaaa    3060
aaatcgctat ctcgccgagt cgccagtcac cgcctcgacg ccggtcgccg taccgccggc    3120
gctgcacgcc cccctccaag ccgtcgcccc atcgccccca gccgcccagt ggtggggcgg    3180
cggatgccga gcttggcgag gttgccgagg acgaaccagg cgaggaggac gaggatcttg    3240
tcgacgagcc agagcgggag ccacgccatg agcaacacgg cgagctcgaa cgtggacttg    3300
ccgagcacct cgccagggag gacgtggacg gcgtcgcgca ccaccatcgc cgggagggcg    3360
ctgtggtcgc acaggtcgag cgacaccacc atgccggagt tgccgcaccc gacgacgagc    3420
accttcttgc cgcggtacgc ctcgccggac ttgtagaccg cgacatgcat cacctcgctg    3480
ctatatttgt tcttggactg tggagacttg ctgtcagtgg gtgtgttcag aattgctgct    3540
gcagcttgca gcgaatttgt gatgcagcag ctgcagcttg tatggctgcc gagtagagcg    3600
agtgttgcta tctgtttttg ttctcttttt cagaaatttc gcccgcaaat tttaaatttg    3660
aattcaaatt tttaaaagaa ctagaaaata tgcccgtgcg ttgcaccggg tgaatatcaa    3720
acaaatattg atgggtaaga ttgcttgtgt acttataaca catatgcaca aaaatattga    3780
atatgtacat acctcgcaaa tatctccaaa ttttatacat atgagttgtg taaatcatgt    3840
gagttccata ttgtcatgtt aatatggagt attactgatg agcccatcta tggtgataat    3900
tttggaggtt gtagctcaac gaatttgtat ttgctatgta tctcaacgtt gataagtcac    3960
tactacaacc atcggcgacc tttctcggga tccaagcatg tcgaccccgc caacgtggcg    4020
tcggtgcagg gcaccgagat gaacaccacg gggctatttg cctgtccagg gtcatcctag    4080
gcttaaggcc acgacactca aggacgtggt aggcggcgtc acagaggtgc tcccagcgaa    4140
caagctggcc accaaggagg acgccgacaa ggtggcggcc accgctatgc agaaacgatg    4200
ggaggcatgc cggtgacgac aaggagctaa cacgatccat ttagtcccga tccgagttta    4260
tcaggaattc aatcctgcac cgtgcggtta cgtttttctt ttccgcggga aaagcaatca    4320
ccgatggtag ggacaaagtg cgtgtgagaa cagaggccag gccaaagtgc gtgcgagaac    4380
ggaggctagg ccatcgctgg attggattta cgaatgaaat atcgatgtga cgaacagaaa    4440
attatcagtt tgatttaatt ttcataatca gaactcttta ataggaaaaa aattacatgt    4500
acgttccttc atcgtgccca tgtccatctg ggagtccagg tttattcaca aagacccaat    4560
caacagccag gaatccatgt ccttccccgc cgttccctac tctgcttttt tttctttcat    4620
ttgaaacctt ccgctatgaa tttctagtcg ttcctagcat ccacgcacac aaaatagatt    4680
tccctcgcaa ggcaaaacat acaaatatga gtgcatgcaa gatattacaa acccaatcca    4740
ttaaaaatag aaaataatta actttagcct acctatctca atattggtat atgcccaaac    4800
tcaaaaggag aaaaaccaaa ctaaaacttt taataaagtg aacccaagag ataaaaaggt    4860
gatagtaaca acaaaatctc acttgacaat gtcgttaatc aacactgttt ttaaatatta    4920
cttaaaaatc tttatattta cctattaaaa caatgaaaaa cagaagatgt ttctttttta    4980
tttacaacag cgttgtattt agtcatgtcc tatctaagag agaaaaatga atttaacgaa    5040
aagaagctca gaaaaaaaaa gagaacaggg ccaccacacc agtaatccct atgttatcaa    5100
tgaaaaaaaa tttcaatgct aggtttttta taagaaaagg tgataaagtg ttgaaaaaat    5160
acagcaggaa attatatatc ttgctggttt aacatgaatt caagcatata gatataaaaa    5220
tatatcaggc taggaaagga aaaggataaa attggagaga aaaaggaaaa gaacagtaga    5280
ggataaccag caaaaagatg aaaggattcg aacccatgac ctagcggtac aattgtttca    5340
caggctaacc aattgagaat catcgacgtt gtgtcatctt gtgtagctac atttgaaaaa    5400
atatgttttg agctgaacgt tggtgtgtcc gcccctgcat ccgatacatg ttggagcgtg    5460
gagcgcggta aagaaaaaat cctatcgaac cttatctcct tctctctcgt cgctttctgc    5520
gtctccccgt ctctccttcg ccaacagccg agaagaggca gagagagcgc cgccccccgt    5580
ccctctctct ccctctcgtc ctcgccccca tccctctcgt ctttcccttg ccggcagcag    5640
aggaggcggc agcgacggct tcagctgctc ccacgggccg gatcgggcag tggcggtggc    5700
gtcggcggct tccgctggcg aatccggcgg gtggatacaa atcagtgttc cgataggtaa    5760
aaccctgctc tcagcatctg cccttttgaa ttcgccaaga gccagcatct gcccttttga    5820
attcgccaag ggccagcatc tgcccatttg attttgaatt cgccaagagc cagcaacagc    5880
gcccccgcgc cccctccctc ctccgcaata aacagccaca cgcgccgccc ccatgtccac    5940
cctcatcgcc acagcgcacc accaccacca ccaccaccac caccaccacc gtctccagcc    6000
atg gcc tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac ccc cac      6048
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1               5                   10                  15
gcg gca gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc ccc gtg      6096
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
            20                  25                  30
cag tcg tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg gcg gac      6144
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
        35                  40                  45
gag gcc gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag cgg gag      6192
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
    50                  55                  60
ggc cgg tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg aac ccg      6240
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65                  70                  75                  80
cag gag aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc atg gag      6288
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
                85                  90                  95
ggc ggc atc aag gag ctc gcc aag atg ccc atg gag gag atc gag gcc      6336
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
            100                 105                 110
gac aag ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg ctc ggc      6384
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
        115                 120                 125
ctc ttc cac cgc cgc aag cat cag t gtatgcctct cttctcttgc              6429
Leu Phe His Arg Arg Lys His Gln
    130                 135
tcctctgatc aacacatttt cttgctttcg ttcggttatt tgtcgcgccg aggaagttaa    6489
ttcgccaaga tattctgcag ttttttttct cgatgcacat tcagcaacct aattaagact    6549
gattaagttg ctgtgatttt tatagcttaa ttacggtctc gtgggtaatg actatttata    6609
ttgagtaaac atggttacct ttgatccaat cacttcacct ccatgtgcca tatatagcca    6669
caggctctac caagtaacac tagtaatatg cctgtgatac gccacggtgg cataataaat    6729
cattaaattt tattataatc aaattaagga tcctaaaatt ggtccaattg ggtgttaatt    6789
cgatgcaggt catataaaaa tatattttag gcaaggtgca attcaagagc atcaaccatt    6849
atatccaatc actttaatat atatttgaag ataacatatg tcggaaaaaa aatgatggag    6909
agctatttca ttaacttgtg agcataaaca gatcaccaga tgatgccacc ataagtcccg    6969
ccacagtaag tgatgcagct catcttgccc taggcgttcg gtctaaccag tagatagaaa    7029
gagtacaaca tagatcgaat gaaaaaaaaa atctccagaa gaaagctcaa ccacattgag    7089
taaattagag caacaatcaa atcgagtcag catatcgtta tgttagcaga accaatcacc    7149
acaatttgtt tctcctcttt atctaagtgt tttgccaggt taaaagcata tatcactatg    7209
ttccaagcaa acatcggcaa tggacatgtc aaaaataaat gatcaattgt ttctttgagt    7269
acaaaattga caatggacac tatgttcctt tgttagaatt ctatttgtca gggtaggatg    7329
tagaaaaact taacttttag aggaagctta aatatccggc ataaacttgc tttttcagcg    7389
ctctataaaa taattcaaca gtgaattgtc catcttttct aagtgctcca aaagacacta    7449
agttgaaaaa ccaggtgaac caacagattg atccacaaaa tcttattatt agattattca    7509
cttaaaagcc tgtctttatt tcaaacatat aaaaacagaa gttattaatc agggaagcgc    7569
ttatggcagc ctgagcgaac cagtgatagc aagtggtgaa aacagtaaat aggatacata    7629
aaaattatac aaggtttcta ctgtttatca aaaaaaaata tttgaaaaca gtaaatagga    7689
tacataatcg acttccaact tgtccttatc ataacatcca gaatcacaac aagaattgca    7749
acgaatacat agtcgacttg agctaagaag tcacaagacc tgtcaaagta agctgccctt    7809
gatcttgaag tgaaaggcat attttattgt cttccttggc aaacagatat cactgtcttc    7869
agcagttcag ttagataatc caagatttct cacggagaag agcatatcac tcgcatcagt    7929
gttgtgccct ccaaatactg agataaactg aattttgttc tctttgaagc atctgcaggc    7989
attaacaatt ataatacttt acaaagtttc attgggtcta aactattgtt tgcacatcat    8049
atatatgccc agaacttttt agcatgatac aagggtcctg ttcataactc atgcctaaat    8109
ctgacaaatt tgtcaaacga caatataagt cgaattataa tgcgttttag aattgacgcc    8169
aaaacttttg ctagcgtaag taactcttcc acctcccagc atgcatacaa ccaacaagct    8229
aaacttttgt tcaaaaaaat gtacatttat ttccttgaac acagcctttg tagaatatga    8289
ttaaaaactc atggatgaat gaaataatgt aaaagaatgg tcaaaatgat gaatagtaca    8349
agaagcaact gtgaacattt cacctttacc tgactgttcg caagaaggcc acgtggcaga    8409
aaagccagaa atgcaagaag cttccctaat tgatacacca tcaagaaatc aatggactca    8469
acaccagcgt ctgcccagac aaaatgaatg caggcaccta aaatatagaa ccattgactt    8529
ttcaacactg aattatataa cctgaatatc ttgttttttt aacacatctg acaaaatcag    8589
tgcattctgt tccatataga tgtatgcata gctcccatat gttagttgat cgatgagcat    8649
gcaaactata cacaccttac gttactccct ctgtcaaaaa aaatataagc ttgtctagat    8709
acatagctac aaatgcttat atttttggat tctcttaaag ctgtagaaac ttttatcgcc    8769
ccgccatggc aagtcgagat gccatcccca atgaaagccc ccacacaggt ttcatgccct    8829
gctgcacaat attgagcaac caaaaatata ataatatttg tgtcagaatt tgaatcaacc    8889
ttacagatac tgggtggcca gaaaatctag tccaagtaat atcctgaaaa atagcaactg    8949
gcaaatacta aaggcagtga agagtttcct ttagatcaga tgataaaaaa aaatcatatg    9009
ttcaatagca ataatcactc acattttttt tgctgtttag aatttagata attagtagtt    9069
aaacttctat agcttgcgta gctaagatca atggtgatta ttagttgaaa aaataatcaa    9129
atcatcaaac tgaggagact tatacctgcc ataagttctg aaatttcaat gatcctagtc    9189
aatatttact gtatatatag aattaggtcc aaaagatgat acttacaatt aaggatgttg    9249
tattgatcgg ttcataactc aagcttctat ttatcattaa tcaaaagctg gatcattcat    9309
gcatatacct ttgccgcact caacgtagca gctcggagtc ttctttgttc agaagcgagg    9369
aaggagtcaa caaataagta ctgcaatgtt aaacaaaccg acatatcaaa tcccaaatta    9429
agaatgcatg atttattaat acaggaaata tatgatcaag tcccaaaaag tgagtcatgt    9489
tatgtacact cagtcatcaa tttcaataag aatattaact tgctcattgg tatatggatt    9549
tgattatgac ataatttgac aatacattta cagaataaac ttgcagtgct gtgagcatat    9609
gttactaaca tgtaaggacc ttgttttgct ctgttcaata ctcatgttga tcttgatctg    9669
tgtccacata tacctaaatg aaatgaaatc aaagaatgag gtttgtagga gtggagttgg    9729
tgaattatag ggtagataat gtcggcacaa ccgtttgata agtagtacga gtactttatt    9789
tggcgccacc gcgccagcat cagatgtgtg gcctttgcac tgattgaatc caaaagaaaa    9849
aaaaagtcgt tttggtccca cacaattcta cttcatctgc aggatgtaca gaaggttaca    9909
tatctattct gttctatgct ctgtttacat ttatatttat agtactaggt tgaaagggct    9969
cacttggtgg ctgtcattgg ttggctggtg cggtatatta ctaataggtt ttttaatggc   10029
atatatgttc ttaaaataaa ccagaaaagc aaaagatcaa ctatcttagc cacaccaatg   10089
aaatggaata tactgaactg tcacggctaa aattctcttc agtcacctgg cccaactgga   10149
gccgtgggct cgtcgtcttt tctaaacatg tactagtatt ttgggggccc acagtgaatt   10209
tggcccaaaa tgctgacagc cgctctacgg ctctacgctg tgcag at  ggg cgg ttc   10265
                                                  Tyr Gly Arg Phe
                                                              140
atg atg cgg ctg aag ctg cca aac ggt gtg acg acg agc gag cag acg     10313
Met Met Arg Leu Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr
                145                 150                 155
agg tac ctg gcg agc gtg atc gag gcg tac ggc aag gag ggc tgc gcc     10361
Arg Tyr Leu Ala Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala
            160                 165                 170
gac gtg aca acc cgc cag aac tgg cag atc cgc ggc gtc acg ctc ccc     10409
Asp Val Thr Thr Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro
        175                 180                 185
gac gtg ccg gcc atc ctc gac ggg ctc aac gcc gtc ggc ctc acc agc     10457
Asp Val Pro Ala Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser
    190                 195                 200
ctc cag agc ggc atg gac aac gtc cgc aac ccc gtc ggc aac ccg ctc     10505
Leu Gln Ser Gly Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu
205                 210                 215                 220
gcc ggc atc gac ccc gac gag atc gtc gac acg cga tcc tac acc aac     10553
Ala Gly Ile Asp Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn
                225                 230                 235
ctc ctc tcc tcc tac atc acc agc aac ttc cag ggc aac ccc acc atc     10601
Leu Leu Ser Ser Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile
            240                 245                 250
acc aac ct gtgagtgatc gaatcaaatt gatcatgctc tgtgctgtgc              10649
Thr Asn Leu
tgtttcgtgt cgtctctgac gacatgtttg ttgaatttgt tgttgctgcg tgctgttggc   10709
ag g ccg agg aag tgg aac gtg tgc gtg atc ggg tcg cac gat ctg tac    10757
     Pro Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr
                    260                 265                 270
gag cac cca cac atc aac gac ctc gcg tac atg ccg gcg gtg aag ggc      10805
Glu His Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly
                275                 280                 285
ggc aag ttc ggg ttc aac ctc ctc gtc ggc ggg ttc ata agc ccc aag      10853
Gly Lys Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys
            290                 295                 300
agg tgg gag gag gcg ctg ccg ctc gac gcc tgg gtc ccc ggc gac gac      10901
Arg Trp Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp
        305                 310                 315
atc atc ccg gtg tgc aag gcc gtt ctc gag gcg tac cgc gac ctc ggc      10949
Ile Ile Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly
    320                 325                 330
acc agg ggc aac cgc cag aag acc cgc atg atg tgg ctc atc gac gaa      10997
Thr Arg Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu
335                 340                 345                 350
ctt gtgaaccatt tttttctcca ttcatccacg ccattgactg aattacgtat           11050
Leu
gtcccaatgt tcttatcagt taattgcggt gttggcattg cag gga atg gag gct      11105
                                                Gly Met Glu Ala
                                                            355
ttt cgg tcg gag gtg gag aag agg atg ccg aac ggc gtg ctg gag cgc      11153
Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu Arg
                360                 365                 370
gcg gcg ccg gag gac ctc atc gac aag aaa tgg cag agg agg gac tac      11201
Ala Ala Pro Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp Tyr
            375                 380                 385
ctc ggc gtg cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc ctg      11249
Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly Leu
        390                 395                 400
cac gtg ccc gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc gca      11297
His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu Ala
    405                 410                 415
cgc ctc gcc gac gag tac ggc tcc ggc gag ctc cgc ctc acc gtg gag      11345
Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val Glu
420                 425                 430                 435
cag aac atc gtg atc ccg aac gtc aag aac gag aag gtg gag gcg ctg      11393
Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala Leu
                440                 445                 450
ctc tcc gag ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg ctg      11441
Leu Ser Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu Leu
            455                 460                 465
ctc aag ggc ctc gtc gcg tgc acc ggc aac cag ttc tgc ggc cag gcc      11489
Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln Ala
        470                 475                 480
atc atc gag acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg gag      11537
Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val Glu
    485                 490                 495
aag ctc gtg tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc tgc      11585
Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly Cys
500                 505                 510                 515
ccc aac agc tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg ggc      11633
Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met Gly
                520                 525                 530
tgc ctc acc aag gac agc gcc ggc aag atc gtt gag gcg gcc gac atc      11681
Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp Ile
            535                 540                 545
ttc gtc ggc ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg tac      11729
Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala Tyr
        550                 555                 560
aag aag tcc gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac atc      11777
Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp Ile
    565                 570                 575
ctg gtc gag cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac gag      11825
Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp Glu
580                 585                 590                 595
gag tag gaacacagac tggggtgttt tgcttgctcc ggtgatctct cgccgtcctt       11881
Glu
gtaaagtaga cgacaatatg ccttcgccca tggcacgctt gtactgtcac gttttggttt    11941
gatcttgtag cccaaaagtt gtgttcattc tcgttacagt cttacagagg atgattgatt    12001
gataaataaa gaagaaacag attctgcaac tgttcatcgc tgttcctaaa tctgatttag    12061
cgaaagtatc ttgcctgacc tgtcccaatc gcagtgctaa aaccatataa tcttgcaagc    12121
aaatgaaatt gaaagagttc aatgcaacca ctaacagtct aacaacatga taaggcct      12179
<210>5
<211>2508
<212>DNA
<213>Oryza sativa
<220>
<221>CDS
<222>(519)..(2309)
<223>
<400>5
tatcgaacct tatctccttc tctctcgtcg ctttctgcgt ctccccgtct ctccttcgcc     60
aacagccgag aagaggcaga gagagcgccg ccccccgtcc ctctctctcc ctctcgtcct    120
cgcccccatc cctctcgtct ttcccttgcc ggcagcagag gaggcggcag cgacggcttc    180
agctgctccc acgggccgga tcgggcagtg gcggtggcgt cggcggcttc cgctggcgaa    240
tccggcgggt ggatacaaat cagtgttccg ataggtaaaa ccctgctctc agcatctgcc    300
cttttgaatt cgccaagagc cagcatctgc ccttttgaat tcgccaaggg ccagcatctg    360
cccatttgat tttgaattcg ccaagagcca gcaacagcgc ccccgcgccc cctccctcct    420
ccgcaataaa cagccacacg cgccgccccc atgtccaccc tcatcgccac agcgcaccac    480
caccaccacc accaccacca ccaccaccgt ctccagcc atg gcc tcc tcc gcc tcc    536
                                          Met Ala Ser Ser Ala Ser
                                          1               5
ctg cag cgc ttc ctc ccc ccg tac ccc cac gcg gca gca tcc cgc tgc      584
Leu Gln Arg Phe Leu Pro Pro Tyr Pro His Ala Ala Ala Ser Arg Cys
            10                  15                  20
cgc cct ccc ggc gtc cgc gcc cgc ccc gtg cag tcg tcg acg gtg tcc      632
Arg Pro Pro Gly Val Arg Ala Arg Pro Val Gln Ser Ser Thr Val Ser
        25                  30                  35
gca ccg tcc tcc tcg act ccg gcg gcg gac gag gcc gtg tcg gcg gag      680
Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp Glu Ala Val Ser Ala Glu
    40                  45                  50
cgg ctg gag ccg cgg gtg gag cag cgg gag ggc cgg tac tgg gtg ctc      728
Arg Leu Glu Pro Arg Val Glu Gln Arg Glu Gly Arg Tyr Trp Val Leu
55                  60                  65                  70
aag gag aag tac cgg acg ggg ctg aac ccg cag gag aag gtg aag ctg      776
Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro Gln Glu Lys Val Lys Leu
                75                  80                  85
ggg aag gag ccc atg tca ttg ttc atg gag ggc ggc atc aag gag ctc      824
Gly Lys Glu Pro Met Ser Leu Phe Met Glu Gly Gly Ile Lys Glu Leu
            90                  95                  100
gcc aag atg ccc atg gag gag atc gag gcc gac aag ctc tcc aag gag      872
Ala Lys Met Pro Met Glu Glu Ile Glu Ala Asp Lys Leu Ser Lys Glu
        105                 110                 115
gac atc gac gtg cgg ctc aag tgg ctc ggc ctc ttc cac cgc cgc aag      920
Asp Ile Asp Val Arg Leu Lys Trp Leu Gly Leu Phe His Arg Arg Lys
    120                 125                 130
cat cag tat ggg cgg ttc atg atg cgg ctg aag ctg cca aac ggt gtg      968
His Gln Tyr Gly Arg Phe Met Met Arg Leu Lys Leu Pro Asn Gly Val
135                 140                 145                 150
acg acg agc gag cag acg agg tac ctg gcg agc gtg atc gag gcg tac     1016
Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala Ser Val Ile Glu Ala Tyr
                155                 160                 165
ggc aag gag ggc tgc gcc gac gtg aca acc cgc cag aac tgg cag atc      1064
Gly Lys Glu Gly Cys Ala Asp Val Thr Thr Arg Gln Asn Trp Gln Ile
            170                 175                 180
cgc ggc gtc acg ctc ccc gac gtg ccg gcc atc ctc gac ggg ctc aac      1112
Arg Gly Val Thr Leu Pro Asp Val Pro Ala Ile Leu Asp Gly Leu Asn
        185                 190                 195
gcc gtc ggc ctc acc agc ctc cag agc ggc atg gac aac gtc cgc aac      1160
Ala Val Gly Leu Thr Ser Leu Gln Ser Gly Met Asp Asn Val Arg Asn
    200                 205                 210
ccc gtc ggc aac ccg ctc gcc ggc atc gac ccc gac gag atc gtc gac      1208
Pro Val Gly Asn Pro Leu Ala Gly Ile Asp Pro Asp Glu Ile Val Asp
215                 220                 225                 230
acg cga tcc tac acc aac ctc ctc tcc tcc tac atc acc agc aac ttc      1256
Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser Tyr Ile Thr Ser Asn Phe
                235                 240                 245
cag ggc aac ccc acc atc acc aac ctg ccg agg aag tgg aac gtg tgc      1304
Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro Arg Lys Trp Asn Val Cys
            250                 255                 260
gtg atc ggg tcg cac gat ctg tac gag cac cca cac atc aac gac ctc      1352
Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His Ile Asn Asp Leu
        265                 270                 275
gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg ttc aac ctc ctc      1400
Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly Phe Asn Leu Leu
    280                 285                 290
gtc ggc ggg ttc ata agc ccc aag agg tgg gag gag gcg ctg ccg ctc      1448
Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu Ala Leu Pro Leu
295                 300                 305                 310
gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg tgc aag gcc gtt      1496
Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val Cys Lys Ala Val
                315                 320                 325
ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac cgc cag aag acc      1544
Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn Arg Gln Lys Thr
            330                 335                 340
cgc atg atg tgg ctc atc gac gaa ctt gga atg gag gct ttt cgg tcg      1592
Arg Met Met Trp Leu Ile Asp Glu Leu Gly Met Glu Ala Phe Arg Ser
        345                 350                 355
gag gtg gag aag agg atg ccg aac ggc gtg ctg gag cgc gcg gcg ccg      1640
Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu Arg Ala Ala Pro
    360                 365                 370
gag gac ctc atc gac aag aaa tgg cag agg agg gac tac ctc ggc gtg      1688
Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp Tyr Leu Gly Val
375                 380                 385                 390
cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc ctg cac gtg ccc      1736
His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly Leu His Val Pro
                395                 400                 405
gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc gca cgc ctc gcc      1784
Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu Ala Arg Leu Ala
            410                 415                 420
gac gag tac ggc tcc ggc gag ctc cgc ctc acc gtg gag cag aac atc      1832
Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val Glu Gln Asn Ile
        425                 430                 435
gtg atc ccg aac gtc aag aac gag aag gtg gag gcg ctg ctc tcc gag      1880
Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala Leu Leu Ser Glu
    440                 445                 450
ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg ctg ctc aag ggc      1928
Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu Leu Leu Lys Gly
455                 460                 465                 470
ctc gtc gcg tgc acc ggc aac cag ttc tgc ggc cag gcc atc atc gag      1976
Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln Ala Ile Ile Glu
                475                 480                 485
acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg gag aag ctc gtg      2024
Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val Glu Lys Leu Val
            490                 495                 500
tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc tgc ccc aac agc      2072
Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly Cys Pro Asn Ser
        505                 510                 515
tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg ggc tgc ctc acc      2120
Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met Gly Cys Leu Thr
    520                 525                 530
aag gac agc gcc ggc aag atc gtt gag gcg gcc gac atc ttc gtc ggc      2168
Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp Ile Phe Val Gly
535                 540                 545                 550
ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg tac aag aag tcc      2216
Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala Tyr Lys Lys Ser
                555                 560                 565
gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac atc ctg gtc gag      2264
Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp Ile Leu Val Glu
            570                 575                 580
cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac gag gag tag          2309
Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp Glu Glu
        585                 590                 595
gaacacagac tggggtgttt tgcttgctcc ggtgatctct cgccgtcctt gtaaagtaga    2369
cgacaatatg ccttcgccca tggcacgctt gtactgtcac gttttggttt gatcttgtag    2429
cccaaaagtt gtgttcattc tcgttacagt cttacagagg atgattgatt gataaataaa    2489
gaagaaacag attctgcaa                                                 2508
<210>6
<211>596
<212>PRT
<213>Oryza sativa
<400>6
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1               5                   10                  15
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
            20                  25                  30
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
        35                  40                  45
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
    50                  55                  60
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65                  70                  75                  80
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
                85                  90                  95
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
            100                 105                 110
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
        115                 120                 125
Leu Phe His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu
    130                 135                 140
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145                 150                 155                 160
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
                165                 170                 175
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
            180                 185                 190
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
        195                 200                 205
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
    210                 215                 220
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225                 230                 235                 240
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro
                245                 250                 255
Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His
            260                 265                 270
Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys
        275                 280                 285
Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp
    290                 295                 300
Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile
305                 310                 315                 320
Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg
                325                 330                 335
Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly
            340                 345                 350
Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val
        355                 360                 365
Leu Glu Arg Ala Ala Pro Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg
    370                 375                 380
Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr
385                 390                 395                 400
Val Gly Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe
                405                 410                 415
Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu
            420                 425                 430
Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val
        435                 440                 445
Glu Ala Leu Leu Ser Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro
    450                 455                 460
Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys
465                 470                 475                 480
Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser
                485                 490                 495
Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp
            500                 505                 510
Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly
        515                 520                 525
Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala
    530                 535                 540
Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala
545                 550                 555                 560
Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val
                565                 570                 575
Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu
            580                 585                 590
Glu Asp Glu Glu
        595

Claims (22)

1.一种与植物再生能力有关的DNA,所述DNA是以下(a)-(d)中的任一种:
(a)编码包含SEQ ID NO:3的氨基酸序列的蛋白质的DNA;
(b)包含SEQ ID NO:1或2的核苷酸序列的编码区的DNA;
(c)编码包含在SEQ ID NO:3的氨基酸序列中具有一个或多个氨基酸取代、缺失、添加和/或插入的氨基酸序列的蛋白质的DNA;和
(d)在严格条件下与包含SEQ ID NO:1或2的核苷酸序列的DNA杂交的DNA。
2.编码包含SEQ ID NO:3的氨基酸序列的蛋白质的部分肽的DNA。
3.包含SEQ ID NO:1或2的核苷酸序列的启动子区域的DNA。
4.包含权利要求1或2的DNA的载体。
5.包含权利要求3的DNA的载体。
6.携带权利要求4的载体的宿主细胞。
7.携带权利要求4的载体的植物细胞。
8.包含权利要求7的植物细胞的植物转化体。
9.一种植物转化体,其是权利要求8的植物转化体的后代或克隆。
10.权利要求8或9的植物转化体的繁殖材料。
11.一种用于制备植物转化体的方法,该方法包括将权利要求1或2的DNA导入植物细胞和从所述植物细胞再生植物的步骤。
12.由权利要求1或2的DNA所编码的蛋白质。
13.一种用于制备权利要求12的蛋白质的方法,该方法包括培养权利要求6的宿主细胞并从所述细胞或其培养物上清中收集重组蛋白质的步骤。
14.与权利要求12的蛋白质结合的抗体。
15.包含与SEQ ID NO:1或2的核苷酸序列互补的至少15个连续核苷酸的多核苷酸,或与其互补的序列。
16.一种用于提高植物的再生能力的方法,该方法包括在植物的细胞中表达权利要求1或2的DNA的步骤。
17.一种用于改变植物的再生能力的制剂,该制剂包含权利要求1或2的DNA或权利要求4的载体作为活性成分。
18.一种用于测定植物细胞的再生能力的方法,该方法包括检测权利要求1的DNA或权利要求12的蛋白质在植物细胞中的表达的步骤。
19.一种用于测定植物细胞的再生能力的方法,该方法包括检测权利要求12的蛋白质在植物细胞中的活性的步骤。
20.一种用于提高植物的再生能力的方法,该方法包括调节该植物中的内源性的权利要求12的蛋白质的活性的步骤。
21.一种用于选择转化的植物细胞的方法,该方法包括以下步骤:
(a)将包含用作选择标记的权利要求1或2的DNA的载体导入植物细胞中;和
(b)培养所述植物细胞并选择已经获得再生能力的植物细胞。
22.一种用于改变植物的再生能力的方法,该方法包括通过杂交取代植物中的内源性的权利要求1或2的DNA的步骤。
CNB2004800222181A 2003-07-31 2004-07-30 赋予植物再生能力的基因及其应用 Expired - Fee Related CN100462435C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US49183703P 2003-07-31 2003-07-31
US60/491,837 2003-07-31

Publications (2)

Publication Number Publication Date
CN1842592A true CN1842592A (zh) 2006-10-04
CN100462435C CN100462435C (zh) 2009-02-18

Family

ID=34115557

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2004800222181A Expired - Fee Related CN100462435C (zh) 2003-07-31 2004-07-30 赋予植物再生能力的基因及其应用

Country Status (8)

Country Link
US (1) US7790957B2 (zh)
EP (1) EP1650301B8 (zh)
JP (1) JP3979431B2 (zh)
KR (1) KR101192258B1 (zh)
CN (1) CN100462435C (zh)
AU (1) AU2004261892B2 (zh)
DE (1) DE602004019783D1 (zh)
WO (1) WO2005012520A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104673828B (zh) * 2007-08-15 2018-11-09 英美烟草(投资)有限公司 亚硝酸盐含量降低的植物的产生
WO2022199665A1 (zh) * 2021-03-25 2022-09-29 苏州齐禾生科生物科技有限公司 一种提高植物遗传转化和基因编辑效率的方法

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8160020B2 (en) 2001-06-25 2012-04-17 Airvana Network Solutions, Inc. Radio network control
US8195187B2 (en) 2001-06-25 2012-06-05 Airvana Network Solutions, Inc. Radio network control
US8099504B2 (en) 2005-06-24 2012-01-17 Airvana Network Solutions, Inc. Preserving sessions in a wireless network
US7751835B2 (en) 2005-10-04 2010-07-06 Airvana, Inc. Non-circular paging areas
US8094630B2 (en) 2005-12-16 2012-01-10 Airvana Network Solutions, Inc. Radio frequency dragging prevention
US8619702B2 (en) 2005-12-16 2013-12-31 Ericsson Evdo Inc. Radio network control
US8145221B2 (en) 2005-12-16 2012-03-27 Airvana Network Solutions, Inc. Radio network communication
US8085696B2 (en) 2006-07-14 2011-12-27 Airvana Networks Solutions, Inc. Dynamic modification of route update protocols
JP4368391B2 (ja) * 2007-05-17 2009-11-18 本田技研工業株式会社 イネおよびその作出方法
US8843638B2 (en) 2007-12-13 2014-09-23 Ericsson Evdo Inc. Handing off active connections
CN105132441B (zh) * 2015-09-29 2018-07-06 浙江农林大学 版纳甜龙竹NiR基因及其应用

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07236486A (ja) * 1994-03-02 1995-09-12 Toyota Motor Corp ポプラ属植物の亜硝酸還元酵素遺伝子
KR100797667B1 (ko) 1999-10-04 2008-01-23 메디카고 인코포레이티드 외래 유전자의 전사를 조절하는 방법
AU2002210310A1 (en) * 2000-10-31 2002-05-15 Medicago Inc. Method of selecting plant promoters to control transgene expression

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104673828B (zh) * 2007-08-15 2018-11-09 英美烟草(投资)有限公司 亚硝酸盐含量降低的植物的产生
WO2022199665A1 (zh) * 2021-03-25 2022-09-29 苏州齐禾生科生物科技有限公司 一种提高植物遗传转化和基因编辑效率的方法

Also Published As

Publication number Publication date
EP1650301A1 (en) 2006-04-26
EP1650301A4 (en) 2006-12-06
EP1650301B8 (en) 2009-11-18
CN100462435C (zh) 2009-02-18
KR101192258B1 (ko) 2012-10-17
US20070186302A1 (en) 2007-08-09
DE602004019783D1 (de) 2009-04-16
AU2004261892B2 (en) 2010-11-11
WO2005012520A1 (ja) 2005-02-10
JP3979431B2 (ja) 2007-09-19
US7790957B2 (en) 2010-09-07
AU2004261892A1 (en) 2005-02-10
KR20060052938A (ko) 2006-05-19
JPWO2005012520A1 (ja) 2006-09-21
EP1650301B1 (en) 2009-03-04

Similar Documents

Publication Publication Date Title
CN1170940C (zh) 生长得到改造的植物以及获得此种植物的方法
CN1024021C (zh) 含谷胱甘肽s-转移酶基因的除莠剂耐性植物
CN1054170A (zh) 可繁殖的转基因谷类植物
CN1624135A (zh) 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法
CN1151183A (zh) Rps2基因及其应用
CN1201012C (zh) 改变植物开花时间的方法
CN87106531A (zh) 编码具有除莠剂抗性的植物乙酰乳酸合酶的核酸片段
CN1193355A (zh) 种子中氨基酸组成的改变
CN1930293A (zh) 具有降低的饱和脂肪酸水平的转基因植物及其制备方法
CN1753992A (zh) 种子中蛋白质含量降低的植物及其制备方法和利用方法
CN1842592A (zh) 赋予植物再分化能力的基因及其应用
CN1844396A (zh) 调控水稻分蘖角度的基因及其编码蛋白与应用
CN1420932A (zh) 由表达serk相互作用蛋白质实现无融合生殖
CN1582335A (zh) 水稻转座子基因
CN1807453A (zh) 一种白叶枯病抗性相关蛋白及其编码基因与应用
CN1751065A (zh) 棉蚜(Aphis gossypii)抗性基因
CN1289523C (zh) 水稻钾、钠离子转运基因及其应用
CN101037696A (zh) 一种水稻冷害基因及应用
CN100339479C (zh) 参与油菜素类固醇合成的基因
CN1810977A (zh) 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸
CN1297666C (zh) 植物转录阻遏物,结合其的蛋白质核因子,及它们的应用
CN1854154A (zh) 一种稻瘟病抗性相关蛋白及其编码基因与应用
CN1289664C (zh) 可变盐单胞菌高抗草苷膦的epsp合酶及其编码序列
CN1566146A (zh) 水稻茎杆伸长基因及其编码蛋白和用途
CN1869232A (zh) 一种水稻杂种育性基因及其应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20090218

Termination date: 20190730