CN1842592A - 赋予植物再分化能力的基因及其应用 - Google Patents
赋予植物再分化能力的基因及其应用 Download PDFInfo
- Publication number
- CN1842592A CN1842592A CNA2004800222181A CN200480022218A CN1842592A CN 1842592 A CN1842592 A CN 1842592A CN A2004800222181 A CNA2004800222181 A CN A2004800222181A CN 200480022218 A CN200480022218 A CN 200480022218A CN 1842592 A CN1842592 A CN 1842592A
- Authority
- CN
- China
- Prior art keywords
- leu
- val
- gly
- ala
- glu
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
- C12N15/821—Non-antibiotic resistance markers, e.g. morphogenetic, metabolic markers
-
- A—HUMAN NECESSITIES
- A01—AGRICULTURE; FORESTRY; ANIMAL HUSBANDRY; HUNTING; TRAPPING; FISHING
- A01H—NEW PLANTS OR NON-TRANSGENIC PROCESSES FOR OBTAINING THEM; PLANT REPRODUCTION BY TISSUE CULTURE TECHNIQUES
- A01H4/00—Plant reproduction by tissue culture techniques ; Tissue culture techniques therefor
- A01H4/008—Methods for regeneration to complete plants
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07H—SUGARS; DERIVATIVES THEREOF; NUCLEOSIDES; NUCLEOTIDES; NUCLEIC ACIDS
- C07H21/00—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids
- C07H21/04—Compounds containing two or more mononucleotide units having separate phosphate or polyphosphate groups linked by saccharide radicals of nucleoside groups, e.g. nucleic acids with deoxyribosyl as saccharide radical
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8201—Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
- C12N15/8209—Selection, visualisation of transformants, reporter constructs, e.g. antibiotic resistance markers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0012—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
- C12N9/0044—Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7)
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Cell Biology (AREA)
- Biophysics (AREA)
- Developmental Biology & Embryology (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Botany (AREA)
- Medicinal Chemistry (AREA)
- Gastroenterology & Hepatology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Environmental Sciences (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
Abstract
本发明应用连锁分析成功地分离并鉴定到与植物的再生能力有关的基因。此外,本发明还公开了用于培育高再生性品种的方法、用于转化不可栽培品种的方法和用于选择转化细胞的方法,这些方法都应用了这些基因。本发明在例如栽培品种改良和使用转化方法的基因分析等领域中是有用的。
Description
技术领域
本发明涉及赋予植物再生能力的基因的分离和鉴定,以及应用这些基因提高再生能力和选择转化细胞的方法。本发明可使得植物的培养特性得到改良并可基于安全性方面的特别考虑而开发转化方法。
背景技术
在适当的条件下,分化的植物组织去分化并在经过细胞分裂后形成愈伤组织(去分化细胞群)。依赖于所述的条件,愈伤组织可以进一步再分化以再生为完整的植物体。这种分化细胞或去分化细胞再生为个体的能力被称为分化全能性,在1930-1950年代对烟草、番茄等的培养研究中最初证实了这一点。组织培养技术是基于这一分化全能性,且已被广泛应用,尤其是在植物育种方面。例如,组织培养技术已经被用于通过细胞融合和胚珠培养生产新品种、缩短育种年限和固定遗传特性。近年来,组织培养技术作为以基因功能分析为目的的人工基因转移(转化方法)中的关键技术已成为分子育种和植物的基础研究所必需的。
分化全能性通常被认为是所有植物都拥有的能力。事实上,已知对于某些植物来说展示这一能力是容易的,对于其它植物来说则是困难的,这取决于植物种类、品种或器官。与双子叶植物相比,单子叶植物包括主要农作物例如水稻、小麦和玉米的组织培养和再生是困难的,因此对于培养包括转化方法的分析而言,再三反复实验是必需的。在水稻中,已经利用特定品种的成熟种子确立了一个相对简单的培养系统,但是具有足够的再生能力的品种是有限的。特别地,可食品种例如Koshihikari和Sasanishiki,以及在热带地区广泛栽培的IR品系品种的再生能力低且通过组织培养再生为植物体困难。提高这些品种的再生能力将不仅对于选择育种和基因特性的研究有用,而且还有可能阐明再生过程的机制。此外,其它不可培养的植物种和品种的再生能力也可能得到提高。
此外,近年来已开发了大量经遗传修饰的农产品(GMO),且它们的栽培面积正逐年增加。同时,许多消费者担心这些农产品的安全性。在GMO的安全性问题的讨论中最主要的问题是它们掺入了抗生素抗性基因。因此,开发不使用抗生素抗性基因的转化方法将减轻目前消费者对GMO的担忧,同时作为无需昂贵的抗生素的简单转化方法对于研究人员可能也是有利的。
发明内容
再生能力取决于作为数量性状(QTL:数量性状基因座)的众多基因间的相互作用,但是迄今为止未有关于从那样的基因的基因座成功分离出具有再生能力的基因的报道。本发明的一个目的是分离和鉴定与植物的再生能力有关的基因、提供应用这些基因改良植物的方法以及应用这些基因作为选择标记的转化方法。
在繁殖用于检测具有再生能力的QTL的杂种群体之前,本发明人选择了将用做该杂种群体的亲本的品种。本发明人选择了在再生能力上有明显差异的两个品种:日本水稻(japonica rice)“Koshihikari”和印度水稻(indica rice)“Kasalath”(图1)。将这两个栽培种杂交产生F1个体,然后用Koshihikari作为回归亲本对它们进行回交,并进行自体受精。生成了BCF1群体的99个品系,并收集BC1F2种子。用每一品系的20粒BC1F2种子在诱导培养基中培养愈伤组织30天后,将生长的愈伤组织转移到再生培养基中并再培养30天。30天之后,测量每粒种子的愈伤组织重量和苗数,用每一品系的20粒种子测定平均值。该平均值被当作再生能力(图1)。采用262个PCR标记得出每一品系的基因型。当基于这些数据进行关于再生能力的QTL分析时,检出了4个具有再生能力增加效应的QTL(图2)。在其中一个QTL中,靠近1号染色体的短臂上的TGS2451标记(PSR1;苗再生启动子1)处,成功地发现Kasalath基因组在Koshihikari的再生能力上具有很大的增加效应(图2)。其次,为了鉴定出PSR1基因的大致基因座,从BC2F1群体中选择出其PSR1区域已被Kasalath的PSR1区域取代的30株个体,用来自这些个体的每一株的10粒种子(BC2F2种子)诱导产生愈伤组织。从生长的愈伤组织提取DNA以利用分子标记测定基因型,通过研究再生能力进行连锁分析。此外,为了对该基因座进行详细说明,采用分子标记对大约3,800粒其中PSR1被隔离的BC3F2种子进行基因型调查,并进行高分辨连锁分析。结果,发现PSR1定位于分子标记3132和P182间的大约50.8kb的区域(图3)。在该区域的基因预测表明在该区域存在4个基因,包括一假定的蛋白质。为了测定这些基因中的哪一个是具有再生能力的基因,构建了Kasalath BAC文库(平均长度120kb),通过PCR筛选分离出了一个包含PSR1区域(BHAL15)的BAC克隆。将位于BHAL15克隆中的合适的限制性酶切位点用以制备包含每一候选基因区域的Kasalath基因组片段,并将它们导入到Koshihikari中。结果发现仅当导入了包含被认为编码铁氧还蛋白亚硝酸还原酶(NiR)的基因的Kasalath基因组片段(图3中的3F)时,Koshihikari的再生能力才提高(图4)。铁氧还蛋白亚硝酸还原酶是一种亚硝酸还原酶,其利用铁氧还蛋白作为电子供体发挥功能,并具备将亚硝酸盐转换为氨的作用。测定了被认为是铁氧还蛋白亚硝酸还原酶基因的遗传区域及其大约2kb的上游区的核苷酸序列并与Kasalath和Koshihikari进行比较,在该核苷酸序列内发现了许多的突变(图5)此外,当通过半定量RT-PCR和实时定量PCR对位于愈伤组织中的这一基因的mRNA表达水平进行测定时,Kasalath中的mRNA的量大约是Koshihikari中的该量的2.5倍(图6中左侧照片的顶部和中部和右侧照片)。使用特异于NiR蛋白的抗体进行的Western印迹分析也表明该NiR蛋白在Kasalath中的储存量比在Koshihikari中的储存量更大(图6中左侧照片的底部)。此外,使用萘乙二胺法和在E.coli中表达的NiR重组蛋白比较每单位蛋白的NiR酶活性,Kasalath的NiR酶活性显示出高于Koshihikari的NiR酶活性大约1.6倍(图7)。上述结果表明Koshihikari和Kasalath之间在再生能力上的差异首先归因于两者在NiR基因的转录调节水平上的差异,其次归因于每分子该合成蛋白在活性上的差异。
将Kasalath PSR1基因的基因组区域导入中赋予了不能再生的Koshihikari以再生能力。这表明当转化Koshihikari时Kasalath PSR1基因可以被用做一个选择标记。更特别地,当将已同时插入了KasalathPSR1基因和一靶基因的载体导入到Koshihikari中时,仅已被导入了PSR1基因的那些细胞将获得再生能力,因此再生的植物体将同时具有被掺入的靶基因。为了证明这一观点,构建了携带有于pBI101二元载体的T-DNA区域中的Kasalath NiR基因组+35S启动子GUS、Kasalath NiR启动子∷NiR cDNA∷NiR终止子+35S启动子GUS、水稻Actin1启动子∷NiR cDNA∷NiR终止子+35S启动子GUS的载体和未携带NiR基因的载体,并将其导入到Koshihikari中。当导入3种类型的包含NiR基因的载体时,在所有情况下都获得了大量的再生个体,且在这些再生个体自其衍生而来的愈伤组织中观察到由于GUS基因所产生的着色(图8)。此外,NiR基因具有代谢对植物有毒性的亚硝酸的特性,应用这一特性也使得NiR基因能被用作高再生性品种的转化标记。更特别地,位于肌动蛋白启动子(该启动子是水稻中的一个高表达启动子)控制下的过表达NiR基因的载体被导入到一个高再生性的Kasalath品种中,并在添加有亚硝酸的培养基中进行培养,所添加的亚硝酸的浓度能抑制普通野生型的生长。只有被转化的细胞由于过表达的NiR基因的效应而生长,且GUS染色仅在这些生长的细胞中被观测到(图9)。这一选择方法的使用使得生产不使用衍生自微生物的抗生素抗性基因(转化细胞的选择标记)的更安全的重组植物成为可能,这被认为是传统的遗传修饰的农产品中的问题所在。此外,因为昂贵的抗生素是不必要的,开发转化体的费用被降低。
更特别地,本发明涉及提高植物再生能力的基因的分离和鉴定和通过应用这些基因提高植物的培养特性,以及使用这些基因作为选择标记的转化。本发明提供了下述[1]-[22]个方面:
[1]涉及植物的再生能力的DNA,其中所述DNA是(a)-(d)中的任一个:
(a)编码一种包含SEQ ID NO:3的氨基酸序列的蛋白质的DNA;
(b)包含SEQ ID NO:1或2的核苷酸序列的编码区的DNA;
(c)编码包含SEQ ID NO:3的氨基酸序列中的一个或多个氨基酸取代、缺失、添加和/或插入的氨基酸序列的蛋白质的DNA;和
(d)在严格条件下与包含SEQ ID NO:1或2的核苷酸序列的DNA杂交的DNA;
[2]编码包含SEQ ID NO:3的氨基酸序列的蛋白质的部分肽的DNA;
[3]包含SEQ ID NO:1或2的核苷酸序列的启动子区域的DNA;
[4]包含[1]或[2]的DNA的载体;
[5]包含[3]的DNA的载体;
[6]携带[4]的载体的宿主细胞;
[7]携带[4]的载体的植物细胞;
[8]包含[7]的植物细胞的植物转化体;
[9]是[8]的植物转化体的后代或克隆的植物转化体;
[10][8]或[9]的植物转化体的繁殖材料;
[11]一种用于制备植物转化体的方法,该方法包括将[1]或[2]的DNA导入植物细胞和从所述植物细胞再生植物的步骤;
[12]由[1]或[2]的DNA所编码的蛋白质;
[13]一种用于制备[12]的蛋白质的方法,该方法包括培养[6]所述的宿主细胞并从所述细胞或其培养物上清收集重组蛋白质的步骤;
[14]与[12]的蛋白质结合的抗体;
[15]包含至少15个与SEQ ID NO:1或2的核苷酸序列互补的连续核苷酸的多核苷酸,或与其互补的序列;
[16]一种用于提高植物的再生能力的方法,该方法包括在植物的细胞中表达[1]或[2]的DNA的步骤;
[17]一种用于改变植物的再生能力的制剂,该制剂包含[1]或[2]的DNA或[4]的载体做为活性成分;
[18]一种用于测定植物细胞的再生能力的方法,该方法包括检测[1]的DNA或[12]的蛋白质在植物细胞中的表达的步骤;
[19]一种用于测定植物细胞的再生能力的方法,该方法包括检测[12]的蛋白质在植物细胞中的活性的步骤;
[20]一种用于提高植物的再生能力的方法,该方法包括调节[12]的内源蛋白在该植物中的活性的步骤;
[21]一种用于选择转化的植物细胞的方法,该方法包括以下步骤:
(a)将包含用做选择标记的[1]或[2]的DNA的载体导入植物细胞中;和(b)培养所述植物细胞并选择已经获得再生能力的植物细胞;和
[22]一种用于改变植物的再生能力的方法,该方法包括通过杂交取代植物中的[1]或[2]的内源DNA的步骤。
本发明提供了编码水稻来源的NiR蛋白的DNA。“Kasalath”的基因组DNA的核苷酸序列示于SEQ ID NO:1中,“Kasalath”的cDNA的核苷酸序列示于SEQ ID NO:2中,由该DNA所编码的蛋白质的氨基酸序列示与SEQ ID NO:3中。“Koshihikari”的基因组DNA的核苷酸序列示于SEQ ID NO:4中,“Koshihikari”的cDNA的核苷酸序列示于SEQ ID NO:5中,由该DNA所编码的蛋白质的氨基酸序列示与SEQ ID NO:6中。
本发明表明了植物的再生能力可以通过调节PSR1基因在植物中的表达或活性而提高。这使得不可培养品种例如Koshihikari的培养成为可能,并使得生产稳定且高再生性的品种成为可能。
术语“再生能力的提高”在本发明中仅指在培养条件下植物的再生能力被提高,且再生个体的形式未改变。这一在再生能力上的提高使得可以将所期望的品种用于各种培养试验中,结果使得新品种和基因的功能性分析得到有效的发展。
在本发明中,术语“植物的PSR1基因”指编码植物的铁氧还蛋白亚硝酸还原酶的NiR基因。“植物的PSR1基因”包含水稻的PSR1基因(图5)和来源于其他植物的PSR1基因。编码本发明的PSR1蛋白的DNA包括基因组DNA、cDNA和化学合成的DNA。基因组DNA和cDNA可以根据本领域技术人员所熟知的常规方法制备。更特别的,基因组DNA可以例如按照如下制备:(1)从具有PSR1基因的水稻品种(例如Koshihikari)提取基因组DNA;(2)构建一个基因组文库(应用载体例如质粒、噬菌体、粘粒、BAC和PAC);(3)发展所述文库;和(4)用基于编码本发明的蛋白质的DNA(例如SEQID NO:1或2)制备的探针进行克隆杂交或噬菌斑杂交。或者,可以通过使用特异于编码本发明的蛋白质的DNA(例如SEQ ID NO:1或2)的引物进行PCR植被基因组DNA。另一方面,可以例如按照如下制备cDNA:(1)基于从具有PSR1基因的水稻品种(例如Koshihikari)提取的mRNA合成cDNA;(2)通过将该合成的cDNA插入到载体例如λZAP中制备一个cDNA文库;(3)发展所述cDNA文库;和(4)如上述进行克隆杂交或噬菌斑杂交。或者,也可以通过PCR制备cDNA。
本发明包括编码SEQ ID NO:3的PSR1蛋白的功能性等价物的蛋白(Kasalath)的DNA。在本申请中,术语“PSR1蛋白的功能性等价物”是指对目标蛋白的表达或活性的修饰使得再生能力提高。
这样的DNA的例子包括编码突变体、衍生物、等位基因、变异体和包含SEQ ID NO:3中一个或多个氨基酸被取代、删除、添加和/或插入的氨基酸序列的同源物的那些DNA。
本领域技术人员所熟知的用于制备编码包含被改变的氨基酸的DNA的方法的例子包括定点诱变(Kramer,W.和Fritz,H.-J.,(1987)“Oligonucleotide-directed construction of mutagenesis via gapped duplexDNA.”Methods in Enzymology,154:350-367)。蛋白质的氨基酸序列也可以在自然界中由于核苷酸序列的突变发生突变。编码其中具有一个或多个氨基酸被取代、缺失和/或添加的天然PSR1蛋白的氨基酸序列的蛋白质的DNA也包括在本发明的DNA中,只要它们编码与天然PSR1蛋白(SEQ ID NO:3)功能性等价的蛋白质。此外,不增加蛋白质的氨基酸序列的改变的核苷酸突变体(退行性突变体)也包括在本发明的DNA的范围内。
编码与SEQ ID NO:3中所述的PSR1蛋白的功能性等价性蛋白的DNA可以通过例如本领域技术人员所熟知的方法来制备,包括使用杂交技术的方法(Southern,E.M.,Journal of Molecular Biology,Vol.98,503,1975.)和聚合酶链式反应(PCR)技术(Saiki,R.K.et al.Science,vol.230,1350-1354,1985;Saiki,R.K.et al.Science,vol.239,487-491,1988)。也就是说,通过使用PSR1基因的核苷酸序列(SEQID NO:2)或其一部分作为探针,并使用与PSR1基因的核苷酸序列(SEQ ID NO:2)特异性杂交的寡核苷酸作为引物,从水稻和其他植物分离出与PSR1基因具有高度同源性的DNA对于本领域技术人员来说是很常规的。这样的可通过杂交技术或PCR技术获得的编码与PSR1蛋白功能性等价的蛋白质的DNA也包括在本发明的DNA的范围内。
优选在严格条件下进行杂交反应以分离这样的DNA。本发明的严格杂交条件包括例如6M尿素、0.4%SDS和0.5x SSC这样的条件,和那些产生相似的严格性的条件。期望当在具备较高的严格性的条件下,例如6M尿素、0.4%SDS、和0.1x SSC的条件下进行杂交时获得具有较高同源性的DNA。在这种条件下分离出的那些DNA被期望编码与PSR1蛋白(SEQ ID NO:3或6)具有高水平的氨基酸同源性蛋白质。在本申请中,高同源性的意思是在整个氨基酸序列上具有至少50%或更高的同一性,更优选70%或更高,更加优选90%或更高(例如95%、96%、97%、98%、99%或更高)。一条氨基酸序或核苷酸序列与另一条氨基酸序列或者核苷酸序列的同源性的程度可以遵循由Karlin和Altschul建立的BLAST算法进行测定(Proc.Natl.Acad.Sci.USA 87:2264-2268,1990;Proc.Natl.Acad.Sci.USA,90:5873,1993)。基于BLAST算法开发了例如BLASTN和BLASTX这样的程序(Altschul SF,et al.J.Mol.Biol.215:403,1990)。为了根据BLASTN对核苷酸序列进行测定,参数被设置为例如得分=100和字长=12。另一方面,用于通过BLASTX对氨基酸序列进行分析的参数包括例如得分=50和字长=3。当应用BLAST和缺口BLAST程序时,使用每一程序的缺省值。用于这种分析的特定技术是本领域中已知的。
可以按照如下评估某一特定的DNA是否编码与植物的再生能力有关的蛋白质。最为常规的方法包括检测DNA的功能,然后进行培养并对再生的能力进行调查。更特别低,所述方法包括在维持了DNA的功能的条件下和在DNA失去功能的条件下进行培养,并比较结果产生的再生能力。如果再生能力不发生变化或几乎相同,则该DNA与再生能力无关。当DNA与再生能力相关时,再生率被进一步提高,这一差别被认为是再生能力的程度。
本发明的DNA可以被用于例如制备重组蛋白和生产再生能力被改变的植物转化体。通常通过以下步骤制备重组蛋白:将编码本发明的蛋白质的DNA插入到一合适的表达载体中;将该载体导入到一合适的细胞中;培养该转化细胞;使得所述细胞能够表达所述重组蛋白并纯化所表达的蛋白质。重组蛋白可以与其他蛋白质一起作为融合蛋白被表达以使得能够容易地被纯化,例如作为与麦芽糖结合蛋白在大肠杆菌(Escherichia coli)中的融合蛋白(New England Biolabs,USA,Pmal载体系列)、作为与谷胱甘肽-S-转移酶(GST)的融合蛋白(Amersham Pharmacia Biotech,pGEX载体系列)或用组氨酸标签(Novagen,pET系列)。对宿主细胞没有限制,只要该细胞适于表达该重组蛋白即可。有可能利用酵母或各种动物、植物或昆虫细胞以及上述的大肠杆菌。可以通过多种本领域技术人员已知的方法将载体导入到宿主细胞当中。例如,利用钙离子的转化方法可以被用于将载体导入E.coli中(Mandel,M.和Higa,A.(1970)Journal of MolecularBiology,53,158-162,Hanahan,D.(1983)Journal of Molecular Biology,166,557-580)。在宿主细胞中表达的重组蛋白可以通过已知的方法进行纯化并从宿主细胞或其培养物上清进行回收。当重组蛋白作为与麦芽糖结合蛋白或其他配偶体(partner)的融合蛋白被表达时,所述重组蛋白能够通过亲合层析容易地被纯化。本发明的蛋白质可以从按照下述通过将本发明的DNA导入到植物中所产生的转化植物来制备。因此,如下述,本发明的转化植物不仅包括导入了本发明的DNA以改变其再生能力的植物,而且包括了导入了本发明的DNA以制备本发明的蛋白质的植物。
所得蛋白质可以用于制备与所述蛋白质结合的抗体。例如,可以通过用本发明的纯化蛋白或其一部分对免疫动物例如兔进行免疫、在一定时期后采集血液并除去血液凝块来制备多克隆抗体。可以通过将骨髓瘤细胞与被上述蛋白质或其一部分免疫的动物的抗体生成细胞相融合、分离表达所需抗体的单克隆细胞(杂交瘤)并从所述细胞除去回收所述抗体来制备单克隆抗体。所获得的抗体可以被用于纯化或检测本发明的蛋白质。因此,本发明包括了与本发明的蛋白质相结合的抗体。这些抗体的使用使得可以将与植物体的再生能力相关的蛋白质的表达位点区分出来,或能够测定某一植物种是否表达与再生能力相关的蛋白质。
当应用本发明的DNA来制备再生能力被提高的转化植物时,将编码本发明的蛋白质的DNA被插入到一合适的载体中,随后将该载体导入到植物细胞中。通过这些步骤所获得的转化的植物细胞随后被再生。导入了所述载体的植物细胞优选具有本发明的DNA的低表达的植物细胞。因此,术语“植物细胞”包括各种形式的植物细胞,例如悬浮培养细胞、原生质体、叶的切片(leaf sections)和愈伤组织。
对用于植物细胞转化的载体没有特别的限制,只要它们能在细胞中表达被插入的基因即可。实例包括“pBI121”、“pBI221”和“pBI101”质粒(全部来自Clontech)。
本发明的载体可以包含一个用于组成型或诱导型表达本发明的蛋白质的启动子。用于组成型表达的启动子的例子包括花椰菜花叶病毒的35S启动子(Odell et al.1985 Nature 313:810),水稻的肌动蛋白启动子(Zhang et al.1991 Plant Cell 3:1155)和玉米的遍在蛋白启动子(Comejo et al.1993 Plant Mol.Biol.23:567)。
用于诱导型表达的启动子的实例包括已知的由于外因启动表达的启动子,例如丝状真菌、细菌和病毒的感染和入侵、低温、高温、干燥、紫外线照射和特殊化合物的喷射。这样的启动子的实例包括通过丝状真菌、细菌和病毒的感染和入侵导入的几丁质基因启动子(Xuet al.1996 Plant Mol.Biol.30:387)和烟草PR蛋白基因启动子(Ohshima et al.1990 Plant Cell 2:95)、低温所诱导的水稻“lip19”基因启动子(Aguan et al.1993 Mol.Gen Genet.240:1)、高温所诱导的水稻″hsp 80″基因和″hsp 72″基因启动子(Van Breusegem et al.1994 Planta193:57)、干燥所诱导的拟南芥″rab 16″基因启动子(Nundy et al.,1990Proc.Natl.Acad.Sci.USA 87:1406)、紫外线照射所诱导的查耳酮合酶基因启动子(Schulze-Lefert et al.1989EMBO J.8:651)和厌氧条件所诱导的玉米乙醇脱氢酶基因启动子(Walker et al.,1987 Proc.Natl.Acad.Sci.USA 84:6624)。此外,水稻的几丁质基因启动子和烟草的PR蛋白基因启动子也能被特定的化合物例如水杨酸所诱导,″rab 16″也能通过喷射脱落酸,一种植物激素被诱导。
此外,所述载体可以包含编码本发明的蛋白质的DNA的启动子。编码本发明的蛋白质的DNA的启动子区域可以通过例如用包含SEQID NO:1或2的核苷酸序列或其一部分的DNA作为探针对基因组文库进行筛选获得。
此外,本发明提供了导入了本发明的载体的转化细胞。除了上述用于制备重组蛋白的细胞外,导入了本发明的载体的细胞包括用于制备转化植物的植物细胞。对于所述植物细胞的类型没有特殊的限制,其实例有拟南芥、水稻、玉米、马铃薯和烟草的细胞。除培养的细胞外,本发明的植物细胞包括植物中的细胞以及原生质体、shootprimordia、multiple shoots和发根(hairy root)中的细胞。可以通过已知的方法将载体导入植物细胞中,例如聚乙烯乙二醇方法、电穿孔、农杆菌介导的转移和微粒轰击。根据植物细胞的类型,可以通过已知的方法从转化的植物细胞再生植物(Toki et al.,(1995)Plant Physiol.100:1503-1507)。例如,用于水稻类植物的转化和再生方法包括:(1)用聚乙烯乙二醇将基因导入原生质体中并再生植物体(适于indica水稻品种)(Datta,S.K.(1995)in“Gene Transfer To Plants”,Potrykus Iand Spangenberg Eds.,pp66-74);(2)用电脉冲将基因导入原生质体中并再生植物体(适于japonica水稻品种)(Toki et al.(1992)Plant Physiol.100,1503-1507);(3)通过微粒轰击直接将基因导入细胞中并再生植物体(Christou et al.(1991)Bio/Technology,9:957-962);和(4)用农杆菌将基因导入并再生植物体(Hiei et al.(1994)Plant J.6:271-282)。这些方法是现有技术中已经建立起来的方法并被广泛地应用于本发明所属的技术领域中。这样的方法可以被适当地用于本发明。
已经获得了在其基因组中含有本发明的DNA的转化植物,因而有可能通过有性繁殖或无性繁殖获得该植物的后代。也有可能从所述植物或其后代或克隆获得繁殖材料(例如种子、果实、穗、块茎、块茎状的根、残株、愈伤组织、和原生质体)以基于这样的材料大量生产所述植物。因此,本发明包括导入了本发明的DNA的植物细胞、含有这些细胞的植物、这些植物的后代或克隆以及该植物及其后代和克隆的繁殖材料。
以这种方式制备的其再生能力被修饰的植物相对于野生型植物其再生能力和产量发生变化。例如,其中导入了位于水稻肌动蛋白启动子控制下的编码PSR1蛋白的DNA的植物被期望在其再生能力上有所提高。本发明的方法的使用可以提高水稻的再生能力,这对于农作物而言是有益的。本发明还有益于高再生型水稻品种的开发。
此外,本发明提供了包含与SEQ ID NO:1或2的核苷酸序列互补的至少15个连续核苷酸的多核苷酸或其互补序列。因此,术语“互补序列”是包含A:T和G:C碱基对的双链DNA的一条链的序列相对于另一条链的序列而言。术语“互补”不限制于某一序列与至少15个连续的核苷酸完全互补的情形,还包括其中核苷酸序列同一性为至少70%、优选至少80%、更优选90%、再更优选95%或更高(例如96%或更高、97%或更高、98%或更高、或99%或更高)。这些DNA作为探针有益于检测或分离本发明的DNA,和用做引物扩增所述DNA。
本发明还提供了用于测在植物中是否存在再生能力的遗传诊断方法。在本发明中,“测定在植物中是否存在再生能力”不仅对于测定迄今为止所栽培的品中是否存在再生能力是有效的,而且还包括了测定在通过杂交和遗传工程技术所制备的新品种中是否存在再生能力。这些方法对于测定japonica水稻品种中是否存在再生能力由其有效。
本发明的用于评估在植物中是否存在再生能力的方法包括检测编码PSR1蛋白的DNA和PSR1蛋白的植物表达水平。例如,如果编码PSR1的DNA或PSR1蛋白的表达水平高于在Koshihikari中的表达水平,则所检测的植物被测定为是拥有再生能力的一个品种。
本发明提供了用于在植物的转化中将PSR1基因作为选择标记的方法。先前被用作转化的植物细胞的选择标记基因的实例包括提供对抗生素潮霉素的抗性的潮霉素磷酸转移酶基因、提供对卡那霉素或庆大霉素的抗性的新霉素磷酸转移酶、提供对除草剂膦丝菌素的抗性的乙酰转移酶基因和提供对双丙氨膦(bialaphos)的抗性的双丙氨膦抗性基因。当使用这些基因时,通过在一种已知的选择培养基中进行培养获得转化的植物细胞,所述选择性培养基包含一种与选择标记基因的类型匹配的选择剂。当将PSR1基因而不是这些药物抗性基因用作选择标记时,如果待转化的植物细胞不具备再生能力,如在Koshihikari中,可以使用所获得的再生能力作为选择性状对转化体进行选择,而不使用用于选择的特殊制剂。也就是说,由于非转化体不能够再生,由于PSR1基因的效应而再生的个体被假定为转化体。此外,当使用PSR1基因作为具有再生能力的植物细胞的选择标记时,可以通过向选择培养基中添加一定浓度的亚硝酸盐对具有再生能力的转化细胞进行选择,该亚硝酸盐将抑制非转化体的生长。上述被用于选择转化体的常规药物抗性基因衍生自微生物;因此,保留了这些抗性基因的经遗传修饰的农产品(GMO)已经增加了人们对于其对生态系统和人体所产生的副作用的担忧。但是,使用本发明的PSR1基因用于选择转化体的方法在减轻此类担忧和开发廉价的遗传修饰农作物方面具有优势。
本申请中所引用的所有现有技术文献通过引用合并到本发明中。
附图说明
图1是表示Koshihikari和Kasalath的基因型的一组照片。左侧的照片表示Koshihikari,右侧的照片表示Kasalath。该图将Koshihikari和Kasalath的再生能力用每克愈伤组织的再生个体数表示。
图2表示染色体上的再生能力QTL的位置。
图3表示再生能力QTL的高精度连锁图谱。
图4是表示互补测验结果的一组照片。左侧的照片表示当载体被单独插入Koshihikari中时的结果,右侧照片表示当Kasalat的3F片段被插入到Koshihikari中时发生的再生。
图5表示与Koshihikari NiR基因组序列相比Kasalath NiR基因组的突变位点。示意图中的阿拉伯数字表示插入或缺失的核苷酸数目。黑框表示编码区。垂直线表示取代位点。加外框部分表示在Koshihikari(顶部)和Kasalath(底部)中的NiR基因序列的比较。框内围住的部分表示Koshihikari和Kasalath间的不同氨基酸。粗斜体所示区域表示叶绿体转运肽结构域,虚线下划线所示区域表示铁氧还蛋白结合域,下划线部分表示4Fe-4S簇。
图6是一组照片和比较Koshihikari和Kasalath的愈伤组织中的NiR基因和NiR蛋白的表达水平的图。在左侧照片中,顶部的一行表示由半定量RT-PCR所检测到的NiR基因,中间一行表示用做表达对照组并由定量RT-PCR所检测到的水稻遍在蛋白1基因(Rubq1),底部一行表示使用NiR蛋白抗体进行的Western印迹杂交所检测到的NiR蛋白。右侧图表示将Rubq1基因的表达水平用做内标通过实时定量RT-PCR测量NiR基因的表达水平的结果。RT-PCR引物位点示于图5中。
图7是比较Koshihikari和Kasalath NiR重组蛋白的酶活性的图。
图8是一张示意图和一组表示用于确认NiR基因作为选择标记的效力的试验结果的照片。该示意图表示用于转化的二元载体的T-DNA区域。照片表示当每一载体被导入Koshihikari中时的再生状态。表格表示再生个体中GUS-染色个体的比例。
图9是显示当由于肌动蛋白启动子而过表达NiR基因的载体被导入Kasalath中时,选择愈伤组织的结果的照片。顶部的照片表示愈伤组织选择的结果。由于亚硝酸盐被添加到培养基中,转化体“a”由于过表达的NiR基因效应而生长,而非转化体“b”的愈伤组织生长被抑制。底部的照片表示愈伤组织“a”和“b”的GUS染色结果。
具体实施方式
本发明将用以下实施例进行详细描述,但其不应被理解为对本发明的限制。
实施例1:测验材料的选择和近-同源品系的制备
在培育用于QTL分析的杂种群体之前,选择用做群体亲本的品种。首先研究了水稻的几个品种和印度水稻的几个品种的平均再生能力,并选择了在再生能力上具有显著差别的两个品种:日本水稻“Koshihikari”和印度水稻“Kasalath”(图1)。将日本品种“Koshihikari”和印度品种“Kasalath”杂交制备F1个体。然后用Koshihikari作为回归亲本对这些个体进行回交,并进行自体受精。生成BC1F1群体后,收集BC1F2种子。用来自每一品系的20粒BC1F2种子在诱导培养基中培养愈伤组织30天,然后将生长的愈伤组织转移至再生培养基中。转移30天之后,测量每粒种子的愈伤组织重量和苗数,用每一品系的20粒种子测定平均值。该平均值被当作再生能力(图1)。采用262个PCR标记测定出每一品系的基因型。
当基于这些数据进行关于再生能力的QTL分析时,检出了4个具有再生能力增加效应的QTL(图2)。在其中一个QTL中,靠近1号染色体的短臂上的TGS2451标记(PSR1;苗再生启动子1)处,成功地发现Kasalath基因组在Koshihikari的再生能力上具有很大的增加效应。用重复回交和MAS制备了一个PSR1近-同源品系(Nil-PSR1:用靠近Kasalath染色体1的TGS2451标记的一个区域对Koshihikari染色体进行了取代的一个品系)。对Nil-PSR1和Koshihikari(对照)的再生能力进行调查,确认了QTL(PSR1)的存在。在其中靠近染色体1的短臂上的TGS2451的一个区域被Kasalath的相应区域取代的一个品系中,其再生能力平均增加了14.7倍。
实施例2 使用PSR1的隔离群体进行高精度连锁分析
从BC2F1群体中选择出30个其PSR1区域已被Kasalath的相应区域取代的个体。使用每种种子(BC2F2种子)的10粒种子,并从愈伤组织提取DNA。使用分子标记阐明基因型,并通过调查再生能力进行连锁分析。此外,为了对具体基因座进行详细说明,约3,800粒其中PSR1被分离的BC3F2种子被用于使用分子标记调查基因型,并进行高精度连锁分析。结果,发现PSR1定位于分子标记3132和P182间的约50.8kb区域(图3)。在这一区域的基因预测表明存在4个基因,包括一假定的蛋白质。为了测定这些基因中的那些是再生能力型基因,构建Kasalath BAC文库(平均长度120kb),通过PCR筛选将一包含PSR1区域(BHAL15)的BAC克隆分离出来。BHAL15克隆中合适的限制性酶切位点被用于制备含有各后选基因区域的Kasalath基因组片段,并将它们导入Koshihikari中。结果发现仅当导入了包含被认为编码了铁氧还蛋白亚硝酸还原酶(NiR)的基因的Kasalath基因组片段(图3中的3F)时,Koshihikari的再生能力才提高(图4)。测定了被认为编码了铁氧还蛋白亚硝酸还原酶的遗传区域及其约2kb的上游区的核苷酸序列并与Kasalath和Koshihikari进行比较,在该核苷酸序列内发现了许多的突变(图5)。
实施例3 提高不可栽培品种的培养特性
Kasalath的PSR1基因区域(或使用基因组序列或使用cDNA序列)被导入Koshihikari中以赋予Koshihikari以再生能力,生成高再生性Koshihikari(图4、8和9)。在这种情形中,PSR启动子和一种组成型启动子例如肌动蛋白启动子作为用于表达PSR1基因的启动子是有效的。
实施例4 PSR1基因和PSR1蛋白的表达分析
当通过半定量RT-PCR和实时定量PCR测定愈伤组织中的NiRmRNA表达水平时,Kasalath中的mRNA的量约为Koshihikari中的2.5倍(图6中左侧照片的顶部和中部的行及右图)。使用特异于NiR蛋白的抗体进行的Western印迹分析也表明NiR蛋白在Kasalath中的储存量较Koshihikari中的储存量更大(图6中左侧照片的底部一行)。此外,用萘基乙二胺方法和其表达由大肠杆菌所诱导的NiR重组蛋白比较每单位蛋白的NiR酶活性,Kasalath NiR蛋白显示出比Koshihikari的NiR蛋白的酶活性高约1.6倍(图7)。上述结果表明Koshihikari和Kasalath间在再生能力上的差异主要是由于在NiR基因的转录调节水平上的差异,其次是由于每分子合成蛋白在活性上的差异。
实施例5 使用再生能力作为选择性状进行转化
将Kasalath PSR1基因导入Koshihikari中能够赋予不能再生的Koshihikari以再生能力。这表明当对Koshihikari进行转化时,KasalathPSR1基因可以被用做一个选择标记。更特别地,当串联插入了Kasalath PSR1基因和一靶基因的载体被导入Koshihikari中时,仅那些导入了PSR1基因的细胞将获得再生能力。因此,再生的植物体应该已经同时掺入了靶基因。为了证明这一观点,构建了携带KasalathNiR基因组+35S启动子GUS、Kasalath NiR启动子∷NiR cDNA∷NiR终止子+35S启动子GUS、水稻Actin1启动子∷NiR cDNA∷NiR终止子+位于pBI101二元载体中的T-DNA区域中的35S启动子GUS的载体和不携带NiR基因的载体,并将它们导入Koshihikari中。结果,当导入3种类型的包含NiR基因的载体时,获得了大量的再生个体,且在这些再生个体自其衍生的愈伤组织中观察到由于GUS基因所产生的着色(图8)。
此外,NiR基因具有代谢对植物有毒性的亚硝酸的特性,应用这一特性也使得NiR基因能被用作高再生性品种的转化标记。更特别地,位于肌动蛋白启动子(该启动子是水稻中的一个高表达启动子)控制下的过表达NiR基因的载体被导入到一个高再生性的Kasalath品种中,并在添加有亚硝酸的培养基中进行培养,所添加的亚硝酸的浓度能抑制普通野生型的生长。只有被转化的细胞由于过表达的NiR基因的效应而生长,且GUS染色仅在这些生长的细胞中被观测到(图9)。这一选择方法的使用相对于其中使用衍生自微生物的抗生素抗性基因作为选择标记的传统方法抗生素的费用减低。此外,该方法使得可以生产更加环保的重组植物,因为该再生植物不含有微生物基因。
工业实用性
近来,应用转化方法开发有用的植物和对基因进行功能分析进展迅速。由于转化方法允许超越生理种类的界限使用基因从而可以制备新的植物,这在基于杂交和选择的传统育种中是不可能实现的。此外,由于基因组序列被接连阐明,转化方法也正被用于基因破裂、表达调节分析等以阐明每一基因的功能。通常,当制备植物转化体时,将同时包含待导入的基因和药物抗性标记基因例如抗生素抗性基因的质粒载体通过农杆菌方法或通过电穿孔导入植物细胞中,并通过药物处理选择出转化细胞。选择出来的转化细胞经过细胞生长再生为植物体。因此,为了应用这样的转化方法,必须建立组织培养技术。组织培养技术不仅在转化方法中尤其有用,而且在使用体细胞克隆变异制备突变体、使用细胞融合或胚珠培育栽培品种、遗传特性的固定、缩短育种年限等方面也尤其有用。
培育技术使用得最多的谷物是水稻,但是在品种间存在的在培育特性上的巨大差异被认为是一个问题。特别地,很难在日本培育主要的品种例如Koshihikari和Akitakomachi,以及许多在热带地区栽培的印度品种,因此这些品种不能被用做组织培养的材料。在品种之间在培育特性上的这些差异是在众多的植物中普遍观察到的现象而并非仅限于水稻,但在阐明其原因方面还没有进展。
本申请的发明人分离了与再生能力有关的基因,使得可以通过使用分子标记对高再生性性状进行有效的选择(标记选择育种),并使得可以应用分子生物学方法提高再生能力(分子育种)。此外,将PSR1基因用做选择标记已经使得生产廉价且兼顾环境的植物转化体成为可能。
谷物例如水稻、玉米、小麦和大麦是人类的主要能量来源,也是对人类最重要的植物。这些谷物都属于Poaceae家族,且可能是从一个共同的祖先进化而来。它们相互间具有高度的遗传同源性(基因组同线性)。在这些谷物中,水稻的基因组最小,这也就是为什么水稻被用做谷物的模型植物的原因。水稻基因存在于水稻的亲缘植物例如小麦和玉米的基因组中,分离自水稻的基因可以容易地分离自小麦和玉米。此外,水稻基因可以被直接用于小麦、玉米等的培育。因此,本发明的基因不仅可以应用于水稻还可应用于多种植物品种。
序列表
<110>本田技研工业株式会社
<120>赋予植物再生能力的基因及其应用
<130>H3-A0301P
<150>US 60/491837
<151>2003-07-31
<160>6
<170>PatentIn version 3.1
<210>1
<211>12161
<212>DNA
<213>Oryza sativa
<220>
<221>exon
<222>(6010)..(6418)
<223>
<220>
<221>exon
<222>(10247)..(10601)
<223>
<220>
<221>exon
<222>(10703)..(10991)
<223>
<220>
<221>exon
<222>(11076)..(11813)
<223>
<220>
<221>misc_feature
<222>(4429)..(4429)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4479)..(4479)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4520)..(4520)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4555)..(4555)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4561)..(4561)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4563)..(4563)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4577)..(4578)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(4823)..(4823)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(7186)..(7186)
<223>″n″=a,t,g or c.
<220>
<221>misc_feature
<222>(11994)..(11994)
<223>″n″=a,t,g or c.
<400>1
ctcgagcttt tttgactgcc ctaatcaggc gggttccttg tgggacccac ataatgcttt 60
ttttaatcgc cttcacgggc tgcatgcaaa ctatacggca tgggacttcc actactagaa 120
aaaacgggcg gtcgaaacac gttttcgcag gcaggcaaac cttccacatg tatcttaacg 180
accgtaaaaa tctccaattt tcacaggtgg accacagcac cgttttcgca ggctacattt 240
cgaatcttcc tgggtgctac agtaaaccac ctgcaaaaat actcacggcg ccaaaaaaaa 300
tttccgccag ccccgccccc tccctattca aatcacaaat cacaaattct cacaaatctc 360
atccaaaaac aaaatccaat ccaaaaatcc atacatcaac acaaagcatt ggattcaaat 420
ccacaacatc aatttacaag ttaacatcaa tcaacatgta agctttaaaa cgaaacgtcg 480
tcgtcgccgg caaactcctt tgcatgcggt gccgctgccg cccccctccc cctctgtccg 540
gatttgggag ggagggaggg aggtgtttgc cgccaccacc gccctcccct ctcctcgtag 600
ggccggatct cgggagggag gagaggggag ccgcctccgc acagccatca acgtccgtgc 660
cgccgtcgcc tcgttcgcac caccgccgtt gcttcccctc ctccggccag atctaggagc 720
ggggaggaag agagggggag ccaccgccac cgtcgccccc tcgcgtccgc gccgtcgtca 780
ccgtccacgc cgccgcgtcc gtgccgccgc tgtcgctccc cctcctctgg cgaggaggga 840
gagagaggga gccgtcgcgc cgccgtcgct cccctccttc ggcgaggagg gagagagggg 900
gagggaagag ggatggaggg gaggagagtg gcgctgagag agagagagag agacgctgag 960
gagaggaaat gagtggtggg gaggggtgga ggagaagata aggaggactt agattttttt 1020
ttgggtaggt atgatttttg caggcggacc acataaggtt ccgcctgcga aaatcaattt 1080
tttcacgcag accacttaag aggtccgcat gcgaaaataa aggtattttt ttaggcagac 1140
ctcttaagtg gtccgcctgg aaaaattgat tttcacaagc agatgacgaa aattcacccc 1200
ggtttatatt ttcgaagatg cttcatcgac gacatcgacc gcgtcctcta tgacggcaac 1260
gaccgcgtca ccgacaacgg catcgatcac gtcatctacg atgacaacga ctgcatcaac 1320
tccgcatcac tattgtgatg actgttacat ggcgtagaag aaccaaccaa agtggtggcc 1380
tcatcgccaa cgacgtcctc tgacatatgc aagacgtccc caatggcatc ctcagacatc 1440
tacaaggtgc aagatgctaa caattacagt ttttgtcttc acactgtggc ataaatattt 1500
tttttcgcct tcggctatat tcggctacac ctacaaccac ggttactaca tgatcggctc 1560
catcaacgaa catctataac aacaatcatt gacggaaact ccagtcaaga gcgtctgtgt 1620
catcgctatc ttccatgaca ctcccgctat gactacgtga gggaatagag gagagtcaag 1680
ggacgacacg gaaggagacg taggcaccag gtggaggacc gtccatcaaa gatgcaattg 1740
atgatggtga gttgaagaag atgaagaaat aaaagatttc aaatccagtc gcaatcgttc 1800
gcttcgctcc cgttacgact gagggggaat gttagaagca tagatatatt aattggagat 1860
aagagtcata caaatataga gataagatat catcctagag atagaattct atagataaaa 1920
tagagtccta gagataaatc tactcttact tgtaccccta tatatacccc atgagaggat 1980
caatgcaata caccgagaat acaacaatta gattttttta cagttgtaac tatgatacgt 2040
tgtaatatgc tggatcgggg aagagcgccc gtaatcagtg ccccagagat gtaggtctcg 2100
gctgaactcc attatcaaat accgtacctc ggtgttgtca tcatgtttga atcttctatg 2160
acgtttcttt tgcattcggt tttcgatgtg acttcagggc tggttttata ataatgatta 2220
tagtgctgtg acggcaatcg gttgtgagaa ttagctattc gggtccctcc atgtgatttt 2280
cttgtgattg ggatgtatgg taatgctagg gttttaaggt gtaggattgg tgcatgagag 2340
atcatcactt cacttgtatg accttctctc cttttatatt tttttatcat tctctccttt 2400
tttttataat gctactgaac tagtggaata caggggacta atgcaaaata aaagaaaagt 2460
atcactggtc acggcataca atttagaaag tgtgtgattt aggcatagag ctgaccacga 2520
ccctttacga cttggtcgct cggtttgtta gacgatagat caaccaacaa aagctacgat 2580
acatgatgta cgtgtcagga tacaaatcct tacaaataac aacagttatt gttcgataac 2640
ttttatcagt tgtctaggct taccaatgta taatagaaga tgaaaattcc atattactgg 2700
tatcgatcaa tgctagtaac tctttgagct ttgtctaggt taaaaaaaat tatggatcca 2760
ccatcacaaa aatgaaaaac accggggaaa acaaaaaacc atttaataac agcacaagac 2820
aaaatgatgt taccgtctac ccgagctcct actccgtacc agcacaacca aacgaacagt 2880
acccgccggg tcaggggcac gttcgtaaat ttccctcccg tggctggctg gctgccatct 2940
ctctcagcca gggttggtaa tttcggccgt ttcggtgggt cccgatagta aatgagctcc 3000
agtcaaaacg ccctctgcct cccctcattg cgccacacgc acaccgcatc tagatccaga 3060
tcgaaaaaat cgccatctcg ccgagtcgcc agtcgccgcc tcaacgccgg tcgccgtacc 3120
gccggcgctg cacgcccccc tccaagccgt cgccccatcg cccccagccg cccggtggtg 3180
gggcagcgga tgccgagctt ggcgaggttg ccgaggacga accaggcgag gaggacgagg 3240
atcttgtcga cgagccagag cgggagccac gccatgagca acacggcgag ctcgaacgtg 3300
gacttgccga gcacctcgcc agggaggacg tggacggcgt cgcgcaccac catcgccggg 3360
agggcgctgt ggtcgcagag gtcgagcgac accaccatgc cggagttgcc gcacccgacg 3420
acgagcacct tcttgccgcg gtacgcctcg ccggacttgt agaccgcgac atgcatcacc 3480
tcgctgctat atttgttctt ggactgtgga gacttgctgt cagtgggtgt gttcagaatt 3540
gctgctgcag cttgcagcga atttgtgatg cagcagctac agcttgtatg gctgccgagt 3600
agagcgagtg ttgctatctg ttttttgttc tctttttcag aaatttcgcc cgcaaatttt 3660
aaatttgaat tcaaattttt aaaagaacta gcaaatatgc ccgtgcgttg caccgggtga 3720
atatcaaaca aatattgatg ggtaagattg cttgtgtact tataacacat atgcacaaaa 3780
atattgaata tgtacatacc tcgcaaatat ctccaaattt tatacatatg agttgtgtaa 3840
atcgtgtgag ttccatattg tcatgttgat atggagtatt actgatgagc ccatctatgg 3900
tgataatttt ggaggttgta gctcaacgaa tttgtatttg ctatgtatct caacgttgat 3960
aagtcactac cacaaccatc ggcgaccttt ctcgggatcc aagcatgttg accccgccaa 4020
cgtggcgtcg gtgcagggca ccgagatgaa caccacgggg ctatgtgcct gtccagggtc 4080
atcctaggct taaggccacg acactcaagg acgtggtggg cggcgtcgcg gaggtgctcc 4140
aagcgaacaa gctggccacc aaggaggacg ccgacaaggt ggcggccacc gctatgcaga 4200
acgatgggag gcacgccggt gacgacaagg agctaacacg atccatttag tcccgatccg 4260
agttgatcag gaattcaatc ctgcaccttg cggttacgtt tttcttctcc gcgggaaaag 4320
caatcaccga tggtagggac aaagtgtgtg tgagaacgga ggccaggcca aagtgcgtgc 4380
gagaacggag gctaggccat cgctggattg gatttacgaa tgaaatatng atgtgacgaa 4440
cagaaaatta tcagtttgat ttaattttca taatcgganc tctttaatag gaaaaaaaat 4500
tacatgtacg ttccttcatn gtgcccatgt ccatccggga gtccaggttt attcncaaag 4560
ncncaatcaa cagctannaa tccatgtcct tccccgccgt tccctactct gctttttttt 4620
ctttcatttg aaaccttccg ctatgaattt ctagtcgttc ctagcatcca cgcacacaaa 4680
atagatttcc ctcgcaaggc aaaacataca aatatgagtg catgcaagat attacaaacc 4740
caatccatta aaaatagaac ataattaact ttagcctacc tatctcaata ttggtatatg 4800
cccaaactca aaaggagaaa aancaaacta aaacttttaa taaagtgacc ccaagagata 4860
aaaaggtgat agtaacaaca aaatctcact tgacaatgtc gttgatcagc actattttta 4920
aatattactt aaaaatcttt atatttacct attaaaacaa tgaaaaacag aagatgtttc 4980
ttttttattt acaacagcgt tgtatttagt catgtcctat ctaagagaga aaaatgaatt 5040
taacgaaaag aagctcagaa aaaaaaaaga gaacagggcc accacaccag taatccctat 5100
gttatcaatg aaaaaaaatt tcaatgctag gttttttata agaaaaggtg ataaagtgtt 5160
gaaaaataca gcaggaaatt atatatcttg ctggtttaac attaattcaa gcatatagat 5220
ataaaaatat atcaggctag gaaaggaaaa ggataaaatt ggagagaaaa aggaaaagaa 5280
cagtagagga taaccagcaa aaagatgaaa ggattcgaac ccatgaccta gcgttacaat 5340
tgtttcacag gctaaccaat cgagaatcat cgacgtagtg taatcttgtg tagctacatt 5400
tgaaaaaata tgttttgagc tgaacgttgg tgtgtccgcc cctgcatccg atacatgttg 5460
gagcgtggag cgcggtaata tctccttctc tctcgtcgct ttctgcgtct ccccgtctct 5520
ccttcgccaa cagccgagaa gaggcagaga gagcgccgcc ccccgtccct ctctctccct 5580
ctcgtcctcg cccccatccc tctcgtcttt cccttgccgg cagcagagga ggcggcagcg 5640
acggcttcag ctgctcccac gggccggatc gggcagtggc ggtggcgtcg gcggcttccg 5700
ctggcgaatc cggcgggtga atcgggtgaa atttgggtga cccccgatac aaatcagtgt 5760
tccgataggt aataccctgc tctcagcatc tgcccttttg aattcgccaa gagccagcat 5820
ctgccctttt gaattcgcca agggccagca tctgcccatt tgattttgaa ttcgccaaga 5880
gccagcaaca gcgcccccgc gccccctccc tcctccgcaa taaacagcca cacgcgccgc 5940
ccccatgtcc accctcatcg ccacagcgca ccaccaccac caccaccacc accaccaccg 6000
tctccagcc atg gcc tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac 6051
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr
1 5 10
ccc cac gcg gca gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc 6099
Pro His Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg
15 20 25 30
ccc gtg cag tcg tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg 6147
Pro Val Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala
35 40 45
gcg gac gag gcc gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag 6195
Ala Asp Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln
50 55 6O
cgg gag ggc cgg tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg 6243
Arg Glu Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu
65 70 75
aac ccg cag gag aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc 6291
Asn Pro Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe
80 85 90
atg gag ggc ggc atc aag gag ctc gcc aag atg ccc atg gag gag atc 6339
Met Glu Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile
95 100 105 110
gag gcc gac aag ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg 6387
Glu Ala Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp
115 120 125
ctc ggc ctc ttc cac cgc cgc aag cat cag t gtatgcctct cttctcttgc 6438
Leu Gly Leu Phe His Arg Arg Lys His Gln
130 135
tcctctgatc aacacatttt cttgctttcg ttcggttatt tgtcgcgccg aggaagttaa 6498
ttcgccaaga tattctgcag ttttttttct cgatgcacat tcagcaacct aattaagact 6558
gattaagttg ctgtgatttt tatagcttaa ttacggtctc gtgggtaatg actatttata 6618
ttgagtaaac atggttacct ttgatccaat cacttcacct ccatgtgcca tatatagcca 6678
caggctctac caagtaacac tagtaatatg cccgtgctac gacacggtgg cataataaat 6738
cattaaattt tattataatc aaattaagga tcctaaaatt ggtccaattg ggtgttaatt 6798
cgatgcaggt catataaaaa tatattttag gcaaggtgca attcaagagc atcaaccatt 6858
atatccaatc actttaatat atatttgaag ataacatatg tcggaaaaaa aatgatggag 6918
agctatttca ttaacttgtg agcataaaca gatcaccaga tgatgccacc ataagtcccg 6978
ccacagtaag tgatgcagct catcttgccc taggcgttcg gtctaaccag tagatagaaa 7038
gagtacaaca tagatcgaat gaaaaaaaaa atctccagaa gaaagctcaa ccacattgag 7098
taaattagag caacaatcaa atcgagtcag catatcgtta tgttagcaga accaatcacc 7158
acaatttgtt tctcctcttt atctaagngt tttggccagg ttaaaagcat atatcactat 7218
gttccaagca aacatcggca atggacacgt caaaaataaa tgatcaattg tttctttgag 7278
tacaaaattg acaatggaca ctatgttcct ttgttagaat tctatttgtc agggtaggat 7338
gtagaaaaac ttaactttta gaggaagctt aaatatccgg cataaacttg ctttttcagc 7398
gctctataaa ataattcaac agtgaattgt ccatcttttc taagtgctcc aaaagacact 7458
aagttgaaaa accaggtgaa ccaacagatt gatccacaaa atcttattat tagattattc 7518
acttaaaagc ctgtctttat ttcaaacata taaaaacaga agttattaat cagggaagcg 7578
cttatggcag cctgagcgaa ccagtgatag caagtggtga aaacagtaaa taggatacat 7638
aaaaattata caaggtttct actgtttatc gaaaaaaaat atttgaaaac agtaaatagg 7698
atacataatc gacttccaac ttgtccttat cataacatcc agaatcacaa caagaattgc 7758
aacgaataca tagtcgactt gagctaagaa gtcacaagac ctgtcaaagt aagctgccct 7818
tgatcttgaa gtgaaaggca tattttattg tcttccttgg caaacagata tcactgtctt 7878
cagcagttca gttagataat ccaagatttc tcacggagaa gagcatatca ctcacatcag 7938
tgttgtgccc tccaaatact gagataaact gaattttgtt ctctttgaag catctgcagg 7998
cattaacaat aataatactt tacaaagttt cattgggtct aaactattgt ttgcacatca 8058
tatatatgcc cagaactttt tagcatgata caagggtcct gttcataact catgcctaaa 8118
tctgacaaat ttgtcaaacg acaatataag tcgaattata atgcgtttta gaattgacgc 8178
caaaactttt gctagcgtaa gtaactcttc cacctcccag catgcataca accaacaagc 8238
taaacttttg ttcaaaaaaa tgtacattta tttccttgaa cacagccttt gtagaatatg 8298
attaaaaact catggatgaa tgaaataatg taaaagaatg gtcaaaatga tgaatagtac 8358
aagaagcaac tgtgaacatt tcacctttac ctgactgttc gcaagaaggc cacgtggcag 8418
aaaagccaga aatgcaagaa gcttccctaa ttgatacacc atcaagaaat caatggactc 8478
aacaccagcg tccgcccaga caaaatgaat gcaggcacct aaaatataga accattgact 8538
tttcaacact gaattatata acctgaatat cttgttttgt taacacatct gacaaaatca 8598
gtgcattctg ttccatatag atgtatgcat agctcccata tgttagttga tcgatgagca 8658
tgcaaactat acacacctta cgttactccc tctgtcaaaa aaaatataag cttgtctaga 8718
tacatagcta caaatgctta tatttttgga ttctcttaaa gctgtagaaa cttttatcgc 8778
cccgccatgg caagtcgagc tgccatcccc aatgaaagcc cccacacagg tttcatgccc 8838
tgctgcacaa tattgagcaa ccaaaaatat aataatattt gtgtcagaat ttgaatcaac 8898
cttacagata ctgggtggcc agaaaatcta gtccaagtaa tatcctgaaa aatagcaact 8958
ggcaaatact aaaggcagtg aagagtttcc tttagatcag atgataaaaa aaaatcatat 9018
gttcaatagc aataatcact cacatttttt ttgctgttta gaatttagat aaatagtagt 9078
taaacttcta tagcttgcgt agctaagatc aatggtgatt attagttgaa aaaataatca 9138
aatcatcaaa ctgaggagac ttatacctgc cataagttct gaaatttcaa tgatcctagt 9198
caatatttac tgtatatata gaattaggtc caaaagatga tacttacaat taaggatgtt 9258
gtattgatcg gttcataact caagcttcta tttatcatta atcaaaagct ggatcattca 9318
tgcatatacc tttgccgcac tcaacatagc agctcggagt cttctttgtt cagaagcgag 9378
gaaggagtca acaaataagt actgcaatgt taaacaaacc gacatatcaa atcccaaatt 9438
aagaatgcat gatttattaa tacaggaaat atatgatcaa gtcccaaaaa gtgagtcatg 9498
ttatgtacac tcagtcatca atttcaataa gaatattaac ttgctcattg gtatatggat 9558
ttgattatga cataatttga caatacattt acagaataaa cttgcagtgc tgtgagcata 9618
tgttactaac atgtaaggac cttgttttgc tctgttcaat actcatgttg atcttgatct 9678
gtgtccacat atacctaaat gaaatgaaat caaagaatga ggtttgtagg agtggagttg 9738
gtgaattata gggtagataa tgtcggcaca accgtttgat aagtagtacg agtactttat 9798
ttggcgccac cgcgccagca tcagatgtgt ggcctttgca ctgattgaac ccaaaagaaa 9858
aaaaaaagtc gttttggtcc cacacaattc tacttcatct gcaggatgta cagaaggtta 9918
catatctatt ctgttctatg ctctgtttac atttataagg gctcacttgg tggctgtcat 9978
tggttggctg gtgcggtata ttactaatag gttttttaat ggcatatatg ttcttaaaat 10038
aaaccagaaa agcaaaagat caactatctt agccacacca atgaaatgga atatactgaa 10098
ctgtcacggc taaaattctc ttcagtcacc tggcccagct ggagccgtgg gctcgtcgtc 10158
ttttctaaac atgtactagt attttggggg cccacagtga atttggccca aaatgctgac 10218
agccgctcta cggctctacg ctgtgcag at ggg cgg ttc atg atg cgg ctg 10269
Tyr Gly Arg Phe Met Met Arg Leu
140
aag ctg cca aac ggt gtg acg acg agc gag cag acg agg tac ctg gcg 10317
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145 150 155 160
agc gtg atc gag gcg tac ggc aag gag ggc tgc gcc gac gtg aca acc 10365
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
165 170 175
cgc cag aac tgg cag atc cgc ggc gtc acg ctc ccc gac gtg ccg gcc 10413
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
180 185 190
atc ctc gac ggg ctc aac gcc gtc ggc ctc acc agc ctc cag agc ggc 10461
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
195 200 205
atg gac aac gtc cgc aac ccc gtc ggc aac ccg ctc gcc ggc atc gac 10509
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
210 215 220
ccc gac gag atc gtc gac acg cga tcc tac acc aac ctc ctc tcc tcc 10557
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225 230 235 240
tac atc acc agc aac ttc cag ggc aac ccc acc atc acc aac ct 10601
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu
245 250
gtgagtgatc gaatcaactt gatcatgctc tgtgctgtgc tgttcgtgtc gtctctgacg 10661
acatgtttgt tgaatttgtt gttgctgcgt gctgttggca g g ccg agg aag tgg 10715
Pro Arg Lys Trp
aac gtg tgc gtg atc ggg tcg cac gat ctg tac gag cac ccg cac atc 10763
Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His Ile
260 265 270 275
aac gac ctc gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg ttc 10811
Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly Phe
280 285 290
aac ctc ctt gtc ggc ggg ttc atc agc ccc aag agg tgg gag gag gcg 10859
Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu Ala
295 300 305
ctg ccg ctg gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg tgc 10907
Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val Cys
310 315 320
aag gcc gtt ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac cgc 10955
Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn Arg
325 330 335
cag aag acc cgc atg atg tgg ctc atc gac gaa ctt gtgagcctcc 11001
Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu
340 345 350
attcatccac gccattgact gaattacgta tgtcccaatg ttcttatcag ttaattgcgg 11061
tgttggcatt gcag gga atg gag gct ttt cgg tcg gag gtg gag aag agg 11111
Gly Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg
355 360
atg ccg aac ggc gtg ctg gag cgc gct gcg ccg gac gac ctc atc gac 11159
Met Pro Asn Gly Val Leu Glu Arg Ala Ala Pro Asp Asp Leu Ile Asp
365 370 375
aag aaa tgg cag agg agg gac tac ctc ggc gtg cac ccg cag aag cag 11207
Lys Lys Trp Gln Arg Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln
380 385 390 395
gaa ggg atg tcc tac gtc ggc ctg cac gtg ccc gtc ggc cgg gtg cag 11255
Glu Gly Met Ser Tyr Val Gly Leu His Val Pro Val Gly Arg Val Gln
400 405 410
gcg gcg gac atg ttc gag ctc gcc cgc ctt gcc gac gag tat ggc tcc 11303
Ala Ala Asp Met Phe Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser
415 420 425
ggc gag ctc cgc ctc acc gtg gag cag aac atc gtg atc ccg aac gtc 11351
Gly Glu Leu Arg Leu Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val
430 435 440
aag aac gag aag gtg gag gcg ctg ctc gcc gag ccg ctg ctt cag aag 11399
Lys Asn Glu Lys Val Glu Ala Leu Leu Ala Glu Pro Leu Leu Gln Lys
445 450 455
ttc tcc ccg cag ccg tcg ctg ctg ctc aag ggc ctg gtc gcg tgc acc 11447
Phe Ser Pro Gln Pro Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr
460 465 470 475
ggc aac cag ttc tgc ggc cag gcc atc atc gag acg aag cag cgg gcg 11495
Gly Asn Gln Phe Cys Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala
480 485 490
ctg ctg gtg acg tcg cag gtg gag aag ctc gtg tcg gtg ccc cgg gcg 11543
Leu Leu Val Thr Ser Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala
495 500 505
gtg cgg atg cac tgg acc ggc tgc ccc aac agc tgc ggc cag gtg cag 11591
Val Arg Met His Trp Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln
510 515 520
gtc gcc gac atc ggc ttc atg ggc tgc ctc acc aag gat agc gcc ggc 11639
Val Ala Asp Ile Gly Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly
525 530 535
aag atc gtc gag gcg gcc gac atc ttc gtc ggc ggc cgc gtc ggc agc 11687
Lys Ile Val Glu Ala Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser
540 545 550 555
gac tcg cac ctc gcc ggc gcg tac aag aag tcc gtg ccg tgc gac gag 11735
Asp Ser His Leu Ala Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu
560 565 570
ctg gcg ccg atc gtc gcc gac atc ctg gtc gag cgg ttc ggg gcc gtg 11783
Leu Ala Pro Ile Val Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val
575 580 585
cgg agg gag agg gag gag gac gag gag tag gagcacagac tggggtggtt 11833
Arg Arg Glu Arg Glu Glu Asp Glu Glu
590 595
tgcttgctcc ggtgatctct cgccgtcctt gtaaagtaga cgacaatatg ccttcgccca 11893
tggcacgctt gtactgtcac gttttggttt gatcttgtag cccaaaagtt gtgttcattc 11953
tcgttacagt cttacagagg atgattgatt gataaataaa naagaaacag attctgcaac 12013
tgttcatcgc tgttcctaaa tctgatttcg cgatagtatc ttgtctgacc tgtcccaatc 12073
gcagtgctaa aaccatataa tcttgcaagc aaatgaaatt gaaagagttc aatgcaacca 12133
ctaacggtct aacaacatga taaggcct 12161
<210>2
<211>2519
<212>DNA
<213>Oryza sativa
<220>
<221>CDS
<222>(532)..(2322)
<223>
<400>2
tatctccttc tctctcgtcg ctttctgcgt ctccccgtct ctccttcgcc aacagccgag 60
aagaggcaga gagagcgccg ccccccgtcc ctctctctcc ctctcgtcct cgcccccatc 120
cctctcgtct ttcccttgcc ggcagcagag gaggcggcag cgacggcttc agctgctccc 180
acgggccgga tcgggcagtg gcggtggcgt cggcggcttc cgctggcgaa tccggcgggt 240
gaatcgggtg aaatttgggt gacccccgat acaaatcagt gttccgatag gtaataccct 300
gctctcagca tctgcccttt tgaattcgcc aagagccagc atctgccctt ttgaattcgc 360
caagggccag catctgccca tttgattttg aattcgccaa gagccagcaa cagcgccccc 420
gcgccccctc cctcctccgc aataaacagc cacacgcgcc gcccccatgt ccaccctcat 480
cgccacagcg caccaccacc accaccacca ccaccaccac cgtctccagc c atg gcc 537
Met Ala
1
tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac ccc cac gcg gca 585
Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His Ala Ala
5 10 15
gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc ccc gtg cag tcg 633
Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val Gln Ser
20 25 30
tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg gcg gac gag gcc 681
Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp Glu Ala
35 40 45 50
gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag cgg gag ggc cgg 729
Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu Gly Arg
55 60 65
tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg aac ccg cag gag 777
Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro Gln Glu
70 75 80
aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc atg gag ggc ggc 825
Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu Gly Gly
85 90 95
atc aag gag ctc gcc aag atg ccc atg gag gag atc gag gcc gac aag 873
Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala Asp Lys
100 105 110
ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg ctc ggc ctc ttc 921
Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly Leu Phe
115 120 125 130
cac cgc cgc aag cat cag tat ggg cgg ttc atg atg cgg ctg aag ctg 969
His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu Lys Leu
135 140 145
cca aac ggt gtg acg acg agc gag cag acg agg tac ctg gcg agc gtg 1017
Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala Ser Val
150 155 160
atc gag gcg tac ggc aag gag ggc tgc gcc gac gtg aca acc cgc cag 1065
Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr Arg Gln
165 170 175
aac tgg cag atc cgc ggc gtc acg ctc ccc gac gtg ccg gcc atc ctc 1113
Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala Ile Leu
180 185 190
gac ggg ctc aac gcc gtc ggc ctc acc agc ctc cag agc ggc atg gac 1161
Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly Met Asp
195 200 205 210
aac gtc cgc aac ccc gtc ggc aac ccg ctc gcc ggc atc gac ccc gac 1209
Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp Pro Asp
215 220 225
gag atc gtc gac acg cga tcc tac acc aac ctc ctc tcc tcc tac atc 1257
Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser Tyr Ile
230 235 240
acc agc aac ttc cag ggc aac ccc acc atc acc aac ctg ccg agg aag 1305
Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro Arg Lys
245 250 255
tgg aac gtg tgc gtg atc ggg tcg cac gat ctg tac gag cac ccg cac 1353
Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His
260 265 270
atc aac gac ctc gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg 1401
Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly
275 280 285 290
ttc aac ctc ctt gtc ggc ggg ttc atc agc ccc aag agg tgg gag gag 1449
Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu
295 300 305
gcg ctg ccg ctg gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg 1497
Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val
310 315 320
tgc aag gcc gtt ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac 1545
Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn
325 330 335
cgc cag aag acc cgc atg atg tgg ctc atc gac gaa ctt gga atg gag 1593
Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly Met Glu
340 345 350
gct ttt cgg tcg gag gtg gag aag agg atg ccg aac ggc gtg ctg gag 1641
Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu
355 360 365 370
cgc gct gcg ccg gac gac ctc atc gac aag aaa tgg cag agg agg gac 1689
Arg Ala Ala Pro Asp Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp
375 380 385
tac ctc ggc gtg cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc 1737
Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly
390 395 400
ctg cac gtg ccc gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc 1785
Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu
405 410 415
gcc cgc ctt gcc gac gag tat ggc tcc ggc gag ctc cgc ctc acc gtg 1833
Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val
420 425 430
gag cag aac atc gtg atc ccg aac gtc aag aac gag aag gtg gag gcg 1881
Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala
435 440 445 450
ctg ctc gcc gag ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg 1929
Leu Leu Ala Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu
455 460 465
ctg ctc aag ggc ctg gtc gcg tgc acc ggc aac cag ttc tgc ggc cag 1977
Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln
470 475 480
gcc atc atc gag acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg 2025
Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val
485 490 495
gag aag ctc gtg tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc 2073
Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly
500 505 510
tgc ccc aac agc tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg 2121
Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met
515 520 525 530
ggc tgc ctc acc aag gac agc gcc ggc aag atc gtc gag gcg gcc gac 2169
Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp
535 540 545
atc ttc gtc ggc ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg 2217
Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala
550 555 560
tac aag aag tcc gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac 2265
Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp
565 570 575
atc ctg gtc gag cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac 2313
Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp
580 585 590
gag gag tag gagcacagac tggggtggtt tgcttgctcc ggtgatctct 2362
Glu Glu
595
cgccgtcctt gtaaagtaga cgacaatatg ccttcgccca tggcacgctt gtactgtcac 2422
gttttggttt gatcttgtag cccaaaagtt gtgttcattc tcgttacagt cttacagagg 2482
atgattgatt gataaataaa gaagaaacag attctgc 2519
<210>3
<211>596
<212>PRT
<213>Oryza sativa
<400>3
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1 5 10 15
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
20 25 30
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
35 40 45
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
50 55 60
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65 70 75 80
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
85 90 95
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
100 105 110
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
115 120 125
Leu Phe His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu
130 135 140
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145 150 155 160
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
165 170 175
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
180 185 190
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
195 200 205
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
210 215 220
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225 230 235 240
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro
245 250 255
Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His
260 265 270
Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys
275 280 285
Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp
290 295 300
Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile
305 310 315 320
Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg
325 330 335
Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly
340 345 350
Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val
355 360 365
Leu Glu Arg Ala Ala Pro Asp Asp Leu Ile Asp Lys Lys Trp Gln Arg
370 375 380
Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr
385 390 395 400
Val Gly Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe
405 410 415
Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu
420 425 430
Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val
435 440 445
Glu Ala Leu Leu Ala Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro
450 455 460
Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys
465 470 475 480
Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser
485 490 495
Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp
500 505 510
Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly
515 520 525
Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala
530 535 540
Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala
545 550 555 560
Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val
565 570 575
Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu
580 585 590
Glu Asp Glu Glu
595
<210>4
<211>12179
<212>DNA
<213>Oryza sativa
<220>
<221>exon
<222>(6001)..(6409)
<223>
<220>
<221>exon
<222>(10255)..(10609)
<223>
<220>
<221>exon
<222>(10712)..(11000)
<223>
<220>
<221>exon
<222>(11094)..(11831)
<223>
<400>4
ctcgagcttt tttgactgcc ctaatcaggc gggttccttg tgggacccac ataatgcttt 60
ttttaatcgc cttcacgggc tgcatgcaaa ctatacggcg tggtacttcc actactagaa 120
aaaacgggct tttcgcaggc gggcaaacct tccgcatgta tattaacgac cgtaaaaatc 180
tccaattttc acaggtggac cccagcaccg cctgcgaaaa taattttcgc aggctgcatt 240
tcgaatcttc ctgggtgcta cagtaaacca cctgcgaaaa tactcacggc gccaaaaaaa 300
aaatttccgc cagccccgcc ccctccctat tcaaatcaca aattctcaca aatctcatcc 360
aaaaacaaaa ttcaatccaa aaatccatac atcaacacaa agcattggat tcaaatccac 420
aacatcaatt tacaagttaa catcaatcaa catgtaagct ttaaaacgaa acgtcgtcgt 480
cgccggcaaa ctccttttgc atgcggtgcc gccgccgccc ccctcccccc tctgtccgga 540
tttgggaggg agggaggtgt ttgccgccac caccgccctc ccctctcctc gtagggccgg 600
atctcgggag ggaggagagg ggagccgcct ccgcacagcc atcaacgtcc gtgccgccgt 660
cgcctcgttc gcaccaccgc cgttgcttcc cctcctccgg ccagatctag gagcggggag 720
gaagagaggg ggagccaccg ccaccgtcgc cccctcgcgt ccgcgccgtc gtcaccgtcc 780
acgccgccgc gtccgtgccg ccgctgtcgc tccccctcct ctggcgagga gggagagaga 840
gggagccgtc gcgccgccgt cgctcccctc cttcggcgag gagggagaga gggggaggga 900
agagggatgg aggggaggag agtggcgctg agagagagag agagagacgc tgaggagagg 960
aaatgagtgg tggggagggg tggaggagaa gataaggagg acttagattt tttttttggg 1020
taagtatgat ttttgcaggc ggaccacata aggttccgcc tgcgaaaatc aattttttcg 1080
cgcagaccac ttaagaggtc cgcatgcgaa aataaaggta tttttttagg cggacctctt 1140
aagtggtccg cctggaaaaa ttgattttcg caagcggatg acgaaaattc accccggttt 1200
atattttcga agatgcttca tcgacgacat cgactgcgtc ctctatgaca gcaacgaccg 1260
cgtcaccgac gacggcatcg atcacgtcat ctacgatgac aatgactgca tcaactccgc 1320
atcactattg tgatgactgt tacacggcgt agaagaacca accaaagtgg tggcttcatc 1380
gccaacgacg tcctctaaca tatgcaagac gtccccaatg gcatcctctg acatctacaa 1440
ggtgcaagat gctaacaatt acagtttttg tcttcacact gtggcataaa tatttttttt 1500
caccttcggc tatatgcggc tacacctaca accacggtta ctacatgatc ggctccatca 1560
acgaacatct ataacaacaa tcattgatgg aaactctagt caaagcgtct gtgtcatcgc 1620
tatcatccat gacactcccg ctatgactac gtgagggaat agataagagt caagggacga 1680
cacggaagga gacgtaggca ccaggtggag gaccatccat caaagatgca attgatgatg 1740
gtgagttgaa gaagatgaag aaataaaata tttcaaatcc agtcgcaatc attcgcttcg 1800
ctcccgttac gactgagggg gaatgttaga agcatagata tattaattgg agataagagt 1860
catacaaata tagagataag atatcatcct agagatagaa tcctagagat aaaatatagt 1920
cctagagata aatctactct tacttgtacc cctatatata ccccatgaga ggatcaatgc 1980
aatacaccga gaatacaaca attagatttt tctacggttg taactataat acgctgtaat 2040
atgctggatc ggggaagagc gcccgtaatc agtgccccag agatgtaggt ctcggttgaa 2100
ctccattatc aaataccgta cctcggtgtc gtcatcatgt ttgaatcttc tatgacgttt 2160
cttttgcatt cggttttcga tgtgacttcg gggctggttt tataacaatg attatagtgc 2220
tgttgacggc aatcggttgt gagaattagc tattcgggtc cctccatgtg attttcttgt 2280
gattgggatg tatggtaatg ctagggtttt aaggtgtagg attggtgcat gagagatcat 2340
cacttcactt gtatgacctt ctctcctttt atattttttt atcattctct cctttttttt 2400
ataatgctac tgaactagtg gaatacaggg gactaatgca aaataaaaga aaagtatcac 2460
tggtcacggc atataattta gaaagtgtgt gatttaggca tagggctgac catgaccctt 2520
tacgacttgg tcgctcggtt tgttagacga tagatcaacc aacaaaagct acgatacatg 2580
atgtacgtgt caggatacaa atccttacaa ataacaacag ttattgttcg ataactatca 2640
gttgtctagg cttaccaatg tataatagaa gatgaaaatt ccatattact ggtatcgttc 2700
aatgctagta actctttgag ctttgtctag gttaaaaaaa aaattatgga tccaccatca 2760
caaaaatgaa aaacaccggg gaaaacaaaa aaccatttga tagcagcaca agacaaaatg 2820
atgttaccgt ctacccgagc tcctactccg taccagcaca accaaacgaa cagtacccgc 2880
cggaccaggg gcacgttcgt aaatttccct cccgtggctg gctggctgcc atctctctca 2940
accagggttg gtaatttcgg ccgtttcggt gggtcccgat agtaaatgag ctccggtcaa 3000
aacgccctcc gcctcccctc attgcgccgc acgcacaccg catctagatc cagatcgaaa 3060
aaatcgctat ctcgccgagt cgccagtcac cgcctcgacg ccggtcgccg taccgccggc 3120
gctgcacgcc cccctccaag ccgtcgcccc atcgccccca gccgcccagt ggtggggcgg 3180
cggatgccga gcttggcgag gttgccgagg acgaaccagg cgaggaggac gaggatcttg 3240
tcgacgagcc agagcgggag ccacgccatg agcaacacgg cgagctcgaa cgtggacttg 3300
ccgagcacct cgccagggag gacgtggacg gcgtcgcgca ccaccatcgc cgggagggcg 3360
ctgtggtcgc acaggtcgag cgacaccacc atgccggagt tgccgcaccc gacgacgagc 3420
accttcttgc cgcggtacgc ctcgccggac ttgtagaccg cgacatgcat cacctcgctg 3480
ctatatttgt tcttggactg tggagacttg ctgtcagtgg gtgtgttcag aattgctgct 3540
gcagcttgca gcgaatttgt gatgcagcag ctgcagcttg tatggctgcc gagtagagcg 3600
agtgttgcta tctgtttttg ttctcttttt cagaaatttc gcccgcaaat tttaaatttg 3660
aattcaaatt tttaaaagaa ctagaaaata tgcccgtgcg ttgcaccggg tgaatatcaa 3720
acaaatattg atgggtaaga ttgcttgtgt acttataaca catatgcaca aaaatattga 3780
atatgtacat acctcgcaaa tatctccaaa ttttatacat atgagttgtg taaatcatgt 3840
gagttccata ttgtcatgtt aatatggagt attactgatg agcccatcta tggtgataat 3900
tttggaggtt gtagctcaac gaatttgtat ttgctatgta tctcaacgtt gataagtcac 3960
tactacaacc atcggcgacc tttctcggga tccaagcatg tcgaccccgc caacgtggcg 4020
tcggtgcagg gcaccgagat gaacaccacg gggctatttg cctgtccagg gtcatcctag 4080
gcttaaggcc acgacactca aggacgtggt aggcggcgtc acagaggtgc tcccagcgaa 4140
caagctggcc accaaggagg acgccgacaa ggtggcggcc accgctatgc agaaacgatg 4200
ggaggcatgc cggtgacgac aaggagctaa cacgatccat ttagtcccga tccgagttta 4260
tcaggaattc aatcctgcac cgtgcggtta cgtttttctt ttccgcggga aaagcaatca 4320
ccgatggtag ggacaaagtg cgtgtgagaa cagaggccag gccaaagtgc gtgcgagaac 4380
ggaggctagg ccatcgctgg attggattta cgaatgaaat atcgatgtga cgaacagaaa 4440
attatcagtt tgatttaatt ttcataatca gaactcttta ataggaaaaa aattacatgt 4500
acgttccttc atcgtgccca tgtccatctg ggagtccagg tttattcaca aagacccaat 4560
caacagccag gaatccatgt ccttccccgc cgttccctac tctgcttttt tttctttcat 4620
ttgaaacctt ccgctatgaa tttctagtcg ttcctagcat ccacgcacac aaaatagatt 4680
tccctcgcaa ggcaaaacat acaaatatga gtgcatgcaa gatattacaa acccaatcca 4740
ttaaaaatag aaaataatta actttagcct acctatctca atattggtat atgcccaaac 4800
tcaaaaggag aaaaaccaaa ctaaaacttt taataaagtg aacccaagag ataaaaaggt 4860
gatagtaaca acaaaatctc acttgacaat gtcgttaatc aacactgttt ttaaatatta 4920
cttaaaaatc tttatattta cctattaaaa caatgaaaaa cagaagatgt ttctttttta 4980
tttacaacag cgttgtattt agtcatgtcc tatctaagag agaaaaatga atttaacgaa 5040
aagaagctca gaaaaaaaaa gagaacaggg ccaccacacc agtaatccct atgttatcaa 5100
tgaaaaaaaa tttcaatgct aggtttttta taagaaaagg tgataaagtg ttgaaaaaat 5160
acagcaggaa attatatatc ttgctggttt aacatgaatt caagcatata gatataaaaa 5220
tatatcaggc taggaaagga aaaggataaa attggagaga aaaaggaaaa gaacagtaga 5280
ggataaccag caaaaagatg aaaggattcg aacccatgac ctagcggtac aattgtttca 5340
caggctaacc aattgagaat catcgacgtt gtgtcatctt gtgtagctac atttgaaaaa 5400
atatgttttg agctgaacgt tggtgtgtcc gcccctgcat ccgatacatg ttggagcgtg 5460
gagcgcggta aagaaaaaat cctatcgaac cttatctcct tctctctcgt cgctttctgc 5520
gtctccccgt ctctccttcg ccaacagccg agaagaggca gagagagcgc cgccccccgt 5580
ccctctctct ccctctcgtc ctcgccccca tccctctcgt ctttcccttg ccggcagcag 5640
aggaggcggc agcgacggct tcagctgctc ccacgggccg gatcgggcag tggcggtggc 5700
gtcggcggct tccgctggcg aatccggcgg gtggatacaa atcagtgttc cgataggtaa 5760
aaccctgctc tcagcatctg cccttttgaa ttcgccaaga gccagcatct gcccttttga 5820
attcgccaag ggccagcatc tgcccatttg attttgaatt cgccaagagc cagcaacagc 5880
gcccccgcgc cccctccctc ctccgcaata aacagccaca cgcgccgccc ccatgtccac 5940
cctcatcgcc acagcgcacc accaccacca ccaccaccac caccaccacc gtctccagcc 6000
atg gcc tcc tcc gcc tcc ctg cag cgc ttc ctc ccc ccg tac ccc cac 6048
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1 5 10 15
gcg gca gca tcc cgc tgc cgc cct ccc ggc gtc cgc gcc cgc ccc gtg 6096
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
20 25 30
cag tcg tcg acg gtg tcc gca ccg tcc tcc tcg act ccg gcg gcg gac 6144
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
35 40 45
gag gcc gtg tcg gcg gag cgg ctg gag ccg cgg gtg gag cag cgg gag 6192
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
50 55 60
ggc cgg tac tgg gtg ctc aag gag aag tac cgg acg ggg ctg aac ccg 6240
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65 70 75 80
cag gag aag gtg aag ctg ggg aag gag ccc atg tca ttg ttc atg gag 6288
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
85 90 95
ggc ggc atc aag gag ctc gcc aag atg ccc atg gag gag atc gag gcc 6336
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
100 105 110
gac aag ctc tcc aag gag gac atc gac gtg cgg ctc aag tgg ctc ggc 6384
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
115 120 125
ctc ttc cac cgc cgc aag cat cag t gtatgcctct cttctcttgc 6429
Leu Phe His Arg Arg Lys His Gln
130 135
tcctctgatc aacacatttt cttgctttcg ttcggttatt tgtcgcgccg aggaagttaa 6489
ttcgccaaga tattctgcag ttttttttct cgatgcacat tcagcaacct aattaagact 6549
gattaagttg ctgtgatttt tatagcttaa ttacggtctc gtgggtaatg actatttata 6609
ttgagtaaac atggttacct ttgatccaat cacttcacct ccatgtgcca tatatagcca 6669
caggctctac caagtaacac tagtaatatg cctgtgatac gccacggtgg cataataaat 6729
cattaaattt tattataatc aaattaagga tcctaaaatt ggtccaattg ggtgttaatt 6789
cgatgcaggt catataaaaa tatattttag gcaaggtgca attcaagagc atcaaccatt 6849
atatccaatc actttaatat atatttgaag ataacatatg tcggaaaaaa aatgatggag 6909
agctatttca ttaacttgtg agcataaaca gatcaccaga tgatgccacc ataagtcccg 6969
ccacagtaag tgatgcagct catcttgccc taggcgttcg gtctaaccag tagatagaaa 7029
gagtacaaca tagatcgaat gaaaaaaaaa atctccagaa gaaagctcaa ccacattgag 7089
taaattagag caacaatcaa atcgagtcag catatcgtta tgttagcaga accaatcacc 7149
acaatttgtt tctcctcttt atctaagtgt tttgccaggt taaaagcata tatcactatg 7209
ttccaagcaa acatcggcaa tggacatgtc aaaaataaat gatcaattgt ttctttgagt 7269
acaaaattga caatggacac tatgttcctt tgttagaatt ctatttgtca gggtaggatg 7329
tagaaaaact taacttttag aggaagctta aatatccggc ataaacttgc tttttcagcg 7389
ctctataaaa taattcaaca gtgaattgtc catcttttct aagtgctcca aaagacacta 7449
agttgaaaaa ccaggtgaac caacagattg atccacaaaa tcttattatt agattattca 7509
cttaaaagcc tgtctttatt tcaaacatat aaaaacagaa gttattaatc agggaagcgc 7569
ttatggcagc ctgagcgaac cagtgatagc aagtggtgaa aacagtaaat aggatacata 7629
aaaattatac aaggtttcta ctgtttatca aaaaaaaata tttgaaaaca gtaaatagga 7689
tacataatcg acttccaact tgtccttatc ataacatcca gaatcacaac aagaattgca 7749
acgaatacat agtcgacttg agctaagaag tcacaagacc tgtcaaagta agctgccctt 7809
gatcttgaag tgaaaggcat attttattgt cttccttggc aaacagatat cactgtcttc 7869
agcagttcag ttagataatc caagatttct cacggagaag agcatatcac tcgcatcagt 7929
gttgtgccct ccaaatactg agataaactg aattttgttc tctttgaagc atctgcaggc 7989
attaacaatt ataatacttt acaaagtttc attgggtcta aactattgtt tgcacatcat 8049
atatatgccc agaacttttt agcatgatac aagggtcctg ttcataactc atgcctaaat 8109
ctgacaaatt tgtcaaacga caatataagt cgaattataa tgcgttttag aattgacgcc 8169
aaaacttttg ctagcgtaag taactcttcc acctcccagc atgcatacaa ccaacaagct 8229
aaacttttgt tcaaaaaaat gtacatttat ttccttgaac acagcctttg tagaatatga 8289
ttaaaaactc atggatgaat gaaataatgt aaaagaatgg tcaaaatgat gaatagtaca 8349
agaagcaact gtgaacattt cacctttacc tgactgttcg caagaaggcc acgtggcaga 8409
aaagccagaa atgcaagaag cttccctaat tgatacacca tcaagaaatc aatggactca 8469
acaccagcgt ctgcccagac aaaatgaatg caggcaccta aaatatagaa ccattgactt 8529
ttcaacactg aattatataa cctgaatatc ttgttttttt aacacatctg acaaaatcag 8589
tgcattctgt tccatataga tgtatgcata gctcccatat gttagttgat cgatgagcat 8649
gcaaactata cacaccttac gttactccct ctgtcaaaaa aaatataagc ttgtctagat 8709
acatagctac aaatgcttat atttttggat tctcttaaag ctgtagaaac ttttatcgcc 8769
ccgccatggc aagtcgagat gccatcccca atgaaagccc ccacacaggt ttcatgccct 8829
gctgcacaat attgagcaac caaaaatata ataatatttg tgtcagaatt tgaatcaacc 8889
ttacagatac tgggtggcca gaaaatctag tccaagtaat atcctgaaaa atagcaactg 8949
gcaaatacta aaggcagtga agagtttcct ttagatcaga tgataaaaaa aaatcatatg 9009
ttcaatagca ataatcactc acattttttt tgctgtttag aatttagata attagtagtt 9069
aaacttctat agcttgcgta gctaagatca atggtgatta ttagttgaaa aaataatcaa 9129
atcatcaaac tgaggagact tatacctgcc ataagttctg aaatttcaat gatcctagtc 9189
aatatttact gtatatatag aattaggtcc aaaagatgat acttacaatt aaggatgttg 9249
tattgatcgg ttcataactc aagcttctat ttatcattaa tcaaaagctg gatcattcat 9309
gcatatacct ttgccgcact caacgtagca gctcggagtc ttctttgttc agaagcgagg 9369
aaggagtcaa caaataagta ctgcaatgtt aaacaaaccg acatatcaaa tcccaaatta 9429
agaatgcatg atttattaat acaggaaata tatgatcaag tcccaaaaag tgagtcatgt 9489
tatgtacact cagtcatcaa tttcaataag aatattaact tgctcattgg tatatggatt 9549
tgattatgac ataatttgac aatacattta cagaataaac ttgcagtgct gtgagcatat 9609
gttactaaca tgtaaggacc ttgttttgct ctgttcaata ctcatgttga tcttgatctg 9669
tgtccacata tacctaaatg aaatgaaatc aaagaatgag gtttgtagga gtggagttgg 9729
tgaattatag ggtagataat gtcggcacaa ccgtttgata agtagtacga gtactttatt 9789
tggcgccacc gcgccagcat cagatgtgtg gcctttgcac tgattgaatc caaaagaaaa 9849
aaaaagtcgt tttggtccca cacaattcta cttcatctgc aggatgtaca gaaggttaca 9909
tatctattct gttctatgct ctgtttacat ttatatttat agtactaggt tgaaagggct 9969
cacttggtgg ctgtcattgg ttggctggtg cggtatatta ctaataggtt ttttaatggc 10029
atatatgttc ttaaaataaa ccagaaaagc aaaagatcaa ctatcttagc cacaccaatg 10089
aaatggaata tactgaactg tcacggctaa aattctcttc agtcacctgg cccaactgga 10149
gccgtgggct cgtcgtcttt tctaaacatg tactagtatt ttgggggccc acagtgaatt 10209
tggcccaaaa tgctgacagc cgctctacgg ctctacgctg tgcag at ggg cgg ttc 10265
Tyr Gly Arg Phe
140
atg atg cgg ctg aag ctg cca aac ggt gtg acg acg agc gag cag acg 10313
Met Met Arg Leu Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr
145 150 155
agg tac ctg gcg agc gtg atc gag gcg tac ggc aag gag ggc tgc gcc 10361
Arg Tyr Leu Ala Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala
160 165 170
gac gtg aca acc cgc cag aac tgg cag atc cgc ggc gtc acg ctc ccc 10409
Asp Val Thr Thr Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro
175 180 185
gac gtg ccg gcc atc ctc gac ggg ctc aac gcc gtc ggc ctc acc agc 10457
Asp Val Pro Ala Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser
190 195 200
ctc cag agc ggc atg gac aac gtc cgc aac ccc gtc ggc aac ccg ctc 10505
Leu Gln Ser Gly Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu
205 210 215 220
gcc ggc atc gac ccc gac gag atc gtc gac acg cga tcc tac acc aac 10553
Ala Gly Ile Asp Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn
225 230 235
ctc ctc tcc tcc tac atc acc agc aac ttc cag ggc aac ccc acc atc 10601
Leu Leu Ser Ser Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile
240 245 250
acc aac ct gtgagtgatc gaatcaaatt gatcatgctc tgtgctgtgc 10649
Thr Asn Leu
tgtttcgtgt cgtctctgac gacatgtttg ttgaatttgt tgttgctgcg tgctgttggc 10709
ag g ccg agg aag tgg aac gtg tgc gtg atc ggg tcg cac gat ctg tac 10757
Pro Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr
260 265 270
gag cac cca cac atc aac gac ctc gcg tac atg ccg gcg gtg aag ggc 10805
Glu His Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly
275 280 285
ggc aag ttc ggg ttc aac ctc ctc gtc ggc ggg ttc ata agc ccc aag 10853
Gly Lys Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys
290 295 300
agg tgg gag gag gcg ctg ccg ctc gac gcc tgg gtc ccc ggc gac gac 10901
Arg Trp Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp
305 310 315
atc atc ccg gtg tgc aag gcc gtt ctc gag gcg tac cgc gac ctc ggc 10949
Ile Ile Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly
320 325 330
acc agg ggc aac cgc cag aag acc cgc atg atg tgg ctc atc gac gaa 10997
Thr Arg Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu
335 340 345 350
ctt gtgaaccatt tttttctcca ttcatccacg ccattgactg aattacgtat 11050
Leu
gtcccaatgt tcttatcagt taattgcggt gttggcattg cag gga atg gag gct 11105
Gly Met Glu Ala
355
ttt cgg tcg gag gtg gag aag agg atg ccg aac ggc gtg ctg gag cgc 11153
Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu Arg
360 365 370
gcg gcg ccg gag gac ctc atc gac aag aaa tgg cag agg agg gac tac 11201
Ala Ala Pro Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp Tyr
375 380 385
ctc ggc gtg cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc ctg 11249
Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly Leu
390 395 400
cac gtg ccc gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc gca 11297
His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu Ala
405 410 415
cgc ctc gcc gac gag tac ggc tcc ggc gag ctc cgc ctc acc gtg gag 11345
Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val Glu
420 425 430 435
cag aac atc gtg atc ccg aac gtc aag aac gag aag gtg gag gcg ctg 11393
Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala Leu
440 445 450
ctc tcc gag ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg ctg 11441
Leu Ser Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu Leu
455 460 465
ctc aag ggc ctc gtc gcg tgc acc ggc aac cag ttc tgc ggc cag gcc 11489
Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln Ala
470 475 480
atc atc gag acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg gag 11537
Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val Glu
485 490 495
aag ctc gtg tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc tgc 11585
Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly Cys
500 505 510 515
ccc aac agc tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg ggc 11633
Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met Gly
520 525 530
tgc ctc acc aag gac agc gcc ggc aag atc gtt gag gcg gcc gac atc 11681
Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp Ile
535 540 545
ttc gtc ggc ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg tac 11729
Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala Tyr
550 555 560
aag aag tcc gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac atc 11777
Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp Ile
565 570 575
ctg gtc gag cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac gag 11825
Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp Glu
580 585 590 595
gag tag gaacacagac tggggtgttt tgcttgctcc ggtgatctct cgccgtcctt 11881
Glu
gtaaagtaga cgacaatatg ccttcgccca tggcacgctt gtactgtcac gttttggttt 11941
gatcttgtag cccaaaagtt gtgttcattc tcgttacagt cttacagagg atgattgatt 12001
gataaataaa gaagaaacag attctgcaac tgttcatcgc tgttcctaaa tctgatttag 12061
cgaaagtatc ttgcctgacc tgtcccaatc gcagtgctaa aaccatataa tcttgcaagc 12121
aaatgaaatt gaaagagttc aatgcaacca ctaacagtct aacaacatga taaggcct 12179
<210>5
<211>2508
<212>DNA
<213>Oryza sativa
<220>
<221>CDS
<222>(519)..(2309)
<223>
<400>5
tatcgaacct tatctccttc tctctcgtcg ctttctgcgt ctccccgtct ctccttcgcc 60
aacagccgag aagaggcaga gagagcgccg ccccccgtcc ctctctctcc ctctcgtcct 120
cgcccccatc cctctcgtct ttcccttgcc ggcagcagag gaggcggcag cgacggcttc 180
agctgctccc acgggccgga tcgggcagtg gcggtggcgt cggcggcttc cgctggcgaa 240
tccggcgggt ggatacaaat cagtgttccg ataggtaaaa ccctgctctc agcatctgcc 300
cttttgaatt cgccaagagc cagcatctgc ccttttgaat tcgccaaggg ccagcatctg 360
cccatttgat tttgaattcg ccaagagcca gcaacagcgc ccccgcgccc cctccctcct 420
ccgcaataaa cagccacacg cgccgccccc atgtccaccc tcatcgccac agcgcaccac 480
caccaccacc accaccacca ccaccaccgt ctccagcc atg gcc tcc tcc gcc tcc 536
Met Ala Ser Ser Ala Ser
1 5
ctg cag cgc ttc ctc ccc ccg tac ccc cac gcg gca gca tcc cgc tgc 584
Leu Gln Arg Phe Leu Pro Pro Tyr Pro His Ala Ala Ala Ser Arg Cys
10 15 20
cgc cct ccc ggc gtc cgc gcc cgc ccc gtg cag tcg tcg acg gtg tcc 632
Arg Pro Pro Gly Val Arg Ala Arg Pro Val Gln Ser Ser Thr Val Ser
25 30 35
gca ccg tcc tcc tcg act ccg gcg gcg gac gag gcc gtg tcg gcg gag 680
Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp Glu Ala Val Ser Ala Glu
40 45 50
cgg ctg gag ccg cgg gtg gag cag cgg gag ggc cgg tac tgg gtg ctc 728
Arg Leu Glu Pro Arg Val Glu Gln Arg Glu Gly Arg Tyr Trp Val Leu
55 60 65 70
aag gag aag tac cgg acg ggg ctg aac ccg cag gag aag gtg aag ctg 776
Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro Gln Glu Lys Val Lys Leu
75 80 85
ggg aag gag ccc atg tca ttg ttc atg gag ggc ggc atc aag gag ctc 824
Gly Lys Glu Pro Met Ser Leu Phe Met Glu Gly Gly Ile Lys Glu Leu
90 95 100
gcc aag atg ccc atg gag gag atc gag gcc gac aag ctc tcc aag gag 872
Ala Lys Met Pro Met Glu Glu Ile Glu Ala Asp Lys Leu Ser Lys Glu
105 110 115
gac atc gac gtg cgg ctc aag tgg ctc ggc ctc ttc cac cgc cgc aag 920
Asp Ile Asp Val Arg Leu Lys Trp Leu Gly Leu Phe His Arg Arg Lys
120 125 130
cat cag tat ggg cgg ttc atg atg cgg ctg aag ctg cca aac ggt gtg 968
His Gln Tyr Gly Arg Phe Met Met Arg Leu Lys Leu Pro Asn Gly Val
135 140 145 150
acg acg agc gag cag acg agg tac ctg gcg agc gtg atc gag gcg tac 1016
Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala Ser Val Ile Glu Ala Tyr
155 160 165
ggc aag gag ggc tgc gcc gac gtg aca acc cgc cag aac tgg cag atc 1064
Gly Lys Glu Gly Cys Ala Asp Val Thr Thr Arg Gln Asn Trp Gln Ile
170 175 180
cgc ggc gtc acg ctc ccc gac gtg ccg gcc atc ctc gac ggg ctc aac 1112
Arg Gly Val Thr Leu Pro Asp Val Pro Ala Ile Leu Asp Gly Leu Asn
185 190 195
gcc gtc ggc ctc acc agc ctc cag agc ggc atg gac aac gtc cgc aac 1160
Ala Val Gly Leu Thr Ser Leu Gln Ser Gly Met Asp Asn Val Arg Asn
200 205 210
ccc gtc ggc aac ccg ctc gcc ggc atc gac ccc gac gag atc gtc gac 1208
Pro Val Gly Asn Pro Leu Ala Gly Ile Asp Pro Asp Glu Ile Val Asp
215 220 225 230
acg cga tcc tac acc aac ctc ctc tcc tcc tac atc acc agc aac ttc 1256
Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser Tyr Ile Thr Ser Asn Phe
235 240 245
cag ggc aac ccc acc atc acc aac ctg ccg agg aag tgg aac gtg tgc 1304
Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro Arg Lys Trp Asn Val Cys
250 255 260
gtg atc ggg tcg cac gat ctg tac gag cac cca cac atc aac gac ctc 1352
Val Ile Gly Ser His Asp Leu Tyr Glu His Pro His Ile Asn Asp Leu
265 270 275
gcg tac atg ccg gcg gtg aag ggc ggc aag ttc ggg ttc aac ctc ctc 1400
Ala Tyr Met Pro Ala Val Lys Gly Gly Lys Phe Gly Phe Asn Leu Leu
280 285 290
gtc ggc ggg ttc ata agc ccc aag agg tgg gag gag gcg ctg ccg ctc 1448
Val Gly Gly Phe Ile Ser Pro Lys Arg Trp Glu Glu Ala Leu Pro Leu
295 300 305 310
gac gcc tgg gtc ccc ggc gac gac atc atc ccg gtg tgc aag gcc gtt 1496
Asp Ala Trp Val Pro Gly Asp Asp Ile Ile Pro Val Cys Lys Ala Val
315 320 325
ctc gag gcg tac cgc gac ctc ggc acc agg ggc aac cgc cag aag acc 1544
Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg Gly Asn Arg Gln Lys Thr
330 335 340
cgc atg atg tgg ctc atc gac gaa ctt gga atg gag gct ttt cgg tcg 1592
Arg Met Met Trp Leu Ile Asp Glu Leu Gly Met Glu Ala Phe Arg Ser
345 350 355
gag gtg gag aag agg atg ccg aac ggc gtg ctg gag cgc gcg gcg ccg 1640
Glu Val Glu Lys Arg Met Pro Asn Gly Val Leu Glu Arg Ala Ala Pro
360 365 370
gag gac ctc atc gac aag aaa tgg cag agg agg gac tac ctc ggc gtg 1688
Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg Arg Asp Tyr Leu Gly Val
375 380 385 390
cac ccg cag aag cag gaa ggg atg tcc tac gtc ggc ctg cac gtg ccc 1736
His Pro Gln Lys Gln Glu Gly Met Ser Tyr Val Gly Leu His Val Pro
395 400 405
gtc ggc cgg gtg cag gcg gcg gac atg ttc gag ctc gca cgc ctc gcc 1784
Val Gly Arg Val Gln Ala Ala Asp Met Phe Glu Leu Ala Arg Leu Ala
410 415 420
gac gag tac ggc tcc ggc gag ctc cgc ctc acc gtg gag cag aac atc 1832
Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu Thr Val Glu Gln Asn Ile
425 430 435
gtg atc ccg aac gtc aag aac gag aag gtg gag gcg ctg ctc tcc gag 1880
Val Ile Pro Asn Val Lys Asn Glu Lys Val Glu Ala Leu Leu Ser Glu
440 445 450
ccg ctg ctt cag aag ttc tcc ccg cag ccg tcg ctg ctg ctc aag ggc 1928
Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro Ser Leu Leu Leu Lys Gly
455 460 465 470
ctc gtc gcg tgc acc ggc aac cag ttc tgc ggc cag gcc atc atc gag 1976
Leu Val Ala Cys Thr Gly Asn Gln Phe Cys Gly Gln Ala Ile Ile Glu
475 480 485
acg aag cag cgg gcg ctg ctg gtg acg tcg cag gtg gag aag ctc gtg 2024
Thr Lys Gln Arg Ala Leu Leu Val Thr Ser Gln Val Glu Lys Leu Val
490 495 500
tcg gtg ccc cgg gcg gtg cgg atg cac tgg acc ggc tgc ccc aac agc 2072
Ser Val Pro Arg Ala Val Arg Met His Trp Thr Gly Cys Pro Asn Ser
505 510 515
tgc ggc cag gtg cag gtc gcc gac atc ggc ttc atg ggc tgc ctc acc 2120
Cys Gly Gln Val Gln Val Ala Asp Ile Gly Phe Met Gly Cys Leu Thr
520 525 530
aag gac agc gcc ggc aag atc gtt gag gcg gcc gac atc ttc gtc ggc 2168
Lys Asp Ser Ala Gly Lys Ile Val Glu Ala Ala Asp Ile Phe Val Gly
535 540 545 550
ggc cgc gtc ggc agc gac tcg cac ctc gcc ggc gcg tac aag aag tcc 2216
Gly Arg Val Gly Ser Asp Ser His Leu Ala Gly Ala Tyr Lys Lys Ser
555 560 565
gtg ccg tgc gac gag ctg gcg ccg atc gtc gcc gac atc ctg gtc gag 2264
Val Pro Cys Asp Glu Leu Ala Pro Ile Val Ala Asp Ile Leu Val Glu
570 575 580
cgg ttc ggg gcc gtg cgg agg gag agg gag gag gac gag gag tag 2309
Arg Phe Gly Ala Val Arg Arg Glu Arg Glu Glu Asp Glu Glu
585 590 595
gaacacagac tggggtgttt tgcttgctcc ggtgatctct cgccgtcctt gtaaagtaga 2369
cgacaatatg ccttcgccca tggcacgctt gtactgtcac gttttggttt gatcttgtag 2429
cccaaaagtt gtgttcattc tcgttacagt cttacagagg atgattgatt gataaataaa 2489
gaagaaacag attctgcaa 2508
<210>6
<211>596
<212>PRT
<213>Oryza sativa
<400>6
Met Ala Ser Ser Ala Ser Leu Gln Arg Phe Leu Pro Pro Tyr Pro His
1 5 10 15
Ala Ala Ala Ser Arg Cys Arg Pro Pro Gly Val Arg Ala Arg Pro Val
20 25 30
Gln Ser Ser Thr Val Ser Ala Pro Ser Ser Ser Thr Pro Ala Ala Asp
35 40 45
Glu Ala Val Ser Ala Glu Arg Leu Glu Pro Arg Val Glu Gln Arg Glu
50 55 60
Gly Arg Tyr Trp Val Leu Lys Glu Lys Tyr Arg Thr Gly Leu Asn Pro
65 70 75 80
Gln Glu Lys Val Lys Leu Gly Lys Glu Pro Met Ser Leu Phe Met Glu
85 90 95
Gly Gly Ile Lys Glu Leu Ala Lys Met Pro Met Glu Glu Ile Glu Ala
100 105 110
Asp Lys Leu Ser Lys Glu Asp Ile Asp Val Arg Leu Lys Trp Leu Gly
115 120 125
Leu Phe His Arg Arg Lys His Gln Tyr Gly Arg Phe Met Met Arg Leu
130 135 140
Lys Leu Pro Asn Gly Val Thr Thr Ser Glu Gln Thr Arg Tyr Leu Ala
145 150 155 160
Ser Val Ile Glu Ala Tyr Gly Lys Glu Gly Cys Ala Asp Val Thr Thr
165 170 175
Arg Gln Asn Trp Gln Ile Arg Gly Val Thr Leu Pro Asp Val Pro Ala
180 185 190
Ile Leu Asp Gly Leu Asn Ala Val Gly Leu Thr Ser Leu Gln Ser Gly
195 200 205
Met Asp Asn Val Arg Asn Pro Val Gly Asn Pro Leu Ala Gly Ile Asp
210 215 220
Pro Asp Glu Ile Val Asp Thr Arg Ser Tyr Thr Asn Leu Leu Ser Ser
225 230 235 240
Tyr Ile Thr Ser Asn Phe Gln Gly Asn Pro Thr Ile Thr Asn Leu Pro
245 250 255
Arg Lys Trp Asn Val Cys Val Ile Gly Ser His Asp Leu Tyr Glu His
260 265 270
Pro His Ile Asn Asp Leu Ala Tyr Met Pro Ala Val Lys Gly Gly Lys
275 280 285
Phe Gly Phe Asn Leu Leu Val Gly Gly Phe Ile Ser Pro Lys Arg Trp
290 295 300
Glu Glu Ala Leu Pro Leu Asp Ala Trp Val Pro Gly Asp Asp Ile Ile
305 310 315 320
Pro Val Cys Lys Ala Val Leu Glu Ala Tyr Arg Asp Leu Gly Thr Arg
325 330 335
Gly Asn Arg Gln Lys Thr Arg Met Met Trp Leu Ile Asp Glu Leu Gly
340 345 350
Met Glu Ala Phe Arg Ser Glu Val Glu Lys Arg Met Pro Asn Gly Val
355 360 365
Leu Glu Arg Ala Ala Pro Glu Asp Leu Ile Asp Lys Lys Trp Gln Arg
370 375 380
Arg Asp Tyr Leu Gly Val His Pro Gln Lys Gln Glu Gly Met Ser Tyr
385 390 395 400
Val Gly Leu His Val Pro Val Gly Arg Val Gln Ala Ala Asp Met Phe
405 410 415
Glu Leu Ala Arg Leu Ala Asp Glu Tyr Gly Ser Gly Glu Leu Arg Leu
420 425 430
Thr Val Glu Gln Asn Ile Val Ile Pro Asn Val Lys Asn Glu Lys Val
435 440 445
Glu Ala Leu Leu Ser Glu Pro Leu Leu Gln Lys Phe Ser Pro Gln Pro
450 455 460
Ser Leu Leu Leu Lys Gly Leu Val Ala Cys Thr Gly Asn Gln Phe Cys
465 470 475 480
Gly Gln Ala Ile Ile Glu Thr Lys Gln Arg Ala Leu Leu Val Thr Ser
485 490 495
Gln Val Glu Lys Leu Val Ser Val Pro Arg Ala Val Arg Met His Trp
500 505 510
Thr Gly Cys Pro Asn Ser Cys Gly Gln Val Gln Val Ala Asp Ile Gly
515 520 525
Phe Met Gly Cys Leu Thr Lys Asp Ser Ala Gly Lys Ile Val Glu Ala
530 535 540
Ala Asp Ile Phe Val Gly Gly Arg Val Gly Ser Asp Ser His Leu Ala
545 550 555 560
Gly Ala Tyr Lys Lys Ser Val Pro Cys Asp Glu Leu Ala Pro Ile Val
565 570 575
Ala Asp Ile Leu Val Glu Arg Phe Gly Ala Val Arg Arg Glu Arg Glu
580 585 590
Glu Asp Glu Glu
595
Claims (22)
1.一种与植物再生能力有关的DNA,所述DNA是以下(a)-(d)中的任一种:
(a)编码包含SEQ ID NO:3的氨基酸序列的蛋白质的DNA;
(b)包含SEQ ID NO:1或2的核苷酸序列的编码区的DNA;
(c)编码包含在SEQ ID NO:3的氨基酸序列中具有一个或多个氨基酸取代、缺失、添加和/或插入的氨基酸序列的蛋白质的DNA;和
(d)在严格条件下与包含SEQ ID NO:1或2的核苷酸序列的DNA杂交的DNA。
2.编码包含SEQ ID NO:3的氨基酸序列的蛋白质的部分肽的DNA。
3.包含SEQ ID NO:1或2的核苷酸序列的启动子区域的DNA。
4.包含权利要求1或2的DNA的载体。
5.包含权利要求3的DNA的载体。
6.携带权利要求4的载体的宿主细胞。
7.携带权利要求4的载体的植物细胞。
8.包含权利要求7的植物细胞的植物转化体。
9.一种植物转化体,其是权利要求8的植物转化体的后代或克隆。
10.权利要求8或9的植物转化体的繁殖材料。
11.一种用于制备植物转化体的方法,该方法包括将权利要求1或2的DNA导入植物细胞和从所述植物细胞再生植物的步骤。
12.由权利要求1或2的DNA所编码的蛋白质。
13.一种用于制备权利要求12的蛋白质的方法,该方法包括培养权利要求6的宿主细胞并从所述细胞或其培养物上清中收集重组蛋白质的步骤。
14.与权利要求12的蛋白质结合的抗体。
15.包含与SEQ ID NO:1或2的核苷酸序列互补的至少15个连续核苷酸的多核苷酸,或与其互补的序列。
16.一种用于提高植物的再生能力的方法,该方法包括在植物的细胞中表达权利要求1或2的DNA的步骤。
17.一种用于改变植物的再生能力的制剂,该制剂包含权利要求1或2的DNA或权利要求4的载体作为活性成分。
18.一种用于测定植物细胞的再生能力的方法,该方法包括检测权利要求1的DNA或权利要求12的蛋白质在植物细胞中的表达的步骤。
19.一种用于测定植物细胞的再生能力的方法,该方法包括检测权利要求12的蛋白质在植物细胞中的活性的步骤。
20.一种用于提高植物的再生能力的方法,该方法包括调节该植物中的内源性的权利要求12的蛋白质的活性的步骤。
21.一种用于选择转化的植物细胞的方法,该方法包括以下步骤:
(a)将包含用作选择标记的权利要求1或2的DNA的载体导入植物细胞中;和
(b)培养所述植物细胞并选择已经获得再生能力的植物细胞。
22.一种用于改变植物的再生能力的方法,该方法包括通过杂交取代植物中的内源性的权利要求1或2的DNA的步骤。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US49183703P | 2003-07-31 | 2003-07-31 | |
US60/491,837 | 2003-07-31 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1842592A true CN1842592A (zh) | 2006-10-04 |
CN100462435C CN100462435C (zh) | 2009-02-18 |
Family
ID=34115557
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNB2004800222181A Expired - Fee Related CN100462435C (zh) | 2003-07-31 | 2004-07-30 | 赋予植物再生能力的基因及其应用 |
Country Status (8)
Country | Link |
---|---|
US (1) | US7790957B2 (zh) |
EP (1) | EP1650301B8 (zh) |
JP (1) | JP3979431B2 (zh) |
KR (1) | KR101192258B1 (zh) |
CN (1) | CN100462435C (zh) |
AU (1) | AU2004261892B2 (zh) |
DE (1) | DE602004019783D1 (zh) |
WO (1) | WO2005012520A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104673828B (zh) * | 2007-08-15 | 2018-11-09 | 英美烟草(投资)有限公司 | 亚硝酸盐含量降低的植物的产生 |
WO2022199665A1 (zh) * | 2021-03-25 | 2022-09-29 | 苏州齐禾生科生物科技有限公司 | 一种提高植物遗传转化和基因编辑效率的方法 |
Families Citing this family (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8160020B2 (en) | 2001-06-25 | 2012-04-17 | Airvana Network Solutions, Inc. | Radio network control |
US8195187B2 (en) | 2001-06-25 | 2012-06-05 | Airvana Network Solutions, Inc. | Radio network control |
US8099504B2 (en) | 2005-06-24 | 2012-01-17 | Airvana Network Solutions, Inc. | Preserving sessions in a wireless network |
US7751835B2 (en) | 2005-10-04 | 2010-07-06 | Airvana, Inc. | Non-circular paging areas |
US8094630B2 (en) | 2005-12-16 | 2012-01-10 | Airvana Network Solutions, Inc. | Radio frequency dragging prevention |
US8619702B2 (en) | 2005-12-16 | 2013-12-31 | Ericsson Evdo Inc. | Radio network control |
US8145221B2 (en) | 2005-12-16 | 2012-03-27 | Airvana Network Solutions, Inc. | Radio network communication |
US8085696B2 (en) | 2006-07-14 | 2011-12-27 | Airvana Networks Solutions, Inc. | Dynamic modification of route update protocols |
JP4368391B2 (ja) * | 2007-05-17 | 2009-11-18 | 本田技研工業株式会社 | イネおよびその作出方法 |
US8843638B2 (en) | 2007-12-13 | 2014-09-23 | Ericsson Evdo Inc. | Handing off active connections |
CN105132441B (zh) * | 2015-09-29 | 2018-07-06 | 浙江农林大学 | 版纳甜龙竹NiR基因及其应用 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07236486A (ja) * | 1994-03-02 | 1995-09-12 | Toyota Motor Corp | ポプラ属植物の亜硝酸還元酵素遺伝子 |
KR100797667B1 (ko) | 1999-10-04 | 2008-01-23 | 메디카고 인코포레이티드 | 외래 유전자의 전사를 조절하는 방법 |
AU2002210310A1 (en) * | 2000-10-31 | 2002-05-15 | Medicago Inc. | Method of selecting plant promoters to control transgene expression |
-
2004
- 2004-07-30 EP EP04771310A patent/EP1650301B8/en not_active Expired - Lifetime
- 2004-07-30 WO PCT/JP2004/011307 patent/WO2005012520A1/ja active Application Filing
- 2004-07-30 JP JP2005512596A patent/JP3979431B2/ja not_active Expired - Fee Related
- 2004-07-30 CN CNB2004800222181A patent/CN100462435C/zh not_active Expired - Fee Related
- 2004-07-30 KR KR1020067002052A patent/KR101192258B1/ko active IP Right Grant
- 2004-07-30 DE DE602004019783T patent/DE602004019783D1/de not_active Expired - Lifetime
- 2004-07-30 AU AU2004261892A patent/AU2004261892B2/en not_active Ceased
- 2004-07-30 US US10/566,593 patent/US7790957B2/en not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104673828B (zh) * | 2007-08-15 | 2018-11-09 | 英美烟草(投资)有限公司 | 亚硝酸盐含量降低的植物的产生 |
WO2022199665A1 (zh) * | 2021-03-25 | 2022-09-29 | 苏州齐禾生科生物科技有限公司 | 一种提高植物遗传转化和基因编辑效率的方法 |
Also Published As
Publication number | Publication date |
---|---|
EP1650301A1 (en) | 2006-04-26 |
EP1650301A4 (en) | 2006-12-06 |
EP1650301B8 (en) | 2009-11-18 |
CN100462435C (zh) | 2009-02-18 |
KR101192258B1 (ko) | 2012-10-17 |
US20070186302A1 (en) | 2007-08-09 |
DE602004019783D1 (de) | 2009-04-16 |
AU2004261892B2 (en) | 2010-11-11 |
WO2005012520A1 (ja) | 2005-02-10 |
JP3979431B2 (ja) | 2007-09-19 |
US7790957B2 (en) | 2010-09-07 |
AU2004261892A1 (en) | 2005-02-10 |
KR20060052938A (ko) | 2006-05-19 |
JPWO2005012520A1 (ja) | 2006-09-21 |
EP1650301B1 (en) | 2009-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1170940C (zh) | 生长得到改造的植物以及获得此种植物的方法 | |
CN1024021C (zh) | 含谷胱甘肽s-转移酶基因的除莠剂耐性植物 | |
CN1054170A (zh) | 可繁殖的转基因谷类植物 | |
CN1624135A (zh) | 编码植物脱氧海普赖氨酸合成酶的dna,植物真核起始因子5a,转基因植物和控制植物衰老和程序性细胞死亡的方法 | |
CN1151183A (zh) | Rps2基因及其应用 | |
CN1201012C (zh) | 改变植物开花时间的方法 | |
CN87106531A (zh) | 编码具有除莠剂抗性的植物乙酰乳酸合酶的核酸片段 | |
CN1193355A (zh) | 种子中氨基酸组成的改变 | |
CN1930293A (zh) | 具有降低的饱和脂肪酸水平的转基因植物及其制备方法 | |
CN1753992A (zh) | 种子中蛋白质含量降低的植物及其制备方法和利用方法 | |
CN1842592A (zh) | 赋予植物再分化能力的基因及其应用 | |
CN1844396A (zh) | 调控水稻分蘖角度的基因及其编码蛋白与应用 | |
CN1420932A (zh) | 由表达serk相互作用蛋白质实现无融合生殖 | |
CN1582335A (zh) | 水稻转座子基因 | |
CN1807453A (zh) | 一种白叶枯病抗性相关蛋白及其编码基因与应用 | |
CN1751065A (zh) | 棉蚜(Aphis gossypii)抗性基因 | |
CN1289523C (zh) | 水稻钾、钠离子转运基因及其应用 | |
CN101037696A (zh) | 一种水稻冷害基因及应用 | |
CN100339479C (zh) | 参与油菜素类固醇合成的基因 | |
CN1810977A (zh) | 增强植物和真菌中的2-乙酰基-1-吡咯的合成的核酸 | |
CN1297666C (zh) | 植物转录阻遏物,结合其的蛋白质核因子,及它们的应用 | |
CN1854154A (zh) | 一种稻瘟病抗性相关蛋白及其编码基因与应用 | |
CN1289664C (zh) | 可变盐单胞菌高抗草苷膦的epsp合酶及其编码序列 | |
CN1566146A (zh) | 水稻茎杆伸长基因及其编码蛋白和用途 | |
CN1869232A (zh) | 一种水稻杂种育性基因及其应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20090218 Termination date: 20190730 |