KR101429476B1 - 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 - Google Patents
향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 Download PDFInfo
- Publication number
- KR101429476B1 KR101429476B1 KR1020137005300A KR20137005300A KR101429476B1 KR 101429476 B1 KR101429476 B1 KR 101429476B1 KR 1020137005300 A KR1020137005300 A KR 1020137005300A KR 20137005300 A KR20137005300 A KR 20137005300A KR 101429476 B1 KR101429476 B1 KR 101429476B1
- Authority
- KR
- South Korea
- Prior art keywords
- plant
- nucleic acid
- polypeptide
- plants
- expression
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 364
- 150000007523 nucleic acids Chemical class 0.000 claims abstract description 569
- 108090000765 processed proteins & peptides Proteins 0.000 claims abstract description 489
- 102000004196 processed proteins & peptides Human genes 0.000 claims abstract description 487
- 229920001184 polypeptide Polymers 0.000 claims abstract description 476
- 102000039446 nucleic acids Human genes 0.000 claims abstract description 463
- 108020004707 nucleic acids Proteins 0.000 claims abstract description 463
- 230000014509 gene expression Effects 0.000 claims abstract description 239
- 230000001976 improved effect Effects 0.000 claims abstract description 59
- 241000196324 Embryophyta Species 0.000 claims description 771
- 108090000623 proteins and genes Proteins 0.000 claims description 314
- 230000001965 increasing effect Effects 0.000 claims description 158
- 108091028043 Nucleic acid sequence Proteins 0.000 claims description 84
- 240000007594 Oryza sativa Species 0.000 claims description 65
- 235000007164 Oryza sativa Nutrition 0.000 claims description 63
- 235000009566 rice Nutrition 0.000 claims description 60
- 230000001105 regulatory effect Effects 0.000 claims description 48
- 230000009261 transgenic effect Effects 0.000 claims description 36
- 239000002028 Biomass Substances 0.000 claims description 25
- 230000002708 enhancing effect Effects 0.000 claims description 25
- 235000021307 Triticum Nutrition 0.000 claims description 20
- 240000008042 Zea mays Species 0.000 claims description 17
- 235000002017 Zea mays subsp mays Nutrition 0.000 claims description 16
- 240000005979 Hordeum vulgare Species 0.000 claims description 15
- 235000007340 Hordeum vulgare Nutrition 0.000 claims description 15
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 claims description 13
- 235000005822 corn Nutrition 0.000 claims description 13
- 230000001939 inductive effect Effects 0.000 claims description 13
- 238000004519 manufacturing process Methods 0.000 claims description 13
- 230000008635 plant growth Effects 0.000 claims description 13
- 244000075850 Avena orientalis Species 0.000 claims description 11
- 241000209056 Secale Species 0.000 claims description 11
- 238000011161 development Methods 0.000 claims description 11
- 235000011684 Sorghum saccharatum Nutrition 0.000 claims description 10
- 235000007238 Secale cereale Nutrition 0.000 claims description 9
- 240000006394 Sorghum bicolor Species 0.000 claims description 9
- 241000209140 Triticum Species 0.000 claims description 9
- 239000000203 mixture Substances 0.000 claims description 8
- 230000008121 plant development Effects 0.000 claims description 8
- 235000007319 Avena orientalis Nutrition 0.000 claims description 7
- 238000012258 culturing Methods 0.000 claims description 7
- 230000002018 overexpression Effects 0.000 claims description 7
- 235000014966 Eragrostis abyssinica Nutrition 0.000 claims description 6
- 244000140063 Eragrostis abyssinica Species 0.000 claims description 6
- 235000017587 Medicago sativa ssp. sativa Nutrition 0.000 claims description 6
- 244000062793 Sorghum vulgare Species 0.000 claims description 6
- 240000004658 Medicago sativa Species 0.000 claims description 5
- 240000000581 Triticum monococcum Species 0.000 claims description 5
- 241000219310 Beta vulgaris subsp. vulgaris Species 0.000 claims description 4
- 240000000111 Saccharum officinarum Species 0.000 claims description 4
- 235000007201 Saccharum officinarum Nutrition 0.000 claims description 4
- 235000021536 Sugar beet Nutrition 0.000 claims description 4
- 235000009430 Thespesia populnea Nutrition 0.000 claims description 4
- 235000019714 Triticale Nutrition 0.000 claims description 4
- 235000019713 millet Nutrition 0.000 claims description 4
- 230000005030 transcription termination Effects 0.000 claims description 4
- 241000228158 x Triticosecale Species 0.000 claims description 4
- 240000000359 Triticum dicoccon Species 0.000 claims 1
- 235000001468 Triticum dicoccon Nutrition 0.000 claims 1
- 108010064862 Nicotinamide phosphoribosyltransferase Proteins 0.000 abstract description 134
- 102000015532 Nicotinamide phosphoribosyltransferase Human genes 0.000 abstract description 133
- 230000002068 genetic effect Effects 0.000 abstract description 23
- 230000015572 biosynthetic process Effects 0.000 abstract description 11
- 125000003275 alpha amino acid group Chemical group 0.000 description 120
- 102000004169 proteins and genes Human genes 0.000 description 101
- 235000018102 proteins Nutrition 0.000 description 99
- 210000004027 cell Anatomy 0.000 description 94
- 238000009396 hybridization Methods 0.000 description 55
- 125000003729 nucleotide group Chemical group 0.000 description 49
- 239000002773 nucleotide Substances 0.000 description 46
- 235000001014 amino acid Nutrition 0.000 description 44
- 230000000694 effects Effects 0.000 description 43
- 230000012010 growth Effects 0.000 description 43
- 230000035882 stress Effects 0.000 description 41
- 230000009466 transformation Effects 0.000 description 39
- 229940024606 amino acid Drugs 0.000 description 38
- 150000001413 amino acids Chemical class 0.000 description 38
- 230000033228 biological regulation Effects 0.000 description 33
- 210000001519 tissue Anatomy 0.000 description 32
- 239000013598 vector Substances 0.000 description 31
- 239000003550 marker Substances 0.000 description 30
- 108020004414 DNA Proteins 0.000 description 27
- 230000000295 complement effect Effects 0.000 description 27
- 235000013339 cereals Nutrition 0.000 description 25
- 108020004999 messenger RNA Proteins 0.000 description 25
- 230000000692 anti-sense effect Effects 0.000 description 24
- 238000006467 substitution reaction Methods 0.000 description 22
- 230000004071 biological effect Effects 0.000 description 21
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 description 18
- 238000004422 calculation algorithm Methods 0.000 description 18
- 210000000056 organ Anatomy 0.000 description 17
- 230000035897 transcription Effects 0.000 description 17
- 238000013518 transcription Methods 0.000 description 17
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 16
- 230000004568 DNA-binding Effects 0.000 description 16
- DFPAKSUCGFBDDF-UHFFFAOYSA-N Nicotinamide Chemical compound NC(=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-UHFFFAOYSA-N 0.000 description 16
- 244000098338 Triticum aestivum Species 0.000 description 16
- 238000010276 construction Methods 0.000 description 15
- 238000003306 harvesting Methods 0.000 description 15
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 108091023040 Transcription factor Proteins 0.000 description 14
- 102000040945 Transcription factor Human genes 0.000 description 14
- 230000001580 bacterial effect Effects 0.000 description 14
- 238000003780 insertion Methods 0.000 description 14
- 230000037431 insertion Effects 0.000 description 14
- 241000219194 Arabidopsis Species 0.000 description 12
- 108091026890 Coding region Proteins 0.000 description 12
- 230000001488 breeding effect Effects 0.000 description 12
- 238000012217 deletion Methods 0.000 description 12
- 230000037430 deletion Effects 0.000 description 12
- 230000030279 gene silencing Effects 0.000 description 12
- 239000000047 product Substances 0.000 description 12
- 230000002829 reductive effect Effects 0.000 description 12
- 230000014616 translation Effects 0.000 description 12
- 101150104463 GOS2 gene Proteins 0.000 description 11
- 238000009395 breeding Methods 0.000 description 11
- 230000000875 corresponding effect Effects 0.000 description 11
- 230000029087 digestion Effects 0.000 description 11
- 238000013507 mapping Methods 0.000 description 11
- 238000002703 mutagenesis Methods 0.000 description 11
- 231100000350 mutagenesis Toxicity 0.000 description 11
- 230000035772 mutation Effects 0.000 description 11
- 239000000523 sample Substances 0.000 description 11
- 239000011780 sodium chloride Substances 0.000 description 11
- 238000013519 translation Methods 0.000 description 11
- 240000002791 Brassica napus Species 0.000 description 10
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 10
- 102000004190 Enzymes Human genes 0.000 description 10
- 108090000790 Enzymes Proteins 0.000 description 10
- 235000010469 Glycine max Nutrition 0.000 description 10
- 244000068988 Glycine max Species 0.000 description 10
- 230000001276 controlling effect Effects 0.000 description 10
- 229940088598 enzyme Drugs 0.000 description 10
- 238000011049 filling Methods 0.000 description 10
- 230000008569 process Effects 0.000 description 10
- 108700028369 Alleles Proteins 0.000 description 9
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 9
- 240000003768 Solanum lycopersicum Species 0.000 description 9
- 230000002950 deficient Effects 0.000 description 9
- 230000008641 drought stress Effects 0.000 description 9
- 239000012634 fragment Substances 0.000 description 9
- 239000002609 medium Substances 0.000 description 9
- 235000015097 nutrients Nutrition 0.000 description 9
- 230000009467 reduction Effects 0.000 description 9
- 238000009331 sowing Methods 0.000 description 9
- 230000017260 vegetative to reproductive phase transition of meristem Effects 0.000 description 9
- IJGRMHOSHXDMSA-UHFFFAOYSA-N Atomic nitrogen Chemical compound N#N IJGRMHOSHXDMSA-UHFFFAOYSA-N 0.000 description 8
- 108090000994 Catalytic RNA Proteins 0.000 description 8
- 102000053642 Catalytic RNA Human genes 0.000 description 8
- 102000000574 RNA-Induced Silencing Complex Human genes 0.000 description 8
- 108010016790 RNA-Induced Silencing Complex Proteins 0.000 description 8
- 230000036579 abiotic stress Effects 0.000 description 8
- 230000007423 decrease Effects 0.000 description 8
- 238000002744 homologous recombination Methods 0.000 description 8
- 230000006801 homologous recombination Effects 0.000 description 8
- 235000005152 nicotinamide Nutrition 0.000 description 8
- 239000011570 nicotinamide Substances 0.000 description 8
- 229960003966 nicotinamide Drugs 0.000 description 8
- 108091092562 ribozyme Proteins 0.000 description 8
- 239000000243 solution Substances 0.000 description 8
- 241000192700 Cyanobacteria Species 0.000 description 7
- PVNIIMVLHYAWGP-UHFFFAOYSA-N Niacin Chemical compound OC(=O)C1=CC=CN=C1 PVNIIMVLHYAWGP-UHFFFAOYSA-N 0.000 description 7
- 241000208125 Nicotiana Species 0.000 description 7
- 108091034117 Oligonucleotide Proteins 0.000 description 7
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 7
- 230000004913 activation Effects 0.000 description 7
- 125000000539 amino acid group Chemical group 0.000 description 7
- 230000027455 binding Effects 0.000 description 7
- 230000003247 decreasing effect Effects 0.000 description 7
- 235000013399 edible fruits Nutrition 0.000 description 7
- 239000003623 enhancer Substances 0.000 description 7
- 238000012226 gene silencing method Methods 0.000 description 7
- 239000012528 membrane Substances 0.000 description 7
- 238000012546 transfer Methods 0.000 description 7
- 230000032258 transport Effects 0.000 description 7
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 6
- 101100438633 Arabidopsis thaliana CBSX2 gene Proteins 0.000 description 6
- 108091092195 Intron Proteins 0.000 description 6
- 108700011259 MicroRNAs Proteins 0.000 description 6
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 6
- 108700008625 Reporter Genes Proteins 0.000 description 6
- 235000002595 Solanum tuberosum Nutrition 0.000 description 6
- 244000061456 Solanum tuberosum Species 0.000 description 6
- 241000192581 Synechocystis sp. Species 0.000 description 6
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 6
- 238000004458 analytical method Methods 0.000 description 6
- 230000008030 elimination Effects 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 230000007613 environmental effect Effects 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000004048 modification Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 6
- 239000003921 oil Substances 0.000 description 6
- 235000019198 oils Nutrition 0.000 description 6
- 210000002706 plastid Anatomy 0.000 description 6
- 238000011144 upstream manufacturing Methods 0.000 description 6
- 238000005406 washing Methods 0.000 description 6
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 6
- 241000589158 Agrobacterium Species 0.000 description 5
- 241000894006 Bacteria Species 0.000 description 5
- 241000335053 Beta vulgaris Species 0.000 description 5
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 5
- 235000006008 Brassica napus var napus Nutrition 0.000 description 5
- 240000000385 Brassica napus var. napus Species 0.000 description 5
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 5
- 244000000626 Daucus carota Species 0.000 description 5
- 235000002767 Daucus carota Nutrition 0.000 description 5
- 241000208818 Helianthus Species 0.000 description 5
- DAYLJWODMCOQEW-TURQNECASA-N NMN zwitterion Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](COP(O)([O-])=O)O2)O)=C1 DAYLJWODMCOQEW-TURQNECASA-N 0.000 description 5
- 108700001094 Plant Genes Proteins 0.000 description 5
- 241000192584 Synechocystis Species 0.000 description 5
- 108700019146 Transgenes Proteins 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 210000000805 cytoplasm Anatomy 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 230000018109 developmental process Effects 0.000 description 5
- 210000005069 ears Anatomy 0.000 description 5
- 238000003379 elimination reaction Methods 0.000 description 5
- 239000004459 forage Substances 0.000 description 5
- 238000007710 freezing Methods 0.000 description 5
- 230000008014 freezing Effects 0.000 description 5
- 230000002538 fungal effect Effects 0.000 description 5
- 230000001404 mediated effect Effects 0.000 description 5
- 108091070501 miRNA Proteins 0.000 description 5
- 239000002679 microRNA Substances 0.000 description 5
- 230000036542 oxidative stress Effects 0.000 description 5
- 102000040430 polynucleotide Human genes 0.000 description 5
- 108091033319 polynucleotide Proteins 0.000 description 5
- 239000002157 polynucleotide Substances 0.000 description 5
- 238000011160 research Methods 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 150000003839 salts Chemical class 0.000 description 5
- 230000028327 secretion Effects 0.000 description 5
- 241000894007 species Species 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 238000012225 targeting induced local lesions in genomes Methods 0.000 description 5
- 230000001131 transforming effect Effects 0.000 description 5
- 241000219195 Arabidopsis thaliana Species 0.000 description 4
- 108091026821 Artificial microRNA Proteins 0.000 description 4
- 235000005781 Avena Nutrition 0.000 description 4
- 235000011293 Brassica napus Nutrition 0.000 description 4
- 108010068370 Glutens Proteins 0.000 description 4
- DHMQDGOQFOQNFH-UHFFFAOYSA-N Glycine Chemical compound NCC(O)=O DHMQDGOQFOQNFH-UHFFFAOYSA-N 0.000 description 4
- 241000219146 Gossypium Species 0.000 description 4
- 235000003222 Helianthus annuus Nutrition 0.000 description 4
- 241000209510 Liliopsida Species 0.000 description 4
- 235000004431 Linum usitatissimum Nutrition 0.000 description 4
- 240000006240 Linum usitatissimum Species 0.000 description 4
- 240000003183 Manihot esculenta Species 0.000 description 4
- 241000219823 Medicago Species 0.000 description 4
- 241001465754 Metazoa Species 0.000 description 4
- 108091092724 Noncoding DNA Proteins 0.000 description 4
- 108700026244 Open Reading Frames Proteins 0.000 description 4
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 4
- 244000046052 Phaseolus vulgaris Species 0.000 description 4
- 108010029485 Protein Isoforms Proteins 0.000 description 4
- 102000001708 Protein Isoforms Human genes 0.000 description 4
- 108020004459 Small interfering RNA Proteins 0.000 description 4
- 229920002472 Starch Polymers 0.000 description 4
- 241001464837 Viridiplantae Species 0.000 description 4
- 229920002494 Zein Polymers 0.000 description 4
- 239000002253 acid Substances 0.000 description 4
- 238000007792 addition Methods 0.000 description 4
- 230000002411 adverse Effects 0.000 description 4
- 239000000074 antisense oligonucleotide Substances 0.000 description 4
- 238000012230 antisense oligonucleotides Methods 0.000 description 4
- 210000000170 cell membrane Anatomy 0.000 description 4
- 210000003763 chloroplast Anatomy 0.000 description 4
- 238000004140 cleaning Methods 0.000 description 4
- 244000038559 crop plants Species 0.000 description 4
- 238000013461 design Methods 0.000 description 4
- -1 diphosphate phospho Chemical class 0.000 description 4
- 230000002255 enzymatic effect Effects 0.000 description 4
- 235000013305 food Nutrition 0.000 description 4
- 230000005714 functional activity Effects 0.000 description 4
- 230000004927 fusion Effects 0.000 description 4
- 230000000977 initiatory effect Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 230000007246 mechanism Effects 0.000 description 4
- 235000001968 nicotinic acid Nutrition 0.000 description 4
- 239000011664 nicotinic acid Substances 0.000 description 4
- 229960003512 nicotinic acid Drugs 0.000 description 4
- 229910052757 nitrogen Inorganic materials 0.000 description 4
- 239000002243 precursor Substances 0.000 description 4
- 230000010076 replication Effects 0.000 description 4
- 230000002441 reversible effect Effects 0.000 description 4
- 235000019698 starch Nutrition 0.000 description 4
- 239000000758 substrate Substances 0.000 description 4
- 239000005019 zein Substances 0.000 description 4
- 229940093612 zein Drugs 0.000 description 4
- 235000016068 Berberis vulgaris Nutrition 0.000 description 3
- 102100026189 Beta-galactosidase Human genes 0.000 description 3
- 241000723343 Cichorium Species 0.000 description 3
- 235000007542 Cichorium intybus Nutrition 0.000 description 3
- 241000207199 Citrus Species 0.000 description 3
- 108700010070 Codon Usage Proteins 0.000 description 3
- 229920000742 Cotton Polymers 0.000 description 3
- 235000004035 Cryptotaenia japonica Nutrition 0.000 description 3
- 102100034976 Cystathionine beta-synthase Human genes 0.000 description 3
- 108010073644 Cystathionine beta-synthase Proteins 0.000 description 3
- 102000053187 Glucuronidase Human genes 0.000 description 3
- 108010060309 Glucuronidase Proteins 0.000 description 3
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 3
- 235000016735 Manihot esculenta subsp esculenta Nutrition 0.000 description 3
- 102000015636 Oligopeptides Human genes 0.000 description 3
- 108010038807 Oligopeptides Proteins 0.000 description 3
- 108700023764 Oryza sativa OSH1 Proteins 0.000 description 3
- 241000220324 Pyrus Species 0.000 description 3
- 108010003581 Ribulose-bisphosphate carboxylase Proteins 0.000 description 3
- 241001453296 Synechococcus elongatus Species 0.000 description 3
- 102000007641 Trefoil Factors Human genes 0.000 description 3
- 235000015724 Trifolium pratense Nutrition 0.000 description 3
- 235000004240 Triticum spelta Nutrition 0.000 description 3
- 240000003834 Triticum spelta Species 0.000 description 3
- 241000700605 Viruses Species 0.000 description 3
- 235000016383 Zea mays subsp huehuetenangensis Nutrition 0.000 description 3
- 150000007513 acids Chemical class 0.000 description 3
- 230000003321 amplification Effects 0.000 description 3
- 239000000427 antigen Substances 0.000 description 3
- 102000036639 antigens Human genes 0.000 description 3
- 108010005774 beta-Galactosidase Proteins 0.000 description 3
- 210000004899 c-terminal region Anatomy 0.000 description 3
- 235000020971 citrus fruits Nutrition 0.000 description 3
- 238000003776 cleavage reaction Methods 0.000 description 3
- 235000014113 dietary fatty acids Nutrition 0.000 description 3
- 239000001177 diphosphate Substances 0.000 description 3
- 235000011180 diphosphates Nutrition 0.000 description 3
- 241001233957 eudicotyledons Species 0.000 description 3
- 230000001747 exhibiting effect Effects 0.000 description 3
- 239000013604 expression vector Substances 0.000 description 3
- 239000003925 fat Substances 0.000 description 3
- 235000019197 fats Nutrition 0.000 description 3
- 229930195729 fatty acid Natural products 0.000 description 3
- 239000000194 fatty acid Substances 0.000 description 3
- 150000004665 fatty acids Chemical class 0.000 description 3
- 235000019688 fish Nutrition 0.000 description 3
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 3
- 230000035784 germination Effects 0.000 description 3
- 239000004009 herbicide Substances 0.000 description 3
- 208000015181 infectious disease Diseases 0.000 description 3
- 230000002401 inhibitory effect Effects 0.000 description 3
- 235000009973 maize Nutrition 0.000 description 3
- 230000002503 metabolic effect Effects 0.000 description 3
- 230000004060 metabolic process Effects 0.000 description 3
- 244000005700 microbiome Species 0.000 description 3
- 238000003199 nucleic acid amplification method Methods 0.000 description 3
- 230000008723 osmotic stress Effects 0.000 description 3
- 244000052769 pathogen Species 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 239000008188 pellet Substances 0.000 description 3
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 3
- 230000008488 polyadenylation Effects 0.000 description 3
- 239000000843 powder Substances 0.000 description 3
- 238000012545 processing Methods 0.000 description 3
- 238000010188 recombinant method Methods 0.000 description 3
- 230000006798 recombination Effects 0.000 description 3
- 238000005215 recombination Methods 0.000 description 3
- 102000037983 regulatory factors Human genes 0.000 description 3
- 108091008025 regulatory factors Proteins 0.000 description 3
- 230000007017 scission Effects 0.000 description 3
- 238000002864 sequence alignment Methods 0.000 description 3
- 230000019491 signal transduction Effects 0.000 description 3
- 238000002741 site-directed mutagenesis Methods 0.000 description 3
- 239000011734 sodium Substances 0.000 description 3
- 239000000725 suspension Substances 0.000 description 3
- 230000002194 synthesizing effect Effects 0.000 description 3
- 238000011426 transformation method Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 235000020985 whole grains Nutrition 0.000 description 3
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 2
- 108020005345 3' Untranslated Regions Proteins 0.000 description 2
- 241000208140 Acer Species 0.000 description 2
- 241000219068 Actinidia Species 0.000 description 2
- 235000011624 Agave sisalana Nutrition 0.000 description 2
- 244000198134 Agave sisalana Species 0.000 description 2
- 240000007241 Agrostis stolonifera Species 0.000 description 2
- 241000219318 Amaranthus Species 0.000 description 2
- 244000296825 Amygdalus nana Species 0.000 description 2
- 235000003840 Amygdalus nana Nutrition 0.000 description 2
- 244000099147 Ananas comosus Species 0.000 description 2
- 235000007119 Ananas comosus Nutrition 0.000 description 2
- 235000005340 Asparagus officinalis Nutrition 0.000 description 2
- 240000000372 Avena hybrida Species 0.000 description 2
- 235000009123 Avena hybrida Nutrition 0.000 description 2
- 235000010082 Averrhoa carambola Nutrition 0.000 description 2
- 240000006063 Averrhoa carambola Species 0.000 description 2
- 244000036905 Benincasa cerifera Species 0.000 description 2
- 235000011274 Benincasa cerifera Nutrition 0.000 description 2
- 235000021533 Beta vulgaris Nutrition 0.000 description 2
- 235000011331 Brassica Nutrition 0.000 description 2
- 241000219198 Brassica Species 0.000 description 2
- 240000008100 Brassica rapa Species 0.000 description 2
- 235000011292 Brassica rapa Nutrition 0.000 description 2
- 102000047411 CBS domains Human genes 0.000 description 2
- 108700037257 CBS domains Proteins 0.000 description 2
- 235000008635 Cadaba farinosa Nutrition 0.000 description 2
- 241000628166 Cadaba farinosa Species 0.000 description 2
- 101100126625 Caenorhabditis elegans itr-1 gene Proteins 0.000 description 2
- OYPRJOBELJOOCE-UHFFFAOYSA-N Calcium Chemical compound [Ca] OYPRJOBELJOOCE-UHFFFAOYSA-N 0.000 description 2
- 235000008697 Cannabis sativa Nutrition 0.000 description 2
- 244000025254 Cannabis sativa Species 0.000 description 2
- 235000002566 Capsicum Nutrition 0.000 description 2
- 241000208293 Capsicum Species 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 235000009467 Carica papaya Nutrition 0.000 description 2
- 240000006432 Carica papaya Species 0.000 description 2
- 240000004927 Carissa macrocarpa Species 0.000 description 2
- 235000014036 Castanea Nutrition 0.000 description 2
- 241001070941 Castanea Species 0.000 description 2
- 102000005600 Cathepsins Human genes 0.000 description 2
- 108010084457 Cathepsins Proteins 0.000 description 2
- 241000737241 Cocos Species 0.000 description 2
- 244000228088 Cola acuminata Species 0.000 description 2
- 235000010071 Cucumis prophetarum Nutrition 0.000 description 2
- 244000024469 Cucumis prophetarum Species 0.000 description 2
- 108010066133 D-octopine dehydrogenase Proteins 0.000 description 2
- 102000004163 DNA-directed RNA polymerases Human genes 0.000 description 2
- 108090000626 DNA-directed RNA polymerases Proteins 0.000 description 2
- 241000522190 Desmodium Species 0.000 description 2
- 240000001008 Dimocarpus longan Species 0.000 description 2
- 235000005903 Dioscorea Nutrition 0.000 description 2
- 244000281702 Dioscorea villosa Species 0.000 description 2
- 235000000504 Dioscorea villosa Nutrition 0.000 description 2
- 244000127993 Elaeis melanococca Species 0.000 description 2
- 101150094177 Erf gene Proteins 0.000 description 2
- 241000588724 Escherichia coli Species 0.000 description 2
- 244000166124 Eucalyptus globulus Species 0.000 description 2
- 235000013420 Eugenia uniflora Nutrition 0.000 description 2
- 240000003813 Eugenia uniflora Species 0.000 description 2
- 235000000235 Euphoria longan Nutrition 0.000 description 2
- 241000220223 Fragaria Species 0.000 description 2
- 241000233866 Fungi Species 0.000 description 2
- 244000194101 Ginkgo biloba Species 0.000 description 2
- 108010044091 Globulins Proteins 0.000 description 2
- 102000006395 Globulins Human genes 0.000 description 2
- 108700023224 Glucose-1-phosphate adenylyltransferases Proteins 0.000 description 2
- 239000004471 Glycine Substances 0.000 description 2
- 108010033040 Histones Proteins 0.000 description 2
- 108010048671 Homeodomain Proteins Proteins 0.000 description 2
- 102000009331 Homeodomain Proteins Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 206010020649 Hyperkeratosis Diseases 0.000 description 2
- 244000017020 Ipomoea batatas Species 0.000 description 2
- 235000002678 Ipomoea batatas Nutrition 0.000 description 2
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 2
- 102000003960 Ligases Human genes 0.000 description 2
- 108090000364 Ligases Proteins 0.000 description 2
- 241000219743 Lotus Species 0.000 description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 description 2
- 241000220225 Malus Species 0.000 description 2
- 235000014826 Mangifera indica Nutrition 0.000 description 2
- 240000007228 Mangifera indica Species 0.000 description 2
- 240000001794 Manilkara zapota Species 0.000 description 2
- 235000011339 Manilkara zapota Nutrition 0.000 description 2
- 235000010624 Medicago sativa Nutrition 0.000 description 2
- 102000003792 Metallothionein Human genes 0.000 description 2
- 108090000157 Metallothionein Proteins 0.000 description 2
- 240000000249 Morus alba Species 0.000 description 2
- 235000008708 Morus alba Nutrition 0.000 description 2
- 235000006508 Nelumbo nucifera Nutrition 0.000 description 2
- 235000006510 Nelumbo pentapetala Nutrition 0.000 description 2
- 241000208133 Nicotiana plumbaginifolia Species 0.000 description 2
- 108020004711 Nucleic Acid Probes Proteins 0.000 description 2
- 241000795633 Olea <sea slug> Species 0.000 description 2
- 240000001439 Opuntia Species 0.000 description 2
- 229910019142 PO4 Inorganic materials 0.000 description 2
- 241000209117 Panicum Species 0.000 description 2
- 235000006443 Panicum miliaceum subsp. miliaceum Nutrition 0.000 description 2
- 235000009037 Panicum miliaceum subsp. ruderale Nutrition 0.000 description 2
- 240000004370 Pastinaca sativa Species 0.000 description 2
- 235000002769 Pastinaca sativa Nutrition 0.000 description 2
- 241000233805 Phoenix Species 0.000 description 2
- 102000016462 Phosphate Transport Proteins Human genes 0.000 description 2
- 108010092528 Phosphate Transport Proteins Proteins 0.000 description 2
- 108091000041 Phosphoenolpyruvate Carboxylase Proteins 0.000 description 2
- 241000219843 Pisum Species 0.000 description 2
- 241000209504 Poaceae Species 0.000 description 2
- 241000219000 Populus Species 0.000 description 2
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 2
- 241000350158 Prioria balsamifera Species 0.000 description 2
- 108010076504 Protein Sorting Signals Proteins 0.000 description 2
- 235000011432 Prunus Nutrition 0.000 description 2
- 244000294611 Punica granatum Species 0.000 description 2
- 235000014360 Punica granatum Nutrition 0.000 description 2
- 240000001987 Pyrus communis Species 0.000 description 2
- 235000014443 Pyrus communis Nutrition 0.000 description 2
- 238000011529 RT qPCR Methods 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 241000282806 Rhinoceros Species 0.000 description 2
- 102000006382 Ribonucleases Human genes 0.000 description 2
- 108010083644 Ribonucleases Proteins 0.000 description 2
- 241000124033 Salix Species 0.000 description 2
- 235000009367 Sesamum alatum Nutrition 0.000 description 2
- 240000000452 Sesamum alatum Species 0.000 description 2
- 235000003434 Sesamum indicum Nutrition 0.000 description 2
- 238000002105 Southern blotting Methods 0.000 description 2
- 241000219315 Spinacia Species 0.000 description 2
- 235000012308 Tagetes Nutrition 0.000 description 2
- 241000736851 Tagetes Species 0.000 description 2
- 235000004298 Tamarindus indica Nutrition 0.000 description 2
- 240000004584 Tamarindus indica Species 0.000 description 2
- 108010020764 Transposases Proteins 0.000 description 2
- 102000008579 Transposases Human genes 0.000 description 2
- 241000219793 Trifolium Species 0.000 description 2
- 235000007264 Triticum durum Nutrition 0.000 description 2
- 241000209143 Triticum turgidum subsp. durum Species 0.000 description 2
- 241000219873 Vicia Species 0.000 description 2
- 240000009038 Viola odorata Species 0.000 description 2
- 235000013487 Viola odorata Nutrition 0.000 description 2
- 244000193174 agave Species 0.000 description 2
- 108090000637 alpha-Amylases Proteins 0.000 description 2
- 102000004139 alpha-Amylases Human genes 0.000 description 2
- 229940024171 alpha-amylase Drugs 0.000 description 2
- 238000000137 annealing Methods 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 108091007433 antigens Proteins 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 239000011324 bead Substances 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 239000011575 calcium Substances 0.000 description 2
- 229910052791 calcium Inorganic materials 0.000 description 2
- 239000001390 capsicum minimum Substances 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 230000036978 cell physiology Effects 0.000 description 2
- 231100000045 chemical toxicity Toxicity 0.000 description 2
- 210000000349 chromosome Anatomy 0.000 description 2
- 230000008645 cold stress Effects 0.000 description 2
- 239000002299 complementary DNA Substances 0.000 description 2
- 238000004925 denaturation Methods 0.000 description 2
- 230000036425 denaturation Effects 0.000 description 2
- BABWHSBPEIVBBZ-UHFFFAOYSA-N diazete Chemical compound C1=CN=N1 BABWHSBPEIVBBZ-UHFFFAOYSA-N 0.000 description 2
- 235000004879 dioscorea Nutrition 0.000 description 2
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 210000002257 embryonic structure Anatomy 0.000 description 2
- 230000006353 environmental stress Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- ZZUFCTLCJUWOSV-UHFFFAOYSA-N furosemide Chemical compound C1=C(Cl)C(S(=O)(=O)N)=CC(C(O)=O)=C1NCC1=CC=CO1 ZZUFCTLCJUWOSV-UHFFFAOYSA-N 0.000 description 2
- 230000009368 gene silencing by RNA Effects 0.000 description 2
- 101150091511 glb-1 gene Proteins 0.000 description 2
- RWSXRVCMGQZWBV-WDSKDSINSA-N glutathione Chemical compound OC(=O)[C@@H](N)CCC(=O)N[C@@H](CS)C(=O)NCC(O)=O RWSXRVCMGQZWBV-WDSKDSINSA-N 0.000 description 2
- 230000002209 hydrophobic effect Effects 0.000 description 2
- 238000011065 in-situ storage Methods 0.000 description 2
- 230000008595 infiltration Effects 0.000 description 2
- 238000001764 infiltration Methods 0.000 description 2
- 238000002347 injection Methods 0.000 description 2
- 239000007924 injection Substances 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000002955 isolation Methods 0.000 description 2
- 239000003446 ligand Substances 0.000 description 2
- KWGKDLIKAYFUFQ-UHFFFAOYSA-M lithium chloride Chemical compound [Li+].[Cl-] KWGKDLIKAYFUFQ-UHFFFAOYSA-M 0.000 description 2
- 210000001161 mammalian embryo Anatomy 0.000 description 2
- 230000013011 mating Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000002207 metabolite Substances 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 108010058731 nopaline synthase Proteins 0.000 description 2
- 239000002853 nucleic acid probe Substances 0.000 description 2
- 235000018343 nutrient deficiency Nutrition 0.000 description 2
- 230000005305 organ development Effects 0.000 description 2
- 230000036961 partial effect Effects 0.000 description 2
- 239000002245 particle Substances 0.000 description 2
- 235000021017 pears Nutrition 0.000 description 2
- 238000010647 peptide synthesis reaction Methods 0.000 description 2
- 239000012071 phase Substances 0.000 description 2
- 239000010452 phosphate Substances 0.000 description 2
- 230000000865 phosphorylative effect Effects 0.000 description 2
- 238000003976 plant breeding Methods 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 102000054765 polymorphisms of proteins Human genes 0.000 description 2
- 108060006613 prolamin Proteins 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 235000014774 prunus Nutrition 0.000 description 2
- 108020003175 receptors Proteins 0.000 description 2
- 102000005962 receptors Human genes 0.000 description 2
- 238000006479 redox reaction Methods 0.000 description 2
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 2
- 108091008146 restriction endonucleases Proteins 0.000 description 2
- 238000007894 restriction fragment length polymorphism technique Methods 0.000 description 2
- 230000008117 seed development Effects 0.000 description 2
- 238000009394 selective breeding Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 125000006850 spacer group Chemical group 0.000 description 2
- UCSJYZPVAKXKNQ-HZYVHMACSA-N streptomycin Chemical compound CN[C@H]1[C@H](O)[C@@H](O)[C@H](CO)O[C@H]1O[C@@H]1[C@](C=O)(O)[C@H](C)O[C@H]1O[C@@H]1[C@@H](NC(N)=N)[C@H](O)[C@@H](NC(N)=N)[C@H](O)[C@H]1O UCSJYZPVAKXKNQ-HZYVHMACSA-N 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- 230000009897 systematic effect Effects 0.000 description 2
- 230000005026 transcription initiation Effects 0.000 description 2
- 230000002103 transcriptional effect Effects 0.000 description 2
- VRYALKFFQXWPIH-PBXRRBTRSA-N (3r,4s,5r)-3,4,5,6-tetrahydroxyhexanal Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)CC=O VRYALKFFQXWPIH-PBXRRBTRSA-N 0.000 description 1
- 108020004463 18S ribosomal RNA Proteins 0.000 description 1
- AFLBTVGQCQLOFJ-UHFFFAOYSA-N 2-[[1-(2,6-diaminohexanoyl)pyrrolidine-2-carbonyl]amino]-5-(diaminomethylideneamino)pentanoic acid Chemical compound NCCCCC(N)C(=O)N1CCCC1C(=O)NC(CCCN=C(N)N)C(O)=O AFLBTVGQCQLOFJ-UHFFFAOYSA-N 0.000 description 1
- ZBMRKNMTMPPMMK-UHFFFAOYSA-N 2-amino-4-[hydroxy(methyl)phosphoryl]butanoic acid;azane Chemical compound [NH4+].CP(O)(=O)CCC(N)C([O-])=O ZBMRKNMTMPPMMK-UHFFFAOYSA-N 0.000 description 1
- CAAMSDWKXXPUJR-UHFFFAOYSA-N 3,5-dihydro-4H-imidazol-4-one Chemical compound O=C1CNC=N1 CAAMSDWKXXPUJR-UHFFFAOYSA-N 0.000 description 1
- 108020003589 5' Untranslated Regions Proteins 0.000 description 1
- PQGCEDQWHSBAJP-TXICZTDVSA-N 5-O-phosphono-alpha-D-ribofuranosyl diphosphate Chemical compound O[C@H]1[C@@H](O)[C@@H](O[P@](O)(=O)OP(O)(O)=O)O[C@@H]1COP(O)(O)=O PQGCEDQWHSBAJP-TXICZTDVSA-N 0.000 description 1
- OPIFSICVWOWJMJ-AEOCFKNESA-N 5-bromo-4-chloro-3-indolyl beta-D-galactoside Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1OC1=CNC2=CC=C(Br)C(Cl)=C12 OPIFSICVWOWJMJ-AEOCFKNESA-N 0.000 description 1
- 108010049290 ADP Ribose Transferases Proteins 0.000 description 1
- 102000009062 ADP Ribose Transferases Human genes 0.000 description 1
- 241001075517 Abelmoschus Species 0.000 description 1
- RZVAJINKPMORJF-UHFFFAOYSA-N Acetaminophen Chemical compound CC(=O)NC1=CC=C(O)C=C1 RZVAJINKPMORJF-UHFFFAOYSA-N 0.000 description 1
- 108090000104 Actin-related protein 3 Proteins 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229920001817 Agar Polymers 0.000 description 1
- HOVPGJUNRLMIOZ-CIUDSAMLSA-N Ala-Ser-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CO)NC(=O)[C@H](C)N HOVPGJUNRLMIOZ-CIUDSAMLSA-N 0.000 description 1
- 102100036475 Alanine aminotransferase 1 Human genes 0.000 description 1
- 108010082126 Alanine transaminase Proteins 0.000 description 1
- 108010088751 Albumins Proteins 0.000 description 1
- 102000009027 Albumins Human genes 0.000 description 1
- 241000234282 Allium Species 0.000 description 1
- 241000368670 Ammophila <wasp> Species 0.000 description 1
- 241000380131 Ammophila arenaria Species 0.000 description 1
- 108091093088 Amplicon Proteins 0.000 description 1
- 235000007755 Annona Nutrition 0.000 description 1
- 235000011518 Annona purpurea Nutrition 0.000 description 1
- 240000006199 Annona purpurea Species 0.000 description 1
- 101710117679 Anthocyanidin 3-O-glucosyltransferase Proteins 0.000 description 1
- 235000002764 Apium graveolens Nutrition 0.000 description 1
- 240000007087 Apium graveolens Species 0.000 description 1
- 108700025465 Arabidopsis PYK10 Proteins 0.000 description 1
- 101100500204 Arabidopsis thaliana DTX19 gene Proteins 0.000 description 1
- 101100242413 Arabidopsis thaliana HAB1 gene Proteins 0.000 description 1
- 101100399945 Arabidopsis thaliana LRX1 gene Proteins 0.000 description 1
- 101100478627 Arabidopsis thaliana S-ACP-DES2 gene Proteins 0.000 description 1
- 101100484992 Arabidopsis thaliana WAK1 gene Proteins 0.000 description 1
- 101100484993 Arabidopsis thaliana WAK2 gene Proteins 0.000 description 1
- 235000003911 Arachis Nutrition 0.000 description 1
- 244000105624 Arachis hypogaea Species 0.000 description 1
- 102000008682 Argonaute Proteins Human genes 0.000 description 1
- 108010088141 Argonaute Proteins Proteins 0.000 description 1
- 241001167018 Aroa Species 0.000 description 1
- 241000972773 Aulopiformes Species 0.000 description 1
- 229930192334 Auxin Natural products 0.000 description 1
- 235000009393 Avena byzantina Nutrition 0.000 description 1
- 235000007320 Avena fatua Nutrition 0.000 description 1
- 241000209764 Avena fatua Species 0.000 description 1
- 235000018410 Avena fatua var sativa Nutrition 0.000 description 1
- 108091032955 Bacterial small RNA Proteins 0.000 description 1
- 241000209128 Bambusa Species 0.000 description 1
- 235000017166 Bambusa arundinacea Nutrition 0.000 description 1
- 235000017491 Bambusa tulda Nutrition 0.000 description 1
- 241000219164 Bertholletia Species 0.000 description 1
- 235000012284 Bertholletia excelsa Nutrition 0.000 description 1
- 244000205479 Bertholletia excelsa Species 0.000 description 1
- 108010006654 Bleomycin Proteins 0.000 description 1
- 235000004480 Bombax malabaricum Nutrition 0.000 description 1
- ZOXJGFHDIHLPTG-UHFFFAOYSA-N Boron Chemical compound [B] ZOXJGFHDIHLPTG-UHFFFAOYSA-N 0.000 description 1
- 101100001366 Brassica napus BTG-26 gene Proteins 0.000 description 1
- 235000000540 Brassica rapa subsp rapa Nutrition 0.000 description 1
- 241000219193 Brassicaceae Species 0.000 description 1
- 235000010773 Cajanus indicus Nutrition 0.000 description 1
- 244000105627 Cajanus indicus Species 0.000 description 1
- 102000000584 Calmodulin Human genes 0.000 description 1
- 108010041952 Calmodulin Proteins 0.000 description 1
- 241001239379 Calophysus macropterus Species 0.000 description 1
- 241001164374 Calyx Species 0.000 description 1
- 240000001548 Camellia japonica Species 0.000 description 1
- 244000052707 Camellia sinensis Species 0.000 description 1
- 244000292211 Canna coccinea Species 0.000 description 1
- 235000005273 Canna coccinea Nutrition 0.000 description 1
- 240000004160 Capsicum annuum Species 0.000 description 1
- 235000008534 Capsicum annuum var annuum Nutrition 0.000 description 1
- 235000007862 Capsicum baccatum Nutrition 0.000 description 1
- 101710132601 Capsid protein Proteins 0.000 description 1
- 241000973255 Carex elata Species 0.000 description 1
- 241000219173 Carica Species 0.000 description 1
- 235000014649 Carica monoica Nutrition 0.000 description 1
- 235000017350 Carissa Nutrition 0.000 description 1
- 235000001479 Carissa macrocarpa Nutrition 0.000 description 1
- 235000003255 Carthamus tinctorius Nutrition 0.000 description 1
- 244000020518 Carthamus tinctorius Species 0.000 description 1
- 241000723418 Carya Species 0.000 description 1
- 241000701489 Cauliflower mosaic virus Species 0.000 description 1
- 244000146553 Ceiba pentandra Species 0.000 description 1
- 235000003301 Ceiba pentandra Nutrition 0.000 description 1
- 108010001857 Cell Surface Receptors Proteins 0.000 description 1
- 241001148660 Cenchrus sp. Species 0.000 description 1
- 235000005940 Centaurea cyanus Nutrition 0.000 description 1
- 240000004385 Centaurea cyanus Species 0.000 description 1
- 108091092236 Chimeric RNA Proteins 0.000 description 1
- 240000006740 Cichorium endivia Species 0.000 description 1
- 235000018536 Cichorium endivia Nutrition 0.000 description 1
- 241000723347 Cinnamomum Species 0.000 description 1
- 244000241235 Citrullus lanatus Species 0.000 description 1
- 235000009831 Citrullus lanatus Nutrition 0.000 description 1
- 101710094648 Coat protein Proteins 0.000 description 1
- 108091033380 Coding strand Proteins 0.000 description 1
- 108020004705 Codon Proteins 0.000 description 1
- 241000723377 Coffea Species 0.000 description 1
- 244000205754 Colocasia esculenta Species 0.000 description 1
- 235000006481 Colocasia esculenta Nutrition 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 108020004394 Complementary RNA Proteins 0.000 description 1
- 235000007706 Corchorus sp Nutrition 0.000 description 1
- 235000002787 Coriandrum sativum Nutrition 0.000 description 1
- 244000018436 Coriandrum sativum Species 0.000 description 1
- 241000723382 Corylus Species 0.000 description 1
- 235000014493 Crataegus Nutrition 0.000 description 1
- 241001092040 Crataegus Species 0.000 description 1
- 235000004237 Crocus Nutrition 0.000 description 1
- 241000596148 Crocus Species 0.000 description 1
- 235000015655 Crocus sativus Nutrition 0.000 description 1
- 244000124209 Crocus sativus Species 0.000 description 1
- 241000219122 Cucurbita Species 0.000 description 1
- 235000003198 Cynara Nutrition 0.000 description 1
- 241000208947 Cynara Species 0.000 description 1
- IGXWBGJHJZYPQS-SSDOTTSWSA-N D-Luciferin Chemical compound OC(=O)[C@H]1CSC(C=2SC3=CC=C(O)C=C3N=2)=N1 IGXWBGJHJZYPQS-SSDOTTSWSA-N 0.000 description 1
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 1
- PUEDDPCUCPRQNY-ZYUZMQFOSA-N D-ribosylnicotinate Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1[N+]1=CC=CC(C([O-])=O)=C1 PUEDDPCUCPRQNY-ZYUZMQFOSA-N 0.000 description 1
- SRBFZHDQGSBBOR-IOVATXLUSA-N D-xylopyranose Chemical group O[C@@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-IOVATXLUSA-N 0.000 description 1
- 102000012410 DNA Ligases Human genes 0.000 description 1
- 108010061982 DNA Ligases Proteins 0.000 description 1
- 230000004544 DNA amplification Effects 0.000 description 1
- 208000005156 Dehydration Diseases 0.000 description 1
- CYCGRDQQIOGCKX-UHFFFAOYSA-N Dehydro-luciferin Natural products OC(=O)C1=CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 CYCGRDQQIOGCKX-UHFFFAOYSA-N 0.000 description 1
- 102000040623 Dicer family Human genes 0.000 description 1
- 108091070648 Dicer family Proteins 0.000 description 1
- 235000000525 Dimocarpus longan Nutrition 0.000 description 1
- 241001057636 Dracaena deremensis Species 0.000 description 1
- 101000702533 Drosophila melanogaster NAD-dependent protein deacetylase Sirt2 Proteins 0.000 description 1
- 108091061403 ERF family Proteins 0.000 description 1
- 244000133098 Echinacea angustifolia Species 0.000 description 1
- 241000192043 Echinochloa Species 0.000 description 1
- 235000001942 Elaeis Nutrition 0.000 description 1
- 241000512897 Elaeis Species 0.000 description 1
- 235000001950 Elaeis guineensis Nutrition 0.000 description 1
- 235000018060 Elaeis melanococca Nutrition 0.000 description 1
- 235000007349 Eleusine coracana Nutrition 0.000 description 1
- 244000078127 Eleusine coracana Species 0.000 description 1
- 101100491986 Emericella nidulans (strain FGSC A4 / ATCC 38163 / CBS 112.46 / NRRL 194 / M139) aromA gene Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 235000009008 Eriobotrya japonica Nutrition 0.000 description 1
- 244000061508 Eriobotrya japonica Species 0.000 description 1
- 108700039887 Essential Genes Proteins 0.000 description 1
- VGGSQFUCUMXWEO-UHFFFAOYSA-N Ethene Chemical compound C=C VGGSQFUCUMXWEO-UHFFFAOYSA-N 0.000 description 1
- 239000005977 Ethylene Substances 0.000 description 1
- 235000009419 Fagopyrum esculentum Nutrition 0.000 description 1
- 240000008620 Fagopyrum esculentum Species 0.000 description 1
- 241001070947 Fagus Species 0.000 description 1
- 241000234643 Festuca arundinacea Species 0.000 description 1
- 235000008730 Ficus carica Nutrition 0.000 description 1
- 244000025361 Ficus carica Species 0.000 description 1
- BJGNCJDXODQBOB-UHFFFAOYSA-N Fivefly Luciferin Natural products OC(=O)C1CSC(C=2SC3=CC(O)=CC=C3N=2)=N1 BJGNCJDXODQBOB-UHFFFAOYSA-N 0.000 description 1
- 108700028146 Genetic Enhancer Elements Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- CEAZRRDELHUEMR-URQXQFDESA-N Gentamicin Chemical compound O1[C@H](C(C)NC)CC[C@@H](N)[C@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](NC)[C@@](C)(O)CO2)O)[C@H](N)C[C@@H]1N CEAZRRDELHUEMR-URQXQFDESA-N 0.000 description 1
- 229930182566 Gentamicin Natural products 0.000 description 1
- 235000008100 Ginkgo biloba Nutrition 0.000 description 1
- 108010061711 Gliadin Proteins 0.000 description 1
- TWHDOEYLXXQYOZ-FXQIFTODSA-N Gln-Asn-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N TWHDOEYLXXQYOZ-FXQIFTODSA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- 108010024636 Glutathione Proteins 0.000 description 1
- QCTLGOYODITHPQ-WHFBIAKZSA-N Gly-Cys-Ser Chemical compound [H]NCC(=O)N[C@@H](CS)C(=O)N[C@@H](CO)C(O)=O QCTLGOYODITHPQ-WHFBIAKZSA-N 0.000 description 1
- 102000051366 Glycosyltransferases Human genes 0.000 description 1
- 108700023372 Glycosyltransferases Proteins 0.000 description 1
- 239000005562 Glyphosate Substances 0.000 description 1
- 102100021181 Golgi phosphoprotein 3 Human genes 0.000 description 1
- 235000009438 Gossypium Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 235000009432 Gossypium hirsutum Nutrition 0.000 description 1
- 108050002220 Green fluorescent protein, GFP Proteins 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 101150105462 HIS6 gene Proteins 0.000 description 1
- 102000002812 Heat-Shock Proteins Human genes 0.000 description 1
- 108010004889 Heat-Shock Proteins Proteins 0.000 description 1
- 244000020551 Helianthus annuus Species 0.000 description 1
- 108010066161 Helianthus annuus oleosin Proteins 0.000 description 1
- 241000756137 Hemerocallis Species 0.000 description 1
- 235000002941 Hemerocallis fulva Nutrition 0.000 description 1
- 240000009206 Hemerocallis fulva Species 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 235000005206 Hibiscus Nutrition 0.000 description 1
- 235000007185 Hibiscus lunariifolius Nutrition 0.000 description 1
- 244000284380 Hibiscus rosa sinensis Species 0.000 description 1
- RNAYRCNHRYEBTH-IHRRRGAJSA-N His-Met-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CC(C)C)C(O)=O RNAYRCNHRYEBTH-IHRRRGAJSA-N 0.000 description 1
- 102000001420 Homeobox domains Human genes 0.000 description 1
- 108050009606 Homeobox domains Proteins 0.000 description 1
- 101001130308 Homo sapiens Ras-related protein Rab-21 Proteins 0.000 description 1
- 101000836261 Homo sapiens U4/U6.U5 tri-snRNP-associated protein 2 Proteins 0.000 description 1
- 241000209219 Hordeum Species 0.000 description 1
- 101150053510 ITR1 gene Proteins 0.000 description 1
- IDAHFEPYTJJZFD-PEFMBERDSA-N Ile-Asp-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCC(=O)O)C(=O)O)N IDAHFEPYTJJZFD-PEFMBERDSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 229930010555 Inosine Natural products 0.000 description 1
- UGQMRVRMYYASKQ-KQYNXXCUSA-N Inosine Chemical compound O[C@@H]1[C@H](O)[C@@H](CO)O[C@H]1N1C2=NC=NC(O)=C2N=C1 UGQMRVRMYYASKQ-KQYNXXCUSA-N 0.000 description 1
- 235000013757 Juglans Nutrition 0.000 description 1
- 241000758789 Juglans Species 0.000 description 1
- 101100288095 Klebsiella pneumoniae neo gene Proteins 0.000 description 1
- CKLJMWTZIZZHCS-REOHCLBHSA-N L-aspartic acid Chemical compound OC(=O)[C@@H](N)CC(O)=O CKLJMWTZIZZHCS-REOHCLBHSA-N 0.000 description 1
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 1
- QIVBCDIJIAJPQS-VIFPVBQESA-N L-tryptophane Chemical compound C1=CC=C2C(C[C@H](N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-VIFPVBQESA-N 0.000 description 1
- 235000003228 Lactuca sativa Nutrition 0.000 description 1
- 240000008415 Lactuca sativa Species 0.000 description 1
- 241000219729 Lathyrus Species 0.000 description 1
- 101710094902 Legumin Proteins 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000010666 Lens esculenta Nutrition 0.000 description 1
- KUIDCYNIEJBZBU-AJNGGQMLSA-N Leu-Ile-Leu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC(C)C)C(O)=O KUIDCYNIEJBZBU-AJNGGQMLSA-N 0.000 description 1
- AAKRWBIIGKPOKQ-ONGXEEELSA-N Leu-Val-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O AAKRWBIIGKPOKQ-ONGXEEELSA-N 0.000 description 1
- 241000208204 Linum Species 0.000 description 1
- DDWFXDSYGUXRAY-UHFFFAOYSA-N Luciferin Natural products CCc1c(C)c(CC2NC(=O)C(=C2C=C)C)[nH]c1Cc3[nH]c4C(=C5/NC(CC(=O)O)C(C)C5CC(=O)O)CC(=O)c4c3C DDWFXDSYGUXRAY-UHFFFAOYSA-N 0.000 description 1
- 235000018780 Luffa acutangula Nutrition 0.000 description 1
- 244000280244 Luffa acutangula Species 0.000 description 1
- 241000219745 Lupinus Species 0.000 description 1
- 241000605547 Luzula sylvatica Species 0.000 description 1
- 244000276497 Lycopersicon esculentum Species 0.000 description 1
- 239000004472 Lysine Substances 0.000 description 1
- 241000219816 Macrotyloma Species 0.000 description 1
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 1
- 101710125418 Major capsid protein Proteins 0.000 description 1
- 240000003394 Malpighia glabra Species 0.000 description 1
- 235000014837 Malpighia glabra Nutrition 0.000 description 1
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 description 1
- 235000000889 Mammea americana Nutrition 0.000 description 1
- 240000005984 Mammea americana Species 0.000 description 1
- 241000213996 Melilotus Species 0.000 description 1
- 108010052285 Membrane Proteins Proteins 0.000 description 1
- 235000014435 Mentha Nutrition 0.000 description 1
- 241001072983 Mentha Species 0.000 description 1
- 241000878006 Miscanthus sinensis Species 0.000 description 1
- 235000009815 Momordica Nutrition 0.000 description 1
- 241000218984 Momordica Species 0.000 description 1
- 108700005084 Multigene Family Proteins 0.000 description 1
- 241000234295 Musa Species 0.000 description 1
- 101710135898 Myc proto-oncogene protein Proteins 0.000 description 1
- 102100038895 Myc proto-oncogene protein Human genes 0.000 description 1
- XMBSYZWANAQXEV-UHFFFAOYSA-N N-alpha-L-glutamyl-L-phenylalanine Natural products OC(=O)CCC(N)C(=O)NC(C(O)=O)CC1=CC=CC=C1 XMBSYZWANAQXEV-UHFFFAOYSA-N 0.000 description 1
- KZNQNBZMBZJQJO-UHFFFAOYSA-N N-glycyl-L-proline Natural products NCC(=O)N1CCCC1C(O)=O KZNQNBZMBZJQJO-UHFFFAOYSA-N 0.000 description 1
- JLEBZPBDRKPWTD-TURQNECASA-O N-ribosylnicotinamide Chemical compound NC(=O)C1=CC=C[N+]([C@H]2[C@@H]([C@H](O)[C@@H](CO)O2)O)=C1 JLEBZPBDRKPWTD-TURQNECASA-O 0.000 description 1
- 241001230286 Narenga Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 244000183278 Nephelium litchi Species 0.000 description 1
- 235000015742 Nephelium litchi Nutrition 0.000 description 1
- 101100329389 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) cre-1 gene Proteins 0.000 description 1
- 101100395023 Neurospora crassa (strain ATCC 24698 / 74-OR23-1A / CBS 708.71 / DSM 1257 / FGSC 987) his-7 gene Proteins 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 101000598243 Nicotiana tabacum Probable aquaporin TIP-type RB7-18C Proteins 0.000 description 1
- 101000655028 Nicotiana tabacum Probable aquaporin TIP-type RB7-5A Proteins 0.000 description 1
- 239000000020 Nitrocellulose Substances 0.000 description 1
- 238000000636 Northern blotting Methods 0.000 description 1
- 101710141454 Nucleoprotein Proteins 0.000 description 1
- 239000004677 Nylon Substances 0.000 description 1
- 241001446528 Ornithopus Species 0.000 description 1
- 241000209094 Oryza Species 0.000 description 1
- 240000001516 Oryza latifolia Species 0.000 description 1
- 101100235056 Oryza sativa subsp. japonica LEA14 gene Proteins 0.000 description 1
- 101710160107 Outer membrane protein A Proteins 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 240000008114 Panicum miliaceum Species 0.000 description 1
- 235000007199 Panicum miliaceum Nutrition 0.000 description 1
- 241001520808 Panicum virgatum Species 0.000 description 1
- 101000813258 Paspalum notatum Expansin-B Proteins 0.000 description 1
- 235000000370 Passiflora edulis Nutrition 0.000 description 1
- 244000288157 Passiflora edulis Species 0.000 description 1
- 101710091688 Patatin Proteins 0.000 description 1
- 206010034133 Pathogen resistance Diseases 0.000 description 1
- 241000218196 Persea Species 0.000 description 1
- 240000009164 Petroselinum crispum Species 0.000 description 1
- 235000002770 Petroselinum crispum Nutrition 0.000 description 1
- 244000081757 Phalaris arundinacea Species 0.000 description 1
- 241000219833 Phaseolus Species 0.000 description 1
- ZWJKVFAYPLPCQB-UNQGMJICSA-N Phe-Arg-Thr Chemical compound C[C@@H](O)[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)Cc1ccccc1)C(O)=O ZWJKVFAYPLPCQB-UNQGMJICSA-N 0.000 description 1
- RVRRHFPCEOVRKQ-KKUMJFAQSA-N Phe-His-Asn Chemical compound C1=CC=C(C=C1)C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)N[C@@H](CC(=O)N)C(=O)O)N RVRRHFPCEOVRKQ-KKUMJFAQSA-N 0.000 description 1
- 241000746983 Phleum pratense Species 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 244000273256 Phragmites communis Species 0.000 description 1
- 235000014676 Phragmites communis Nutrition 0.000 description 1
- 235000015334 Phyllostachys viridis Nutrition 0.000 description 1
- 244000082204 Phyllostachys viridis Species 0.000 description 1
- 244000064622 Physalis edulis Species 0.000 description 1
- 241000195888 Physcomitrella Species 0.000 description 1
- 241001444167 Picus Species 0.000 description 1
- 235000005205 Pinus Nutrition 0.000 description 1
- 241000218602 Pinus <genus> Species 0.000 description 1
- 235000008331 Pinus X rigitaeda Nutrition 0.000 description 1
- 235000011613 Pinus brutia Nutrition 0.000 description 1
- 241000018646 Pinus brutia Species 0.000 description 1
- 235000003447 Pistacia vera Nutrition 0.000 description 1
- 240000006711 Pistacia vera Species 0.000 description 1
- 241000209048 Poa Species 0.000 description 1
- 239000002202 Polyethylene glycol Substances 0.000 description 1
- ZLMJMSJWJFRBEC-UHFFFAOYSA-N Potassium Chemical compound [K] ZLMJMSJWJFRBEC-UHFFFAOYSA-N 0.000 description 1
- QMABBZHZMDXHKU-FKBYEOEOSA-N Pro-Tyr-Trp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(O)=O QMABBZHZMDXHKU-FKBYEOEOSA-N 0.000 description 1
- 101710083689 Probable capsid protein Proteins 0.000 description 1
- 241001494501 Prosopis <angiosperm> Species 0.000 description 1
- 101800004937 Protein C Proteins 0.000 description 1
- 241000508269 Psidium Species 0.000 description 1
- 244000184734 Pyrus japonica Species 0.000 description 1
- 241000219492 Quercus Species 0.000 description 1
- 108091061402 RAV family Proteins 0.000 description 1
- 230000004570 RNA-binding Effects 0.000 description 1
- 102000020146 Rab21 Human genes 0.000 description 1
- 235000019057 Raphanus caudatus Nutrition 0.000 description 1
- 244000088415 Raphanus sativus Species 0.000 description 1
- 235000011380 Raphanus sativus Nutrition 0.000 description 1
- 108020004511 Recombinant DNA Proteins 0.000 description 1
- 235000009411 Rheum rhabarbarum Nutrition 0.000 description 1
- 244000193032 Rheum rhaponticum Species 0.000 description 1
- 235000011483 Ribes Nutrition 0.000 description 1
- 241000220483 Ribes Species 0.000 description 1
- 108091028664 Ribonucleotide Proteins 0.000 description 1
- 108010000605 Ribosomal Proteins Proteins 0.000 description 1
- 102000002278 Ribosomal Proteins Human genes 0.000 description 1
- 240000000528 Ricinus communis Species 0.000 description 1
- 235000004443 Ricinus communis Nutrition 0.000 description 1
- 241001092459 Rubus Species 0.000 description 1
- 101150038966 SAD2 gene Proteins 0.000 description 1
- 108091006597 SLC15A4 Proteins 0.000 description 1
- 108050000027 START domains Proteins 0.000 description 1
- 102000009147 START domains Human genes 0.000 description 1
- 241000209051 Saccharum Species 0.000 description 1
- 241000208829 Sambucus Species 0.000 description 1
- 101800001700 Saposin-D Proteins 0.000 description 1
- 102400000827 Saposin-D Human genes 0.000 description 1
- 206010039491 Sarcoma Diseases 0.000 description 1
- 101100373125 Schizosaccharomyces pombe (strain 972 / ATCC 24843) wis4 gene Proteins 0.000 description 1
- 244000082988 Secale cereale Species 0.000 description 1
- 241000228160 Secale cereale x Triticum aestivum Species 0.000 description 1
- 229920002684 Sepharose Polymers 0.000 description 1
- 241000220261 Sinapis Species 0.000 description 1
- 108091027967 Small hairpin RNA Proteins 0.000 description 1
- 235000002634 Solanum Nutrition 0.000 description 1
- 241000207763 Solanum Species 0.000 description 1
- 244000244100 Solanum integrifolium Species 0.000 description 1
- 235000000099 Solanum integrifolium Nutrition 0.000 description 1
- 235000002560 Solanum lycopersicum Nutrition 0.000 description 1
- 102100021484 Solute carrier family 15 member 4 Human genes 0.000 description 1
- 235000007230 Sorghum bicolor Nutrition 0.000 description 1
- 241000251131 Sphyrna Species 0.000 description 1
- 101710172711 Structural protein Proteins 0.000 description 1
- 229940100389 Sulfonylurea Drugs 0.000 description 1
- 101100501960 Synechocystis sp. (strain PCC 6803 / Kazusa) sll1404 gene Proteins 0.000 description 1
- 101100389928 Synechocystis sp. (strain PCC 6803 / Kazusa) slr0677 gene Proteins 0.000 description 1
- 101100389922 Synechocystis sp. (strain PCC 6803 / Kazusa) slr0678 gene Proteins 0.000 description 1
- 241000192593 Synechocystis sp. PCC 6803 Species 0.000 description 1
- 244000045719 Syzygium Species 0.000 description 1
- 235000012096 Syzygium samarangense Nutrition 0.000 description 1
- 108700026226 TATA Box Proteins 0.000 description 1
- 239000004098 Tetracycline Substances 0.000 description 1
- 235000006468 Thea sinensis Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-N Thiophosphoric acid Chemical group OP(O)(S)=O RYYWUUFWQRZTIU-UHFFFAOYSA-N 0.000 description 1
- 102100036407 Thioredoxin Human genes 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108010022394 Threonine synthase Proteins 0.000 description 1
- 240000003243 Thuja occidentalis Species 0.000 description 1
- RHTNTTODYGNRSP-UHFFFAOYSA-N Tolazoline hydrochloride Chemical compound Cl.C=1C=CC=CC=1CC1=NCCN1 RHTNTTODYGNRSP-UHFFFAOYSA-N 0.000 description 1
- 230000010632 Transcription Factor Activity Effects 0.000 description 1
- 101710150448 Transcriptional regulator Myc Proteins 0.000 description 1
- 235000007218 Tripsacum dactyloides Nutrition 0.000 description 1
- 244000082267 Tripsacum dactyloides Species 0.000 description 1
- 235000002041 Triticum macha Nutrition 0.000 description 1
- 244000102426 Triticum macha Species 0.000 description 1
- 235000007251 Triticum monococcum Nutrition 0.000 description 1
- 235000007247 Triticum turgidum Nutrition 0.000 description 1
- 240000002805 Triticum turgidum Species 0.000 description 1
- 235000004424 Tropaeolum majus Nutrition 0.000 description 1
- 240000001260 Tropaeolum majus Species 0.000 description 1
- 235000018946 Tropaeolum minus Nutrition 0.000 description 1
- 240000008573 Tropaeolum minus Species 0.000 description 1
- ZKVANNIVSDOQMG-HKUYNNGSSA-N Trp-Tyr-Gly Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)N[C@@H](CC3=CC=C(C=C3)O)C(=O)NCC(=O)O)N ZKVANNIVSDOQMG-HKUYNNGSSA-N 0.000 description 1
- 101710162629 Trypsin inhibitor Proteins 0.000 description 1
- 229940122618 Trypsin inhibitor Drugs 0.000 description 1
- QIVBCDIJIAJPQS-UHFFFAOYSA-N Tryptophan Natural products C1=CC=C2C(CC(N)C(O)=O)=CNC2=C1 QIVBCDIJIAJPQS-UHFFFAOYSA-N 0.000 description 1
- 102000004243 Tubulin Human genes 0.000 description 1
- 108090000704 Tubulin Proteins 0.000 description 1
- CRHFOYCJGVJPLE-AVGNSLFASA-N Tyr-Gln-Asn Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N)O CRHFOYCJGVJPLE-AVGNSLFASA-N 0.000 description 1
- 102100027243 U4/U6.U5 tri-snRNP-associated protein 2 Human genes 0.000 description 1
- 108090000848 Ubiquitin Proteins 0.000 description 1
- 102000044159 Ubiquitin Human genes 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 235000012511 Vaccinium Nutrition 0.000 description 1
- 241000736767 Vaccinium Species 0.000 description 1
- PAPWZOJOLKZEFR-AVGNSLFASA-N Val-Arg-Lys Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCCCN)C(=O)O)N PAPWZOJOLKZEFR-AVGNSLFASA-N 0.000 description 1
- GBESYURLQOYWLU-LAEOZQHASA-N Val-Glu-Asp Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)N[C@@H](CC(=O)O)C(=O)O)N GBESYURLQOYWLU-LAEOZQHASA-N 0.000 description 1
- 229930003537 Vitamin B3 Natural products 0.000 description 1
- 235000009392 Vitis Nutrition 0.000 description 1
- 241000219095 Vitis Species 0.000 description 1
- 108700040099 Xylose isomerases Proteins 0.000 description 1
- 235000007244 Zea mays Nutrition 0.000 description 1
- 241001478412 Zizania palustris Species 0.000 description 1
- 241001247821 Ziziphus Species 0.000 description 1
- DFPAKSUCGFBDDF-ZQBYOMGUSA-N [14c]-nicotinamide Chemical compound N[14C](=O)C1=CC=CN=C1 DFPAKSUCGFBDDF-ZQBYOMGUSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- 238000010521 absorption reaction Methods 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- QTBSBXVTEAMEQO-UHFFFAOYSA-N acetic acid Substances CC(O)=O QTBSBXVTEAMEQO-UHFFFAOYSA-N 0.000 description 1
- 125000000641 acridinyl group Chemical group C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000012190 activator Substances 0.000 description 1
- 230000009056 active transport Effects 0.000 description 1
- 230000010933 acylation Effects 0.000 description 1
- 238000005917 acylation reaction Methods 0.000 description 1
- 230000006978 adaptation Effects 0.000 description 1
- 239000008272 agar Substances 0.000 description 1
- 230000032683 aging Effects 0.000 description 1
- PMMURAAUARKVCB-UHFFFAOYSA-N alpha-D-ara-dHexp Natural products OCC1OC(O)CC(O)C1O PMMURAAUARKVCB-UHFFFAOYSA-N 0.000 description 1
- KTVPXOYAKDPRHY-AIHAYLRMSA-N alpha-D-ribofuranose 5-phosphate Chemical compound O[C@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O KTVPXOYAKDPRHY-AIHAYLRMSA-N 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 230000000890 antigenic effect Effects 0.000 description 1
- 239000002246 antineoplastic agent Substances 0.000 description 1
- 229940041181 antineoplastic drug Drugs 0.000 description 1
- 239000003963 antioxidant agent Substances 0.000 description 1
- 230000003078 antioxidant effect Effects 0.000 description 1
- 239000001387 apium graveolens Substances 0.000 description 1
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 1
- 101150037081 aroA gene Proteins 0.000 description 1
- 229940009098 aspartate Drugs 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 239000002363 auxin Substances 0.000 description 1
- 239000011425 bamboo Substances 0.000 description 1
- DZBUGLKDJFMEHC-UHFFFAOYSA-N benzoquinolinylidene Chemical group C1=CC=CC2=CC3=CC=CC=C3N=C21 DZBUGLKDJFMEHC-UHFFFAOYSA-N 0.000 description 1
- 208000036815 beta tubulin Diseases 0.000 description 1
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 230000003115 biocidal effect Effects 0.000 description 1
- 239000002551 biofuel Substances 0.000 description 1
- 230000008827 biological function Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 230000001851 biosynthetic effect Effects 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 238000005422 blasting Methods 0.000 description 1
- 229960001561 bleomycin Drugs 0.000 description 1
- OYVAGSVQBOHSSS-UAPAGMARSA-O bleomycin A2 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC=C(N=1)C=1SC=C(N=1)C(=O)NCCC[S+](C)C)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C OYVAGSVQBOHSSS-UAPAGMARSA-O 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 229910052796 boron Inorganic materials 0.000 description 1
- 210000000481 breast Anatomy 0.000 description 1
- 244000240602 cacao Species 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 239000001728 capsicum frutescens Substances 0.000 description 1
- 150000001720 carbohydrates Chemical class 0.000 description 1
- 235000014633 carbohydrates Nutrition 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000022131 cell cycle Effects 0.000 description 1
- 230000005779 cell damage Effects 0.000 description 1
- 208000037887 cell injury Diseases 0.000 description 1
- 210000004238 cell nucleolus Anatomy 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 230000005754 cellular signaling Effects 0.000 description 1
- 239000003153 chemical reaction reagent Substances 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 239000001407 cinnamomum spp. Substances 0.000 description 1
- 239000005515 coenzyme Substances 0.000 description 1
- 235000018597 common camellia Nutrition 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 239000003184 complementary RNA Substances 0.000 description 1
- 150000001875 compounds Chemical class 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 108091036078 conserved sequence Proteins 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000012272 crop production Methods 0.000 description 1
- 239000012297 crystallization seed Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004093 cyano group Chemical group *C#N 0.000 description 1
- 230000008260 defense mechanism Effects 0.000 description 1
- 230000007850 degeneration Effects 0.000 description 1
- 239000005547 deoxyribonucleotide Substances 0.000 description 1
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 230000001079 digestive effect Effects 0.000 description 1
- 102000004419 dihydrofolate reductase Human genes 0.000 description 1
- 238000007598 dipping method Methods 0.000 description 1
- 201000010099 disease Diseases 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- NEKNNCABDXGBEN-UHFFFAOYSA-L disodium;4-(4-chloro-2-methylphenoxy)butanoate;4-(2,4-dichlorophenoxy)butanoate Chemical compound [Na+].[Na+].CC1=CC(Cl)=CC=C1OCCCC([O-])=O.[O-]C(=O)CCCOC1=CC=C(Cl)C=C1Cl NEKNNCABDXGBEN-UHFFFAOYSA-L 0.000 description 1
- 238000004090 dissolution Methods 0.000 description 1
- 230000003828 downregulation Effects 0.000 description 1
- 235000014134 echinacea Nutrition 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 108010032090 ethylene-responsive element binding protein Proteins 0.000 description 1
- 235000008995 european elder Nutrition 0.000 description 1
- 230000004720 fertilization Effects 0.000 description 1
- 235000004426 flaxseed Nutrition 0.000 description 1
- 108020001507 fusion proteins Proteins 0.000 description 1
- 102000037865 fusion proteins Human genes 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012252 genetic analysis Methods 0.000 description 1
- 238000010353 genetic engineering Methods 0.000 description 1
- 238000011331 genomic analysis Methods 0.000 description 1
- 229960002518 gentamicin Drugs 0.000 description 1
- 239000011521 glass Substances 0.000 description 1
- IAJOBQBIJHVGMQ-BYPYZUCNSA-M glufosinate-P zwitterion(1-) Chemical compound CP([O-])(=O)CC[C@H](N)C(O)=O IAJOBQBIJHVGMQ-BYPYZUCNSA-M 0.000 description 1
- 229960003180 glutathione Drugs 0.000 description 1
- 230000013595 glycosylation Effects 0.000 description 1
- 238000006206 glycosylation reaction Methods 0.000 description 1
- 108010077515 glycylproline Proteins 0.000 description 1
- XDDAORKBJWWYJS-UHFFFAOYSA-N glyphosate Chemical compound OC(=O)CNCP(O)(O)=O XDDAORKBJWWYJS-UHFFFAOYSA-N 0.000 description 1
- 229940097068 glyphosate Drugs 0.000 description 1
- 230000002363 herbicidal effect Effects 0.000 description 1
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 1
- 230000013632 homeostatic process Effects 0.000 description 1
- 230000003054 hormonal effect Effects 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 238000007654 immersion Methods 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- 238000012405 in silico analysis Methods 0.000 description 1
- 238000000338 in vitro Methods 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- SEOVTRFCIGRIMH-UHFFFAOYSA-N indole-3-acetic acid Chemical compound C1=CC=C2C(CC(=O)O)=CNC2=C1 SEOVTRFCIGRIMH-UHFFFAOYSA-N 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000012994 industrial processing Methods 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 229960003786 inosine Drugs 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 229910052742 iron Inorganic materials 0.000 description 1
- 230000002262 irrigation Effects 0.000 description 1
- 238000003973 irrigation Methods 0.000 description 1
- 238000005304 joining Methods 0.000 description 1
- 230000009191 jumping Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 230000032297 kinesis Effects 0.000 description 1
- 101150066555 lacZ gene Proteins 0.000 description 1
- 150000002605 large molecules Chemical class 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 230000004807 localization Effects 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 239000011777 magnesium Substances 0.000 description 1
- 229910052749 magnesium Inorganic materials 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- WPBNNNQJVZRUHP-UHFFFAOYSA-L manganese(2+);methyl n-[[2-(methoxycarbonylcarbamothioylamino)phenyl]carbamothioyl]carbamate;n-[2-(sulfidocarbothioylamino)ethyl]carbamodithioate Chemical compound [Mn+2].[S-]C(=S)NCCNC([S-])=S.COC(=O)NC(=S)NC1=CC=CC=C1NC(=S)NC(=O)OC WPBNNNQJVZRUHP-UHFFFAOYSA-L 0.000 description 1
- 235000005739 manihot Nutrition 0.000 description 1
- 230000008774 maternal effect Effects 0.000 description 1
- 235000013372 meat Nutrition 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 102000006240 membrane receptors Human genes 0.000 description 1
- 229930182817 methionine Natural products 0.000 description 1
- 230000011987 methylation Effects 0.000 description 1
- 238000007069 methylation reaction Methods 0.000 description 1
- 238000002493 microarray Methods 0.000 description 1
- 230000000813 microbial effect Effects 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 239000003147 molecular marker Substances 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 238000002887 multiple sequence alignment Methods 0.000 description 1
- 210000004165 myocardium Anatomy 0.000 description 1
- 230000007498 myristoylation Effects 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 235000020956 nicotinamide riboside Nutrition 0.000 description 1
- 239000011618 nicotinamide riboside Substances 0.000 description 1
- 229920001220 nitrocellulos Polymers 0.000 description 1
- 230000014075 nitrogen utilization Effects 0.000 description 1
- 230000009871 nonspecific binding Effects 0.000 description 1
- 238000003499 nucleic acid array Methods 0.000 description 1
- 238000007899 nucleic acid hybridization Methods 0.000 description 1
- 235000015816 nutrient absorption Nutrition 0.000 description 1
- 235000021232 nutrient availability Nutrition 0.000 description 1
- 230000035764 nutrition Effects 0.000 description 1
- 235000016709 nutrition Nutrition 0.000 description 1
- 229920001778 nylon Polymers 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000003204 osmotic effect Effects 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 210000001322 periplasm Anatomy 0.000 description 1
- 239000000575 pesticide Substances 0.000 description 1
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 230000026731 phosphorylation Effects 0.000 description 1
- 238000006366 phosphorylation reaction Methods 0.000 description 1
- 238000000206 photolithography Methods 0.000 description 1
- 230000029553 photosynthesis Effects 0.000 description 1
- 238000010672 photosynthesis Methods 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 239000001739 pinus spp. Substances 0.000 description 1
- 230000008638 plant developmental process Effects 0.000 description 1
- 230000037039 plant physiology Effects 0.000 description 1
- 101150022921 pncA gene Proteins 0.000 description 1
- 229920001223 polyethylene glycol Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 238000011176 pooling Methods 0.000 description 1
- 239000011591 potassium Substances 0.000 description 1
- 229910052700 potassium Inorganic materials 0.000 description 1
- 235000012015 potatoes Nutrition 0.000 description 1
- 230000013823 prenylation Effects 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 229960000856 protein c Drugs 0.000 description 1
- 230000005855 radiation Effects 0.000 description 1
- 238000011084 recovery Methods 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000008929 regeneration Effects 0.000 description 1
- 238000011069 regeneration method Methods 0.000 description 1
- 230000007363 regulatory process Effects 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000001850 reproductive effect Effects 0.000 description 1
- 239000011347 resin Substances 0.000 description 1
- 229920005989 resin Polymers 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 210000000614 rib Anatomy 0.000 description 1
- 239000002336 ribonucleotide Substances 0.000 description 1
- 125000002652 ribonucleotide group Chemical group 0.000 description 1
- 238000007363 ring formation reaction Methods 0.000 description 1
- 230000021749 root development Effects 0.000 description 1
- 235000019515 salmon Nutrition 0.000 description 1
- 239000012266 salt solution Substances 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 230000007226 seed germination Effects 0.000 description 1
- 230000035040 seed growth Effects 0.000 description 1
- 230000005562 seed maturation Effects 0.000 description 1
- 238000005204 segregation Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
- 238000002791 soaking Methods 0.000 description 1
- 229910052708 sodium Inorganic materials 0.000 description 1
- 239000001509 sodium citrate Substances 0.000 description 1
- NLJMYIDDQXHKNR-UHFFFAOYSA-K sodium citrate Chemical compound O.O.[Na+].[Na+].[Na+].[O-]C(=O)CC(O)(CC([O-])=O)C([O-])=O NLJMYIDDQXHKNR-UHFFFAOYSA-K 0.000 description 1
- FQENQNTWSFEDLI-UHFFFAOYSA-J sodium diphosphate Chemical compound [Na+].[Na+].[Na+].[Na+].[O-]P([O-])(=O)OP([O-])([O-])=O FQENQNTWSFEDLI-UHFFFAOYSA-J 0.000 description 1
- 229940048086 sodium pyrophosphate Drugs 0.000 description 1
- 239000002689 soil Substances 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 239000007790 solid phase Substances 0.000 description 1
- 210000001082 somatic cell Anatomy 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 238000005507 spraying Methods 0.000 description 1
- 230000000087 stabilizing effect Effects 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 229960005322 streptomycin Drugs 0.000 description 1
- 235000000346 sugar Nutrition 0.000 description 1
- 238000005486 sulfidation Methods 0.000 description 1
- YROXIXLRRCOBKF-UHFFFAOYSA-N sulfonylurea Chemical class OC(=N)N=S(=O)=O YROXIXLRRCOBKF-UHFFFAOYSA-N 0.000 description 1
- 239000004094 surface-active agent Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 238000004114 suspension culture Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 229960002180 tetracycline Drugs 0.000 description 1
- 229930101283 tetracycline Natural products 0.000 description 1
- 235000019364 tetracycline Nutrition 0.000 description 1
- 150000003522 tetracyclines Chemical class 0.000 description 1
- 235000019818 tetrasodium diphosphate Nutrition 0.000 description 1
- 239000001577 tetrasodium phosphonato phosphate Substances 0.000 description 1
- 108060008226 thioredoxin Proteins 0.000 description 1
- 229940094937 thioredoxin Drugs 0.000 description 1
- 210000002377 thylakoid Anatomy 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 238000012250 transgenic expression Methods 0.000 description 1
- 238000002054 transplantation Methods 0.000 description 1
- 239000002753 trypsin inhibitor Substances 0.000 description 1
- 230000003827 upregulation Effects 0.000 description 1
- 230000006459 vascular development Effects 0.000 description 1
- 108700026220 vif Genes Proteins 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- 230000028604 virus induced gene silencing Effects 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 235000019160 vitamin B3 Nutrition 0.000 description 1
- 239000011708 vitamin B3 Substances 0.000 description 1
- 238000001262 western blot Methods 0.000 description 1
- 239000002023 wood Substances 0.000 description 1
- 238000001086 yeast two-hybrid system Methods 0.000 description 1
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/82—Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
- C12N15/8241—Phenotypically and genetically modified plants via recombinant DNA technology
- C12N15/8261—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield
- C12N15/8271—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance
- C12N15/8273—Phenotypically and genetically modified plants via recombinant DNA technology with agronomic (input) traits, e.g. crop yield for stress resistance, e.g. heavy metal resistance for drought, cold, salt resistance
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1077—Pentosyltransferases (2.4.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/02—Pentosyltransferases (2.4.2)
- C12Y204/02012—Nicotinamide phosphoribosyltransferase (2.4.2.12), i.e. visfatin
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A40/00—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production
- Y02A40/10—Adaptation technologies in agriculture, forestry, livestock or agroalimentary production in agriculture
- Y02A40/146—Genetically Modified [GMO] plants, e.g. transgenic plants
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Microbiology (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Cell Biology (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Gastroenterology & Hepatology (AREA)
- Botany (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Breeding Of Plants And Reproduction By Means Of Culturing (AREA)
- Enzymes And Modification Thereof (AREA)
Abstract
LEJ1 (Loss of timing of ET and JA biosynthesis 1) 폴리펩티드, ExbB 폴리펩티드, NMPRT (nicotinamide phosphoribosyltransferase) 폴리펩티드, AP2-26-유사 폴리펩티드 또는 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물에 있어 다양한 경제적으로 중요한 수확량 관련 형질을 향상시키는 방법이 제공된다. 또한 상기 방법에 의해 생산된 식물체가 제공되며, 상기 식물체는 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. LEJ1, ExbB, NMPRT, AP2-26-유사 또는 HD8-유사 폴리펩티드를 코딩하는 핵산을 포함하는 유전자 구축물 및 이의 용도가 제공된다.
Description
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, LEJ1 (Loss of timing of ET and JA biosynthesis 1) 폴리펩티드 또는 AP2-26-유사 (APETALA2-like transcription factor) 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 LEJ1 폴리펩티드 또는 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
본 발명은 또한 일반적으로 분자생물학 분야에 관한 것이며, ExbB 폴리펩티드 또는 HD8-유사 (Homeodomain 8-like) 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 ExbB 폴리펩티드 또는 HD8-유사 폴리펩티드를 코딩하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
본 발명은 일반적으로 분자생물학 분야에 관한 것이며, 본 발명에서 NMPRT로도 언급되는 니코틴아미드 포스포리보실트랜스퍼라아제 (nicotinamide phosphoribosyltransferase)를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 수확량 관련 형질을 향상시키는 방법에 관한 것이다. 본 발명은 또한 NMPRT를 코딩하는 핵산의 발현이 조절된 식물에 관한 것으로, 상기 식물은 해당 야생형 식물 또는 다른 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는다. 본 발명은 또한 본 발명의 방법에 유용한 구축물을 제공한다.
세계 인구의 증가와 농업에 유용한 경작지의 감소는 농업의 효율성을 증가시키는 연구에 박차를 가하게 만들었다. 작물 및 원예농업 향상을 위한 전통적인 방식은 바람직한 특성을 갖는 식물체를 동정하기 위하여 선택적 육종기법을 이용한다. 그러나, 상기 선택적 육종기법에는 몇 약점이 있는데, 즉 노동집약적이며 양친으로부터 원하는 형질이 항상 전해지는 것이 아닌 이종의 유전적 요소를 갖는 식물로 귀착된다는 것이다. 분자생물학의 진보는 인간이 동물 및 식물의 생식질 (germplasm)을 변형하게 허용했다. 식물유전공학은 유전물질 (전형적으로 DNA 또는 RNA 형태)의 분리와 조작 및 이 유전물질을 식물체 내로 도입하게 했다. 상기 기술은 다양한 향상된 경제적, 농업적, 원예적 형질을 갖는 작물 또는 식물을 제공하는 능력이 있다.
특히 경제적으로 중요한 형질은 증가된 수확량이다. 수확량은 보통 작물로부터 경제적 가치의 측정할 수 있는 산물로 정의된다. 이는 양 및/또는 질의 면에서 정의될 수 있다. 수확량은 몇 요인에 직접적으로 의존되는데, 예를 들면 기관의 수와 크기, 식물체 형상 (예를 들면, 가지의 수), 종자 생산, 잎의 노화 등이다. 뿌리 발달, 양분 흡수, 스트레스 내성, 및 초기 활력 또한 수확량 결정에 중요한 요인일 수 있다. 상기 요인들을 최적화하는 것이 작물 수확량 향상에 기여할 수 있다.
많은 식물의 종자는 인간과 동물의 영양에 중요하므로 종자 수확량이 특히 중요한 형질이다. 옥수수, 벼, 밀, 캐놀라 및 대두와 같은 작물이 종자 자체의 직접적인 소비 또는 가공종자로 육성된 육류 소비를 통해서 전체 인간 칼로리 흡수량의 절반 이상을 차지한다. 상기 작물들은 설탕, 기름 및 산업적 가공공정에 사용되는 많은 종류의 대사물의 재료이기도 하다. 종자는 배 (어린 줄기와 뿌리의 근원) 및 배유 (발아 동안 및 실생의 초기 생장 동안 배의 양분의 공급원)를 포함한다. 종자 발달에는 많은 유전자가 관여되며, 뿌리, 잎 및 줄기로부터 생장하는 종자로 대사물의 이동이 필요하다. 특히 배유는 탄수화물, 오일 및 단백질의 대사 전구체를 동화하여, 이들을 알곡을 채우기 위한 저장성 고분자로 합성한다.
많은 작물에 있어 또 하나의 중요한 형질은 초기 활력 (early vigour)이다. 초기 활력을 향상시키는 것은 온대 및 열대 벼 품종에 있어 현대 벼 육종 프로그램의 중요한 목표이다. 긴 뿌리는 물에 파종하는 벼에서는 적절하게 토양에 박히기 위하여 중요하다. 벼를 직접 논에 파종한 곳에서와 식물이 물 밖으로 급속히 나와야 하는 곳에서는 긴 줄기가 활력과 연관되어 있다. 조파지에서는 긴 중배축과 자엽초가 좋은 실생 출현 (seedling emergence)에 있어서 중요하다. 식물체 내로 초기 활력을 부여하는 능력은 농업에서 매우 중요하다. 예를 들면, 불충분한 초기 활력은 대서양 연안 유럽에서 옥수수 지대 생식질에 기초한 옥수수 교배종의 도입에 대해서 제한되어 왔다.
추가의 중요한 형질은 향상된 비생물적 스트레스 내성이다. 비생물적 스트레스는 대다수 주요 작물의 평균 수확량을 50% 이상 감소시키는 전 세계적인 작물 손실의 주요 원인이다 (Wang et al., Planta 218, 1-14, 2003). 비생물적 스트레스는 건조, 염분, 극단적인 기온, 화학적 독성 및 산화적 스트레스에 의해 야기될 수 있다. 비생물적 스트레스에 대한 식물의 내성을 향상시키는 것은 전세계의 농부들에게 매우 경제적 가치가 있는 것이며, 불리한 상황에서 그리고 작물재배가 가능하지 않은 곳에서도 작물재배를 가능하게 한다.
작물 수확량은 따라서 상기 요인들 중 어느 하나를 최적화함으로써 증가시킬 수 있다.
최종 목적에 따라, 임의의 수확량 형질의 변형이 다른 것에 비해 월등히 유리할 수 있다. 사료 또는 목재 생산, 또는 바이오연료 자원과 같은 경우에 적용에 대해 예를 들면, 식물체의 영양기관 부분의 증가가 바람직하며, 곡분, 전분 또는 유지 생산과 같은 경우에는 종자에 관련된 매개변수의 증가가 특히 바람직하다. 종자 매개변수 중에서도 용도에 따라 특정한 일부의 것이 다른 것에 비해 훨씬 중요하다. 종자 크기의 증가 또는 종자 수의 증가의 형태로 다양한 기작이 종자 수확량 증가에 영향을 미칠 수 있다.
식물의 수확량 (종자 수확량 및/또는 생물량)의 증가에 대한 하나의 접근은 세포 주기 또는 식물 생장 또는 방어 기작에 관련된 다양한 신호전달 경로와 같은 식물의 내재적 생장 기작의 변형을 통해서 가능하다.
식물에서 LEJ1 (Loss of timing of ET and JA biosynthesis 1) 폴리펩티드 또는 AP2-26-유사 (APETALA2-like transcription factor) 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 다양한 수확량 관련 형질이 향상될 수 있다는 것이 밝혀졌다.
식물에서 ExbB 폴리펩티드 또는 HD8-유사 (Homeodomain 8-like) 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 다양한 수확량 관련 형질이 향상될 수 있다는 것 또한 밝혀졌다.
LEJ1
폴리펩티드 (
Loss
of
timing
of
ET
and
JA
biosynthesis
1 polypeptide) 배경기술
LEJ1은 지금까지 기능적으로 규명되지 않았다. Kleffmann 등 (Curr Biol. 1, 354-362, 2004)은 LEJ1 단백질이 시스타티오닌 베타-신타제 (CBS) 도메인을 포함한다는 것을 보고했다. 상기와 같은 CBS 도메인은 정의된 기능(들)은 없지만, 많은 효소들에 대한 조절 역할을 수행하는 것으로 추정되고, 따라서 세포 내의 산화 환원 균형을 유지하는데 도움이 될 수 있다. 상기 단백질은 색소체 (plastid)의 스트로마 (stroma)에 위치하는 것으로 예상된다 (Zybailov et al. PLoS One. 3(4):e1994, 2008, Rutschow et al. Plant Physiol. 148, 156-75, 2008).
ExbB
폴리펩티드 배경기술
ExbB는 TonB-의존 전달 복합체 (TonB-dependent transduction complex)의 일부인 것으로 알려져 있다. TonB 복합체는 큰 분자를 운반하기 위해 세균 외막에서 세균 내막에 걸친 양성자 구배를 이용한다.
TonB-ExbB 시스템 및 또한 Tol-Pal 시스템은 에너지-요구 과정에 세포질 막 양성자 구배를 연결할 수 있고, 따라서 외막을 가로지르는 능동 수송 (active transport)을 활성화한다.
E. coli 및 관련된 그람-음성 박테리아 두 시스템에서, 상기 시스템은 3가지 상동 원형질막 관통 단백질 (homologous integral plasma membrane protein)인 TonB/TolA, ExbB/TolQ 및 ExbD/TolR을 포함하는 오페론으로 구성된다.
Fang 등 (Molecular & Cellular Proteomics 1.12 (2002): 956-966)은 시아노박테리아 원형질막에서 ExbB/TolQ 및 ExbD/TolR의 추정 상동체를 동정했다. TonB/TolA 상동체는 시네코시스티스 (Synechocystis)의 게놈에서 발견되지 않았다. ExbB/TolQ는 3개의 예상 막관통 나선 (transmembrane helix)를 가지고 있으며, ExbD/TolQ는 해당 대장균(E. coli) 단백질과 동일한 막 구조 (topology) 1개를 갖는다. sll1405는 ExbB 및 ExbD 단백질 및 TonB-ExbB 시스템의 외막 부분인 FhuA 단백질을 코딩하는 하나의 오페론 (sll1404/sll1405/sll1406)의 일부이다. Slr0677은 ExbB- 및 ExbD-유사 단백질을 코딩하는 유전자로 구성되는 다른 오페론 slr0677/slr0678의 일부이다.
ExbB 및 TolQ는 동일한 막관통 구조를 공유한다. 주변세포질 (periplasm)의 N-말단에서 시작해서, 그들은 세포질 막을 3번 가로지른다 (잔기 16 및 39, 128 및 155, 및 162 및 199 사이의 ExbB의 막관통 부분, 총 길이 244개 잔기).
Suzuki 등 (Molecular Microbiology (2001) 40(1): 235-244)은 바이오폴리머의 수송을 허용하는 모든 인자가 시네코시스티스의 오페론에 밀집되어 있다는 것을 기술했다. ExbB, 즉 sII1404는 상기 인자 중 하나이다.
Agarwal 등 (Journal of Proteomics 73 (2010): 976-991)은 시네코시스티스 6803의 엽록체의 틸라코이드 막에서 ExbB의 위치를 알아냈다.
니코틴아미드
포스포리보실트랜스퍼라아제
(
NMPRT
) 폴리펩티드 배경기술
이제 식물에서 NMPRT (nicotinamide phosphoribosyltransferase) 폴리펩티드를 코딩하는 핵산의 식물에서의 발현을 조절함으로써, 특히, 니코틴아미드 포스포리보실트랜스퍼라아제를 코딩하는 핵산의 식물에서의 발현을 조절함으로써 식물의 다양한 수확량 관련 형질이 향상될 수 있다는 것이 밝혀졌다.
본 발명은 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법에서 니코틴아미드 포스포리보실트랜스퍼라아제를 코딩하는 핵산 및 이의 용도에 관한 것이다.
효소학에서, EC 2.4.2.12 클래스에 속하는 니코틴아미드 포스포리보실트랜스퍼라아제는 하기 화학 반응을 촉매하는 효소이다: 니코틴아미드 D-리보뉴클레오티드 + 디포스페이트 <=> 니코틴아미드 + 5-포스포-알파-D-리보스 1-디포스페이트. 따라서, 상기 효소의 2가지 기질은 i) 니코틴아미드 D-리보뉴클레오티드 및 ii) 디포스페이트이며, 이것의 2가지 생성물은 i) 니코틴아미드 및 ii) 5-포스포-알파-D-리보스 1-디포스페이트이다. 상기 효소는 글리코실트랜스퍼라아제 패밀리, 특히 펜토실트랜스퍼라아제 패밀리에 속한다. 상기 효소 클래스의 계통명 (systematic name)은 니코틴아미드-뉴클레오티드:디포스페이트 포스포 알파-D-리보실트랜스퍼라아제이다. 상기 효소 클래스를 나타내는데 일반적으로 사용되는 다른 명칭은 NMN 피로포스포릴라아제 (pyrophosphorylase), 니코틴아미드 모노뉴클레오티드 피로포스포릴라아제, 니코틴아미드 모노뉴클레오티드 신세타아제 및 NMN 신세타아제를 포함한다. 상기 효소는 니코티네이트 (nicotinate) 및 니코틴아미드 대사에 참여한다.
NAD(P) 보조인자의 생합성, 회수 (salvage) 및 재사용 (recycling)은 그들의 다양한 역할에 대해 중요하다. NAD는 광합성 및 호흡을 포함하는 수많은 산화 환원 반응, 및 많은 대사 및 조절 과정에 보조기질 (cosubstrate)로 참여한다. 미생물의 NAD 대사에 대한 연구는 이전 기술에서 얻을 수 있다.
예를 들어, Gazzaniga 등 (2009; Microbiol Mol Biol Rev 73: 529-541)은 NAD가 산화 환원 반응에 대한 조효소 (coenzyme) 및 ADP-리보스 트랜스퍼라아제, Sir2-관련 단백질 리신 디아세틸라아제 및 박테리아 DNA 리가아제를 포함하는 NAD-소비 효소의 기질이라는 것을 제시했다. 6가지의 동정된 생합성 전구체 중 1가지 내지 5가지의 NAD를 합성하는 미생물이 동정되었다. 아스파테이트 또는 트립토판으로부터 새로운 (De novo) NAD 합성은 보편적이거나 절대 호기성 (strictly aerobic)이 아니다. 니코틴아미드, 니코틴산, 니코틴아미드 리보시드 및 니코틴산 리보시드로부터 회수 (salvage) NAD 합성이 다른 유전자 모듈을 통해 발생한다는 것이 기술되었다. 독특한 박테리아에서 발견된 니코틴아미드 회수 유전자 nadV 및 pncA는 수평적 유전자 전이 (horizontal gene transfer)를 통해 생명의 나무 (tree of life)를 거쳐 확산되는 것으로 나타났다.
게다가, Gerdes 등 (2006, JOURNAL OF BACTERIOLOGY 3012-3023 Vol. 188, No. 80021)은 시네코시스티스 sp. PCC 8803 균주에서 확인 실험과 함께 비교 유전체 분석 (comparative genomics analysis)을 사용하여 시아노박테리아에서 NAD(P) 인자의 생합성을 연구했다는 것을 주목할 수 있다. 그들은 상기 균주의 slr0788 유전자 산물이 니코틴아미드의 2단계 비-탈아미노화 (nondeamidating) 이용의 첫 번째 단계에 관련된 니코틴아미드-선호 포스포리보실트랜스퍼라아제 NMPRT라는 것을 밝혔다 (NMN 경로 (shunt); Gerdes 등의 도 1 참고). 보존된 유전자 클러스터인 slr0787-slr0788에 의해 코딩된 상기 경로의 생리적인 역할은 외인성으로 (exogenously) 제공된 니아신 (비타민 B3 또는 니코틴산으로도 알려짐)을 이용하지 못하는 상기 시아노박테리아에 의해 뒷받침된 것처럼 내생적으로 생성된 니코틴아미드의 재사용인 것 같다.
AP2
-26-유사 폴리펩티드의 배경기술
전사 인자는 유전자의 전사를 조절한다. 전사인자의 3가지 일반적인 범주는 RNA 폴리머라아제에 결합하는 것, 다른 전사인자에 결합하는 것 및 특정한 DNA 서열에 결합하는 것으로 구별될 수 있다. 마지막 그룹은 대부분 프로모터 서열의 목적 유전자의 업스트림 (upstream)에 결합한다. AP2 (APETALA2) 및 EREBP (ethylene-responsive element binding protein, 또는 ERF; ethylene response factor)는 식물에 유일한 전사인자 패밀리의 원형적 (prototypic) 멤버이며, 그리고 그것의 특징적인 특성은 그들이 소위 AP2 DNA-결합 도메인을 포함한다는 것이다. AP2/EREBP 유전자는 큰 다중유전자 패밀리 (AP2/ERF 수퍼패밀리)를 형성하고, 그들은 꽃 기관 정체성 (floral organ identity) 결정 또는 잎 상피세포 정체성의 조절과 같은 여러 발달 과정의 중요한 조절자가 되는 것부터 생물적 및 환경적 스트레스의 다양한 유형에 대응하기 위해 식물이 사용하는 메커니즘의 일부를 형성하는 것까지 식물 생활사에서 다양한 역할을 수행한다. AP2/ERF 수퍼패밀리 내에서, 3개의 큰 패밀리는 2개의 AP2/ERF 도메인을 갖는 AP2 패밀리, 1개의 AP2/ERF 도메인을 갖는 ERF 패밀리 및 B3-타입 DNA 결합 도메인을 포함하는 RAV 패밀리로 구별된다. Nakano 등 (Plant Physiology 140, 411-432, 2006)은 애기장대 및 벼에서 ERF 유전자 패밀리를 연구했으며, 애기장대 ERF 유전자 패밀리는 12개 그룹 (그룹 I 내지 X 및 그룹 VI-유사 및 그룹 Xb-유사로 지정)으로 구분한 반면, 벼의 경우에는 15개 그룹으로 구별했다. 애기장대 그룹 VII 단백질은 보존된 모티프 VII-1 (CMVII-1)로 언급된 보존된 N-말단 모티프에 의해 규명되었다. 벼에서, 그룹 VII은 애기장대 그룹 VII보다 더 많은 단백질을 포함하고, 많은 보존된 모티프가 벼와 애기장대 그룹 VII 사이에 공통적으로 있지만, 개별적인 벼 그룹 VIIb는 상기 전형적인 CMVII-1 모티프가 없는 서열에 대해 생성되었다. 기능적으로, 그룹 VII의 멤버는 삼투 스트레스 및 질병 반응에 관련되는 것으로 기술되었다 (예를 들면, WO 2003007699). 담배에서 토마토 JERF3의 전위 과발현 (ectopic overexpression)은 형질전환체의 내염성을 증가시켰고 (Wang et al., Plant Molecular Biology 58, 183-192, 2004), 고추 전사인자 CaPF1 과발현은 소나무에서 증가된 삼투 내성을 초래했을 뿐만 아니라 (Tang et al, Plant Cell Rep. 26, 115-124, 2007), 애기장대에서 병원균 저항성을 증가시켰다 (Yi et al., Plant Physiol. 136, 2862-2874, 2004). 유사한 관찰 결과가 보리 HvRAF에 의해 만들어졌다 (Jung et al., Planta Epub 26 August 2006). 게다가, 그룹 VII 타입 ERF 단백질은 메티오닌의 생산을 위한 과정에 사용된다 (EP2005003297).
HD8
-유사 폴리펩티드의 배경기술
HD-ZIP 전사 인자 (TF)는 게다가 PHD-핑거 TF, BELL, ZF-HD TF, WOX 및 KNOX 전사인자를 포함하는 큰 수퍼패밀리의 일부이다. HD-ZIP TF는 환경 조건에 대한 반응, 기관 및 관 발달, 분열조직 조절 및 호르몬 신호전달의 매개와 같은 많은 생리적 및 발달 과정에 관여한다. HD-ZIP 단백질 패밀리는 4개의 서브패밀리 (I 내지 IV)로 세분될 수 있다. HD-ZIP 서브패밀리 IV TF에 의해 표적화된 DNA 서열은 TAAA 핵심 서열에 의해 규명된다.
LEJ1
폴리펩티드 (
Loss
of
timing
of
ET
and
JA
biosynthesis
1 polypeptide) 요약
놀랍게도, 이제 본 발명에서 정의된 LEJ1 폴리펩티드를 코딩하는 핵산의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, 본 발명에서 정의된 LEJ1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 본 발명에서 제공된 것처럼 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
ExbB
폴리펩티드 요약
놀랍게도, 이제 ExbB 폴리펩티드를 코딩하는 핵산의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 수확량 및 특히 더 증가된 종자 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, ExbB 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
니코틴아미드
포스포리보실트랜스퍼라아제
(
NMPRT
) 폴리펩티드 요약
놀랍게도, 이제 본 발명에서 정의된 NMPRT 또는 이의 상동체를 코딩하는 핵산의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 수확량 및 특히 더 증가된 종자 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 본 발명에서 제공된 것처럼 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다. 다른 구현예에서, 본 발명은 또한 핵산 및 폴리펩티드 및 본 발명에서 제공된 것처럼 대조구 식물에 비해 식물에서 특히 수확량 관련 형질을 향상시키기 위한 이의 용도, 구축물, 세포 및 형질전환 식물체와 같은 형질전환 생물을 제공한다.
AP2
-26-유사 폴리펩티드 요약
놀랍게도, 이제 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 초기 활력 (vigour) 및/또는 증가된 종자 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
또한, 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질, 특히 증가된 종자 수확량을 갖는 식물을 제공한다는 것이 밝혀졌다.
일 구현예에 따라, 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 본 발명에서 제공된 것처럼 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
HD8
-유사 폴리펩티드 요약
다른 구현예에 따라, 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 본 발명에서 제공된 것처럼 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법이 제공된다.
본 명세서에서 섹션 제목 및 표제는 단지 편의 및 참조 목적이며, 본 명세서의 의미 또는 해석에 어떤 식으로도 영향을 미쳐서는 안된다.
정의
하기 정의들은 본 명세서 전체적으로 이용될 것이다.
폴리펩티드(들)/단백질(들)
용어 "폴리펩티드" 및 "단백질"은 본 발명에서 상호 교체 사용되며, 펩티드 결합으로 연결된 임의의 길이의 아미노산의 중합형을 말한다.
폴리뉴클레오티드(들)/핵산(들)/
핵산서열
(들)/뉴클레오티드 서열(들)
용어 "폴리뉴클레오티드(들)", "핵산서열(들)", "뉴클레오티드 서열(들)", "핵산(들)", "핵산분자"는 본 발명에서 상호 교체 사용되며, 임의의 길이의 미분지된 중합형인, 리보뉴클레오티드 또는 데옥시리보뉴클레오티드 또는 양자의 조합인 뉴클레오티드를 말한다.
상동체
(들)
단백질의 "상동체"는 문제의 변형되지 않은 단백질에 대해 아미노산 치환, 결실 및/또는 삽입을 가지며, 이들이 유래되는 변형되지 않은 단백질과 유사한 생물학적 및 기능적 활성을 갖는 펩티드, 올리고펩티드, 폴리펩티드, 단백질 및 효소를 포함한다.
결실은 단백질로부터 하나 또는 하나 이상의 아미노산의 제거를 말한다.
삽입은 단백질 내의 예정된 위치에 하나 이상의 아미노산 잔기가 도입되는 것을 말한다. 삽입은 하나 또는 다수 아미노산의 서열 내 삽입뿐 아니라 N-말단 및/또는 C-말단 융합을 포함할 수 있다. 일반적으로 아미노산 서열 내 삽입은 N- 또는 C-말단 융합보다 작을 것이며, 약 1 내지 10 개 정도의 잔기이다. N- 또는 C-말단 융합 단백질 또는 펩티드의 예는 효모 two-hybrid 시스템에 사용된 전사 활성제의 결합 도메인 또는 활성화 도메인, 파아지 외피 단백질, (히스티딘)-6-태그, 글루타치온 S-전달효소-태그, 단백질 A, 말토스-결합 단백질, 디히드로폴레이트 환원효소, Tag·100 에피토프, c-myc 에피토프, FLAG®-에피토프, lacZ, CMP (칼모둘린-결합 펩티드), HA 에피토프, 단백질 C 에피토프 및 VSV 에피토프를 포함한다.
치환은 유사한 성질 (유사한 소수성, 친수성, 항원성, 알파 나선 또는 베타 병풍 구조를 형성하거나 파괴하는 경향 같은)을 갖는 다른 아미노산으로 단백질의 아미노산의 치환을 말한다. 아미노산 치환은 전형적으로 한 잔기의 치환이나, 폴리펩티드에 부여된 기능적 제약에 따라 클러스터될 수도 있으며, 1 내지 10개의 아미노산일 수 있으며; 삽입은 보통 약 1 내지 10 개 정도의 아미노산 잔기가 삽입된다. 아미노산 치환은 바람직하게는 보존적 아미노산 치환이다. 보존적 치환 표는 당업계에 주지되어 있다 (예를 들면, Creighton (1984) Proteins, W.H. Freeman and Company (Eds) 및 하기 표 1 참고).
잔기 | 보존적 치환 | 잔기 | 보존적 치환 |
Ala | Ser | Leu | Ile; Val |
Arg | Lys | Lys | Arg; Gln |
Asn | Gln; His | Met | Leu; Ile |
Asp | Glu | Phe | Met; Leu; Tyr |
Gln | Asn | Ser | Thr; Gly |
Cys | Ser | Thr | Ser; Val |
Glu | Asp | Trp | Tyr |
Gly | Pro | Tyr | Trp; Phe |
His | Asn; Gln | Val | Ile; Leu |
Ile | Leu, Val |
아미노산 치환, 결실 및/또는 삽입은 고체상 펩티드 합성 등과 같은 당업계에 주지된 펩티드 합성 기술을 이용하거나 또는 재조합 DNA 조작에 의해 용이하게 수행될 수 있다. 단백질의 치환, 삽입 또는 결실 변이체를 제조하기 위한 DNA 서열 조작 방법은 당업계에 주지되어 있다. 예를 들면, DNA 상의 예정된 위치에 치환 돌연변이를 제조하기 위한 기술은 당업자에게 주지되어 있으며, M13 돌연변이유발, T7-Gen 시험관 내 돌연변이유발 (USB, Cleveland, OH), QuickChange 자리지정 돌연변이유발 (Stratagene, San Diego, CA), PCR-매개된 자리지정 돌연변이유발 또는 다른 자리지정 돌연변이유발 프로토콜을 포함한다.
유도체
"유도체"는 목적 단백질과 같이 자연발생 형태의 단백질의 아미노산 서열에 비교하여, 자연적으로 발생하지 않는 아미노산 잔기로 아미노산의 치환 또는 자연적으로 발생하지 않는 아미노산 잔기의 첨가를 포함할 수 있는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 단백질의 "유도체"는 또한 자연발생 형인 폴리펩티드의 아미노산 서열에 비교하여 자연적으로 발생하는 변형된 (글리코실화, 아실화, 프레닐화, 인산화, 미리스토일화, 황화 등) 또는 자연적으로 발생하지 않는 변형된 아미노산 잔기를 포함하는 펩티드, 올리고펩티드, 폴리펩티드를 포함한다. 유도체는 또한 원래의 아미노산 서열에 비교하여 하나 이상의 비아미노산의 치환 또는 첨가를 포함할 수 있는데, 예를 들면, 이의 검출을 용이하게 하기 위해 결합되는 리포터 분자와 같은 아미노산 서열에 공유적으로 또는 비공유적으로 결합한 리포터 분자나 다른 리간드, 및 자연적으로 발생하는 단백질의 아미노산 서열에 대해 비자연적으로 발생하는 아미노산 잔기이다. 더욱이, "유도체"는 또한 단백질의 자연적으로 발생하는 형태와 FLAG, HIS6 또는 티오레독신 같은 태깅 펩티드 (태깅펩티드에 관하여 Terpe, Appl. Microbiol. Biotechnol. 60, 523-533, 2003 참고)와의 융합을 포함한다.
오쏘로그
(들)/
패럴로그
(들)
오쏘로그 및 패럴로그는 유전자의 조상관계를 기재하는데 사용되는 진화적 개념을 포함한다. 패럴로그는 조상 유전자의 복제로 생긴 동일한 종 내의 유전자이고; 오쏘로그는 종분화로 인하여 공통 조상 유전자로부터 유래한 다른 생물체의 유전자이다.
도메인, 모티프/일치 서열/
시그너처
용어 "도메인"은 진화적으로 연관된 단백질의 서열 정렬 시 특정 위치에서 보존된 아미노산의 세트이다. 다른 위치의 아미노산은 상동체들 간에 다양할 수 있는 반면, 특정 위치에서 고도로 보존된 아미노산은 단백질의 구조, 안정성 또는 기능에 필수적일 것인 아미노산을 나타낸다. 단백질 상동체 패밀리의 정렬된 서열상에서 고도로 보존된 부분은 임의의 문제되는 폴리펩티드가 이전에 동정된 폴리펩티드 패밀리에 속하는지를 결정하는 동정부위로 사용될 수 있다.
용어 "모티프", "일치 서열" 또는 "시그너처"는 진화적으로 연관된 단백질의 서열에 있어 짧은 보존된 영역을 말한다. 모티프는 흔히 도메인의 고도로 보존된 부분뿐만 아니라, 도메인의 일부만을 포함할 수도 있거나 또는 보존된 도메인 외부에 있을 수도 있다 (만일 모티프의 아미노산 모두가 지정된 도메인 외부에 있으면).
전문가 데이터베이스는 예를 들면, SMART (Schultz et al. (1998) Proc. Natl. Acad. Sci. USA 95, 5857-5864; Letunic et al. (2002) Nucleic Acids Res 30, 242-244), InterPro (Mulder et al., (2003) Nucl. Acids. Res. 31, 315-318), Prosite (Bucher and Bairoch (1994), A generalized profile syntax for biomolecular sequences motifs and its function in automatic sequence interpretation. (In) ISMB-94; Proceedings 2nd International Conference on Intelligent Systems for Molecular Biology. Altman R., Brutlag D., Karp P., Lathrop R., Searls D., Eds., pp53-61, AAAI Press, Menlo Park; Hulo et al., Nucl. Acids. Res. 32:D134-D137, (2004)), 또는 Pfam (Bateman et al., Nucleic Acids Research 30(1): 276-280 (2002))이 도메인의 확인을 위해 존재한다. 단백질 서열의 인실리코 분석을 위한 도구 세트는 ExPASy 프로테오믹스 서버에서 이용가능하다 (Swiss Institute of Bioinformatics (Gasteiger et al., ExPASy: the proteomics server for in-depth protein knowledge and analysis, Nucleic Acids Res. 31:3784-3788(2003)). 도메인 또는 모티프는 또한 서열 정렬과 같은 일상적인 기술을 이용해서도 확인할 수 있다.
비교를 위한 서열정렬 방법은 당업계에 주지되어 있으며, 상기 방법은 GAP, BESTFIT, BLAST, FASTA 및 TFASTA를 포함한다. GAP은 일치되는 (match) 수는 최대로, 공백 (gap)의 수는 최소로 되는 두 서열의 전체적인 (즉, 전체 서열에 걸쳐) 정렬을 찾기 위해 Needleman 및 Wunsch ((1970) J MoI Biol 48: 443-453)의 알고리즘을 사용한다. BLAST 알고리즘 (Altschul et al. (1990) J MoI Biol 215: 403-10)은 서열 동일성의 백분율을 계산하여, 두 서열 간에 유사도의 통계적 분석을 수행한다. BLAST 분석을 수행하는 소프트웨어는 NCBI (National Centre for Biotechnology Information)를 통해 공개적으로 이용 가능하다. 상동체는 예를 들면, ClustalW 다중 서열 정렬 알고리즘 (multiple sequence alignment algorithm; version 1.83)을 사용하여, 디폴트 페어와이즈 정렬 매개변수(default pairwise alignment parameter) 및 백분율 평점법으로 용이하게 동정된다. 유사성 및 동일성의 전체 백분율은 MatGAT 소프트웨어 패키지 (Campanell et al., BMC Bioinformatics. 2003 Jul 10; 4:29. MatGAT: 단백질 또는 DNA 서열을 사용하여 유사성/동일성 매트릭스를 생성하는 적용)에서 유용한 방법 중의 하나를 사용하여 결정될 수 있다. 당업자에게 명백한 것으로서 보존된 모티프 간에 정렬을 최적화하기 위하여 약간의 수작업의 편집을 수행할 수 있다. 더욱이, 상동체 동정을 위하여 전체 길이의 서열을 사용하는 대신에, 특정 도메인 또한 사용될 수 있다. 서열 동일성 값은 핵산 또는 아미노산 전체 서열에 걸쳐, 또는 선정된 도메인 또는 보존된 모티프(들)에 걸쳐 상기 기재된 프로그램으로 디폴트 매개변수(default parameter)를 사용하여 결정될 수 있다. 국부적인 정렬을 위해서는, Smith-Waterman 알고리즘이 특히 유용하다 (Smith TF, Waterman MS (1981) J. Mol. Biol 147(1);195-7).
상호간
블라스트
(
Reciprocal
BLAST
)
전형적으로 공개적으로 유용한 NCBI 데이터베이스 같은 임의의 서열 데이터베이스에 대해 조회 서열 (예를 들면, 실시예 섹션의 표 10, 표 11, 표 12, 표 22 및 표 26에 열거된 서열 이용)을 BLASTing하는 것을 포함하는 첫 번째 BLAST를 포함한다. BLASTN 또는 TBLASTX (표준 디폴트값 사용)은 일반적으로 뉴클레오티드 서열로부터 시작할 때, BLASTP 또는 TBLASTN (표준 디폴트값 사용)은 단백질 서열로부터 시작할 때 사용된다. BLAST 결과를 선택적으로 필터할 수도 있다. 필터한 결과물 또는 필터하지 않은 결과물의 전체 길이의 서열을 조회 서열이 유래된 생물체의 서열과 대조하여 다시 BLAST한다 (두 번째 BLAST). 첫 번째와 두 번째 BLAST의 결과물을 비교한다. 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터라면 패럴로그가 동정되고, 후에 다시 BLAST (BLAST back)하면 이상적으로는 조회 서열이 가장 높은 hit을 보일 것이며; 첫 번째 BLAST로부터의 높은 ranking hit이 조회 서열이 유래한 것과 동종으로부터가 아니라면 오쏘로그가 동정되며, 바람직하게는 다시 BLAST하면 가장 높은 hit 중에 조회 서열이 있다.
높은 ranking hit은 낮은 E-값을 가진 것이다. E-값이 낮을수록, 점수가 더 의미 있다 (또는 다른 말로, 우연히 hit이 발견될 기회가 적다). E-값의 계산은 당업계에 주지되어 있다. E-값에다가, 비교는 또한 백분율 동일성에 의하여 점수화된다. 백분율 동일성은 특정 길이에 걸쳐 두 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 큰 패밀리의 경우, 연관 유전자의 클러스터링을 보여주고 오쏘로그 및 패럴로그를 동정하는데 도움이 되므로 ClustalW 다음에 neighbour joining tree가 사용된다.
혼성화
본 발명에 정의된 용어 "혼성화"는 사실상 상동인 상보적인 뉴클레오티드 서열이 서로 어닐링하는 과정이다. 혼성화 과정은 전적으로 용액 내에서, 즉 상보적인 두 핵산이 용액 내에 있을 때 일어날 수 있다. 혼성화 과정은 또한 상보적인 핵산의 하나가 자성 비드, Sepharose 비드 또는 어떤 다른 수지 (resin) 같은 기질에 고정되었을 때도 일어날 수 있다. 혼성화 과정은 더욱이 상보적인 핵산 중의 하나가 니트로셀룰로스 또는 나일론 막 같은 고체 지지체에 고정되었거나 또는 사진석판술에 의하여 규산질의 유리 지지체 (핵산 어레이, 마이크로어레이 또는 핵산 칩이라 알려짐)에 고정되었을 때에도 일어날 수 있다. 혼성화가 일어나게 하기 위하여, 핵산분자는 일반적으로 열적으로 또는 화학적으로 변성되어 이중 가닥을 2개의 단일가닥으로 녹이고/녹이거나 단일 가닥 핵산으로부터 헤어핀 또는 기타 이차 구조를 제거한다.
용어 "스트린전시"는 혼성화가 일어나는 조건을 말한다. 혼성화의 스트린전시는 온도, 염 농도, 이온 강도 및 혼성화 완충액 조성 같은 조건의 영향을 받는다. 일반적으로 낮은 스트린전시 조건은 정해진 이온강도 및 pH에서 특정 서열에 대한 용해점 (Tm) 보다 약 30℃ 낮은 온도가 선택된다. 중간 스트린전시 조건은 Tm 보다 20℃ 낮은 온도일 때, 높은 스트린전시 조건은 Tm 보다 10℃ 낮은 온도이다. 높은 스트린전시 혼성화 조건은 전형적으로 표적 핵산 서열에 높은 서열 유사성을 갖는 혼성화 서열을 분리하기 위해 사용된다. 그러나, 핵산은 서열 상의 차이가 있더라도 유전암호의 축퇴로 인하여 실제로는 동일한 폴리펩티드를 코딩할 수 있다. 그러므로, 중간 스트린전시 혼성화 조건은 종종 상기 핵산분자를 동정하는데 필요할 수 있다.
Tm은 정해진 이온 강도 및 pH 하에서 표적 서열의 50%가 완벽하게 매치된 탐침에 혼성화하는 온도이다. Tm은 용액 조건, 염기 조성 및 탐침의 길이에 의존적이다. 예를 들면, 보다 긴 서열일수록 보다 높은 온도에서 특이적으로 혼성화한다. 최대 혼성화율은 Tm보다 약 16℃에서 32℃까지 낮을 때 얻어진다. 1가 양이온이 혼성액에 있으면 두 핵산 가닥 간에 정전기적 반발이 감소하여 혼성화가 촉진되고; 이 효과는 0.4M (보다 높은 농도에서는 이 효과가 무시될 수 있다)까지의 나트륨 농도에서 보여진다. 포름아미드는 DNA-DNA 및 DNA-RNA 이중가닥의 용해 온도를 포름아미드 퍼센트 당 0.6 내지 0.7℃ 내리며, 50% 포름아미드의 첨가는 혼성화율은 낮아지더라도 혼성화가 30 내지 45℃에서 일어나게 한다. 염기쌍 미스매치는 혼성화율 및 이중가닥의 온도 안정성을 감소시킨다. 평균적으로 그리고 큰 탐침에 대하여, Tm은 염기 미스매치 % 당 약 1℃ 감소한다. Tm은 혼성체의 유형에 따라 하기의 식으로 계산할 수 있다:
1) DNA-DNA 혼성체 (Meinkoth 및 Wahl, Anal. Biochem., 138: 267-284, 1984):
Tm=81.5℃+16.6xlog10[Na+]a+0.41x%[G/Cb]-500x[Lc]-1 -0.61x%포름아미드
2) DNA-RNA 또는 RNA-RNA 혼성체:
Tm= 79.8℃ + 18.5 (log10[Na+]a)+0.58(%G/Cb)+11.8(%G/Cb)2-820/Lc
3) 올리고-DNA 또는 올리고-RNAd 혼성체:
20개 뉴클레오티드 미만에 대해: Tm=2(In)
20-35개 뉴클레오티드에 대해: Tm=22+1.46(In)
a 또는 다른 1가 양이온에 대하여, 0.01-0.4 M 범위 내에서만 정확.
b 30% 내지 75% 범위 내에서 %GC에 대하여만 정확.
c L = bp으로 표시된 이중가닥의 길이.
d 올리고, 올리고뉴클레오티드; In,= 효과적인 프라이머 길이 = 2x(G/C의 수)+(A/T의 수)
비특이적 결합은 예를 들면, 단백질 함유 용액으로 막을 차단하고, 혼성화 완충액에 이종의 RNA, DNA, 및 SDS를 첨가하고, RNAse 처리하는 것과 같은 많은 알려진 기술 중 임의의 하나를 사용하여 조절할 수 있다. 비상동 탐침에 대하여, 일련의 혼성화 과정은 (i) 점차적으로 어닐링 온도를 낮추거나 (예를 들면 68℃에서 42℃까지) (ii) 점차적으로 포름아미드 농도를 낮추거나 (예를 들면 50%에서 0%까지) 중 하나를 변화시킴으로써 수행될 수 있다. 당업자는 혼성화 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
혼성화 조건 외에, 혼성화의 특이성은 또한 전형적으로 혼성화 후 세척 기능에 의존한다. 비특이적 혼성화로 생기는 백그라운드를 제거하기 위하여, 시료를 묽은 염 용액으로 세척한다. 이런 세척의 결정적인 요인은 최종 세척액의 이온 강도 및 온도를 포함한다: 염 농도가 낮고 세척 온도가 높을수록 세척의 스트린전시는 높아진다. 세척 조건은 전형적으로 혼성화 스트린전시에서 또는 보다 낮게 수행된다. 양성 혼성화는 적어도 백그라운드의 2 배의 신호로 나타난다. 일반적으로 핵산 혼성화 분석이나 유전자 증폭 검출 과정에 적절한 스트린전트 조건은 상기와 같다. 다소 스트린전트한 조건 또한 선택될 수 있다. 당업자는 세척 중에 변할 수 있는, 그리고 스트린전시 조건을 유지하거나 바꾸는 다양한 매개변수를 인식하고 있다.
예를 들면, 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 전형적인 높은 스트린전시 혼성화 조건은 65℃, 1x SSC에서 또는 42℃, 1x SSC 및 50% 포름아미드에서 혼성화 후 65℃, 0.3x SSC에서 세척하는 것이다. 50 뉴클레오티드보다 긴 DNA 혼성체에 대한 중간 스트린전시 혼성화 조건은 50℃, 4x SSC 또는 40℃, 6x SSC 및 50% 포름아미드에서 혼성화 후, 50℃, 2x SSC에서 세척하는 것이다. 혼성체의 길이는 혼성화하는 핵산에 대해 예측된 길이이다. 알려진 서열의 핵산이 혼성화 될 때 혼성체의 길이는 서열을 정렬하고 본 발명에서 기재된 보존된 영역을 동정하면 결정될 수 있다. 1X SSC는 0.15M NaCl 및 15mM 소듐 시트레이트이며; 혼성액 및 세척액에는 부가적으로 5x Denhardt's reagent, 0.5-1.0% SDS, 100 ㎍/ml 변성된, 단편화된 연어 정자 DNA, 0.5% 소듐 피로포스페이트가 포함된다.
스트린전시 수준을 결정하기 위해서는 [Sambrook 등 (2001) Molecular Cloning: laboratory manual, 3rdEdition, Cold Spring Harbor Laboratory Press, CSH, New York 또는 to Current Protocols in Molecular Biology, John Wiley & Sons, N.Y. (1989, 매년 개정됨)]을 참조하면 된다.
스플라이스
변이체
본 발명에서 사용된 용어 "스플라이스 변이체"는 선정된 인트론 및/또는 엑손이 절단되거나, 치환되거나, 대체되거나, 부가된, 또는 인트론이 짧아지거나 길어진 핵산 서열의 변이체를 포함한다. 상기 변이체는 단백질의 생물학적 활성이 사실상 보유되며; 이는 단백질의 기능적 단편을 선택적으로 보유함으로써 달성될 수 있다. 상기 스플라이스 변이체는 자연계에서 발견되거나 인공적으로 만들 수도 있다. 상기 스플라이스 변이체를 예측하고 분리하는 방법은 당업계에 주지되어 있다 (예를 들면 Foissac 및 Schiex (2005) BMC Bioinformatics 6: 25 참고).
대립인자
변이체
대립인자 또는 대립인자 변이체는 동일한 염색체 상에 위치한 해당 유전자의 또 다른 형태이다. 대립인자 변이체는 작은 삽입/결실 다형성 (Insertion/Deletion Polymorphisms, INDELs)뿐 아니라 단일염기다형성 (Single Nucleotide Polymorphisms, SNPs)을 포함한다. INDELs의 크기는 보통 100 bp 미만이다. SNPs 및 INDELs이 대부분의 생물체의 자연적으로 발생하는 다형 균주에 있어 가장 큰 서열 변이체를 형성한다.
내재적 유전자
본 발명에서 "내재적" 유전자는 자연적 형태 (즉, 임의의 인간의 개입이 없는)로 식물에서 발견되는 것으로서 문제의 유전자뿐 아니라, 분리된 형태로 연이어 식물체에 (재)도입된 (외래유전자, transgene) 동일한 유전자 (사실상 상동인 핵산/유전자)를 말한다. 예를 들면, 상기 외래유전자를 갖는 형질전환 식물체에서는 외래유전자 발현의 실질적인 감소 및/또는 내재적 유전자 발현의 실질적인 감소가 있을 수 있다. 분리된 유전자는 생물체로부터 분리되거나, 또는 예를 들면 화학적 합성에 의하여 인위적으로 만들 수도 있다.
본 발명의 명세서에서, 용어 "분리된 핵산" 또는 "분리된 폴리펩티드"는 어떤 경우에는 각각 "재조합 핵산" 또는 "재조합 폴리펩티드"와 동의어로서 생각될 수 있으며, 이의 천연 유전적 환경에서 존재하지 않고/않거나 재조합 방법에 의해 변형된 핵산 또는 폴리펩티드 각각을 말한다.
유전자
셔플링
(
shuffling
)/방향진화 (
directed
evolution
)
유전자 셔플링 또는 방향진화는 DNA 셔플링의 반복에 이은 변형된 생물학적 활성을 갖는 단백질을 코딩하는 핵산이나 그 일부분의 변이체 생성을 위해 적절한 탐색 및/또는 선발로 구성된다 (Castle 등, (2004) Science 304(5674): 1151-4; 미국 특허 제5,811,238호 및 제6,395,547호).
구축물 (
Construct
)
부가적인 조절 인자는 해독뿐 아니라 전사 인핸서를 포함한다. 본 발명을 수행함에 있어 사용하기에 적절한 종결신호 및 인핸서 서열이 당업자에게 공지되어 있다. "정의" 섹션에 기재된 바와 같이, 세포질 내에 축적되는 성숙한 메시지의 양 증가를 위하여 인트론 서열이 또한 5' 비해독 영역 (UTR) 또는 코딩 서열에 첨가될 수 있다. 다른 조절 서열 (프로모터, 인핸서, 사일런서, 인트론 서열, 3'UTR 및/또는 5'UTR 영역 외에)은 단백질 및/또는 RNA 안정화 인자들일 수 있다. 상기 서열은 알려져 있거나, 당업자가 쉽게 얻을 수 있다.
본 발명의 유전자 구축물은 특정 세포 유형에서 유지 및/또는 복제에 필요한 복제원점 서열을 포함한다. 한 예는 에피좀 유전자 요소 (예를 들면, 플라스미드 또는 코스미드 분자)로서 유전자 구축물이 세균 세포 내에 유지되어야 할 때이다. 바람직한 복제 원점은 f1-ori 및 colE1를 포함하나, 이들에 제한되는 것은 아니다.
본 발명의 방법에 사용된 핵산 서열이 성공적으로 전달되었는지 검출 및/또는 이들 핵산 서열을 포함하는 형질전환 식물의 선발을 위해서 마커 유전자 (또는 리포터 유전자)를 사용하는 것이 유리하다. 따라서, 유전자 구축물은 선택적으로 선발 마커 유전자를 포함한다. 선발 마커는 본 발명의 "정의" 섹션에서 더 상세히 기재된다. 마커 유전자는 더 이상 필요하지 않을 시 형질전환 세포로부터 제거 또는 절단될 수 있다. 마커 제거 기술은 당업계에 공지되어 있으며, 유용한 기술은 상기 정의 섹션에 기재되어 있다.
조절 인자/조절 서열/프로모터
용어 "조절 인자", "조절 서열" 및 "프로모터"는 본 발명에서 상호 호환적으로 사용되며, 결합되는 서열의 발현에 영향을 미칠 수 있는 조절 핵산 서열을 말하는 것으로 사용된다. 용어 "프로모터"는 전형적으로 유전자의 전사 개시점의 업스트림에 있으며, RNA 중합효소 및 다른 단백질의 인지 및 결합에 관여하여 작동가능하게 연결된 핵산의 전사를 지시하는 핵산 조절 서열을 말한다. 상기 언급한 용어에는 전형적인 진핵세포 게놈 유전자 (CCAAT 박스 서열이 있거나 없이 정확한 전사 개시에 필요한 TATA 박스를 포함) 및 발달 및/또는 외부 자극에 반응하여 또는 조직 특이적 방식으로 유전자 발현을 변경하는 부가적인 조절 인자 (즉, 업스트림 활성화 서열, 인핸서 및 사일런서)로부터 유래한 전사 조절 서열이 포함된다. 또한 상기 용어에는 -35 박스 서열 및/또는 -10 박스 전사 조절 서열을 포함하는 전형적인 원핵생물 유전자의 전사 조절 서열이 포함된다. 용어 "조절 인자"는 또한 세포, 조직 또는 기관에 핵산분자의 발현을 하게 하거나 활성화 또는 증가시키는 합성 융합 분자 또는 유도체를 포함한다.
"식물 프로모터"는 식물 세포에 코딩 서열 단편의 발현을 중재하는 조절 인자를 포함한다. 따라서, 식물 프로모터는 식물에서 유래해야 하는 것은 아니며, 예를 들면 식물 세포에 침범하는 바이러스 또는 미생물 기원일 수도 있다. "식물 프로모터"는 식물 세포, 예를 들면, 본 발명의 방법에서 발현되며, 본 발명에 기재된 핵산 서열로 형질전환된 식물 기원일 수 있다. 이는 또한 "식물" 종결신호 같은 "식물" 조절 신호에도 해당된다. 본 발명의 방법에 유용한 뉴클레오티드 서열의 프로모터 업스트림은 프로모터, 개방형해독틀 (ORF) 또는 종결신호 또는 ORF로부터 떨어져 있는 다른 3' 조절 영역 같은 3'-조절 영역의 기능성 또는 활성을 방해하지 않고 하나 또는 그 이상의 뉴클레오티드 치환(들), 삽입(들) 및/또는 결실(들)에 의하여 변형될 수 있다. 더욱이 서열의 변형에 의하여 프로모터 활성은 증가될 수 있거나, 또는 보다 활성이 큰 프로모터, 심지어 이종 생물체의 프로모터로 완전히 대체되는 것도 가능하다. 식물체에서의 발현을 위해서는 상기 언급된 것처럼 핵산분자는 올바른 시점에 요구되는 공간적 발현 양상으로 유전자를 발현하는 적절한 프로모터에 작동가능하게 연결되거나 프로모터를 포함해야 한다.
기능적으로 동등한 프로모터 동정을 위해, 후보 프로모터의 프로모터 강도 및/또는 발현 양상은 예를 들면, 리포터 유전자에 프로모터를 작동하게 연결하여 다양한 식물 조직에서 리포터 유전자의 발현 수준 및 양상을 검정함으로써 분석할 수 있다. 적절한 주지된 리포터 유전자는 예를 들면 베타-글루쿠로니다제 또는 베타-갈락토시다제를 포함한다. 프로모터 활성은 베타-글루쿠로니다제 또는 베타-갈락토시다제의 효소 활성을 측정함으로써 검정된다. 프로모터 강도 및/또는 발현 양상은 기준 프로모터의 것에 비교된다 (본 발명의 방법에 사용된 것과 같은 것). 다르게는, 프로모터 강도는 방사선 사진의 농도계 분석을 이용한 노던 블럿, 정량적 실시간 PCR 또는 RT-PCR 같은 당업계에 공지된 방법을 사용하여, mRNA 수준을 정량화하거나 본 발명의 방법에 사용된 핵산의 mRNA 수준과 18S rRNA 같은 housekeeping 유전자의 mRNA 수준을 비교함으로써 분석될 수 있다 (Heid 등, 1996 Genome Methods 6: 986-994). 일반적으로 "약한 프로모터"는 코딩 서열의 발현을 낮은 수준으로 이끄는 것이다. "낮은 수준"은 세포당 약 1/10,000 전사체 내지 약 1/100,000 전사체, 약 1/500,0000 전사체까지의 수준을 말한다. 역으로, "강력한 프로모터" 는 코딩 서열의 발현을 높은 수준으로 또는 세포당 약 1/10 전사체 내지 약 1/100 전사체 내지 약 1/1000 전사체로 이끄는 것이다. 일반적으로 "중간 강도 프로모터"는 강한 프로모터보다 낮은 수준으로 특히 모든 경우에 있어서 35S CaMV 프로모터의 조절하에 있을 때 얻어지는 것보다 낮은 수준으로 코딩 서열의 발현을 이끄는 프로모터를 의미한다.
작동가능하게 연결된
본 발명에서 사용된 용어 "작동가능하게 연결된"은 프로모터 서열과 해당 유전자 간의 기능적 연관을 말하는 것으로, 그럼으로써 프로모터 서열이 해당 유전자의 전사를 개시할 수 있다.
항시성
프로모터
"항시성 프로모터"는 반드시 항상은 아니더라도 생장 및 발달의 대부분 기간 중에 그리고 대부분의 환경적 조건 하에서 적어도 하나의 세포, 조직 또는 기관에서 전사적으로 활성인 프로모터를 말한다. 하기 표 2가 항시성 프로모터의 예이다.
유전자 출처 | 참고문헌 |
액틴 | McElroy 등, Plant Cell, 2: 163-171, 1990 |
HMGP | WO 2004/070039 |
CAMV 35S | Odell 등, Nature, 313: 810-812, 1985 |
CaMV 19S | Nilsson 등, Physiol. Plant. 100:456-462, 1997 |
GOS2 | de Pater 등, Plant J Nov;2(6):837-44, 1992, WO 2004/065596 |
유비퀴틴 | Christensen 등, Plant Mol. Biol. 18: 675-689, 1992 |
벼 사이클로필린 | Buchholz 등, Plant Mol Biol. 25(5): 837-43, 1994 |
옥수수 H3 히스톤 | Lepetit 등, Mol. Gen. Genet. 231:276-285, 1992 |
알팔파 H3 히스톤 | Wu 등 Plant Mol. Biol. 11:641-649, 1988 |
액틴 2 | An 등, Plant J. 10(1); 107-121, 1996 |
34S FMV | Sanger 등, Plant. Mol. Biol., 14, 1990: 433-443 |
Rubisco small subunit | US 4,962,028 |
OCS | Leisner (1988) Proc Natl Acad Sci USA 85(5): 2553 |
SAD1 | Jain 등, Crop Science, 39 (6), 1999: 1696 |
SAD2 | Jain 등, Crop Science, 39 (6), 1999: 1696 |
nos | Shaw 등 (1984) Nucleic Acids Res. 12(20):7831-7846 |
V-ATPase | WO 01/14572 |
Super 프로모터 | WO 95/14098 |
G-box 단백질 | WO 94/12015 |
편재하는 프로모터
편재하는 프로모터는 생물체의 사실상 모든 조직이나 세포에서 활성을 갖는 것이다.
발달적으로
조절된 프로모터
발달적으로 조절된 프로모터는 특정 발달 단계 중에 또는 발달적 변화가 일어나는 식물체의 부위에서 활성을 갖는 것이다.
유도성 프로모터
유도성 프로모터는 화학적 (Gatz 1997, Annu. Rev. Plant Physiol. Plant Mol. Biol., 48:89-108), 환경적 또는 물리적 자극에 반응하여 전사 개시가 유도되거나 증가되거나 또는 식물이 다양한 스트레스 환경에 노출될 때 "스트레스 유도성", 즉 활성화될 수 있거나 또는, 식물이 다양한 병원균에 노출될 때 "병원균 유도성", 즉 활성화될 수 있다.
기관 특이적/조직 특이적 프로모터
기관 특이적 또는 조직 특이적 프로모터는 잎, 뿌리, 종자조직 등과 같이 특정 기관 또는 조직에서 우선적으로 발현 개시가 가능한 것이다. 예를 들면, "뿌리 특이적 프로모터"는 식물의 다른 부위에 약간 누설된(leaky) 발현을 허용하지만, 사실상 식물의 다른 부위를 제외하고 식물 뿌리에서 우세하게 전사적으로 활성이 있는 프로모터이다. 특정 세포에서만 전사를 개시할 수 있는 프로모터는 본 발명에서 "세포 특이적"이라 한다.
뿌리 특이적 프로모터의 예는 하기 표 3에 열거된다:
유전자 출처 | 참고문헌 |
RCc3 | Plant Mol Biol. 1995 Jan;27(2):237-48 |
애기장대 PHT1 | Koyama et al. J Biosci Bioeng. 2005 Jan;99(1):38-42.; Mudge et al. (2002, Plant J. 31:341) |
알팔파 인산염 운반자 (Medicago phosphate transporter) |
Xiao et al., 2006, Plant Biol (Stuttg). 2006 Jul; 8(4): 439-49 |
애기장대 Pyk10 | Nitz et al. (2001) Plant Sci 161(2): 337-346 |
뿌리 발현성 유전자 | Tingey et al., EMBO J. 6: 1, 1987. |
담배 옥신 유도성 유전자 | Van der Zaal et al., Plant Mol. Biol. 16, 983, 1991. |
β-튜불린 | Oppenheimer, et al., Gene 63: 87, 1988. |
담배 뿌리 특이적 유전자 | Conkling, et al., Plant Physiol. 93: 1203, 1990. |
B. napus G1-3b 유전자 | United States Patent No. 5, 401, 836 |
SbPRP1 | Suzuki et al., Plant Mol. Biol. 21: 109-119, 1993. |
LRX1 | Baumberger et al. 2001, Genes & Dev. 15:1128 |
BTG-26 유채 (Brassica napus) | US 20050044585 |
LeAMT1 (토마토) | Lauter et al. (1996, PNAS 3:8139) |
The LeNRT1-1 (토마토) | Lauter et al. (1996, PNAS 3:8139) |
Class I 파타틴 유전자 (감자) | Liu et al., Plant Mol. Biol. 17(6):1139-1154 |
KDC1 (Daucus carota) | Downey et al. (2000, J. Biol. Chem. 275:39420) |
TobRB7 유전자 | W Song (1997) PhD Thesis, North Carolina State University, Raleigh, NC USA |
OsRAB5a (벼) | Wang et al. 2002, Plant Sci. 163:273 |
ALF5 (애기장대) | Diener et al. (2001, Plant Cell 13:1625) |
NRT2;1Np (N. plumbaginifolia) | Quesada et al. (1997, Plant Mol. Biol. 34:265) |
종자 특이적 프로모터는 종자 조직에서만 반드시 배타적으로는 아니지만 (누설 발현의 경우) 종자조직에서 우세하게 전사적으로 활성인 것이다. 종자 특이적 프로모터는 종자발달 및/또는 발아 중에 활성일 것이다. 종자 특이적 프로모터는 배유/호분층/배 특이적일 수 있다. 종자 특이적 프로모터 (배유/호분층/배 특이적)의 예는 하기 표 4 내지 표 7에 제시된다. 종자 특이적 프로모터의 추가적인 예는 Qing Qu 및 Takaiwa (Plant Biotechnol. J. 2, 113-125, 2004)에 제시되며, 이의 개시는 충분히 설명한 것처럼 본 발명에 원용에 의해 포함된다.
유전자 출처 | 참고문헌 |
종자 특이적 유전자 | Simon et al., Plant Mol. Biol. 5: 191, 1985; |
Scofield et al., J. Biol. Chem. 262: 12202, 1987.; | |
Baszczynski et al., Plant Mol. Biol. 14: 633, 1990. | |
Brazil Nut 알부민 | Pearson et al., Plant Mol. Biol. 18: 235-245, 1992. |
레규민(legumin) | Ellis et al., Plant Mol. Biol. 10: 203-214, 1988. |
글루텔린(벼) | Takaiwa et al., Mol. Gen. Genet. 208: 15-22, 1986; |
Takaiwa et al., FEBS Letts. 221: 43-47, 1987. | |
제인(zein) | Matzke et al Plant Mol Biol, 14(3):323-32 1990 |
napA | Stalberg et al, Planta 199: 515-519, 1996. |
밀 LMW 및 HMW 글루테닌-1 | Mol Gen Genet 216:81-90, 1989; NAR 17:461-2, 1989 |
밀 SPA | Albani et al, Plant Cell, 9: 171-184, 1997 |
밀 α,β,γ,-글리아딘 | EMBO J. 3:1409-15, 1984 |
보리 Itr1 프로모터 | Diaz et al. (1995) Mol Gen Genet 248(5):592-8 |
보리 B1, C, D, 호데인(hordein) | Theor Appl Gen 98:1253-62, 1999; Plant J 4:343-55, 1993; Mol Gen Genet 250:750-60, 1996 |
보리 DOF | Mena et al, Plant Journal, 116(1): 53-62, 1998 |
blz2 | EP99106056.7 |
합성 프로모터 | Vicente-Carbajosa et al., Plant J. 13: 629-640, 1998. |
벼 프롤라민 NRP33 | Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 |
벼 a-글로불린 Glb-1 | Wu et al, Plant Cell Physiology 39(8) 885-889, 1998 |
벼 OSH1 | Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996 |
벼 a-글로불린 REB/OHP-1 | Nakase et al. Plant Mol. Biol. 33: 513-522, 1997 |
벼 ADP-글루코스 파이로포스포릴라아제 | Trans Res 6:157-68, 1997 |
옥수수 ESR 유전자 패밀리 | Plant J 12:235-46, 1997 |
수수(Sorghum) α-kafirin | DeRose et al., Plant Mol. Biol 32:1029-35, 1996 |
KNOX | Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 |
벼 올레오신 | Wu et al, J. Biochem. 123:386, 1998 |
해바라기 올레오신 | Cummins et al., Plant Mol. Biol. 19: 873-876, 1992 |
PRO0117, 추정 벼 40S 리보좀 단백질 | WO 2004/070039 |
PRO0136, 벼 알라닌 아미노트랜스퍼라제 | 미공개 |
PRO0147, 트립신 저해제 ITR1 (보리) | 미공개 |
PRO0151, 벼 WSI18 | WO 2004/070039 |
PRO0175, 벼 RAB21 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
α-아밀라아제 (Amy32b) | Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 |
카텝신(cathepsin) β-유사 유전자 | Cejudo et al, Plant Mol Biol 20:849-856, 1992 |
보리 Ltp2 | Kalla et al., Plant J. 6:849-60, 1994 |
Chi26 | Leah et al., Plant J. 4:579-89, 1994 |
옥수수 B-Peru | Selinger et al., Genetics 149;1125-38,1998 |
유전자 출처 | 참고문헌 |
글루텔린 (벼) | Takaiwa et al. (1986) Mol Gen Genet 208:15-22; Takaiwa et al. (1987) FEBS Letts. 221:43-47 |
제인(zein) | Matzke et al., (1990) Plant Mol Biol 14(3): 323-32 |
밀 LMW 및 HMW 글루테닌-1 | Colot et al. (1989) Mol Gen Genet 216:81-90; Anderson et al. (1989) NAR 17:461-2 |
밀 SPA | Albani et al. (1997) Plant Cell 9:171-184 |
밀 글리아딘 | Rafalski et al. (1984) EMBO 3:1409-15 |
보리 Itr1 프로모터 | Diaz et al. (1995) Mol Gen Genet 248(5):592-8 |
보리 B1, C, D, 호데인(hordein) | Cho et al. (1999) Theor Appl Genet 98:1253-62; Muller et al. (1993) Plant J 4:343-55; Sorenson et al. (1996) Mol Gen Genet 250:750-60 |
보리 DOF | Mena et al, (1998) Plant J 116(1): 53-62 |
blz2 | Onate et al. (1999) J Biol Chem 274(14):9175-82 |
합성 프로모터 | Vicente-Carbajosa et al. (1998) Plant J 13:629-640 |
벼 프롤라민 NRP33 | Wu et al, (1998) Plant Cell Physiol 39(8) 885-889 |
벼 글로불린 Glb-1 | Wu et al. (1998) Plant Cell Physiol 39(8) 885-889 |
벼 글로불린 REB/OHP-1 | Nakase et al. (1997) Plant Molec Biol 33: 513-522 |
벼 ADP-글루코스 파이로포스포릴라아제 | Russell et al. (1997) Trans Res 6:157-68 |
옥수수 ESR 유전자 패밀리 | Opsahl-Ferstad et al. (1997) Plant J 12:235-46 |
수수(sorghum) kafirin | DeRose et al. (1996) Plant Mol Biol 32:1029-35 |
유전자 출처 | 참고문헌 |
벼 OSH1 | Sato et al, Proc. Natl. Acad. Sci. USA, 93: 8117-8122, 1996 |
KNOX | Postma-Haarsma et al, Plant Mol. Biol. 39:257-71, 1999 |
PRO0151 | WO 2004/070039 |
PRO0175 | WO 2004/070039 |
PRO005 | WO 2004/070039 |
PRO0095 | WO 2004/070039 |
유전자 출처 | 참고문헌 |
α-아밀라아제 (Amy32b) | Lanahan et al, Plant Cell 4:203-211, 1992; Skriver et al, Proc Natl Acad Sci USA 88:7266-7270, 1991 |
카텝신 β-유사 유전자 | Cejudo et al, Plant Mol Biol 20:849-856, 1992 |
보리 Ltp2 | Kalla et al., Plant J. 6:849-60, 1994 |
Chi26 | Leah et al., Plant J. 4:579-89, 1994 |
옥수수 B-Peru | Selinger et al., Genetics 149;1125-38,1998 |
본 발명에서 정의된 녹색 조직 특이적 프로모터는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 녹색 조직에서 우세하게 전사적으로 활성이 있는 프로모터이다.
본 발명의 방법을 수행하는데 사용될 수 있는 녹색 조직 특이적 프로모터의 예는 하기의 표 8에 있다.
유전자 출처 | 발현 | 참고문헌 |
옥수수 오쏘포스페이트 디키나아제 (Orthophosphate dikinase) |
잎 특이적 | Fukavama et al., Plant Physiol. 2001 Nov;127(3):1136-46 |
옥수수 포스포에놀피루베이트 카르복실라아제 | 잎 특이적 | Kausch et al., Plant Mol Biol. 2001 Jan;45(1):1-15 |
벼 포스포에놀피루베이트 카르복실라아제 | 잎 특이적 | Lin et al., 2004 DNA Seq. 2004 Aug;15(4):269-76 |
벼 작은 서브유닛 루비스코 | 잎 특이적 | Nomura et al., Plant Mol Biol. 2000 Sep;44(1)99-106 |
벼 베타 익스팬신(expansin) EXBP9 | 어린줄기 특이적 | WO 2004/070039 |
Pigeonpea 작은 서브유닛 루비스코 | 잎 특이적 | Panguluri et al., Indian J Exp Biol. 2005 Apr;43(4):369-72 |
완두 RBCS3A | 잎 특이적 |
조직 특이적 프로모터의 다른 예는 식물의 다른 부위에 약간 누설된 발현을 허용하지만, 식물의 다른 부위를 제외하고 실질적으로 분열조직에서 우세하게 전사적으로 활성이 있는 분열조직 특이적 프로모터이다. 본 발명의 방법을 수행하는데 사용될 수 있는 녹색 분열조직 특이적 프로모터의 예는 하기의 표 9에 있다.
유전자 출처 | 발현 패턴 | 참고문헌 |
벼 OSH1 | 어린줄기 정단 분열조직, 구상배 단계에서 실생단계까지 |
Sato et al. (1996) Proc. Natl. Acad. Sci. USA, 93:8117-8122 |
벼 메탈로티오네인 (metallothionein) |
분열조직 특이적 | BAD87835.1 |
WAK1 & WAK2 | 어린줄기 및 뿌리, 정단 분열조직, 및 팽창 잎 및 꽃받침 |
Wagner & Kohorn (2001) Plant Cell 13(2): 303-318 |
종결신호(
Terminator
)
용어 "종결신호"는 일차 전사체의 3' 프로세싱 및 폴리아데닐화와 전사 종결의 신호가 되는 전사 단위의 말단에 있는 DNA 서열인 조절 서열이다. 종결신호는 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래될 수 있다. 첨가된 종결신호는 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
선발
마커
(유전자)/리포터 유전자
"선발 마커", "선발 마커 유전자" 또는 "리포터 유전자"는 본 발명의 핵산 구축물로 감염되거나 형질전환된 세포의 동정 및/또는 선발을 촉진하기 위하여 발현된 세포에 표현형을 부여하는 임의의 유전자를 포함한다. 이들 마커 유전자는 일련의 상이한 원리를 통해 핵산 분자의 성공적인 전달을 확인 가능하게 한다. 적절한 마커는 항생제나 제초제 저항성을 주거나 새로운 대사 형질을 도입하거나 또는 시각적인 선발을 가능하게 하는 마커로부터 선택된다. 선발 마커 유전자의 예는 항생제 (네오마이신 및 카나마이신을 인산화하는 nptII, 하이그로마이신을 인산화하는 hpt, 또는 예를 들면, 블레오마이신, 스트렙토마이신, 테트라사이클린, 클로람페니콜, 앰피실린, 겐타마이신, 제네티신 (G418), 스펙티노마이신, 블라스티시딘에 저항성을 주는 유전자), 제초제 (예를 들면, Basta®에 저항성을 제공하는 bar; 글리포제이트에 대한 저항성을 제공하는 aroA 또는 gox, 또는 예를 들면, 이미다졸리논, 포스피노트리신, 설포닐우레아에 저항성을 주는 유전자)에 저항성을 주는 유전자 또는 대사적 형질을 제공하는 유전자 (식물이 유일한 탄소원으로 만노즈를 이용하게 하는 manA 또는 자일로스 이용을 위한 자일로스 이성화효소, 또는 2-데옥시글루코스에 대한 저항성 같은 반영양적 마커)를 포함한다. 가시적 마커 유전자의 발현으로 발색 (예를 들면 베타-글루쿠로니다제, GUS, 또는 발색된 기질, 예를 들면 X-Gal을 가진 베타-갈락토시다제), 발광 (루시페린/루시파라제 시스템 같은) 또는 형광 (녹색 형광 단백질, GFP, 및 이의 유도체)이 형성된다. 이 목록은 소수의 가능한 마커만을 나타낸다. 당업자는 상기 마커에 친숙하다. 생물체 및 선발 방법에 따라 다른 마커가 선호된다.
식물 세포로 핵산의 안정적인 또는 일시적인 통합에 따라 소수의 세포만이 외래 DNA를 취하여, 필요 시 사용된 발현벡터 및 사용된 감염 기술에 따라 게놈 내로 이를 통합한다는 것이 알려져 있다. 통합체를 동정하고 선발하기 위하여, 선발 마커를 코딩하는 유전자 (상기 기재된 것과 같은)가 보통 목적 유전자와 함께 숙주 세포에 도입된다. 이들 마커는 예를 들면 이들 마커 유전자가 예를 들면 전통적인 방법에 의한 결실에 의하여 기능이 없는 돌연변이체에 사용될 수 있다. 더욱이, 선발 마커를 코딩하는 핵산분자는 본 발명의 또는 본 발명의 방법에 사용된 폴리펩티드를 코딩하는 서열을 포함하는 동일한 벡터 또는 그 외 별개 백터 상에서 숙주 세포로 도입될 수 있다. 도입된 핵산으로 안정적으로 감염된 세포는 예를 들면 선발에 의해서 동정될 수 있다 (예를 들면, 통합된 선발 마커를 갖는 세포는 생존하는 반면, 다른 세포는 사멸한다).
마커 유전자, 특히 항생제 및 제초제에 저항성이 있는 유전자는 일단 핵산이 성공적으로 도입되면 형질전환 숙주 세포에서 더 이상 필요하지 않거나, 바람직하지 않으므로, 핵산 도입을 위한 본 발명의 방법에서는 이들 마커 유전자가 제거 또는 절단되게 하는 기술을 사용한다. 하나의 상기 방법이 동시형질전환 (co-transformation)으로 알려진 것이다. 동시형질전환 방법은 형질전환을 위해 두 벡터를 동시에 사용하여, 하나의 벡터에는 본 발명에 따른 핵산이 있고, 둘째 벡터에는 마커 유전자(들)이 있다. 대부분의 형질전환체는 양 벡터를 받거나, 식물의 경우 (형질전환체의 40% 이상까지) 포함한다. 아그로박테리아로 형질전환한 경우, 형질전환체는 보통 벡터의 일부, 즉 보통 발현 카세트인 T-DNA에 의해 플랭킹된 서열만을 받는다. 마커 유전자는 연이어 교배를 하여 형질전환 식물체로부터 제거된다. 다른 방법에서는, 마커 유전자가 트랜스포손에 통합되어 원하는 핵산과 함께 형질전환에 사용된다 (Ac/Ds 기술로 알려짐). 형질전환체는 트랜스포자제(transposase) 공급원과 교배될 수 있거나 또는 트랜스포자제가 발현되게 하는 핵산 구축물로 일시적으로 또는 안정적으로 형질전환된다. 어떤 경우에 (약 10%), 일단 형질전환이 성공적으로 되면 트랜스포존은 숙주 세포의 게놈 밖으로 튀어나가 소실된다. 더 많은 경우에, 트랜스포존은 다른 구역으로 튄다. 이들 경우에 마커 유전자는 교배에 의하여 제거되어야 한다. 미생물학에서 상기 일이 있어났는지 검출을 가능하게 하거나 용이하게 하는 기술이 개발되었다. 보다 편리한 방법은 재조합 시스템이라 알려진 것에 의존하는 것으로; 이점은 교배에 의한 제거가 면제될 수 있다는 것이다. 이 유형의 가장 잘 알려진 시스템은 Cre/lox 시스템이다. Cre1은 loxP 서열 사이에 위치한 서열을 제거하는 리콤비나아제이다. 만일 마커 유전자가 loxP 서열 사이에 통합되면 리콤비나아제의 발현에 의해서 마커 유전자는 제거된다. 다른 재조합 시스템은 HIN/HIX, FLP/FRT 및 REP/STB 시스템 (Tribble 등, J. Biol. Chem., 275, 2000: 22255-22267; Velmurugan 등, J. Cell Biol., 149, 2000: 553-566)이다. 본 발명에 따른 핵산 서열의 식물 게놈 내로 위치 특이적 통합이 가능하다. 자연적으로, 이들 방법은 또한 효모, 균류 또는 세균 같은 미생물에 응용될 수 있다.
형질전환된 (
transgenic
)/외래유전자 (
transgene
)/재조합
본 발명에서 "형질전환된", "외래유전자" 또는 "재조합"은 예를 들면, 핵산 서열, 발현카세트, 핵산 서열을 포함하는 유전자 구축물 또는 벡터, 또는 본 발명에 따른 핵산 서열, 발현 카세트나 벡터로 형질전환된 생물체, 하기에 기재된 재조합 방법에 의해 생성된 모든 구조물에 관한 의미이다:
(a) 본 발명의 방법에 유용한 단백질을 코딩하는 핵산서열, 또는
(b) 본 발명에 따른 핵산 서열에 작동가능하게 연결된 유전자 조절 서열 (들), 예를 들면 프로모터, 또는
(c) a) 및 b)
가 자연적인 유전적 환경에 있지 않거나, 재조합 방법으로 변형되어 왔으므로 예를 들면, 하나 또는 그 이상의 뉴클레오티드 잔기의 치환, 부가, 결실, 역위 또는 삽입의 유형의 변형이 가능하다. 자연적인 유전적 환경은 원래의 식물에서 자연적인 게놈 또는 염색체상의 위치나 게놈 라이브러리에서의 존재를 의미하는 것으로 이해된다. 게놈 라이브러리의 경우, 핵산 서열의 자연적인 유전적 환경은 바람직하게는 적어도 부분적으로는 보유된다. 환경은 적어도 한쪽의 핵산 서열을 플랭킹하며 적어도 50 bp, 바람직하게는 적어도 500 bp, 특히 바람직하게는 적어도 1000 bp, 가장 바람직하게는 적어도 5000 bp 길이의 서열을 갖는다. 자연적으로 발생하는 발현 카세트, 예를 들면 본 발명의 방법에 유용한 폴리펩티드를 코딩하는 해당 핵산 서열과 핵산 서열의 자연적 프로모터의 자연적으로 생긴 조합은 이 발현 카세트가 예를 들면 돌연변이 처리 같은 비자연적인 합성 ("인위적") 방법으로 변형될 때 형질 전환 발현카세트가 된다. 적절한 방법이 예를 들면 US 5,565,350 또는 WO 00/15815에 기재되어 있다.
본 발명의 목적상, 형질전환된 식물은 상기처럼 본 발명의 방법에서 사용된 핵산이 상기 식물의 게놈에 존재하지 않거나, 상기 식물로부터 유래하지 않거나, 상기 식물의 게놈에 존재할 수 있지만, 상기 식물의 게놈상의 자연적 위치에 있지 않아 핵산이 동종에서 또는 이종에서 발현될 수 있다는 의미로 이해된다. 그러나, 언급된 바와 같이, 형질전환은 또한 본 발명에 있어 또는 본 발명 방법에 사용된 핵산이 식물 게놈 내의 자연적 위치에 있는 반면, 그 서열이 자연적 서열에 대하여 변형되었고 및/또는 자연적 서열의 조절 서열이 변형되었음을 의미한다. 형질전환은 핵산의 동종 또는 바람직하게는 이종 발현이 일어나는 게놈 내의 비자연적 위치에서 본 발명에 따른 핵산의 발현을 의미하는 것으로 바람직하게는 이해된다. 바람직한 형질전환된 식물이 본 발명에서 언급된다.
조절(
modulation
)
용어 "조절"은 발현 또는 유전자 발현에 관한 것으로, 대조구 식물에 비하여 발현 수준이 상기 유전자 발현에 의하여 변화되는, 발현 수준이 증가되거나 감소되는 과정이다. 원래의 조절되지 않은 발현은 구조 RNA (rRNA, tRNA) 또는 연이어 해독되는 mRNA 같이 임의의 종류의 발현일 수 있다. 본 발명의 목적을 위해, 원래의 조절되지 않은 발현은 또한 임의의 발현의 부재일 수 있다. 용어 "활성 조절"은 식물의 증가된 수확량 관련 형질 (예를 들면, 증가된 수확량 및/또는 증가된 생장)로 이끄는, 본 발명의 핵산 서열 또는 코딩된 단백질의 발현의 임의의 변화를 의미한다. 발현은 없는 상태 (zero) (부재, 또는 측정 불가능한 발현)에서 특정 양까지 증가하거나, 특정 양에서 측정 불가능한 적은 양 또는 없는 상태까지 감소할 수 있다.
발현
용어 "발현" 또는 "유전자 발현"은 특정 유전자 또는 특정 유전자들 또는 특정 유전자 구축물의 전사를 의미한다. 용어 "발현" 또는 "유전자 발현"은 특히 유전자 또는 유전자들 또는 유전자 구축물의 구조 RNA (rRNA, tRNA), 또는 단백질로의 이은 해독이 있거나 없는 mRNA로의 전사를 의미한다. 상기 과정은 DNA의 전사 및 생성된 mRNA 산물의 가공을 포함한다.
증가된
발현/과발현
본 발명에 사용된 용어 "증가된 발현" 또는 "과발현"은 원래의 야생형 발현 수준에 부가적인 임의의 형태의 발현을 의미한다. 본 발명의 목적을 위해, 원래의 야생형 발현 수준은 또한 없는 상태 (zero; 발현의 부재 또는 측정 불가능한 발현)일 수 있다.
유전자 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어 있으며, 예를 들면, 적절한 프로모터에 의한 과발현, 전사 인핸서 또는 해독 인핸서의 사용을 포함한다. 프로모터 또는 인핸서 인자로 작용하는 분리된 핵산 서열은 비이질성 형태의 폴리뉴클레오티드의 적절한 위치 (전형적으로 업스트림)에 도입되어 해당 폴리펩티드를 코딩하는 핵산 서열의 발현을 상향 조절한다. 예를 들면, 내재적 프로모터는 돌연변이, 결실, 및/또는 치환에 의해 생체 내에서 변할 수 있거나 (Kmiec, US 5,565,350; Zarling 등, WO9322443), 또는 분리된 프로모터는 본 발명의 유전자로부터 적절한 거리와 방향으로 식물 세포 내에 도입될 수 있어 해당 유전자의 발현을 조절한다.
폴리펩티드 발현을 원한다면, 일반적으로 폴리뉴클레오티드 코딩 영역의 3'-말단에 폴리아데닐화 영역을 포함하는 것이 바람직하다. 폴리아데닐화 영역은 자연 유전자, 다양한 다른 식물 유전자, 또는 T-DNA로부터 유래할 수 있다. 부가된 3' 말단 서열은 예를 들면, 노팔린 신타아제 또는 옥토파인 신타아제 유전자, 또는 또 다른 식물 유전자, 또는 덜 바람직하게는 임의의 다른 진핵세포 유전자로부터 유래된다.
세포질 내에 축적되는 성숙된 메세지 양의 증가를 위하여 인트론 서열이 또한 부분적인 코딩 서열의 5' 비해독 영역 (UTR) 또는 코딩 서열에 첨가될 수 있다. 식물 및 동물 발현 구축물에 있어 전사 단위 내에 스플라이스 가능한 인트론이 포함되면 mRNA 및 단백질 수준에서 유전자 발현이 1000 배까지 증가함이 보였다 (Buchman and Berg (1988) Mol. Cell biol. 8: 4395-4405; Callis 등 (1987) Genes Dev 1:1183-1200). 인트론에 의한 유전자 발현의 상승효과는 전형적으로 전사 단위의 5' 말단 가까이에 위치하였을 때 가장 컸다. 옥수수 인트론 Adh1-S 인트론 1, 2, 및 6, Bronze-1 인트론의 사용은 당업계에 주지되어 있다. 전반적인 정보는 하기를 참고한다: Maize Handbook, Chapter 116, Freeling and Walbot, Eds., Springer, N.Y. (1994).
감소된
발현
본 발명에서 "감소된 발현" 또는 발현의 "감소 또는 실질적인 제거"는 대조구에 비하여 내재적 유전자 발현 및/또는 폴리펩티드 수준 및/또는 폴리펩티드 활성의 감소를 의미한다. 감소 또는 실질적인 제거는 대조구 식물에 비하여 증가하는 순으로 선호되는 적어도 10%, 20%, 30%, 40% 또는 50%, 60%, 70%, 80%, 85%, 90%, 또는 95%, 96%, 97%, 98%, 99% 이상 감소된 것이다.
식물체에 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해서는 충분한 길이의 핵산 서열의 상당히 연속적인 뉴클레오티드가 필요하다. 유전자 침묵을 수행하기 위한 뉴클레오티드는 20, 19, 18, 17, 16, 15, 14, 13, 12, 11, 10 개 또는 더 소수의 뉴클레오티드만큼 적을 수도 있고, 전체 유전자 (5' 및/또는 3' UTR을 포함하여, 일부분 또는 전체)만큼 많을 수도 있다. 상당한 길이의 연속적인 뉴클레오티드는 관심있는 단백질을 코딩하는 핵산 서열 (표적 유전자)로부터, 또는 관심있는 단백질의 오쏘로그(orthologue), 패럴로그(paralogue) 또는 상동체(homologue)를 코딩하는 것이 가능한 임의의 핵산 서열로부터 유래할 수 있다. 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)와 수소결합을 형성할 수 있으며, 더욱 바람직하게는, 상당한 길이의 연속적인 뉴클레오티드는 표적 유전자 (센스 또는 안티센스 가닥)에 증가하는 순으로 선호되는, 50%, 60%, 70%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, 100% 동일한 서열을 갖는다. (기능성) 폴리펩티드를 코딩하는 핵산 서열은 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위해 본 발명에서 논의된 다양한 방법에 대한 필요조건은 아니다.
상기 발현의 감소 또는 실질적인 제거는 통상적인 수단 및 기술을 사용하여 이룰 수 있다. 내재적 유전자의 발현의 감소 또는 실질적인 제거를 위한 바람직한 방법은 핵산 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)이 스페이서 (spacer: non-coding DNA)로 분리되어 역반복 (inverted repeat: 부분적으로 또는 완전히)으로 클로닝된 유전자 구축물의 식물체로의 도입 및 발현이다.
상기 바람직한 방법에 있어, 내재적 유전자의 발현은 핵산 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)의, 바람직하게는 헤어핀(hairpin) 구조를 형성하는 것이 가능한 역반복을 사용한 RNA 매개된 침묵에 의해 감소되거나 또는 실질적으로 제거된다. 상기 역반복(inverted repeat)은 조절서열을 포함하는 발현벡터로 클로닝된다. 비코딩 DNA 핵산 서열 (스페이서, 예를 들면 matrix attachment region fragment (MAR), 인트론, 폴리링커 등)은 두 역위 핵산 사이에 위치하여 역반복을 형성한다. 역반복의 전사 후, 자체 상보적인(self-complementary) 구조를 가진 키메릭(chimeric) RNA가 형성된다 (부분적인 또는 완전한). 상기 이중가닥 RNA 구조를 hpRNA (hairpin RNA)라고 한다. 상기 hpRNA는 식물에 의해 RISC (RNA-induced silencing complex)로 통합되는 siRNA로 가공된다. 상기 RISC는 mRNA 전사물로 쪼개어져, 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 감소시킨다. 더욱 상세한 내용은 예를 들면, Grierson 등 (1998) WO 98/53083; Waterhouse 등 (1999) WO 99/53050를 참고하면 된다.
본 발명의 방법의 수행은 핵산이 역반복으로 클로닝된 유전자 구축물의 식물로의 도입 및 발현에 의존하지 않으나, 임의의 하나 이상의 몇 가지 공지된 "유전자 침묵 (gene silencing)" 방법이 동일한 효과를 얻기 위해 사용될 수 있다.
내재적 유전자 발현의 감소를 위한 상기 방법 중 하나는 유전자 발현의 RNA-매개된 침묵 (하향조절 (downregulation))이다. 상기의 경우 침묵 (Silencing)은 목적 내재적 유전자에 실질적으로 유사한 이중가닥 RNA 서열 (dsRNA)에 의해 식물체에서 유발된다. 상기 dsRNA는 식물에 의해 siRNAs (short interfering RNAs)라는 약 20 내지 약 26 개의 뉴클레오티드로 더 가공된다. 상기 siRNAs는 내재적 표적 유전자의 mRNA 전사물을 쪼개는 RISC (RNA-induced silencing complex)로 통합되며, 그로 인하여 실질적으로 폴리펩티드로 해독될 mRNA 전사물의 수를 감소시킨다. 바람직하게는, 이중가닥 RNA 서열이 표적 유전자에 해당한다.
RNA 침묵 방법의 또 다른 예는 핵산 서열 또는 그 일부 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)를 센스 방향으로 식물체로의 도입을 포함한다. "센스 방향"은 해당 mRNA 전사물에 상동인 DNA 서열을 말한다. 식물로 도입되면 따라서 적어도 한 카피의 핵산 서열이다. 부가적인 핵산 서열은 내재적 유전자의 발현을 감소시켜, 공억제 (co-suppression)라 알려진 현상이 생긴다. 높은 전사물 수준 및 공억제 (co-suppression)의 유발 간에는 양의 상관관계가 있으므로 유전자 발현의 감소는 몇 부가적인 카피의 핵산 서열이 식물체 내로 도입되면 더욱 현저해질 것이다.
RNA 침묵 방법의 또 다른 예는 안티센스 (antisense) 핵산 서열의 사용을 포함한다. "안티센스" 핵산 서열은 단백질을 코딩하는 "센스 (sense)" 핵산 서열에 상보적인, 즉 이중가닥 cDNA 분자의 코딩 가닥에 상보적인 또는 mRNA 전사물 서열에 상보적인 뉴클레오티드 서열을 포함한다. 안티센스 핵산 서열은 바람직하게는 침묵 (silencing)하게 될 내재적 유전자에 상보적이다. 상기 상보성은 유전자의 "코딩 영역" 및/또는 "비코딩 영역 (non-coding region)"에 위치할 수 있다. 용어 "코딩 영역"은 아미노산 잔기로 해독되는 코돈 (codon)을 포함하는 뉴클레오티드 서열의 영역을 말한다. "비코딩 영역 (non-coding region)"은 전사는 되나 아미노산으로 해독되지 않는, 코딩 영역을 플랭킹하는 5' 및 3' 서열을 말한다 (또한 5' 및 3' 비해독 영역이라 한다).
안티센스 핵산 서열은 Watson 및 Crick 염기 페어링 (base pairing)의 방식에 따라 디자인될 수 있다. 안티센스 핵산 서열은 전체 핵산 서열 (이 경우, 관심있는 유전자 유래의, 또는 관심있는 단백질의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 것이 가능한 임의의 핵산 유래의 상당한 길이의 연속적인 뉴클레오티드)에 상보적일 수 있으나, 또한 핵산 서열의 일부 (mRNA 5' 및 3' UTR 포함)에 대해서만 안티센스인 올리고뉴클레오티드일 수 있다. 예를 들면, 안티센스 올리고뉴클레오티드 서열은 폴리펩티드를 코딩하는 mRNA 전사물의 해독 개시부위 주변의 영역에 상보적일 수 있다. 적절한 안티센스 올리고뉴클레오티드 서열의 길이는 당업계에 공지되어 있으며 약 50, 45, 40, 35, 30, 25, 20, 15 또는 10 개의 뉴클레오티드 길이 또는 그 이하일 수 있다. 본 발명에 따른 안티센스 핵산 서열은 당업계에 공지된 방법을 사용하여 화학적 합성 및 효소적 라이게이션 반응으로 구축될 수 있다. 예를 들면, 안티센스 핵산 서열 (예를 들면, 안티센스 올리고뉴클레오티드 서열)은 자연적으로 발생하는 뉴클레오티드 또는 분자의 생물학적 안정성을 증가시키기 위해 또는 안티센스 및 센스 핵산 서열 간에 형성된 이중선 (duplex)의 물리적 안정성을 증가시키기 위해 디자인된 다양하게 변형된 뉴클레오티드를 사용하여 화학적으로 합성될 수 있으며, 예를 들면, 포스포로티오에이트 (phosphorothioate) 유도체 및 아크리딘 (acridine) 치환된 뉴클레오티드가 사용될 수 있다. 안티센스 핵산 서열의 생성에 사용될 수 있는 변형된 뉴클레오티드의 예는 당업계에 주지되어 있다. 알려진 뉴클레오티드 변형은 메틸화 (methylation), 고리화 (cyclization) 및 '캡 (caps)' 및 하나 이상의 자연적으로 발생하는 뉴클레오티드의 이노신 (inosine)과 같은 유사체 (analogue)로의 치환을 포함한다. 뉴클레오티드 변형의 다른 경우는 당업계에 주지되어 있다.
안티센스 핵산 서열은 핵산 서열이 안티센스 방향으로 서브클로닝된 (즉, 삽입된 핵산으로부터 전사된 RNA는 관심있는 목적 핵산에 대해 안티센스 방향일 수 있다) 발현 벡터를 사용하여 생물학적으로 생산될 수 있다. 바람직하게는, 식물에서 안티센스 핵산 서열은 프로모터, 작동가능하게 연결된 안티센스 올리고뉴클레오티드, 및 종결신호 (terminator)를 포함하여 안정적으로 통합된 핵산 구축물을 통해 생산된다.
본 발명의 방법에서 침묵에 사용된 핵산 분자 (식물로 도입되거나 또는 인 시튜로 생성되거나)는 mRNA 전사물 및/또는 폴리펩티드를 코딩하는 게놈 DNA와 혼성화하거나 또는 이들에 결합하여, 그로 인하여 예를 들면, 전사 및/또는 해독을 저해함으로서 단백질의 발현을 저해한다. 상기 혼성화는 안정적인 이중선 (duplex)를 형성하기 위해 전형적인 뉴클레오티드 상보성에 의해 이루어질 수 있거나, 또는, 예를 들면, DNA 이중선 (duplexes)에 결합하는 안티센스 핵산 서열의 경우에, 이중 나선 (double helix)의 깊은 홈 (major groove)에서의 특정 상호작용을 통해 이루어질 수 있다. 안티센스 핵산 서열은 형질전환에 의해 또는 특정 조직 부위에서 직접적인 주입에 의해 식물체로 도입될 수 있다. 대안으로는, 안티센스 핵산 서열은 선발된 세포를 표적화하기 위해 변형되어, 체계적으로 도입될 있다. 예를 들면, 체계적인 도입을 위해, 안티센스 핵산 서열은 변형될 수 있어, 상기 서열은 예를 들면, 안티센스 핵산 서열을 세포 표면 수용체 또는 항원에 결합하는 펩티드 또는 항원에 연결함으로써 선발된 세포 표면상에 발현된 수용체 또는 항원에 특이적으로 결합한다. 상기 안티센스 핵산 서열은 또한 본 발명에서 기재된 벡터를 사용하여 세포로 전달될 수 있다.
추가적인 양상에 따라, 상기 안티센스 핵산 서열은 a-아노머 핵산 서열이다. a-아노머 핵산 서열은 상보적인 RNA와 특정 이중가닥 혼성체 (hybrid)를 형성하며, 상기에서 보통의 b-units와 달리 상기 이중가닥은 서로 평행이다 (Gaultier 등 (1987) Nucl Ac Res 15: 6625-6641). 상기 안티센스 핵산 서열은 또한 2'-o-메틸리보뉴클레오티드 (Inoue 등 (1987) Nucl Ac Res 15, 6131-6148) 또는 키메릭 (chimeric) RNA-DNA 유사체 (analogue) (Inoue 등 (1987) FEBS Lett. 215, 327-330)를 포함할 수 있다.
내재적 유전자 발현의 감소 또는 사실상의 제거는 또한 리보자임 (ribozyme)을 사용하여 수행될 수 있다. 리보자임 (ribozyme)은 상보적인 영역을 갖는 부위에서 mRNA와 같은 단일가닥인 핵산 서열을 절단할 수 있는 리보핵산가수분해효소 (ribonuclease) 활성을 가진 촉매성 RNA 분자이다. 따라서, 리보자임 (예를 들면, 햄머헤드 (hammerhead) 리보자임 (Haselhoff 및 Gerlach (1988) Nature 334, 585-591 참조)은 폴리펩티드를 코딩하는 mRNA 전사물의 촉매적 절단에 사용될 수 있어, 그로 인하여 폴리펩티드로 해독될 mRNA 전사물의 수를 실질적으로 줄인다. 핵산 서열에 대해 특이성을 가진 리보자임이 디자인될 수 있다 (예를 들면: Cech 등 U.S. Patent No. 4,987,071; 및 Cech 등 U.S. Patent No. 5,116,742 참고). 대안으로는, 핵산 서열에 해당하는 mRNA 전사물이 RNA 분자의 풀 (pool)로부터 특정 리보핵산가수분해효소 (ribonuclease) 활성을 가진 촉매성 RNA의 선발에 사용될 수 있다 (Bartel 및 Szostak (1993) Science 261, 1411 -1418). 식물에서 유전자 침묵 (gene silencing)을 위한 리보자임의 사용은 당업계에 공지되어 있다 (예를 들면, Atkins 등 (1994) WO 94/00012; Lenne 등 (1995) WO 95/03404; Lutziger 등 (2000) WO 00/00619; Prinsen 등 (1997) WO 97/13865 및 Scott 등 (1997) WO 97/38116).
유전자 침묵 (gene silencing)은 또한 삽입 돌연변이 유발 (예를 들면, T-DNA 삽입 또는 트렌스포존 삽입)에 의해 또는 Angell 및 Baulcombe ((1999) Plant J 20(3): 357-62), (Amplicon VIGS WO 98/36083), 또는 Baulcombe (WO 99/15682)에 기재된 전략에 의해서도 수행될 수 있다.
유전자 침묵은 또한 내재적 유전자상에 돌연변이 및/또는 실질적으로 식물체로 도입될 분리된 유전자/핵산에 돌연변이의 존재 시 발생할 수 있다. 상기 감소 또는 사실상의 제거는 기능이 없는 폴리펩티드에 의해서도 야기될 수 있다. 예를 들면, 폴리펩티드가 다양한 상호작용하는 단백질에 결합할 수 있다; 하나 이상의 돌연변이(들) 및/또는 절단(들)은 따라서, 상호작용하는 단백질 (수용체 단백질과 같은)에 결합할 수는 있으나 정상적인 기능을 나타낼 수 없는 (신호전달 리간드와 같은) 폴리펩티드를 제공할 수 있다.
유전자 침묵의 또 다른 방법은 표적 세포 내 유전자의 전사를 막는 3중나선 (triple helical) 구조를 형성하기 위해 유전자의 조절 영역 (예를 들면, 프로모터 및/또는 인핸서)에 상보적인 핵산 서열을 표적화하는 것이다. [Helene, C, Anticancer Drug Res. 6, 569-84, 1991; Helene 등 Ann. N.Y. Acad. Sci. 660, 27-36 1992; 및 Maher, LJ. Bioassays 14, 807-15, 1992]을 참조하면 된다.
식물체 내에서의 기능 저해를 위해 내재적 폴리펩티드에 대한 항체의 사용, 또는 폴리펩티드가 관여되는 신호전달 경로 (signalling pathway)의 방해와 같은 다른 방법들이 당업자에게 주지되어 있다. 특히, 인공합성 분자가 표적 폴리펩티드의 생물학적 기능을 저해하거나 또는 표적 폴리펩티드가 관여되는 신호전달 경로의 방해에 유용할 수 있다는 것을 고려할 수 있다.
대안으로는, 유전자의 식물 개체군 자연 변이체를 동정하기 위해 스크리닝 프로그램이 셋업될 수도 있으며, 상기 변이체는 활성이 감소된 폴리펩티드를 코딩한다. 상기 자연 변이체는 또한 예를 들면, 상동 재조합의 수행에 사용될 수 있다.
인공적인 및/또는 자연적인 miRNAs (microRNAs)가 유전자 발현 및/또는 mRNA 해독을 넉아웃 (knock out)하는 데 사용될 수 있다. 내재적 miRNAs는 전형적으로 19-24 뉴클레오티드 길이의 단일가닥의 작은 RNAs이며, 주로 유전자 발현 및/또는 mRNA 해독을 조절하는 작용을 한다. 대부분의 식물 miRNAs (microRNAs)는 표적 서열에 완전한 또는 완전에 가까운 상보성을 가진다. 그러나, 5 개까지의 미스매치 (mismatches)를 가진 자연적인 표적이 있으며, 다이서 (Dicer) 패밀리의 이중가닥 특정 RNases에 의해 특징적인 폴더백 (fold-back) 구조를 가진 더욱 긴 넌코딩 (non-coding) RNAs로부터 가공될 수 있다. 가공 (processing)으로, 주성분인 Argonaute 단백질에 결합함으로써 RISC (RNA-induced silencing complex)로 통합된다. MiRNAs는 세포질 내에서 표적 핵산, 대개 mRNAs와 염기쌍을 이루므로 RISC의 특이성 요소로서 작용한다. 연이은 조절은 표적 mRNA 절단 및 붕괴 및/또는 해독 저해를 포함한다. miRNA 과발현의 효과는 따라서 표적 유전자의 mRNA 수준의 감소로 흔히 반영된다.
전형적으로 21 뉴클레오티드 길이인 인공적인 microRNAs (amiRNAs)가 하나 또는 다수의 관심 유전자의 유전자 발현을 특이적으로 음성적으로 조절하도록 유전공학적으로 조작될 수 있다. 식물 microRNA 표적 선발의 결정인자는 당업계에 주지되어 있다. 표적 인지에 대한 경험적 매개변수는 정해져 있으며, 특정 amiRNAs의 디자인에 도움이 되게 사용될 수 있다 (Schwab 등 Dev. Cell 8, 517-527, 2005). amiRNAs의 디자인 및 생성을 위한 편리한 수단 및 이의 전구체는 또한 공개되어 있다 (Schwab 등 Plant Cell 18, 1 121-1 133, 2006).
최적의 수행을 위해, 내재적 유전자의 식물에서의 발현을 감소시키는 유전자 침묵 기술에서 단자엽 식물의 형질전환을 위해서는 단자엽 식물 유래의 핵산 서열을, 쌍자엽 식물의 형질전환을 위해서는 쌍자엽 식물 유래의 핵산 서열을 사용할 것이 요구된다. 바람직하게는, 임의의 해당 식물 종의 핵산 서열이 동일 생물종에 도입된다. 예를 들면, 벼 유래의 핵산 서열은 벼 식물로 형질전환된다. 그러나, 도입될 핵산 서열이 도입될 식물과 동일 식물 종으로부터 유래해야 한다는 것은 절대적인 필요조건은 아니다. 내재적 표적 유전자 및 도입될 핵산 간에 실질적인 상동성이 있으면 충분하다.
상기 기재된 것은 내재적 유전자의 식물에서의 발현의 감소 또는 실질적인 제거를 위한 다양한 방법의 예이다. 당업자는 전체 식물 또는 그 일부에서 내재적 유전자의 발현을 감소시키기 위한 침묵을 위해, 예를 들면, 적절한 프로모터를 사용하여 상기 언급된 방법을 용이하게 변형할 수 있다.
형질전환
본 발명에 언급된 용어 "도입" 또는 "형질전환"은 전달에 사용된 방법에 관계없이 외래 폴리뉴클레오티드의 숙주 세포로의 전달을 포함한다. 기관 발생이나 배발생에 의하여 연이은 클론 번식이 가능한 식물 조직은 본 발명의 유전자 구축물로 형질전환될 수 있으며, 전체 식물체가 이로부터 재생된다. 선택된 특정 조직은 형질전환될 특정 종에 이용 가능하며 가장 잘 맞는 클론 번식 시스템에 따라 다양할 것이다. 전형적인 조직 표적은 잎 디스크, 화분, 배, 자엽, 하배축, 대배우체, 캘러스 조직, 분열조직 (예를 들면, 정단 분열조직, 액아, 및 뿌리 분열조직), 및 유도된 분열조직 (예를 들면, 자엽 분열조직 및 하배축 분열조직)을 포함한다. 폴리뉴클레오티드는 일시적으로 또는 안정적으로 숙주 세포에 도입되며 예를 들면, 플라스미드처럼 비통합적으로 유지된다. 다르게는, 숙주 게놈으로 통합된다. 결과적인 형질전환 식물 세포는 당업자에게 주지된 방식으로 형질전환 식물을 재생하는데 사용된다.
외래 유전자의 식물 게놈으로 전달을 형질전환이라 부른다. 식물 종의 형질전환은 일상적인 기술이다. 유리하게도, 임의의 몇 가지 형질전환 방법이 목적 유전자를 적절한 조상 세포로의 도입에 사용될 수 있다. 식물 조직 또는 식물 세포로부터 식물의 형질전환 및 재생에 관하여 기재된 방법은 일시적인 또는 안정한 형질전환에 이용될 수 있다. 형질전환 방법은 리포좀, 전기천공법, 유리 DNA 흡수를 증가시키는 화학물질, 식물체 내로 DNA의 직접적인 주입, 입자총 충격법, 바이러스 또는 화분을 이용한 형질전환 및 미세주입 (microprojection)을 포함한다. 방법은 원형질에 대한 칼슘/폴리에틸렌 글리콜법 (Krens, F.A. et al., (1982) Nature 296, 72-74; Negrutiu I et al. (1987) Plant Mol Biol 8: 363-373); 원형질의 전기천공법 (Shillito R.D. et al. (1985) Bio/Technol 3, 1099-1102); 식물로 미세주사 (microinjection) (Crossway et al., (1986) Mol. Gen Genet 202: 179-185); DNA 또는 RNA 코팅된 입자 충격법 (Klein TM et al., (1987) Nature 327: 70) (비통합적) 바이러스로 감염 등으로부터 선택할 수도 있다. 형질전환 작물을 포함한 형질전환 식물은 바람직하게는 아그로박테리움-매개 형질전환을 통해 제조된다. 편리한 형질전환방법은 식물체에서의 형질전환이다. 이를 위해, 예를 들면, 아그로박테리아를 식물 종자 상에 작용하게 하거나 식물 분열조직을 아그로박테리아로 접종하는 것이 가능하다. 형질전환된 아그로박테리아의 현탁액을 손상되지 않은 식물이나 적어도 꽃 원기에 작용하게 하는 것이 본 발명에 따라 특히 편리하다는 것이 입증되었다. 처리된 식물의 종자를 얻을 때까지 식물체를 키운다 (Clough and Bent, Plant J. (1998) 16, 735-743). 벼의 아그로박테리움 매개된 형질전환 방법은 하기 임의의 것에 기재된 것처럼 벼 형질전환에 관한 잘 알려진 방법들을 포함한다: 유럽특허출원 EP 1198985 A1, Aldemita and Hodges (Planta 199: 612-617, 1996); Chan 등 (Plant Mol Biol 22 (3): 491-506, 1993), Hiei 등 (Plant J 6 (2): 271-282, 1994), 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 옥수수 형질전환의 경우에, 바람직한 방법은 Ishida 등 (Nat. Biotechnol 14(6): 745-50, 1996) 또는 Frame 등 (Plant Physiol 129(1): 13-22, 2002)에 기재된 것이며, 상기 명세서는 충분히 설명한 것처럼 본 발명에 참조문헌으로 통합된다. 상기 방법들은 [B. Jenes 등, Techniques for Gene Transfer, in: Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press (1993) 128-143] 및 [Potrykus Annu. Rev. Plant Physiol. Plant Molec. Biol. 42 (1991) 205-225]에 예로서 기재되어 있다. 핵산 또는 발현될 구축물은 바람직하게는 아그로박테리움 투머파시엔스 형질전환에 적절한 벡터, 예를 들면 pBin19 내로 클론된다 (Bevan 등, Nucl. Acids Res. 12 (1984) 8711). 상기 벡터로 형질전환된 아그로박테리아가 애기장대처럼 모델로 사용된 식물 (본 발명의 범위 내의 애기장대 (아라비돕시스 탈리아나)는 작물로 고려되지 않는다)이나 예로서 담배 같은 작물의 예를 들면, 상처 내거나 잘게 썬 잎을 아그로박테리아 용액에 적신 후 적절한 배지에 배양하는 것과 같은 식물 형질전환을 위해 알려진 방식으로 사용될 수 있다. 아그로박테리움 투머파시엔스에 의한 식물의 형질전환은 예를 들면, [Hofgen and Willmitzer in Nucl. Acid Res. (1988) 16, 9877]에 의하여 기재되었거나, 특히 [F.F. White, Vectors for Gene Transfer in Higher Plants; in Transgenic Plants, Vol. 1, Engineering and Utilization, eds. S.D. Kung and R. Wu, Academic Press, 1993, pp. 15-38]에 알려져 있다.
온전한 식물로 재생되는 체세포의 형질전환 외에, 식물의 분열조직 특히 배우자로 발달하는 세포의 형질전환이 가능하다. 이 경우에, 형질전환된 배우자는 자연적인 식물 발달 과정을 거쳐 형질전환 식물이 된다. 따라서 예를 들면, 애기장대의 종자가 아그로박테리아로 처리되고, 발달하는 식물체로부터 취한 종자 중의 일부분이 형질전환되어 형질전환 식물체로 된다 [Feldman, KA and Marks MD (1987). Mol Gen Genet 208:1-9; Feldmann K (1992). In: C Koncz, N-H Chua and J Shell, eds, Methods in Arabidopsis Research. Word Scientific, Singapore, pp. 274-289]. 또 다른 방법은 화서의 반복적인 제거에 근거하며 근생엽 중앙의 절단 부위를 형질전환된 아그로박테리아와 함께 배양하면 형질전환된 종자를 이후에 얻을 수 있다 (Chang (1994). Plant J. 5: 551-558; Katavic (1994). Mol Gen Genet, 245: 363-370). 그러나, 특히 효과적인 방법은 화서 담그기 ("floral dip") 방법의 변형인 진공 침윤 (vacuum infiltration)이다. 애기장대의 진공 침윤의 경우, 감압 하에 온전한 식물체를 아그로박테리아 현탁액으로 처리하는 것이고 [Bechthold, N (1993). C R Acad Sci Paris Life Sci, 316: 1194-1199], "화서 담그기법"에서는 발달 중인 화서 조직을 계면활성제가 처리된 아그로박테리아 현탁액과 잠깐 배양하는 것이다 [Clough, SJ and Bent AF (1998) Plant J. 16, 735-743]. 양 경우에 특정 비율의 형질전환 종자가 수확되며, 이들 종자는 상기 기재된 선발 조건 하에서 재배함으로써 형질전환되지 않은 종자와 구분된다. 색소체는 모계로 유전되기 때문에 색소체의 안정적인 형질전환의 잇점은 대부분의 작물에서 화분을 통한 외래유전자의 유전이 감소되거나 제거된다는 점이다. 엽록체 게놈의 형질전환은 일반적으로 Klaus 등, 2004 [Nature Biotechnology 22 (2), 225-229]에 체계적으로 표시된 과정에 의하여 수행된다. 간단히, 형질전환될 서열을 선발 마커 유전자와 함께 엽록체 게놈에 상동인 플랭킹 서열 사이에 클로닝한다. 이들 상동 플랭킹 서열이 플라스톰(plastome) 내로 특이적으로 통합된다. 색소체 형질전환은 많은 다른 식물 종에 대해 기술되어 왔으며, 개관은 [Bock (2001) Transgenic plastids in basic research and plant biotechnology. J Mol Biol. 2001 Sep 21; 312 (3):425-38 or Maliga, P (2003) Progress towards commercialization of plastid transformation technology. Trends Biotechnol. 21, 20-28]에 있다. 추가의 생물공학적 진보는 마커 없는 색소체 형질전환체의 형태로 최근 보고되었으며, 이는 일시적인 동시통합된(co-integrated) 마커 유전자에 의해 생성될 수 있다 (Klaus et al., 2004, Nature Biotechnology 22(2), 225-229).
유전적으로 변형된 식물 세포는 당업자에게 친숙한 모든 방법을 통해서 재분화될 수 있다. 적절한 방법은 상기 언급된 S.D. Kung 및 R. Wu, Potrykus 또는 Hofgen 및 Willmitzer의 문헌에 있다.
일반적으로 형질전환 후, 식물 세포 또는 세포 집단은 목적 유전자와 함께 전달된 식물에서 발현 가능한 유전자에 의해 코딩되는 하나 이상의 마커의 존재에 대하여 선발되어, 형질전환된 물질은 온전한 식물로 재분화된다. 형질전환 식물을 선발하기 위하여, 형질전환에서 얻은 식물 재료는 대체로 선택적 조건 하에 두어, 형질전환 식물이 형질전환되지 않은 식물과 구분될 수 있게 한다. 예를 들면, 상기 기재된 방식으로 얻은 종자를 심고, 초기 생장기간 후, 분무에 의해 적절한 선발을 하게 된다. 추가의 가능한 방법으로는, 종자를 멸균하여 적절한 선발물질을 사용하여 한천 판에 키우면, 형질전환된 종자만 식물체로 자랄 수 있다. 다르게는, 형질전환 식물은 상기 기재된 것과 같은 선발 마커의 존재에 대하여 가려진다.
DNA 전달 및 재분화에 이어, 형질전환된 것으로 추정되는 식물은 또한 예를 들면, 목적 유전자의 존재, 카피 수 및/또는 게놈 조직에 대하여 서던 분석을 사용하여 평가될 수 있다. 다르게는 또는 부가적으로, 새로이 도입된 DNA의 발현수준을 노던 및/또는 웨스턴 분석으로 측정할 수 있으며, 두 기술은 당업자에게 주지되어 있다.
생성된 형질전환된 식물은 클론 번식 또는 전통적인 육종 기술 같은 다양한 수단으로 증식될 수 있다. 예를 들면, 제1세대 (또는 T1) 형질전환 식물은 자가교배되고, 동형접합 제2세대 (또는 T2) 형질전환체가 선발되어, T2 식물은 전통적인 육종 기술로 더 증식된다. 생성된 형질전환된 생물체는 다양한 형태를 취할 수 있다. 예를 들면, 형질전환된 세포 및 형질전환되지 않은 세포의 키메라; 클론 형질전환체 (예를 들면, 발현카세트를 함유하도록 형질전환된 모든 세포); 형질전환된 및 형질전환되지 않은 조직의 그라프트(graft) (예를 들면, 식물에 있어 형질전환되지 않은 접순에 접목된 형질전환된 대목)일 수 있다.
T-
DNA
활성화 태깅
T-DNA 활성화 태깅 (Hayashi et al. Science (1992) 1350-1353)은 보통 프로모터 (또한 해독 인핸서 또는 인트론)를 함유하는 T-DNA를 프로모터가 표적 유전자의 발현을 지시하게 배치되어 관심 유전자의 게놈 영역 내로 또는 유전자 코딩 영역의 10 kb 업스트림 또는 다운스트림으로 삽입하는 것을 포함한다. 전형적으로, 자체의 자연 프로모터에 의한 표적 유전자 발현의 조절은 붕괴되고 유전자는 새로 도입된 프로모터의 조절하에 있게 된다. 프로모터는 전형적으로 T-DNA 내에 끼워져 있다. 이 T-DNA는 식물 게놈 내에 예를 들면, 아그로박테리움 감염을 통하여 무작위로 삽입되며 삽입된 T-DNA 인근의 유전자의 발현이 변형되게 된다. 결과적인 형질전환 식물은 도입된 프로모터에 가까운 유전자의 변형된 발현으로 인하여 우성 표현형을 보인다.
틸링
(
TILLING
)
용어 "틸링 (TILLING)"은 "Targeted Induced Local Lesions In Genomes"의 약어이며 변형된 발현 및/또는 활성을 갖는 단백질을 코딩하는 핵산을 생성 및/또는 동정하는데 유용한 돌연변이 기술을 말한다. 틸링은 또한 상기 돌연변이체를 갖는 식물의 선발을 가능하게 한다. 이들 돌연변이체는 강도나 위치 또는 시기상의 변형된 발현을 보인다 (만일 돌연변이가 프로모터에 영향을 준다면). 이들 돌연변이체는 자체의 자연적 형태의 유전자에 비하여 훨씬 높은 활성을 나타낸다. 틸링은 고밀도 돌연변이 유발과 고속처리 탐색 방법을 조합한 것이다. 틸링의 전형적인 단계는 하기와 같다: (a) EMS 돌연변이유발 (Redei GP 및 Koncz C (1992) In Methods in Arabidopsis Research, Koncz C, Chu NH, Schell J, eds. Singapore, World Scientific Publishing Co, pp. 1682; Feldmann et al., (1994) In Meyerowitz EM, Somerville CR, eds, Arabidopsis. Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, pp 137-172; Lightner J and Caspar T (1998) In J Martinez-Zapater, J Salinas, eds, Methods on Molecular Biology, Vol. 82. Humana Press, Totowa, NJ, pp 91-104); (b) DNA 준비 및 개체의 풀링(pooling); (c) 관심 영역의 PCR 증폭; (d) 이형 이중가닥 (heteroduplexes)이 되게 변성 및 어닐링; (e) DHPLC로 이형 이중가닥이 있는지를 크로마토그램 상의 여분의 정점으로 검출; (f) 돌연변이체 개체의 동정; (g) 돌연변이 PCR 산물의 염기서열결정. 틸링의 방법은 당업계에 주지되어 있다 (McCallum et al., (2000) Nat Biotechnol 18: 455-457; Stemple (2004) Nat Rev Genet 5(2): 145-50).
상동 재조합
상동 재조합은 정해진 위치에 선택된 핵산이 게놈 내로 도입되게 한다. 상동 재조합은 생물학에서 효모 또는 선류 (Physcomitrella) 같은 하등생물에 대해 일상적으로 사용되는 표준기술이다. 식물에서 상동 재조합을 수행하는 방법은 모델 식물 (Offring et al. (1990) EMBO J 9(10): 3077-84)에 대해서 뿐 아니라 작물 예를 들면, 벼 (Terad et al. (2002) Nat Biotech 20(10): 1030-4; Iid and Terad (2004) Curr Opin Biotech 15(2): 132-8)에 대해서도 기재된 바 있고, 일반적으로 목적 생물체에 구애받지 않고 적용 가능한 접근법이 존재한다 (Miller et al, Nature Biotechnol. 25, 778-785, 2007).
수확량 관련 형질
수확량 관련 형질은 식물 수확량에 관련된 형질 또는 특징이다. 수확량 관련 형질은 빠른 개화 시기, 수확량, 생물량 (biomass), 종자 수확량, 초기 활력, 녹색지수, 증가된 성장률, 개선된 농업 형질 (예를 들면, 증가된 침수 내성 (벼에서 수확량 증가 유도), 개선된 물 이용 효율 (WUE), 질소 이용 효율 (NUE) 등과 같은)의 특징 중 제한되지 않는 목록의 하나 이상을 포함할 수 있다.
수확량
일반적인 의미에서의 용어 "수확량"은 경제적 가치 있는 측정 가능한 생산량을 말하며, 전형적으로 특정 작물, 면적, 및 기간에 관련이 있다. 개개 식물체 부분이 직접적으로 수, 크기 및/또는 중량에 근거한 수확량에 기여하거나, 또는 실제 수확량은 작물 및 년에 대해 평방 미터 당 수확량이고, 이는 총생산량 (수확된 및 평가된 생산량을 포함)을 재배된 평방 미터로 나눔으로써 결정된다. 용어 식물의 "수확량" 및 "식물 수확량"은 본 발명에서 호환성 있게 사용되고, 뿌리 및/또는 줄기 생물량과 같은 식물의 생물량, 생식 기관, 및/또는 그 식물의 종자와 같은 번식체 (propagule)로 언급될 수 있다.
옥수수를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 평방 미터 당 식물체의 수 증가, 식물체 당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄 당 낱알의 수, 낱알 중량, 천립 중량, 열매 길이/직경의 증가, 종자 충전율 (충전된 종자의 수/전체 종자의 수 x100의 증가). 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상으로 표시된다: 평방 미터 당 식물체의 수, 식물체 당 원추화서의 수, 원추화서의 길이, 원추화서 당 작은 이삭 (spikelet)의 수, 원추화서 당 꽃 (소화)의 수, 종자 충전율 (충전된 종자의 수/전체 종자의 수 x100의 증가)의 증가, 천립 중량의 증가. 벼에서 침수 내성 또한 증가된 수확량을 나타낼 수 있다.
옥수수의 꽃은 단성 (unisexual)으로 수꽃차례 (male inflorescence, tassel)는 줄기 정단에서 발생하고, 암꽃차례 (ear)는 액아 정점 (axillary bud apex)에서 발생한다. 암꽃차례는 중앙 축 (cob)의 표면에 작은 이삭 쌍을 생성한다. 암꽃 이삭 각각은 2개의 수정가능한 소화 (floret)를 가지며, 그중 하나는 보통 수정되면 옥수수 낱알로 성숙하게 된다. 따라서 옥수수에서 수확량 증가는 다음 중의 하나 이상으로 표시된다: 평방 미터 당 식물체의 수 증가, 식물체 당 이삭 (열매) 수의 증가, 낱알 줄의 수, 줄 당 낱알의 수, 낱알 중량, 천립 중량, 열매 길이/직경의 증가, 충전된 소화의 수 (즉, 종자를 함유하는 소화)/전체 소화의 수 x100인 종자 충전율의 증가.
벼 식물에서 꽃차례는 원추화서라고 불린다. 상기 원추화서는 작은 이삭을 지니며, 상기 이삭은 원추화서의 기본 단위이고, 소수경 (pedicel) 및 소화로 구성된다. 소화는 소수경 위에 생긴고, 큰 영포 (gluume, 포엽, lemma) 및 짧은 영포 (내화영, palea)로 이루어지는 2개의 보호적인 포엽에 감싸진 꽃을 포함한다. 따라서, 벼를 예로 들면, 수확량 증가는 다음 중의 하나 이상의 증가로 표시된다: 평방 미터 당 식물체의 수, 식물체 당 원추화서의 수, 원추화서의 길이, 원추화서 당 작은 이삭의 수, 원추화서 당 꽃 (또는 소화)의 수; 충전된 소화 (즉, 종자를 함유하는 소화)의 수/전체 소화의 수 x100인 종자 충전율의 증가; 천립 중량의 증가.
빠른 개화 시기
본 발명에 사용된 "빠른 개화 시기"를 갖는 식물은 대조구 식물보다 빠르게 개화하기 시작하는 식물이다. 따라서, 상기 용어는 빠른 개화 시작을 나타내는 식물을 의미한다. 식물의 개화 시기는 파종과 첫 번째 꽃의 출현 사이의 일수 (개화하는 시간)를 계산하여 평가될 수 있다. 식물의 "개화 시기"는 예를 들면 WO 2007/093444에 기재된 방법을 사용하여 결정될 수 있다.
초기 활력
"초기 활력" 특히 식물 생장의 초기 단계 중에 활기차고 건강하게 잘 균형을 이룬 생장을 말하며, 예를 들면, 식물이 환경에 보다 잘 적응함으로 인한 (즉, 에너지 자원 사용이 최적화되고 어린 줄기와 뿌리 간에 분배됨) 식물체의 적응성 증가의 결과일 것이다. 초기 활력을 갖는 식물은 또한 증가된 실생 생존 및 보다 나은 작물 생성을 보여주며, 이는 흔히 고도로 균일한 밭 (균일한 양상으로 자라는 작물, 즉 대다수의 식물이 사실상 거의 동시에 다양한 발달단계에 이르는)과 흔히 보다 낫고 보다 높은 수확량이 된다. 따라서, 초기 활력은 천립 중량, 발아율, 출현율, 실생 생장, 실생 높이, 뿌리 길이, 뿌리 및 어린 줄기 생물량 등과 같은 다양한 요인들을 측정함으로써 결정될 수 있다.
증가된
생장 속도
증가된 생장 속도는 식물체의 하나 이상의 부분 (종자 포함)에 특이적이거나, 또는 실질적으로 전체 식물에 걸쳐서일 수도 있다. 증가된 생장 속도를 가진 식물은 보다 짧은 생활사를 가질 수 있다. 식물의 생활사는 성숙된 건종자로부터 식물체가 출발 물질과 유사한 성숙한 건종자를 생산하는 단계까지 자라는데 필요한 시간을 의미하는 것일 수 있다. 상기 생활사는 발아의 속도, 초기 활력, 생장 속도, 녹색 지수, 개화 시기 및 종자 성숙 속도와 같은 요인에 의해 영향을 받을 수 있다. 증가된 생장 속도는 식물의 생활사 중의 하나 이상의 단계에서 또는 실질적으로 전체 식물 생활사 중에 나타날 수 있다. 식물의 생활사 중의 초기 단계 중에 증가된 생장 속도는 향상된 활력을 반영한다. 생장 속도의 증가는 그렇지 않았으면 가능했을 시기보다 식물을 늦게 파종하고/하거나 이르게 수확하게 함으로써 식물의 수확 주기를 변경할 수도 있다 (비슷한 효과는 보다 이른 개화시기로 얻을 수 있다). 만일 생장 속도가 충분히 증가하면 동일 식물 종의 잇따른 파종이 가능하다 (예를 들면, 한 생장기간 내에 벼의 파종 및 수확 후에 잇따라 벼의 파종 및 수확). 유사하게 만일 생장 속도가 충분히 증가하면 다른 식물 종의 잇따른 파종이 가능하다 (예를 들면, 옥수수 식물의 파종 및 수확 후에 예를 들면, 대두, 감자 또는 임의의 다른 적절한 식물의 파종 및 선택적 수확). 일부 작물의 경우 동일한 근경으로부터 부가적인 횟수의 수확도 가능하다. 식물의 수확 주기 변경은 평방 미터 당 연간 생물량 생산의 증가로 이끈다 ((말하자면 일년 내) 임의의 식물을 재배하여 수확하는 횟수의 증가로 인하여). 작물 생육에 대한 영역 제한은 이식기에 (초기) 또는 수확기에 (후기) 흔히 불리한 환경 조건에 의해 결정되므로, 생장 속도 증가는 야생형에 비하여 보다 넓은 지리적 지역에 형질전환 식물이 재배되게 한다. 상기 불리한 조건은 수확 주기가 짧아지면 피할 수 있다. 생장 속도는 생장 곡선으로부터 다양한 매개변수를 유도함으로써 결정될 수 있으며, 상기 매개변수는 T-Mid (식물이 최대 크기의 50%에 이를 때까지 걸린 시간) 및 T-90 (식물이 최대 크기의 90%에 이를 때까지 걸린 시간)이다.
스트레스 저항성 (
Stress
resistance
)
식물이 스트레스가 없는 조건 하에 있든지 식물이 대조구 식물에 비하여 다양한 스트레스에 노출되든지 간에 수확량 및/또는 생장 속도의 증가는 있다. 식물은 전형적으로 보다 느리게 성장함으로써 스트레스에 대한 노출에 반응한다. 심각한 스트레스 하에서 식물의 생장이 중단되기도 한다. 다른 한편으로 본 발명에서 순한 스트레스는 식물이 노출됨으로써 생장을 재개하는 능력 없이 생장을 중단하게 하지 않는 임의의 스트레스로 정의된다. 본 발명이 의미하는 순한 스트레스는 스트레스 받은 식물의 생장 감소가 스트레스가 없는 조건 하의 대조구 식물에 비하여 40%, 35%, 30% 또는 25% 미만, 더욱 바람직하게는 20% 또는 15% 미만이다. 실제 농업상의 진전 (관개, 시비, 살충제 처리)으로 인하여 심각한 스트레스가 재배 작물에 가해지지는 않는다. 결과적으로 순한 스트레스에 의해 유도되는 손상된 생장은 흔히 농업에서는 바람직하지 않은 특징이다. 순한 스트레스는 식물이 노출되는 매일의 생물적 및/또는 비생물적 (환경) 스트레스이다. 비생물적 스트레스는 가뭄 또는 과도한 수분, 혐기적 스트레스, 염분 스트레스, 화학적 독성, 산화적 스트레스 및 더운, 추운 또는 동결 (freezing) 온도에 의한 것이다.
"생물적 스트레스"는 전형적으로 병원균, 예를 들면, 세균, 바이러스, 균류, 선형동물 및 곤충에 의한 스트레스이다.
"비생물적 스트레스"는 예를 들면 가뭄에 의한 수분 스트레스, 염 스트레스, 또는 동결 스트레스에 의한 삼투 스트레스일 수 있다. 비생물적 스트레스는 또한 산화적 스트레스 또는 저온 스트레스일 수 있다. "동결 스트레스"는 동결 온도, 즉, 이용가능한 물 분자가 동결되어 얼음으로 바뀌는 온도에 의한 스트레스를 의미한다. "냉각 스트레스"로도 불리는 "저온 (cold) 스트레스"는 예를 들면 10℃ 미만의 온도 또는 바람직하게는 5℃ 미만의 온도, 그러나 물 분자가 동결되지 않는 차가운 온도를 의미한다. Wang 등 (Planta (2003) 218: 1-14)에 보고된 바와 같이, 비생물적 스트레스는 일련의 형태적, 생리적, 생화학적 및 분자적 변화를 이끌어 식물 생장 및 생산성에 불리한 영향을 미친다. 가뭄, 염분, 극단적인 온도 및 산화적 스트레스는 상호 연관된 것으로 알려져 있으며, 유사한 기작을 통하여 생장 및 세포 손상을 유도할 수 있다. Rabbani 등 (Plant Physiol (2003) 133: 1755-1767)은 특히 가뭄 스트레스와 고염도 스트레스 간에 고도의 "혼선"을 기재하고 있다. 예를 들면, 가뭄 및/또는 염분은 일차적으로 삼투 스트레스로 나타나서 세포 내 항상성 및 이온 분포를 파괴한다. 흔히 고온 또는 저온을 동반하는 산화적 스트레스, 염분 또는 가뭄 스트레스는 기능적 및 구조 단백질의 변성을 야기한다. 결국 이들 다양한 환경적 스트레스는 흔히 유사한 세포 신호전달 경로 및 스트레스 단백질 생산, 항산화제 상향조절, 친화성 용질 축적 및 생장 정지 같은 세포 반응을 활성화한다. 본 발명에서 사용된 용어 "스트레스가 없는" 조건은 식물의 최적 생장을 허용하는 환경 조건이다. 당업자는 주어진 위치에서 정상적인 토양 조건 및 기후 조건을 인식하고 있다. 최적의 성장 조건에서 (스트레스가 없는 조건 하에서 자랄 때) 식물은 일반적으로 주어진 환경에서 그 식물의 평균 생산량의 증가하는 순으로 선호되는 적어도 97%, 95%, 92%, 90%, 87%, 85%, 83%, 80%, 77% 또는 75%를 생산한다. 평균 생산량은 수확 및/또는 계절에 근거해서 계산될 수 있다. 당업자는 작물의 평균 수확량 생산을 인식하고 있다.
특히, 본 발명의 방법은 스트레스가 없는 조건 하에서 수행될 수 있다. 한 예에서 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 순한 가뭄 같은 스트레스가 없는 조건 하에서 수행될 수 있다.
다른 구현예에서, 본 발명의 방법은 스트레스 조건 하에서 수행될 수 있다.
한 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 가뭄과 같은 스트레스 조건 하에서 수행될 수 있다. 또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 양분 결핍과 같은 스트레스 조건 하에서 수행될 수 있다.
양분 결핍은 질소, 인산염 및 다른 인 함유 화합물, 칼륨, 칼슘, 마그네슘, 망간, 철 및 붕소 같은 양분 부족의 결과이다.
또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 염분 스트레스와 같은 스트레스 조건 하에서 수행될 수 있다. 용어 염분 스트레스는 통상적인 소금 (NaCl)에 제한되는 것이 아니라, NaCl, KCl, LiCl, MgCl2, CaCl2 중 임의의 하나 이상일 수 있다.
또 다른 예에서, 본 발명의 방법은 대조구 식물에 비해 증가된 수확량을 갖는 식물을 제공하기 위해 저온 스트레스 또는 동결 스트레스와 같은 스트레스 조건 하에서 수행될 수 있다.
증가/향상/강화
용어 "증가", "향상", 또는 "강화"는 서로 호환성 있게 사용할 수 있으며, 본 발명에서 정의된 대조구 식물과 비교하여 적어도 3%, 4%, 5%, 6%, 7%, 8%, 9% 또는 10%, 바람직하게는 적어도 15% 또는 20%, 더욱 바람직하게는 25%, 30%, 35% 또는 40% 이상의 수확량 및/또는 생장을 의미한다.
종자 수확량
증가된 종자 수확량은 다음 중 하나 이상으로 나타난다:
(a) 개별 종자 당 및/또는 식물체 당 및/또는 평방 미터 당의 종자 생물량 (총 종자 중량)의 증가;
(b) 식물체 당 꽃 수의 증가;
(c) 증가된 종자의 수 및/또는 증가된 충전된 종자의 수;
(d) 증가된 종자 충전율 (충전된 종자의 수를 총 종자의 수로 나눈 비로 나타냄);
(e) 증가된 수확 지수 (종자 같은 수확할 수 있는 부분의 수확량을 식물 지상부의 생물량으로 나눈 비율); 및
(f) 증가된 천립 중량 (TKW) (계수된 충전된 종자의 수 및 이의 총 중량으로부터 외삽됨). 증가된 TKW는 증가된 종자 크기 및/또는 종자 중량, 및 배 및/또는 배유 크기의 증가로 인한다.
용어 "충전된 소화" 및 "충전된 종자"는 동의어로 생각될 수 있다.
종자 수확량의 증가는 또한 종자 크기 및/또는 종자 부피의 증가로 나타낼 수 있다. 더욱이, 종자 수확량의 증가는 또한 종자 면적 및/또는 종자 길이 및/또는 종자 폭 및/또는 종자 주계의 증가로 나타난다.
녹색 지수
본 발명에 사용된 "녹색 지수 (greenness index)"는 식물의 디지털 이미지로부터 계산된다. 이미지 상에 식물 대상에 속하는 각 화소에 대하여, 녹색 값 대 적색 값의 비율 (코딩 색상에 대하여 RGB 모델에서)이 계산된다. 녹색 지수는 녹색 대 적색의 비율이 주어진 역치를 능가하는 화소의 백분율로 표시된다. 정상적인 생장 조건 하에서, 염분 스트레스가 있는 생장 조건 하에서, 양분 이용도가 감소된 생장 조건 하에서 식물의 녹색 지수는 개화 전 마지막 이미지에서 측정된다. 대조적으로, 가뭄 스트레스 생장 조건 하에서 식물의 녹색 지수는 가뭄 후의 첫 번째 이미지에서 측정된다.
생물량
(
Biomass
)
본 발명에서 사용된 용어 "생물량"은 식물의 총 중량을 의미한다. 생물량의 정의에서, 하기의 임의의 하나 이상을 포함할 수 있는, 하나 이상의 식물 일부의 생물량 사이에 구별될 수 있다:
- 줄기 생물량, 종자 생물량, 잎 생물량 등과 같은 지상부 (수확 가능한)일 수 있으나, 이에 제한되지 않음; 및/또는
- 뿌리 생물량 등과 같은 (수확 가능한) 지하부일 수 있으나, 이에 제한되지 않음; 및/또는
- 뿌리 생물량, 줄기 생물량 등과 같은 영양 (vegetative) 생물량; 및/또는
- 생식 기관; 및/또는
- 종자와 같은 번식체.
마커
보조 육종
상기 육종 프로그램은 때때로 예를 들면, EMS 돌연변이 유발을 사용하여 식물에 돌연변이 유발 처리로 대립인자 변이의 도입을 필요로 하며; 다르게는, 그 프로그램은 자연발생적으로 생성된 "자연적인" 대립인자 변이체의 수집물로부터 시작될 수도 있다. 그러면 대립인자 변이체의 동정은 예를 들면, PCR로 한다. 문제되는 서열의 증가된 수확량을 제공하는 우수한 대립인자 변이체의 선발 단계가 잇따른다. 선발은 전형적으로 문제되는 서열의 다른 대립인자 변이체를 함유하는 식물의 생장 능력을 관찰함으로써 이루어진다. 생장 능력은 온실 또는 야외에서 관찰할 수 있다. 추가의 선택 가능한 단계는 우수한 대립인자 변이체가 동정된 식물과 또 다른 식물의 교배를 포함한다. 이는 예를 들면, 흥미로운 표현형적 특징의 조합을 만드는데 사용될 수 있다.
(유전자 지도 제작에서) 탐침으로 사용
상기 유전자에 대한 유전자 및 물리 지도 제작을 위한 관심있는 단백질을 코딩하는 핵산의 사용에는 적어도 15 뉴클레오티드 길이의 핵산 서열만이 필요하다. 이 핵산은 RFLP (restriction fragment length polymorphism) 마커로 사용될 수 있다. 제한효소로 절단된 식물 게놈 DNA의 서던 블럿 (Sambrook J, Fritsch EF and Maniatis T (1989) Molecular Cloning, A Laboratory Manual)은 관심있는 단백질을 코딩하는 핵산으로 프로빙될 수 있다. 생성된 밴드 패턴으로 유전자지도 제작을 위하여 MapMaker (Lander 등 (1987) Genomics 1: 174-181) 같은 컴퓨터 프로그램을 사용하여 유전적 분석을 하게 된다. 또한, 핵산은 지정된 유전적 교배의 양친 및 자손을 나타내는 개체들 세트의 제한 효소 처리된 게놈 DNA를 포함하는 서던 블럿에 탐침으로 사용될 수 있다. DNA 다형성의 분리를 기록하고, 이 집단을 이용하여 이전에 얻었던 유전자 지도상에 관심있는 단백질을 코딩하는 핵산의 위치 계산에 사용한다 (Botstein et al. (1980) Am. J. Hum. Genet. 32:314-331).
유전자 지도 제작에 사용하기 위한 식물 유전자 유래 탐침의 생산 및 사용은 [Bematzky and Tanksley (1986) Plant Mol. Biol. Reporter 4: 37-41]에 기재되어 있다. 수많은 공개문헌이 상기 개설된 방법론 또는 이의 변형을 사용하여 특정 cDNA 클론의 유전자 지도 제작을 기술한다. 예를 들면, F2 이종교배 개체군, 역교배 개체군, 무작위 교배 개체군, 근동질유전자계통, 및 다른 세트의 개체가 유전자 지도 제작에 사용될 수 있다. 상기 방법론은 당업자에게 주지되어 있다.
핵산 탐침은 또한 물리 지도에 제작 사용될 수 있다 (즉, 물리 지도상에 서열의 위치 Hoheisel et al. In: Non-mammalian Genomic Analysis: Practical Guide, Academic press 1996, pp. 319-346, 인용된 문헌 참고).
또 다른 구현예에 있어서, 핵산 탐침은 직접적인 형광 인 시투 혼성화 (fluorescence in situ hybridisation, FISH) 지도 제작에 사용될 수 있다 (Trask (1991) Trends Genet. 7:149-154). 비록 현 FISH 지도 제작 방법이 큰 클론에 유리하지만 (수 kb 내지 몇 백 kb; Laan et al. (1995)Genome Res. 5:13-20), 감도가 향상되면 더욱 짧은 탐침으로 FISH 지도 제작이 가능해진다.
유전자지도 및 물리지도 작성을 위한 핵산증폭에 근거한 다양한 방법이 핵산 서열을 사용하여 수행될 수 있다. 예는 대립인자 특이적 증폭 (allele-specific amplification, Kazazian (1989) J. Lab. Clin. Med 11:95-96), CAPS (polymorphism of PCR-amplified fragments; Sheffield 등 (1993) Genomics 16:325-332), 대립인자 특이적 라이게이션 (allele-specific ligation, Landegren 등 (1988) Science 241:1077-1080), 뉴클레오티드 신장 반응 (nucleotide extension reactions, Sokolov (1990) Nucleic Acid Res. 18:3671), Radiation Hybrid Mapping (Walter et al . (1997) Nat. Genet. 7:22-28) 및 Happy Mapping (Dear and Cook (1989) Nucleic Acid Res. 17:6795-6807)을 포함한다. 이들 방법을 위해서 증폭 반응 또는 프라이머 연장 반응에 사용하기 위한 프라이머 쌍을 고안하고 제작하기 위해 핵산 서열이 사용된다. 상기 프라이머의 고안은 당업자에게는 주지되어 있다. PCR에 근거한 유전자 지도 제작에 사용하는 방법에서는 핵산 서열에 해당하는 영역에서 교배 양친 간의 DNA 서열 차이를 알 필요가 있다. 그러나 이는 일반적으로 지도제작 방법에는 필요하지 않다.
식물
본 발명에서 사용된 용어 "식물"은 전체식물, 식물 및 종자, 어린 줄기, 줄기, 잎, 뿌리 (괴경 포함), 꽃, 및 조직과 기관을 포함하는 식물 부분의 조상 및 자손을 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다. 용어 "식물"은 또한 식물 세포, 현탁 배양액, 캘러스 조직, 배, 분열조직, 배우체, 포자체, 화분 및 소포자를 포함하며, 이들 각각은 목적 유전자/핵산을 포함한다.
본 발명의 방법에 유용한 특히 유용한 식물은 수퍼패밀리 비리디플란태 (Viridiplantae)에 속하는 모든 식물, 특히 하기를 포함하는 목록에서 선택된 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다: 에이서 (Acer spp.), 악티니디아 (Actinidia spp.), 아벨모스쿠스 (Abelmoschus spp.), 아가베 시살라나 (Agave sisalana), 아그로피론 (Agropyron spp.), 아그로스티스 스톨로니페라 ( Agrostis stolonifera ), 알리움 (Allium spp.), 아마란투스 (Amaranthus spp.), 암모필라 아레나리아 (Ammophila arenaria), 아나나스 코모수스 ( Ananas comosus ), 안노나 (Annona spp.), 아피움 그라베오렌스 (Apium graveolens), 아라키스 ( Arachis spp.), 알토칼푸스 (Artocarpus spp.), 아스파라거스 오피시날리스 ( Asparagus officinalis ), 아베나 (Avena spp.) (예를 들면, 아베나 사티바 ( Avena sativa ), 아베나 파투아 ( Avena fatua), 아베나 비잔티나 (Avena byzantina), 아베나 파투아 var . 사티바 (Avena fatua var . sativa), 아베나 하이브리다 (Avena hybrida)), 아베로아 카람볼라 (Averrhoa carambola), 뱀부사 (Bambusa sp .), 베닌카사 히스피다 (Benincasa hispida), 벨톨레티아 엑셀세아 (Bertholletia excelsea), 베타 불가리스 (Beta vulgaris), 브라시카 (Brassica spp.) (예를 들면, 브라시카 나푸스 ( Brassica napus), 브라시카 라파 (Brassica rapa ssp.) [캐놀라, 유채, 순무]), 카다바 파리노사 (Cadaba farinosa), 카멜리아 시넨시스 (Camellia sinensis), 칸나 인디카 (Canna indica), 칸나비스 사티바 (Cannabis sativa), 캡시쿰 ( Capsicum spp.), 카렉스 엘라타 (Carex elata), 카리카 파파야 (Carica papaya), 카리사 마크로칼파 (Carissa macrocarpa), 카리야 (Carya spp .), 카르타무스 팅크토리우스 (Carthamus tinctorius), 카스타네아 (Castanea spp.), 케이바 펜탄드라 (Ceiba pentandra), 키코리움 엔디비아 (Cichorium endivia ), 신나모뭄 (Cinnamomum spp .), 시트룰루스 라나투스 (Citrullus lanatus), 시트루스 (Citrus spp.), 코코스 (Cocos spp .), 코페아 ( Coffea spp.), 콜로카시아 에스쿨렌타 (Colocasia esculenta), 콜라 (Cola spp.), 콜코루스 (Corchorus sp.), 코리안드룸 사티붐 (Coriandrum sativum), 코리루스 (Corylus spp.), 크라태구스 (Crataegus spp.), 크로쿠스 사티부스 (Crocus sativus), 쿠쿨비타 (Cucurbita spp .), 쿠쿠미스 ( Cucumis spp.), 키나라 ( Cynara spp.), 다우쿠스 카로타 (Daucus carota), 데스모디움 ( Desmodium spp.), 디모칼푸스 론간 (Dimocarpus longan), 디오스코레아 (Dioscorea spp.), 디오스피로스 (Diospyros spp.), 에키노크로아 (Echinochloa spp .), 엘래이스 ((Elaeis (예를 들면, 엘래이스 귀넨시스 (Elaeis guineensis), 엘레이스 올레이페라 (Elaeis oleifera)), 엘레우신 코라카나 (Eleusine coracana), 에라그로스티스 테프 (Eragrostis tef), 에리안투스 (Erianthus sp .), 에리오보트리아 야포니카 (Eriobotrya japonica), 유카립투스 (Eucalyptus spp.), 유게니아 유니플로라 (Eugenia uniflora), 파고피룸 (Fagopyrum spp.), 파구스 (Fagus spp.), 페스투카 아룬디나케아 (Festuca arundinacea), 피쿠스 카리카 (Ficus carica), 폴투넬라 (Fortunella spp.), 프라가리아 (Fragaria spp.), 깅코 빌로바 (Ginkgo biloba), 글라이신 (Glycine spp.) (예를 들면, 글라이신 맥스 (Glycine max), 소야 히스피다 (Soja hispida) 또는 소야 맥스 (Soja max)), 고시피움 힐수툼 (Gossypium hirsutum), 헬리안투스 (Helianthus spp.) (예를 들면, 헬리안투스 안누스 (Helianthus annuus)), 헤메로칼리스 풀바 (Hemerocallis fulva), 히비스쿠스 (Hibiscus spp.) 홀데움 (Hordeum spp.) (예를 들면, 홀데움 불가레 (Hordeum vulgare)), 이포모에아 바타타스 (Ipomoea batatas ), 주글란스 (Juglans spp.), 락투카 사티바 (Lactuca sativa), 라티루스 (Lathyrus spp.), 렌스 쿨리나리스 (Lens culinaris), 리눔 우시타티시뭄 (Linum usitatissimum), 리치 키넨시스 (Litchi chinensis), 로투스 ( Lotus spp.), 루파 아쿠탄굴라 ( Luffa acutangula ), 루피누스 (Lupinus spp.), 루줄라 실바티카 (Luzula sylvatica), 라이코펠시콘 (Lycopersicon spp.) (예를 들면, 라이코펠시콘 에스쿨렌툼 (Lycopersicon esculentum), 라이코펠시콘 라이코펠시쿰 (Lycopersicon lycopersicum), 라이코펠시콘 피리폴메 (Lycopersicon pyriforme)), 마크로틸로마 (Macrotyloma spp.), 말루스 (Malus spp.), 말피기아 에말기나타 (Malpighia emarginata), 맘메아 아메리카나 (Mammea americana), 망기페라 인디카 (Mangifera indica), 마니호트 (Manihot spp.), 마닐카라 자포타 (Manilkara zapota), 메디카고 사티바 (Medicago sativa), 메릴로투스 (Melilotus spp.), 멘타 ( Mentha spp.), 미스칸투스 시넨시스 (Miscanthus sinensis), 모몰디카 (Momordica spp.), 모루스 니그라 (Morus nigra), 무사 (Musa spp.), 니코티아나 ( Nicotiana spp.), 올레아 ( Olea spp.), 오푼티아 (Opuntia spp.), 오르니토푸스 (Ornithopus spp.), 오리자 (Oryza spp.) (예를 들면, 오리자 사티바 (Oryza sativa ), 오리자 라티포리아 ( Oryza latifolia)), 패니쿰 미리아케움 (Panicum miliaceum), 패니쿰 벌가툼 ( Panicum virgatum), 파시플로라 에둘리스 (Passiflora edulis), 파스티나카 사티바 (Pastinaca sativa), 페니세툼 (Pennisetum sp .), 펠세아 (Persea spp.), 페트로셀리눔 크리스품 (Petroselinum crispum), 파라리스 아룬디나케아 (Phalaris arundinacea), 파세올루스 (Phaseolus spp.), 플레움 프라텐세 (Phleum pratense), 피닉스 (Phoenix spp .), 프라그미테스 오스트라리스 (Phragmites australis), 피사리스 (Physalis spp.), 피누스 ( Pinus spp.,) 피스타키아 베라 (Pistacia vera ), 피숨 (Pisum spp.), 포아 (Poa spp.), 포푸러스 ( Populus spp.), 프로소피스 (Prosopis spp.), 프루누스 (Prunus spp.), 프시디움 ( Psidium spp.), 푸니카 그라나툼 (Punica granatum), 피루스 코무니스 (Pyrus communis), 켈쿠스 (Quercus spp.), 라파누스 사티부스 (Raphanus sativus), 레움 라발바룸 (Rheum rhabarbarum), 리베스 (Ribes spp.), 리키누스 코무니스 ( Ricinus communis ), 루부스 (Rubus spp.), 사카룸 (Saccharum spp.), 살릭스 ( Salix spp.), 삼부쿠스 (Sambucus spp.), 세카레 세레알레 ( Secale cereale ), 세사뭄 ( Sesamum spp.), 시나피스 ( Sinapis sp .), 솔라눔 ( Solanum spp.) (예를 들면, 솔라눔 투베로숨 (Solanum tuberosum ), 솔라눔 인테그리폴리움 (Solanum integrifolium) 또는 솔라눔 라이코펠시쿰 (Solanum lycopersicum)), 솔굼 바이칼라 ( Sorghum bicolor ), 스피나시아 (Spinacia spp.), 시지기움 (Syzygium spp.), 타게테스 ( Tagetes spp.), 타마린두스 인디카 ( Tamarindus indica ), 테오브로마 카카오 (Theobroma cacao ), 트리폴리움 (Trifolium spp.), 트리프사쿰 다크틸로이드 (Tripsacum dactyloides), 트리티코세칼레 림파우이 ( Triticosecale rimpaui ), 트리티쿰 (Triticum spp. (예를 들면, 트리티쿰 아에스티붐 (Triticum aestivum ), 트리티쿰 두룸 (Triticum durum), 트리티쿰 툴기둠 (Triticum turgidum ), 트리티쿰 하이베르눔 (Triticum hybernum), 트리티쿰 마차 (Triticum macha ), 트리티쿰 사티붐 (Triticum sativum), 트리티쿰 모노코쿰 (Triticum monococcum) 또는 트리티쿰 불가레 (Triticum vulgare)), 트로패오룸 미누스 (Tropaeolum minus), 트로패오룸 마주스 (Tropaeolum majus), 박시니움 (Vaccinium spp.), 비시아 (Vicia spp.), 비그나 (Vigna spp.), 비올라 오도라타 (Viola odorata), 비티스 ( Vitis spp.), 제아 메이즈 (Zea mays), 지자니아 팔루스트리스 (Zizania palustris), 지지푸스 (Ziziphus spp.).
대조구
식물(들)
적절한 대조구 식물의 선택은 실험 셋업에서는 통상적인 부분이며, 상기 식물의 야생형 또는 목적 유전자가 없는 해당 식물을 실험에 포함할 수 있다. 대조구 식물은 전형적으로 평가되는 식물과 동일한 식물 종 또는 동일한 변종이다. 대조구 식물은 또한 평가되는 식물의 공접합자(nullizygote)일 수 있다. 공접합자는 분리에 의하여 왜래 유전자가 없는 개체이다. 본 발명에서 사용된 "대조구 식물"은 전체 식물뿐 아니라 종자 및 종자의 일부분을 포함한 식물의 일부분을 말한다.
발명의 상세한 설명
LEJ1
폴리펩티드 -
ExbB
폴리펩티드 -
NMPRT
폴리펩티드
놀랍게도, 이제 LEJ1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다. 첫 번째 구현예에 따라, 본 발명은 LEJ1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
게다가, 이제 놀랍게도 ExbB 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다. 두 번째 구현예에 따라, 본 발명은 ExbB 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
놀랍게도, 이제 본 발명에서 정의된 NMPRT를 코딩하는 핵산의 식물에서의 발현 조절은 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다. 세 번째 구현예에 따라, 본 발명은 본 발명에서 정의된 NMPRT를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
다른 구현예에서, 본 발명은 (i) NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 (ii) 향상된 수확량 관련 형질을 갖는 식물을 선발하는 단계를 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 생산하는 방법을 제공한다.
LEJ1 폴리펩티드를 코딩하는 핵산의 발현을 조절 (바람직하게는 증가)하는 바람직한 방법은 LEJ1 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다. 마찬가지로, ExbB 폴리펩티드를 코딩하는 핵산의 발현 조절, 바람직하게는 증가시키는 바람직한 방법은 ExbB 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이며, 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 바람직하게는 증가시키는 바람직한 방법은 상기 NMPRT를 코딩하는 상기 핵산의 상기 식물로의 도입 및 발현이다.
본 발명의 명세서에서, 용어 "핵산 서열" 및 "핵산"은 상호 교체 사용되는 것을 인지해야 한다. 또한, 용어 "아미노산 서열" 및 "아미노산"은 본 발명의 명세서에서 상호 교체 사용된다.
일 구현예에서 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 LEJ1폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 LEJ1 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "LEJ1 핵산" 또는 "LEJ1 유전자"라고 칭한다.
본 발명에서 정의된 "LEJ1 폴리펩티드"는 시스타티오닌 베타-신타아제 도메인 (Interpro entry IPR000644, PFAM entry PF00571) 또는 적어도 하나의, 바람직하게는 2개의 CBS 도메인(들) (ProfileScan PS51371 또는 SMART SM00116)을 포함하는 임의의 폴리펩티드를 의미한다. 바람직하게는 LEJ1 폴리펩티드는 또한 엽록체에 대한 위치화 신호 서열을 포함한다.
더 바람직하게는, LEJ1 폴리펩티드는 또한 하기 모티프의 하나 이상을 포함한다:
모티프 1 (서열번호 205):
HVVKP[TS]T[TS]VD[ED]ALE[ALI]LVE[HKN][KR][IV]TG[FL]PV[IV]DD[DN]W[KTN]LVG[VL]VSDYDLLALDSISG
모티프 2 (서열번호 206):
T[NS][ML]FP[ED]VDSTWKTFNE[VIL]QKL[LI]SKT[NY]GKV[VI]GD[LV]MTP[AS]PLVVR
모티프 3 (서열번호 207):
NLEDAARLLLETK[YF]RRLPVVD[SA][DE]GKL[VI]GI[IL]TRGNV
모티프 4 (서열번호 208):
P[AG][KR]N[GE]GYTVGDFMT[GP][RK]Q[HN]LHVVKPSTSVDDALELLVEKKVTGLPVIDD[DN]W
모티프 5 (서열번호 209):
[GR][RS]SQN[DE]TN[LM]FP[ND]VDS[TS]WKTFNELQKLISKT[HY]G[KQ]VVGDLMTPSPLVVR[GD]ST
모티프 6 (서열번호 210):
NLEDAARLLLETKFRRLPVVD[SA]DGKLIGILTRGNVVRAALQIKRETE[NK]S[TA]
본 발명에서 사용된 용어 "LEJ1" 또는 "LEJ1 폴리펩티드"는 하기에 정의된 "LEJ1 폴리펩티드"의 상동체를 포함하는 의미이다.
모티프 1 내지 6은 MEME 알고리즘 (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994)을 사용하여 찾아졌다. MEME 모티프 내의 각 위치에서, 잔기는 0.2보다 높은 빈도로 서열의 조회 (query) 세트에 존재하는 것을 나타낸다. 대괄호 (square bracket) 안의 잔기는 대체를 나타낸다.
더욱 바람직하게는, LEJ1 폴리펩티드는 증가하는 순으로 선호되는 적어도 2개, 적어도 3개, 적어도 4개, 적어도 5개 또는 모든 6개 모티프를 포함한다.
부가적으로 또는 대안적으로, LEJ1 단백질의 상동체는 상동체 단백질이 상기에 기술된 보존된 모티프의 임의의 하나 이상을 포함한다면, 서열번호 2로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다. 바람직하게는 LEJ1 폴리펩티드의 모티프는 서열번호 205 내지 서열번호 210 (모티프 1 내지 6)으로 표시된 모티프의 임의의 하나 이상에 대해 증가하는 순으로 선호되는, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
또다른 구현예에서, 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 ExbB 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 ExbB 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는, 따라서 본 발명의 방법 수행에 유용한 핵산은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "ExbB 핵산" 또는 "ExbB 유전자"라고 칭한다.
본 발명에서 정의된 "ExbB 폴리펩티드"는 PFAM 등록 번호 PF01618에 해당하는 InterPro accession IPR002898 MotA/TolQ/ExbB 양성자 채널 도메인을 포함하는 비-척추동물 (non-vertebrate) 기원의 임의의 폴리펩티드를 의미한다. 본 발명에서 사용된 용어 "비-척추동물" 기원은 척추동물 유래와 다른 임의의 기원을 의미하며, 예를 들어 조류 (algal), 박테리아, 곰팡이, 효모 또는 식물 기원을 포함하나, 이에 제한되는 것은 아니다.
바람직한 구현예에서, ExbB 폴리펩티드는 하나 이상의 막관통 (transmembrane) 도메인을 포함한다.
당업자는 막관통 도메인을 결정하는 알고리즘을 숙지하고 있다. 상기 알고리즘의 예는 [Technical University of Denmark]의 서버상에 호스팅된 TMHMM이다.
바람직한 구현예에서, 본 발명에서 사용된 "ExbB" 또는 "ExbB 폴리펩티드"는 원핵생물 기원의 임의의 ExbB 폴리펩티드를 의미한다.
부가적으로 또는 대안적으로, ExbB 단백질의 상동체는 상동체 단백질이 상기에 기술된 하나 이상의 막관통 도메인을 포함한다면, 서열번호 212로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 18%, 19%, 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다.
다른 구현예에서, 이후 "본 발명의 방법에 유용한 단백질"은 본 발명에서 정의된 NMPRT를 의미한다. 본 발명에서 사용된 "NMPRT"는 또한 "nadV 폴리펩티드"라는 명칭으로 알려져 있다. 상기 구현예에 따라, 이후 "본 발명의 방법에 유용한 핵산"은 본 발명에서 정의된 NMPRT를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는, 따라서 본 발명의 방법 수행에 유용한 핵산은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이다. 상기 핵산은 또한 본 발명에서 "NMPRT 핵산" 또는 "NMPRT 유전자"라고 칭한다.
본 발명에서 사용된 "NMPRT" 또는 "NMPRT 폴리펩티드" 또는 "NMPRT 단백질"은 니코틴아미드 포스포리보실트랜스퍼라아제 활성을 갖는, 바람직하게는 비-척추동물 기원의 임의의 폴리펩티드를 의미한다. 본 발명에서 사용된 용어 "비-척추동물" 기원은 척추동물 유래와 다른 임의의 기원을 의미하며, 예를 들어 조류 (algal), 박테리아, 곰팡이, 효모 또는 식물 기원을 포함하나, 이에 제한되는 것은 아니다. 바람직한 구현예에서, 본 발명에서 사용된 "NMPRT" 또는 "NMPRT 폴리펩티드"는 원핵생물 기원의, 바람직하게는 시아노박테리아 기원의 임의의 폴리펩티드를 의미한다.
다른 바람직한 구현예에서, 본 발명에서 사용된 "NMPRT" 또는 "NMPRT 폴리펩티드"는 (i) InterPro accession IPR016471 도메인 및 (ii) 서열번호 315로 표시된 도메인에 대해 적어도 50%의 아미노산 서열 동일성을 추가로 포함하는, 상기에 제공된 임의의 폴리펩티드를 의미한다.
다른 바람직한 구현예에서 NMPRT는 하기 모티프의 하나 이상에 대해 적어도 64%, 예를 들면 적어도 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 더 높은 아미노산 서열 동일성을 포함한다:
(i) 모티프 7: FKLHDFGARGVSSGESSGIGGLAHLVNFQGSDTV (서열번호 318),
(ii) 모티프 8: AAYSIPAAEHSTITAWG (서열번호 319),
(iii) 모티프 9: AVVSDSYDL (서열번호 320),
(iv) 모티프 10: VIRPDSGDP (서열번호 321),
(v) 모티프 11: VRVIQGDGV (서열번호 322),
(vi) 모티프 12: NLAFGMGGALLQKVNRDT (서열번호 323).
즉, 본 발명에서 제공된 니코틴아미드 포스포리보실트랜스퍼라아제 (NMPRT)를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물의 수확량 관련 형질을 향상시키는 방법이 제공되며, 상기 NMPRT는 하기 모티프의 하나 이상을 포함한다:
(i) 모티프 7: FKLHDFGARGVSSGESSGIGGLAHLVNFQGSDTV (서열번호 318), 상기에서 감소하는 순으로 선호되는 많게는 1, 2, 3, 4, 5, 6, 7, 8, 9 또는 10개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨;
(ii) 모티프 8: AAYSIPAAEHSTITAWG (서열번호 319), 상기에서 감소하는 순으로 선호되는 많게는 1, 2, 3, 4 또는 5개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨;
(iii) 모티프 9: AVVSDSYDL (서열번호 320), 상기에서 감소하는 순으로 선호되는 많게는 1, 2 또는 3개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨;
(iv) 모티프 10: VIRPDSGDP (서열번호 321), 상기에서 감소하는 순으로 선호되는 많게는 1, 2 또는 3개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨;
(v) 모티프 11: VRVIQGDGV (서열번호 322), 상기에서 감소하는 순으로 선호되는 많게는 1, 2 또는 3개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨; 및
(v) 모티프 12: NLAFGMGGALLQKVNRDT (서열번호 323), 상기에서 감소하는 순으로 선호되는 많게는 1, 2, 3, 4 또는 5개의 아미노산 불일치 (mismatch) 또는 변화가 허용됨.
더 바람직하게는, NMPRT 폴리펩티드는 증가하는 순으로 선호되는 적어도 2, 적어도 3, 적어도 4, 적어도 5개 또는 모든 6개의 상기에 기술된 모티프를 포함한다. 용어 "도메인" 및 "모티프"는 본 발명의 "정의" 섹션에 정의되었다.
본 발명에서 사용된 용어 "NMPRT" 또는 "NMPRT 폴리펩티드"는 또한 하기에 정의된 "NMPRT"의 상동체를 포함하는 의미이다.
부가적으로 또는 대안적으로, NMPRT 단백질의 상동체는 상동체 단백질이 서열번호 315로 표시된 도메인 및/또는 상기에 기술된 모티프 7 내지 12 중 임의의 하나 이상을 포함한다면, 서열번호 282로 표시되는 아미노산에 대해, 증가하는 순으로 선호되는 적어도 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다. 바람직하게는 NMPRT 폴리펩티드의 모티프는 서열번호 315로 표시된 도메인 및/또는 서열번호 318 내지 서열번호 323 (모티프 7 내지 12)으로 표시된 모티프의 임의의 하나 이상에 대해 증가하는 순으로 선호되는, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
다른 구현예에서, 본 발명은 NMPRT 폴리펩티드가 서열번호 282의 1 내지 461번 아미노산의 보존된 도메인에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함하는 방법에 관한 것이다. 다른 구현예에서, 본 발명은 NMPRT 폴리펩티드가 서열번호 282의 64 내지 459번 아미노산의 보존된 도메인에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함하는 방법에 관한 것이다.
용어 "도메인", "시그너처" 및 "모티프"는 본 발명의 "정의" 섹션에 정의되었다.
바람직하게는, 도 3에 도시된 것과 같은 계통수의 구축에 이용될 때의 LEJ1 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링된다.
바람직하게는, 도 9에 도시된 것과 같은 계통수의 구축에 이용될 때의 ExbB 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 212로 표시된 아미노산 서열을 포함하는 ExbB 폴리펩티드 그룹과 함께 클러스터링된다.
게다가, ExbB 폴리펩티드 (적어도 그들의 자연적인 형태에서)는 상기에 기술된 것처럼 막에 위치한다.
바람직하게는, Gazzaniga 등 (2009)에 도시된 것과 같은 계통수의 구축에 이용될 때의 NMPRT 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 282로 표시된 아미노산 서열을 포함하는 시아노박테리아의 NMPRT 폴리펩티드 그룹과 함께 클러스터링된다.
다른 바람직한 구현예에서, 본 발명에서 사용된 "NMPRT" 또는 "NMPRT 폴리펩티드" 또는 "NMPRT 단백질"은 또한 NMPRT, NMPRTase 또는 NAmPRTase라고 칭해지는 "니코틴아미드 포스포리보실트랜스퍼라아제" (국제 명명법: E.G. 2.4.2.12)를 의미하며, 상기는 자연적인 니코틴아미드 전구체로부터 니코틴아미드 아데닐 디뉴클레오티드 (NAD; nicotinamide adenyl dinucleotide) 생합성에 중요한 효소이다. 일반적으로 NMPRT 폴리펩티드 (적어도 그들의 자연적인 형태에서)는 효소 활성을 갖는다. 니코틴아미드 포스포리보실트랜스퍼라아제의 활성을 측정하기 위한 도구 및 기술은 당업계에 잘 알려져 있다. NMPRT 효소 활성은 예를 들면 실시예 6에 제시된 방법으로 측정될 수 있다.
게다가, LEJ1 폴리펩티드는 실시예 7 및 8에 기재된 본 발명의 방법에 따라 벼에서 발현되었을 때, 증가된 수확량 관련 형질, 특히 증가된 충전율 및 증가된 수확 지수를 갖는 식물체를 제공한다.
게다가, ExbB 폴리펩티드는 본 발명의 실시예 섹션에 기재된 본 발명의 방법에 따라 벼에서 발현되었을 때, 증가된 수확량 관련 형질, 특히 종자 수확량, 천립 중량, 수확 지수, 충전된 종자의 수, 총 종자 중량 중 임의의 하나 이상의 증가, 더 특별하게는 충전된 종자 수의 현저한 증가를 갖는 식물체를 제공한다.
게다가, NMPRT 폴리펩티드는 실시예 7 및 8에 기재된 것처럼 본 발명의 방법에 따라 벼에서 발현되었을 때, 뿌리/줄기 지수, 총 종자 수확량, 충전율, 원추화서 당 꽃의 수, 충전된 종자의 수, 천립 중량의 증가를 포함하는 증가된 수확량 관련 형질을 갖는 식물체를 제공한다.
바람직한 구현예에서, 본 발명은 시네코시스티스 (Synechocystis) sp. 균주 PCC 6803으로부터 유래된 니코틴아미드 포스포리보실트랜스퍼라아제 (NMPRT)를 코딩하는 핵산, 특히 서열번호 281로 표시된 시네코시스티스 sp. 균주 PCC 6803의 slr0788 유전자의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
다른 구현예에서, 본 발명은 시네코코커스 이롱가투스 (Synechococcus elongatus) 균주 PCC 7942로부터 유래된 니코틴아미드 포스포리보실트랜스퍼라아제 (NMPRT)를 코딩하는 핵산, 특히 서열번호 309로 표시된 시네코코커스 이롱가투스 (Synechococcus elongatus) 7942의 2328로 명명된 유전자의 식물에서의 발현 조절을 포함하는, 대조구 식물에 비해 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다.
LEJ1 폴리펩티드에 관하여, 본 발명은 서열번호 2의 폴리펩티드 서열을 코딩하는 서열번호 1로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 LEJ1 코딩 핵산 또는 LEJ1 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
LEJ1 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 10에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 10에 제시된 아미노산 서열이 서열번호 2로 표시된 LEJ1 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 1 또는 서열번호 2에서, 두 번째 BLAST (back-BLAST)는 애기장대 서열과 대조하는 것이다.
ExbB 폴리펩티드에 관하여, 본 발명은 서열번호 212의 폴리펩티드 서열을 코딩하는 서열번호 211로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 ExbB 코딩 핵산 또는 ExbB 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
ExbB 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 11에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 11에 제시된 아미노산 서열이 서열번호 212로 표시된 ExbB 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 211 또는 서열번호 212에서, 두 번째 BLAST (back-BLAST)는 시네코시스티스 서열과 대조하는 것이다.
NMPRT 폴리펩티드에 관하여, 본 발명은 서열번호 282의 폴리펩티드 서열을 코딩하는 서열번호 281로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 NMPRT 코딩 핵산 또는 NMPRT 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
NMPRT 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 12에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 12에 제시된 아미노산 서열이 서열번호 282로 표시된 NMPRT 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 281 또는 서열번호 282에서, 두 번째 BLAST (back-BLAST)는 시네코시스티스 서열과 대조하는 것이다.
핵산 변이체도 본 발명의 방법의 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 코딩하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 코딩하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다. 본 발명의 방법 수행에 유용한 추가의 변이체는 코돈 사용 빈도가 최적화된 또는 miRNA 표적 위치가 제거된 변이체이다.
본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 일부, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산에 혼성화하는 핵산, LEJ1 폴리펩티드를 코딩하는 핵산의 스플라이스 변이체, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 변이체를 포함한다. 용어 혼성화하는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재되어 있다.
본 발명의 방법의 수행은 전체 길이 핵산 서열의 사용에 의존하지 않으므로, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산은 전체 길이의 핵산일 필요는 없다. 본 발명에서는, 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 핵산 서열 중 임의의 하나의 일부를 식물에 도입 및 발현, 또는 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 일부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 코딩 (또는 비코딩) 서열에 융합될 수도 있다. 다른 코딩 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
LEJ1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 LEJ1 폴리펩티드를 코딩하며, 실시예 섹션의 표 10에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 10에 제시된 핵산 중 임의의 하나의 일부분, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 300, 350, 400, 450, 500, 550, 600, 650, 700, 750, 800, 850개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 10에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 1의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 3에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 모티프 1 내지 6의 하나 이상을 포함하고/하거나, 서열번호 2에 대해 적어도 37%의 서열 동일성을 갖는 아미노산 서열의 단편을 코딩한다.
ExbB 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 ExbB 폴리펩티드를 코딩하며, 실시예 섹션의 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 11에 제시된 핵산 중 임의의 하나의 일부분, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 150, 200, 250, 300, 350, 500, 550, 600, 650, 700, 750, 800, 850, 900개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 11에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 211의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 박테리아 기원의, 바람직하게는 서열번호 212로 표시된 아미노산 서열을 포함하는 ExbB 폴리펩티드 그룹과 함께 클러스터링되는 아미노산 서열의 단편을 코딩한다.
NMPRT 폴리펩티드에 관하여, 본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 NMPRT 폴리펩티드를 코딩하며, 실시예 섹션의 표 12에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 12에 제시된 핵산 중 임의의 하나의 일부분, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 1300, 1400, 1500, 1600, 1700, 1800, 1900, 2000, 2100, 2200, 2300, 2400, 2500, 2600개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 12에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 281의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 박테리아 기원의, 바람직하게는 서열번호 281로 표시된 아미노산 서열을 포함하는 NMPRT 폴리펩티드 그룹과 함께 클러스터링되는 아미노산 서열의 단편을 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건 하에서, 바람직하게는 스트린전트 조건 하에서, 본 발명에서 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 핵산 중 임의의 하나와 혼성화가 가능한 핵산의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 임의의 핵산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산과 혼성화가 가능한 핵산의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
LEJ1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 LEJ1 폴리펩티드를 코딩하며, 실시예 섹션의 표 10에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 10에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 10에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 1로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 도 3에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 모티프 1 내지 6의 하나 이상을 포함하고/하거나, 서열번호 2에 대해 적어도 37%의 서열 동일성을 갖는 아미노산 서열의 폴리펩티드를 코딩한다.
ExbB 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 ExbB 폴리펩티드를 코딩하며, 실시예 섹션의 표 11에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 11에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 11에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 211로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 박테리아 기원의, 바람직하게는 서열번호 212로 표시된 아미노산 서열을 포함하는 ExbB 폴리펩티드 그룹과 함께 클러스터링되는 아미노산 서열의 폴리펩티드를 코딩한다.
NMPRT 폴리펩티드에 관하여, 본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩하며, 실시예 섹션의 표 12에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 12에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 12에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 281로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 Gazzaniga 등 (2009)에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 282로 표시된 아미노산 서열을 포함하는 시아노박테리아 기원의, 즉 시아노박테리아의 NMPRT 폴리펩티드 그룹과 함께, 더 바람직하게는 시네코시스티스 sp. 유래의 NMPRT 폴리펩티드와 함께 클러스터링되는 아미노산 서열의 폴리펩티드를 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 LEJ1 폴리펩티드를 코딩하는 스플라이스 변이체이며, 스플라이스 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10에 제시된 핵산 서열 중 임의의 하나의 스플라이스 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 10에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 스플라이스 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
바람직한 스플라이스 변이체는 서열번호 1로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 2의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 도 3에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 모티프 1 내지 6의 하나 이상을 포함하고/하거나, 서열번호 2에 대해 적어도 37%의 서열 동일성을 갖는다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 핵산의 임의의 하나의 대립인자 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 대립인자 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
LEJ1 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 2의 LEJ1 폴리펩티드 및 실시예 섹션의 표 10에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 1의 대립인자 변이체 또는 서열번호 2의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 도 3에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 모티프 1 내지 6의 하나 이상을 포함하고/하거나, 서열번호 2에 대해 적어도 37%의 서열 동일성을 갖는다.
ExbB 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 212의 ExbB 폴리펩티드 및 실시예 섹션의 표 11에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 211의 대립인자 변이체 또는 서열번호 212의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 임의의 다른 그룹보다 박테리아 기원의, 바람직하게는 서열번호 212로 표시된 아미노산 서열을 포함하는 ExbB 폴리펩티드와 함께 클러스터링된다.
NMPRT 폴리펩티드에 관하여, 본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 282의 NMPRT 폴리펩티드 및 실시예 섹션의 표 12에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 281의 대립인자 변이체 또는 서열번호 282의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 Gazzaniga 등 (2009)에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 282로 표시된 아미노산 서열을 포함하는 시아노박테리아 기원의, 즉 시아노박테리아의 NMPRT 폴리펩티드 그룹과 함께, 더 바람직하게는 시네코시스티스 sp. 유래의 NMPRT 폴리펩티드와 함께 클러스터링된다.
유전자 셔플링 또는 방향 진화는 또한 상기에 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 핵산 서열 중 임의의 하나의 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 10 또는 표 11 또는 표 12에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링으로 얻어진다.
LEJ1 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 도 3에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 2 (At4g34120, 박스 표시)로 표시된 아미노산 서열을 포함하는 LEJ1 폴리펩티드 그룹과 함께 클러스터링되고/되거나, 모티프 1 내지 6의 하나 이상을 포함하고/하거나, 서열번호 2에 대해 적어도 37%의 서열 동일성을 갖는다.
ExbB 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 박테리아 기원의, 바람직하게는 서열번호 212로 표시된 아미노산 서열을 포함하는 ExbB 폴리펩티드 그룹과 함께 클러스터링된다.
NMPRT 폴리펩티드에 관하여, 바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 Gazzaniga 등 (2009)에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 282로 표시된 아미노산 서열을 포함하는 시아노박테리아 기원의, 즉 시아노박테리아의 NMPRT 폴리펩티드 그룹과 함께, 더 바람직하게는 시네코시스티스 sp. 유래의 NMPRT 폴리펩티드와 함께 클러스터링된다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
LEJ1 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 상기 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 LEJ1 폴리펩티드 코딩 핵산은 식물로부터, 더 바람직하게는 쌍자엽 식물로부터, 더욱 바람직하게는 십자화과 (family Brassicaceae)로부터, 가장 바람직하게는 핵산은 애기장대 (Arabidopsis thaliana)로부터 유래한다.
ExbB 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 상기 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 ExbB 폴리펩티드 코딩 핵산은 시아노박테리아 기원으로부터, 더 바람직하게는 시네코시스티스 종으로부터, 가장 바람직하게는 시네코시스티스 sp. PCC6803으로부터 유래한다.
NMPRT 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 상기 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히, 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하게 기재되어 있다.
LEJ1 폴리펩티드 및 NMPRT 폴리펩티드에 관하여, 본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (수확 가능한) 지상부 및/또는 (수확 가능한) 지하부를 포함하여 초기 활력 및/또는 하나 이상의 식물체의 일부분의 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
본 발명은 대조구 식물에 비하여 수확량 관련 형질, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
NMPRT 폴리펩티드에 관하여, 바람직한 구현예에서 종자 수확량을 증가시키는 방법은 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하여 제공되며, 상기 증가된 종자 수확량은 (i) 증가된 충전율; (ii) 증가된 원추화서 당 꽃의 수; 및 (iii) 증가된 천립 중량 (TKW)의 하나 이상이다.
다른 바람직한 구현예에서, 적어도 하나의 수확량 관련 매개변수를 증가시키는 방법은 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하여 제공되며, 상기 증가된 수확량 관련 매개변수는 증가된 뿌리/줄기 지수이다.
본 발명에 따른 형질전환 식물은 수확량 관련 형질이 증가하므로, 이들 식물은 생활사 중의 해당 단계에서 대조구 식물의 생장 속도에 비하여 (생활사 중 적어도 일부에서) 증가된 생장 속도를 나타낼 것이다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키기 위한 방법을 제공하며, 상기 방법은 본 발명에 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현의 조절을 포함한다.
본 발명의 방법의 수행은 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 양분 결핍 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 염분 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 염분 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 가뭄 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 가뭄 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명은 또한 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산;
(b) (a)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산은 상기에 정의된 바와 같다. 용어 "조절 서열" 및 "종결 서열"은 본 발명에서 정의된 바와 같다.
본 발명은 또한 상기에 기재된 구축물로 형질전환된 식물체를 제공한다. 특히, 본 발명은 상기에 기재된 구축물로 형질전환된 식물체를 제공하며, 상기 식물체는 본 발명에서 기재된 것처럼 증가된 수확량 관련 형질을 갖는다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동 가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 유도하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 항시성 (constitutive) 프로모터가 본 발명의 방법에 특히 유용하다. 바람직하게는 항시성 프로모터는 중간 강도의 편재하는 (ubiquitous) 항시성 프로모터이다. 본 발명의 "정의" 섹션에서 다양한 프로모터 유형의 정의에 대해 참고한다.
LEJ1 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 1로 표시된 LEJ1 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 항시성 프로모터에 의해 유도될 때 LEJ1 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
ExbB 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 211로 표시된 ExbB 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 항시성 프로모터 또는 뿌리 특이적 프로모터에 의해 유도될 때 ExbB 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
NMPRT 폴리펩티드에 관하여, 본 발명의 적용은 서열번호 281로 표시된 NMPRT 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 항시성 프로모터에 의해 유도될 때 NMPRT 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
항시성 프로모터는 바람직하게는 중간 강도의 프로모터이다. 더 바람직하게는 상기 항시성 프로모터는 GOS2 프로모터와 같은 식물 유래 프로모터, 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터, 더욱 바람직하게는 벼 유래의 GOS2 프로모터이다. 더 바람직하게는 항시성 프로모터는 서열번호 201 또는 서열번호 275 또는 서열번호 324에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 항시성 프로모터는 서열번호 201 또는 서열번호 275 또는 서열번호 324로 표시된다. 본 발명의 "정의" 섹션에서 항시성 프로모터의 추가의 예에 대해 참고한다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 구축물은 서열번호 201에 대해 실질적으로 유사한 벼 GOS2 프로모터 및 LEJ1 폴리펩티드 코딩 핵산을 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 발현 카세트는 서열번호 202 (pGOS2::LEJ1::t-zein 서열)로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다.
ExbB 폴리펩티드에 관하여, 항시성 프로모터는 바람직하게는 중간 강도의 프로모터이다. 더 바람직하게는 상기 항시성 프로모터는 GOS2 프로모터와 같은 식물 유래 프로모터, 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터, 더욱 바람직하게는 프로모터는 벼 유래의 GOS2 프로모터이다. 더 바람직하게는 항시성 프로모터는 서열번호 275에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 항시성 프로모터는 서열번호 275로 표시된다. 본 발명의 "정의" 섹션에서 항시성 프로모터의 추가의 예에 대해 참고한다.
본 발명의 다른 바람직한 특징에 따라, ExbB 폴리펩티드를 코딩하는 핵산은 뿌리 특이적 프로모터에 작동 가능하게 연결된다. 상기 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터 (Plant Mol Biol. 1995 Jan; 27(2):237-48) 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터이며, 더 바람직하게는 RCc3 프로모터는 벼 유래이며, 더욱 바람직하게는 RCc3 프로모터는 서열번호 276에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 276으로 표시된다. 본 발명의 방법 수행에 사용될 수 있는 다른 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 3에 제시되어 있다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 구축물은 서열번호 275에 실질적으로 유사한 항시성 프로모터 및 ExbB 폴리펩티드를 코딩하는 핵산을 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 상기 발현 카세트는 서열번호 279 (pGOS2::ExbB::종결 서열)로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다.
다른 바람직한 구현예에서, 상기 구축물은 서열번호 276에 실질적으로 유사한 뿌리 특이적 프로모터 및 ExbB 폴리펩티드를 코딩하는 핵산을 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 상기 발현 카세트는 서열번호 280 (pRs::ExbB::종결 서열)으로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다.
NMPRT 폴리펩티드에 관하여, 항시성 프로모터는 바람직하게는 중간 강도의 프로모터이다. 더 바람직하게는 상기 항시성 프로모터는 GOS2 프로모터와 같은 식물 유래 프로모터, 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상을 갖는 프로모터, 즉, 기능적으로 동등한 프로모터, 더욱 바람직하게는 프로모터는 벼 유래의 GOS2 프로모터이다. 더 바람직하게는 항시성 프로모터는 서열번호 324에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 항시성 프로모터는 서열번호 324로 표시된다. 본 발명의 "정의" 섹션에서 항시성 프로모터의 추가의 예에 대해 참고한다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 구축물은 서열번호 324에 실질적으로 유사한 프로모터 및 NMPRT 폴리펩티드를 코딩하는 핵산을 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 상기 발현 카세트는 서열번호 327 (pGOS2::NMPRT::종결 서열)로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다. 그 예는 실시예 7을 참고한다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 발현을 조절하는 바람직한 방법은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다; 그러나 상기 방법의 수행 효과 즉, 수확량 관련 형질을 향상시키는 효과는 T-DNA 활성화 태깅, 틸링 (TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행해질 수도 있으나, 이에 제한되지 않는다. 상기 기술의 설명은 정의 섹션에 기재되어 있다.
본 발명은 또한 상기에서 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 임의의 핵산의 식물로의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 하기 단계를 포함하는 향상된 수확량 관련 형질, 특히 증가된 수확량, 더 특별하게는 증가된 종자 수확량을 갖는 형질전환 식물을 생산하는 방법을 제공한다:
(i) LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 핵산 또는 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드를 코딩하는 핵산을 포함하는 유전자 구축물을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
상기 (i)의 핵산은 본 발명에서 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드를 코딩할 수 있는 임의의 핵산일 수 있다.
NMPRT 폴리펩티드에 관하여, 더욱 상세하게, 본 발명은 하기 단계를 포함하는 향상된 수확량 관련 형질, 특히 증가된 종자 수확량을 갖는, 더 바람직하게는 (i) 증가된 충전율; (ii) 증가된 원추화서 당 꽃의 수; 및 (iii) 증가된 천립 중량 (TKW)의 하나 이상을 포함하는 형질전환 식물을 생산하는 방법을 제공한다:
(i) NMPRT 폴리펩티드 코딩 핵산 또는 NMPRT 폴리펩티드 코딩 핵산을 포함하는 유전자 구축물을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
다른 구현예에서, 본 발명은 하기 단계를 포함하는 향상된 수확량 관련 형질, 특히, 예를 들어 증가된 뿌리/줄기 지수로 나타나는 증가된 뿌리 생물량을 갖는 형질전환 식물을 생산하는 방법을 제공한다:
(i) NMPRT 폴리펩티드 코딩 핵산 또는 NMPRT 폴리펩티드 코딩 핵산을 포함하는 유전자 구축물을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
상기 (i)의 핵산은 본 발명에서 정의된 NMPRT 폴리펩티드를 코딩할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 상기 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그의 부분 (종자 포함)을 포함한다. 식물 또는 그의 일부는 상기에 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산 외래유전자 (transgene)를 포함한다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 분리된 핵산을 함유하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 박테리아, 효모, 곰팡이 또는 식물 세포이다. 본 발명에 따른 방법에서 사용된 핵산 또는 벡터에 대한 숙주 식물, 발현 카세트 (cassette) 또는 구축물 또는 벡터는 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에, 특히 본 발명에 정의된 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 비리디플란태 (Viridiplantae) 수퍼패밀리에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다.
본 발명의 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 치커리, 당근, 카사바, 토끼풀 (trefoil), 대두, 비트 (beet), 사탕무, 해바라기, 캐놀라, 알팔파, 유채, 아마, 목화, 토마토, 감자 및 담배를 포함하나 이에 제한되지 않는다.
본 발명의 다른 구현예에 있어서, 상기 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다.
본 발명의 다른 구현예에 있어서, 상기 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 뿌리, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이에 제한되지는 않으며, 상기의 수확가능한 부분은 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 재조합 핵산을 포함한다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 상기 식물의 수확 가능한 부분으로부터 유래된, 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명은 또한 본 발명에 기재된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산의 용도, 및 식물에서 앞서 언급한 임의의 수확량 관련 형질을 향상시키는 상기 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드의 용도를 포함한다. 예를 들면, 본 발명에서 기재된 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산 또는 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드 그 자체는 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드 코딩 유전자에 유전적으로 연결될 수 있는 DNA 마커가 동정된 육종 프로그램에서 용도를 찾을 수 있다. 핵산/유전자, 또는 LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에서 사용될 수 있다. 게다가, LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드 코딩 핵산/유전자의 대립인자 변이체는 마커 보조 육종 프로그램에서 용도를 찾을 수 있다. LEJ1 폴리펩티드, 또는 ExbB 폴리펩티드, 또는 NMPRT 폴리펩티드를 코딩하는 핵산은 또한 이 유전자의 일부에 대한 유전자지도 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다.
본 발명에서 제공된 구현예는 명시적으로 언급하지 않는 한 조합될 수 있다는 것을 인지해야한다. 본 발명에서 사용된 표제는 단지 편의를 위해 제공되며, 본 출원을 한정하거나 이것의 해석에 어떤 식으로든 영향을 미치는 것을 의미하지 않는다.
AP2
-26-유사 폴리펩티드
놀랍게도, 이제 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절이 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다.
첫 번째 구현예에 따라, 본 발명은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다. 다른 구현예에 따라, 본 발명은 대조구 식물에 비하여 수확량 관련 형질이 향상된 식물을 생산하는 방법을 제공하며, 상기 방법은 본 발명에 기재된 AP2-26-유사 폴리펩티드 코딩 핵산의 상기 식물에서의 발현 조절 단계 및 임의로 향상된 수확량 관련 형질을 갖는 식물을 선발하는 단계를 포함한다.
AP2-26-유사 폴리펩티드를 코딩하는 핵산의 발현을 조절 (바람직하게는, 증가)하는 바람직한 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 AP2-26-유사 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 AP2-26-유사 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "AP2-26-유사 핵산" 또는 "AP2-26-유사 유전자"라고 칭한다.
본 발명에서 정의된 "AP2-26-유사 폴리펩티드"는 하나의 AP2 도메인 (PFam entry PF00847, 실시예 15 참고)을 포함하고 전사 인자 활성을 갖는 임의의 폴리펩티드를 의미한다. 바람직하게는 AP2-26-유사 폴리펩티드는 또한 하기 모티프의 하나 이상을 포함한다:
모티프 13 (서열번호 378):
KLYRGVRQRHWGKWVAEIRLP[RK]NRTRLWLGTFDTAE[ED]AAL[TA]YD[KQ]AA[YF][RK]LR
모티프 14 (서열번호 379):
[GHA][ELS][YRA][GKP]PL[DH][AS][SAT]VDAKL[QE]AIC[DQ][TSN][ILM]
모티프 15 (서열번호 380):
PS[YVWL]EIDW
본 발명에 사용된 용어 "AP2-26-유사" 또는 "AP2-26-유사 폴리펩티드"는 또한 하기에 정의된 "AP2-26-유사 폴리펩티드"의 상동체를 포함하는 의미이다.
모티프 13 내지 15는 MEME 알고리즘 (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994) 또는 도 16의 다중 정렬을 사용하여 찾아졌다. MEME 모티프 내의 각 위치에서, 잔기는 0.2보다 높은 빈도로 서열의 조회 (query) 세트에 존재하는 것을 나타낸다. 대괄호 (square bracket) 안의 잔기는 대체를 나타낸다.
더욱 바람직하게는, AP2-26-유사 폴리펩티드는 증가하는 순으로 선호되는 1개, 2개 또는 모든 3개 모티프를 포함한다.
부가적으로 또는 대안적으로, AP2-26-유사 단백질의 상동체는 상동체 단백질이 상기에 기술된 보존된 모티프의 임의의 하나 이상을 포함한다면, 서열번호 329로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다. 바람직하게는 AP2-26-유사 폴리펩티드의 모티프는 서열번호 378 내지 서열번호 380 (모티프 13 내지 15)으로 표시된 모티프의 임의의 하나 이상에 대해 증가하는 순으로 선호되는, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
즉, 다른 구현예에서 AP2-26-유사 폴리펩티드가 서열번호 329의 104번 아미노산부터 152번 아미노산까지의 보존된 도메인에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함하는 방법을 제공한다.
용어 "도메인", "시그너처" 및 "모티프"는 본 발명의 "정의" 섹션에 정의되어 있다.
바람직하게는, 도 17에 도시된 것과 같은 계통수의 구축에 사용되었을 때의 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에 클러스터링된다.
게다가, AP2-26-유사 폴리펩티드 (적어도 그들의 자연적인 형태에서)는 일반적으로 DNA 결합 활성을 갖는다. DNA 결합 활성을 측정하기 위한 도구 및 기술, 예를 들면 EMSA (electrophoretic mobility shift assay) 및 식물 프로모터 영역에 빈번하게 발생하는 모티프의 족적분석 (footprinting) 연구는 당업계에 잘 알려져 있다 (Gasser 2003, Plant Mol Biol. 53(3):281-95 and references therein; Nieto-Sotelo et al.1994 Plant Cell 6: 287-301; Zhang et al. 2003 Biochemistry 42: 6596-6607; Klosterman 2002 Plant Science 162, 855-866). 추가의 상세한 내용은 실시예 17에 제시되어 있다.
게다가, AP2-26-유사 폴리펩티드는 실시예 18 및 19에 기재된 본 발명의 방법에 따라 벼에서 발현되었을 때, 증가된 수확량 관련 형질, 특히 증가된 초기 활력 및/또는 증가된 수확 지수를 갖는 식물체를 제공한다.
본 발명은 서열번호 329의 폴리펩티드 서열을 코딩하는 서열번호 328로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 AP2-26-유사 코딩 핵산 또는 AP2-26-유사 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
AP2-26-유사 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 22에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 22에 제시된 아미노산 서열이 서열번호 329로 표시된 AP2-26-유사 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 328 또는 서열번호 329에서, 두 번째 BLAST (back-BLAST)는 벼 서열과 대조하는 것이다.
본 발명은 또한 대조구 식물에 비해 식물에서 향상된 수확량 관련 형질을 부여하는데 유용한 지금까지 알려지지 않은 AP2-26-유사 코딩 핵산 및 AP2-26-유사 폴리펩티드를 제공한다.
본 발명의 추가의 구현예에 따라, 따라서 본 발명은 하기로부터 선택되는 분리된 핵산 분자를 제공한다:
(i) 서열번호 352 및 338로 표시된 핵산;
(ii) 서열번호 352 및 338로 표시된 핵산의 상보체;
(iii) 서열번호 353 및 339로 표시된 아미노산 서열에 대해 증가하는 순으로 선호되는 적어도 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 AP2-26-유사 폴리펩티드 코딩 핵산, 및 부가적으로 또는 대안적으로 서열번호 378 내지 380에 제시된 모티프에 대해 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 하나 이상의 모티프를 포함하는 AP2-26-유사 폴리펩티드 코딩 핵산, 및 더 바람직하게는 대조구 식물에 비해 향상된 수확량 관련 형질을 부여하는 AP2-26-유사 폴리펩티드 코딩 핵산;
(iv) 높은 스트린전시 혼성화 조건 하에서 상기 (i) 내지 (iii)의 핵산 분자와 혼성화하는 핵산 분자 및 바람직하게는 대조구 식물에 비해 향상된 수확량 관련 형질을 부여하는 핵산 분자.
본 발명의 추가의 구현예에 따라, 본 발명은 또한 하기로부터 선택되는 분리된 폴리펩티드를 제공한다:
(i) 서열번호 353 및 339로 표시된 아미노산 서열;
(ii) 서열번호 353 및 339로 표시된 아미노산 서열에 대해 증가하는 순으로 선호되는 적어도 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 아미노산 서열, 및 부가적으로 또는 대안적으로 서열번호 378 내지 380에 제시된 모티프에 대해 증가하는 순으로 선호되는 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 하나 이상의 모티프를 포함하는 아미노산 서열, 및 더 바람직하게는 대조구 식물에 비해 향상된 수확량 관련 형질을 부여하는 아미노산 서열;
(iii) 상기 (i) 또는 (ii)에 제시된 임의의 아미노산 서열의 유도체.
핵산 변이체도 본 발명의 방법의 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 섹션의 표 22에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 코딩하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 섹션의 표 22에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 코딩하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다. 본 발명의 방법 수행에 유용한 추가의 변이체는 코돈 사용 빈도가 최적화된 또는 miRNA 표적 위치가 제거된 변이체이다.
본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 일부, AP2-26-유사 폴리펩티드를 코딩하는 핵산에 혼성화하는 핵산, AP2-26-유사 폴리펩티드를 코딩하는 핵산의 스플라이스 변이체, AP2-26-유사 폴리펩티드를 코딩하는 핵산의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 변이체를 포함한다. 용어 혼성화하는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재되어 있다.
본 발명의 방법의 수행은 전체 길이 핵산 서열의 사용에 의존하지 않으므로, AP2-26-유사 폴리펩티드를 코딩하는 핵산은 전체 길이의 핵산일 필요는 없다. 본 발명에서는, 실시예 섹션의 표 22에 제시된 핵산 서열 중 임의의 하나의 일부를 식물에 도입 및 발현, 또는 실시예 섹션의 표 22에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 일부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 코딩 (또는 비코딩) 서열에 융합될 수도 있다. 다른 코딩 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 AP2-26-유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 22에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 22에 제시된 핵산 중 임의의 하나의 일부분, 또는 실시예 섹션의 표 22에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 22에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 22에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 328의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 17에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에서 클러스터링되고/되거나, 임의의 모티프 13 내지 15를 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 서열번호 329에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열의 단편을 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건 하에서, 바람직하게는 스트린전트 조건 하에서, 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 섹션의 표 22에 제시된 핵산 중 임의의 하나와 혼성화가 가능한 핵산의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 22에 제시된 임의의 핵산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산과 혼성화가 가능한 핵산의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 22에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 22에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 22에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 328로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 도 17에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에서 클러스터링되고/되거나, 임의의 모티프 13 내지 15를 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 서열번호 329에 대해 적어도 80%의 서열 동일성을 갖는 아미노산 서열의 폴리펩티드를 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 AP2-26-유사 폴리펩티드를 코딩하는 스플라이스 변이체이며, 스플라이스 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 22에 제시된 핵산 서열 중 임의의 하나의 스플라이스 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 22에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 스플라이스 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
바람직한 스플라이스 변이체는 서열번호 328로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 329의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 도 17에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에서 클러스터링되고/되거나, 임의의 모티프 13 내지 15를 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 서열번호 329에 대해 적어도 80%의 서열 동일성을 갖는다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 22에 제시된 핵산의 임의의 하나의 대립인자 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 22에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 대립인자 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 329의 AP2-26-유사 폴리펩티드 및 실시예 섹션의 표 22에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 328의 대립인자 변이체 또는 서열번호 329의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 도 17에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에서 클러스터링되고/되거나, 임의의 모티프 12 내지 15를 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 서열번호 329에 대해 적어도 80%의 서열 동일성을 갖는다.
유전자 셔플링 또는 방향 진화는 또한 상기에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 22에 제시된 핵산 서열 중 임의의 하나의 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 22에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링으로 얻어진다.
바람직하게는, 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 도 17에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 329로 표시된 아미노산 서열을 포함하는 AP2-26-유사 폴리펩티드 그룹 내에서 클러스터링되고/되거나, 임의의 모티프 13 내지 15를 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 서열번호 329에 대해 적어도 80%의 서열 동일성을 갖는다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
AP2-26-유사 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 상기 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 AP2-26-유사 폴리펩티드 코딩 핵산은 식물로부터, 더 바람직하게는 단자엽 식물로부터, 더욱 바람직하게는 벼과 (family Poaceae)로부터, 가장 바람직하게는 핵산은 벼 (Oryza sativa)로부터 유래한다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히, 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 초기 활력 및 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하게 기재되어 있다.
본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (i) 지상부 및 바람직하게는 수확 가능한 지상부 및/또는 (ii) 지하부 및 바람직하게는 수확 가능한 지하부를 포함하여 초기 활력 및/또는 하나 이상의 식물체의 일부분의 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
본 발명은 대조구 식물에 비하여 수확량 관련 형질, 특히 식물의 초기 활력 및 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키기 위한 방법을 제공하며, 상기 방법은 본 발명에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현의 조절을 포함한다.
본 발명의 방법의 수행은 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 양분 결핍 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 염분 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 염분 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 가뭄 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 가뭄 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명은 또한 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산;
(b) (a)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, AP2-26-유사 폴리펩티드를 코딩하는 핵산은 상기에 정의된 바와 같다. 용어 "조절 서열" 및 "종결 서열"은 본 발명에서 정의된 바와 같다.
본 발명은 또한 상기에 기재된 구축물로 형질전환된 식물체를 제공한다. 특히, 본 발명은 상기에 기재된 구축물로 형질전환된 식물체를 제공하며, 상기 식물체는 본 발명에서 기재된 것처럼 증가된 수확량 관련 형질을 갖는다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동 가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 유도하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 뿌리 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 또한 항시성 (constitutive) 프로모터가 본 발명의 방법에 유용하다. 바람직하게는 항시성 프로모터는 중간 강도의 편재하는 (ubiquitous) 항시성 프로모터이다. 본 발명의 "정의" 섹션에서 다양한 프로모터 유형의 정의에 대해 참고한다.
본 발명의 적용은 서열번호 328로 표시된 AP2-26-유사 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 뿌리 특이적 프로모터 또는 항시성 프로모터에 의해 유도될 때 AP2-26-유사 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
상기 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터 (Plant Mol Biol. 1995 Jan; 27(2):237-48) 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터이며, 더 바람직하게는 RCc3 프로모터는 벼 유래이며, 더욱 바람직하게는 RCc3 프로모터는 서열번호 382에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 382로 표시된다. 본 발명의 방법 수행에 사용될 수 있는 다른 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 3에 제시되어 있다.
본 발명의 다른 바람직한 특징에 따라, AP2-26-유사 폴리펩티드를 코딩하는 핵산은 항시성 프로모터에 작동 가능하게 연결된다. 상기 항시성 프로모터는 바람직하게는 중간 강도의 프로모터이다. 더 바람직하게는 상기 프로모터는 GOS2 프로모터와 같은 식물 유래 프로모터, 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터와 같은 식물 유래 프로모터, 더욱 바람직하게는 프로모터는 벼 유래의 GOS2 프로모터이다. 더 바람직하게는 항시성 프로모터는 서열번호 381에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 항시성 프로모터는 서열번호 381로 표시된다. 본 발명의 "정의" 섹션에서 항시성 프로모터의 추가의 예에 대해 참고한다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 상기 구축물은 AP2-26-유사 폴리펩티드 코딩 핵산에 작동 가능하게 연결된 서열번호 382 또는 서열번호 381에 대해 실질적으로 유사한 RCc3 또는 GOS2 프로모터를 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 상기 RCc3 프로모터에 작동 가능하게 연결된 AP2-26-유사 폴리펩티드 코딩 핵산을 포함하는 발현 카세트는 서열번호 382로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, AP2-26-유사 폴리펩티드를 코딩하는 핵산의 발현을 조절하는 바람직한 방법은 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다; 그러나 상기 방법의 수행 효과 즉, 수확량 관련 형질을 향상시키는 효과는 T-DNA 활성화 태깅, 틸링 (TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행해질 수도 있으나, 이에 제한되지 않는다. 상기 기술의 설명은 정의 섹션에 기재되어 있다.
본 발명은 또한 상기에서 정의된 AP2-26-유사 폴리펩티드를 코딩하는 임의의 핵산의 식물로의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 하기 단계를 포함하는 향상된 수확량 관련 형질, 특히 증가된 종자 수확량 및/또는 초기 활력을 갖는 형질전환 식물을 생산하는 방법을 제공한다:
(i) AP2-26-유사 폴리펩티드 코딩 핵산 또는 AP2-26-유사 폴리펩티드 코딩 핵산을 포함하는 유전자 구축물을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포의 배양은 재분화 및/또는 성숙기까지의 생장을 포함하거나 포함하지 않을 수 있다.
상기 (i)의 핵산은 본 발명에서 정의된 AP2-26-유사 폴리펩티드를 코딩할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 상기 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그의 부분 (종자 포함)을 포함한다. 식물 또는 그의 일부는 상기에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산 외래유전자 (transgene)를 포함한다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 분리된 핵산을 함유하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 박테리아, 효모, 곰팡이 또는 식물 세포이다. 본 발명에 따른 방법에서 사용된 핵산 또는 벡터에 대한 숙주 식물, 발현 카세트 (cassette) 또는 구축물 또는 벡터는 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에, 특히 본 발명에 정의된 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 비리디플란태 (Viridiplantae) 수퍼패밀리에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다.
본 발명의 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 치커리, 당근, 카사바, 토끼풀 (trefoil), 대두, 비트 (beet), 사탕무, 해바라기, 캐놀라, 알팔파, 유채, 아마, 목화, 토마토, 감자 및 담배를 포함하나 이에 제한되지 않는다.
본 발명의 다른 구현예에 있어서, 상기 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다.
본 발명의 다른 구현예에 있어서, 상기 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 뿌리, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이에 제한되지는 않으며, 상기의 수확가능한 부분은 AP2-26-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함한다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 상기 식물의 수확 가능한 부분으로부터 유래된, 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명은 또한 본 발명에 기재된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 용도, 및 식물에서 앞서 언급한 임의의 수확량 관련 형질을 향상시키는 상기 AP2-26-유사 폴리펩티드의 용도를 포함한다. 예를 들면, 본 발명에서 기재된 AP2-26-유사 폴리펩티드를 코딩하는 핵산 또는 AP2-26-유사 폴리펩티드 그 자체는 AP2-26-유사 폴리펩티드 코딩 유전자에 유전적으로 연결될 수 있는 DNA 마커가 동정된 육종 프로그램에서 용도를 찾을 수 있다. 핵산/유전자, 또는 AP2-26-유사 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에서 사용될 수 있다. 게다가, AP2-26-유사 폴리펩티드 코딩 핵산/유전자의 대립인자 변이체는 마커 보조 육종 프로그램에서 용도를 찾을 수 있다. AP2-26-유사 폴리펩티드를 코딩하는 핵산은 또한 이 유전자의 일부에 대한 유전자지도 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다.
HD8
-유사 폴리펩티드
다른 구현예에서, 이제 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절이 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 식물을 제공한다는 것이 밝혀졌다.
첫 번째 구현예에 따라, 본 발명은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절 및 임의로 향상된 수확량 관련 형질을 갖는 식물의 선발을 포함하는 대조구 식물에 비하여 식물에서 수확량 관련 형질을 향상시키는 방법을 제공한다. 다른 구현예에 따라, 본 발명은 대조구 식물에 비하여 수확량 관련 형질이 향상된 식물을 생산하는 방법을 제공하며, 상기 방법은 본 발명에 기재된 HD8-유사 폴리펩티드 코딩 핵산의 상기 식물에서의 발현 조절 단계 및 임의로 향상된 수확량 관련 형질을 갖는 식물을 선발하는 단계를 포함한다.
HD8-유사 폴리펩티드를 코딩하는 핵산의 발현을 조절 (바람직하게는, 증가)하는 바람직한 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다.
이후 "본 발명의 방법에 유용한 단백질"은 본 발명에 정의된 HD8-유사 폴리펩티드를 의미한다. 이후 "본 발명의 방법에 유용한 핵산"은 상기 HD8-유사 폴리펩티드를 코딩하는 것이 가능한 핵산을 의미한다. 식물에 도입되는 핵산 (따라서 본 발명의 방법 수행에 유용한)은 하기에 기재될 유형의 단백질을 코딩하는 임의의 핵산이며, 이후 또한 "HD8-유사 핵산" 또는 "HD8-유사 유전자"라고 칭한다.
본 발명에서 정의된 "HD8-유사 폴리펩티드"는 HD-ZIP 전사 인자 서브패밀리 IV에 속하고, 호메오박스 (Homeobox) 도메인 (Pfam PF00046) 및 START 도메인 (PF01852)을 포함하는 임의의 단백질을 의미하며, 또한 실시예 26을 참고한다.
바람직하게는, HD8-유사 폴리펩티드는 하기 모티프의 하나 이상을 포함한다:
모티프 16 (서열번호 562):
[EAP][TR]Q[IV]K[YF]WFQN[CR]R[ST][KQ][MI]K[KVA][FRQ][QKSH][ENCD][RNG][AETH][DE][RN][SKNC][LAKI][LY][RQK][KRA][QE]N[EAD][EK][LI][RLK][KAC][TE]N[AMI][AER][LI][RKQ][NE][RQA][LMI][KR][NGK][VSMA][TI]C
모티프 17 (서열번호 563):
[KPR][RK]RY[QH][LR][LH]T[MPA][QR]Q[KI][EQ][ETQR][LM][NE][RAS][LAYM][FD][QLK][ESA][CS][PF][NPH][FP][LD][ERLD][KNL][DLQ]
모티프 18 (서열번호 564):
[DN]G[CRNHY][CS][QRK][ILMV][YVIT][AW][VLIM][DEV]
본 발명에 사용된 용어 "HD8-유사" 또는 "HD8-유사 폴리펩티드"는 또한 하기에 정의된 "HD8-유사 폴리펩티드"의 상동체를 포함하는 의미이다.
모티프 16, 17 및 18은 MEME 알고리즘 (Bailey and Elkan, Proceedings of the Second International Conference on Intelligent Systems for Molecular Biology, pp. 28-36, AAAI Press, Menlo Park, California, 1994)을 사용하여 찾아졌다. MEME 모티프 내의 각 위치에서, 잔기는 0.2보다 높은 빈도로 서열의 조회 (query) 세트에 존재하는 것을 나타낸다. 대괄호 (square bracket) 안의 잔기는 대체를 나타낸다.
더욱 바람직하게는, HD8-유사 폴리펩티드는 증가하는 순으로 선호되는 적어도 1개, 적어도 2개 또는 모든 3개 모티프를 포함한다.
부가적으로 또는 대안적으로, HD8-유사 단백질의 상동체는 상동체 단백질이 상기에 기술된 보존된 모티프의 임의의 하나 이상을 포함한다면, 서열번호 385로 표시된 아미노산에 대해, 증가하는 순으로 선호되는 적어도 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 전체 서열 동일성을 갖는다. 전체의 서열 동일성은 바람직하게는 디폴트 매개 변수 및 성숙 단백질 서열을 이용하여 (즉, 분비 신호 또는 수송 펩티드를 고려하지 않고), GAP 프로그램 (GCG Wisconsin Package, Accelrys)의 Needleman Wunsch 알고리즘과 같은, 전체적인 정렬 알고리즘을 이용하여 결정한다. 전체적인 서열 동일성에 비해, 서열 동일성은 일반적으로 보존된 도메인 또는 모티프만 고려되었을 때 더 높을 것이다. 바람직하게는 HD8-유사 폴리펩티드의 모티프는 서열번호 562 내지 서열번호 564 (모티프 16 내지 18)으로 표시된 모티프의 임의의 하나 이상에 대해 증가하는 순으로 선호되는, 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99%의 서열 동일성을 갖는다.
즉, 다른 구현예에서 HD8-유사 폴리펩티드가 서열번호 385의 265번 아미노산부터 500번 아미노산까지의 보존된 도메인에 대해 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함하는 방법을 제공한다.
용어 "도메인", "시그너처" 및 "모티프"는 본 발명의 "정의" 섹션에 정의되어 있다.
바람직하게는, 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수의 구축에 사용되었을 때의 폴리펩티드 서열은 임의의 다른 그룹보다 서열번호 385 (Os08g19590로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에 클러스터링된다.
게다가, HD8-유사 폴리펩티드 (적어도 그들의 자연적인 형태에서)는 일반적으로 DNA 결합 활성을 갖는다. 겔 지체 분석 (gel retardation assay)과 같은 DNA 결합 활성을 측정하기 위한 도구 및 기술은 당업계에 잘 알려져 있다 (예를 들어 Sessa et al., EMBO J. 12(9): 3507-3517,1993 참고). 추가의 상세한 내용은 실시예 28에 제시되어 있다.
게다가, HD8-유사 폴리펩티드는 실시예 29 및 30에 기재된 본 발명의 방법에 따라 벼에서 발현되었을 때, 총 종자 중량, 종자 충전율, 수확 지수 및/또는 충전된 종자의 수를 포함하는 증가된 수확량 관련 형질을 갖는 식물체를 제공한다.
본 발명은 서열번호 385의 폴리펩티드 서열을 코딩하는 서열번호 384로 표시된 핵산 서열로 식물체를 형질전환함으로써 예시된다. 그러나, 본 발명의 수행은 상기 서열에 제한되지 않으며; 본 발명의 방법은 본 발명에서 정의된 임의의 HD8-유사 코딩 핵산 또는 HD8-유사 폴리펩티드를 사용하여 유리하게 수행될 수 있다.
HD8-유사 폴리펩티드를 코딩하는 핵산의 예는 본 발명의 실시예 섹션의 표 26에 제시되어 있다. 상기 핵산은 본 발명의 방법의 수행에 유용하다. 실시예 섹션의 표 26에 제시된 아미노산 서열이 서열번호 385로 표시된 HD8-유사 폴리펩티드의 오쏘로그 및 패럴로그 서열의 예이며, 용어 "오쏘로그" 및 "패럴로그"는 본 발명에 정의되어 있다. 추가의 오쏘로그 및 패럴로그는 정의 섹션에 기재된 소위 상호간 블라스트 (reciprocal blast) 탐색을 수행하면 용이하게 동정될 수 있으며; 조회 서열은 서열번호 384 또는 서열번호 385에서, 두 번째 BLAST (back-BLAST)는 벼 서열과 대조하는 것이다.
본 발명은 또한 대조구 식물에 비해 식물에서 향상된 수확량 관련 형질을 부여하는데 유용한 지금까지 알려지지 않은 HD8-유사 코딩 핵산 및 HD8-유사 폴리펩티드를 제공한다.
핵산 변이체도 본 발명의 방법의 수행에 유용할 수 있다. 상기 핵산 변이체의 예는 본 발명의 실시예 섹션의 표 26에 제시된 아미노산 서열 중 임의의 하나의 상동체 및 유도체를 코딩하는 핵산을 포함하며, 용어 "상동체" 및 "유도체"는 본 발명에 정의되어 있다. 본 발명의 방법에는 실시예 섹션의 표 26에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그의 상동체 및 유도체를 코딩하는 핵산도 유용하다. 본 발명의 방법에 유용한 상동체 및 유도체는 상기 상동체 및 유도체가 유래된 변형되지 않은 단백질과 실질적으로 동일한 생물학적 및 기능적 활성을 가진다. 본 발명의 방법 수행에 유용한 추가의 변이체는 코돈 사용 빈도가 최적화된 또는 miRNA 표적 위치가 제거된 변이체이다.
본 발명의 방법의 수행에 유용한 또 다른 핵산 변이체는 HD8-유사 폴리펩티드를 코딩하는 핵산의 일부, HD8-유사 폴리펩티드를 코딩하는 핵산에 혼성화하는 핵산, HD8-유사 폴리펩티드를 코딩하는 핵산의 스플라이스 변이체, HD8-유사 폴리펩티드를 코딩하는 핵산의 대립인자 변이체, 및 유전자 셔플링에 의해 얻은 HD8-유사 폴리펩티드를 코딩하는 핵산의 변이체를 포함한다. 용어 혼성화하는 서열, 스플라이스 변이체, 대립인자 변이체 및 유전자 셔플링은 본 발명에 기재되어 있다.
본 발명의 방법의 수행은 전체 길이 핵산 서열의 사용에 의존하지 않으므로, HD8-유사 폴리펩티드를 코딩하는 핵산은 전체 길이의 핵산일 필요는 없다. 본 발명에서는, 실시예 섹션의 표 26에 제시된 핵산 서열 중 임의의 하나의 일부를 식물에 도입 및 발현, 또는 실시예 섹션의 표 26에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산의 일부를 식물에 도입 및 발현하는 것을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
핵산의 일부분은 예를 들면, 핵산에 하나 이상의 결실을 만들어서 제조될 수 있다. 그 일부분은 분리된 형태로 사용될 수 있거나, 또는 예를 들면, 몇 가지 활성을 조합한 단백질을 생산하기 위하여 다른 코딩 (또는 비코딩) 서열에 융합될 수도 있다. 다른 코딩 서열에 융합될 경우, 해독으로 생성된 결과적인 폴리펩티드는 단백질 부분에 대해 예측된 것보다 클 것이다.
본 발명의 방법에 유용한 일부분은, 본 발명에 정의된 HD8-유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 26에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 일부분은 실시예 섹션의 표 26에 제시된 핵산 중 임의의 하나의 일부분, 또는 실시예 섹션의 표 26에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 일부분이다. 바람직하게는 상기 일부분은 적어도 길이 500, 550, 600, 650, 700, 750, 800, 850, 900, 950, 1000, 1050, 1100, 1150, 1200, 1250, 1300, 1350, 1400, 1450, 1500, 1550, 1600, 1650, 1700, 1750, 1800, 1850, 1900, 1950, 2000, 2050, 2100, 2150, 2200, 2250, 2300, 2350, 2400, 2450, 2500개의 연속적인 뉴클레오티드이며, 상기 연속적인 뉴클레오티드는 실시예 섹션의 표 26에 제시된 핵산 서열 중 임의의 하나, 또는 실시예 섹션의 표 26에 제시된 아미노산 서열 중 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산일 수 있다. 가장 바람직하게는, 상기 일부분은 서열번호 384의 핵산의 일부분이다. 바람직하게는, 상기 일부분은 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 385 (Os08g19590으로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에서 클러스터링되고/되거나, 모티프 16 내지 18 중 임의의 하나 이상을 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 바람직하게는 서열번호 385에 대해 적어도 20%의 서열 동일성을 갖는 아미노산 서열의 단편을 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 감소된 스트린전시 조건 하에서, 바람직하게는 스트린전트 조건 하에서, 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산, 또는 본 발명에서 정의된 일부와 혼성화가 가능한 핵산이다.
본 발명에 따라, 실시예 섹션의 표 26에 제시된 핵산 중 임의의 하나와 혼성화가 가능한 핵산의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 26에 제시된 임의의 핵산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산과 혼성화가 가능한 핵산의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 혼성화 서열은 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩하며, 실시예 섹션의 표 26에 제시된 아미노산 서열과 실질적으로 동일한 생물학적 활성을 가진다. 바람직하게는, 상기 혼성화 서열은 실시예 섹션의 표 26에 제시된 핵산 중의 임의의 하나의 상보적인 가닥에 또는 상기 정의된 일부인 임의의 이들 서열 중 일부에, 또는 실시예 섹션의 표 26에 제시된 아미노산 서열 중의 임의의 하나의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 상보적인 가닥에 혼성화가 가능하다. 가장 바람직하게는, 상기 혼성화 서열은 서열번호 384로 표시된 핵산의 상보적인 가닥에 또는 그 일부에 혼성화가 가능하다.
바람직하게는, 상기 혼성화 서열은 전체 길이 및 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수의 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 385 (Os08g19590으로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에서 클러스터링되고/되거나, 모티프 16 내지 18 중 임의의 하나 이상을 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 바람직하게는 서열번호 385에 대해 적어도 20%의 서열 동일성을 갖는 아미노산 서열의 폴리펩티드를 코딩한다.
본 발명의 방법에 유용한 또 다른 핵산 변이체는 상기 정의된 HD8-유사 폴리펩티드를 코딩하는 스플라이스 변이체이며, 스플라이스 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 26에 제시된 핵산 서열 중 임의의 하나의 스플라이스 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 26에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 스플라이스 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
바람직한 스플라이스 변이체는 서열번호 384로 표시된 핵산의 스플라이스 변이체, 또는 서열번호 385의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 핵산의 스플라이스 변이체이다. 바람직하게는, 상기 스플라이스 변이체에 의해 코딩된 아미노산 서열은 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 385 (Os08g19590으로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에서 클러스터링되고/되거나, 모티프 16 내지 18 중 임의의 하나 이상을 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 바람직하게는 서열번호 385에 대해 적어도 20%의 서열 동일성을 갖는다.
본 발명의 방법 수행에 유용한 또 다른 핵산 변이체는 상기 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 대립인자 변이체이며, 대립인자 변이체는 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 26에 제시된 핵산의 임의의 하나의 대립인자 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 26에 제시된 임의의 아미노산 서열의 오쏘로그 (orthologue), 패럴로그 (paralogue) 또는 상동체를 코딩하는 핵산의 대립인자 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공한다.
본 발명의 방법에 유용한 대립인자 변이체에 의해 코딩된 폴리펩티드는 서열번호 385의 HD8-유사 폴리펩티드 및 실시예 섹션의 표 26에 도시된 임의의 아미노산과 실질적으로 동일한 생물학적 활성을 가진다. 대립인자 변이체는 자연계에 존재하며, 본 발명의 방법은 상기의 자연적인 대립인자의 사용을 포함한다. 바람직하게는, 대립인자 변이체는 서열번호 384의 대립인자 변이체 또는 서열번호 385의 오쏘로그 또는 패럴로그를 코딩하는 핵산의 대립인자 변이체이다. 바람직하게는, 상기 대립인자 변이체에 의해 코딩된 아미노산 서열은 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 385 (Os08g19590으로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에서 클러스터링되고/되거나, 모티프 16 내지 18 중 임의의 하나 이상을 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 바람직하게는 서열번호 385에 대해 적어도 20%의 서열 동일성을 갖는다.
유전자 셔플링 또는 방향 진화는 또한 상기에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 변이체 생성에 사용될 수 있으며, 용어 "유전자 셔플링"은 본 발명에 정의되어 있다.
본 발명에 따라, 실시예 섹션의 표 26에 제시된 핵산 서열 중 임의의 하나의 변이체의 식물로의 도입 및 발현, 또는 실시예 섹션의 표 26에 제시된 임의의 아미노산 서열의 오쏘로그, 패럴로그 또는 상동체를 코딩하는 핵산 변이체의 식물로의 도입 및 발현을 포함하는, 식물의 수확량 관련 형질을 향상시키는 방법을 제공하며, 상기 변이체 핵산은 유전자 셔플링으로 얻어진다.
바람직하게는 유전자 셔플링으로 얻어진 변이체 핵산에 의해 코딩된 아미노산 서열은 도 17 (Jain et al., FEBS Journal 275, 2845-2861, 2008)에 도시된 것과 같은 계통수 구축에 사용되었을 때, 임의의 다른 그룹보다 서열번호 385 (Os08g19590으로 표시)로 표시된 아미노산 서열을 포함하는 HD-ZIP 폴리펩티드의 서브패밀리 IV 내에서 클러스터링되고/되거나, 모티프 16 내지 18 중 임의의 하나 이상을 포함하고/하거나, DNA 결합 활성을 갖고/갖거나, 바람직하게는 서열번호 385에 대해 적어도 20%의 서열 동일성을 갖는다.
더욱이, 핵산 변이체는 또한 자리지정 돌연변이유발에 의해서도 얻을 수 있다. 몇 가지 방법이 자리지정 돌연변이를 유발하는데 유용하며, 가장 흔한 것은 PCR에 근거한 방법이다 (Current Protocols in Molecular Biology. Wiley Eds).
HD8-유사 폴리펩티드를 코딩하는 핵산은 임의의 자연적 또는 인공적인 출처로부터 유래될 수 있다. 상기 핵산은 고의적인 인간의 조작으로 조성 및/또는 게놈 환경에 있어서 자연형태로부터 변형될 수 있다. 바람직하게는 HD8-유사 폴리펩티드 코딩 핵산은 식물로부터, 더 바람직하게는 단자엽 식물로부터, 더욱 바람직하게는 벼과 (family Poaceae)로부터, 가장 바람직하게는 핵산은 벼 (Oryza sativa)로부터 유래한다.
본 발명의 방법의 수행은 향상된 수확량 관련 형질을 갖는 식물을 제공한다. 특히, 본 발명의 방법의 수행은 대조구 식물에 비하여 증가된 수확량, 특히 증가된 종자 수확량을 갖는 식물을 제공한다. 용어 "수확량" 및 "종자 수확량"은 본 발명의 "정의" 섹션에 보다 상세하게 기재되어 있다.
본 발명에서 향상된 수확량 관련 형질에 대한 기준은 (i) 지상부 및 바람직하게는 수확 가능한 지상부 및/또는 (ii) 지하부 및 바람직하게는 수확 가능한 지하부를 포함하여 초기 활력 및/또는 하나 이상의 식물체의 일부분의 생물량 (중량)의 증가를 의미한다. 특히, 상기 수확 가능한 부분은 종자이며, 본 발명의 방법의 수행으로 대조구 식물의 종자 수확량에 비해 증가된 종자 수확량을 갖는 식물이 된다.
본 발명은 대조구 식물에 비하여 수확량, 특히 식물의 종자 수확량을 증가시키는 방법을 제공하는데, 상기 방법은 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 바람직한 특징에 따라, 본 발명의 방법의 수행으로 대조구 식물에 비해 생장 속도가 증가된 식물을 제공한다. 따라서, 본 발명에 따라 식물의 생장 속도를 증가시키기 위한 방법을 제공하며, 상기 방법은 본 발명에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현의 조절을 포함한다.
본 발명의 방법의 수행은 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 스트레스가 없는 조건 또는 순한 가뭄 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 양분결핍 조건 하에서, 특히 질소 결핍 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 양분 결핍 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 염분 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 염분 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명의 방법의 수행은 가뭄 스트레스 조건 하에서 자란 식물이 동등한 조건 하에서 자란 대조구 식물에 비하여 증가된 수확량을 제공한다. 따라서, 본 발명에 따라, 가뭄 스트레스 조건 하에서 자란 식물의 수확량을 증가시키기 위한 방법을 제공하며, 상기 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함한다.
본 발명은 또한 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및/또는 발현을 용이하게 하는 유전자 구축물 및 벡터를 제공한다. 유전자 구축물은 상업적으로 유용하고, 식물의 형질전환에 적절하며, 형질전환된 세포에서 목적 유전자의 발현에 적절한 벡터에 삽입될 수 있다. 본 발명은 또한 본 발명의 방법에 있어 상기 정의된 유전자 구축물의 용도를 제공한다.
더욱 구체적으로, 본 발명은 하기를 포함하는 구축물을 제공한다:
(a) 상기 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산;
(b) (a)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(c) 전사 종결 서열.
바람직하게는, HD8-유사 폴리펩티드를 코딩하는 핵산은 상기에 정의된 바와 같다. 용어 "조절 서열" 및 "종결 서열"은 본 발명에서 정의된 바와 같다.
본 발명은 또한 상기에 기재된 구축물로 형질전환된 식물체를 제공한다. 특히, 본 발명은 상기에 기재된 구축물로 형질전환된 식물체를 제공하며, 상기 식물체는 본 발명에서 기재된 것처럼 증가된 수확량 관련 형질을 갖는다.
식물은 상기 기재된 임의의 핵산을 포함하는 벡터로 형질전환된다. 당업자는 목적 서열을 함유하는 숙주 세포를 성공적으로 형질전환, 선발 및 증식시키기 위하여 벡터 내에 존재해야 하는 유전적 요소를 주지하고 있다. 목적 서열은 하나 이상의 조절 서열 (적어도 프로모터)에 작동 가능하게 연결된다.
유리하게, 자연적이든 인공적이든 임의의 유형의 프로모터가 핵산 서열의 발현을 유도하기 위하여 사용될 수 있으나, 바람직하게는 프로모터는 식물 유래이다. 뿌리 특이적 프로모터가 본 발명의 방법에 특히 유용하다. 본 발명의 "정의" 섹션에서 다양한 프로모터 유형의 정의에 대해 참고한다.
본 발명의 적용은 서열번호 384로 표시된 HD8-유사 폴리펩티드 코딩 핵산에 제한되지 않으며, 본 발명의 적용은 뿌리 특이적 프로모터에 의해 유도될 때 HD8-유사 폴리펩티드 코딩 핵산의 발현에 제한되지 않는다는 것은 명백하다.
상기 뿌리 특이적 프로모터는 바람직하게는 RCc3 프로모터 (Plant Mol Biol. 1995 Jan; 27(2):237-48) 또는 실질적으로 동일한 강도 및 실질적으로 동일한 발현 양상 (기능적으로 동등한 프로모터)을 갖는 프로모터이며, 더 바람직하게는 RCc3 프로모터는 벼 유래이며, 더욱 바람직하게는 RCc3 프로모터는 서열번호 565에 대해 실질적으로 유사한 핵산 서열로 표시되며, 가장 바람직하게는 상기 프로모터는 서열번호 565로 표시된다. 본 발명의 방법 수행에 사용될 수 있는 다른 뿌리 특이적 프로모터의 예는 상기 "정의" 섹션의 표 3에 제시되어 있다.
선택적으로, 하나 이상의 종결 서열이 식물에 도입된 구축물에 사용될 수 있다. 바람직하게는, 상기 구축물은 HD8-유사 폴리펩티드를 코딩하는 핵산에 작동 가능하게 연결된, 서열번호 565와 실질적으로 유사한 RCc3 프로모터를 포함하는 발현 카세트를 포함한다. 더 바람직하게는, 상기 구축물은 HAB1 코딩 서열의 3'말단에 연결된 제인 종결신호 (t-zein)을 포함한다. 가장 바람직하게는 상기 발현 카세트는 서열번호 566 (pRCc3::HD8-like::t-zein 서열)으로 표시된 서열을 포함한다. 게다가, 선발 마커를 코딩하는 하나 이상의 서열이 식물에 도입된 구축물에 존재할 수 있다.
본 발명의 바람직한 특징에 따라, 조절된 발현은 증가된 발현이다. 핵산 또는 유전자, 또는 유전자 산물의 발현을 증가시키는 방법은 당업계에 잘 문서화되어있으며, 정의 섹션에 예가 제시되어 있다.
상기 언급된 바와 같이, HD8-유사 폴리펩티드를 코딩하는 핵산의 발현을 조절하는 바람직한 방법은 HD8-유사 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현이다; 그러나 상기 방법의 수행 효과 즉, 수확량 관련 형질을 향상시키는 효과는 T-DNA 활성화 태깅, 틸링 (TILLING), 상동 재조합을 포함하여 다른 잘 알려진 기술을 사용하여 행해질 수도 있으나, 이에 제한되지 않는다. 상기 기술의 설명은 정의 섹션에 기재되어 있다.
본 발명은 또한 상기에서 정의된 HD8-유사 폴리펩티드를 코딩하는 임의의 핵산의 식물로의 도입 및 발현을 포함하는, 대조구 식물에 비해 향상된 수확량 관련 형질을 갖는 형질전환 식물을 생산하는 방법을 제공한다.
더욱 상세하게, 본 발명은 하기 단계를 포함하는 향상된 수확량 관련 형질, 특히 증가된 종자 수확량을 갖는 형질전환 식물을 생산하는 방법을 제공한다:
(i) HD8-유사 폴리펩티드 코딩 핵산 또는 HD8-유사 폴리펩티드 코딩 핵산을 포함하는 유전자 구축물을 식물 또는 식물 세포로 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포의 배양은 재분화 및/또는 성숙기까지의 생장을 포함하거나 포함하지 않을 수 있다.
상기 (i)의 핵산은 본 발명에서 정의된 HD8-유사 폴리펩티드를 코딩할 수 있는 임의의 핵산일 수 있다.
상기 핵산은 식물 세포로 또는 식물체 자체 (조직, 기관, 또는 식물체의 임의의 다른 부분으로 도입 포함)로 직접적으로 도입될 수 있다. 본 발명의 바람직한 특징에 따르면, 상기 핵산은 바람직하게는 형질전환에 의하여 식물체 내로 도입된다. 용어 "형질전환"은 본 발명의 "정의" 섹션에 보다 더 상세하게 기재되어 있다.
본 발명은 분명히 본 발명에서 기재된 임의의 방법으로 생산된 임의의 식물 세포 또는 식물 및 모든 식물 부분 및 그의 번식체로 확장된다. 본 발명은 본 발명에 따른 방법으로 얻을 수 있는 식물 또는 그의 부분 (종자 포함)을 포함한다. 식물 또는 그의 일부는 상기에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산 외래유전자 (transgene)를 포함한다. 본 발명은 상기 언급한 임의의 방법으로 생산된 일차 형질전환된 또는 감염된 세포, 조직, 기관 또는 전체식물의 자손을 포함하기 위해 더 확장될 수 있으며, 자손이 본 발명에 따른 방법으로 양친이 생산한 것과 동일한 유전형적 및/또는 표현형적 특징(들)을 나타내는 것만이 요구된다.
본 발명은 또한 상기에 정의된 HD8-유사 폴리펩티드를 코딩하는 분리된 핵산을 함유하는 숙주 세포를 포함한다. 본 발명에 따른 바람직한 숙주 세포는 박테리아, 효모, 곰팡이 또는 식물 세포이다. 본 발명에 따른 방법에서 사용된 핵산 또는 벡터에 대한 숙주 식물, 발현 카세트 (cassette) 또는 구축물 또는 벡터는 원칙적으로 유리하게, 본 발명의 방법에 사용된 폴리펩티드를 합성하는 것이 가능한 모든 식물이다.
본 발명의 방법은 유리하게 임의의 식물에, 특히 본 발명에 정의된 임의의 식물에 적용될 수 있다. 본 발명의 방법에 특히 유용한 식물은 비리디플란태 (Viridiplantae) 수퍼패밀리에 속하는 모든 식물, 특히 사료 또는 마초용 콩, 관상 식물, 식량 작물, 교목 또는 관목을 포함하는 단자엽 및 쌍자엽 식물을 포함한다.
본 발명의 구현예에 있어서, 식물은 작물이다. 작물 식물의 예는 치커리, 당근, 카사바, 토끼풀 (trefoil), 대두, 비트 (beet), 사탕무, 해바라기, 캐놀라, 알팔파, 유채, 아마, 목화, 토마토, 감자 및 담배를 포함하나 이에 제한되지 않는다.
본 발명의 다른 구현예에 있어서, 상기 식물은 단자엽 식물이다. 단자엽 식물의 예는 사탕수수를 포함한다.
본 발명의 다른 구현예에 있어서, 상기 식물은 곡물이다. 곡물의 예는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 및 귀리를 포함한다.
본 발명은 또한 종자, 잎, 열매, 꽃, 줄기, 뿌리, 지하경, 괴경 및 인경 같은 식물의 수확가능한 부분에까지 확장되나, 이에 제한되지는 않으며, 상기의 수확가능한 부분은 HD8-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함한다. 본 발명은 더욱이 건조 펠렛 또는 분말, 기름, 지방 및 지방산, 전분 또는 단백질 같은 상기 식물의 수확 가능한 부분으로부터 유래된, 바람직하게는 직접적으로 유래된 생산물에 관련된다.
본 발명은 또한 본 발명에 기재된 HD8-유사 폴리펩티드를 코딩하는 핵산의 용도, 및 식물에서 앞서 언급한 임의의 수확량 관련 형질을 향상시키는 상기 HD8-유사 폴리펩티드의 용도를 포함한다. 예를 들면, 본 발명에서 기재된 HD8-유사 폴리펩티드를 코딩하는 핵산 또는 HD8-유사 폴리펩티드 그 자체는 HD8-유사 폴리펩티드 코딩 유전자에 유전적으로 연결될 수 있는 DNA 마커가 동정된 육종 프로그램에서 용도를 찾을 수 있다. 핵산/유전자, 또는 HD8-유사 폴리펩티드 그 자체는 분자 마커를 정의하는데 사용될 수 있다. 이 DNA 또는 단백질 마커는 상기 본 발명의 방법에 정의된 향상된 수확량 관련 형질을 갖는 식물을 선발하는 육종 프로그램에서 사용될 수 있다. 게다가, HD8-유사 폴리펩티드 코딩 핵산/유전자의 대립인자 변이체는 마커 보조 육종 프로그램에서 용도를 찾을 수 있다. HD8-유사 폴리펩티드를 코딩하는 핵산은 또한 이 유전자의 일부에 대한 유전자지도 및 물리지도 제작용 탐침으로서 및 그 유전자에 연관된 형질에 대한 마커로서 사용될 수 있다. 상기 정보는 원하는 표현형을 갖는 라인 개발을 위한 식물 육종에 유용하다.
LEJ1
폴리펩티드의
구현예
1. LEJ1 폴리펩티드가 적어도 하나, 바람직하게는 두 개의 CBS 도메인(들) (SMART entry SM00116)을 포함하는 것을 특징으로 하는, LEJ1 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 구현예 1에 있어서, 상기 조절된 발현은 상기 LEJ1 폴리펩티드를 코딩하는 상기 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
3. 구현예 1 또는 구현예 2에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량, 바람직하게는 대조구 식물에 비하여 증가된 생물량 및/또는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
4. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
5. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 가뭄 스트레스, 염분 스트레스 또는 질소 결핍 조건 하에서 얻어지는 것을 특징으로 하는 방법.
6. 구현예 1 내지 구현예 5 중 어느 한 구현예에 있어서, 상기 LEJ1 폴리펩티드는 모티프 1 내지 6 (서열번호 205 내지 서열번호 210)의 하나 이상을 포함하는 것을 특징으로 하는 방법.
7. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 LEJ1을 코딩하는 핵산은 식물 유래, 바람직하게는 쌍자엽 식물 유래, 더 바람직하게는 십자화과 (family Brassicaceae) 유래, 더욱 바람직하게는 애기장대속 (genus Arabidopsis) 유래, 가장 바람직하게는 애기장대 (Arabidopsis thaliana) 유래인 것을 특징으로 하는 방법.
8. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 LEJ1을 코딩하는 핵산은 표 10에 열거된 폴리펩티드 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
9. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 핵산 서열은 표 10에 제시된 어느 하나의 폴리펩티드의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 것을 특징으로 하는 방법.
10. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 LEJ1 폴리펩티드를 코딩하는 상기 핵산은 서열번호 2인 것을 특징으로 하는 방법.
11. 구현예 1 내지 구현예 10 중 어느 한 구현예에 있어서, 상기 핵산은 항시성 프로모터에, 바람직하게는 중간 강도의 항시성 프로모터에, 바람직하게는 식물 프로모터에, 더욱 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼 유래의 GOS2 프로모터에 작동 가능하게 연결된 것을 특징으로 하는 방법.
12. 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 LEJ1 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 구현예 1 내지 구현예 11 중 어느 한 구현예의 방법에 의해 수득 가능한 종자를 포함하는 식물, 식물체의 일부 또는 식물 세포.
13. 하기를 포함하는 유전자 구축물 (construct):
(i) 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 LEJ1을 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
14. 구현예 13에 있어서, 상기 하나 이상의 조절 서열은 항시성 프로모터, 바람직하게는 중간 강도의 항시성 프로모터, 바람직하게는 식물 프로모터, 더욱 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼 유래의 GOS2 프로모터인 것을 특징으로 하는 유전자 구축물.
15. 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량 및/또는 증가된 생물량을 가진 식물을 제조하는 방법에 대한 구현예 13 또는 구현예 14에 따른 유전자 구축물의 용도.
16. 구현예 13 또는 구현예 14에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
17. 하기 단계를 포함하는, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량 및/또는 증가된 생물량을 갖는 형질전환 식물의 제조 방법:
(i) 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 LEJ1 폴리펩티드를 코딩하는 핵산을 식물 세포 또는 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포 또는 식물을 배양하는 단계.
18. 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 LEJ1 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 증가된 종자 수확량 및/또는 증가된 생물량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
19. 구현예 12, 구현예 16 또는 구현예 18 중 어느 한 구현예에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
20. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 구현예 19에 따른 식물의 수확 가능한 부분.
21. 구현예 19에 따른 식물 및/또는 구현예 20에 따른 식물의 수확 가능한 부분 유래의 산물.
22. 대조구 식물에 비하여 식물에서 수확량 관련 형질 향상, 바람직하게는 수확량 증가, 더 바람직하게는 대조구 식물에 비하여 식물에서 종자 수확량 증가 및/또는 생물량 증가를 위한 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 LEJ1 폴리펩티드를 코딩하는 핵산의 용도.
ExbB
폴리펩티드의
구현예
1. ExbB 폴리펩티드가 PFAM 등록 번호 PF01618 MotA_ExbB 도메인에 해당하는 InterPro accession IPR002898 MotA/TolQ/ExbB 양성자 채널 도메인을 포함하는 것을 특징으로 하는, ExbB 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 구현예 1에 있어서, 상기 ExbB 폴리펩티드는 적어도 하나의 부가적인 막관통 (transmembrane) 도메인을 포함하는 것을 특징으로 하는 방법.
3. 구현예 1 또는 구현예 2에 있어서, 상기 조절된 발현은 ExbB 폴리펩티드를 코딩하는 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
4. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 ExbB 폴리펩티드를 코딩하는 핵산은 표 11에 열거된 단백질 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
5. 구현예 1 내지 구현예 4 중 어느 한 구현예에 있어서, 상기 핵산 서열은 표 11에 제시된 어느 하나의 단백질의 오쏘로그 (orthologue) 또는 패럴로그 (paralogue)를 코딩하는 것을 특징으로 하는 방법.
6. 구현예 1 내지 구현예 5 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량, 바람직하게는 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
7. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
8. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 가뭄 스트레스, 염분 스트레스 또는 질소 결핍 조건 하에서 얻어지는 것을 특징으로 하는 방법.
9. 구현예 3 내지 구현예 8 중 어느 한 구현예에 있어서, 상기 핵산은 항시성 프로모터에, 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼 유래의 GOS2 프로모터에 작동 가능하게 연결된 것을 특징으로 하는 방법.
10. 구현예 1 내지 구현예 9 중 어느 한 구현예에 있어서, 상기 ExbB 폴리펩티드를 코딩하는 핵산은 시아노박테리아 유래, 바람직하게는 시네코시스티스 종 (Synechocystis species) 유래, 더 바람직하게는 시네코시스티스 sp. PCC 6803 유래인 것을 특징으로 하는 방법.
11. ExbB 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 구현예 1 내지 구현예 10 중 어느 한 구현예의 방법에 의해 수득 가능한 종자를 포함하는 식물 또는 식물의 일부.
12. 하기를 포함하는 유전자 구축물 (construct):
(i) 구현예 1 또는 구현예 2에 정의된 ExbB 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
13. 구현예 12에 있어서, 상기 하나 이상의 조절 서열은 항시성 프로모터, 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼 유래의 GOS2 프로모터인 것을 특징으로 하는 유전자 구축물.
14. 구현예 12에 있어서, 상기 하나 이상의 조절 서열은 뿌리 특이적 프로모터, 바람직하게는 벼 뿌리 특이적 프로모터인 것을 특징으로 하는 유전자 구축물.
15. 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 가진 식물을 제조하는 방법에 대한 구현예 12, 구현예 13 또는 구현예 14 중 어느 한 구현예에 따른 유전자 구축물의 용도.
16. 구현예 12, 구현예 13 또는 구현예 14 중 어느 한 구현예에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
17. 하기 단계를 포함하는, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 구현예 1 또는 구현예 2에 정의된 ExbB 폴리펩티드를 코딩하는 핵산을 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 식물 세포를 배양하는 단계.
18. 구현예 1 또는 구현예 2에 정의된 ExbB 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 증가된 수확량, 특히 증가된 생물량 및/또는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
19. 구현예 11, 구현예 16 또는 구현예 18 중 어느 한 구현예에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
20. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 구현예 19에 따른 식물의 수확 가능한 부분.
21. 구현예 19에 따른 식물 및/또는 구현예 20에 따른 식물의 수확 가능한 부분 유래의 산물.
22. 대조구 식물에 비하여 식물에서 수확량 증가, 특히 종자 수확량 및/또는 줄기 생물량을 증가시키기 위한 ExbB 폴리펩티드 코딩 핵산의 용도.
NMPRT
폴리펩티드의
구현예
1. 니코틴아미드 포스포리보실트랜스퍼라아제 (NMPRT)를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법으로서, 상기 NMPRT가 비척추동물 유래이며, 하기를 포함하는 것을 특징으로 하는 방법:
(i) InterPro accession IPR016471을 갖는 도메인; 및
(ii) 서열번호 315로 표시된 도메인에 대해 적어도 50%의 아미노산 서열 동일성, 바람직하게는 증가하는 순으로 선호되는 적어도 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%, 또는 그 이상의 아미노산 서열 동일성.
2. 구현예 1에 있어서, 상기 조절된 발현은 상기 NMPRT를 코딩하는 상기 핵산의 상기 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
3. 구현예 1 또는 구현예 2에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량, 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
4. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
5. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 가뭄 스트레스, 염분 스트레스 또는 질소 결핍 조건 하에서 얻어지는 것을 특징으로 하는 방법.
6. 구현예 1 내지 구현예 5 중 어느 한 구현예에 있어서, 상기 NMPRT는 하기 모티프의 하나 이상에 대해 적어도 64%의 아미노산 서열 동일성, 예를 들면 적어도 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 아미노산 서열 동일성을 포함하는 것을 특징으로 하는 방법:
(i) 모티프 7: FKLHDFGARGVSSGESSGIGGLAHLVNFQGSDTV (서열번호 318),
(ii) 모티프 8: AAYSIPAAEHSTITAWG (서열번호 319),
(iii) 모티프 9: AVVSDSYDL (서열번호 320),
(iv) 모티프 10: VIRPDSGDP (서열번호 321),
(v) 모티프 11: VRVIQGDGV (서열번호 322),
(vi) 모티프 12: NLAFGMGGALLQKVNRDT (서열번호 323).
7. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 NMPRT를 코딩하는 핵산은 원핵생물 유래, 바람직하게는 시아노박테리아 유래, 더 바람직하게는 시네코시스티스속 (genus Synechocystis) 유래, 가장 바람직하게는 시네코시스티스 종 (Synechocystis species) 유래인 것을 특징으로 하는 방법.
8. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 NMPRT를 코딩하는 핵산은 표 12에 열거된 폴리펩티드 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 상기 핵산과 바람직하게는 높은 스트린전시 조건 하에서 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
9. 구현예 1 내지 구현예 8 중 어느 한 구현예에 있어서, 상기 핵산 서열은 표 12에 제시된 어느 하나의 폴리펩티드의 오쏘로그 또는 패럴로그를 코딩하는 것을 특징으로 하는 방법.
10. 구현예 1 내지 구현예 9 중 어느 한 구현예에 있어서, 상기 NMPRT를 코딩하는 상기 핵산은 서열번호 281 또는 서열번호 309로 표시되는 것을 특징으로 하는 방법.
11. 구현예 1 내지 구현예 10 중 어느 한 구현예에 있어서, 상기 핵산은 항시성 프로모터에, 바람직하게는 중간 강도의 항시성 프로모터에, 바람직하게는 식물 프로모터에, 더 바람직하게는 GOS2 프로모터에, 가장 바람직하게는 벼 유래의 GOS2 프로모터에 작동 가능하게 연결되는 것을 특징으로 하는 방법.
12. 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 NMPRT 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 구현예 1 내지 구현예 11 중 어느 한 구현예의 방법에 의해 수득 가능한 종자를 포함하는 식물, 식물체의 일부 또는 식물 세포.
13. 하기를 포함하는 유전자 구축물 (construct):
(i) 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 NMPRT를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
14. 구현예 13에 있어서, 상기 하나 이상의 조절 서열은 항시성 프로모터, 바람직하게는 중간 강도의 항시성 프로모터, 바람직하게는 식물 프로모터, 더욱 바람직하게는 GOS2 프로모터, 가장 바람직하게는 벼 유래의 GOS2 프로모터인 것을 특징으로 하는 유전자 구축물.
15. 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 가진 식물을 제조하는 방법에 대한 구현예 13 또는 구현예 14에 따른 유전자 구축물의 용도.
16. 구현예 13 또는 구현예 14에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
17. 하기 단계를 포함하는, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 NMPRT를 코딩하는 핵산을 식물 세포 또는 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포 또는 식물을 배양하는 단계.
18. 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
19. 구현예 12, 구현예 16 또는 구현예 18 중 어느 한 구현예에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
20. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 구현예 19에 따른 식물의 수확 가능한 부분.
21. 구현예 19에 따른 식물 및/또는 구현예 20에 따른 식물의 수확 가능한 부분 유래의 산물.
22. 대조구 식물에 비하여 식물에서 수확량 관련 형질 향상, 바람직하게는 대조구 식물에 비하여 수확량 증가, 더 바람직하게는 종자 수확량 증가를 위한 구현예 1, 구현예 6 내지 구현예 10 중 어느 한 구현예에 정의된 NMPRT 폴리펩티드를 코딩하는 핵산의 용도.
AP2
-26-유사 폴리펩티드의
구현예
1. AP2-26-유사 폴리펩티드가 Pfam PF00847 도메인을 포함하는 것을 특징으로 하는, AP2-26-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 구현예 1에 있어서, 상기 조절된 발현은 상기 AP2-26-유사 폴리펩티드를 코딩하는 상기 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
3. 구현예 1 또는 구현예 2에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량 및/또는 초기 활력, 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
4. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
5. 구현예 1 내지 구현예 4 중 어느 한 구현예에 있어서, 상기 AP2-26-유사 폴리펩티드는 하기 모티프의 하나 이상을 포함하는 것을 특징으로 하는 방법:
(i) 모티프 13:
KLYRGVRQRHWGKWVAEIRLP[RK]NRTRLWLGTFDTAE[ED]AAL[TA]YD[KQ]AA[YF][RK]LR (서열번호 378),
(ii) 모티프 14:
[GHA][ELS][YRA][GKP]PL[DH][AS][SAT]VDAKL[QE]AIC[DQ][TSN][ILM] (서열번호 379),
(iii) 모티프 15:
PS[YVWL]EIDW (서열번호 380).
6. 구현예 1 내지 구현예 5 중 어느 한 구현예에 있어서, 상기 AP2-26-유사 폴리펩티드를 코딩하는 핵산은 식물 유래, 바람직하게는 쌍자엽 식물 유래, 더 바람직하게는 벼과 (family Poaceae) 유래, 더욱 바람직하게는 벼속 (genus Oryza) 유래, 가장 바람직하게는 벼 (Oryza sativa) 유래인 것을 특징으로 하는 방법.
7. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 AP2-26-유사 폴리펩티드를 코딩하는 핵산은 표 22에 열거된 폴리펩티드 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
8. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 핵산 서열은 표 22에 제시된 어느 하나의 폴리펩티드의 오쏘로그 또는 패럴로그를 코딩하는 것을 특징으로 하는 방법.
9. 구현예 1 내지 구현예 8 중 어느 한 구현예에 있어서, 상기 핵산은 서열번호 329로 표시된 폴리펩티드를 코딩하는 것을 특징으로 하는 방법.
10. 구현예 1 내지 구현예 9 중 어느 한 구현예에 있어서, 상기 핵산은 뿌리 특이적 프로모터에, 바람직하게는 RCc3 프로모터에, 가장 바람직하게는 벼 유래의 RCc3 프로모터에 작동 가능하게 연결된 것을 특징으로 하는 방법.
11. 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 구현예 1 내지 구현예 10 중 어느 한 구현예의 방법에 의해 수득 가능한 종자를 포함하는 식물, 식물체의 일부 또는 식물 세포.
12. 하기를 포함하는 유전자 구축물 (construct):
(i) 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
13. 구현예 12에 있어서, 상기 하나 이상의 조절 서열은 뿌리 특이적 프로모터, 바람직하게는 RCc3 프로모터, 가장 바람직하게는 벼 유래의 RCc3 프로모터인 것을 특징으로 하는 유전자 구축물.
14. 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 초기 활력 및/또는 증가된 종자 수확량을 가진 식물을 제조하는 방법에 대한 구현예 12 또는 구현예 13에 따른 유전자 구축물의 용도.
15. 구현예 12 또는 구현예 13에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
16. 하기 단계를 포함하는, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 초기 활력 및/또는 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산을 식물 세포 또는 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포 또는 식물을 배양하는 단계.
17. 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 초기 활력 및/또는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
18. 구현예 11, 구현예 15 또는 구현예 17 중 어느 한 구현예에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
19. 수확 가능한 부분이 바람직하게는 종자인 것을 특징으로 하는, 구현예 18에 따른 식물의 수확 가능한 부분.
20. 구현예 18에 따른 식물 및/또는 구현예 19에 따른 식물의 수확 가능한 부분 유래의 산물.
21. 대조구 식물에 비하여 식물에서 수확량 관련 형질 향상, 바람직하게는 대조구 식물에 비하여 식물에서 초기 활력 증가 및/또는 종자 수확량 증가를 위한 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 AP2-26-유사 폴리펩티드를 코딩하는 핵산의 용도.
HD8
-유사 폴리펩티드의
구현예
1. HD8-유사 폴리펩티드가 호메오도메인 (PF00046) 및 START 도메인 (PF01852)을 포함하는 것을 특징으로 하는, HD8-유사 폴리펩티드를 코딩하는 핵산의 식물에서의 발현 조절을 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
2. 구현예 1에 있어서, 상기 조절된 발현은 상기 HD8-유사 폴리펩티드를 코딩하는 상기 핵산의 식물로의 도입 및 발현에 의해 수행되는 것을 특징으로 하는 방법.
3. 구현예 1 또는 구현예 2에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량, 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
4. 구현예 1 내지 구현예 3 중 어느 한 구현예에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
5. 구현예 1 내지 구현예 4 중 어느 한 구현예에 있어서, 상기 HD8-유사 폴리펩티드는 하기 모티프의 하나 이상을 포함하는 것을 특징으로 하는 방법:
(i) 모티프 16:
[EAP][TR]Q[IV]K[YF]WFQN[CR]R[ST][KQ][MI]K[KVA][FRQ][QKSH][ENCD][RNG][AETH][DE][RN][SKNC][LAKI][LY][RQK][KRA][QE]N[EAD][EK][LI][RLK][KAC][TE]N[AMI][AER][LI][RKQ][NE][RQA][LMI][KR][NGK][VSMA][TI]C (서열번호 562),
(ii) 모티프 17:
[KPR][RK]RY[QH][LR][LH]T[MPA][QR]Q[KI][EQ][ETQR][LM][NE][RAS][LAYM][FD][QLK][ESA][CS][PF][NPH][FP][LD][ERLD][KNL][DLQ] (서열번호 563),
(iii) 모티프 18:
[DN]G[CRNHY][CS][QRK][ILMV][YVIT][AW][VLIM][DEV] (서열번호 564).
6. 구현예 1 내지 구현예 5 중 어느 한 구현예에 있어서, 상기 HD8-유사 폴리펩티드를 코딩하는 핵산은 식물 유래, 바람직하게는 단자엽 식물 유래, 더 바람직하게는 벼과 (family Poaceae) 유래, 더욱 바람직하게는 벼속 (genus Oryza) 유래, 가장 바람직하게는 벼 (Oryza sativa) 유래인 것을 특징으로 하는 방법.
7. 구현예 1 내지 구현예 6 중 어느 한 구현예에 있어서, 상기 HD8-유사 폴리펩티드를 코딩하는 핵산은 표 26에 열거된 폴리펩티드 중 어느 하나를 코딩하거나, 상기 핵산의 일부이거나, 상기 핵산과 혼성화가 가능한 핵산인 것을 특징으로 하는 방법.
8. 구현예 1 내지 구현예 7 중 어느 한 구현예에 있어서, 상기 핵산 서열은 표 26에 제시된 어느 하나의 폴리펩티드의 오쏘로그 또는 패럴로그를 코딩하는 것을 특징으로 하는 방법.
9. 구현예 1 내지 구현예 8 중 어느 한 구현예에 있어서, 상기 핵산은 서열번호 385로 표시된 폴리펩티드를 코딩하는 것을 특징으로 하는 방법.
10. 구현예 1 내지 구현예 9 중 어느 한 구현예에 있어서, 상기 핵산은 뿌리 특이적 프로모터에, 더 바람직하게는 RCc3 프로모터에, 가장 바람직하게는 벼 유래의 RCc3 프로모터에 작동 가능하게 연결된 것을 특징으로 하는 방법.
11. 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 HD8-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 구현예 1 내지 구현예 10 중 어느 한 구현예의 방법에 의해 수득 가능한 종자를 포함하는 식물, 식물체의 일부 또는 식물 세포.
12. 하기를 포함하는 유전자 구축물 (construct):
(i) 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열.
13. 구현예 12에 있어서, 상기 하나 이상의 조절 서열은 뿌리 특이적 프로모터, 더 바람직하게는 RCc3 프로모터, 가장 바람직하게는 벼 유래의 RCc3 프로모터인 것을 특징으로 하는 유전자 구축물.
14. 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 가진 식물을 제조하는 방법에 대한 구현예 12 또는 구현예 13에 따른 유전자 구축물의 용도.
15. 구현예 12 또는 구현예 13에 따른 유전자 구축물로 형질전환된 식물, 식물의 일부 또는 식물 세포.
16. 하기 단계를 포함하는, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 대조구 식물에 비하여 증가된 종자 수확량을 갖는 형질전환 식물의 제조 방법:
(i) 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산을 식물 세포 또는 식물에 도입 및 발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포 또는 식물을 배양하는 단계.
17. 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 조절된 발현으로 인하여, 대조구 식물에 비하여 향상된 수확량 관련 형질, 바람직하게는 대조구 식물에 비하여 증가된 수확량, 더 바람직하게는 증가된 종자 수확량을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
18. 구현예 11, 구현예 15 또는 구현예 17 중 어느 한 구현예에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
19. 수확 가능한 부분이 바람직하게는 줄기 생물량 및/또는 종자인 것을 특징으로 하는, 구현예 18에 따른 식물의 수확 가능한 부분.
20. 구현예 18에 따른 식물 및/또는 구현예 19에 따른 식물의 수확 가능한 부분 유래의 산물.
21. 대조구 식물에 비하여 식물에서 수확량 관련 형질 향상, 바람직하게는 대조구 식물에 비하여 식물에서 수확량 증가, 더 바람직하게는 종자 수확량 증가를 위한 구현예 1, 구현예 5 내지 구현예 9 중 어느 한 구현예에 정의된 HD8-유사 폴리펩티드를 코딩하는 핵산의 용도.
도 1은 서열번호 2의 도메인 구조를 나타내며, 모티프 1 내지 3은 굵은 글씨로, 모티프 5 내지 6은 이탤릭체로 표시하였다. SMART 알고리즘 (표 13에 대한 설명 참고)으로 동정된 직렬 (tandem) CBS 도메인은 밑줄로 표시하였다.
도 2는 다양한 LEJ1 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 정의하는데 이용될 수 있다.
도 3은 LEJ1 폴리펩티드의 계통수를 나타낸다.
도 4는 가깝게 연관된 LEJ1 단백질 사이의 상동성을 보여주는 MATGAT 표를 나타낸다. 서열 동일성은 대각선 위쪽에, 서열 유사성은 대각선 아래쪽에 나타내었다.
도 5는 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 LEJ1 코딩 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위해 사용된 바이너리 (binary) 벡터를 나타낸다.
도 6은 논의된 세 개의 이온 전위 연결 시스템 (ion potential coupled system)의 다양한 요소의 도식도이다: Tol-Pal 시스템 (왼쪽); TonB-exb 시스템 (중앙); 및 편모 모터 (flagellar motor, 오른쪽). 검은색 화살표는 본 발명의 방법 수행에 유용한 폴리펩티드를 나타낸다. Cascales 등 (Molecular Microbiology (2001), 42(3): 795-807)에 따르면, TolQ-TolR 단백질은 TolA를 활성화하고, 편모 모터 단백질 MotA-MotB와 상동성을 공유한다.
도 7은 ExbB-유사 폴리펩티드의 다중 정렬을 나타낸다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 8은 ClustalW 프로그램을 사용한, ExbB-유사 폴리펩티드의 대안적인 다중 정렬을 나타낸다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 9는 표 11의 서열의 ClustalW 생성 neighbour-joining tree를 나타낸다. 계통수는 디폴트 세팅 (실시예 2 참고)을 사용하여 생성되었다.
도 10은 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 ExbB 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 11은 가깝게 연관된 ExbB 단백질 사이의 상동성을 보여주는 MATGAT 표를 나타낸다. 서열 동일성은 대각선 위쪽에, 서열 유사성은 대각선 아래쪽에 나타내었다.
도 12는 InterPro accession IPR016471을 갖는 도메인 (굵은 글씨), 서열번호 315 (밑줄) 및 모티프 7 내지 12의 위치가 표시된 서열번호 282의 도메인 구조를 나타낸다.
도 13은 다양한 NMPRT 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 정의하는데 이용될 수 있다.
도 14는 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 NMPRT 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 15는 굵은 글씨로 표시한 보존된 모티프 13 내지 15 및 이탤릭체로 표시한 AP2 도메인을 갖는 서열번호 329의 도메인 구조를 나타낸다.
도 16은 다양한 AP2-26-유사 폴리펩티드의 다중 정렬을 나타낸다. 보존된 영역은 보존된 아미노산이 고려될 때, 추가의 모티프를 정의하는데 유용한 상기 정렬로부터 쉽게 찾아질 수 있다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다.
도 17은 AP2-26-유사 폴리펩티드의 계통수를 나타내며, 서열번호 329는 LOC_Os08g31580로 표시하였다.
도 18은 실시예 14의 MATGAT 표를 나타낸다.
도 19는 벼 RCc3 프로모터의 조절 하에서 AP2-26-유사 코딩 핵산 (pRCc3::AP2-26-like)의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 20은 이탤릭체로 표시된 호메오도메인 (homeodomain) 및 START 도메인, 굵은 글씨로 표시된 모티프 16 내지 18을 갖는 서열번호 385의 도메인 구조를 나타낸다.
도 21은 다양한 HD8-유사 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 또는 시그너처 (signature) 서열을 정의하는데 이용될 수 있다.
도 22는 HD8-유사 폴리펩티드의 계통수 (Jain et al., 2008)를 나타낸다.
도 23은 실시예 25의 MATGAT 표를 나타낸다.
도 24는 벼 RCc3 프로모터 (pRCc3)의 조절 하에서 HD8-유사 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 2는 다양한 LEJ1 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 정의하는데 이용될 수 있다.
도 3은 LEJ1 폴리펩티드의 계통수를 나타낸다.
도 4는 가깝게 연관된 LEJ1 단백질 사이의 상동성을 보여주는 MATGAT 표를 나타낸다. 서열 동일성은 대각선 위쪽에, 서열 유사성은 대각선 아래쪽에 나타내었다.
도 5는 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 LEJ1 코딩 핵산의 벼 (Oryza sativa)에서의 증가된 발현을 위해 사용된 바이너리 (binary) 벡터를 나타낸다.
도 6은 논의된 세 개의 이온 전위 연결 시스템 (ion potential coupled system)의 다양한 요소의 도식도이다: Tol-Pal 시스템 (왼쪽); TonB-exb 시스템 (중앙); 및 편모 모터 (flagellar motor, 오른쪽). 검은색 화살표는 본 발명의 방법 수행에 유용한 폴리펩티드를 나타낸다. Cascales 등 (Molecular Microbiology (2001), 42(3): 795-807)에 따르면, TolQ-TolR 단백질은 TolA를 활성화하고, 편모 모터 단백질 MotA-MotB와 상동성을 공유한다.
도 7은 ExbB-유사 폴리펩티드의 다중 정렬을 나타낸다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 8은 ClustalW 프로그램을 사용한, ExbB-유사 폴리펩티드의 대안적인 다중 정렬을 나타낸다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프를 정의하는데 이용될 수 있다.
도 9는 표 11의 서열의 ClustalW 생성 neighbour-joining tree를 나타낸다. 계통수는 디폴트 세팅 (실시예 2 참고)을 사용하여 생성되었다.
도 10은 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 ExbB 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 11은 가깝게 연관된 ExbB 단백질 사이의 상동성을 보여주는 MATGAT 표를 나타낸다. 서열 동일성은 대각선 위쪽에, 서열 유사성은 대각선 아래쪽에 나타내었다.
도 12는 InterPro accession IPR016471을 갖는 도메인 (굵은 글씨), 서열번호 315 (밑줄) 및 모티프 7 내지 12의 위치가 표시된 서열번호 282의 도메인 구조를 나타낸다.
도 13은 다양한 NMPRT 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 정의하는데 이용될 수 있다.
도 14는 벼 GOS2 프로모터 (pGOS2)의 조절 하에서 NMPRT 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 15는 굵은 글씨로 표시한 보존된 모티프 13 내지 15 및 이탤릭체로 표시한 AP2 도메인을 갖는 서열번호 329의 도메인 구조를 나타낸다.
도 16은 다양한 AP2-26-유사 폴리펩티드의 다중 정렬을 나타낸다. 보존된 영역은 보존된 아미노산이 고려될 때, 추가의 모티프를 정의하는데 유용한 상기 정렬로부터 쉽게 찾아질 수 있다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다.
도 17은 AP2-26-유사 폴리펩티드의 계통수를 나타내며, 서열번호 329는 LOC_Os08g31580로 표시하였다.
도 18은 실시예 14의 MATGAT 표를 나타낸다.
도 19는 벼 RCc3 프로모터의 조절 하에서 AP2-26-유사 코딩 핵산 (pRCc3::AP2-26-like)의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
도 20은 이탤릭체로 표시된 호메오도메인 (homeodomain) 및 START 도메인, 굵은 글씨로 표시된 모티프 16 내지 18을 갖는 서열번호 385의 도메인 구조를 나타낸다.
도 21은 다양한 HD8-유사 폴리펩티드의 다중 정렬을 나타낸다. 별표는 다양한 단백질 서열 사이에서 동일한 아미노산을 가리키며, 콜론은 고도로 보존된 아미노산 치환을 나타내고, 점은 더 적게 보존된 아미노산 치환을 나타내며, 다른 위치에서는 서열 보존이 없다. 이 정렬은 보존된 아미노산을 이용할 때, 추가의 모티프 또는 시그너처 (signature) 서열을 정의하는데 이용될 수 있다.
도 22는 HD8-유사 폴리펩티드의 계통수 (Jain et al., 2008)를 나타낸다.
도 23은 실시예 25의 MATGAT 표를 나타낸다.
도 24는 벼 RCc3 프로모터 (pRCc3)의 조절 하에서 HD8-유사 코딩 핵산의 벼에서의 증가된 발현을 위해 사용된 바이너리 벡터를 나타낸다.
실시예
본 발명은 단지 예시인 하기 실시예를 참고하여 기재될 것이다. 하기 실시예는 본 발명의 범위를 제한할 의도는 아니다.
DNA 조작: 달리 언급되지 않는 한, 재조합 DNA 기술은 Sambrook (2001, Molecular Cloning: laboratory manual, 3rd Edition Cold Spring Harbor Laboratory Press, CSH, New York) 또는 Ausubel 등 (1994, Current Protocols in Molecular Biology, Current Protocols의 Volumes 1 및 2)에 기재된 표준 프로토콜에 따라 수행되었다. 식물 분자작업에 대한 표준 재료 및 방법은 Plant Molecular Biology Labfax (1993, by R.D.D. Croy, published by BIOS Scientific Publications Ltd (UK) 및 Blackwell Scientific Publications (UK))에 기재되어 있다.
실시예
1: 본 발명의 방법에 사용된 핵산 서열에 연관된 서열의 동정
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
서열번호 1 및 서열번호 2에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 1의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 10은 서열번호 1 및 서열번호 2에 연관된 핵산 서열의 목록을 제공한다.
명칭 |
핵산
서열번호 |
폴리펩티드
서열번호 |
A. thaliana _ AT4G34120 .1#1 | 1 | 2 |
A.lyrata_491262#1 | 3 | 4 |
B.napus_TC96197#1 | 5 | 6 |
B.oleracea_TA10145_3712#1 | 7 | 8 |
B.oleracea_TA9314_3712#1 | 9 | 10 |
B.rapa_DN962218#1 | 11 | 12 |
B.rapa_DN964415#1 | 13 | 14 |
A.lyrata_490898#1 | 15 | 16 |
A.thaliana_AT4G36910.1#1 | 17 | 18 |
Aquilegia_sp_TC20070#1 | 19 | 20 |
Aquilegia_sp_TC26534#1 | 21 | 22 |
B.distachyon_TA1216_15368#1 | 23 | 24 |
B.napus_TC64871#1 | 25 | 26 |
Bruguiera_gymnorhiza_AB429351#1 | 27 | 28 |
C.annuum_TC14856#1 | 29 | 30 |
C.annuum_TC16585#1 | 31 | 32 |
C.clementina_TC16065#1 | 33 | 34 |
C.clementina_TC36326#1 | 35 | 36 |
C.endivia_EL357072#1 | 37 | 38 |
C.intybus_EH692144#1 | 39 | 40 |
C.intybus_TA750_13427#1 | 41 | 42 |
C.reinhardtii_185012#1 | 43 | 44 |
C.sinensis_EY677132#1 | 45 | 46 |
C.sinensis_TC7973#1 | 47 | 48 |
C.solstitialis_EH757631#1 | 49 | 50 |
C.solstitialis_TA2067_347529#1 | 51 | 52 |
C.solstitialis_TA5231_347529#1 | 53 | 54 |
C.vulgaris_68484#1 | 55 | 56 |
E.esula_TC5314#1 | 57 | 58 |
G.hirsutum_EV497842#1 | 59 | 60 |
G.hirsutum_TC130207#1 | 61 | 62 |
G.hirsutum_TC131625#1 | 63 | 64 |
G.hirsutum_TC132155#1 | 65 | 66 |
G.max_Glyma01g39530.1#1 | 67 | 68 |
G.max_Glyma01g39530.2#1 | 69 | 70 |
G.max_Glyma11g05710.1#1 | 71 | 72 |
G.max_TC285505#1 | 73 | 74 |
G.max_TC286772#1 | 75 | 76 |
G.max_TC287707#1 | 77 | 78 |
G.soja_CA782722#1 | 79 | 80 |
H.ciliaris_EL432844#1 | 81 | 82 |
H.exilis_EE655546#1 | 83 | 84 |
H.petiolaris_DY938300#1 | 85 | 86 |
H.petiolaris_TA3105_4234#1 | 87 | 88 |
H.vulgare_TC155851#1 | 89 | 90 |
H.vulgare_TC169422#1 | 91 | 92 |
L.japonicus_TC37102#1 | 93 | 94 |
L.japonicus_TC49381#1 | 95 | 96 |
L.perennis_TA2207_43195#1 | 97 | 98 |
L.saligna_TA1249_75948#1 | 99 | 100 |
L.saligna_TA2654_75948#1 | 101 | 102 |
L.sativa_TC16554#1 | 103 | 104 |
L.sativa_TC20908#1 | 105 | 106 |
L.serriola_TC1188#1 | 107 | 108 |
L.virosa_TA2488_75947#1 | 109 | 110 |
L.virosa_TA2701_75947#1 | 111 | 112 |
M.polymorpha_TA1202_3197#1 | 113 | 114 |
M.truncatula_AC136449_14.5#1 | 115 | 116 |
M.truncatula_CT025837_26.4#1 | 117 | 118 |
Medicago_truncatula_BT053473#1 | 119 | 120 |
N.tabacum_TC41456#1 | 121 | 122 |
N.tabacum_TC46283#1 | 123 | 124 |
N.tabacum_TC72241#1 | 125 | 126 |
Nicotiana_langsdorffii_x_sanderae_EB699100#1 | 127 | 128 |
O.sativa_LOC_Os08g22149.1#1 | 129 | 130 |
O.sativa_LOC_Os09g02710.1#1 | 131 | 132 |
P.patens_TC30132#1 | 133 | 134 |
P.patens_TC37673#1 | 135 | 136 |
P.patens_TC42286#1 | 137 | 138 |
P.patens_TC42494#1 | 139 | 140 |
P.persica_TC10631#1 | 141 | 142 |
P.taeda_TA12827_3352#1 | 143 | 144 |
P.trichocarpa_549923#1 | 145 | 146 |
P.trifoliata_TA8203_37690#1 | 147 | 148 |
P.vulgaris_TC13521#1 | 149 | 150 |
R.communis_TA2199_3988#1 | 151 | 152 |
S.bicolor_Sb06g002220.1#1 | 153 | 154 |
S.bicolor_Sb06g002220.2#1 | 155 | 156 |
S.henryi_DT598835#1 | 157 | 158 |
S.henryi_DT605075#1 | 159 | 160 |
S.henryi_TA1396_13258#1 | 161 | 162 |
S.lycopersicum_TC194328#1 | 163 | 164 |
S.lycopersicum_TC197340#1 | 165 | 166 |
S.lycopersicum_TC205614#1 | 167 | 168 |
S.officinarum_TC88204#1 | 169 | 170 |
S.tuberosum_TC163611#1 | 171 | 172 |
S.tuberosum_TC170837#1 | 173 | 174 |
S.tuberosum_TC177736#1 | 175 | 176 |
S.tuberosum_TC184391#1 | 177 | 178 |
T.aestivum_TC285265#1 | 179 | 180 |
T.aestivum_TC330389#1 | 181 | 182 |
T.cacao_TC4622#1 | 183 | 184 |
T.officinale_TA5844_50225#1 | 185 | 186 |
T.pratense_TA1696_57577#1 | 187 | 188 |
Z.mays_c58992071gm030403@3921#1 | 189 | 190 |
Z.mays_TC462721#1 | 191 | 192 |
Z.mays_TC475890#1 | 193 | 194 |
Zea_mays_BT064440#1 | 195 | 196 |
Zea_mays_DQ244217#1 | 197 | 198 |
Zea_mays_EU962300#1 | 199 | 200 |
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정을 허용한다.
2.
ExbB
폴리펩티드
서열번호 211 및 서열번호 212에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 1의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 11은 서열번호 211 및 서열번호 212에 연관된 핵산 서열의 목록을 제공한다.
명칭 |
핵산
서열번호 |
단백질
서열번호 |
Synechocystis PCC6803_sll1404_exbB3 | 211 | 212 |
Acaryochloris marina MBIC11017 exbB1 | 213 | 214 |
Acaryochloris marina MBIC11017 exbB2 | 215 | 216 |
Acaryochloris marina MBIC11017 exbB3 | 217 | 218 |
Anabaena variabilis ATCC 29413 exbB1 | 219 | 220 |
Anabaena variabilis ATCC 29413 exbB2 | 221 | 222 |
Anabaena variabilis ATCC 29413 exbB3 | 223 | 224 |
Chlorobaculum tepidum CT1586 exbB3 | 225 | 226 |
Cyanobacteria Yellowstone B-Prime CYB_0819 exbB3 | 227 | 228 |
Cyanothece sp. ATCC 51142 exbB1 | 229 | 230 |
Cyanothece sp. ATCC 51142 exbB2 | 231 | 232 |
Cyanothece sp. ATCC 51142 exbB3 | 233 | 234 |
Fremyella diplosiphon Fd33 exbB3 | 235 | 236 |
Gloeobacter violaceus PCC 7421 exbB2 | 237 | 238 |
Gloeobacter violaceus PCC7421 glr1387 exbB3 | 239 | 240 |
Microcystis aeruginosa NIES-843 exbB3 | 241 | 242 |
Nostoc punctiforme PCC 73102 ExbB1 | 243 | 244 |
Nostoc punctiforme PCC 73102 ExbB2 | 245 | 246 |
Nostoc punctiforme PCC 73102 ExbB3 | 247 | 248 |
Nostoc sp. PCC 7120 exbB3 | 249 | 250 |
Nostoc sp. PCC 7120 exbB1 | 251 | 252 |
Nostoc sp. PCC 7120 exbB2 | 253 | 254 |
Rhodopseudomonas palustris CGA009 RPA1239 exbB3 | 255 | 256 |
Rhodopseudomonas palustris CGA009 RPA2127 exbB3 | 257 | 258 |
Synechococcus elongatus PCC 7942 exbB3 | 259 | 260 |
Synechococcus sp. JA-3-3Ab exbB3 | 261 | 262 |
Synechococcus sp. PCC 7002 plasmid pAQ7 exbB3 | 263 | 264 |
Synechocystis PCC6803_sll0477_exbB1 | 265 | 266 |
Synechocystis PCC6803_sll0677_exbB2 | 267 | 268 |
Thermosynechococcus elongatus BP-1 exbB3 | 269 | 270 |
Trichodesmium erythraeum IMS101 exbB3 | 271 | 272 |
Chroococcales cyanobacterium HF070_14_C03 exbB3 | 273 | 274 |
진핵 생물의 상동체에 대해, 서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. 예를 들어, EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체, 예를 들어 특정한 원핵생물에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정을 허용한다.
3.
NMPRT
폴리펩티드
서열번호 281 및 서열번호 282에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 281의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 12는 서열번호 281 및 서열번호 282 및 서열번호 281 및 서열번호 282에 연관된 핵산 서열의 목록을 제공한다.
출처 |
핵산
서열번호 |
폴리펩티드
서열번호 |
Synechocystis sp. PCC 6803 | 281 | 282 |
Aureococcus anophagefferens 39495 | 283 | 284 |
Burkholderia phytofirmans PsJN | 285 | 286 |
Chlamydomonas reinhardtii_206505 | 287 | 288 |
Chlorella vulgaris_72572 | 289 | 290 |
Chlorella_133026 | 291 | 292 |
Deinococcus radiodurans R1 | 293 | 294 |
Emiliania huxleyi 464234 | 295 | 296 |
Hahella chejuensis KCTC 2396 | 297 | 298 |
Magnetospirillum magneticum AMB-1 | 299 | 300 |
Pasteurella multocida subsp Pm70 | 301 | 302 |
Psychrobacter sp PRwf-1 | 303 | 304 |
Ralstonia solanacearum GMI1000 | 305 | 306 |
Stenotrophomonas maltophilia K279a | 307 | 308 |
Synechococcus elongatus PCC6301 | 309 | 310 |
Volvox carteri_90876 | 311 | 312 |
Xanthomonas campestris B100 | 313 | 314 |
Synechococcus elongatus PCC7942 | 325 | 326 |
진핵 생물의 상동체에 대해, 서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. 예를 들어, EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체, 예를 들어 특정한 원핵생물에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정을 허용한다.
실시예
2: 본 발명의 방법에 사용된 폴리펩티드 서열과 연관된 서열의 정렬
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW (2.0) 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. LEJ1 폴리펩티드는 도 2에 정렬되었다.
LEJ1 폴리펩티드의 계통수 (도 3)는 MAFFT (Katoh et al., Nucleic Acids Res., 30:3059-3066, 2002)에서 제공된 정렬 및 neighbour-joining 클러스터링 알고리즘을 사용하여 표 10에 열거된 서열로부터 구축되었다. 상기 계통수는 방사형 분기도 (radial cladogram)로 나타내었다 (Dendroscope: Huson et al. (2007), BMC Bioinformatics 8(1):460)).
2.
ExbB
폴리펩티드
폴리펩티드 서열의 정렬은 점진적인 정렬에 대한 ClustalW 2.0 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 기반으로 한 Vector NTI (Invitrogen)로부터 AlignX 프로그램을 사용하여 수행되었으며, 정렬은 표준세팅 (갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. 고도로 보존된 아미노산 잔기는 일치 서열에 나타내었다. ExbB 폴리펩티드는 도 7에 정렬되었다.
폴리펩티드 서열의 대안적인 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: 또는 Blosum 62, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW (1.81) 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. ExbB 폴리펩티드는 도 8에 정렬되었다.
ExbB 폴리펩티드의 계통수 (도 9)는 도 8의 정렬에 사용된 ClustalW 프로그램에서 제공된 neighbour-joining 클러스터링 알고리즘을 이용하여 구축되었다.
3.
NMPRT
폴리펩티드
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Blosum 62, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 1.8 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. NMPRT 폴리펩티드는 도 13에 정렬되었다. NMPRT 폴리펩티드의 계통수는 Gazzaniga 등 (2009)에 나타내었다.
실시예
3: 폴리펩티드 서열 사이의 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전체 길이의 폴리펩티드 서열 사이의 전체적인 유사성 및 동일성 백분율은 MatGAT (Matrix Global Alignment Tool; BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 이용하여 결정되었다. MatGAT는 데이터의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (갭 끊김 벌점 12 및 갭 확장 벌점 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다.
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
폴리펩티드 서열의 전체 길이에 걸친 전체적인 유사성 및 동일성은 도 4에 나타내었다. 서열 유사성은 나누어진 선 절반의 하단에 표시하였고, 서열 동일성은 대각선으로 나누어진 선 절반의 상단에 표시하였다. 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다. 본 발명의 방법 수행에 유용한 LEJ1 폴리펩티드 서열 간의 서열 동일성 (%)은 서열번호 2와 비교하여 37% (표 10의 모든 단백질 서열이 고려될 때)만큼 낮거나, 60% (가까운 오쏘로그가 고려되었을 때)만큼 낮을 수 있다.
2.
ExbB
폴리펩티드
소프트웨어 분석 결과는 표 11에 나타낸 폴리펩티드 서열의 전체 길이에 걸쳐 전체적인 유사성 및 동일성에 대하여 도 11에 나타내었다. 서열 유사성은 나누어진 선 절반의 하단에 표시하였고, 서열 동일성은 대각선으로 나누어진 선 절반의 상단에 표시하였다. 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다. 본 발명의 방법 수행에 유용한 ExbB 폴리펩티드 서열 간의 서열 동일성 (%)은 서열번호 212와 비교하여 18%만큼 낮을 수 있고, 따라서 일반적으로 18%보다 높다.
3.
NMPRT
폴리펩티드
소프트웨어 분석 결과는 폴리펩티드 서열의 전체 길이에 걸쳐 전체적인 유사성 및 동일성에 대하여 표 13에 나타내었다. 서열 유사성은 나누어진 선 절반의 하단에 표시하였고, 서열 동일성은 대각선으로 나누어진 선 절반의 상단에 표시하였다. 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다. 본 발명의 방법 수행에 유용한 NMPRT 폴리펩티드 서열 간의 서열 동일성 (%)은 서열번호 282와 비교하여 21.4%만큼 낮을 수 있다 (일반적으로 21.4%보다 높다).
1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | |
1. Synechocystis sp. PCC 6803 | 47,7 | 56,7 | 34,3 | 27 | 33,9 | 56,9 | 21,4 | 54,8 | 54,5 | 50,5 | 51,1 | 58,6 | 58 | 58,3 | 34,4 | 55 | |
2. Aureococcus anophagefferens 39495 | 62 | 47 | 35,6 | 27,4 | 33,1 | 45,9 | 24,1 | 49,7 | 45,2 | 45,5 | 45,5 | 49,3 | 49,1 | 45,9 | 35,4 | 45,6 | |
3. Burkholderia phytofirmans PsJN |
71,8 | 63,4 | 35 | 26,9 | 31,3 | 53,6 | 23,9 | 55,4 | 54,9 | 52,2 | 52,7 | 75,7 | 60,3 | 53 | 34,6 | 57,9 | |
4. Chlamydomonas reinhardtii_206505 | 49 | 52 | 50,2 | 49,3 | 54,1 | 34,4 | 20,8 | 36 | 32,9 | 35,5 | 36 | 36,9 | 34,3 | 32 | 80,4 | 34 | |
5. Chlorella vulgaris_72572 | 39,2 | 41,2 | 39,8 | 60,2 | 48,5 | 28,3 | 20,7 | 27,5 | 26,8 | 29,5 | 30,9 | 27,1 | 28 | 28,5 | 45,8 | 28,7 | |
6. Chlorella_133026 | 49,9 | 50,9 | 48,7 | 72,3 | 58,3 | 33,7 | 20,6 | 32,1 | 32,1 | 31,3 | 32,1 | 32,1 | 34,7 | 31,8 | 51,9 | 34,8 | |
7. Deinococcus radiodurans R1 |
72,3 | 60,2 | 69,9 | 49,8 | 39,5 | 49,5 | 22,6 | 54,4 | 52,5 | 51,6 | 52,2 | 53,1 | 55,7 | 55,1 | 34,9 | 52,4 | |
8. Emiliania huxleyi 464234 |
31,4 | 34,8 | 32,8 | 33,3 | 35 | 31,7 | 30,9 | 21,8 | 22,7 | 21,3 | 21,5 | 23,5 | 23,5 | 22,2 | 21,7 | 23,3 | |
9. Hahella chejuensis KCTC 2396 | 70,1 | 62,8 | 69,3 | 52,4 | 41,4 | 47,7 | 70,6 | 31,1 | 55,3 | 59,1 | 58,2 | 55,6 | 53,9 | 51,3 | 35,9 | 52,4 | |
10. Magnetospirillum magneticum AMB-1 | 70,5 | 59,4 | 68 | 48,8 | 40,5 | 49,5 | 66,9 | 33,1 | 70,9 | 52,9 | 52,9 | 53,8 | 58,5 | 50 | 33,8 | 57 | |
11. Pasteurella multocida subsp Pm70 | 70,1 | 61,8 | 68 | 53,6 | 41,9 | 49,1 | 69,3 | 32,9 | 76,6 | 69,9 | 68,6 | 49,1 | 52,5 | 50,1 | 34,4 | 50,8 | |
12. Psychrobacter sp PRwf-1 | 68,6 | 62,4 | 68 | 54,9 | 43,7 | 52,5 | 70,5 | 32,2 | 75,3 | 71,2 | 83,4 | 50,2 | 52,2 | 50,4 | 35,6 | 50,3 | |
13. Ralstonia solanacearum GMI1000 | 71,6 | 64,8 | 86,5 | 50,8 | 39,7 | 49,3 | 68,5 | 32,8 | 70,2 | 66,9 | 65,4 | 66,5 | 64,1 | 53,8 | 36,1 | 61,5 | |
14. Stenotrophomonas maltophilia K279a | 72,7 | 64 | 76 | 52,2 | 41,2 | 50,9 | 69,9 | 33,1 | 70,4 | 70,8 | 70,1 | 70,8 | 75,8 | 55,3 | 34,7 | 74,6 | |
15. Synechococcus elongatus PCC7942 | 74,7 | 62,4 | 70,9 | 51,4 | 40,6 | 49,9 | 71,4 | 32,5 | 70,3 | 67,9 | 70,6 | 68,6 | 70,6 | 71,2 | 32,3 | 53,4 | |
16. Volvox carteri_90876 | 48,3 | 51,1 | 50,5 | 88,1 | 57,5 | 70,2 | 48,9 | 34 | 51,5 | 48,3 | 51,5 | 53 | 51,1 | 52 | 51,5 | 32,8 | |
17. Xanthomonas campestris | 70,8 | 64 | 75,8 | 50,6 | 42,9 | 52,1 | 68,8 | 33 | 69,6 | 68,8 | 69,2 | 68,8 | 77,6 | 83,4 | 69,2 | 50,3 |
실시예
4: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처 (signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브 (hidden Markov) 모델의 큰 집합체이다. Pfam은 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
서열번호 2로 표시된 폴리펩티드 서열의 InterPro 스캔 결과는 표 14에 제시하였다.
단백질
길이 |
데이터베이스 | 번호 | 명칭 | 개시 | 종결 | p-값 |
InterPro
패밀리 |
|
238 | HMMPfam | PF00571 | CBS | 83 | 228 | 1,00E-17 | IPR000644 | Cystathionine beta-synthase, core |
238 | HMMSmart | SM00116 | CBS | 88 | 136 | 1,30E+10 | IPR000644 | Cystathionine beta-synthase, core |
238 | HMMSmart | SM00116 | CBS | 180 | 228 | 4,50E+01 | IPR000644 | Cystathionine beta-synthase, core |
238 | ProfileScan | PS51371 | CBS | 83 | 145 | 0,00E+00 | IPR000644 | Cystathionine beta-synthase, core |
238 | ProfileScan | PS51371 | CBS | 177 | 234 | 0,00E+00 | IPR000644 | Cystathionine beta-synthase, core |
238 | superfamily | SSF54631 | SSF54631 | 73 | 132 | 1,80E+03 | NULL | NULL |
238 | superfamily | SSF54631 | SSF54631 | 167 | 229 | 1,70E-15 | NULL | NULL |
238 | HMMPanther | PTHR11911:SF5 | PTHR11911:SF5 | 11 | 238 | 3,90E-62 | NULL | NULL |
238 | HMMPanther | PTHR11911:SF5 | PTHR11911:SF5 | 11 | 238 | 3,90E-62 | NULL | NULL |
238 | HMMPanther | PTHR11911 | PTHR11911 | 11 | 238 | 3,90E-62 | NULL | NULL |
238 | HMMPanther | PTHR11911 | PTHR11911 | 11 | 238 | 3,90E-62 | NULL | NULL |
2.
ExbB
폴리펩티드
서열번호 212로 표시된 폴리펩티드 서열의 InterPro 스캔 결과는 표 15에 제시하였다.
데이터베이스 | 등록 번호 | 등록 명칭 |
서열번호 212에 대한 아미노산 좌표 (coordinates), e-값
[도메인의 아미노산 위치] |
PFAM | PF01618 | MotA_ExbB | 3.2E-48 [48-188]T |
PF01618은 또한 도 7의 정렬의 하부에 표시하였다.
3.
NMPRT
폴리펩티드
서열번호 282로 표시된 폴리펩티드 서열의 InterPro 스캔 결과는 표 16에 제시하였다.
데이터베이스 | 등록 번호 | 등록 명칭 |
서열번호 282에 대한
아미노산 좌표 |
InterPro | IPR016471 | NMPRT | [1-461] |
PANTHER | PTHR11098 | PTHR11098 | [64-459] |
PANTHER | PTHR11098:SF2 | PTHR11098 : SF2 | [64-459] |
PFAM | PF04095 | NAPRTase | [170-437] |
실시예
5:
LEJ1
폴리펩티드 서열의
Topology
예측
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
TargetP 1.1은 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 집단 (비식물 또는 식물), 컷오프 세트 (없거나, 컷오프의 미리 정의된 세트 또는 컷오프의 사용자 지정 세트) 및 절단 부위 예측의 계산 (유 또는 무)과 같은 많은 매개변수가 선택된다.
서열번호 2로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 17에 제시하였다. "식물" 생물체 집단이 선택되었고, 컷오프는 지정되지 않았고, 운반 펩티드의 예상 길이가 요청되었다. 서열번호 2로 표시된 폴리펩티드 서열의 세포 내 위치는 높은 가능성 점수를 갖는 엽록체일 것으로 예측되었다.
명칭 | Len | cTP | mTP | SP | other | Loc | RC | TPlen |
A.thaliana _AT4G34120 |
238 | 0.879 | 0.050 | 0.007 | 0.026 | C | 1 | 71 |
컷오프 | 0.000 | 0.000 | 0.000 | 0.000 |
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
2.
ExbB
폴리펩티드
TargetP 1.1는 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
부가적으로 또는 대안적으로, 하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
실시예
6: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 연관된 분석
1.
NMPRT
폴리펩티드
NMPRT 폴리펩티드의 특성 규명을 위한 효소 활성 분석은 Gerdes 등 (2006)에 기술되었다.
간단하게, NaMNAT 및 NMNAT 활성을 측정하기 위한 효소 활성 분석은 결합된 분광광도 분석을 사용하였다 (Kurnasov et al. 2002, J. Bacteriol. 184:6906-6917 참고). NMNAT 분석은 Balducci 등 (1995, Anal. Biochem. 228:64-68)에 의해 최초로 개발된, 340 nm에서 UV 흡광도에 의해 모니터링되는 NAD의 NADH로의 알코올 디하이드로게나아제 (alchol dehydrogenase)-촉매 전환에 대한 NAD 형성의 결합 (coupling)에 기반을 두고 있다. 상기 반응은 1 mM까지 NMN을 첨가하여 시작하고, 20분 동안 340 nm에서 관찰하였다. NaMN 특이 활성을 측정하기 위하여, 상기 과정은 첨가된 과량의 순수한 재조합 NADS에 의해 디아미도-NAD (NaAD)가 NAD로 전환되는 추가적인 효소 단계 (Kurnasov et al. 2002 참고)의 도입에 의해 변형되었다.
NADS 활성은 NADS 활성에 대한 연속적인 결합 분광광도 분석에 의해 측정될 수 있다. 반응 혼합물은 100 mM HEPES (pH 8.5) 내에 1 mM NaAD, 2 mM ATP, 10 mM MgCl2, 7 U/ml 알코올 디하이드로게나아제 (Sigma), 46 mM 에탄올, 16 mM 세미카바지드 (semicarbazide) (또는 2 mM NaHSO3), 및 4 mM NH4Cl (또는 2 mM 글루타민)을 포함한다. 반응은 37℃에서 수행되었고, Beckman DU-640 분광광도계를 사용하거나, 동적 연구를 위하여 Tecan-Plus reader를 사용하여 96-웰 플레이트에서 340 nm에서의 UV 흡광도 변화에 의해 관찰되었다.
NMPRT 활성은 연속적인 분광광도 분석에 의해 측정될 수 있다. 상기 분석은 (a) NMNAT에 의한 NMN의 NAD로의 전환 (과발현 및 정제된 이중 NMN/NaMN 특이성을 갖는 재조합 인간 효소 PANT-3 (Zhang et al. 2003, J. Biol. Chem. 278:13503-13511 참고)) 및 (b) NAD의 NADH로의 알코올 디하이드로게나아제 촉매 전환의 2가지 추가적인 효소 단계를 통해 NADH 형성에 NMPRT 활성을 연결한다. 분석은 반응 혼합물이 NMN 대신에 2.0 mM 니코틴아미드, 5 mM ATP 및 0.15 U의 인간 NMNAT가 포함하는 것을 제외하고는, NMNAT 분석을 위해 상기에 기술된 것처럼 수행될 수 있다. 반응은 2 mM까지 포스포리보실 피로포스페이트 (PRPP)을 첨가하여 개시된다.
한 예에서, 시네코시스티스 sp. 균주 PCC 6803에 대한 생화학적 특성 규명은 NMPRT의 하기의 활성을 나타낸다: 150/1 이상의 비율로 기질 1 (Nam)에 대한 효소 활성 (U/mg)은 0.5였고, 기질 2 (NA)에 대해 0.003이었다 (Gerdes 등 (2006)의 표 3 참고).
실시예
7: 본 발명의 방법에 사용된 핵산 서열의
클로닝
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
핵산 서열은 주문제작한 애기장대 (Arabidopsis thaliana) 실생 cDNA 라이브러리를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm14149 (서열번호 203; 정방향, 개시 코돈은 굵은 글씨): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgggttcaatctctttatcc-3' 및 prm14150 (서열번호 204; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggtattcagatctgctccatcact-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 또한 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편은 Gateway 용어에 따르면 "엔트리 클론" pLEJ1을 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 1을 포함하는 엔트리 클론 (entry clone)은 벼 (Oryza sativa) 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 항시적인 (constitutive) 발현을 위한 벼 GOS2 프로모터 (서열번호 201)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pGOS2::LEJ1 (도 5)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044에 형질전환 되었다.
2.
ExbB
폴리펩티드
핵산 서열은 시네코시스티스 sp. PCC 6803 게놈 DNA를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm14244 (서열번호 277; 정방향): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatggccgggggcatag-3' 및 prm14243 (서열번호 278; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggttcatcgggaagtcgcatactctt-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 또한 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편은 Gateway 용어에 따르면 "엔트리 클론" ExbB를 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 211을 포함하는 엔트리 클론 (entry clone)은 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 항시적인 (constitutive) 특이적 발현을 위한 벼 GOS2 프로모터 (서열번호 275)는 이 Gateway 카세트의 업스트림에 위치한다.
두 번째 예에서, 뿌리 특이적 발현을 위한 뿌리 특이적 프로모터 (pRs: 서열번호 276)은 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pGOS2::ExbB (도 10) 및 pRs::ExbB는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044에 각각 형질전환 되었다.
3.
NMPRT
폴리펩티드
핵산 서열은 시네코시스티스 sp. PCC 6803 게놈 DNA를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 Hifi Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm14234 (서열번호 316; 정방향, 개시 코돈 굵은 글씨): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaatactaatctcattctggatg-3' 및 prm14233 (서열번호 317; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggtctagcttgcgggaacatt-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 또한 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편은 Gateway 용어에 따르면 "엔트리 클론" pNMPRT를 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 281을 포함하는 엔트리 클론 (entry clone)은 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 항시적인 (constitutive) 특이적 발현을 위한 벼 GOS2 프로모터 (서열번호 324)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pGOS2::NMPRT (도 14)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044에 형질전환 되었다.
실시예
8: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 벼 (Oryza sativa) 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1분, 0.2% HgCl2에 30분, 멸균된 증류수로 6회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
실시예
9: 다른 작물의 형질전환
옥수수 형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2 mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/
캐놀라
형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물 절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물 절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물 절편을 3 mg/l BAP, 3% 수크로스, 0.7% Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3 mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300 mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지 (MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파
형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65: 654-659). 엽병 식물 절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물 절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100 μM 아세토시린곤을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물 절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시린곤은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50 g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스 (Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨 (sodium hypochlorite) 용액에서 20분간 표면 살균되어, 500 ㎍/ml 세포탁심 (cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50 ㎍/ml 베노밀 (benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴 (6-furfurylaminopurine) 및 750 ㎍/ml MgCl2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴 (6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16시간의 광주기로 배양하였고, 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해지면 재배를 위해 온실로 옮겼다.
실시예
10: 표현형 평가 절차
1. 평가
셋업
약 35개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손의 6개 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자 (이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다. 스트레스가 없는 조건 하에서 자란 식물은 물 및 양분이 제한되지 않는 것을 확실히 하게 하고, 식물이 완전한 생장 및 발달을 위해 필요로 하는 것을 충족시키기 위해 규칙적인 간격으로 급수하였다.
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 적어도 다른 6 각도에서 촬영되었다.
T1 events는 예를 들어, 더 적은 events 및/또는 event 당 더 많은 개체를 사용하여 T1 세대에 대한 것과 동일한 평가 절차에 따라 T2 세대에서 추가로 평가될 수 있다.
가뭄 스크린
T2 종자로부터의 식물체를 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 그리고 그들을 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 관찰하기 위해 무작위로 선택한 화분에 습도 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동으로 식물에 재급수하였다. 그리고 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건 하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T2 종자로부터의 벼 식물체는 양분액을 제외하고는 정상적인 조건 하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 과정 (식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
염분 스트레스 스크린
식물체를 코코넛 섬유(coco fibers) 및 아르젝스(argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)을 양분액에 첨가하였다. 종자 관련 매개변수를 측정하였다.
2. 통계적 분석: F-검정
식물의 표현형적 특성의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 event의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 event에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
3. 측정된 매개변수
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 WO2010/031780에 기술된 것처럼 적어도 다른 6 각도에서 촬영되었다. 이러한 측정은 다양한 매개변수를 결정하기 위해 사용되었다.
생물량
관련 매개변수 측정
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다. 초기 활력은 발아 후 3 주일 때 식물 (실생) 지상부 면적이다. 뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 동안에 관찰된 뿌리의 최대 생물량으로 측정) 또는 뿌리/줄기(shoot) 지수 (뿌리 및 줄기의 활발한 생장기간에 뿌리 질량 및 줄기 질량 간의 비율로 측정)의 증가로 표현된다.
발달 시간에 관한 매개변수
초기 활력은 발아 3주 후의 식물 (실생)의 지상부 면적이다. 초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다.
AreaEmer는 빠른 초기 발달 (대조구 식물에 비하여 감소되었을 때)의 지표이다. 그것은 식물이 최종 생물량의 30%를 생성하기 위해 필요한 시간과 식물이 최종 생물량의 90%를 생성하기 위해 필요한 시간 사이의 비율 (%로 표현)이다.
식물의 "개화 시간"은 WO 2007/093444에 기술된 방법을 사용하여 결정될 수 있다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 충전된 깍지는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 세었다. 충전된 깍지는 분석 저울로 무게를 재었다. 충전된 종자의 수는 분리 단계 후 남은 충전된 깍지의 수를 세어 결정하였다. 총 종자 수확량은 식물체로부터 수확된 모든 충전된 깍지 중량으로 측정하였다. 식물체당 총 종자수는 식물체로부터 수확된 깍지의 수를 세어 측정하였다. 천립 중량 (TKW)은 숫자를 센 충전된 종자의 수와 그 총 중량으로부터 외삽하였다. 본 발명에서 수확 지수 (HI)는 총 종자 수확량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다. 본 발명에서 정의된 원추화서 당 총 꽃의 수는 총 종자 수와 성숙한 1차 원추화서의 수 간의 비율이다. 본 발명에서 정의된 종자 충전율 (fill rate)은 총 종자 (또는 소화) 수에 대한 충전된 종자 수의 비율 (%)로 표시된다.
뿌리 생물량은 WO 2006/029987에 기술된 방법을 사용하여 결정될 수 있다.
실시예
11: 형질전환 식물체의 표현형 평가 결과
1.
LEJ1
(
Loss
of
timing
of
ET
and
JA
biosynthesis
1) 폴리펩티드
스트레스가 없는 조건 하에서 서열번호 2의 LEJ1 폴리펩티드를 코딩하는 핵산을 발현하는 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 충전율 및 수확 지수에 대해 5% 이상의 증가가 관찰되었다.
매개변수 | 전체적인 증가 |
충전율 | 15.6 |
수확지수 | 11.9 |
게다가, LEJ1 핵산을 발현하는 2개 라인은 빠른 성장률 (감소된 AreaEmer)을 보여주며, 다른 라인은 증가된 생물량 (증가된 초장 (HeightMax 및 GravityYMax) 및 증가된 뿌리 생장 (RootThickMax))을 보여준다.
2.
ExbB
폴리펩티드
항시성
프로모터의 조절 하에서
ExbB
폴리펩티드를 코딩하는 핵산 서열을 포함하는 형질전환 벼 식물체의 표현형 평가 결과
스트레스가 없는 조건 하에서 서열번호 211의 가장 긴 ORF (Open Reading Frame)를 포함하는 핵산을 발현하는 T1 세대 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 형질전환 식물체의 세대에 대한 상세한 내용은 이전의 실시예를 참고한다.
스트레스가 없는 조건 하에서 pGOS2::ExbB 벡터의 사용에 의해, 서열번호 212의 ExbB 폴리펩티드를 코딩하는 핵산을 발현하는 T1 세대 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 스트레스가 없는 조건 하에서 자랐을 때, 충전된 종자 수, 즉 충전율에 대해서 적어도 5%의 증가가 관찰되었다 (표 19 참고). 게다가, 형질전환 식물체는 또한 1개 라인에서 총 종자 중량, 충전된 종자 수 및 수확 지수의 현저한 증가, 즉 5% 이상의 증가 및 p-값 0.05 미만을 보여주었다. 다른 2개 라인은 총 종자 중량 및 수확 지수에 대해 긍정적인 경향, 즉 5% 이상의 증가를 보여주었으나, p-값은 0.05를 초과했다.
매개변수 | 전체적인 증가 |
충전율 | 13.3 |
뿌리 특이적 프로모터의 조절 하에서
ExbB
폴리펩티드를 코딩하는 핵산 서열을 포함하는 형질전환 벼 식물체의 표현형 평가 결과
스트레스가 없는 조건 하에서 서열번호 211의 가장 긴 ORF (Open Reading Frame)를 포함하는 핵산을 발현하는 T1 세대 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 형질전환 식물체의 세대에 대한 상세한 내용은 이전의 실시예를 참고한다.
스트레스가 없는 조건 하에서, pRS::ExbB 벡터의 사용에 의해, 서열번호 212의 ExbB 폴리펩티드를 코딩하는 핵산을 발현하는 T1 세대 형질전환 벼 식물체의 표현형 평가 결과는 하기에 나타내었다. 스트레스가 없는 조건 하에서 자랐을 때, 충전된 종자 수, 즉 충전율에 대하여 적어도 5%의 증가가 관찰되었다 (표 20 참고). 게다가, 형질전환 식물체는 또한, 2개 라인에서 TKW라고도 불리는 총 천립 중량의 현저한 증가, 즉 5% 이상의 증가 및 p-값 0.05 미만을 보여주었다. 증가된 충전율을 나타내는 형질전환 라인 1개는 수확 지수에서도 현저한 증가를 보여주었다. 증가된 충전율을 나타내는 형질전환 라인 중 3개 라인은 충전된 종자 수 및 초기 활력에서도 긍정적인 경향을 보여주었다. 다른 2개의 라인은 수확 지수에 대해, 긍정적인 경향, 즉 5% 이상의 증가를 보여주었으나, p-값이 0.05를 초과했다.
매개변수 | 전체적인 증가 |
충전율 | 8.8 |
3.
NMPRT
폴리펩티드
스트레스가 없는 조건 하에서 서열번호 281을 포함하는 핵산을 발현하는 T1 세대 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 형질전환 식물체의 세대에 대한 상세한 내용은 상기를 참고한다.
뿌리/줄기 지수, 총 종자 수확량, 충전율, 원추화서 당 꽃의 수, 충전된 종자의 수를 포함하는 여러 가지 매개변수에 대해, 대조구 식물에 비하여 형질전환 식물체에서 5% 이상의 증가 (p<0.05의 p-값에서)가 관찰 되었으며, 천립 중량에 대해서는 3% 이상의 증가 (p<0.05의 p-값에서)가 관찰 되었다. 충전율은 종자 충전의 지표이며, 소화 (floret)의 수에 대한 충전된 종자 수의 비율 (%로 표현)이다.
한 실험 결과를 하기의 표 21에 나타내었다.
매개변수 |
대조구
식물 대비
전체적인 증가 |
충전율 | 14.2 |
원추화서 당 꽃 | 7.3 |
천립중량 | 4 |
뿌리/줄기 지수 | 5.3 |
뿌리/줄기 지수, 충전율, 원추화서 당 꽃의 수 및 천립 중량 (TKW)에 대한 증가가 관찰되었다. 한 event에 대하여 형질전환 식물체는 대조구 식물에 비하여 총 종자 수확량의 34%의 증가 및 대조구 식물에 비하여 충전된 종자 수의 35%의 증가도 보여주었다.
실시예
12: 서열번호 328 및 서열번호 329에 연관된 서열의 동정
서열번호 329 및 서열번호 329에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 328의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 22는 서열번호 328 및 서열번호 329에 연관된 핵산 서열의 목록을 제공한다.
식물 출처 | 핵산 서열번호 | 단백질 서열번호 |
LOC_Os08g31580 (AP2-26 SEQ ID NO: 329) | 328 | 329 |
A.thaliana_AT1G78080.1#1 | 330 | 331 |
B.napus_TC65671#1 | 332 | 333 |
B.napus_TC90095#1 | 334 | 335 |
B.napus_TC92126#1 | 336 | 337 |
G.max_GM06MC30458_sf81e08@29754#1 | 338 | 339 |
H.vulgare_TC185981#1 | 340 | 341 |
O.sativa_LOC_Os02g51670.1#1 | 342 | 343 |
O.sativa_LOC_Os09g20350.1#1 | 344 | 345 |
P.trichocarpa_798748#1 | 346 | 347 |
P.trichocarpa_scaff_V.168#1 | 348 | 349 |
P.trichocarpa_TC99525#1 | 350 | 351 |
T.aestivum_c50843809@10011#1 | 352 | 353 |
T.aestivum_TC277143#1 | 354 | 355 |
T.aestivum_TC300618#1 | 356 | 357 |
T.aestivum_TC315204#1 | 358 | 359 |
Z.mays_TA17892_4577999#1 | 360 | 361 |
Z.mays_TC478294#1 | 362 | 363 |
Z.mays_TC488418#1 | 364 | 365 |
Z.mays_TC501784#1 | 366 | 367 |
Zea_mays_GRMZM2G003466_T01#1 | 368 | 369 |
Zea_mays_GRMZM2G039870_T01#1 | 370 | 371 |
Zea_mays_GRMZM2G061487_T01#1 | 372 | 373 |
Zea_mays_GRMZM2G061487_T02#1 | 374 | 375 |
Zea_mays_GRMZM2G113060_T01#1 | 376 | 377 |
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. 예를 들어, EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체, 예를 들어 특정한 원핵생물에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정을 허용한다.
실시예
13:
AP2
-26-유사 폴리펩티드 서열의 정렬
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 2.0 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. AP2-26-유사 폴리펩티드는 도 16에 정렬되었다.
AP2-26-유사 폴리펩티드의 계통수 (도 17)는 MAFFT (Katoh and Toh (2008) - Briefings in Bioinformatics 9:286-298)를 사용하여 AP2-26-유사 서열의 정렬에 의해 구축되었다. neighbour-joining tree는 Quick-Tree (Howe et al. (2002), Bioinformatics 18(11): 1546-7), 100 부트스트랩 (bootstrap) 반복을 사용하여 계산되었다. 상기 계통수 (dendrogram)는 Dendroscope (Huson et al. (2007), BMC Bioinformatics 8(1):460)를 사용하여 그려졌다. 100 부트스트랩 반복에 대한 신뢰성 수준은 주요 분지화 (branching)에 대해 표시되었다.
실시예
14: 폴리펩티드 서열 사이의 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전체 길이의 폴리펩티드 서열 사이의 전체적인 유사성 및 동일성 백분율은 당업계의 유용한 방법 중 하나인 MatGAT (Matrix Global Alignment Tool) 소프트 웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 이용하여 결정되었다. MatGAT 소프트웨어는 데이터의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (갭 끊김 벌점 12 및 갭 확장 벌점 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다.
분석 결과는 폴리펩티드 서열의 전체 길이에 걸쳐 전체적인 유사성 및 동일성에 대해 도 18에 나타내었다. 서열 유사성은 나누어진 선 절반의 하단에 표시하였고, 서열 동일성은 대각선으로 나누어진 선 절반의 상단에 표시하였다. 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다. 본 발명의 방법 수행에 유용한 AP2-26-유사 폴리펩티드 서열 간의 서열 동일성(%)은 서열번호 329와 비교하여 36%만큼 낮을 수 있다.
실시예
15: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브 (hidden Markov) 모델의 큰 집합체이다. Pfam은 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
서열번호 329로 표시된 폴리펩티드 서열의 InterPro 스캔 결과 (InterPro database, release 28)는 표 23에 제시하였다.
데이터베이스 | 등록 번호 | 등록 명칭 |
서열번호 329에 대한
아미노산 좌표 |
Prints | PR00367 | ETHRSPELEMNT | T[104-115] T[126-142] |
Gene3D | G3DSA:3.30.730.10 | TF_ERF | T[102-163] |
Pfam | PF00847 | AP2 | T[104-152] |
Smart | SM00380 | AP2 | T[103-166] |
Profile | PS51032 | AP2_ERF | T[103-160] |
superfamily | SSF54171 | DNA-binding_integrase-type | T[102-163] |
일 구현예에서, AP2-26-유사 폴리펩티드는 서열번호 329의 104번 아미노산부터 152번 아미노산까지의 보존된 도메인에 대하여 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함한다.
실시예
16:
AP2
-26-유사 폴리펩티드 서열의
Topology
예측
TargetP 1.1은 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 집단 (비식물 또는 식물), 컷오프 세트 (없거나, 컷오프의 미리 정의된 세트 또는 컷오프의 사용자 지정 세트) 및 절단 부위 예측의 계산 (유 또는 무)과 같은 많은 매개변수가 선택된다.
서열번호 329로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 24에 제시하였다. "식물" 생물체 집단이 선택되었고, 컷오프는 지정되지 않았고, 운반 펩티드의 예상 길이가 요청되었다. 서열번호 329로 표시된 폴리펩티드 서열의 세포 내 위치는 세포질 또는 핵일 수 있으며, 운반 펩티드는 예측되지 않았다.
명칭 | Len | cTP | mTP | SP | other | Loc | RC | TPlen |
서열번호 329 | 280 | 0.399 | 0.076 | 0.035 | 0.684 | _ | 4 | - |
컷오프 | 0.000 | 0.000 | 0.000 | 0.000 |
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003).
실시예
17:
AP2
-26-유사 폴리펩티드에 대한 기능적 분석
Sakuma 등 (Bioch. Biophys. Res. Comm. 290: 998-1009, 2002)은 DREB 전사 인자에서 AP2/ERF 도메인의 기능성을 평가하기 위한 겔 이동성 분석을 기술하였다. 당업자는 그들의 전사 촉진 능력뿐만 아니라 전사인자의 DNA 결합 활성을 분석하기 위한 기술도 주지하고 있다.
실시예
18:
AP2
-26-유사 폴리펩티드 코딩 핵산 서열의
클로닝
AP2-26-유사 폴리펩티드를 코딩하는 핵산 서열은 표준 프로토콜을 이용하여 분리되었고, Gateway® 엔트리 벡터에 클로닝되었다.
서열번호 328을 포함하는 엔트리 클론 (entry clone)은 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 뿌리 특이적 발현을 위한 벼 RCc3 프로모터 (서열번호 382)는 이 Gateway 카세트의 업스트림에 위치한다. LR 재조합 단계 후, 생성된 발현벡터 pRCc3::AP2-26-like (도 19)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044에 형질전환 되었다. 유사한 방법으로, AP2-26-유사 폴리펩티드를 코딩하는 핵산 서열이 벼 GOS2 프로모터를 갖는 destination 벡터에 클로닝되었고, 아그로박테리움에 형질전환 되었다.
실시예
19: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 벼 (Oryza sativa) 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1분, 0.2% HgCl2에 30분, 멸균된 증류수로 6회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
약 35개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
실시예
20: 다른 작물의 형질전환
옥수수 형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2 mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/
캐놀라
형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물 절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물 절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물 절편을 3 mg/l BAP, 3% 수크로스, 0.7% Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3 mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300 mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지 (MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파
형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65: 654-659). 엽병 식물 절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물 절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100 μM 아세토시린곤을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물 절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시린곤은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50 g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스 (Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨 (sodium hypochlorite) 용액에서 20분간 표면 살균되어, 500 ㎍/ml 세포탁심 (cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50 ㎍/ml 베노밀 (benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴 (6-furfurylaminopurine) 및 750 ㎍/ml MgCl2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴 (6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16시간의 광주기로 배양하였고, 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해지면 재배를 위해 온실로 옮겼다.
실시예
21: 표현형 평가 절차
21.1. 평가
셋업
35 내지 90개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손의 6개 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자 (이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다. 스트레스가 없는 조건 하에서 자란 식물은 물 및 양분이 제한되지 않는 것을 확실히 하게 하고, 그들이 스트레스 스크린에 사용되지 않을 경우, 식물이 완전한 생장 및 발달을 위해 필요로 하는 것을 충족시키기 위해 규칙적인 간격으로 급수하였다.
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 적어도 다른 6 각도에서 촬영되었다.
T1 events는 예를 들어, 더 적은 events 및/또는 event 당 더 많은 개체를 사용하여 T1 세대에 대한 것과 동일한 평가 절차에 따라 T2 세대에서 추가로 평가될 수 있다.
가뭄 스크린
T1 또는 T2 식물체는 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 그리고 그들을 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 관찰하기 위해 무작위로 선택한 화분에 토양 수분 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동으로 식물에 재급수하였다. 그리고 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건 하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T1 또는 T2 식물체는 양분액을 제외하고는 정상적인 조건 하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 과정 (식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
염분 스트레스 스크린
T1 또는 T2 식물체는 코코넛 섬유(coco fibers) 및 구운 점토 입자 (Argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)을 양분액에 첨가하였다. 생장 및 수확량 매개변수는 정상 조건 하에서의 생장에 대해 상세히 기록하였다.
21.2 통계적 분석: F-검정
식물의 표현형적 특성의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 event의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 event에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
21.3. 측정된 매개변수
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 WO2010/031780에 기술된 것처럼 적어도 다른 6 각도에서 촬영되었다. 이러한 측정은 다양한 매개변수를 결정하기 위해 사용되었다.
생물량
관련 매개변수 측정
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다.
뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 동안에 관찰된 뿌리의 최대 생물량으로 측정) 또는 뿌리 및 줄기의 활발한 생장기간에 뿌리 질량 및 줄기 질량 간의 비율로 측정되는 뿌리/줄기(shoot) 지수의 증가로 표현된다. 즉, 뿌리/줄기 지수는 뿌리 및 줄기의 활발한 생장 기간에 줄기 생장 속도 (rapidity)에 대한 뿌리 생장 속도의 비율로 정의된다. 뿌리 생물량은 WO 2006/029987에 기술된 방법을 사용하여 결정될 수 있다.
발달 시간에 관한 매개변수
초기 활력은 발아 3주 후의 식물의 지상부 면적이다. 초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다.
AreaEmer는 대조구 식물에 비하여 이 값이 감소되었을 때, 빠른 초기 발달의 지표이다. 그것은 식물이 최종 생물량의 30%를 생성하기 위해 필요한 시간과 최종 생물량의 90%를 생성하기 위해 필요한 시간 사이의 비율 (%로 표현)이다.
식물의 "꽃을 피우기 위한 시간" 또는 "개화 시간"은 WO 2007/093444에 기술된 방법을 사용하여 결정될 수 있다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 종자는 일반적으로 깍지인 마른 외피로 감싸져있다. 충전된 깍지 (본 발명에서는 또한 충전된 소화로 불림)는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 다시 세었다. 충전된 깍지는 분석 저울로 무게를 재었다.
총 종자의 수는 분리 단계 후 남은 충전된 깍지의 수를 세어 결정하였다. 총 종자 무게는 식물체로부터 수확된 모든 충전된 깍지 중량으로 측정하였다.
식물체당 총 종자 (또는 소화)의 수는 식물체로부터 수확된 깍지 (충전되었든 되지 않았든)의 수를 세어 결정하였다.
천립 중량 (TKW)은 숫자를 센 종자의 수와 그 총 중량으로부터 외삽하였다.
본 발명에서 수확 지수 (HI)는 총 종자 중량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다.
본 발명에서 정의된 원추화서 당 꽃의 수는 성숙한 1차 원추화서의 수에 대한 총 종자 수의 비율이다.
본 발명에서 정의된 "종자 충전도 (fill rate)" 또는 "종자 충전율 (filling rate)"는 총 종자 수 (즉, 총 소화의 수)에 대한 충전된 종자 수 (즉, 종자를 함유한 소화)의 비율 (%로 표현)이다. 즉, 종자 충전율은 종자로 충전된 소화의 백분율이다.
실시예
22: 형질전환 식물체의 표현형 평가 결과
수확량 스크린에서 RCc3 프로모터의 조절 하에 AP2-26-유사 핵산을 발현하는 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 스트레스가 없는 조건 하에서 자랐을 때, 출현 활력 (초기 활력), 충전율 및 수확 지수에 대해 적어도 5%의 증가가 관찰되었다.
매개변수 | 전체적인 증가 |
EmerVigor | 15.4 |
충전율 | 9.0 |
수확지수 | 6.5 |
게다가, AP2-26-유사 핵산을 발현하는 식물체는 증가된 생물량 (지상부 생물량 및 뿌리 생물량), 증가된 총 종자 중량 및 증가된 천립 중량을 가졌다.
수확량 스크린에서 검정되었을 때, 증가된 천립 중량은 또한 GOS2 프로모터의 조절 하에서 AP2-26-유사 핵산을 발현하는 형질전환 벼 식물체에서 관찰되었다.
실시예
23: 서열번호 384 및 서열번호 385에 연관된 서열의 동정
서열번호 384 및 서열번호 385에 연관된 서열 (전체 길이 cDNA, ESTs 또는 게놈)이 BLAST (Basic Local Alignment Tool) 같은 데이터베이스 서열 탐색 도구를 사용하여 NCBI (National Center for Biotechnology Information)의 Entrez 뉴클레오티드 데이터베이스 (Altschul 등 (1990) J. Mol. Biol. 215:403-410; 및 Altschul 등 (1997) Nucleic Acids Res. 25:3389-3402)에 보유된 것 중에서 동정되었다. 이 프로그램은 핵산 또는 폴리펩티드 서열을 서열 데이터베이스에 비교하고, 매치 (match)의 통계적 유의성을 계산하여 서열 간에 국부적인 유사성이 있는 영역을 발견하는 데 사용된다. 예를 들면, 서열번호 384의 핵산에 의해 코딩된 폴리펩티드는 낮은 복잡성 서열 세트 오프를 무시하기 위해, 디폴트 셋팅 및 필터를 갖는 TBLASTN 알고리즘에 대해 이용되었다. 분석 결과는 pairwise 비교로 보이게 하였으며, 확률 점수 (E-값)에 따라 순위를 매겼으며, 여기서 점수는 특정 정렬이 우연히 발생할 가능성을 반영한다 (E-값이 낮을수록 hit가 보다 유의하다). E-값 외에, 비교는 동일성 백분율에 의해서도 점수가 매겨진다. 동일성 백분율은 특정 길이에 걸쳐 두 가지 비교되는 핵산 (또는 폴리펩티드) 서열 간에 동일한 뉴클레오티드 (또는 아미노산)의 수를 말한다. 특정 경우에, 탐색의 엄격성을 변경하기 위하여 디폴트 매개변수를 조절할 수도 있다. 예를 들면, E-값은 덜 엄격한 일치부위를 보이기 위해 증가될 수도 있다. 이와 같은 방식으로, 거의 정확하게 일치하는 짧은 부위가 동정될 수 있다.
표 26은 서열번호 384 및 서열번호 385에 연관된 핵산 서열의 목록을 제공한다.
식물 출처 | 핵산 서열번호 | 단백질 서열번호 |
>O.sativa_LOC_Os08g19590.2 | 384 | 385 |
>Medicago truncatula HD | 386 | 387 |
>A.thaliana_AT5G52170.1 | 388 | 389 |
>A.thaliana_AT4G04890.1 | 390 | 391 |
>A.thaliana_AT4G00730.2 | 392 | 393 |
>A.thaliana_AT1G79840.1 | 394 | 395 |
>A.thaliana_AT2G32370.1 | 396 | 397 |
>A.thaliana_AT4G25530.1 | 398 | 399 |
>A.thaliana_AT3G61150.1 | 400 | 401 |
>A.thaliana_AT1G17920.1 | 402 | 403 |
>A.thaliana_AT1G73360.1 | 404 | 405 |
>A.thaliana_AT1G05230.2 | 406 | 407 |
>A.thaliana_AT1G05230.3 | 408 | 409 |
>A.thaliana_AT4G00730.1 | 410 | 411 |
>A.thaliana_AT4G21750.2 | 412 | 413 |
>G.max_Glyma16g34350.1 | 414 | 415 |
>G.max_Glyma10g38280.1 | 416 | 417 |
>G.max_Glyma15g01960.1 | 418 | 419 |
>G.max_Glyma09g40130.1 | 420 | 421 |
>G.max_Glyma03g01860.1 | 422 | 423 |
>G.max_Glyma13g38430.1 | 424 | 425 |
>G.max_Glyma08g06190.1 | 426 | 427 |
>G.max_Glyma09g29810.1 | 428 | 429 |
>G.max_Glyma20g29580.1 | 430 | 431 |
>G.max_Glyma11g00570.1 | 432 | 433 |
>G.max_Glyma16g32130.1 | 434 | 435 |
>G.max_Glyma06g46000.1 | 436 | 437 |
>G.max_Glyma12g32050.1 | 438 | 439 |
>G.max_Glyma12g10710.1 | 440 | 441 |
>G.max_Glyma01g45070.1 | 442 | 443 |
>G.max_Glyma05g33520.1 | 444 | 445 |
>G.max_Glyma01g01850.1 | 446 | 447 |
>G.max_Glyma13g43350.2 | 448 | 449 |
>G.max_Glyma09g26600.1 | 450 | 451 |
>G.max_Glyma10g39720.2 | 452 | 453 |
>G.max_Glyma13g43350.1 | 454 | 455 |
>G.max_Glyma18g45970.1 | 456 | 457 |
>G.max_Glyma07g08340.1 | 458 | 459 |
>G.max_Glyma09g34070.1 | 460 | 461 |
>Hordeum_vulgare_PUT-169a-82273 | 462 | 463 |
>M.truncatula_AC202466_12.4 | 464 | 465 |
>M.truncatula_AC148764_30.5 | 466 | 467 |
>M.truncatula_AC123975_4.5 | 468 | 469 |
>M.truncatula_AC173288_41.5 | 470 | 471 |
>M.truncatula_CT485796_15.4 | 472 | 473 |
>O.sativa_LOC_Os08g08820.2 | 474 | 475 |
>O.sativa_LOC_Os02g45250.1 | 476 | 477 |
>O.sativa_LOC_Os04g48070.3 | 478 | 479 |
>O.sativa_LOC_Os09g35760.2 | 480 | 481 |
>O.sativa_LOC_Os10g42490.2 | 482 | 483 |
>O.sativa_LOC_Os04g53540.3 | 484 | 485 |
>O.sativa_LOC_Os06g10600.1 | 486 | 487 |
>O.sativa_LOC_Os01g55549.1 | 488 | 489 |
>O.sativa_LOC_Os04g53540.4 | 490 | 491 |
>O.sativa_LOC_Os04g48070.2 | 492 | 493 |
>O.sativa_LOC_Os08g19590.3 | 494 | 495 |
>O.sativa_LOC_Os09g35760.1 | 496 | 497 |
>O.sativa_LOC_Os08g04190.1 | 498 | 499 |
>O.sativa_LOC_Os04g48070.1 | 500 | 501 |
>P.trichocarpa_scaff_III.687 | 502 | 503 |
>P.trichocarpa_scaff_29.235 | 504 | 505 |
>P.trichocarpa_scaff_II.1438 | 506 | 507 |
>P.trichocarpa_scaff_122.86 | 508 | 509 |
>P.trichocarpa_scaff_XV.1195 | 510 | 511 |
>P.trichocarpa_scaff_II.2114 | 512 | 513 |
>P.trichocarpa_scaff_XII.63 | 514 | 515 |
>P.trichocarpa_scaff_IV.76 | 516 | 517 |
>P.trichocarpa_scaff_XII.1124 | 518 | 519 |
>P.trichocarpa_scaff_XIV.211 | 520 | 521 |
>P.trichocarpa_scaff_44.222 | 522 | 523 |
>P.trichocarpa_scaff_XIV.993 | 524 | 525 |
>P.trichocarpa_scaff_XI.213 | 526 | 527 |
>Solanum_lycopersicum_GQ222185 | 528 | 529 |
>P.trichocarpa_HB1-like | 530 | 531 |
>T.aestivum_TC277292 | 532 | 533 |
>Zea_mays_GRMZM2G122897_T01 | 534 | 535 |
>Zea_mays_AC235534.1_FGT007 | 536 | 537 |
>Zea_mays_GRMZM2G116658_T01 | 538 | 539 |
>Zea_mays_GRMZM2G004957_T02 | 540 | 541 |
>Zea_mays_GRMZM2G001289_T02 | 542 | 543 |
>Zea_mays_GRMZM2G118063_T02 | 544 | 545 |
>Zea_mays_GRMZM2G026643_T01 | 546 | 547 |
>Zea_mays_GRMZM2G001289_T01 | 548 | 549 |
>Zea_mays_GRMZM2G130442_T02 | 550 | 551 |
>Zea_mays_GRMZM2G118063_T03 | 552 | 553 |
>Zea_mays_GRMZM2G438260_T01 | 554 | 555 |
>Zea_mays_GRMZM2G130442_T01 | 556 | 557 |
>Zea_mays_GRMZM2G004334_T01 | 558 | 559 |
>Zea_mays_GRMZM2G026643_T02 | 560 | 561 |
서열은 TIGR (The Institute for Genomic Research; TA로 시작)과 같은 연구 기관에 의해 시험적으로 조립되어 (assembled), 공개된다. 예를 들어, EGO (Eukaryotic Gene Orthologs) 데이터베이스는 키워드 탐색으로 또는 관심 있는 핵산 서열 또는 폴리펩티드 서열로 BLAST 알고리즘을 사용하여 상기와 같은 연관 서열의 동정에 사용될 수 있다. 특별한 핵산 서열 데이터베이스는 통합 게놈 연구소 (Joint Genome Institute)에 의한 것과 같은 특정한 생물체, 예를 들어 특정한 원핵생물에 대해 생성된다. 더욱이, 사유 데이터베이스에 대한 접근은 새로운 핵산 및 폴리펩티드 서열의 동정을 허용한다.
실시예
24:
HD8
-유사 폴리펩티드 서열의 정렬
폴리펩티드 서열의 정렬은 표준 세팅 (느린 정렬, 유사 매트릭스: Gonnet, 갭 끊김 벌점 10, 갭 확장 벌점: 0.2)으로 점진적인 정렬의 ClustalW 2.0 알고리즘 (Thompson et al. (1997) Nucleic Acids Res 25:4876-4882; Chenna et al. (2003). Nucleic Acids Res 31:3497-3500)을 사용하여 수행되었다. 정렬을 최적화하기 위해 약간의 편집이 수작업으로 가해졌다. HD8-유사 폴리펩티드는 도 21에 정렬되었다.
HD8-유사 폴리펩티드의 계통수 (도 22)는 Jain 등 (2008)에 의해 기술된 것처럼 구축되었다. 모든 단백질 서열로부터의 smart에 의해 규명된 호메오박스 도메인의 다중 서열 정렬은 clustalx 버전 1.83을 사용하여 수행되었다. 분지되지 않은 계통수 (unrooted phylogenetic tree)는 Neighbourjoining 방법 (Saitou & Nei, Mol Biol Evol 4, 406-425, 1987)에 의해 구축되었고, njplot (Perriere & Gouy, Biochimie 78, 364-369, 1996)를 사용하여 표현되었다.
실시예
25: 폴리펩티드 서열 사이의 전체적인 동일성 백분율 계산
본 발명의 방법 수행에 유용한 전체 길이의 폴리펩티드 서열 사이의 전체적인 유사성 및 동일성 백분율은 당업계의 유용한 방법 중 하나인 MatGAT (Matrix Global Alignment Tool) 소프트 웨어 (BMC Bioinformatics. 2003 4:29. MatGAT: an application that generates similarity/identity matrices using protein or DNA sequences. Campanella JJ, Bitincka L, Smalley J; Ledion Bitincka에 의해 호스팅되는 소프트웨어)를 이용하여 결정되었다. MatGAT 소프트웨어는 데이터의 사전 정렬의 필요없이 DNA 또는 단백질 서열에 대한 유사성/동일성 행렬을 생성한다. 상기 프로그램은 Myers 및 Miller 전체적인 정렬 알고리즘 (갭 끊김 벌점 12 및 갭 확장 벌점 2로)을 사용하여 일련의 pair-wise 정렬을 수행하고, 예를 들면, Blosum 62 (폴리펩티드에 대하여)를 사용하여 유사성 및 동일성을 계산하여, 결과를 거리 행렬로 배열한다.
분석 결과는 폴리펩티드 서열의 전체 길이에 걸쳐 전체적인 유사성 및 동일성에 대해 도 23에 나타내었다. 서열 유사성은 나누어진 선 절반의 하단에 표시하였고, 서열 동일성은 대각선으로 나누어진 선 절반의 상단에 표시하였다. 비교에 사용된 매개변수는 스코링 매트릭스 (scoring matrix): Blosum62, 첫째 갭: 12, 연장 갭: 2이다. 본 발명의 방법 수행에 유용한 HD8-유사 폴리펩티드 서열 간의 서열 동일성 (%)은 서열번호 385와 비교하여 10.4% 만큼 낮을 수 있지만, 일반적으로 20%보다 높다.
실시예
26: 본 발명의 방법 수행에 유용한 폴리펩티드 서열에 포함된 도메인의 동정
InterPro (The Integrated Resource of Protein Families, Domains and Sites) 데이터베이스는 문자 및 서열에 근거한 탐색을 위한 통상적으로 사용되는 시그너처(signature) 데이터베이스에 대한 통합된 인터페이스이다. InterPro 데이터베이스는 단백질 시그너처를 유도하기 위해 다른 방법론 및 잘 규명된 단백질에 관한 다양한 정도의 생물학적 정보를 사용하는 이들 데이터베이스를 통합한다. 협력 데이터베이스는 SWISS-PROT, PROSITE, TrEMBL, PRINTS, ProDom 및 Pfam, Smart 및 TIGRFAMs을 포함한다. Pfam은 많은 일반적인 단백질 도메인 및 패밀리를 포함하는 복수 서열 정렬 및 숨겨진 마코브 (hidden Markov) 모델의 큰 집합체이다. Pfam은 영국의 생거 연구소 서버에서 호스팅된다. InterPro는 영국의 유럽 생물정보학 연구소 (European Bioinformatics Institute)에서 호스팅된다.
서열번호 385로 표시된 폴리펩티드 서열의 InterPro 스캔 결과 (InterPro database, release 29.0)는 표 27에 제시하였다.
방법 | 등록 번호 | 짧은 명칭 | 위치 |
InterPro | IPR001356 | Homeobox | x |
BlastProDom | PD000010 | Homeobox | T[60-117] 0.0 |
FPrintScan | PR00024 | HOMEOBOX | T[98-108] 0.03 T[108-117] 0.03 |
HMMPfam | PF00046 | Homeobox | T[62-118] 4.60E-19 |
HMMSmart | SM00389 | HOX | T[61-123] 1.39E-17 |
ProfileScan | PS50071 | HOMEOBOX_2 | T[59-119] 0.0 |
InterPro | IPR002913 | Lipid-binding START | x |
HMMPfam | PF01852 | START | T[265-500] 1.79E-26 |
HMMSmart | SM00234 | START | T[254-500] 1.59E-12 |
ProfileScan | PS50848 | START | T[245-503] 0.0 |
InterPro | IPR009057 | Homeodomain-like | x |
Superfamily | SSF46689 | Homeodomain_like | T[48-118] 1.9E-18 |
InterPro | IPR012287 | Homeodomain-related | x |
Gene3D | G3DSA:1.10.10.60 | Homeodomain-rel | T[28-124] 4.19E-15 |
InterPro | NULL | NULL | x |
HMMPanthe | PTHR19418 | PTHR19418 | T[36-155] 6.4E-15 T[36-279] 6.4E-15 T[248-279] 6.4E-15 |
일 구현예에서, HD8-유사 폴리펩티드는 서열번호 385의 265번 아미노산부터 500번 아미노산까지의 보존된 도메인에 대하여 적어도 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%의 서열 동일성을 갖는 보존된 도메인 (또는 모티프)를 포함한다.
실시예
27:
HD8
-유사 폴리펩티드 서열의
Topology
예측
TargetP 1.1은 진핵세포 단백질의 세포 내 위치를 예측한다. 위치 지정은 임의의 N-말단 사전 서열 (엽록체 운반 펩티드 (cTP), 미토콘드리아 표적 펩티드 (mTP) 또는 분비 경로 신호 펩티드 (SP))의 예측된 존재에 근거한다. 최종 예측이 근거를 둔 점수는 실제로 가능성은 아니며, 하나에 반드시 추가하지는 않는다. 그러나, 가장 높은 점수를 갖는 위치는 아마 TargetP에 따른 것이며, 점수 간에 상관 관계 (신뢰성 등급)는 아마 그 예측이 얼마나 확실한가의 표시이다. 신뢰성 등급 (RC)은 1에서 5까지이며, 1은 가장 강한 예측을 나타낸다. TargetP는 [Technical University of Denmark]의 서버에서 유지된다.
N-말단 사전 서열을 포함하는 것으로 예측되는 서열에 대해 잠재적인 절단 부위도 예측 가능하다.
생물체 집단 (비식물 또는 식물), 컷오프 세트 (없거나, 컷오프의 미리 정의된 세트 또는 컷오프의 사용자 지정 세트) 및 절단 부위 예측의 계산 (유 또는 무)과 같은 많은 매개변수가 선택된다.
서열번호 385로 표시된 폴리펩티드 서열의 TargetP 1.1 분석 결과는 표 28에 제시하였다. "식물" 생물체 집단이 선택되었고, 컷오프는 지정되지 않았고, 운반 펩티드의 예상 길이가 요청되었다.
명칭 | Len | cTP | mTP | SP | other | Loc | RC | TPlen |
서열번호 385 | 786 | 0.085 | 0.073 | 0.488 | 0.255 | S | 4 | 20 |
컷오프 | 0.000 | 0.000 | 0.000 | 0.000 |
하기의 것을 포함하여 많은 다른 알고리즘도 이런 분석 수행에 사용될 수 있다:
● [Technical University of Denmark]의 서버상에 호스팅된 ChloroP 1.1;
● [Institute for Molecular Bioscience, University of Queensland, Brisbane, Australia]의 서버상에 호스팅된 Protein Prowler Subcellular Localisation Predictor version 1.2;
● [University of Alberta, Edmonton, Alberta, Canada]의 서버상에 호스팅된 PENCE Proteome Analyst PA-GOSUB 2.5;
● [Technical University of Denmark]의 서버상에 호스팅된 TMHMM
● PSORT (URL: psort.org)
● PLOC (Park and Kanehisa, Bioinformatics, 19, 1656-1663, 2003)
● 핵 위치화가 예상되는 핵 위치화 신호 예상 알고리즘 (Rostlab.org)인 PredictNLS.
실시예
28:
HD8
-유사 폴리펩티드에 대한 기능적 분석
Di Cristina 등 (Plant J. 10, 393-402, 1996)은 서브패밀리 IV의 애기장대 HD-ZIP 단백질인 GLABRA2의 상세한 특성을 제공한다. 연구는 겔 이동성 변화 분석 (gel mobility shift assay)를 포함한다.
실시예
29:
HD8
-유사 코딩 핵산 서열의
클로닝
핵산 서열은 주문제작한 벼 (Oryza sativa) 실생 cDNA 라이브러리를 주형으로 사용하여 PCR로 증폭되었다. PCR은 표준 조건에서 상업적으로 유용한 교정 (proofreading) Taq DNA 중합효소를 사용하여, 50 ㎕ PCR 혼합물 내에 주형 200 ng을 사용하여 수행되었다. 사용된 프라이머는 prm15035 (서열번호 567; 정방향, 개시코돈 굵은 글씨): 5'-ggggacaagtttgtacaaaaaagcaggcttaaacaatgaacggcgagcttaaact-3' 및 prm15036 (서열번호 568; 역방향, 상보적): 5'-ggggaccactttgtacaagaaagctgggtctttcgcatgcaaatgctac-3'이며, 상기 프라이머는 Gateway 재조합에 대한 AttB 부위를 포함한다. 증폭된 PCR 단편은 또한 표준 방법을 사용하여 정제되었다. Gateway 과정의 첫 단계인 BP 반응이 수행되었으며, 이때 PCR 단편은 Gateway 용어에 따르면 "엔트리 클론" pHD8-like을 생성하기 위해 pDONR201 플라스미드와 생체 내에서 (in vivo) 재조합되었다. 플라스미드 pDONR201은 Gateway® 기술의 일부분으로서, Invitrogen으로부터 구입하였다.
서열번호 385를 포함하는 엔트리 클론 (entry clone)은 벼 형질전환에 사용된 destination 벡터와의 LR 반응에 사용되었다. 이 벡터는 T-DNA 경계 내에 기능적 요소로서 하기의 것을 함유한다: 식물 선발 마커; 스크린 가능한 마커 발현 카세트; 및 엔트리 클론에 이미 클로닝된 목적 핵산 서열과 LR 생체 내 재조합을 위한 의도된 Gateway 카세트. 뿌리 특이적 발현을 위한 벼 RCc3 프로모터 (서열번호 565)는 이 Gateway 카세트의 업스트림에 위치한다.
LR 재조합 단계 후, 생성된 발현벡터 pRCc3::HD8-like (도 24)는 당업계에 주지된 방법에 따라 아그로박테리움 균주 LBA4044에 형질전환 되었다.
실시예
30: 식물 형질전환
벼 형질전환
발현 벡터를 함유하는 아그로박테리움이 벼 (Oryza sativa) 식물의 형질전환에 사용되었다. 벼 야포니카 재배 품종 니폰바레의 성숙한 건조 종자의 껍질을 벗겼다. 70% 에탄올에 1분, 0.2% HgCl2에 30분, 멸균된 증류수로 6회, 15분 세척하여 멸균하였다. 멸균된 종자를 2,4-D 함유 배지 (캘러스 유도배지)에서 발아시켰다. 암소에서 4주간 배양 후, 배, 배반-유래 캘러스를 절단하여 동일한 배지에서 번식시켰다. 2주 후, 캘러스는 계대배양에 의해 동일한 배지 상에서 또 다른 2주간 증식되거나 번식되었다. 배 캘러스 단편은 (세포 분열 활성을 증대시키기 위하여) 공동배양 3일 전에 신선한 배지 상에서 계대배양 되었다.
발현 벡터 함유 아그로박테리움 균주 LBA4404가 공동배양에 사용되었다. 아그로박테리움은 적절한 항생제가 포함된 AB 배지에 접종되어, 28℃에서 3일간 배양되었다. 세균을 수집하여 밀도 (OD600) 약 1이 되게 액체 공동배양 배지에 현탁액을 만들었다. 이 현탁액을 페트리디쉬에 옮겨 캘러스를 현탁액에 15분간 침지하였다. 캘러스 조직을 필터 페이퍼 상에 옮겨 건조시킨 후, 굳힌 공동배양 배지에 옮겨 25℃, 암소에서 3일간 배양하였다. 공동배양된 캘러스를 선발제의 존재 하에 2,4-D-함유 배지에서 28℃, 암소에서 4주간 키웠다. 이 기간 중에, 급속히 자라는 저항성 캘러스 섬이 발달되었다. 이를 재분화 배지에 옮겨 명소에서 배양 후, 배가 방출되었으며 다음 4 내지 5주 후에 어린 줄기가 발달되었다. 어린 줄기를 캘러스에서 절단하여 옥신 함유 배지에서 2 내지 3주간 배양하여 토양으로 이식하였다. 강해진 어린 줄기를 온실 내 고습도 및 단일에서 키웠다.
35 내지 90개의 독립적인 T0 벼 형질전환체가 한 구축물당 생성되었다. 일차 형질전환체를 조직 배양실에서 온실로 옮겼다. T-DNA 삽입물의 카피 수를 확인하기 위한 정량적 PCR 분석 후, 선발제에 내성을 보이는 한 카피 형질전환 식물을 T1 종자 수확을 위하여 유지하였다. 이식 3 내지 5개월 후 종자를 수확하였다. 본 방법으로 한 좌위 형질전환체가 50% 넘는 비율로 생산되었다 (Aldemita and Hodges 1996, Chan 등 1993, Hiei 등 1994).
실시예
31: 다른 작물의 형질전환
옥수수 형질전환
옥수수 (Zea mays) 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법을 변형하여 수행하였다. 옥수수에 있어 형질전환은 유전형에 의존하며, 특정 유전형만이 형질전환 및 재분화를 받아들인다. 근교계통 A188 (University of Minnesota) 또는 양친으로서 A188과의 교배는 형질전환을 위한 공여자의 좋은 원천이나 다른 유전형도 성공적으로 사용될 수 있다. 옥수수 알을 미성숙된 배의 길이가 약 1 내지 1.2 mm일 때인 수분 후 약 11일된 옥수수 식물체로부터 수확한다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 절단된 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 옥수수 재분화 배지에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 옥수수 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
밀 형질전환
밀의 형질전환은 [Ishida 등 (1996) Nature Biotech 14(6): 745-50]에 기재된 방법으로 수행하였다. 재배품종 봅화이트 (Bobwhite; CIMMYT, Mexico로부터 입수 가능)가 형질전환에 흔히 사용된다. 미성숙한 배는 발현 벡터를 함유하는 아그로박테리움 투머파시엔스와 공배양 되었으며, 형질전환 식물체는 기관발생을 통해 회수된다. 아그로박테리움과의 공배양 후 배를 캘러스 유도 배지에서, 다음에는 선발제 (예를 들면 이미다졸리논, 그러나 다양한 선발 마커 사용 가능)를 함유하는 재분화 배지에서 시험관 내에서 키운다. 페트리 플레이트를 명소, 25℃에서 2 내지 3주간, 또는 어린 줄기가 발달하기까지 배양한다. 각 배에서 녹색 어린 줄기를 발근 배지로 옮겨 25℃에서 2 내지 3주간 뿌리가 발달하기까지 배양한다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
대두 형질전환
대두는 Texas A&M 특허 US 5,164,310에 기재된 방법을 변형하여 형질전환되었다. 몇 가지 상업적 대두 변종은 이 방법에 의한 형질전환을 수용한다. 재배품종 잭 (Jack; Illinois Seed foundation으로부터 입수 가능)이 흔히 형질전환에 사용된다. 대두 종자는 시험관 내 파종을 위해 멸균된다. 하배축, 유근 및 자엽 하나를 7일 된 어린 실생으로부터 잘라낸다. 상배축 및 나머지 자엽을 엽액 마디가 발달할 때까지 키운다. 이 엽액 마디를 잘라내어 발현벡터를 함유하는 아그로박테리움 투머파시엔스와 배양한다. 공배양 후 잘라낸 식물체 조각을 수세하여 선발 배지로 옮긴다. 재분화된 어린 줄기를 잘라내어 어린 줄기 신장 배지에 둔다. 1 cm가 되지 않는 어린 줄기를 뿌리가 발달하기까지 발근 배지에 둔다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
유채/
캐놀라
형질전환
5 내지 6일된 어린 실생의 자엽 엽병 및 하배축이 조직 배양을 위한 식물 절편으로 사용되었으며 Babic 등 (1998, Plant Cell Rep 17: 183-188)에 따라 형질전환되었다. 상업적 재배종 웨스타 (Westar; Agriculture Canada)가 형질전환을 위한 표준 변종으로 사용되나, 다른 변종도 사용될 수 있다. 캐놀라 종자는 시험관 내 파종을 위해 표면 멸균된다. 자엽이 붙어 있는 자엽 엽병 식물 절편을 시험관 내 실생으로부터 절단하여, 엽병 절편의 잘린 끝 부분을 세균 현탁액에 담구어 아그로박테리움 (발현 벡터 포함)을 접종하였다. 식물 절편을 3 mg/l BAP, 3% 수크로스, 0.7% Phytagar를 함유하는 MSBAP-3 배지에서 23℃에서, 16시간의 빛 하에서 2일간 배양하였다. 아그로박테리움과의 공배양 2일 후, 엽병 식물 절편을 3 mg/l BAP, 세포탁심, 카베니실린, 또는 티멘틴 (300 mg/l)을 함유하는 MSBAP-3 배지에 옮겨 7일간 둔 후, 어린 줄기가 재분화될 때까지 세포탁심, 카베니실린, 또는 티멘틴 및 선발제가 든 MSBAP-3 배지에 배양하였다. 어린 줄기의 길이가 5 내지 10 mm일 때 잘라 어린 줄기 신장 배지 (0.5 mg/l BAP 함유 MSBAP-0.5)로 옮긴다. 길이 약 2 cm인 어린 줄기를 뿌리 유도를 위하여 발근 배지(MS0)로 옮긴다. 발근된 어린 줄기를 온실의 토양으로 이식한다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
알팔파
형질전환
알팔파 (Medicago sativa)의 재생 클론이 (McKersie 등, 1999 Plant Physiol 119: 839-847)의 방법으로 형질전환된다. 알팔파의 재생 및 형질전환은 유전형 의존적이므로 재생식물이 요구된다. 재생식물을 얻는 방법이 기재된다. 예를 들면, 이들은 재배품종 랭그랜더 (Rangelander; Agriculture Canada) 또는 Brown DCW 및 A Atanassov (1985. Plant Cell Tissue Organ Culture 4: 111-112)에 의해 기재된 임의의 다른 상업적 알팔파 변종으로부터 선택할 수 있다. 다르게는, RA3 변종 (University of Wisconsin)이 조직배양에 사용하기 위해 선택되었다 (Walker 등, 1978 Am J Bot 65: 654-659). 엽병 식물 절편은 발현 벡터를 가진 아그로박테리움 투머파시엔스 C58C1 pMP90 (McKersie 등, 1999 Plant Physiol 119: 839-847) 또는 LBA4404와 밤새 공배양된다. 식물 절편은 288 mg/L Pro, 53 mg/L 티오프롤린, 4.35 g/L K2SO4, 및 100 μM 아세토시린곤을 함유하는 SH 유도배지 상에서 암소에서 3일간 공배양된다. 식물 절편을 절반 강도의 Murashige-Skoog 배지 (Murashige and Skoog, 1962)로 세척하여 아세토시린곤은 없으나 적절한 선발제 및 아그로박테리움 생장을 저해하는 적절한 항생제를 포함하는 동일한 SH 유도배지 상에 둔다. 몇 주 후, 체세포 배를 생장조절제 및 항생제는 없고, 50g/L 수크로스가 함유된 BOi2Y 발생 배지로 옮긴다. 체세포 배는 연이어 절반 강도의 Murashige-Skoog 배지 상에서 발아된다. 발근된 실생을 온실의 토양으로 이식하여 키운다. T1 종자는 선발제에 내성을 보이며 하나의 카피의 T-DNA 삽입물을 가진 식물에서 생산된다.
목화 형질전환
목화는 US 5,159,135에 기재된 방법에 따라 아그로박테리움 투머파시엔스 (Agrobacterium tumefaciens)를 사용하여 형질전환된다. 목화 종자는 3% 차아염소산나트륨 (sodium hypochlorite) 용액에서 20분간 표면 살균되어, 500 ㎍/ml 세포탁심 (cefotaxime)이 함유된 증류수로 수세되었다. 상기 종자는 발아를 위해 50 ㎍/ml 베노밀 (benomyl)이 함유된 SH 배지로 옮겼다. 4 내지 6일 된 실생의 상배축을 제거하여, 0.5 cm 조각으로 잘라 0.8% 아가에 두었다. 아그로박테리움 현탁액 (목적 유전자 및 적절한 선발 마커로 형질전환되어 밤새 배양된 것으로부터 약 108 세포/ml로 희석된)이 상배축 절편체의 접종에 사용되었다. 상온 및 명소에서 3일 후, 조직을 비타민 B5가 든 Murashige 및 Skoog 염 (Gamborg 등, Exp. Cell Res. 50:151-158 (1968)), 0.1 mg/l 2,4-D, 0.1 mg/l 키네틴 (6-furfurylaminopurine) 및 750 ㎍/ml MgCl2, 그리고 잔존 세균을 죽이기 위해 50 내지 100 ㎍/ml 세포탁심 및 400-500 ㎍/ml 카르베니실린이 포함된 고체 배지 (1.6 g/l Gelrite) 로 옮겼다. 개개 세포 라인은 2 내지 3달 후에 (4 내지 6주마다 계대배양) 분리되어 조직 증식을 위해 선발 배지에 배양되었다 (30℃, 16시간 광주기). 형질전환된 조직은 체세포배를 얻기 위해 2 내지 3달간 비선발배지에서 연이어 배양되었다. 적어도 4 mm 길이의 건강해 보이는 배를 0.1 mg/l 인돌초산, 키네틴 (6-furfurylaminopurine) 및 지베렐린산이 함유된, 미세한 질석의 SH 배지가 든 관상 용기로 옮겼다. 배를 30℃에서 16시간의 광주기로 배양하였고, 2 내지 3 장의 잎이 달린 단계에서 식물체를 질석 및 양분이 든 화분으로 옮겼다. 식물체가 튼튼해지면 재배를 위해 온실로 옮겼다.
실시예
32: 표현형 평가 절차
32.1. 평가
셋업
35 내지 90개의 독립적인 T0 벼 형질전환체가 생성되었다. 일차 형질전환체를 조직배양실에서 온실로 옮겨 키워 T1 종자를 수확하였다. 외래도입유전자의 유/무에 대하여 3:1로 분리되는 T1 자손의 6개 events를 보유하였다. 이들 events의 각각에 대해, 외래도입유전자 (이형- 및 동형접합자)를 가진 약 10 개의 T1 실생 및 외래도입유전자가 없는 (공접합자) 약 10 개의 T1 실생을 가시적 마커 발현을 관찰하여 선발하였다. 형질전환 식물 및 해당 공접합자를 무작위 위치에 나란히 키웠다. 온실 조건은 단일 (12 시간 빛), 명소에서 28℃, 암소에서 22℃, 및 상대습도 70%였다. 스트레스가 없는 조건 하에서 자란 식물은 물 및 양분이 제한되지 않는 것을 확실히 하게 하고, 그들이 스트레스 스크린에 사용되지 않을 경우, 식물이 완전한 생장 및 발달을 위해 필요로 하는 것을 충족시키기 위해 규칙적인 간격으로 급수하였다.
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 적어도 다른 6 각도에서 촬영되었다.
T1 events는 예를 들어, 더 적은 events 및/또는 event 당 더 많은 개체를 사용하여 T1 세대에 대한 것과 동일한 평가 절차에 따라 T2 세대에서 추가로 평가될 수 있다.
가뭄 스크린
T1 또는 T2 식물체는 정상적인 조건에서 이삭이 나오는 단계에 이를 때까지 화분에서 키웠다. 그리고 그들을 관개가 억제된 "건조한" 곳으로 옮겼다. 토양 수분 함량 (SWC)을 관찰하기 위해 무작위로 선택한 화분에 토양 수분 탐침을 삽입하였다. SWC가 특정 역치 밑으로 떨어질 때에는 정상적인 수준에 다시 도달할 때까지 연속적으로 자동으로 식물에 재급수하였다. 그리고 식물체를 다시 정상적인 조건으로 옮겼다. 재배의 나머지 과정 (식물 성숙, 종자 수확)은 비생물적 스트레스 조건 하에서 키우지 않은 식물과 동일하였다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
질소 이용 효율 스크린
T1 또는 T2 식물체는 양분액을 제외하고는 정상적인 조건 하에서 화분용 상토에서 키웠다. 질소 함량이 감소된 특정 양분액으로 이식에서부터 성숙에 이를 때까지, 보통 7 내지 8 회 이하로 화분에 급수하였다. 재배의 나머지 과정 (식물 성숙, 종자 수학)은 비생물적 스트레스 하에서 키우지 않은 식물과 동일하다. 생장 및 수확량 매개변수는 정상적인 조건 하의 생장에 대해서 만큼 상세하게 기록하였다.
염분 스트레스 스크린
T1 또는 T2 식물체는 코코넛 섬유(coco fibers) 및 구운 점토 입자 (Argex) (3:1 비율)로 만들어진 기질에서 키웠다. 정상적인 양분액을 온실에 식물체를 이식 후 처음 2주간 사용하였다. 처음 2주 후, 식물을 수확할 때까지 25 mM 염 (NaCl)을 양분액에 첨가하였다. 생장 및 수확량 매개변수는 정상 조건 하에서의 생장에 대해 상세히 기록하였다.
32.2 통계적 분석: F-검정
식물의 표현형적 특성의 종합적인 평가를 위한 통계적 모델로 2 인자 ANOVA (변이체의 분석)를 사용하였다. 본 발명의 유전자로 형질전환된 모든 event의 모든 식물에서 측정된 모든 매개변수에 대하여 F-검정이 수행되었다. 모든 형질전환 event에 미치는 유전자의 종합적인 효과를 점검하고 전체적인 유전자 효과로 알려진 유전자의 종합적인 효과를 확인하기 위하여 F-검정이 수행되었다. F-검정에 대하여 진정한 전체적인 유전자 효과에 대한 유의성 역치는 5% 확률 수준으로 설정하였다. 유의한 F-검정 값은 유전자 효과를 나타내는데, 이는 표현형 상의 차이를 야기한 것이 유전자의 단순한 존재나 위치만이 아니라는 의미이다.
32.3. 측정된 매개변수
파종 단계에서부터 성숙 단계까지 식물은 디지털 이미지 캐비닛 (digital imaging cabinet)을 몇 회 통과시켰다. 각 타임 포인트에서 각 식물의 디지털 이미지 (2048x1536 픽셀, 1600만 화소)는 WO2010/031780에 기술된 것처럼 적어도 다른 6 각도에서 촬영되었다. 이러한 측정은 다양한 매개변수를 결정하기 위해 사용되었다.
생물량
관련 매개변수 측정
식물 지상부 면적 (또는 잎으로 된 생물량)은 백그라운드로부터 구분되는 지상부 식물 부분의 디지털 이미지의 픽셀의 총 수를 세어 결정하였다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다. 실험은 이 방식으로 측정된 지상부 식물 면적이 지상부 식물 부분의 생물량과 상관관계가 있음을 보여준다. 지상부 면적은 식물의 잎으로 된 생물량이 최대에 달한 시점에서 측정된 면적이다.
뿌리 생물량의 증가는 총 뿌리 생물량 (식물체의 수명 동안에 관찰된 뿌리의 최대 생물량으로 측정) 또는 뿌리 및 줄기의 활발한 생장기간에 뿌리 질량 및 줄기 질량 간의 비율로 측정되는 뿌리/줄기(shoot) 지수의 증가로 표현된다. 즉, 뿌리/줄기 지수는 뿌리 및 줄기의 활발한 생장 기간에 줄기 생장 속도 (rapidity)에 대한 뿌리 생장 속도의 비율로 정의된다. 뿌리 생물량은 WO 2006/029987에 기술된 방법을 사용하여 결정될 수 있다.
발달 시간에 관한 매개변수
초기 활력은 발아 3주 후의 식물의 지상부 면적이다. 초기 활력은 백그라운드로부터 구분되는 지상부 식물체 부분으로부터 총 픽셀의 수를 세어 결정되었다. 이 값은 다른 각도에서 동일한 시점에 촬영한 그림에 대해 평균을 내었으며, 보정에 의해 평방 mm로 표시된 물리적 표면 값으로 전환되었다.
AreaEmer는 대조구 식물에 비하여 이 값이 감소되었을 때, 빠른 초기 발달의 지표이다. 그것은 식물이 최종 생물량의 30%를 생성하기 위해 필요한 시간과 최종 생물량의 90%를 생성하기 위해 필요한 시간 사이의 비율 (%로 표현)이다.
식물의 "꽃을 피우기 위한 시간" 또는 "개화 시간"은 WO 2007/093444에 기술된 방법을 사용하여 결정될 수 있다.
종자 관련 매개변수 측정
성숙한 일차 원추화서를 수확하여, 세고, 봉지에 넣어, 바코드로 표지하여 37℃ 오븐에서 3일간 건조하였다. 원추화서를 타작하여 모든 종자를 수집하고, 세었다. 종자는 일반적으로 깍지인 마른 외피로 감싸져있다. 충전된 깍지 (본 발명에서는 또한 충전된 소화로 불림)는 공기분출기를 사용하여 빈 것과 분리하였다. 빈 깍지는 버리고 나머지를 다시 세었다. 충전된 깍지는 분석 저울로 무게를 재었다.
총 종자의 수는 분리 단계 후 남은 충전된 깍지의 수를 세어 결정하였다. 총 종자 무게는 식물체로부터 수확된 모든 충전된 깍지 중량으로 측정하였다.
식물체당 총 종자 (또는 소화)의 수는 식물체로부터 수확된 깍지 (충전되었든 되지 않았든)의 수를 세어 결정하였다.
천립 중량 (TKW)은 숫자를 센 종자의 수와 그 총 중량으로부터 외삽하였다.
본 발명에서 수확 지수 (HI)는 총 종자 중량과 지상부 면적 (mm2) 간의 비율에 106을 곱한 것으로 정의된다.
본 발명에서 정의된 원추화서 당 꽃의 수는 성숙한 1차 원추화서의 수에 대한 총 종자 수의 비율이다.
본 발명에서 정의된 "종자 충전도 (fill rate)" 또는 "종자 충전율 (filling rate)"는 총 종자 수 (즉, 총 소화의 수)에 대한 충전된 종자 수 (즉, 종자를 함유한 소화)의 비율 (%로 표현)이다. 즉, 종자 충전율은 종자로 충전된 소화의 백분율이다.
실시예
33: 형질전환 식물체의 표현형 평가 결과
RCc3 프로모터에 작동 가능하게 연결된 HD8-유사 핵산을 발현하며, 스트레스가 없는 조건 하에서 자란 형질전환 벼 식물체의 평가 결과는 하기에 나타내었다. 총 종자 중량, 충전된 종자의 수, 충전율 및 수확 지수에서 증가가 관찰되었다 (표 29). 게다가, HD8-유사 핵산을 발현하는 2개 식물체 라인은 대조구 식물에 비해 커졌다. 초장의 증가는 두 라인에서 5% 이상이었다 (p-값 <0.1).
매개변수 | 전체적인 증가 |
총 종자 중량 | 15.4 |
충전율 | 28.1 |
수확지수 | 17.3 |
충전된 종자의 수 | 13.6 |
<110> BASF Plant Science Company GmbH
Crop functional Genomics Center
<120> Plants having enhanced yield-related traits and a method for
making the same
<130> PF71015
<150> EP 10167282.2
<151> 2010-06-25
<150> EP 10190747.5
<151> 2010-11-10
<150> US 61/358,428
<151> 2010-06-25
<150> US 61/411,967
<151> 2010-11-10
<160> 568
<170> PatentIn version 3.4
<210> 1
<211> 717
<212> DNA
<213> Arabidopsis thaliana
<400> 1
atgggttcaa tctctttatc caattctatg cccataactc gacttccact acttacatca 60
ctctatcatc aaagcttcct tccgatttct tcttcatctt tctctcttct tcctctctct 120
aatcgtcgtc gctcctccac tttttcaccg tcaatcaccg tctctgcctt cttcgctgct 180
cctgccagcg ttaataataa taactctgtt ccggcaaaaa atggaggtta cacagttggg 240
gatttcatga ctccgagaca gaatttgcac gttgttaagc cctctacgtc ggtcgatgat 300
gcgttggaac ttctggttga gaagaaagtc acgggattgc ctgtaattga cgataattgg 360
acactggttg gtgttgtttc tgattacgat ttgcttgcat tggactccat ctctggtcgc 420
agtcaaaatg atacaaactt gttccctgat gtcgacagta cctggaaaac gtttaacgaa 480
ctacagaaac tgatcagtaa gacatatgga aaagttgttg gagacttgat gacaccgtct 540
cctctcgttg tccgtgattc taccaattta gaagatgcag ccaggttgct tctggaaaca 600
aagttccgaa gattacccgt tgttgatgct gatggaaaac tgattgggat ccttacaagg 660
ggaaacgttg taagggctgc gctgcagatc aaacgggaaa ccgagaactc tacatag 717
<210> 2
<211> 238
<212> PRT
<213> Arabidopsis thaliana
<400> 2
Met Gly Ser Ile Ser Leu Ser Asn Ser Met Pro Ile Thr Arg Leu Pro
1 5 10 15
Leu Leu Thr Ser Leu Tyr His Gln Ser Phe Leu Pro Ile Ser Ser Ser
20 25 30
Ser Phe Ser Leu Leu Pro Leu Ser Asn Arg Arg Arg Ser Ser Thr Phe
35 40 45
Ser Pro Ser Ile Thr Val Ser Ala Phe Phe Ala Ala Pro Ala Ser Val
50 55 60
Asn Asn Asn Asn Ser Val Pro Ala Lys Asn Gly Gly Tyr Thr Val Gly
65 70 75 80
Asp Phe Met Thr Pro Arg Gln Asn Leu His Val Val Lys Pro Ser Thr
85 90 95
Ser Val Asp Asp Ala Leu Glu Leu Leu Val Glu Lys Lys Val Thr Gly
100 105 110
Leu Pro Val Ile Asp Asp Asn Trp Thr Leu Val Gly Val Val Ser Asp
115 120 125
Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg Ser Gln Asn Asp
130 135 140
Thr Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe Asn Glu
145 150 155 160
Leu Gln Lys Leu Ile Ser Lys Thr Tyr Gly Lys Val Val Gly Asp Leu
165 170 175
Met Thr Pro Ser Pro Leu Val Val Arg Asp Ser Thr Asn Leu Glu Asp
180 185 190
Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro Val Val
195 200 205
Asp Ala Asp Gly Lys Leu Ile Gly Ile Leu Thr Arg Gly Asn Val Val
210 215 220
Arg Ala Ala Leu Gln Ile Lys Arg Glu Thr Glu Asn Ser Thr
225 230 235
<210> 3
<211> 714
<212> DNA
<213> Arabidopsis lyrata
<400> 3
atgggttcca tctctttatc ctattctctg cccataacgc gacttccact acttacatca 60
ctcaatcatc aatgcttcct tccgatttct tcttcatctt tccctcttct tcctctctct 120
aatcgtcgtc gctcctccac tttttcaccg tcaatcgccg tctctgcctt cttcgcagct 180
cctgccagcg ttaataataa ctctgttccg gcaaaaaatg gaggttacac tgttggggat 240
ttcatgacac cgagacagaa tttgcacgtt gttaagccct caacctcggt cgatgatgca 300
ttggaacttc tggttgagaa gaaagtcacg ggattgcctg taattgatga taattggaca 360
ctggttggtg ttgtttctga ttacgatttg cttgcactgg actccatctc tggccgcagt 420
caaaatgata caaacttgtt ccctgatgtt gacagtacct ggaaaacgtt taatgaactc 480
cagaaactga tcagtaagac atatggaaaa gttgttggag acttgatgac accatctcct 540
ctcgttgtcc gtgattctac caatttagaa gatgcagcca ggttgcttct ggaaacaaaa 600
ttccgaagat taccagtcgt ggatgctgat ggaaaactga ttgggatcct tacaagggga 660
aacgttgtaa gggctgcgct gcagatcaaa cgggaaaccg agaactctac atag 714
<210> 4
<211> 237
<212> PRT
<213> Arabidopsis lyrata
<400> 4
Met Gly Ser Ile Ser Leu Ser Tyr Ser Leu Pro Ile Thr Arg Leu Pro
1 5 10 15
Leu Leu Thr Ser Leu Asn His Gln Cys Phe Leu Pro Ile Ser Ser Ser
20 25 30
Ser Phe Pro Leu Leu Pro Leu Ser Asn Arg Arg Arg Ser Ser Thr Phe
35 40 45
Ser Pro Ser Ile Ala Val Ser Ala Phe Phe Ala Ala Pro Ala Ser Val
50 55 60
Asn Asn Asn Ser Val Pro Ala Lys Asn Gly Gly Tyr Thr Val Gly Asp
65 70 75 80
Phe Met Thr Pro Arg Gln Asn Leu His Val Val Lys Pro Ser Thr Ser
85 90 95
Val Asp Asp Ala Leu Glu Leu Leu Val Glu Lys Lys Val Thr Gly Leu
100 105 110
Pro Val Ile Asp Asp Asn Trp Thr Leu Val Gly Val Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg Ser Gln Asn Asp Thr
130 135 140
Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Leu
145 150 155 160
Gln Lys Leu Ile Ser Lys Thr Tyr Gly Lys Val Val Gly Asp Leu Met
165 170 175
Thr Pro Ser Pro Leu Val Val Arg Asp Ser Thr Asn Leu Glu Asp Ala
180 185 190
Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro Val Val Asp
195 200 205
Ala Asp Gly Lys Leu Ile Gly Ile Leu Thr Arg Gly Asn Val Val Arg
210 215 220
Ala Ala Leu Gln Ile Lys Arg Glu Thr Glu Asn Ser Thr
225 230 235
<210> 5
<211> 702
<212> DNA
<213> Brassica napus
<400> 5
atgggttcgg tctctttctc cagttctatg cccataacgc gacttccact acttacatca 60
ctcagtcaat gccttcttcc cacttcttca tccttctcac ttcctcctct ctccagccgt 120
cgtcgctcca atgtttcaca gacaatcacc gcctctgccg tcttctcagc tcctgccggc 180
gttaatgact ctcttccggc aagaaacgag ggttacacag ttggggattt catgacaggg 240
agacagcatc tgcatgttgt taagccctca acatcggtcg atgatgcatt ggaacttctg 300
gttgagaaga aagtcactgg attgcctgta attgatgatg attggaaact ggttggtgtt 360
gtttctgatt acgacttgct tgcactggat tccatttctg gccgctccca aaatgaaaca 420
aacttgttcc ctaacgtcga cagcacctgg aaaacgttta atgaactcca gaaactgata 480
agtaagacac atggacaagt tgttggagac ttgatgaccc cttctcctct ggttgtccgt 540
ggttctacca atttagaaga tgcagccagg ttgcttctgg aaactaagtt ccgaagatta 600
cccgttgtgg attcagatgg aaaactgatt gggattctta caagggggaa cgttgtaagg 660
gctgcactgc agatcaagcg cgaaaccgaa aaatcagcat ag 702
<210> 6
<211> 233
<212> PRT
<213> Brassica napus
<400> 6
Met Gly Ser Val Ser Phe Ser Ser Ser Met Pro Ile Thr Arg Leu Pro
1 5 10 15
Leu Leu Thr Ser Leu Ser Gln Cys Leu Leu Pro Thr Ser Ser Ser Phe
20 25 30
Ser Leu Pro Pro Leu Ser Ser Arg Arg Arg Ser Asn Val Ser Gln Thr
35 40 45
Ile Thr Ala Ser Ala Val Phe Ser Ala Pro Ala Gly Val Asn Asp Ser
50 55 60
Leu Pro Ala Arg Asn Glu Gly Tyr Thr Val Gly Asp Phe Met Thr Gly
65 70 75 80
Arg Gln His Leu His Val Val Lys Pro Ser Thr Ser Val Asp Asp Ala
85 90 95
Leu Glu Leu Leu Val Glu Lys Lys Val Thr Gly Leu Pro Val Ile Asp
100 105 110
Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala
115 120 125
Leu Asp Ser Ile Ser Gly Arg Ser Gln Asn Glu Thr Asn Leu Phe Pro
130 135 140
Asn Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Leu Gln Lys Leu Ile
145 150 155 160
Ser Lys Thr His Gly Gln Val Val Gly Asp Leu Met Thr Pro Ser Pro
165 170 175
Leu Val Val Arg Gly Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu
180 185 190
Leu Glu Thr Lys Phe Arg Arg Leu Pro Val Val Asp Ser Asp Gly Lys
195 200 205
Leu Ile Gly Ile Leu Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln
210 215 220
Ile Lys Arg Glu Thr Glu Lys Ser Ala
225 230
<210> 7
<211> 735
<212> DNA
<213> Brassica oleracea
<400> 7
atgggttcgg tctctttctc caattctatg cccataacgc gacttccact acttacatca 60
ctcaatcaat cccttcttcc cacttcttca tcacttcctc ctctctccaa ccgtcgtcgc 120
tccaatgttt cacagacaat caccgcctct gccgtcttct cagctcctgc cggcgttaat 180
gactctcttc cggcaagaaa cgagggttac acagttgggg atttcatgac agggagacag 240
catctgcatg ttgttaagcc ctcaacatcg gtcgatgatg cattggaact tctggttgag 300
aagaaagtca ctggattgcc tgtaattgat gatgattgga aactggttgg tgttgtttct 360
gattacgact tgcttgcact ggattccatt tctggccgct cccaaaatga aacaaacttg 420
ttccctaacg tcgacagcac ctggaaaacg tttaatgaac tccagaaact gataagtaag 480
acacatggac aagttgttgg agacttgatg accccttctc ctctggttgt ccgtggttct 540
accaatttag aagatgcagc caggttgctt ctggaaacta agttccgaag attacccgtt 600
gtgggttcag atggaaaact gattgggatt cttacaaggg ggaacgttgt aagggctgca 660
ctgcagatca agcgcgaaac cgaaaaatca gcacagattg agaaagcagc agttatagag 720
cagatattcc tgtaa 735
<210> 8
<211> 244
<212> PRT
<213> Brassica oleracea
<400> 8
Met Gly Ser Val Ser Phe Ser Asn Ser Met Pro Ile Thr Arg Leu Pro
1 5 10 15
Leu Leu Thr Ser Leu Asn Gln Ser Leu Leu Pro Thr Ser Ser Ser Leu
20 25 30
Pro Pro Leu Ser Asn Arg Arg Arg Ser Asn Val Ser Gln Thr Ile Thr
35 40 45
Ala Ser Ala Val Phe Ser Ala Pro Ala Gly Val Asn Asp Ser Leu Pro
50 55 60
Ala Arg Asn Glu Gly Tyr Thr Val Gly Asp Phe Met Thr Gly Arg Gln
65 70 75 80
His Leu His Val Val Lys Pro Ser Thr Ser Val Asp Asp Ala Leu Glu
85 90 95
Leu Leu Val Glu Lys Lys Val Thr Gly Leu Pro Val Ile Asp Asp Asp
100 105 110
Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp
115 120 125
Ser Ile Ser Gly Arg Ser Gln Asn Glu Thr Asn Leu Phe Pro Asn Val
130 135 140
Asp Ser Thr Trp Lys Thr Phe Asn Glu Leu Gln Lys Leu Ile Ser Lys
145 150 155 160
Thr His Gly Gln Val Val Gly Asp Leu Met Thr Pro Ser Pro Leu Val
165 170 175
Val Arg Gly Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu
180 185 190
Thr Lys Phe Arg Arg Leu Pro Val Val Gly Ser Asp Gly Lys Leu Ile
195 200 205
Gly Ile Leu Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys
210 215 220
Arg Glu Thr Glu Lys Ser Ala Gln Ile Glu Lys Ala Ala Val Ile Glu
225 230 235 240
Gln Ile Phe Leu
<210> 9
<211> 687
<212> DNA
<213> Brassica oleracea
<400> 9
atgggttcga tctctctgtc aaattctctg cccataccgc gacttccact acatacatca 60
tcactcaatc catgccttcc ttcctccttc tctcttcctc ctcgtcgctc cactttttca 120
ccgcgaatct ccgcctctgc tgtcttcgca gctccttccg gcgttaataa ctctgtcccg 180
ggtaaaaacg ggggttacac agttggtgat ttcatgacag ggaaacagca tcttcatgtt 240
gttaagccct ctacgtcggt tgatgatgca ttggaacttc tggttgagaa gaaggtcacg 300
ggcttgcctg taattgatga tgattggagt ctggttggcg ttgtttctga ttacgactta 360
cttgcactcg actctatttc tggccggagc agccaaaatg atacaaacat gttccctaac 420
gtggacagtt catggaaaac atttaacgaa cttcagaagc tgataagcaa gacacatggg 480
aaagtggttg gagatttgat gacgccttct cctctggttg tccgtggctc taccaattta 540
gaagatgctg ccaggttgct actggaaaca aagttcagaa gattaccagt cgtggattca 600
gatggaaaac tgattgggat cctaacaagg gggaacgttg taagggctgc actgcagatc 660
aagcgggaaa ccgagaactc aacctag 687
<210> 10
<211> 228
<212> PRT
<213> Brassica oleracea
<400> 10
Met Gly Ser Ile Ser Leu Ser Asn Ser Leu Pro Ile Pro Arg Leu Pro
1 5 10 15
Leu His Thr Ser Ser Leu Asn Pro Cys Leu Pro Ser Ser Phe Ser Leu
20 25 30
Pro Pro Arg Arg Ser Thr Phe Ser Pro Arg Ile Ser Ala Ser Ala Val
35 40 45
Phe Ala Ala Pro Ser Gly Val Asn Asn Ser Val Pro Gly Lys Asn Gly
50 55 60
Gly Tyr Thr Val Gly Asp Phe Met Thr Gly Lys Gln His Leu His Val
65 70 75 80
Val Lys Pro Ser Thr Ser Val Asp Asp Ala Leu Glu Leu Leu Val Glu
85 90 95
Lys Lys Val Thr Gly Leu Pro Val Ile Asp Asp Asp Trp Ser Leu Val
100 105 110
Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly
115 120 125
Arg Ser Ser Gln Asn Asp Thr Asn Met Phe Pro Asn Val Asp Ser Ser
130 135 140
Trp Lys Thr Phe Asn Glu Leu Gln Lys Leu Ile Ser Lys Thr His Gly
145 150 155 160
Lys Val Val Gly Asp Leu Met Thr Pro Ser Pro Leu Val Val Arg Gly
165 170 175
Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe
180 185 190
Arg Arg Leu Pro Val Val Asp Ser Asp Gly Lys Leu Ile Gly Ile Leu
195 200 205
Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Glu Thr
210 215 220
Glu Asn Ser Thr
225
<210> 11
<211> 540
<212> DNA
<213> Brassica rapa
<400> 11
atgggttcga tctctctgtc aaattctctg cccataccgc gacttccact acatacatca 60
tcactcaatc catcatgcct tccttcatcc ttctctcttc ctcctcgtcg ctccactttt 120
tcaccgctag tctcggcctc ggcagtcttc gcagctcctt ccggcgttaa taactctgtt 180
cccggtaaaa acgggggtta cacagttggt gatttcatga cagggaaaca gcatcttcat 240
gttgttaagc ccacaacatc tgtcgatgat gcattggaac ttctggttga gaagaaagtc 300
acgggcttgc ctgtaattga tgatgattgg aatctggttg gcgttgtttc tgattacgac 360
ttgcttgcac tcgactccat ttctggccgg agcagccaaa atgatacaaa catgttccct 420
aacgtggaca gttcatggaa aacatttaac gaactccaga agctgataag caagacacat 480
gggaaagtag ttggagattt gatgacgcct tctcctcctt gttgtccgtg gctctactaa 540
<210> 12
<211> 179
<212> PRT
<213> Brassica rapa
<400> 12
Met Gly Ser Ile Ser Leu Ser Asn Ser Leu Pro Ile Pro Arg Leu Pro
1 5 10 15
Leu His Thr Ser Ser Leu Asn Pro Ser Cys Leu Pro Ser Ser Phe Ser
20 25 30
Leu Pro Pro Arg Arg Ser Thr Phe Ser Pro Leu Val Ser Ala Ser Ala
35 40 45
Val Phe Ala Ala Pro Ser Gly Val Asn Asn Ser Val Pro Gly Lys Asn
50 55 60
Gly Gly Tyr Thr Val Gly Asp Phe Met Thr Gly Lys Gln His Leu His
65 70 75 80
Val Val Lys Pro Thr Thr Ser Val Asp Asp Ala Leu Glu Leu Leu Val
85 90 95
Glu Lys Lys Val Thr Gly Leu Pro Val Ile Asp Asp Asp Trp Asn Leu
100 105 110
Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
115 120 125
Gly Arg Ser Ser Gln Asn Asp Thr Asn Met Phe Pro Asn Val Asp Ser
130 135 140
Ser Trp Lys Thr Phe Asn Glu Leu Gln Lys Leu Ile Ser Lys Thr His
145 150 155 160
Gly Lys Val Val Gly Asp Leu Met Thr Pro Ser Pro Pro Cys Cys Pro
165 170 175
Trp Leu Tyr
<210> 13
<211> 612
<212> DNA
<213> Brassica rapa
<400> 13
tttcccgctt gatctgcagt gcagccctta caacgttccc ccttgttaga atcccagcca 60
gttttccatc tgaattcacg actggtaacc ttctgaactt tgtttccagt agcaacctgg 120
cagcatcttc taaattagta gagccacgga caacaagagg agaaggcgtc atcaaatctc 180
caactacttt cccatgtgtc ttgcttatca gcttctggag ttcgttaaat gttttccatg 240
aactgtccac gttagggaac atgtttgtat cattttggct gctccggcca gaaatggagt 300
cgagtgcaag caagtcgtaa tcagaaacaa cgccaaccag attccaatca tcatcaatta 360
caggcaagcc cgtgactttc ttctcaacca gaagttccaa tgcatcatcg acagatgtta 420
tgggcttaac aacatgaaga tgctgtttcc ctgtcatgaa atcaccaact gtgtaacccc 480
cgtttttacc aggaacagag ttattaacgc cggaaggagc tgcgaagact gccgaggccg 540
agactagcgg tgaaaaagtg gagcgacgag gaggagagag aagatgacga cgcatgatgg 600
attgagtgat ga 612
<210> 14
<211> 203
<212> PRT
<213> Brassica rapa
<400> 14
Met Arg Arg His Leu Leu Ser Pro Pro Arg Arg Ser Thr Phe Ser Pro
1 5 10 15
Leu Val Ser Ala Ser Ala Val Phe Ala Ala Pro Ser Gly Val Asn Asn
20 25 30
Ser Val Pro Gly Lys Asn Gly Gly Tyr Thr Val Gly Asp Phe Met Thr
35 40 45
Gly Lys Gln His Leu His Val Val Lys Pro Ile Thr Ser Val Asp Asp
50 55 60
Ala Leu Glu Leu Leu Val Glu Lys Lys Val Thr Gly Leu Pro Val Ile
65 70 75 80
Asp Asp Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu
85 90 95
Ala Leu Asp Ser Ile Ser Gly Arg Ser Ser Gln Asn Asp Thr Asn Met
100 105 110
Phe Pro Asn Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Leu Gln Lys
115 120 125
Leu Ile Ser Lys Thr His Gly Lys Val Val Gly Asp Leu Met Thr Pro
130 135 140
Ser Pro Leu Val Val Arg Gly Ser Thr Asn Leu Glu Asp Ala Ala Arg
145 150 155 160
Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro Val Val Asn Ser Asp
165 170 175
Gly Lys Leu Ala Gly Ile Leu Thr Arg Gly Asn Val Val Arg Ala Ala
180 185 190
Leu Gln Ile Lys Arg Glu Thr Glu Asn Ser Thr
195 200
<210> 15
<211> 711
<212> DNA
<213> Arabidopsis lyrata
<400> 15
atggacgcct tcctatactc tgttccactc tccttcacac gcctacgcgc atcatcctct 60
ccttcctcgc cgtatcttct tccgccgagg tttctctcgg ttcagccatg tcacaaattc 120
aatttctctc gaagcttccc ttccaaatcc aggattcctt cagcttcttc cgccgccggt 180
tccactttga tgaagaattc ctcttctcca agaagtggag tgtacactgt tggtgagttc 240
atgacaaaga aggatgactt gcacgtggtg aaacctacga ctactgtgga tgaagctctg 300
gaactacttg tggagaatag aattacagga tttcctgtga tagacgaaga ctggaaattg 360
gttgggcttg tttcagatta tgacttgttg gctttggact ccatatctgg tagtggaaga 420
acagaaaatt ccatgttccc tgaggttgac agcacctgga aaactttcaa tgcagtgcaa 480
aagctactca gcaaaaccaa tgggaagctt gttggagatt taatgacacc agctccacta 540
gttgttgagg aaaaaaccaa cctcgaagat gctgctaaaa ttttgcttga gacaaaatat 600
cgccggctcc ctgtggtaga ttctgatggc aaattggtcg gtatcatcac aagaggaaac 660
gtggttagag ccgcgcttca aataaagcgc tccggtgata ggaatgcttg a 711
<210> 16
<211> 236
<212> PRT
<213> Arabidopsis lyrata
<400> 16
Met Asp Ala Phe Leu Tyr Ser Val Pro Leu Ser Phe Thr Arg Leu Arg
1 5 10 15
Ala Ser Ser Ser Pro Ser Ser Pro Tyr Leu Leu Pro Pro Arg Phe Leu
20 25 30
Ser Val Gln Pro Cys His Lys Phe Asn Phe Ser Arg Ser Phe Pro Ser
35 40 45
Lys Ser Arg Ile Pro Ser Ala Ser Ser Ala Ala Gly Ser Thr Leu Met
50 55 60
Lys Asn Ser Ser Ser Pro Arg Ser Gly Val Tyr Thr Val Gly Glu Phe
65 70 75 80
Met Thr Lys Lys Asp Asp Leu His Val Val Lys Pro Thr Thr Thr Val
85 90 95
Asp Glu Ala Leu Glu Leu Leu Val Glu Asn Arg Ile Thr Gly Phe Pro
100 105 110
Val Ile Asp Glu Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp
115 120 125
Leu Leu Ala Leu Asp Ser Ile Ser Gly Ser Gly Arg Thr Glu Asn Ser
130 135 140
Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Ala Val Gln
145 150 155 160
Lys Leu Leu Ser Lys Thr Asn Gly Lys Leu Val Gly Asp Leu Met Thr
165 170 175
Pro Ala Pro Leu Val Val Glu Glu Lys Thr Asn Leu Glu Asp Ala Ala
180 185 190
Lys Ile Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser
195 200 205
Asp Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala
210 215 220
Ala Leu Gln Ile Lys Arg Ser Gly Asp Arg Asn Ala
225 230 235
<210> 17
<211> 711
<212> DNA
<213> Arabidopsis thaliana
<400> 17
atggacgccg tcctttactc tgttccactc tccttcactc ccctacgcgc atcatcctct 60
ccttcctcgc cgtatcttct tctgccgagg tttctctccg ttcagccatg tcacaaattc 120
accttctctc gaagcttccc ttccaaatcc cggattccct cagcttcttc cgccgccggt 180
tccacgttga tgacgaattc ctcttcgcca agaagtggag tgtacactgt tggtgagttc 240
atgacaaaga aagaggactt gcacgtggtg aaacctacga ctactgtgga tgaagctctg 300
gaactccttg tggagaatag aatcactgga tttcctgtaa ttgacgaaga ctggaaattg 360
gttgggcttg tttcagatta tgacttgttg gctttggact ccatatctgg tagtggaaga 420
acagaaaatt ccatgttccc tgaggttgac agcacctgga aaactttcaa tgctgtgcaa 480
aagctactca gcaaaaccaa tgggaagctt gttggagatt taatgacacc agctccacta 540
gttgttgagg aaaaaaccaa cctggaagat gctgctaaaa tattgcttga gacaaaatat 600
cgccggctcc ctgtggtaga ttctgatggc aaattggttg gtatcatcac aagaggaaac 660
gtggttagag ccgcgcttca aataaagcgc tctggtgata ggaatgcttg a 711
<210> 18
<211> 236
<212> PRT
<213> Arabidopsis thaliana
<400> 18
Met Asp Ala Val Leu Tyr Ser Val Pro Leu Ser Phe Thr Pro Leu Arg
1 5 10 15
Ala Ser Ser Ser Pro Ser Ser Pro Tyr Leu Leu Leu Pro Arg Phe Leu
20 25 30
Ser Val Gln Pro Cys His Lys Phe Thr Phe Ser Arg Ser Phe Pro Ser
35 40 45
Lys Ser Arg Ile Pro Ser Ala Ser Ser Ala Ala Gly Ser Thr Leu Met
50 55 60
Thr Asn Ser Ser Ser Pro Arg Ser Gly Val Tyr Thr Val Gly Glu Phe
65 70 75 80
Met Thr Lys Lys Glu Asp Leu His Val Val Lys Pro Thr Thr Thr Val
85 90 95
Asp Glu Ala Leu Glu Leu Leu Val Glu Asn Arg Ile Thr Gly Phe Pro
100 105 110
Val Ile Asp Glu Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp
115 120 125
Leu Leu Ala Leu Asp Ser Ile Ser Gly Ser Gly Arg Thr Glu Asn Ser
130 135 140
Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Ala Val Gln
145 150 155 160
Lys Leu Leu Ser Lys Thr Asn Gly Lys Leu Val Gly Asp Leu Met Thr
165 170 175
Pro Ala Pro Leu Val Val Glu Glu Lys Thr Asn Leu Glu Asp Ala Ala
180 185 190
Lys Ile Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser
195 200 205
Asp Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala
210 215 220
Ala Leu Gln Ile Lys Arg Ser Gly Asp Arg Asn Ala
225 230 235
<210> 19
<211> 744
<212> DNA
<213> Aquilegia sp.
<400> 19
atgagttcac ttattcatcc aatccacacg cagtttcact ttgcttccat atccaccact 60
tcatcttctt caacaaatct tcttgttctt cttccttctc atcccacttt ctttgtatct 120
tcttcaatta aaagttctat tatcaaactc aaccattctt tatcacaacg ttttgatcga 180
tgtcgcagtg tttccgcagt tgctgctaat ggtggtactt tgatgtctga ttcttcaccg 240
tcgaaaaatg gggtgttcac ggttggtgat tttatgacca aaaaggagtt attacacgtt 300
gtaaagccta caaccaccat tgatgaagcg ttggagattc ttgtagaaaa cagaattact 360
ggttttcctg tgattgacga tgattggaaa ctggttggtc ttgtttcgga ttacgatctc 420
ttagctcttg actctgtgtc aggtgccgga gttgctgaca caagtatgtt tcctgaagca 480
gacagctcat ggaaaacatt caatgagata caaaagttac ttagtaagac aaatggtaaa 540
gtaattgctg atgtaatgac gcctgcaccc cttgttgttc gcgaaactac aaaccttgaa 600
gatgctgcaa gattattgct tgaaacaaaa taccgccgac ttcccgttgt ggacagtgtt 660
gggaagctgg ttggaatcat aacaagggga aatgttgtta gagctgccct tcatatcaaa 720
cgcgaaattg agaagagtgc ataa 744
<210> 20
<211> 247
<212> PRT
<213> Aquilegia sp.
<400> 20
Met Ser Ser Leu Ile His Pro Ile His Thr Gln Phe His Phe Ala Ser
1 5 10 15
Ile Ser Thr Thr Ser Ser Ser Ser Thr Asn Leu Leu Val Leu Leu Pro
20 25 30
Ser His Pro Thr Phe Phe Val Ser Ser Ser Ile Lys Ser Ser Ile Ile
35 40 45
Lys Leu Asn His Ser Leu Ser Gln Arg Phe Asp Arg Cys Arg Ser Val
50 55 60
Ser Ala Val Ala Ala Asn Gly Gly Thr Leu Met Ser Asp Ser Ser Pro
65 70 75 80
Ser Lys Asn Gly Val Phe Thr Val Gly Asp Phe Met Thr Lys Lys Glu
85 90 95
Leu Leu His Val Val Lys Pro Thr Thr Thr Ile Asp Glu Ala Leu Glu
100 105 110
Ile Leu Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp
115 120 125
Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp
130 135 140
Ser Val Ser Gly Ala Gly Val Ala Asp Thr Ser Met Phe Pro Glu Ala
145 150 155 160
Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile Gln Lys Leu Leu Ser Lys
165 170 175
Thr Asn Gly Lys Val Ile Ala Asp Val Met Thr Pro Ala Pro Leu Val
180 185 190
Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu
195 200 205
Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Val Gly Lys Leu Val
210 215 220
Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Ile Lys
225 230 235 240
Arg Glu Ile Glu Lys Ser Ala
245
<210> 21
<211> 744
<212> DNA
<213> Aquilegia sp.
<400> 21
atgagttcac ttattcatcc aatccacacg cagtttcact ttgcttccat atccaccact 60
tcatcttctt caacaaatct tcttgttctt cttccttctc atcccacttt ctttgtatct 120
tcttcaatta aaagttctat tatcaaactc aaccattctt tatcacaacg ttttgatcga 180
ggtcgcagtg tttccgcagt tgctgctaac ggtggtactt tgatgtctga ttcttcaccg 240
tcgaaaaatg gggtgttcac ggttggtgat tttatgacca aaaaggagtt attacacgtt 300
gtaaagccta caaccaccat tgatgaagcg ttggagattc ttgtagaaaa cagaattact 360
ggttttcctg tgattgacga tgattggaaa ctggttggtc ttgtttcgga ttacgatctc 420
ttagctcttg actctgtgtc aggtgccgga gttgctgaca caagtatgtt tcctgaagca 480
gacagctcat ggaaaacatt caatgagata caaaagttac ttagtaagac aaatggtaaa 540
gtaattgctg atgtaatgac gcctgcaccc cttgttgttc gcgaaactac aaaccttgaa 600
gatgctgcaa gattattgct tgaaacaaaa taccgccgac ttcccgttgt ggacagtgtt 660
gggaagctgg ttggaatcat aacaagggga aatgttgtta gagctgccct tcatatcaaa 720
cgcgaaattg agaagagtgc ataa 744
<210> 22
<211> 247
<212> PRT
<213> Aquilegia sp.
<400> 22
Met Ser Ser Leu Ile His Pro Ile His Thr Gln Phe His Phe Ala Ser
1 5 10 15
Ile Ser Thr Thr Ser Ser Ser Ser Thr Asn Leu Leu Val Leu Leu Pro
20 25 30
Ser His Pro Thr Phe Phe Val Ser Ser Ser Ile Lys Ser Ser Ile Ile
35 40 45
Lys Leu Asn His Ser Leu Ser Gln Arg Phe Asp Arg Gly Arg Ser Val
50 55 60
Ser Ala Val Ala Ala Asn Gly Gly Thr Leu Met Ser Asp Ser Ser Pro
65 70 75 80
Ser Lys Asn Gly Val Phe Thr Val Gly Asp Phe Met Thr Lys Lys Glu
85 90 95
Leu Leu His Val Val Lys Pro Thr Thr Thr Ile Asp Glu Ala Leu Glu
100 105 110
Ile Leu Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp
115 120 125
Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp
130 135 140
Ser Val Ser Gly Ala Gly Val Ala Asp Thr Ser Met Phe Pro Glu Ala
145 150 155 160
Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile Gln Lys Leu Leu Ser Lys
165 170 175
Thr Asn Gly Lys Val Ile Ala Asp Val Met Thr Pro Ala Pro Leu Val
180 185 190
Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu
195 200 205
Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Val Gly Lys Leu Val
210 215 220
Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Ile Lys
225 230 235 240
Arg Glu Ile Glu Lys Ser Ala
245
<210> 23
<211> 702
<212> DNA
<213> Brachypodium distachyon
<400> 23
atggacgcca ggctgctgca cctgtccttc gactgcccgg ccgtcgccgg cggccggccg 60
tcccgtctac ctgcggggcc acggatggct cccgctgcac cccgcgcgct tccccggacc 120
tcatccgtcc gcgcgtccgc cggggccgca gccaccgccg ctcgaggcca tctgccgcac 180
cacggctccg tggctgggga aaccagtcga acttacactg ttggtgattt tatgactaaa 240
cgggaagaac ttcacgttgt gaaaccaacc acttcagttg atgaagccct tgagaggctg 300
gtggagcata ggataactgg ttttcctgtt atcgacgatg actggaattt ggttggtgtt 360
gtctcagatt atgatctgtt agcactggac tcaatatcag gaaatggaat ggctgaagga 420
gacatatttc ctgaggtgga cagcacttgg aagacatttc gtgagataca gaagctcctg 480
agcaaaacca atgggcaagt aattagtgat gttatgactt cttcacctct cgtggtgcgt 540
gaaactacta accttgaaga tgctgcaagg ttactccttg taactaaata ccgcaggctg 600
cctgtagtcg acagctcagg caaactggtt gggatcatta caagagggaa cgtcgtcaga 660
gctgcccttg aatttaagaa aaaggttgaa gggagccttt ga 702
<210> 24
<211> 233
<212> PRT
<213> Brachypodium distachyon
<400> 24
Met Asp Ala Arg Leu Leu His Leu Ser Phe Asp Cys Pro Ala Val Ala
1 5 10 15
Gly Gly Arg Pro Ser Arg Leu Pro Ala Gly Pro Arg Met Ala Pro Ala
20 25 30
Ala Pro Arg Ala Leu Pro Arg Thr Ser Ser Val Arg Ala Ser Ala Gly
35 40 45
Ala Ala Ala Thr Ala Ala Arg Gly His Leu Pro His His Gly Ser Val
50 55 60
Ala Gly Glu Thr Ser Arg Thr Tyr Thr Val Gly Asp Phe Met Thr Lys
65 70 75 80
Arg Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala
85 90 95
Leu Glu Arg Leu Val Glu His Arg Ile Thr Gly Phe Pro Val Ile Asp
100 105 110
Asp Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala
115 120 125
Leu Asp Ser Ile Ser Gly Asn Gly Met Ala Glu Gly Asp Ile Phe Pro
130 135 140
Glu Val Asp Ser Thr Trp Lys Thr Phe Arg Glu Ile Gln Lys Leu Leu
145 150 155 160
Ser Lys Thr Asn Gly Gln Val Ile Ser Asp Val Met Thr Ser Ser Pro
165 170 175
Leu Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu
180 185 190
Leu Val Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Ser Gly Lys
195 200 205
Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Glu
210 215 220
Phe Lys Lys Lys Val Glu Gly Ser Leu
225 230
<210> 25
<211> 702
<212> DNA
<213> Brassica napus
<400> 25
atggacgccg tcgtccacgc ttgtccactc tccatcacgc gcctacgcgc accgccctcc 60
gcttcttctc caactcttat cccgccgaga ttcctctcca tccactccac cttctctccc 120
actctcagct ccctctccaa atcccgaggt ccttcagcct cctccgccgg cgccacgttg 180
atggcgaagt cctcttcgcc aagaagtgga gtgtacactg ttggtgagtt catgaccaag 240
aaggatgact tgcatgtggt caaacctacc accactgttg atgaagctct agaaatcctt 300
gtggagaata ggattacagg atttcctgtg atagaccaag actggaagct ggttgggctt 360
gtttcagatt atgatttgtt ggctttggac tccatctctg gtagtggaag tacagaaaat 420
gccatgttcc ctgaggttga cagcacctgg aaaactttca acgcagtgca aaagctacta 480
agcaaaacca atgggaagct tgttggagat ttaatgacac cagctccagt tgttgttgag 540
gaaaatacca atcttgaaga tgctgctaaa atcttgctcg agaccaaata tcgccggctc 600
cctgtggtag attctgatgg caaattggtt ggaattatca ctagaggaaa cgtggttaga 660
gccgcacttc aaataaagcg cactggtgat aggaacgctt ga 702
<210> 26
<211> 233
<212> PRT
<213> Brassica napus
<400> 26
Met Asp Ala Val Val His Ala Cys Pro Leu Ser Ile Thr Arg Leu Arg
1 5 10 15
Ala Pro Pro Ser Ala Ser Ser Pro Thr Leu Ile Pro Pro Arg Phe Leu
20 25 30
Ser Ile His Ser Thr Phe Ser Pro Thr Leu Ser Ser Leu Ser Lys Ser
35 40 45
Arg Gly Pro Ser Ala Ser Ser Ala Gly Ala Thr Leu Met Ala Lys Ser
50 55 60
Ser Ser Pro Arg Ser Gly Val Tyr Thr Val Gly Glu Phe Met Thr Lys
65 70 75 80
Lys Asp Asp Leu His Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala
85 90 95
Leu Glu Ile Leu Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp
100 105 110
Gln Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala
115 120 125
Leu Asp Ser Ile Ser Gly Ser Gly Ser Thr Glu Asn Ala Met Phe Pro
130 135 140
Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Ala Val Gln Lys Leu Leu
145 150 155 160
Ser Lys Thr Asn Gly Lys Leu Val Gly Asp Leu Met Thr Pro Ala Pro
165 170 175
Val Val Val Glu Glu Asn Thr Asn Leu Glu Asp Ala Ala Lys Ile Leu
180 185 190
Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Asp Gly Lys
195 200 205
Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln
210 215 220
Ile Lys Arg Thr Gly Asp Arg Asn Ala
225 230
<210> 27
<211> 714
<212> DNA
<213> Bruguiera gymnorrhiza
<400> 27
atggcgtctc cttgtttaac tacctcagca accaattgtt ataatcctcc aatggctctg 60
cctcggcaga agcactcgct cttttgtcat caccaccctc ttgtctctgc gagacccaca 120
tcgaaatgtc gtcgtttgcg cttctcccat tgttttcctc cgcctcgctc gagcttttct 180
cccgcgtttt ccaccaaccc cgtcccggct ccccgagaac agacctacaa ggttggtaat 240
ttcatgatca aaaaggagga tttacttgtt ctcaaaacca ccacaaccgt tgacgaagca 300
ttggtggctt tagtggagga cagtgtaacc ggttttcccg ttattgatga tgactggaaa 360
ttggttggtg ttgtttctga ttatgacata ctggcaatcg actccatatc aggttgcagt 420
caaattgata gaaacgtgtt tcctgatgtt gatctttctt ggaaaacctt caatgagcta 480
cggaaaattc tgatgaaaac tcatggcaaa gttgttggtg atttgatgac acccaatccc 540
cttgttgttc atgaaaccac tgatatagaa actgttgcca ggttgcttct tgatacaaaa 600
tatcatcggc tgccagtggt agacagtgat gacaagctgg ttggagtcat tgcacgggaa 660
gatgttgtta aagctgctct gttgataaaa cgtgccagtg aaaggtcaat atga 714
<210> 28
<211> 237
<212> PRT
<213> Bruguiera gymnorrhiza
<400> 28
Met Ala Ser Pro Cys Leu Thr Thr Ser Ala Thr Asn Cys Tyr Asn Pro
1 5 10 15
Pro Met Ala Leu Pro Arg Gln Lys His Ser Leu Phe Cys His His His
20 25 30
Pro Leu Val Ser Ala Arg Pro Thr Ser Lys Cys Arg Arg Leu Arg Phe
35 40 45
Ser His Cys Phe Pro Pro Pro Arg Ser Ser Phe Ser Pro Ala Phe Ser
50 55 60
Thr Asn Pro Val Pro Ala Pro Arg Glu Gln Thr Tyr Lys Val Gly Asn
65 70 75 80
Phe Met Ile Lys Lys Glu Asp Leu Leu Val Leu Lys Thr Thr Thr Thr
85 90 95
Val Asp Glu Ala Leu Val Ala Leu Val Glu Asp Ser Val Thr Gly Phe
100 105 110
Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr
115 120 125
Asp Ile Leu Ala Ile Asp Ser Ile Ser Gly Cys Ser Gln Ile Asp Arg
130 135 140
Asn Val Phe Pro Asp Val Asp Leu Ser Trp Lys Thr Phe Asn Glu Leu
145 150 155 160
Arg Lys Ile Leu Met Lys Thr His Gly Lys Val Val Gly Asp Leu Met
165 170 175
Thr Pro Asn Pro Leu Val Val His Glu Thr Thr Asp Ile Glu Thr Val
180 185 190
Ala Arg Leu Leu Leu Asp Thr Lys Tyr His Arg Leu Pro Val Val Asp
195 200 205
Ser Asp Asp Lys Leu Val Gly Val Ile Ala Arg Glu Asp Val Val Lys
210 215 220
Ala Ala Leu Leu Ile Lys Arg Ala Ser Glu Arg Ser Ile
225 230 235
<210> 29
<211> 711
<212> DNA
<213> Capsicum annuum
<400> 29
atgtcatcta tctcgctgtc gggaatctcc ctccgccgct cctccgctgc tttccaccac 60
cagctccctt gccttctttt atctcatcca tcccaaaatg ttgctacttt cactaaatgt 120
ttcctctccc tccgcctttg gaattcgcgc aaccatttct ccgttaccgc caccaacact 180
ttgaccgcca attctgcaga gccaagaaat ggtatatata cagtaggtga tttcatgaca 240
agaaaagagg atctacatgt ggtaaaacca tcaacatctg tagatgaagc gttggaaatt 300
ttggtagaac gccggatcac tggtttccct gtggttgatg atgactggaa attggttggt 360
cttgtttctg attatgatct attggctctg gattctgtat caggtacagg aggagctgat 420
gcaaacatgt tcccagaagt gggcagcaac tggaaaacat tcaatgaggt tcaaaagttg 480
attagtaaga ccaaggggaa agtggttggt gatttgatga cacatgctcc attagtagtt 540
cgggagtcta ccaatcttga ggatgcagca agacttctgc tgaaaacaaa gtaccgccgg 600
cttcctgttg tagatagtga tgcaaagctg gtgggaataa taaccagggg aaatgtcgtg 660
agagctgccc ttcatataaa acgggtcatg gaaatggaag gccaacagtg a 711
<210> 30
<211> 236
<212> PRT
<213> Capsicum annuum
<400> 30
Met Ser Ser Ile Ser Leu Ser Gly Ile Ser Leu Arg Arg Ser Ser Ala
1 5 10 15
Ala Phe His His Gln Leu Pro Cys Leu Leu Leu Ser His Pro Ser Gln
20 25 30
Asn Val Ala Thr Phe Thr Lys Cys Phe Leu Ser Leu Arg Leu Trp Asn
35 40 45
Ser Arg Asn His Phe Ser Val Thr Ala Thr Asn Thr Leu Thr Ala Asn
50 55 60
Ser Ala Glu Pro Arg Asn Gly Ile Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Glu Asp Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ile Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Gly Ala Asp Ala Asn Met Phe
130 135 140
Pro Glu Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Ile Ser Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr His Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Asp Ala
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
His Ile Lys Arg Val Met Glu Met Glu Gly Gln Gln
225 230 235
<210> 31
<211> 720
<212> DNA
<213> Capsicum annuum
<400> 31
atggattccg ttctcaattt cagttcattt tctccgattt gcgttcttaa ttatcgcctt 60
tctccggcca cgttctcttg cccagctcgt ccttgtaccg gagatcccgc cgttgctaaa 120
tctcgacggc ggcaactttc tcgatctcta cgggcggcgt cttttccttc aaactctgct 180
aacggtgctg ctgctgatac tgcaaattct cagactccaa gagatggaaa ttactcagtt 240
ggtgacttta tgactaggaa agaagattta catgtagtaa aaactacaac taaagttggc 300
gaagcccttg agatgcttgt ggaaaaaaga gttactgggc ttccggtagt tgatgatgac 360
tggaatttgg ttggcgttgt ttctgattat gacctactgg cactcgactc tatatcagga 420
gctggccaag ctgacacaaa tctgtttcct gatgttgaca gtacttggaa gacattcaat 480
gaggttcaaa agctactgag caaaactaat ggaaaagttg ttggtgatgt catgacacca 540
actccattgt ccatccgcga agacaccaac cttgaagatg ctgcgaggtt gttgctccaa 600
acgaagtatc gtcgactgcc tgttgtagat ggtgatggca aactggttgg gattatcaca 660
aggggcaatg ttgtcagagc cgctctgcaa ataaaacgca ctattgagaa tatccaatga 720
<210> 32
<211> 239
<212> PRT
<213> Capsicum annuum
<400> 32
Met Asp Ser Val Leu Asn Phe Ser Ser Phe Ser Pro Ile Cys Val Leu
1 5 10 15
Asn Tyr Arg Leu Ser Pro Ala Thr Phe Ser Cys Pro Ala Arg Pro Cys
20 25 30
Thr Gly Asp Pro Ala Val Ala Lys Ser Arg Arg Arg Gln Leu Ser Arg
35 40 45
Ser Leu Arg Ala Ala Ser Phe Pro Ser Asn Ser Ala Asn Gly Ala Ala
50 55 60
Ala Asp Thr Ala Asn Ser Gln Thr Pro Arg Asp Gly Asn Tyr Ser Val
65 70 75 80
Gly Asp Phe Met Thr Arg Lys Glu Asp Leu His Val Val Lys Thr Thr
85 90 95
Thr Lys Val Gly Glu Ala Leu Glu Met Leu Val Glu Lys Arg Val Thr
100 105 110
Gly Leu Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val Val Ser
115 120 125
Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ala Gly Gln Ala
130 135 140
Asp Thr Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe Asn
145 150 155 160
Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Val Gly Asp
165 170 175
Val Met Thr Pro Thr Pro Leu Ser Ile Arg Glu Asp Thr Asn Leu Glu
180 185 190
Asp Ala Ala Arg Leu Leu Leu Gln Thr Lys Tyr Arg Arg Leu Pro Val
195 200 205
Val Asp Gly Asp Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val
210 215 220
Val Arg Ala Ala Leu Gln Ile Lys Arg Thr Ile Glu Asn Ile Gln
225 230 235
<210> 33
<211> 738
<212> DNA
<213> Citrus clementina
<400> 33
atggactcga ttgtactccc acactcaatc tccgtcgcgc gcctacgcgc cccccctgcc 60
ggtcgtacca gtggtcgtac ttcattcgct ctccagctgc catgcctact tctctctcgt 120
cccggttgta gagtgttctc agtgttggcg acctcatccg atcgcgtctc ggcgcttcgc 180
aggtcgtcgg ttgttttcgc cagtggtacc ttgacggcca actccgctgc gccgagcagt 240
ggagtttata cggttggtga tttcatgaca acaaaagagg agttgcatgt ggtaaaacct 300
acaacgactg tagatgaagc tctggaaatt cttgtagaga agagaattac tggttttcct 360
gtgattgatg atgactggaa attggttggt cttgtatccg attatgactt gttagcattg 420
gactctatat caggcagcgg acgagctgat aacagcatgt ttcccgaagt tgacagcact 480
tggaaaacat tcaacgaggt gcagaagttg cttagtaaaa ccaatgggaa gatggtgggt 540
gacttaatga cgccggcccc agttgtagtt cgggaaacga ctaatcttga ggatgctgct 600
agattgttac ttgagacaaa ataccgcaga cttccagtcg tggatgctga tggtaagctg 660
gttggaatta tcacaagagg aaatgtagta agggcggctc ttcaaataaa acatgcgact 720
gaaatgggag cacaatag 738
<210> 34
<211> 245
<212> PRT
<213> Citrus clementina
<400> 34
Met Asp Ser Ile Val Leu Pro His Ser Ile Ser Val Ala Arg Leu Arg
1 5 10 15
Ala Pro Pro Ala Gly Arg Thr Ser Gly Arg Thr Ser Phe Ala Leu Gln
20 25 30
Leu Pro Cys Leu Leu Leu Ser Arg Pro Gly Cys Arg Val Phe Ser Val
35 40 45
Leu Ala Thr Ser Ser Asp Arg Val Ser Ala Leu Arg Arg Ser Ser Val
50 55 60
Val Phe Ala Ser Gly Thr Leu Thr Ala Asn Ser Ala Ala Pro Ser Ser
65 70 75 80
Gly Val Tyr Thr Val Gly Asp Phe Met Thr Thr Lys Glu Glu Leu His
85 90 95
Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Ile Leu Val
100 105 110
Glu Lys Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu
115 120 125
Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
130 135 140
Gly Ser Gly Arg Ala Asp Asn Ser Met Phe Pro Glu Val Asp Ser Thr
145 150 155 160
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
165 170 175
Lys Met Val Gly Asp Leu Met Thr Pro Ala Pro Val Val Val Arg Glu
180 185 190
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr
195 200 205
Arg Arg Leu Pro Val Val Asp Ala Asp Gly Lys Leu Val Gly Ile Ile
210 215 220
Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys His Ala Thr
225 230 235 240
Glu Met Gly Ala Gln
245
<210> 35
<211> 705
<212> DNA
<213> Citrus clementina
<400> 35
atgagctcga tttcgattcc cagttgtctc gcactcgcgc gactcaacgc caacggcgtt 60
attaactccg ttcctcacct tcagttaccg atcacggtgg ccactccttc gcatctctcc 120
aaacgactac gttttttcac tgtctctcgc gaggtgaagg cttttgctca caacggcatc 180
gggatcacca actccgttcc tccgagaaat ggaacgtaca cagttggtga cttcatgacg 240
aagaaagagg atctacacgc tgtaaagact actacaacgg tcgatgaagc tttagaacgt 300
cttgtggaga agagaattac cggttttcct gtgattgatg acgactggaa gctggttggt 360
gttgtttcag attatgactt gctagcactt gattccattt caggtggcaa tcaaaatgac 420
acaagcttgt ttcctaatgt caatagcagt tggaaaacat tcaatgagtt acagagactt 480
cttagtaaga ctaatggaaa agttgttggt gacttgatga cgcctgctcc gctcgttgtt 540
catgaaaaca ccaacttaga agatgctgct aggttgttgc ttgaaacaaa ataccgtaga 600
ctgccggtag tagatggtga tggcaagctg gttggactca tcacaagagg aaatgtggtt 660
agagctgccc tcaggataaa acgggatggg gaaagatcga cataa 705
<210> 36
<211> 234
<212> PRT
<213> Citrus clementina
<400> 36
Met Ser Ser Ile Ser Ile Pro Ser Cys Leu Ala Leu Ala Arg Leu Asn
1 5 10 15
Ala Asn Gly Val Ile Asn Ser Val Pro His Leu Gln Leu Pro Ile Thr
20 25 30
Val Ala Thr Pro Ser His Leu Ser Lys Arg Leu Arg Phe Phe Thr Val
35 40 45
Ser Arg Glu Val Lys Ala Phe Ala His Asn Gly Ile Gly Ile Thr Asn
50 55 60
Ser Val Pro Pro Arg Asn Gly Thr Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Lys Lys Glu Asp Leu His Ala Val Lys Thr Thr Thr Thr Val Asp Glu
85 90 95
Ala Leu Glu Arg Leu Val Glu Lys Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Ile Ser Gly Gly Asn Gln Asn Asp Thr Ser Leu Phe
130 135 140
Pro Asn Val Asn Ser Ser Trp Lys Thr Phe Asn Glu Leu Gln Arg Leu
145 150 155 160
Leu Ser Lys Thr Asn Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val His Glu Asn Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Asp Gly
195 200 205
Lys Leu Val Gly Leu Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Arg Ile Lys Arg Asp Gly Glu Arg Ser Thr
225 230
<210> 37
<211> 702
<212> DNA
<213> Cichorium endivia
<400> 37
atggcttcaa ttcctctact cgatccccta ccatcttctc tactccgtgc taccaccgcc 60
tccgttccca ccgccttctt tcaccatcag atgccttgtc taatctcatc tcctacggtg 120
ctcgccttta ggctttcttc ttcttgccgc ttttccgatt cccgcagatc aacgctcaca 180
gtcgctgcag ctgtgccgca aaaaagtgga gaattaattg tgggtgattt tatgaccaag 240
aaagaggagt tacatgtggt aaaccccaca accactgtag atgaagcatt aaaagctctt 300
gtagagaaca gaataaccgg ctttcctgta atcgatgatg actggaaatt ggttggggtt 360
gtatcagatt atgacttgtt agcactggat tctatatcag aaacaggacg cgctgacact 420
gacatgttcc ccgaggtcga tagcacttgg aaaacattca atgaggtaca aaagctactc 480
agtaaaaccg acgggaaatt agttggtgat ttgatgacat cagcaccgtt agtagttcgt 540
gaagccacca atctcgagga tgccgcaaga ttgttgcttg aaaccaaata tcgacgattg 600
ccggttgtag atggtgaagg gaagttggtg gggattatta ctagaggaaa cgtggtaaga 660
gcggctctga aaataaaaaa agaaaacgaa atgaaagcgt ga 702
<210> 38
<211> 233
<212> PRT
<213> Cichorium endivia
<400> 38
Met Ala Ser Ile Pro Leu Leu Asp Pro Leu Pro Ser Ser Leu Leu Arg
1 5 10 15
Ala Thr Thr Ala Ser Val Pro Thr Ala Phe Phe His His Gln Met Pro
20 25 30
Cys Leu Ile Ser Ser Pro Thr Val Leu Ala Phe Arg Leu Ser Ser Ser
35 40 45
Cys Arg Phe Ser Asp Ser Arg Arg Ser Thr Leu Thr Val Ala Ala Ala
50 55 60
Val Pro Gln Lys Ser Gly Glu Leu Ile Val Gly Asp Phe Met Thr Lys
65 70 75 80
Lys Glu Glu Leu His Val Val Asn Pro Thr Thr Thr Val Asp Glu Ala
85 90 95
Leu Lys Ala Leu Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp
100 105 110
Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala
115 120 125
Leu Asp Ser Ile Ser Glu Thr Gly Arg Ala Asp Thr Asp Met Phe Pro
130 135 140
Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu
145 150 155 160
Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Ser Ala Pro
165 170 175
Leu Val Val Arg Glu Ala Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu
180 185 190
Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu Gly Lys
195 200 205
Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Lys
210 215 220
Ile Lys Lys Glu Asn Glu Met Lys Ala
225 230
<210> 39
<211> 705
<212> DNA
<213> Cichorium intybus
<400> 39
atggcttcaa ttcctctact tctcgatcct ctaccatctt ctctactccg tgctaccacc 60
gcctccattc ccatcgcctt ctttcaccat cagatgcctt gtttaatctc atctccgtca 120
gtgctcgcct ttaggctttc ttcttcttgc cgcttttccg attcccgcag atcaacgctc 180
acagtcgctg cagctgtgcc gcaaaaaagt ggagaattaa ttgtgggtga ttttatgacc 240
aagaaagagg agttacatgt ggtaaagccc acaaccactg tagatgaagc attgaaagct 300
cttgtagaga acagaataac cggctttcct gtaatcgatg atgactggaa attggttggg 360
gttgtatcag attatgactt gttagcactg gattctatat caggcacagg acgcgctgac 420
actgacatgt tccccgaggt cgatagcact tggaaaacat tcaatgaggt acaaaggcta 480
ctcagtaaaa ccgacgggaa attagttggt gatttgatga catcagcacc gttagtagtt 540
cgtgaaacca ccaatctcga agatgccgca agattgttgc ttgaaactaa atatcgacga 600
ttgccggtcg tagatggtga agggaagttg gtggggatta ttactagagg aaacgtggta 660
agagcggctc tgaaaataaa aaaagaaaac gaaatgaaag cgtga 705
<210> 40
<211> 234
<212> PRT
<213> Cichorium intybus
<400> 40
Met Ala Ser Ile Pro Leu Leu Leu Asp Pro Leu Pro Ser Ser Leu Leu
1 5 10 15
Arg Ala Thr Thr Ala Ser Ile Pro Ile Ala Phe Phe His His Gln Met
20 25 30
Pro Cys Leu Ile Ser Ser Pro Ser Val Leu Ala Phe Arg Leu Ser Ser
35 40 45
Ser Cys Arg Phe Ser Asp Ser Arg Arg Ser Thr Leu Thr Val Ala Ala
50 55 60
Ala Val Pro Gln Lys Ser Gly Glu Leu Ile Val Gly Asp Phe Met Thr
65 70 75 80
Lys Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp Glu
85 90 95
Ala Leu Lys Ala Leu Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Ile Ser Gly Thr Gly Arg Ala Asp Thr Asp Met Phe
130 135 140
Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Arg Leu
145 150 155 160
Leu Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Ser Ala
165 170 175
Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Lys Ile Lys Lys Glu Asn Glu Met Lys Ala
225 230
<210> 41
<211> 720
<212> DNA
<213> Cichorium intybus
<400> 41
atggactcga tcatcttacc ggcggggtct atttccggtg ttgtttcagc cgcacagtat 60
cgtcgaatac cgtatacatc ctcacagact agcgcttttt gccagcggca atttctctct 120
actcgttcgt caccacggaa ctccgatcgc gatcatagcc gttttgcagc tattcattcc 180
gtcgctgctg atacgactaa ctcctcgccg acaagagatg gaacatacac agttgctgat 240
tttatgacaa gaaaagcaaa cttacttgtg gtagaaacaa caactacagt tgataaagca 300
ttagagattc ttgtggagaa aagaatcaca ggctttccag tggttgatgc tgattggaat 360
ctggttggtg tcgtttcaga ttatgacttg ttagctcttg attcaatatc aggtggtaat 420
cacagtgaga caagtttgtt tcctgatgtt gatagttctt ggaaaacttt taatgagatt 480
caaaaactac ttggtaaaac tgatgggaaa gttgtggggg atttaatgac acctactcca 540
cttgttgttc atgataccac aaaccttgaa gaagctgtaa ggttgttgct tgaaacaaaa 600
taccgtaggc tgccagtagt cgatgataat gggaaattgg ttggacttat tacaaggggg 660
gatgttgtta gggctgccct tcagataaaa catgatatta aaaaaatgca atcaagttga 720
<210> 42
<211> 239
<212> PRT
<213> Cichorium intybus
<400> 42
Met Asp Ser Ile Ile Leu Pro Ala Gly Ser Ile Ser Gly Val Val Ser
1 5 10 15
Ala Ala Gln Tyr Arg Arg Ile Pro Tyr Thr Ser Ser Gln Thr Ser Ala
20 25 30
Phe Cys Gln Arg Gln Phe Leu Ser Thr Arg Ser Ser Pro Arg Asn Ser
35 40 45
Asp Arg Asp His Ser Arg Phe Ala Ala Ile His Ser Val Ala Ala Asp
50 55 60
Thr Thr Asn Ser Ser Pro Thr Arg Asp Gly Thr Tyr Thr Val Ala Asp
65 70 75 80
Phe Met Thr Arg Lys Ala Asn Leu Leu Val Val Glu Thr Thr Thr Thr
85 90 95
Val Asp Lys Ala Leu Glu Ile Leu Val Glu Lys Arg Ile Thr Gly Phe
100 105 110
Pro Val Val Asp Ala Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Gly Asn His Ser Glu Thr
130 135 140
Ser Leu Phe Pro Asp Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Gly Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met
165 170 175
Thr Pro Thr Pro Leu Val Val His Asp Thr Thr Asn Leu Glu Glu Ala
180 185 190
Val Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp
195 200 205
Asp Asn Gly Lys Leu Val Gly Leu Ile Thr Arg Gly Asp Val Val Arg
210 215 220
Ala Ala Leu Gln Ile Lys His Asp Ile Lys Lys Met Gln Ser Ser
225 230 235
<210> 43
<211> 594
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 43
atgcagtctc ttgcccagcg cgctagccac gccgtgcgtc ccatggggcc gcggcgcttg 60
caagctcggc gtgtggtgcc acgggctgcc tccacggagc tgtccttgag cacggtgaag 120
gacgtgatga gctcggggac gctatactcg gtctcgccag aggacacggt ggacgcggcc 180
cttgagattc tcgtgaacaa tcgcattacg ggcctacccg tgctggacac ggagggtcgc 240
gtggtgggcg tggtgtcgga ctttgacttg ctggcgctag acgcggtggg ccgcgtaaat 300
gacgacaaca tgctcttccc cagcgccgag cagagctggc aggcgttcaa ggaggtgaag 360
aagatgctgg ccaagaccgc cggcaagaag atcaaggacg tcatgacgcc caagcccatc 420
accgtgcgcc ccgagaccaa cctcaacgac gccaccagca tcctgatcag caagaagatc 480
cggaggctgc cagtggtgga cgagcacggc aagctggtgg ggctgatcag ccgcggcaac 540
atcgtcaagg cagcgctagc ggcgcgcaag gccgctgccg cctcctccaa ctag 594
<210> 44
<211> 197
<212> PRT
<213> Chlamydomonas reinhardtii
<400> 44
Met Gln Ser Leu Ala Gln Arg Ala Ser His Ala Val Arg Pro Met Gly
1 5 10 15
Pro Arg Arg Leu Gln Ala Arg Arg Val Val Pro Arg Ala Ala Ser Thr
20 25 30
Glu Leu Ser Leu Ser Thr Val Lys Asp Val Met Ser Ser Gly Thr Leu
35 40 45
Tyr Ser Val Ser Pro Glu Asp Thr Val Asp Ala Ala Leu Glu Ile Leu
50 55 60
Val Asn Asn Arg Ile Thr Gly Leu Pro Val Leu Asp Thr Glu Gly Arg
65 70 75 80
Val Val Gly Val Val Ser Asp Phe Asp Leu Leu Ala Leu Asp Ala Val
85 90 95
Gly Arg Val Asn Asp Asp Asn Met Leu Phe Pro Ser Ala Glu Gln Ser
100 105 110
Trp Gln Ala Phe Lys Glu Val Lys Lys Met Leu Ala Lys Thr Ala Gly
115 120 125
Lys Lys Ile Lys Asp Val Met Thr Pro Lys Pro Ile Thr Val Arg Pro
130 135 140
Glu Thr Asn Leu Asn Asp Ala Thr Ser Ile Leu Ile Ser Lys Lys Ile
145 150 155 160
Arg Arg Leu Pro Val Val Asp Glu His Gly Lys Leu Val Gly Leu Ile
165 170 175
Ser Arg Gly Asn Ile Val Lys Ala Ala Leu Ala Ala Arg Lys Ala Ala
180 185 190
Ala Ala Ser Ser Asn
195
<210> 45
<211> 846
<212> DNA
<213> Citrus sinensis
<400> 45
atgagctcga tttcgattcc cagttgtctc acactcgcgc gactcaacgc caacggcgtt 60
attaactccg ttcctcacct tcagttaccg atcacggtgg ccactccttc gcatctctcc 120
aaacgactac gttttttcac tgtctctcgc gaggtgaagg cttttgctca caacggcgtc 180
gggatcacca actccgttcc tccgagaaat ggaacgtaca cagttggtga cttcatgacg 240
aagaaagagg atctacacgc tgtaaagact actacaacgg tcgatgaagc tttagaacgt 300
cttgtggaga agagaattac cggttttcct gtgattgatg acgactggaa gttggttggt 360
gttgtttcag attatgactt gctagcactt gattccattt caggtggcaa tcaaaatgac 420
acaagcttgt ttcctaatgt caatagcact tggaaaacat ttaaagagtt acaaagactt 480
cttagtaaga ctaatggaaa aagttgttgg ggacttgatg aaccccggct ccgctccttt 540
gttcatgaaa acccccaatt taaaaaaaag ctgctagggt tgttggttgg aaacaaaata 600
accgtaaaaa tgcccggtat taaaaggggt ggaggggaaa cctgggttgg gaccccacca 660
aaaaaaagga aaggggggtt aagagccggc cccccccgga aaaaaaaggg ggaagggggg 720
aaaaaaataa aacaaaatta tcaacgtaat cccacaatag aaaatctggg gggtttttgg 780
gaacctccca aaaaaaaaaa cttttttttt tttttttttt tttggccccc ccccagggga 840
ttgtaa 846
<210> 46
<211> 281
<212> PRT
<213> Citrus sinensis
<400> 46
Met Ser Ser Ile Ser Ile Pro Ser Cys Leu Thr Leu Ala Arg Leu Asn
1 5 10 15
Ala Asn Gly Val Ile Asn Ser Val Pro His Leu Gln Leu Pro Ile Thr
20 25 30
Val Ala Thr Pro Ser His Leu Ser Lys Arg Leu Arg Phe Phe Thr Val
35 40 45
Ser Arg Glu Val Lys Ala Phe Ala His Asn Gly Val Gly Ile Thr Asn
50 55 60
Ser Val Pro Pro Arg Asn Gly Thr Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Lys Lys Glu Asp Leu His Ala Val Lys Thr Thr Thr Thr Val Asp Glu
85 90 95
Ala Leu Glu Arg Leu Val Glu Lys Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Ile Ser Gly Gly Asn Gln Asn Asp Thr Ser Leu Phe
130 135 140
Pro Asn Val Asn Ser Thr Trp Lys Thr Phe Lys Glu Leu Gln Arg Leu
145 150 155 160
Leu Ser Lys Thr Asn Gly Lys Ser Cys Trp Gly Leu Asp Glu Pro Arg
165 170 175
Leu Arg Ser Phe Val His Glu Asn Pro Gln Phe Lys Lys Lys Leu Leu
180 185 190
Gly Leu Leu Val Gly Asn Lys Ile Thr Val Lys Met Pro Gly Ile Lys
195 200 205
Arg Gly Gly Gly Glu Thr Trp Val Gly Thr Pro Pro Lys Lys Arg Lys
210 215 220
Gly Gly Leu Arg Ala Gly Pro Pro Arg Lys Lys Lys Gly Glu Gly Gly
225 230 235 240
Lys Lys Ile Lys Gln Asn Tyr Gln Arg Asn Pro Thr Ile Glu Asn Leu
245 250 255
Gly Gly Phe Trp Glu Pro Pro Lys Lys Lys Asn Phe Phe Phe Phe Phe
260 265 270
Phe Phe Trp Pro Pro Pro Arg Gly Leu
275 280
<210> 47
<211> 714
<212> DNA
<213> Citrus sinensis
<400> 47
atggactcga ttgtactccc acactcaatc tccgtcgcgc gcctacgcgc ccccgctgcc 60
ggccgtacca gtggtcgtac ttcattcgct ctccagctgc catgcctact tctctctcgt 120
cccggttgta gagtgttctc agtgttggcg acctcatccg atcgcgtctc ggcgcttcgc 180
aggtcctcgg ctgttttcgc cagtggtacc ttgacggcca actccgctgc gccgagcagt 240
ggagtttata cggttggtga tttcatgaca acaaaagagg agttgcatgt ggtaaaacct 300
acaacgactg tagatgaagc tctggaaatt cttgtagaga agagaattac tggttttcct 360
gtgattgacg atgactggaa attggttggt cttgtatctg attatgactt gttagcattg 420
gactctatat caggcagcgg acgagctgat aacagcatgt ttcccgaagt tgacagcact 480
tggaaaacat tcaacgaggt gcagaagttg cttagtaaaa ccaatgggaa gatggtgggt 540
gacttaatga cgccagcccc agtcgtagtt cgggaaacga ctaatcttga ggatgctgct 600
agattgttac ttgagacaaa ataccgcaga cttccagtcg tggatgctga tggttggaat 660
tatcacaaga ggaaatgtag taagggcggc tcttcaaata aaacatgcga ctga 714
<210> 48
<211> 237
<212> PRT
<213> Citrus sinensis
<400> 48
Met Asp Ser Ile Val Leu Pro His Ser Ile Ser Val Ala Arg Leu Arg
1 5 10 15
Ala Pro Ala Ala Gly Arg Thr Ser Gly Arg Thr Ser Phe Ala Leu Gln
20 25 30
Leu Pro Cys Leu Leu Leu Ser Arg Pro Gly Cys Arg Val Phe Ser Val
35 40 45
Leu Ala Thr Ser Ser Asp Arg Val Ser Ala Leu Arg Arg Ser Ser Ala
50 55 60
Val Phe Ala Ser Gly Thr Leu Thr Ala Asn Ser Ala Ala Pro Ser Ser
65 70 75 80
Gly Val Tyr Thr Val Gly Asp Phe Met Thr Thr Lys Glu Glu Leu His
85 90 95
Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Ile Leu Val
100 105 110
Glu Lys Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu
115 120 125
Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
130 135 140
Gly Ser Gly Arg Ala Asp Asn Ser Met Phe Pro Glu Val Asp Ser Thr
145 150 155 160
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
165 170 175
Lys Met Val Gly Asp Leu Met Thr Pro Ala Pro Val Val Val Arg Glu
180 185 190
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr
195 200 205
Arg Arg Leu Pro Val Val Asp Ala Asp Gly Trp Asn Tyr His Lys Arg
210 215 220
Lys Cys Ser Lys Gly Gly Ser Ser Asn Lys Thr Cys Asp
225 230 235
<210> 49
<211> 712
<212> DNA
<213> Centaurea solstitialis
<400> 49
atggcctcaa ttccgccgct tctagatcct ctctccgcct ctaacctccg ttctaccacc 60
gtcttccacc accaccagat cccttgccta atctcctctc ctcctccatc agttatctac 120
gggaggcttc catcttcttc ttacaccatc catccgcttt ctcgcacacc tactttcacc 180
gtcaccggag ctccacctac cttgaccggt aattccgtac cgccaagaaa tggcgtgttg 240
attgtgggtg atttcatgac tactagagag gagttacagg tcgtgaaggc cacgacgact 300
gtaaacgaag ctctggaagc tcttgtagaa cacagaatca ccggctttcc cgtaattgac 360
gatgactgga aattggttgg gctggtttca gattatgact tattagcact gggctctgta 420
tcaggtgcaa ctaaatctga tacaaacatg ttcccggagg tcgatagcac ttggaagacg 480
ttcaacgagg tacaaaaatt gctcattaaa accgatggaa agcttgttgg tgatttaatg 540
acacccgcgc ctttagtagt tcgtgaaaat actaatcttg aagatgctgc cagattgttg 600
cttgagacca aatatcgtcg ccttccggtt gtagatggtg aaggacagct ggttggaatt 660
atcacgagag gaaatgtcgt atgagccgct ctacaaataa tacaggcggg tg 712
<210> 50
<211> 237
<212> PRT
<213> Centaurea solstitialis
<220>
<221> misc_feature
<222> (237)..(237)
<223> Xaa can be any naturally occurring amino acid
<400> 50
Met Ala Ser Ile Pro Pro Leu Leu Asp Pro Leu Ser Ala Ser Asn Leu
1 5 10 15
Arg Ser Thr Thr Val Phe His His His Gln Ile Pro Cys Leu Ile Ser
20 25 30
Ser Pro Pro Pro Ser Val Ile Tyr Gly Arg Leu Pro Ser Ser Ser Tyr
35 40 45
Thr Ile His Pro Leu Ser Arg Thr Pro Thr Phe Thr Val Thr Gly Ala
50 55 60
Pro Pro Thr Leu Thr Gly Asn Ser Val Pro Pro Arg Asn Gly Val Leu
65 70 75 80
Ile Val Gly Asp Phe Met Thr Thr Arg Glu Glu Leu Gln Val Val Lys
85 90 95
Ala Thr Thr Thr Val Asn Glu Ala Leu Glu Ala Leu Val Glu His Arg
100 105 110
Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu
115 120 125
Val Ser Asp Tyr Asp Leu Leu Ala Leu Gly Ser Val Ser Gly Ala Thr
130 135 140
Lys Ser Asp Thr Asn Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr
145 150 155 160
Phe Asn Glu Val Gln Lys Leu Leu Ile Lys Thr Asp Gly Lys Leu Val
165 170 175
Gly Asp Leu Met Thr Pro Ala Pro Leu Val Val Arg Glu Asn Thr Asn
180 185 190
Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu
195 200 205
Pro Val Val Asp Gly Glu Gly Gln Leu Val Gly Ile Ile Thr Arg Gly
210 215 220
Asn Val Val Ala Ala Leu Gln Ile Ile Gln Ala Gly Xaa
225 230 235
<210> 51
<211> 726
<212> DNA
<213> Centaurea solstitialis
<400> 51
atggattcga tcatcttacc ggcggccagt ttttccggcg ttgttgtttc tgcttcacaa 60
ttacgccatc taccgtctcc atcttcttca cacactagca ccggtttccg tctgccgaaa 120
tcatgcctta atcgttcctc acgacggttc tccaaccgcg atcatactcg tttaccggcg 180
gttcattccg tcgctgctca ttccaccaat tccacgcctc caagagatga aatacacaca 240
gttggtgatt ttatgacgaa aaaagcggac ttacttgtgg tagaaacgac aacaacagtt 300
gacaaggcat tagagcttct tgtggagaaa agaattaccg gatttccagt ggttgatgct 360
gattggaatt tagttggcgt tgtatcagat tatgacttgt tagcgcttga caagatatca 420
ggtggtagtc atggtgacac aagtttgttt cctgatgttg atagttcctg gaaaacgttc 480
aacgagattc agaaactact cggtaaaact gatgggaaag ttgtggggga cttgatgaca 540
cctgctccac ttgttgttca tgaaaccact aactttgagg aagctgtaag gttgttgctt 600
gaaacaaaat accgtcggct accggtggtg gatgttgatg gcaagctggt tggacttatt 660
acaagaggag atgttgttcg ggctgccctt cagataaaag atgctattaa gaagatgcaa 720
ttatga 726
<210> 52
<211> 241
<212> PRT
<213> Centaurea solstitialis
<400> 52
Met Asp Ser Ile Ile Leu Pro Ala Ala Ser Phe Ser Gly Val Val Val
1 5 10 15
Ser Ala Ser Gln Leu Arg His Leu Pro Ser Pro Ser Ser Ser His Thr
20 25 30
Ser Thr Gly Phe Arg Leu Pro Lys Ser Cys Leu Asn Arg Ser Ser Arg
35 40 45
Arg Phe Ser Asn Arg Asp His Thr Arg Leu Pro Ala Val His Ser Val
50 55 60
Ala Ala His Ser Thr Asn Ser Thr Pro Pro Arg Asp Glu Ile His Thr
65 70 75 80
Val Gly Asp Phe Met Thr Lys Lys Ala Asp Leu Leu Val Val Glu Thr
85 90 95
Thr Thr Thr Val Asp Lys Ala Leu Glu Leu Leu Val Glu Lys Arg Ile
100 105 110
Thr Gly Phe Pro Val Val Asp Ala Asp Trp Asn Leu Val Gly Val Val
115 120 125
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Lys Ile Ser Gly Gly Ser His
130 135 140
Gly Asp Thr Ser Leu Phe Pro Asp Val Asp Ser Ser Trp Lys Thr Phe
145 150 155 160
Asn Glu Ile Gln Lys Leu Leu Gly Lys Thr Asp Gly Lys Val Val Gly
165 170 175
Asp Leu Met Thr Pro Ala Pro Leu Val Val His Glu Thr Thr Asn Phe
180 185 190
Glu Glu Ala Val Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro
195 200 205
Val Val Asp Val Asp Gly Lys Leu Val Gly Leu Ile Thr Arg Gly Asp
210 215 220
Val Val Arg Ala Ala Leu Gln Ile Lys Asp Ala Ile Lys Lys Met Gln
225 230 235 240
Leu
<210> 53
<211> 723
<212> DNA
<213> Centaurea solstitialis
<400> 53
atggcctcaa ttcctccggt cgtcgatcac ctctccgttt ctctgcaccg tactaccacc 60
gccttcttcc gccatcagat gcctagtcgt ctaatctcat ctcatccagt gctcgcctcc 120
agagattctt cttcttcttg ccggatttct ggctctcgta gaccggcgct caccgtggct 180
gcagccgcaa ccgccacttt gatgtctaat tccgtgccgc agaaaagtgg agtattgatt 240
gtgggtgatt ttatgaccaa gaaagaggat ttgcatgtgg taaagcccac aacaactgta 300
gatgaagcat tgaaagctct tgtggagaat agaataactg gttttccagt gattgatgat 360
gactggaaat tggttggggt ggtatcagat tatgacttgc tagcactgga ttctatatca 420
ggcacttcac gagctgaaac caacatgttc cctgaggtgg atagcacttg gaaaacattc 480
aacgaggtac aaaggctact cagtaaaacc gacgggaaag tggttggtga tttgatgaca 540
tctgtcccgt tagtagttcg tgaaaccact aatctcgagg atgctgccag attgttgctt 600
gaaactaaat atcggcgact gcctgttgta gatggcgaag gaaagttggt cgggattatt 660
acacgaggaa atgtggtaag agctgccccg aaaataaaaa aagagaacga aacgaaagca 720
tga 723
<210> 54
<211> 240
<212> PRT
<213> Centaurea solstitialis
<400> 54
Met Ala Ser Ile Pro Pro Val Val Asp His Leu Ser Val Ser Leu His
1 5 10 15
Arg Thr Thr Thr Ala Phe Phe Arg His Gln Met Pro Ser Arg Leu Ile
20 25 30
Ser Ser His Pro Val Leu Ala Ser Arg Asp Ser Ser Ser Ser Cys Arg
35 40 45
Ile Ser Gly Ser Arg Arg Pro Ala Leu Thr Val Ala Ala Ala Ala Thr
50 55 60
Ala Thr Leu Met Ser Asn Ser Val Pro Gln Lys Ser Gly Val Leu Ile
65 70 75 80
Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu His Val Val Lys Pro
85 90 95
Thr Thr Thr Val Asp Glu Ala Leu Lys Ala Leu Val Glu Asn Arg Ile
100 105 110
Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Val Val
115 120 125
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr Ser Arg
130 135 140
Ala Glu Thr Asn Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe
145 150 155 160
Asn Glu Val Gln Arg Leu Leu Ser Lys Thr Asp Gly Lys Val Val Gly
165 170 175
Asp Leu Met Thr Ser Val Pro Leu Val Val Arg Glu Thr Thr Asn Leu
180 185 190
Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro
195 200 205
Val Val Asp Gly Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn
210 215 220
Val Val Arg Ala Ala Pro Lys Ile Lys Lys Glu Asn Glu Thr Lys Ala
225 230 235 240
<210> 55
<211> 702
<212> DNA
<213> Chlorella vulgaris
<400> 55
atggccaacg cagcgtcttt cagtggtcgg cttcccagca taagcggaag gacagcatgc 60
agtgcaccct ataacacgct cccatctcgc tttctgcctg ttcccagccc ggcgtcatac 120
ttgcttccaa gcaggcgcct taaagtttca aggctttccc ttgtattgcc cagagcagta 180
ctagctaatt atgcgttacc tgagatcggg ggaccacaca aggtggatga cgttatgacg 240
aagggtaaga ttttcagcgc tcgagtgaac acatctgtgg acgaagccct ggagctcatg 300
gtcaagcaca gagtgtctgg ccttccagtc ctggacgagt caaatagggt ggttggagta 360
gtgtcagact atgatttgct ctcgctggat gcggtttctg gcaaaatgca ggaagccggc 420
tttttcccaa gggcagacac aaactgggac tccttccacg aagtgcagaa gcttgtcctc 480
aagaacgccg gcagggtggt gggcgacgtg atgacagaga atccagtggt cgtccgcgcc 540
aacactgaca tgacatcagc cgcccgcatg ctcctggaca cccgggtgag gaggttgcct 600
gttgtggacg atgatggccg cctggtgggc attttcacaa ggggtgacgt catcaaggct 660
gctctggatg tgcgccgcgc ggctgccggc cgctccggct ga 702
<210> 56
<211> 233
<212> PRT
<213> Chlorella vulgaris
<400> 56
Met Ala Asn Ala Ala Ser Phe Ser Gly Arg Leu Pro Ser Ile Ser Gly
1 5 10 15
Arg Thr Ala Cys Ser Ala Pro Tyr Asn Thr Leu Pro Ser Arg Phe Leu
20 25 30
Pro Val Pro Ser Pro Ala Ser Tyr Leu Leu Pro Ser Arg Arg Leu Lys
35 40 45
Val Ser Arg Leu Ser Leu Val Leu Pro Arg Ala Val Leu Ala Asn Tyr
50 55 60
Ala Leu Pro Glu Ile Gly Gly Pro His Lys Val Asp Asp Val Met Thr
65 70 75 80
Lys Gly Lys Ile Phe Ser Ala Arg Val Asn Thr Ser Val Asp Glu Ala
85 90 95
Leu Glu Leu Met Val Lys His Arg Val Ser Gly Leu Pro Val Leu Asp
100 105 110
Glu Ser Asn Arg Val Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ser
115 120 125
Leu Asp Ala Val Ser Gly Lys Met Gln Glu Ala Gly Phe Phe Pro Arg
130 135 140
Ala Asp Thr Asn Trp Asp Ser Phe His Glu Val Gln Lys Leu Val Leu
145 150 155 160
Lys Asn Ala Gly Arg Val Val Gly Asp Val Met Thr Glu Asn Pro Val
165 170 175
Val Val Arg Ala Asn Thr Asp Met Thr Ser Ala Ala Arg Met Leu Leu
180 185 190
Asp Thr Arg Val Arg Arg Leu Pro Val Val Asp Asp Asp Gly Arg Leu
195 200 205
Val Gly Ile Phe Thr Arg Gly Asp Val Ile Lys Ala Ala Leu Asp Val
210 215 220
Arg Arg Ala Ala Ala Gly Arg Ser Gly
225 230
<210> 57
<211> 630
<212> DNA
<213> Euphorbia esula
<400> 57
atggcgtccg taccgttaac agctacttcc ccttgtctgc ttcactccct tttcatctct 60
ccccacacac catgtctcct tcctccctcc tccatgcagt tacgacgccg tttatgctct 120
ccccgtcggc ccgattttcc tcgtcggatc tccgtcgttg ctttaacaac caacggcatg 180
ccgagaaatg gagcatttac tactgtcggt gatattatga ctagaaagga ggatttgttt 240
gctgtgaaaa ctacaactac tgttgatgaa gcactagagg ctcttgtgga gaagaaatta 300
tctggttttc ctgtggttga tgatgatggg acattggttg gtgttgtttc agattatgac 360
ttgttagctc taaactctat atcaggtggc aatcaaggca gcacaaactt gtttcctgat 420
acggataggt cttggaaaac attcaatgag atgcaaaaac tagttactaa gaacaatgga 480
aaagttgtgg gtgatctgat gactcccgcc cctctagttg tcaacgaaac caccaatttg 540
gaggatgctg ctaggttgct gctagactca aaacaccatc gccttccagt ggtagatgac 600
aaaggaaagc tggtaagtaa caagtactaa 630
<210> 58
<211> 209
<212> PRT
<213> Euphorbia esula
<400> 58
Met Ala Ser Val Pro Leu Thr Ala Thr Ser Pro Cys Leu Leu His Ser
1 5 10 15
Leu Phe Ile Ser Pro His Thr Pro Cys Leu Leu Pro Pro Ser Ser Met
20 25 30
Gln Leu Arg Arg Arg Leu Cys Ser Pro Arg Arg Pro Asp Phe Pro Arg
35 40 45
Arg Ile Ser Val Val Ala Leu Thr Thr Asn Gly Met Pro Arg Asn Gly
50 55 60
Ala Phe Thr Thr Val Gly Asp Ile Met Thr Arg Lys Glu Asp Leu Phe
65 70 75 80
Ala Val Lys Thr Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val
85 90 95
Glu Lys Lys Leu Ser Gly Phe Pro Val Val Asp Asp Asp Gly Thr Leu
100 105 110
Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asn Ser Ile Ser
115 120 125
Gly Gly Asn Gln Gly Ser Thr Asn Leu Phe Pro Asp Thr Asp Arg Ser
130 135 140
Trp Lys Thr Phe Asn Glu Met Gln Lys Leu Val Thr Lys Asn Asn Gly
145 150 155 160
Lys Val Val Gly Asp Leu Met Thr Pro Ala Pro Leu Val Val Asn Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Asp Ser Lys His
180 185 190
His Arg Leu Pro Val Val Asp Asp Lys Gly Lys Leu Val Ser Asn Lys
195 200 205
Tyr
<210> 59
<211> 678
<212> DNA
<213> Gossypium hirsutum
<400> 59
atggacacaa ttctccatac cgaacctcta tctctcactc gcttacgcgc cacttcgaat 60
tccagcgctt ccattcacca tatgccttgc cagctcatct tccgtccttt ccaccgcctc 120
tcctttcctt tatccaccgt caacgctggc tccagttctc gcaggtcatc cgcttttgtt 180
gtcgccgcta gcggcactct caccgccaat tccgtttcgc cgagaggtgg agtatataca 240
gttggggatt tcatgacggg aaaagaggat ttgcatgttg taaagccaac aacaactgtt 300
gatgaagcac tggaagctct tgttgaacac agaatcaccg gttttcctgt tatcgatgat 360
gattggaaat tggttggact tgtttctgat tatgacttgc tagcattgga ctccatatct 420
gggcggcgga ctgagaatga tctgtttcct gaagttgata gcacttggaa aactttcaac 480
gagatacaga agttactcaa caagacgaat ggacaggtgg ttggtgattt aatgacacca 540
gctccattag ttgtacgtga aacaactaat ctcgaggatg ctgctaaatt attgcttgag 600
acaaaatacc gaagacttcc tgttgttgat gtagagggca agctggtggg tatcatcaca 660
agaggaaatg ttcgttag 678
<210> 60
<211> 225
<212> PRT
<213> Gossypium hirsutum
<400> 60
Met Asp Thr Ile Leu His Thr Glu Pro Leu Ser Leu Thr Arg Leu Arg
1 5 10 15
Ala Thr Ser Asn Ser Ser Ala Ser Ile His His Met Pro Cys Gln Leu
20 25 30
Ile Phe Arg Pro Phe His Arg Leu Ser Phe Pro Leu Ser Thr Val Asn
35 40 45
Ala Gly Ser Ser Ser Arg Arg Ser Ser Ala Phe Val Val Ala Ala Ser
50 55 60
Gly Thr Leu Thr Ala Asn Ser Val Ser Pro Arg Gly Gly Val Tyr Thr
65 70 75 80
Val Gly Asp Phe Met Thr Gly Lys Glu Asp Leu His Val Val Lys Pro
85 90 95
Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile
100 105 110
Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val
115 120 125
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg Arg Thr
130 135 140
Glu Asn Asp Leu Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn
145 150 155 160
Glu Ile Gln Lys Leu Leu Asn Lys Thr Asn Gly Gln Val Val Gly Asp
165 170 175
Leu Met Thr Pro Ala Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu
180 185 190
Asp Ala Ala Lys Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val
195 200 205
Val Asp Val Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val
210 215 220
Arg
225
<210> 61
<211> 630
<212> DNA
<213> Gossypium hirsutum
<400> 61
atgggttcca tttctttcgt taattctcaa accctgaagc tattcccttc tttttattcc 60
tttcttcatt ctaagcaacc ctgcattgtc tccatgtacc attattccca taaagtggca 120
ctggcaccct ccttgtctct ccccaaaccc aaagatggct cttttcgtct tgctgctgaa 180
ctcatcacca actctgttcc ctcaagaaat ggaaattata ccgtgggtga ttttatgacc 240
aggaaagagg atttacatgt tgtcaaagct acaacaagtg tggatgaagc attggaggca 300
cttgtggaga agagagttac tggtttccca gtgatcgatg atgactggaa tttggttggc 360
gttgtttccg attatgattt gttggcactc gactcgattt caggtagcag tcaaaatgac 420
acaaccttgt ttcctaatgt tgatagttct tggaaaacat tcaatgaaat acagaaattg 480
atgaacaaaa ataacggaaa cgtggtcgga gacttgatga caccttcacc gctcgttgtt 540
cgtgaaacaa caaacctgga agatgctgct aggctattgc tcgaaaccaa tatcgccaac 600
tacccgtggg aaaaaatgat ggcaaactaa 630
<210> 62
<211> 209
<212> PRT
<213> Gossypium hirsutum
<400> 62
Met Gly Ser Ile Ser Phe Val Asn Ser Gln Thr Leu Lys Leu Phe Pro
1 5 10 15
Ser Phe Tyr Ser Phe Leu His Ser Lys Gln Pro Cys Ile Val Ser Met
20 25 30
Tyr His Tyr Ser His Lys Val Ala Leu Ala Pro Ser Leu Ser Leu Pro
35 40 45
Lys Pro Lys Asp Gly Ser Phe Arg Leu Ala Ala Glu Leu Ile Thr Asn
50 55 60
Ser Val Pro Ser Arg Asn Gly Asn Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Glu Asp Leu His Val Val Lys Ala Thr Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ala Leu Val Glu Lys Arg Val Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Ile Ser Gly Ser Ser Gln Asn Asp Thr Thr Leu Phe
130 135 140
Pro Asn Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile Gln Lys Leu
145 150 155 160
Met Asn Lys Asn Asn Gly Asn Val Val Gly Asp Leu Met Thr Pro Ser
165 170 175
Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Glu Thr Asn Ile Ala Asn Tyr Pro Trp Glu Lys Met Met Ala
195 200 205
Asn
<210> 63
<211> 720
<212> DNA
<213> Gossypium hirsutum
<400> 63
atggacacaa ttctccatac cgaacctcta tctctcactc gcttacgcgc cacttcgaat 60
tccagcgctt ccattcacca tatgccttgc cagctcatct tccgtccttt ccaccgcctc 120
tcctttcctt tatccaccgt caacgctggc tccagttctc gcaggtcatc cgcttttgtt 180
gtcgccgcta gcggcactct caccgccaat tccgtttcgc cgagaggtgg agtatataca 240
gttggggatt tcatgacggg aaaagaggat ttgcatgttg taaagccaac aacaactgtt 300
gatgaagcac tggaagctct tgttgaacac agaatcaccg gttttcctgt tatcgatgat 360
gattggaaat tggttggact tgtttctgat tatgacttgc tagcattgga ctccatatct 420
gggcggcgga ctgagaatga cctgtttcct gaagttgata gcacttggaa aactttcaac 480
gagatacaga agttactcaa caagacgaat ggccaggtgg ttggtgattt aatgacacca 540
gctccattag ttgtacgtga aacaactaat ctcgaggatg ctgctagatt attgcttgag 600
acaaaatacc gcagacttcc tgttgttgat gtagagggca agctggtggg tatcatcaca 660
agaggaaatg tcgttagagc cgcccttcaa ataaagcgtg aaattgaagg aaaagcttaa 720
<210> 64
<211> 239
<212> PRT
<213> Gossypium hirsutum
<400> 64
Met Asp Thr Ile Leu His Thr Glu Pro Leu Ser Leu Thr Arg Leu Arg
1 5 10 15
Ala Thr Ser Asn Ser Ser Ala Ser Ile His His Met Pro Cys Gln Leu
20 25 30
Ile Phe Arg Pro Phe His Arg Leu Ser Phe Pro Leu Ser Thr Val Asn
35 40 45
Ala Gly Ser Ser Ser Arg Arg Ser Ser Ala Phe Val Val Ala Ala Ser
50 55 60
Gly Thr Leu Thr Ala Asn Ser Val Ser Pro Arg Gly Gly Val Tyr Thr
65 70 75 80
Val Gly Asp Phe Met Thr Gly Lys Glu Asp Leu His Val Val Lys Pro
85 90 95
Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile
100 105 110
Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val
115 120 125
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg Arg Thr
130 135 140
Glu Asn Asp Leu Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn
145 150 155 160
Glu Ile Gln Lys Leu Leu Asn Lys Thr Asn Gly Gln Val Val Gly Asp
165 170 175
Leu Met Thr Pro Ala Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu
180 185 190
Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val
195 200 205
Val Asp Val Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val
210 215 220
Val Arg Ala Ala Leu Gln Ile Lys Arg Glu Ile Glu Gly Lys Ala
225 230 235
<210> 65
<211> 720
<212> DNA
<213> Gossypium hirsutum
<400> 65
atggacacaa ttctccatac cgaacctcta tctctcactc gcttacgcgc cacttcgaat 60
tccaccgctt ccattcacca tatgccttgc cagctcatct tccgtccttt ccaccgcctt 120
tcctttcctt tatccaccgt caacgctggc tccagttctc gcaggtcatc cgcttttgtt 180
gtcgccgcta gcggcactct caccgccaat tccgtttcgc caagaggtgg agtatataca 240
gttggggatt tcatgacgag aaaagaggat ttgcatgttg taaagccaac aacaactgtt 300
gatgaagcac tggaagctct tgttgaacac agaatcaccg gttttcctgt tattgatgat 360
gattggaaat tggttggact tgtttctgat tatgacttgc tagcattgga ctccatatct 420
gggcggcgga ctgagaatga cctgtttcct gaagttgata gcacttggaa aactttcaac 480
gaggtacaga agttactcaa caagacgaat ggccaggtgg ttggtgattt aatgacacca 540
gctccattag ttgtacgtga aacaactaat ctcgaggatg ctgctagatt attgctcgag 600
acaaaatacc gcaggcttcc ggttgttgat gtagagggca agctggtggg tatcatcaca 660
agaggaaatg tcgttagagc cgcccttcaa ataaagcgtg aaattgaagg aaaagcttaa 720
<210> 66
<211> 239
<212> PRT
<213> Gossypium hirsutum
<400> 66
Met Asp Thr Ile Leu His Thr Glu Pro Leu Ser Leu Thr Arg Leu Arg
1 5 10 15
Ala Thr Ser Asn Ser Thr Ala Ser Ile His His Met Pro Cys Gln Leu
20 25 30
Ile Phe Arg Pro Phe His Arg Leu Ser Phe Pro Leu Ser Thr Val Asn
35 40 45
Ala Gly Ser Ser Ser Arg Arg Ser Ser Ala Phe Val Val Ala Ala Ser
50 55 60
Gly Thr Leu Thr Ala Asn Ser Val Ser Pro Arg Gly Gly Val Tyr Thr
65 70 75 80
Val Gly Asp Phe Met Thr Arg Lys Glu Asp Leu His Val Val Lys Pro
85 90 95
Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile
100 105 110
Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val
115 120 125
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg Arg Thr
130 135 140
Glu Asn Asp Leu Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn
145 150 155 160
Glu Val Gln Lys Leu Leu Asn Lys Thr Asn Gly Gln Val Val Gly Asp
165 170 175
Leu Met Thr Pro Ala Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu
180 185 190
Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val
195 200 205
Val Asp Val Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val
210 215 220
Val Arg Ala Ala Leu Gln Ile Lys Arg Glu Ile Glu Gly Lys Ala
225 230 235
<210> 67
<211> 687
<212> DNA
<213> Glycine max
<400> 67
atggactcgg ttctcttgca cttgcatctc cacactctcc ctcctctctc ctccgccact 60
caccgccctc tctgccaccc tctcgccgcc tcctccgctt ctttccaccg ctcttctcct 120
cctctcccac gcttccgctt ctcgccgctt ctcgccgcta acaccctcac cgctaataac 180
atctcgccaa gaagtggact atacactgtt ggtgacttta tgacaaagaa agaggattta 240
catgtggtga aaccgacaac atctgtggat gaagctttag aaattcttgt tgaaaacagg 300
ataactggtt ttcccgtgat tgatgataac tggaaactgg ttggtgttgt ttcagattat 360
gatttgttag cactggactc tatatcaggt cacgggttaa aggataacat gtttccagaa 420
gttgacagta cttggaaaac tttcaatgag gttcaaaagc tgctaagtaa gaccaacgga 480
aagttgattg gtgaattgat gaccactgcc cctatggtcg ttcgtgagac caccaatctc 540
gaggatgctg cgaggttgtt gctagagacc aaatttcgac gccttccagt tgtagatgct 600
gagggtagac tggttgggat tatcacaaga ggaaatgttg taagagccgc actccacatg 660
aaacaagcga accaaaagaa agcatga 687
<210> 68
<211> 228
<212> PRT
<213> Glycine max
<400> 68
Met Asp Ser Val Leu Leu His Leu His Leu His Thr Leu Pro Pro Leu
1 5 10 15
Ser Ser Ala Thr His Arg Pro Leu Cys His Pro Leu Ala Ala Ser Ser
20 25 30
Ala Ser Phe His Arg Ser Ser Pro Pro Leu Pro Arg Phe Arg Phe Ser
35 40 45
Pro Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Asn Ile Ser Pro Arg
50 55 60
Ser Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu
65 70 75 80
His Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu Glu Ile Leu
85 90 95
Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys
100 105 110
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
115 120 125
Ser Gly His Gly Leu Lys Asp Asn Met Phe Pro Glu Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe
180 185 190
Arg Arg Leu Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile
195 200 205
Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Met Lys Gln Ala Asn
210 215 220
Gln Lys Lys Ala
225
<210> 69
<211> 630
<212> DNA
<213> Glycine max
<400> 69
atggactcgg ttctcttgca cttgcatctc cacactctcc ctcctctctc ctccgccact 60
caccgccctc tctgccaccc tctcgccgcc tcctccgctt ctttccaccg ctcttctcct 120
cctctcccac gcttccgctt ctcgccgctt ctcgccgcta acaccctcac cgctaataac 180
atctcgccaa gaagtggact atacactgtt ggtgacttta tgacaaagaa agaggattta 240
catgtggtga aaccgacaac atctgtggat gaagctttag aaattcttgt tgaaaacagg 300
ataactggtt ttcccgtgat tgatgataac tggaaactgg ttggtgttgt ttcagattat 360
gatttgttag cactggactc tatatcaggt cacgggttaa aggataacat gtttccagaa 420
gttgacagta cttggaaaac tttcaatgag gttcaaaagc tgctaagtaa gaccaacgga 480
aagttgattg gtgaattgat gaccactgcc cctatggtcg ttcgtgagac caccaatctc 540
gaggatgctg cgaggttctt tcatcttttt cctaatttac ccttggaaac atcccccttt 600
gctttttcct tttttaactt ttgtttttag 630
<210> 70
<211> 209
<212> PRT
<213> Glycine max
<400> 70
Met Asp Ser Val Leu Leu His Leu His Leu His Thr Leu Pro Pro Leu
1 5 10 15
Ser Ser Ala Thr His Arg Pro Leu Cys His Pro Leu Ala Ala Ser Ser
20 25 30
Ala Ser Phe His Arg Ser Ser Pro Pro Leu Pro Arg Phe Arg Phe Ser
35 40 45
Pro Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Asn Ile Ser Pro Arg
50 55 60
Ser Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu
65 70 75 80
His Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu Glu Ile Leu
85 90 95
Val Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys
100 105 110
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
115 120 125
Ser Gly His Gly Leu Lys Asp Asn Met Phe Pro Glu Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Phe Phe His Leu Phe Pro Asn
180 185 190
Leu Pro Leu Glu Thr Ser Pro Phe Ala Phe Ser Phe Phe Asn Phe Cys
195 200 205
Phe
<210> 71
<211> 687
<212> DNA
<213> Glycine max
<400> 71
atggactcag ctctgtcgcg gttgcatctc cacaatctcc ctcctctttc ctccgccgct 60
caccgccctc tcttgcagcc tctcgccgcc gccgcttctt tctaccgctc ttctcctcct 120
ctcccacgcc tccgtctctc gccgcttctc gctgctaaca ccctcaccgc taatgacgtc 180
tcgccaagaa gtggactata cactgtcggt gactttatga caaagaaaga ggatttacat 240
gtggtgaaac ccacaacatc tgtggatgaa gctttggaga ttcttgttga aaacaggata 300
actggttttc ccgtgattga tgataactgg aaactggttg gtgttgtttc agattatgat 360
ttgttagcac tggactctat atcaggtcac gggctaaagg ataacaacat gtttccagaa 420
gttgacagta cttggaaaac tttcaatgag gttcaaaagc tgctaagtaa gaccaacgga 480
aagttgattg gtgaattgat gaccactgcc cctatggtcg ttcgtgagac caccaatctc 540
gaggatgctg cgaggttgtt gctagaaacc aaatttcgac gcctaccagt tgtagatgct 600
gagggtagac tggttgggat tatcacaaga ggaaatgttg taagagccgc actgcacatg 660
aaacaagcga accaaaagaa agaatga 687
<210> 72
<211> 228
<212> PRT
<213> Glycine max
<400> 72
Met Asp Ser Ala Leu Ser Arg Leu His Leu His Asn Leu Pro Pro Leu
1 5 10 15
Ser Ser Ala Ala His Arg Pro Leu Leu Gln Pro Leu Ala Ala Ala Ala
20 25 30
Ser Phe Tyr Arg Ser Ser Pro Pro Leu Pro Arg Leu Arg Leu Ser Pro
35 40 45
Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Asp Val Ser Pro Arg Ser
50 55 60
Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu His
65 70 75 80
Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu Glu Ile Leu Val
85 90 95
Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu
100 105 110
Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
115 120 125
Gly His Gly Leu Lys Asp Asn Asn Met Phe Pro Glu Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe
180 185 190
Arg Arg Leu Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile
195 200 205
Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Met Lys Gln Ala Asn
210 215 220
Gln Lys Lys Glu
225
<210> 73
<211> 669
<212> DNA
<213> Glycine max
<400> 73
atgacttcga ttcatttgat aaacactctc gctgctccgc ttcgttcttt ttctcctccg 60
tcgctttttc cgcaatgcca ttctcctctc cgttcttccg ctgccccgaa acggcgtcgt 120
ttcgctaact cctctgggtt ccgccttgct tcaagccaaa ccgtgaattc ggttccgcgt 180
gggaatggaa cttacaccgt tgctgatttc atgacaaaga agcaagattt gcatgttgtc 240
aaaaccacca ctaccgttga tgaagctctg gaggctcttg taaactacag aatcagtggt 300
cttccggtaa tcgatgaggt ctggaatctg gttggagttg tatctgatta tgacttgtta 360
gctattgatt cgatatcagg aggtcctcaa agtgatgcaa acttgttccc caatgttgat 420
agtacttgga aaacattcaa tgagttacaa aaactgctta gtaagactaa tggccaagtt 480
gtcggtgact tgatgactcc aactccactt gttgttcatg aatcaactag tcttgaggaa 540
gctgctaggc tgttacttga aacaaaatat cgtcgactac ctgtggtaga tgatgatgga 600
aagctggttg gacttattac acggggaaac attgttaagg cagctctact atcaaaacgt 660
gctggatag 669
<210> 74
<211> 222
<212> PRT
<213> Glycine max
<400> 74
Met Thr Ser Ile His Leu Ile Asn Thr Leu Ala Ala Pro Leu Arg Ser
1 5 10 15
Phe Ser Pro Pro Ser Leu Phe Pro Gln Cys His Ser Pro Leu Arg Ser
20 25 30
Ser Ala Ala Pro Lys Arg Arg Arg Phe Ala Asn Ser Ser Gly Phe Arg
35 40 45
Leu Ala Ser Ser Gln Thr Val Asn Ser Val Pro Arg Gly Asn Gly Thr
50 55 60
Tyr Thr Val Ala Asp Phe Met Thr Lys Lys Gln Asp Leu His Val Val
65 70 75 80
Lys Thr Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Asn Tyr
85 90 95
Arg Ile Ser Gly Leu Pro Val Ile Asp Glu Val Trp Asn Leu Val Gly
100 105 110
Val Val Ser Asp Tyr Asp Leu Leu Ala Ile Asp Ser Ile Ser Gly Gly
115 120 125
Pro Gln Ser Asp Ala Asn Leu Phe Pro Asn Val Asp Ser Thr Trp Lys
130 135 140
Thr Phe Asn Glu Leu Gln Lys Leu Leu Ser Lys Thr Asn Gly Gln Val
145 150 155 160
Val Gly Asp Leu Met Thr Pro Thr Pro Leu Val Val His Glu Ser Thr
165 170 175
Ser Leu Glu Glu Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
180 185 190
Leu Pro Val Val Asp Asp Asp Gly Lys Leu Val Gly Leu Ile Thr Arg
195 200 205
Gly Asn Ile Val Lys Ala Ala Leu Leu Ser Lys Arg Ala Gly
210 215 220
<210> 75
<211> 687
<212> DNA
<213> Glycine max
<400> 75
atggactcag ctctgtcgcg gttgcatctc cacaatctcc ctcctctttc ctccgccgct 60
caccgccctc tcttgcagcc tctcgccgcc gccgcttctt tctaccgctc ttctcctcct 120
ctcccacgcc tccgtctctc gccgcttctc gctgctaaca ccctcaccgc taatgacgtc 180
tcgccaagaa gtggactata cactgtcggt gactttatga caaagaaaga ggatttacat 240
gtggtgaaac ccacaacatc tgtggatgaa gctttggaga ttcttgttga aaacaggata 300
actggttttc ccgtgattga tgataactgg aaactggttg gtgttgtttc agattatgat 360
ttgttagcac tggactctat atcaggtcac gggctaaagg ataacaacat gtttccagaa 420
gttgacagta cttggaaaac tttcaatgag gttcaaaagc tgctaagtaa gaccaacgga 480
aagttgattg gtgaattgat gaccactgcc cctatggtcg ttcgtgagac caccaatctc 540
gaggatgctg cgaggttgtt gctagaaacc aaatttcgac gcctaccagt tgtagatgct 600
gagggtagac tggttgggat tatcacaaga ggaaatgttg taagagccgc actccacatg 660
aaacaagcga accaaaagaa agcatga 687
<210> 76
<211> 228
<212> PRT
<213> Glycine max
<400> 76
Met Asp Ser Ala Leu Ser Arg Leu His Leu His Asn Leu Pro Pro Leu
1 5 10 15
Ser Ser Ala Ala His Arg Pro Leu Leu Gln Pro Leu Ala Ala Ala Ala
20 25 30
Ser Phe Tyr Arg Ser Ser Pro Pro Leu Pro Arg Leu Arg Leu Ser Pro
35 40 45
Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Asp Val Ser Pro Arg Ser
50 55 60
Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu His
65 70 75 80
Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu Glu Ile Leu Val
85 90 95
Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu
100 105 110
Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
115 120 125
Gly His Gly Leu Lys Asp Asn Asn Met Phe Pro Glu Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe
180 185 190
Arg Arg Leu Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile
195 200 205
Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Met Lys Gln Ala Asn
210 215 220
Gln Lys Lys Ala
225
<210> 77
<211> 678
<212> DNA
<213> Glycine max
<400> 77
atgagttcga ttcatttgtt aaacactctt gctgttccgc ttcgttcttt ttctcctccg 60
tcgctctttc cgcaatgcca ttctcctctc cgttcttctt ccgctgttcc aaaacggcgt 120
cgtttctcta actcctctgg gttccgtctt gcttcaagtc aaaccgtgaa ttcggttccg 180
cgtgcgaatg gaacttacac cgtttcggat ttcatgacaa agaagcaaga tttgcatgtt 240
gtcaaaacca ccaccaccgt tgatgaagct ttggaggctc ttgtaaacaa cagaatcagt 300
ggtcttccgg tgatcgatga ggactggaat ctggttggag ttgtttctga ttatgactta 360
ttggctattg attcgatatc aggaggtcct caaagtgatg caaacttgtt ccccgacgtc 420
gatagtactt ggaaaacgtt caatgagtta caaaagctgc ttagtaagac taatggccaa 480
gttgttggtg acttgatgac tccaactcca cttgttgttc atgaatcgac tagtcttgag 540
gaagctgcta ggctgttact tgaaacaaaa tatcgtcgac tacctgtggt agatgatgat 600
ggaaagctgg ttggacttat tacacgggga aatattgtta aggcggctct actatcaaaa 660
cgtgctggag agtggtga 678
<210> 78
<211> 225
<212> PRT
<213> Glycine max
<400> 78
Met Ser Ser Ile His Leu Leu Asn Thr Leu Ala Val Pro Leu Arg Ser
1 5 10 15
Phe Ser Pro Pro Ser Leu Phe Pro Gln Cys His Ser Pro Leu Arg Ser
20 25 30
Ser Ser Ala Val Pro Lys Arg Arg Arg Phe Ser Asn Ser Ser Gly Phe
35 40 45
Arg Leu Ala Ser Ser Gln Thr Val Asn Ser Val Pro Arg Ala Asn Gly
50 55 60
Thr Tyr Thr Val Ser Asp Phe Met Thr Lys Lys Gln Asp Leu His Val
65 70 75 80
Val Lys Thr Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Asn
85 90 95
Asn Arg Ile Ser Gly Leu Pro Val Ile Asp Glu Asp Trp Asn Leu Val
100 105 110
Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Ile Asp Ser Ile Ser Gly
115 120 125
Gly Pro Gln Ser Asp Ala Asn Leu Phe Pro Asp Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe Asn Glu Leu Gln Lys Leu Leu Ser Lys Thr Asn Gly Gln
145 150 155 160
Val Val Gly Asp Leu Met Thr Pro Thr Pro Leu Val Val His Glu Ser
165 170 175
Thr Ser Leu Glu Glu Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg
180 185 190
Arg Leu Pro Val Val Asp Asp Asp Gly Lys Leu Val Gly Leu Ile Thr
195 200 205
Arg Gly Asn Ile Val Lys Ala Ala Leu Leu Ser Lys Arg Ala Gly Glu
210 215 220
Trp
225
<210> 79
<211> 681
<212> DNA
<213> Glycine soja
<400> 79
atggactcag ctctgtcgcg gttgcatctc cacaatctcc ctcctctttc ctccgccgct 60
caccgccctc tcttgcagcc tctcgccgcc gccgcttctt tctaccgctc ttctcctcct 120
ctcccacgcc tccgtctctc gccgcttctc gctgctaaca ccctcaccgc taatgacgtc 180
tcgccaagaa gtggactata cactgtcggt gactttatga caaagaaaga ggatttacat 240
gtggtgaaac ccacaacatc tgtggatgaa gctttggaga ttcttgttga aaacaggata 300
actggttttc ccgtgattga tgataactgg aaactggttg gtgttgtttc agattatgat 360
ttgttagcac tggactctat atcaggtcac gggctaaagg ataacaacat gtttccagaa 420
gttgacagta cttggaaaac tttcaatgag gttcaaaagc tgctaagtaa gaccaacgga 480
aagttgattg gtgaattgat gaccactgcc cctatggtcg ttcgtgagac caccaatctc 540
gaggatgctg cgaggttgtt gctagaaacc aaatttcgac gcctaccagt tgtagatgct 600
gagggtagac tggtcgggat tatcacaaga ggaaatgttt gaagagccgc actgcacatg 660
aaacaagtga accaaaagga a 681
<210> 80
<211> 226
<212> PRT
<213> Glycine soja
<400> 80
Met Asp Ser Ala Leu Ser Arg Leu His Leu His Asn Leu Pro Pro Leu
1 5 10 15
Ser Ser Ala Ala His Arg Pro Leu Leu Gln Pro Leu Ala Ala Ala Ala
20 25 30
Ser Phe Tyr Arg Ser Ser Pro Pro Leu Pro Arg Leu Arg Leu Ser Pro
35 40 45
Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Asp Val Ser Pro Arg Ser
50 55 60
Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu His
65 70 75 80
Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu Glu Ile Leu Val
85 90 95
Glu Asn Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu
100 105 110
Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
115 120 125
Gly His Gly Leu Lys Asp Asn Asn Met Phe Pro Glu Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu
165 170 175
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe
180 185 190
Arg Arg Leu Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile
195 200 205
Thr Arg Gly Asn Val Arg Ala Ala Leu His Met Lys Gln Val Asn Gln
210 215 220
Lys Glu
225
<210> 81
<211> 726
<212> DNA
<213> Helianthus ciliaris
<220>
<221> misc_feature
<222> (562)..(562)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (709)..(709)
<223> n is a, c, g, or t
<400> 81
atgaactcga tcatgctacc ggcggcctgt atctccggcg tcgttacatc tgtacagcac 60
cgattgttac cgtcttcatc ctcacagact ctaggttttc accggacgca atttgattct 120
actttttcgt cacgacggtt ttccgatcgt gatcggagcg gtttgccagc tgttcgttct 180
gttgctgctt attcgactaa ttctacaacg cccagagatg gaatatacac agttgcagat 240
tttatgacaa gaaaagccaa cttacttgtg gtagaaacat caacacctgt tgacaaggca 300
cttgagattc tagtggagaa aagaattaca ggctttccag tggttgatgc tgattggaat 360
ttggtcggtg tcgtttcaga ttatgacttg ttagcgcttg attcaatttc aggtggtact 420
cacagcgaca cagctttgtt tcctgatgtt gatagttcct ggaaaacttt caatgagata 480
cagaaactac ttggtaaaac tgacgggaaa gttgtcggag atttgatgac acctgctcca 540
cttgtcgttc acgaaacctc anatcttgag gatgctgtaa ggctgttgct tgaaacaaag 600
taccgtcgac ttccagtcgt cgatgatgat ggcaagctgg ttggacttat aactcgaggt 660
gatgttgtta gagctgccct tcagatcaaa catgatatta agaagatgnc attatcacaa 720
gattga 726
<210> 82
<211> 241
<212> PRT
<213> Helianthus ciliaris
<220>
<221> misc_feature
<222> (188)..(188)
<223> Xaa can be any naturally occurring amino acid
<220>
<221> misc_feature
<222> (237)..(237)
<223> Xaa can be any naturally occurring amino acid
<400> 82
Met Asn Ser Ile Met Leu Pro Ala Ala Cys Ile Ser Gly Val Val Thr
1 5 10 15
Ser Val Gln His Arg Leu Leu Pro Ser Ser Ser Ser Gln Thr Leu Gly
20 25 30
Phe His Arg Thr Gln Phe Asp Ser Thr Phe Ser Ser Arg Arg Phe Ser
35 40 45
Asp Arg Asp Arg Ser Gly Leu Pro Ala Val Arg Ser Val Ala Ala Tyr
50 55 60
Ser Thr Asn Ser Thr Thr Pro Arg Asp Gly Ile Tyr Thr Val Ala Asp
65 70 75 80
Phe Met Thr Arg Lys Ala Asn Leu Leu Val Val Glu Thr Ser Thr Pro
85 90 95
Val Asp Lys Ala Leu Glu Ile Leu Val Glu Lys Arg Ile Thr Gly Phe
100 105 110
Pro Val Val Asp Ala Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Gly Thr His Ser Asp Thr
130 135 140
Ala Leu Phe Pro Asp Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Gly Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met
165 170 175
Thr Pro Ala Pro Leu Val Val His Glu Thr Ser Xaa Leu Glu Asp Ala
180 185 190
Val Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp
195 200 205
Asp Asp Gly Lys Leu Val Gly Leu Ile Thr Arg Gly Asp Val Val Arg
210 215 220
Ala Ala Leu Gln Ile Lys His Asp Ile Lys Lys Met Xaa Leu Ser Gln
225 230 235 240
Asp
<210> 83
<211> 708
<212> DNA
<213> Helianthus exilis
<400> 83
atggcctcac ttctccgccc cataaccctt tcccaatcca ccgtatctca ccagcagcag 60
cagctgccct gtttaatctc atctcatcct tcgcgaatct ccacactacc ctcttctaat 120
tgcatcttta cactttcttc ttctagacct acacctactc tcatcgtcgc agcagcagct 180
accttcaccg gtaattcagt accgccaaga aatggagttc tgattgtggg tgattttatg 240
actacaaaag acgagttaca cgtagtaaag cccacaacaa cggtagatga agccctggaa 300
gctcttgtaa aatacagaat aactggcttt cctgtaattg acgatgactg gaaattggtt 360
gggctggtct cggattatga cttactagca cttgattctg tatcaggtgc tatgcgatct 420
gatgcaagca tgttcccgga agttgatagc acctggaaga cattcaatga ggtacaaaaa 480
ctgctgagta aaaccgacgg gaaggtagtt ggtgatttaa tgacacccgc accgttagta 540
gttcgtccaa ataccaatct cgaggatgct gccagattgt tacttgaaac aaaatatcgg 600
cgtcttccgg ttgtagacgg tgagggaaag ctggtgggaa ttattacaag aggaaatgta 660
gtaagagctg ccctacaaat aaaaaaggct aacgagacca aaacatga 708
<210> 84
<211> 235
<212> PRT
<213> Helianthus exilis
<400> 84
Met Ala Ser Leu Leu Arg Pro Ile Thr Leu Ser Gln Ser Thr Val Ser
1 5 10 15
His Gln Gln Gln Gln Leu Pro Cys Leu Ile Ser Ser His Pro Ser Arg
20 25 30
Ile Ser Thr Leu Pro Ser Ser Asn Cys Ile Phe Thr Leu Ser Ser Ser
35 40 45
Arg Pro Thr Pro Thr Leu Ile Val Ala Ala Ala Ala Thr Phe Thr Gly
50 55 60
Asn Ser Val Pro Pro Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Asp Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Lys Tyr Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Ala Met Arg Ser Asp Ala Ser Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Lys
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Pro Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Ala Asn Glu Thr Lys Thr
225 230 235
<210> 85
<211> 708
<212> DNA
<213> Helianthus petiolaris
<400> 85
atggcctcac ttctccgccc cataaccctt tcccaatcca ccctatctca ccaccaccag 60
ctgccctctt taatctcatc tcatccttcg cgaatctcca cactaccctc ttctaattgc 120
atctttacac tttcttctag acctacacct actctcatcg tcgcagcagc agcagcagct 180
accttcgctg gtaattcagt accgtcaaga aatggagttc tgattgtggg tgattttatg 240
actacaaaag acgagttaca cgtagtaaag cccacaacaa cggtggatga agccctggaa 300
gctcttgtaa aatacagaat tactggcttt cctgtaattg acgatgactg gaaattggtt 360
gggctggtct cggattatga cttactagca cttgattctg tatcaggcgc tatgcgatct 420
gatacaagca tgttcccgga agttgatagc acctggaaga cattcaatga ggtacaaaaa 480
ctgctgagta aaaccgacgg gaaggtagtt ggtgatttaa tgacacccgc accgttagta 540
gttcgtccaa ataccaatct cgaggatgct gccagattgt tacttgaaac gaaatatcgg 600
cgtcttccgg ttgtagatgg tgaaggaaag ctggtgggaa ttattacaag aggaaatgta 660
gtaagagctg ccctacaaat aaaaaaggct aacgagacca aaacatga 708
<210> 86
<211> 235
<212> PRT
<213> Helianthus petiolaris
<400> 86
Met Ala Ser Leu Leu Arg Pro Ile Thr Leu Ser Gln Ser Thr Leu Ser
1 5 10 15
His His His Gln Leu Pro Ser Leu Ile Ser Ser His Pro Ser Arg Ile
20 25 30
Ser Thr Leu Pro Ser Ser Asn Cys Ile Phe Thr Leu Ser Ser Arg Pro
35 40 45
Thr Pro Thr Leu Ile Val Ala Ala Ala Ala Ala Ala Thr Phe Ala Gly
50 55 60
Asn Ser Val Pro Ser Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Asp Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Lys Tyr Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Ala Met Arg Ser Asp Thr Ser Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Lys
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Pro Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Ala Asn Glu Thr Lys Thr
225 230 235
<210> 87
<211> 705
<212> DNA
<213> Helianthus petiolaris
<400> 87
atggcctcac ttctccgccc cataactctt tcccaatcca ccgtatctca ccaccatcag 60
ctgccctctt taatctcatc tcatccctcg cgaatctccg cactaccctc ttctaattgc 120
atctttacac tttcttctag acctactctc gtcgtcgcag cagcagcagc agcagctacc 180
ttcaccggta attcagtacc gtcaagaaat ggagttctga ttgtgggtga ttttatgact 240
acaaaagacg agttacacgt agtaaagccc acaacaacgg tagatgaagc cctggaagct 300
cttgtaaaat acagaataac tggctttcct gtaattgacg atgactggaa attggttggg 360
ctggtctcgg attatgactt actagcactt gattctgtat caggcgctat gcgatctgat 420
acaagcatgt tcccggaagt tgatagcacc tggaagacat tcaatgaggt acaaaaactg 480
ctgagtaaaa ccgacgggaa ggtagttggt gatttaatga cacccgcacc gttagtagtt 540
cgtccaaata ccaatcttga ggatgctgcc agattgttac ttgaaacgaa atatcggcgt 600
cttccggttg tagatggtga aggaaagctg gtgggaatta ttacaagagg aaatgtagta 660
agagctgccc tacaaataaa aaaggctaac gagaccaaaa catga 705
<210> 88
<211> 234
<212> PRT
<213> Helianthus petiolaris
<400> 88
Met Ala Ser Leu Leu Arg Pro Ile Thr Leu Ser Gln Ser Thr Val Ser
1 5 10 15
His His His Gln Leu Pro Ser Leu Ile Ser Ser His Pro Ser Arg Ile
20 25 30
Ser Ala Leu Pro Ser Ser Asn Cys Ile Phe Thr Leu Ser Ser Arg Pro
35 40 45
Thr Leu Val Val Ala Ala Ala Ala Ala Ala Ala Thr Phe Thr Gly Asn
50 55 60
Ser Val Pro Ser Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met Thr
65 70 75 80
Thr Lys Asp Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp Glu
85 90 95
Ala Leu Glu Ala Leu Val Lys Tyr Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Ala Met Arg Ser Asp Thr Ser Met Phe
130 135 140
Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Leu Ser Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Pro Asn Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Gln Ile Lys Lys Ala Asn Glu Thr Lys Thr
225 230
<210> 89
<211> 693
<212> DNA
<213> Hordeum vulgare
<400> 89
atgggcgcca ggctgctgtt actctccttc gattacccgg ccgtcgctgg cggggggcgg 60
tctcgtctgt ctgcggtacc acggatgtct tccggtgccc cacgcgtgcg gtccccagcc 120
tcatccatcc gcgcgtccgc ggccaccgcc gctagaggca acctgccgca ccacacctcc 180
gtggttgtgg aagccggtgg agcttacact gttggtgact ttatgactaa aagggaacac 240
ctccatgttg tgaaaccatc cacttcagta gatgaagctc ttgagaggct ggtggagcat 300
cggataactg gctttcctgt taccgatgat cactggaact tggttggtgt tgtgtcagat 360
tatgatctgt tagcactgga ctcgatatca ggaaatggac aggctgaacc tgacatattt 420
cctgaggtgg acagcacttg gaagacattc cgtgagatac aaaagctctt aagcaaaacc 480
aatgggaaag tagttagtga tgttatgact tctgcacctc ttgtggtgcg tgaaactact 540
aaccttgaag atgctgcaag gttacttctt gttactaaat accgcaggct gccagtagta 600
gatggttcgg gcaaattggt tggaatcatc acaagaggga acgttgtcag agctgctctt 660
gaatttaaga aaaatgttga agggagtctt tga 693
<210> 90
<211> 230
<212> PRT
<213> Hordeum vulgare
<400> 90
Met Gly Ala Arg Leu Leu Leu Leu Ser Phe Asp Tyr Pro Ala Val Ala
1 5 10 15
Gly Gly Gly Arg Ser Arg Leu Ser Ala Val Pro Arg Met Ser Ser Gly
20 25 30
Ala Pro Arg Val Arg Ser Pro Ala Ser Ser Ile Arg Ala Ser Ala Ala
35 40 45
Thr Ala Ala Arg Gly Asn Leu Pro His His Thr Ser Val Val Val Glu
50 55 60
Ala Gly Gly Ala Tyr Thr Val Gly Asp Phe Met Thr Lys Arg Glu His
65 70 75 80
Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu Ala Leu Glu Arg
85 90 95
Leu Val Glu His Arg Ile Thr Gly Phe Pro Val Thr Asp Asp His Trp
100 105 110
Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser
115 120 125
Ile Ser Gly Asn Gly Gln Ala Glu Pro Asp Ile Phe Pro Glu Val Asp
130 135 140
Ser Thr Trp Lys Thr Phe Arg Glu Ile Gln Lys Leu Leu Ser Lys Thr
145 150 155 160
Asn Gly Lys Val Val Ser Asp Val Met Thr Ser Ala Pro Leu Val Val
165 170 175
Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Val Thr
180 185 190
Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Ser Gly Lys Leu Val Gly
195 200 205
Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Glu Phe Lys Lys
210 215 220
Asn Val Glu Gly Ser Leu
225 230
<210> 91
<211> 543
<212> DNA
<213> Hordeum vulgare
<400> 91
atgccagcgc cggcctctgg aaacggcctc gtcccgaata acaacggagt gtacactgtt 60
ggagacttca tgacgaaaaa ggaggatctc catgtcgtca agccgtcaac cccggttgat 120
gaagcgctcg agatgctggt gcagaacagg atctctggtt tccctgttat cgatgacgac 180
tggaagttgg ttggcgttgt ctcagattat gatctattag ctttggactc aatggcagga 240
tgtggactgg ccgatacaaa ttcaagcatg ttccctgaag tagatagcac ttggaagaca 300
tttcgcgaga tccagagact cttgagcaaa accagtggca aagttatcgg tgatgttatg 360
actccctcgc ctcttgtggt gcgtgaaact actaacctcg acgctgctgc aaggttgctg 420
cttgaaacca aataccacag attgcctgtt gttgatagca cgggaaaatt ggttgggatg 480
atcacaaggg ggaatgtcgt cagagctgct ctcaaaataa agaagaaagc tgaaggtgct 540
taa 543
<210> 92
<211> 180
<212> PRT
<213> Hordeum vulgare
<400> 92
Met Pro Ala Pro Ala Ser Gly Asn Gly Leu Val Pro Asn Asn Asn Gly
1 5 10 15
Val Tyr Thr Val Gly Asp Phe Met Thr Lys Lys Glu Asp Leu His Val
20 25 30
Val Lys Pro Ser Thr Pro Val Asp Glu Ala Leu Glu Met Leu Val Gln
35 40 45
Asn Arg Ile Ser Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val
50 55 60
Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Met Ala Gly
65 70 75 80
Cys Gly Leu Ala Asp Thr Asn Ser Ser Met Phe Pro Glu Val Asp Ser
85 90 95
Thr Trp Lys Thr Phe Arg Glu Ile Gln Arg Leu Leu Ser Lys Thr Ser
100 105 110
Gly Lys Val Ile Gly Asp Val Met Thr Pro Ser Pro Leu Val Val Arg
115 120 125
Glu Thr Thr Asn Leu Asp Ala Ala Ala Arg Leu Leu Leu Glu Thr Lys
130 135 140
Tyr His Arg Leu Pro Val Val Asp Ser Thr Gly Lys Leu Val Gly Met
145 150 155 160
Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Lys Ile Lys Lys Lys
165 170 175
Ala Glu Gly Ala
180
<210> 93
<211> 678
<212> DNA
<213> Lotus japonicus
<400> 93
atgagttcga ttcatttgat cagtgctcct ccgcttcggt cactatctcc gtccctattc 60
ccccaaaccc attctccggt tccatcctcc gccgtcccca aacggcgtcg ctcctctcac 120
tccgctcggt tccgccttgc ctccggccca agcgcaaccg tcgattcggt tccgcgcgag 180
aatggaactt atacagttgc tgatttcatg actaagaagc agaatttgca tgttgccaaa 240
accaccacca ccgttgatga agctcttgaa gcacttgtca aaaacagaat cagtggtctt 300
ccagtagttg atgatgactg gaatctggtt ggagttgttt cagattatga cttgttagca 360
attgattcca tatcaggtgg taatcaaaac gattcaaact tattccctga cgtcaatagt 420
tcttggaaaa cattcaatga gatacaaaag cttcttagta aaactaatgg ccaagttgtt 480
ggagacttga tgactccaac tccccttgtt gttcaagaat cgactaatct ggaggatgct 540
gcaaggctgt tgcttgaaac aaaatatcgt cgactgcctg tagttgatag agatggaaag 600
ctggttggac ttattacaag gggaaatata gttaaggcag cattgctgtc aaaacgtgct 660
ggtgataggc tctcatag 678
<210> 94
<211> 225
<212> PRT
<213> Lotus japonicus
<400> 94
Met Ser Ser Ile His Leu Ile Ser Ala Pro Pro Leu Arg Ser Leu Ser
1 5 10 15
Pro Ser Leu Phe Pro Gln Thr His Ser Pro Val Pro Ser Ser Ala Val
20 25 30
Pro Lys Arg Arg Arg Ser Ser His Ser Ala Arg Phe Arg Leu Ala Ser
35 40 45
Gly Pro Ser Ala Thr Val Asp Ser Val Pro Arg Glu Asn Gly Thr Tyr
50 55 60
Thr Val Ala Asp Phe Met Thr Lys Lys Gln Asn Leu His Val Ala Lys
65 70 75 80
Thr Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu Val Lys Asn Arg
85 90 95
Ile Ser Gly Leu Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Ile Asp Ser Ile Ser Gly Gly Asn
115 120 125
Gln Asn Asp Ser Asn Leu Phe Pro Asp Val Asn Ser Ser Trp Lys Thr
130 135 140
Phe Asn Glu Ile Gln Lys Leu Leu Ser Lys Thr Asn Gly Gln Val Val
145 150 155 160
Gly Asp Leu Met Thr Pro Thr Pro Leu Val Val Gln Glu Ser Thr Asn
165 170 175
Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu
180 185 190
Pro Val Val Asp Arg Asp Gly Lys Leu Val Gly Leu Ile Thr Arg Gly
195 200 205
Asn Ile Val Lys Ala Ala Leu Leu Ser Lys Arg Ala Gly Asp Arg Leu
210 215 220
Ser
225
<210> 95
<211> 669
<212> DNA
<213> Lotus japonicus
<400> 95
atggactcgg ttgttctcca tctcgaccgt ttccctctac tctccgccac tcaccgccca 60
acatggaatc cacgcgctgc cgcttccttc cgctgcttcc accgctccct tcctattcca 120
accctccgtg gctcgccgct tctcgctgcc aacaattctg ttccgccaaa aaatggagtg 180
tacactgttg gtgactttat gacaaagaga gaggatttac atgtggtaaa gcccacaaca 240
actgtggatg aagctctgga aatgcttgtt gaacataggg taactggttt tcccgtgatt 300
gatgataagt ggaacctagt ttgtgttgtt tcagattacg acttgttagc actggactct 360
atatcaggta atgggaggaa ggagagtagc atgtttccag aagttgacag ttcttggaaa 420
actttcaatg aggtgcagaa tctgttgagt aagacaaacg ggaaggtaat cggtgaatta 480
atgactactg cccctatggt cgttcgggag aacaccaatc ttgaggatgc tgccaggttg 540
ttgctagaaa caaagtttag acgccttcca gttgtagatt ctgaaggtag actggttggg 600
attatcacca gaggaaatgt tgtaggagcc gctcttcaaa ttaaacgagc tatccaaaac 660
aaagcatga 669
<210> 96
<211> 222
<212> PRT
<213> Lotus japonicus
<400> 96
Met Asp Ser Val Val Leu His Leu Asp Arg Phe Pro Leu Leu Ser Ala
1 5 10 15
Thr His Arg Pro Thr Trp Asn Pro Arg Ala Ala Ala Ser Phe Arg Cys
20 25 30
Phe His Arg Ser Leu Pro Ile Pro Thr Leu Arg Gly Ser Pro Leu Leu
35 40 45
Ala Ala Asn Asn Ser Val Pro Pro Lys Asn Gly Val Tyr Thr Val Gly
50 55 60
Asp Phe Met Thr Lys Arg Glu Asp Leu His Val Val Lys Pro Thr Thr
65 70 75 80
Thr Val Asp Glu Ala Leu Glu Met Leu Val Glu His Arg Val Thr Gly
85 90 95
Phe Pro Val Ile Asp Asp Lys Trp Asn Leu Val Cys Val Val Ser Asp
100 105 110
Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Asn Gly Arg Lys Glu
115 120 125
Ser Ser Met Phe Pro Glu Val Asp Ser Ser Trp Lys Thr Phe Asn Glu
130 135 140
Val Gln Asn Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Gly Glu Leu
145 150 155 160
Met Thr Thr Ala Pro Met Val Val Arg Glu Asn Thr Asn Leu Glu Asp
165 170 175
Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro Val Val
180 185 190
Asp Ser Glu Gly Arg Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val
195 200 205
Gly Ala Ala Leu Gln Ile Lys Arg Ala Ile Gln Asn Lys Ala
210 215 220
<210> 97
<211> 708
<212> DNA
<213> Lactuca perennis
<400> 97
atggcctcaa ttcctccgct tctagaccct ttatctctct ctcaattccg ctccgccacc 60
gtcttccacc ataacccgct ttctctaatc tcaccccctc catcatttat ctatactctc 120
ccatcttctc gcttccttcc agtttctcgc agacccactt tcaccgtcgc cggagcagct 180
accttgaccg gtaattccgt accgccaaga aatggagtct tgattgtggg tgatttcatg 240
actacaaaag acgaattaca tgtggtaaag cccacaacaa cagtagacga agctctagaa 300
gctcttgtag aacacagaat aaccggattt cctgtaattg atgataattg gaaattggtt 360
ggattggttt cagattatga tttattagca ctcgactctg tatcaggccc tgcccgacct 420
gatacgggca tgttcccgga ggttgatagc acctggaaga catttaatga ggtacaaaat 480
ttgctaagta aaaccgatgg gaagttggtt ggtgatttaa tgacacctgc gccattagta 540
gttcgtgaaa atactaatct tgaagatgct gccagattgt tgcttgaaac caaatatcgc 600
cgccttccag ttgtagatgg ggagggaaag ctggtgggaa ttattacaag aggaaatgtt 660
gtaagagctg ccttacaaat aaaaaaggct agtgaaatga aaacataa 708
<210> 98
<211> 235
<212> PRT
<213> Lactuca perennis
<400> 98
Met Ala Ser Ile Pro Pro Leu Leu Asp Pro Leu Ser Leu Ser Gln Phe
1 5 10 15
Arg Ser Ala Thr Val Phe His His Asn Pro Leu Ser Leu Ile Ser Pro
20 25 30
Pro Pro Ser Phe Ile Tyr Thr Leu Pro Ser Ser Arg Phe Leu Pro Val
35 40 45
Ser Arg Arg Pro Thr Phe Thr Val Ala Gly Ala Ala Thr Leu Thr Gly
50 55 60
Asn Ser Val Pro Pro Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Asp Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Pro Ala Arg Pro Asp Thr Gly Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Asn
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Glu Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Ala Ser Glu Met Lys Thr
225 230 235
<210> 99
<211> 729
<212> DNA
<213> Lactuca saligna
<400> 99
atggcttcaa ttcctccgct tatcgatcct ctatcttctt ccctactccg ttctacaacc 60
acttccgtcc ccgccaccgc cttcttccac cgtcagatgc cgtgtctaac ctcatctcct 120
tcggtgctcg ccgctaggct ttcttctcct ttccgcctta cagatcctcg ccgaccatcg 180
ctcaccgtcg ctgcagctac cactttgatg tccaattccg tgcagccgaa aagtggagtt 240
ttaatcgtag gtgattttat gaccaaaaaa gaggaattac acgtggtaaa acccacaaca 300
actgtagatg aagcacttaa gtctcttgtg gagaacagaa taactggctt ccctgtgatc 360
gatgacaatt ggaaattagt tggagttgta tcagattatg acttattagc attggattct 420
atatcaggga ctgggagagc tgacactgac atgttccctg aggtcgatag cacttggaaa 480
acattcaacg aggtacaaaa actactgagt aaaaccgacg gaaaagtagt tggggatttg 540
atgacgtcag cgccactagt agttcgtgaa accaccaatc tcgaagatgc cgcaagattg 600
ttgctcgaaa ctaaatatcg acgcctacct gtcgtagatg atgagggaaa gttggtgggg 660
attattacga gagggaatgt ggtaagagca gccctgaaaa taaaaaaaga aaacgaaaag 720
aaagcgtga 729
<210> 100
<211> 242
<212> PRT
<213> Lactuca saligna
<400> 100
Met Ala Ser Ile Pro Pro Leu Ile Asp Pro Leu Ser Ser Ser Leu Leu
1 5 10 15
Arg Ser Thr Thr Thr Ser Val Pro Ala Thr Ala Phe Phe His Arg Gln
20 25 30
Met Pro Cys Leu Thr Ser Ser Pro Ser Val Leu Ala Ala Arg Leu Ser
35 40 45
Ser Pro Phe Arg Leu Thr Asp Pro Arg Arg Pro Ser Leu Thr Val Ala
50 55 60
Ala Ala Thr Thr Leu Met Ser Asn Ser Val Gln Pro Lys Ser Gly Val
65 70 75 80
Leu Ile Val Gly Asp Phe Met Thr Lys Lys Glu Glu Leu His Val Val
85 90 95
Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Lys Ser Leu Val Glu Asn
100 105 110
Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr
130 135 140
Gly Arg Ala Asp Thr Asp Met Phe Pro Glu Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asp Gly Lys Val
165 170 175
Val Gly Asp Leu Met Thr Ser Ala Pro Leu Val Val Arg Glu Thr Thr
180 185 190
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
195 200 205
Leu Pro Val Val Asp Asp Glu Gly Lys Leu Val Gly Ile Ile Thr Arg
210 215 220
Gly Asn Val Val Arg Ala Ala Leu Lys Ile Lys Lys Glu Asn Glu Lys
225 230 235 240
Lys Ala
<210> 101
<211> 708
<212> DNA
<213> Lactuca saligna
<400> 101
atggcctcta tccctccgct tctagaccca ttatctctct ctcaattccg ttccgccacc 60
gtcttccacc atcatccgct ttctccaatc tcgccccctc catcatttat ctatactctc 120
ccatcttctc gcctccttcc agtttctcgc agacccactt tcaccgtcgc cggagcagct 180
accttgaccg gtaattccgt accgccaaga aatggagtct taattgtggg cgatttcatg 240
actacaaaag aggagttaca tgtcgttaag cccacaacaa cagtagacga agctttagaa 300
gctcttgtag aacacagaat caccggattt cctgtaattg atgataactg gaaattggtt 360
ggattggttt cagattatga cttattagca ctggactctg tatcaggccc tgcccgacct 420
gatacgggca tgttcccgga agttgatagc acctggaaga catttaatga agtacaaaat 480
ttgctaagca aaactgatgg gaagttggtt ggtgatttaa tgactcctgc gccattagta 540
gttcgtgaaa atactaatct tgaagatgct gccagattgt tacttgaaac caaatatcgc 600
cgccttcctg ttgtagatgg ggagggaaag ctggtgggga ttattacaag aggaaatgtt 660
gtaagagctg ccttacaaat aaaaaaggcg agtgaaatga aaacataa 708
<210> 102
<211> 235
<212> PRT
<213> Lactuca saligna
<400> 102
Met Ala Ser Ile Pro Pro Leu Leu Asp Pro Leu Ser Leu Ser Gln Phe
1 5 10 15
Arg Ser Ala Thr Val Phe His His His Pro Leu Ser Pro Ile Ser Pro
20 25 30
Pro Pro Ser Phe Ile Tyr Thr Leu Pro Ser Ser Arg Leu Leu Pro Val
35 40 45
Ser Arg Arg Pro Thr Phe Thr Val Ala Gly Ala Ala Thr Leu Thr Gly
50 55 60
Asn Ser Val Pro Pro Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Pro Ala Arg Pro Asp Thr Gly Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Asn
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Glu Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Ala Ser Glu Met Lys Thr
225 230 235
<210> 103
<211> 696
<212> DNA
<213> Lactuca sativa
<400> 103
atggcttcta tccctccgct tctagaccca ttatctctct ctcaattccg ttccgccacc 60
ctcttccacc atcatccgct ttctctaatc tcaccccctc catcatttat ctatactcac 120
ccatcttctc gcctccttcc agtttctcgc agacccactt tcaccgtcgc cggagcagct 180
accttgaccg gtaattccgt accgccaaga aatggagtct taattgtggg tgatttcatg 240
actacaaaag aggagttaca tgtcgttaag cctacaacaa cagtagacga agctctagaa 300
gctcttgtag aacacagaat caccggattt cctgtaattg atgataactg gaaattggtt 360
ggattggttt cagattatga cttattagca ctggactctg tatcaggccc tgcccgacct 420
gatacgggca tgttcccgga ggttgatagc acctggaaga catttaatga agtacaaaat 480
ttgctaagta aaactgatgg gaagttggtt ggtgatttaa tgacacctgc gccattagta 540
gttcgtgaaa atactaatct tgaagatgct gcaagattgt tacttgaaac caaatatcgc 600
cgccttccgg ttgtagatgg ggagggaaag ctggtgggga ttattacaag aggaaatgtt 660
gtaagagctg ccttacaaat aaaaaaaggc gagtga 696
<210> 104
<211> 231
<212> PRT
<213> Lactuca sativa
<400> 104
Met Ala Ser Ile Pro Pro Leu Leu Asp Pro Leu Ser Leu Ser Gln Phe
1 5 10 15
Arg Ser Ala Thr Leu Phe His His His Pro Leu Ser Leu Ile Ser Pro
20 25 30
Pro Pro Ser Phe Ile Tyr Thr His Pro Ser Ser Arg Leu Leu Pro Val
35 40 45
Ser Arg Arg Pro Thr Phe Thr Val Ala Gly Ala Ala Thr Leu Thr Gly
50 55 60
Asn Ser Val Pro Pro Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Pro Ala Arg Pro Asp Thr Gly Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Asn
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Glu Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Gly Glu
225 230
<210> 105
<211> 735
<212> DNA
<213> Lactuca sativa
<400> 105
atggcttcaa ttcctccgct taccgatccc ctatcttctt ccctactccg ttctacaacc 60
gcctccgttc ccaccaccgc cttcttccac cgtcagatgc cgtgtctaat ctcatctcct 120
cccgtgctcg ccgctaggct ttcttctcct tgccgcctta cagatcctcg cagaccatct 180
ctcaccgtcg ctgcggctac tactttgatg tccaattccg cgcagccgaa aagtggagtt 240
ttaattgtag gtgattttat gaccaaaaaa gaggaattac acgtggtaaa acccacaaca 300
actgtagatg aagcacttaa atctctagtg gagaacagaa taaccggctt ccctgtaatc 360
gatgagaact ggaaattagt tggggttgta tcagattatg acttattagc cttggattct 420
atatcaggga ctgggagagc tgacactgac atgttccctg aggtcgatag cacttggaaa 480
acattcaacg aagtacaaaa actactgagt aaaaccgacg gaaaagtggt tggtgatttg 540
atgacgtcag cgccattagt agttcgtgaa accaccaatc tcgaggatgc cgcaagattg 600
ttgctcgaaa ctaaatatcg acgcctacct gtcgtagatg atgagggaaa gttggtgggg 660
attattacga gagggaatgt ggtaagagca gccctaaaaa taaaaaaaga aaacgaaatg 720
aaaatgaaag cgtga 735
<210> 106
<211> 244
<212> PRT
<213> Lactuca sativa
<400> 106
Met Ala Ser Ile Pro Pro Leu Thr Asp Pro Leu Ser Ser Ser Leu Leu
1 5 10 15
Arg Ser Thr Thr Ala Ser Val Pro Thr Thr Ala Phe Phe His Arg Gln
20 25 30
Met Pro Cys Leu Ile Ser Ser Pro Pro Val Leu Ala Ala Arg Leu Ser
35 40 45
Ser Pro Cys Arg Leu Thr Asp Pro Arg Arg Pro Ser Leu Thr Val Ala
50 55 60
Ala Ala Thr Thr Leu Met Ser Asn Ser Ala Gln Pro Lys Ser Gly Val
65 70 75 80
Leu Ile Val Gly Asp Phe Met Thr Lys Lys Glu Glu Leu His Val Val
85 90 95
Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Lys Ser Leu Val Glu Asn
100 105 110
Arg Ile Thr Gly Phe Pro Val Ile Asp Glu Asn Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr
130 135 140
Gly Arg Ala Asp Thr Asp Met Phe Pro Glu Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asp Gly Lys Val
165 170 175
Val Gly Asp Leu Met Thr Ser Ala Pro Leu Val Val Arg Glu Thr Thr
180 185 190
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
195 200 205
Leu Pro Val Val Asp Asp Glu Gly Lys Leu Val Gly Ile Ile Thr Arg
210 215 220
Gly Asn Val Val Arg Ala Ala Leu Lys Ile Lys Lys Glu Asn Glu Met
225 230 235 240
Lys Met Lys Ala
<210> 107
<211> 726
<212> DNA
<213> Lactuca serriola
<400> 107
atggcttcaa ttcctccgct taccgatccc ctatcttctt ccctactccg ttctacaacc 60
gcctccgttc ccaccaccgc cttcttccac cgtcagatgc cgtgtctaat ctcatctcct 120
cccgtgctcg ccgctaggct ttcttctcct tgccgcctta cagatcctcg cagaccatct 180
ctcaccgtcg ctgcggctac tactttgatg tccaattccg cgcagccgaa aagtggagtt 240
ttaattgtag gtgattttat gaccaaaaaa gaggaattac acgtggtaaa acccacaaca 300
actgtagatg aagcacttaa atctctagtg gagaacagaa taaccggctt ccctgtaatc 360
gatgagaact ggaaattagt tggggttgta tcagattatg acttgttagc cttggattct 420
atatcaggga ctgggagagc tgacactgac atgttccctg aggtcgatag cacttggaaa 480
acattcaacg aagtacaaaa actactgagt aaaaccgacg gaaaagtggt tggtgatttg 540
atgacgtcag cgccattagt agttcgtgaa accaccaatc tcgaggatgc cgcaagattg 600
ttgctcgaaa ctaaatatcg acgcctacct gtcgtagatg atgagggaaa gttggtgggg 660
attattacga gagggaatgt ggtaagagca gccctaaaaa taaaaaaaga aaacgaaatg 720
aaatga 726
<210> 108
<211> 241
<212> PRT
<213> Lactuca serriola
<400> 108
Met Ala Ser Ile Pro Pro Leu Thr Asp Pro Leu Ser Ser Ser Leu Leu
1 5 10 15
Arg Ser Thr Thr Ala Ser Val Pro Thr Thr Ala Phe Phe His Arg Gln
20 25 30
Met Pro Cys Leu Ile Ser Ser Pro Pro Val Leu Ala Ala Arg Leu Ser
35 40 45
Ser Pro Cys Arg Leu Thr Asp Pro Arg Arg Pro Ser Leu Thr Val Ala
50 55 60
Ala Ala Thr Thr Leu Met Ser Asn Ser Ala Gln Pro Lys Ser Gly Val
65 70 75 80
Leu Ile Val Gly Asp Phe Met Thr Lys Lys Glu Glu Leu His Val Val
85 90 95
Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Lys Ser Leu Val Glu Asn
100 105 110
Arg Ile Thr Gly Phe Pro Val Ile Asp Glu Asn Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr
130 135 140
Gly Arg Ala Asp Thr Asp Met Phe Pro Glu Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asp Gly Lys Val
165 170 175
Val Gly Asp Leu Met Thr Ser Ala Pro Leu Val Val Arg Glu Thr Thr
180 185 190
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
195 200 205
Leu Pro Val Val Asp Asp Glu Gly Lys Leu Val Gly Ile Ile Thr Arg
210 215 220
Gly Asn Val Val Arg Ala Ala Leu Lys Ile Lys Lys Glu Asn Glu Met
225 230 235 240
Lys
<210> 109
<211> 708
<212> DNA
<213> Lactuca virosa
<400> 109
atggcttcta tccctccgct tctagaccca ttatctctct ctcaattccg ttcctccacc 60
ctcttccacc atcatccgct ttctctaatc tcaccccctc catcatttat ctatactctc 120
ccatcttctc gcctccttcc agtttctcgc agacccactt tcaccgtcgc cggagcagct 180
accttgaccg gtaattccgt accgccaaga aatggagtct taattgtggg tgatttcatg 240
actacaaaag aagagttaca tgtcgttaag cccacaacaa cagtagacga agctctagaa 300
gctcttgtag aacacagaat aacaggattt cctgtaatcg atgataactg gaaattggtt 360
ggattggttt cagattatga cttattagca ctggactctg tatcaggccc tgcccgacct 420
gatacgggca tgttcccgga agttgatagc acctggaaga catttaatga agtacaaaat 480
ttgctaagta aaactgatgg gaagttggtt ggtgatttaa tgacacctgc gccattagta 540
gttcgtgaaa atactaatct tgaagatgct gcaagattgt tacttgaaac caaatatcgc 600
cgccttccag ttgtagatgg ggagggaaag ctggtgggga ttattacaag aggaaatgtt 660
gtaagagctg ccttacaaat aaaaaaggcg agtgaaatga aaacataa 708
<210> 110
<211> 235
<212> PRT
<213> Lactuca virosa
<400> 110
Met Ala Ser Ile Pro Pro Leu Leu Asp Pro Leu Ser Leu Ser Gln Phe
1 5 10 15
Arg Ser Ser Thr Leu Phe His His His Pro Leu Ser Leu Ile Ser Pro
20 25 30
Pro Pro Ser Phe Ile Tyr Thr Leu Pro Ser Ser Arg Leu Leu Pro Val
35 40 45
Ser Arg Arg Pro Thr Phe Thr Val Ala Gly Ala Ala Thr Leu Thr Gly
50 55 60
Asn Ser Val Pro Pro Arg Asn Gly Val Leu Ile Val Gly Asp Phe Met
65 70 75 80
Thr Thr Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Thr Val Asp
85 90 95
Glu Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Val Ser Gly Pro Ala Arg Pro Asp Thr Gly Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Val Gln Asn
145 150 155 160
Leu Leu Ser Lys Thr Asp Gly Lys Leu Val Gly Asp Leu Met Thr Pro
165 170 175
Ala Pro Leu Val Val Arg Glu Asn Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Glu
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Gln Ile Lys Lys Ala Ser Glu Met Lys Thr
225 230 235
<210> 111
<211> 726
<212> DNA
<213> Lactuca virosa
<220>
<221> misc_feature
<222> (698)..(698)
<223> n is a, c, g, or t
<400> 111
atggcttcaa ttcctccact tatcgatcct ctaccttctt ccctactccg ttctacaacc 60
gcctccgttc ccaccaccgc cttcttccac cgtcagatgc cgtgtataat ctcatctcct 120
ccagtgctcg ccgctaggct ttcttctcct tgccgcctta cagatcctcg cagatcatcg 180
ctaaccgtcg ctgcagctac cactttgatg tccaattccg tgcagccgaa aagtggagtt 240
ttaattgtag gtgattttat gaccaaaaaa gaggaattac acgtggtaaa acccacaaca 300
actgtagatg aagcacttaa atctctcgtg gagaacagaa taacgggctt ccctgtaatc 360
gatgacaact ggaaattagt tggggttgta tcagattatg acttattagc attggattct 420
atatctggga ctgggagagc tgacactgac atgttccctg aggtcgatag cacttggaaa 480
acattcaatg aggtacaaaa actactgagt aaaaccgacg gaaaagtcgt tggtgatttg 540
atgacgtcag cgccattagt agttcgtgaa accaccaatc tcgaggatgc cgcaagattg 600
ttgctcgaaa ctaaatatcg acgcctacct gtcgtagatg atgagggaaa gttggtgggg 660
attattacga gagggaatgt ggtaagagca gccctcanaa taaaaaaaga aaacgaaatg 720
aaatga 726
<210> 112
<211> 241
<212> PRT
<213> Lactuca virosa
<220>
<221> misc_feature
<222> (233)..(233)
<223> Xaa can be any naturally occurring amino acid
<400> 112
Met Ala Ser Ile Pro Pro Leu Ile Asp Pro Leu Pro Ser Ser Leu Leu
1 5 10 15
Arg Ser Thr Thr Ala Ser Val Pro Thr Thr Ala Phe Phe His Arg Gln
20 25 30
Met Pro Cys Ile Ile Ser Ser Pro Pro Val Leu Ala Ala Arg Leu Ser
35 40 45
Ser Pro Cys Arg Leu Thr Asp Pro Arg Arg Ser Ser Leu Thr Val Ala
50 55 60
Ala Ala Thr Thr Leu Met Ser Asn Ser Val Gln Pro Lys Ser Gly Val
65 70 75 80
Leu Ile Val Gly Asp Phe Met Thr Lys Lys Glu Glu Leu His Val Val
85 90 95
Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Lys Ser Leu Val Glu Asn
100 105 110
Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr
130 135 140
Gly Arg Ala Asp Thr Asp Met Phe Pro Glu Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asp Gly Lys Val
165 170 175
Val Gly Asp Leu Met Thr Ser Ala Pro Leu Val Val Arg Glu Thr Thr
180 185 190
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
195 200 205
Leu Pro Val Val Asp Asp Glu Gly Lys Leu Val Gly Ile Ile Thr Arg
210 215 220
Gly Asn Val Val Arg Ala Ala Leu Xaa Ile Lys Lys Glu Asn Glu Met
225 230 235 240
Lys
<210> 113
<211> 783
<212> DNA
<213> Marchantia polymorpha
<400> 113
atggcagcgg agtgtgcctg tttgggtgtg gcccgggcgc agttagctgg ccctgcgatt 60
gcggtcgccg ggaagggaat tagtttgagt gttggttctt gctcggtttc atgccttcct 120
ctgaggaccg cttattccct tcagcaagtc gatagcagac ggagcgcaga tgttgtggct 180
agggcaggtt ttggagcgag gagtggggcg tcctcgcggt cttccgttag ctttgttccc 240
agggccaccg tcgctgacag tccccagtcc aagagagcgc aagacttgta cacagtcggc 300
gacttcatga cccgcttgga cgagttatat gttgcgaagc caagtacgag tgtcgatgaa 360
gctctagaag ttcttgtgga aaagcgaatt acagggttgc ccgtcgtgga tgaccacgga 420
aggttggtcg gagttgtttc ggattacgac ttgctggccc tggattccat ctccgggaag 480
cgaagcgaag agggtggatt cttccccgcc gcaaacagca cgtggaaggc tttcaaggag 540
attcaggtgc ttctgaacaa gacacatggt aagactgtcg gtgagctaat gagtccttct 600
cctctcgtag tgagggagct gacgaatatc gaggatgcgg ccaggttgct gctcgagacc 660
aaattcagac ggttgccagt cgtcgatgat gcaggcaagt tagtcggact tctcacgaga 720
ggtaatgtgg tgagggctgc tctggtcatc aagcgggctc aagaacagaa gacggcagaa 780
tag 783
<210> 114
<211> 260
<212> PRT
<213> Marchantia polymorpha
<400> 114
Met Ala Ala Glu Cys Ala Cys Leu Gly Val Ala Arg Ala Gln Leu Ala
1 5 10 15
Gly Pro Ala Ile Ala Val Ala Gly Lys Gly Ile Ser Leu Ser Val Gly
20 25 30
Ser Cys Ser Val Ser Cys Leu Pro Leu Arg Thr Ala Tyr Ser Leu Gln
35 40 45
Gln Val Asp Ser Arg Arg Ser Ala Asp Val Val Ala Arg Ala Gly Phe
50 55 60
Gly Ala Arg Ser Gly Ala Ser Ser Arg Ser Ser Val Ser Phe Val Pro
65 70 75 80
Arg Ala Thr Val Ala Asp Ser Pro Gln Ser Lys Arg Ala Gln Asp Leu
85 90 95
Tyr Thr Val Gly Asp Phe Met Thr Arg Leu Asp Glu Leu Tyr Val Ala
100 105 110
Lys Pro Ser Thr Ser Val Asp Glu Ala Leu Glu Val Leu Val Glu Lys
115 120 125
Arg Ile Thr Gly Leu Pro Val Val Asp Asp His Gly Arg Leu Val Gly
130 135 140
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Lys
145 150 155 160
Arg Ser Glu Glu Gly Gly Phe Phe Pro Ala Ala Asn Ser Thr Trp Lys
165 170 175
Ala Phe Lys Glu Ile Gln Val Leu Leu Asn Lys Thr His Gly Lys Thr
180 185 190
Val Gly Glu Leu Met Ser Pro Ser Pro Leu Val Val Arg Glu Leu Thr
195 200 205
Asn Ile Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg
210 215 220
Leu Pro Val Val Asp Asp Ala Gly Lys Leu Val Gly Leu Leu Thr Arg
225 230 235 240
Gly Asn Val Val Arg Ala Ala Leu Val Ile Lys Arg Ala Gln Glu Gln
245 250 255
Lys Thr Ala Glu
260
<210> 115
<211> 666
<212> DNA
<213> Medicago truncatula
<400> 115
atgagttcga ttcatttgat taacactctc ccacttagca ctccacatcg gatcatttta 60
cctcattgcc attctttgct tccttcttcc gtcctaccaa aacgacaccg ttttgcacaa 120
tccgctaggt tcagtgttgt ttcatcccaa accgttaatt cggttccgcg cgcgaatgga 180
acttatacag tttctgattt catgactaaa aagcataatt tgcatgttgt taaaaccact 240
acttccgttg atgaagcttt ggaggctctt gtcaagaaca gaatcagtgg tcttccggtg 300
atcgatgagg aatggaatct ggttggagtt gtttcagatt atgacttgtt agcaattgat 360
acaatatcag gtagcagtga tgcaagctta ttccctgatg tggacagtac ttggaaaaca 420
ttcaatgaga tacaaaagct gcttagtaag accaatggaa aagttgtcgg ggacttgatg 480
actccaagtc cacttgttgt tcatgaatcc actagtctgg aggatgctgc caggctgttg 540
cttgaaacaa aatatcgtcg actacctgtg gtagacaaag atggaaagct ggttggactt 600
attacaaggg ggaatattgt taaggcggct ctactgtcaa agcgctctgg tgagaggctc 660
acatag 666
<210> 116
<211> 221
<212> PRT
<213> Medicago truncatula
<400> 116
Met Ser Ser Ile His Leu Ile Asn Thr Leu Pro Leu Ser Thr Pro His
1 5 10 15
Arg Ile Ile Leu Pro His Cys His Ser Leu Leu Pro Ser Ser Val Leu
20 25 30
Pro Lys Arg His Arg Phe Ala Gln Ser Ala Arg Phe Ser Val Val Ser
35 40 45
Ser Gln Thr Val Asn Ser Val Pro Arg Ala Asn Gly Thr Tyr Thr Val
50 55 60
Ser Asp Phe Met Thr Lys Lys His Asn Leu His Val Val Lys Thr Thr
65 70 75 80
Thr Ser Val Asp Glu Ala Leu Glu Ala Leu Val Lys Asn Arg Ile Ser
85 90 95
Gly Leu Pro Val Ile Asp Glu Glu Trp Asn Leu Val Gly Val Val Ser
100 105 110
Asp Tyr Asp Leu Leu Ala Ile Asp Thr Ile Ser Gly Ser Ser Asp Ala
115 120 125
Ser Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Ile
130 135 140
Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Val Gly Asp Leu Met
145 150 155 160
Thr Pro Ser Pro Leu Val Val His Glu Ser Thr Ser Leu Glu Asp Ala
165 170 175
Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp
180 185 190
Lys Asp Gly Lys Leu Val Gly Leu Ile Thr Arg Gly Asn Ile Val Lys
195 200 205
Ala Ala Leu Leu Ser Lys Arg Ser Gly Glu Arg Leu Thr
210 215 220
<210> 117
<211> 675
<212> DNA
<213> Medicago truncatula
<400> 117
atggactcgc tcactcttcc tttccctaca ctctcctccg ccactccccg tcctattttc 60
aatccacgcg ccgctgtcgc tttccgatgc ttccacacct ccgctcattt ttcaaagctt 120
cgtggctcgc cgctttttgc tgctaacacc ctcaccgcta attccgttcc gccaaaaaat 180
ggagtctaca ctgtcggtga ctttatgaca aagaaagatg agttacatac agtgaagccc 240
acaacaaccg tggatgaagc tttggattct cttgttgagc acagaataac tggttttccc 300
gtgattgatg ataactggaa gctagttggt gttgtttcag attatgactt gttagctctg 360
gactctattt caggtcaagg gcaaacagac aacagcttgt ttccagacgt tgacagtact 420
tggaaaactt tcaatgaagt tcagagattg ctgagtaaga ccaatgggaa ggtgatcggt 480
gaattaatga ctactgcccc tatggttgtt cgcgagacca ccaatcttga ggatgctgct 540
agattgttgc tagaaacaaa atttcgacgt cttcctgttg ttgatgctga gggtagattg 600
gttgggatta tcacaagagg aaatgttgta agagctgcgc ttcaaatgaa acgagacagc 660
caaaagaaag catga 675
<210> 118
<211> 224
<212> PRT
<213> Medicago truncatula
<400> 118
Met Asp Ser Leu Thr Leu Pro Phe Pro Thr Leu Ser Ser Ala Thr Pro
1 5 10 15
Arg Pro Ile Phe Asn Pro Arg Ala Ala Val Ala Phe Arg Cys Phe His
20 25 30
Thr Ser Ala His Phe Ser Lys Leu Arg Gly Ser Pro Leu Phe Ala Ala
35 40 45
Asn Thr Leu Thr Ala Asn Ser Val Pro Pro Lys Asn Gly Val Tyr Thr
50 55 60
Val Gly Asp Phe Met Thr Lys Lys Asp Glu Leu His Thr Val Lys Pro
65 70 75 80
Thr Thr Thr Val Asp Glu Ala Leu Asp Ser Leu Val Glu His Arg Ile
85 90 95
Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu Val Gly Val Val
100 105 110
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Gln Gly Gln
115 120 125
Thr Asp Asn Ser Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe
130 135 140
Asn Glu Val Gln Arg Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Gly
145 150 155 160
Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu Thr Thr Asn Leu
165 170 175
Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro
180 185 190
Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile Thr Arg Gly Asn
195 200 205
Val Val Arg Ala Ala Leu Gln Met Lys Arg Asp Ser Gln Lys Lys Ala
210 215 220
<210> 119
<211> 675
<212> DNA
<213> Medicago truncatula
<400> 119
atggactcgc tcactcttcc tttccctaca ctctcctccg ccactccccg tcctattttc 60
aatccacgcg ccgctgtcgc tttccgatgc ttccacacct ccgctcattt ttcaaagctt 120
cgtggctcgc cgctttttgc tgctaacacc ctcaccgcta attccgttcc gccaaaaaat 180
ggagtctaca ctgtcggtga ctttatgaca aagaaagatg agttacatac agtgaagccc 240
acaacaaccg tggatgaagc tttggattct cttgttgagc acagaataac tggttttccc 300
gtgattgatg ataactggaa gctagttggt gttgtttcag attatgactt gttagctctg 360
gactctattt caggtcaagg gcaaacagac aacagcttgt ttccagacgt tgacagtact 420
tggaaaacct tcaatgaagt tcagagattg cagagtaaga ccaatgggaa ggtgatcggt 480
gaattaatga ctactgcccc tatggttgtt cgcgagacca ccaatcttga ggatgctgct 540
agattgttgc tagaaacaaa atttcgacgt cttcctgttg ttgatgctga gggtagattg 600
gttgggatta tcacaagagg aaatgttgta agagctgcgc ttcaaatgaa acgagacagc 660
caaaagaaag catga 675
<210> 120
<211> 224
<212> PRT
<213> Medicago truncatula
<400> 120
Met Asp Ser Leu Thr Leu Pro Phe Pro Thr Leu Ser Ser Ala Thr Pro
1 5 10 15
Arg Pro Ile Phe Asn Pro Arg Ala Ala Val Ala Phe Arg Cys Phe His
20 25 30
Thr Ser Ala His Phe Ser Lys Leu Arg Gly Ser Pro Leu Phe Ala Ala
35 40 45
Asn Thr Leu Thr Ala Asn Ser Val Pro Pro Lys Asn Gly Val Tyr Thr
50 55 60
Val Gly Asp Phe Met Thr Lys Lys Asp Glu Leu His Thr Val Lys Pro
65 70 75 80
Thr Thr Thr Val Asp Glu Ala Leu Asp Ser Leu Val Glu His Arg Ile
85 90 95
Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu Val Gly Val Val
100 105 110
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Gln Gly Gln
115 120 125
Thr Asp Asn Ser Leu Phe Pro Asp Val Asp Ser Thr Trp Lys Thr Phe
130 135 140
Asn Glu Val Gln Arg Leu Gln Ser Lys Thr Asn Gly Lys Val Ile Gly
145 150 155 160
Glu Leu Met Thr Thr Ala Pro Met Val Val Arg Glu Thr Thr Asn Leu
165 170 175
Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu Pro
180 185 190
Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile Thr Arg Gly Asn
195 200 205
Val Val Arg Ala Ala Leu Gln Met Lys Arg Asp Ser Gln Lys Lys Ala
210 215 220
<210> 121
<211> 705
<212> DNA
<213> Nicotiana tabacum
<400> 121
atggcatcta tatcaccgtc gggactctcc ctcagcagct cctccgccgc tctccaccac 60
cagcttcctt gcctgctctt cttatctccg ccgtgcctaa agtttgctac tttcggtaaa 120
tgtttcctct ccgtccgccg caagcagttt tccgttaccg ccagcagcaa cactttgacg 180
gccaattctg cacagccaac aaatggtgta tatacagtag gtgatttcat gacgagaaaa 240
gataagctac atgtggtaaa gccatcaaca tctgtagatg aagccttgga attgttggta 300
gaacgccgaa tcactggttt ccctgtggtt gatgatgact ggaaattggt tggtcttgtt 360
tctgattatg atctattggc tctggactct atatcaggta ccggaggagc tgatgcaaat 420
atgttcccgg aagtgggcag caactggaaa acattcaacg aggttcaaaa gttgattagt 480
aagaccaagg ggaaagtggt tggtgatttg atgacacctg ctcccctagt agttcgggaa 540
tctaccaacc ttgaggatgc agcaagactt ctactcaaaa caaaataccg acggcttcct 600
gttgttgata gtgaaggtaa actggtggga ataataacaa ggggaaacgt tgtgagagct 660
gcccttcata taaaacgggt cattgaaatg gaaggccagc agtga 705
<210> 122
<211> 234
<212> PRT
<213> Nicotiana tabacum
<400> 122
Met Ala Ser Ile Ser Pro Ser Gly Leu Ser Leu Ser Ser Ser Ser Ala
1 5 10 15
Ala Leu His His Gln Leu Pro Cys Leu Leu Phe Leu Ser Pro Pro Cys
20 25 30
Leu Lys Phe Ala Thr Phe Gly Lys Cys Phe Leu Ser Val Arg Arg Lys
35 40 45
Gln Phe Ser Val Thr Ala Ser Ser Asn Thr Leu Thr Ala Asn Ser Ala
50 55 60
Gln Pro Thr Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr Arg Lys
65 70 75 80
Asp Lys Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu Ala Leu
85 90 95
Glu Leu Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val Asp Asp
100 105 110
Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu
115 120 125
Asp Ser Ile Ser Gly Thr Gly Gly Ala Asp Ala Asn Met Phe Pro Glu
130 135 140
Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Ile Ser
145 150 155 160
Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala Pro Leu
165 170 175
Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu
180 185 190
Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Glu Gly Lys Leu
195 200 205
Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu His Ile
210 215 220
Lys Arg Val Ile Glu Met Glu Gly Gln Gln
225 230
<210> 123
<211> 723
<212> DNA
<213> Nicotiana tabacum
<400> 123
atggagtcca ttctcaaatt tagctcaatt tctccgactt ttgtcctcaa ttctcctttt 60
ttgccgtata tgctctcttc ttccacccgt ccccatacag gagatccatc cgttgctaaa 120
tttcgtcgat gtttacctca agcgaaactt tctccatctc tccggccggc gtctctttct 180
tcttccgctg ctaatgctgc tgctacttcg aattctcagc ctccaagaga tggacattac 240
acagttggtg actttatgac tgggaaagaa gatttacatg tagtaaaacc tacaactaaa 300
gttggtgaag cccttgagat gcttgtggaa aagagagtta ctgggcttcc tgtaattgac 360
gatgactgga atttggttgg cgttgtttct gattatgacc tactggcact tgactctata 420
tcaggaactg gccaagctga tacaaatctg tttcctgatg ttgacagtac ttggacgacg 480
tttaatgagg ttcagaagct actgagcaaa actaatggaa aagttgttgg cgatgtcatg 540
acaccaactc cattgtctgt ccgtgaaaac accaaccttg aagatgctgc gaggttgttg 600
ctccaaacga agtaccggcg gctgcctgtt gttgatgttg atggcaaact ggttgggatt 660
atcacaaggg gcaatgttgt tagagctgct ctacaaataa aacgtactgt tgatacacaa 720
tga 723
<210> 124
<211> 240
<212> PRT
<213> Nicotiana tabacum
<400> 124
Met Glu Ser Ile Leu Lys Phe Ser Ser Ile Ser Pro Thr Phe Val Leu
1 5 10 15
Asn Ser Pro Phe Leu Pro Tyr Met Leu Ser Ser Ser Thr Arg Pro His
20 25 30
Thr Gly Asp Pro Ser Val Ala Lys Phe Arg Arg Cys Leu Pro Gln Ala
35 40 45
Lys Leu Ser Pro Ser Leu Arg Pro Ala Ser Leu Ser Ser Ser Ala Ala
50 55 60
Asn Ala Ala Ala Thr Ser Asn Ser Gln Pro Pro Arg Asp Gly His Tyr
65 70 75 80
Thr Val Gly Asp Phe Met Thr Gly Lys Glu Asp Leu His Val Val Lys
85 90 95
Pro Thr Thr Lys Val Gly Glu Ala Leu Glu Met Leu Val Glu Lys Arg
100 105 110
Val Thr Gly Leu Pro Val Ile Asp Asp Asp Trp Asn Leu Val Gly Val
115 120 125
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Thr Gly
130 135 140
Gln Ala Asp Thr Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Thr Thr
145 150 155 160
Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Val
165 170 175
Gly Asp Val Met Thr Pro Thr Pro Leu Ser Val Arg Glu Asn Thr Asn
180 185 190
Leu Glu Asp Ala Ala Arg Leu Leu Leu Gln Thr Lys Tyr Arg Arg Leu
195 200 205
Pro Val Val Asp Val Asp Gly Lys Leu Val Gly Ile Ile Thr Arg Gly
210 215 220
Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Thr Val Asp Thr Gln
225 230 235 240
<210> 125
<211> 705
<212> DNA
<213> Nicotiana tabacum
<400> 125
atggcgtctg tatcgccgtc tggactctgt ctccaccgcg catccgccgc attccaccac 60
cagctgcctt gcctgctctt atctctgcct agccacaaac ttgctgcttc ctctaaatgt 120
ttcctgccgg tacgcctttc ggactctcgc gagacctttt gccttgctgc agccaacact 180
ttgacgacca attctgtccc gcccagaaat ggtgtctata cagtaggtga tttcatgact 240
agaaaagagg agttacatgt ggtaaagccc acaacatcag tagatgaagc cttggaagct 300
ctagtggaac acagaatcgc tggtttccct gtaattgatg ataactggaa attggttggt 360
cttgtttctg actatgatct attggcgctc gactctatat caggtacagg aacagctgat 420
gcagacatgt ttcctgaagt agacagcaat tggaaaacat tcaatgagat tcaaaagttg 480
ctaggtaaga ccaaagggaa agtggttggt gatctgatgt cacttgctcc attagtagtt 540
cgtgaatcta ccaatcttga ggatgcagca agacttttac tgaaaacgaa atatcgtcgg 600
cttcctgtgg tagatggtga tggtaagctg gtgggaataa taacaagggg aaatgtagta 660
agagcggccc ttcaagtaaa gcgggccaac gaaatggaag gctga 705
<210> 126
<211> 234
<212> PRT
<213> Nicotiana tabacum
<400> 126
Met Ala Ser Val Ser Pro Ser Gly Leu Cys Leu His Arg Ala Ser Ala
1 5 10 15
Ala Phe His His Gln Leu Pro Cys Leu Leu Leu Ser Leu Pro Ser His
20 25 30
Lys Leu Ala Ala Ser Ser Lys Cys Phe Leu Pro Val Arg Leu Ser Asp
35 40 45
Ser Arg Glu Thr Phe Cys Leu Ala Ala Ala Asn Thr Leu Thr Thr Asn
50 55 60
Ser Val Pro Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ala Leu Val Glu His Arg Ile Ala Gly Phe Pro Val Ile
100 105 110
Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Ile Ser Gly Thr Gly Thr Ala Asp Ala Asp Met Phe
130 135 140
Pro Glu Val Asp Ser Asn Trp Lys Thr Phe Asn Glu Ile Gln Lys Leu
145 150 155 160
Leu Gly Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Ser Leu Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Asp Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Gln Val Lys Arg Ala Asn Glu Met Glu Gly
225 230
<210> 127
<211> 555
<212> DNA
<213> Nicotiana langsdorffii x sanderae
<400> 127
atggcatcta tatcaccgtc gggactctcc ctcagcagct cctccgccgc tctccaccac 60
cagcttcctt gcctgctctt cttatctcct ccgtgcctaa agtttgctac tttcggtaaa 120
tgtttcctct ccgtccatcg gaagcagttt tccgttaccg ccagcagcaa cactttgacg 180
gccaattctg cacagccaac aaatggtgta tatacagtag gtgatttcat gacgagaaaa 240
gataagctac atgtggtaaa gccatcaaca tctgtagatg aagccttgga attgttggta 300
gaacgccgaa tcaccggttt ccctgtggtt gatgatgact ggaaattggt tggtcttgtt 360
tctgattatg atctattggc tctggactct atatcaggta caggaggagc tgatgcaaac 420
atgttcccgg aagtgggcag caactggaaa acattcaatg aggttcaaaa gctgattagt 480
aagaccaagg ggaaagtggt tgggggattt gatgacacct gctccattag ttgttcggga 540
gtctaccaat cttga 555
<210> 128
<211> 184
<212> PRT
<213> Nicotiana langsdorffii x sanderae
<400> 128
Met Ala Ser Ile Ser Pro Ser Gly Leu Ser Leu Ser Ser Ser Ser Ala
1 5 10 15
Ala Leu His His Gln Leu Pro Cys Leu Leu Phe Leu Ser Pro Pro Cys
20 25 30
Leu Lys Phe Ala Thr Phe Gly Lys Cys Phe Leu Ser Val His Arg Lys
35 40 45
Gln Phe Ser Val Thr Ala Ser Ser Asn Thr Leu Thr Ala Asn Ser Ala
50 55 60
Gln Pro Thr Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr Arg Lys
65 70 75 80
Asp Lys Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu Ala Leu
85 90 95
Glu Leu Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val Asp Asp
100 105 110
Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu
115 120 125
Asp Ser Ile Ser Gly Thr Gly Gly Ala Asp Ala Asn Met Phe Pro Glu
130 135 140
Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Ile Ser
145 150 155 160
Lys Thr Lys Gly Lys Val Val Gly Gly Phe Asp Asp Thr Cys Ser Ile
165 170 175
Ser Cys Ser Gly Val Tyr Gln Ser
180
<210> 129
<211> 708
<212> DNA
<213> Oryza sativa
<400> 129
atgggcgcca cgctgctgct cctgtgcgcc gacttctcgg ctgttgccgg cggccgccgg 60
cggccttccc tgccctcgga gccacggttg gcggctcccg ctgctgggtc ccgtgcgccg 120
ccgtcgagag cctccgtccg cccgtccgct gccgccgccc cgctcgccgc gcgcggcctg 180
ccgcaccacg cctccgtcgc tgggcaaaac agtggaattt acactgttgg tgattttatg 240
actaaaaggg aagaactcca tgttgtgaag tcaacaactt cagtcgatga agcccttgag 300
atgctggtgg agcataggat aactggcttt cctgttattg atgacgagtg gaatttggtt 360
ggcgttgtgt cagattatga tctcttagca ctcgattcaa tatcaggaaa tggacttgcg 420
gaagtagaca tatttcctga ggtggatagt acttggaaga cgttcaatga gatacagaag 480
ctcttgagca aaaccaatgg gaaagtcatt ggtgatgtta tgacgtctgc acctcttgtg 540
gtgcgtgaaa ctactaacct tgaagatgct gcaaggttac tccttgaaac taagtaccgc 600
aggttacctg tagttgacag ttcaggcaaa ttggttggga tcataacaag agggaacgtc 660
gtcagggctg cccttaaaat taagaaaaag tttgaaggtg aactttga 708
<210> 130
<211> 235
<212> PRT
<213> Oryza sativa
<400> 130
Met Gly Ala Thr Leu Leu Leu Leu Cys Ala Asp Phe Ser Ala Val Ala
1 5 10 15
Gly Gly Arg Arg Arg Pro Ser Leu Pro Ser Glu Pro Arg Leu Ala Ala
20 25 30
Pro Ala Ala Gly Ser Arg Ala Pro Pro Ser Arg Ala Ser Val Arg Pro
35 40 45
Ser Ala Ala Ala Ala Pro Leu Ala Ala Arg Gly Leu Pro His His Ala
50 55 60
Ser Val Ala Gly Gln Asn Ser Gly Ile Tyr Thr Val Gly Asp Phe Met
65 70 75 80
Thr Lys Arg Glu Glu Leu His Val Val Lys Ser Thr Thr Ser Val Asp
85 90 95
Glu Ala Leu Glu Met Leu Val Glu His Arg Ile Thr Gly Phe Pro Val
100 105 110
Ile Asp Asp Glu Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu
115 120 125
Leu Ala Leu Asp Ser Ile Ser Gly Asn Gly Leu Ala Glu Val Asp Ile
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Ile Gln Lys
145 150 155 160
Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Gly Asp Val Met Thr Ser
165 170 175
Ala Pro Leu Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Ser
195 200 205
Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Lys Ile Lys Lys Lys Phe Glu Gly Glu Leu
225 230 235
<210> 131
<211> 684
<212> DNA
<213> Oryza sativa
<400> 131
atggacgcca cgctgctccg ctccgccgat gccgccgtcg ccgtccgctc caccaccact 60
gcgcctccgc ctcgccctcg cctccaccgc cccagtaccc tccccctccc gtcctcctgc 120
gcctgcgggc ccctccgcgc ctacgccgct cccgctgccc ccgcgcccgc cgcgcacaac 180
aacggagtct acacagttgg tgacttcatg accaaaaggc ctaatctcca tgtcgttaca 240
cctgcaacct cggttgatga agctctcgag acgctggtgc aacacaagat ctctggtttc 300
cctgttgttg atgacaccgg aaagttggtg ggtgttgtct cagattatga tctgttagca 360
cttgactcaa tatcaggaag tggactgact ggcacaaaca caagcatgtt tcctgaggtg 420
gatagtactt ggaagacatt tcgcgagata cagagactct tgagcaaaac caatggcaaa 480
gtcatcgctg atgtgatgac ttattcgcct cttgcggttc gtgaaagtac caaccttgat 540
gctgctacaa ggttgctact tgaaaccaaa tatcgcagat tgcctgttgt tgatagcact 600
ggtaaattgg ttgggatgat cacaaggggg actgttgtca gagctgccct caaaataaag 660
aagacagctg aagaaactgc ttaa 684
<210> 132
<211> 227
<212> PRT
<213> Oryza sativa
<400> 132
Met Asp Ala Thr Leu Leu Arg Ser Ala Asp Ala Ala Val Ala Val Arg
1 5 10 15
Ser Thr Thr Thr Ala Pro Pro Pro Arg Pro Arg Leu His Arg Pro Ser
20 25 30
Thr Leu Pro Leu Pro Ser Ser Cys Ala Cys Gly Pro Leu Arg Ala Tyr
35 40 45
Ala Ala Pro Ala Ala Pro Ala Pro Ala Ala His Asn Asn Gly Val Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Lys Arg Pro Asn Leu His Val Val Thr
65 70 75 80
Pro Ala Thr Ser Val Asp Glu Ala Leu Glu Thr Leu Val Gln His Lys
85 90 95
Ile Ser Gly Phe Pro Val Val Asp Asp Thr Gly Lys Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ser Gly
115 120 125
Leu Thr Gly Thr Asn Thr Ser Met Phe Pro Glu Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe Arg Glu Ile Gln Arg Leu Leu Ser Lys Thr Asn Gly Lys
145 150 155 160
Val Ile Ala Asp Val Met Thr Tyr Ser Pro Leu Ala Val Arg Glu Ser
165 170 175
Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr Arg
180 185 190
Arg Leu Pro Val Val Asp Ser Thr Gly Lys Leu Val Gly Met Ile Thr
195 200 205
Arg Gly Thr Val Val Arg Ala Ala Leu Lys Ile Lys Lys Thr Ala Glu
210 215 220
Glu Thr Ala
225
<210> 133
<211> 783
<212> DNA
<213> Physcomitrella patens
<400> 133
atggcggctt tgttggtggc ctcgagtacg ggagtggggt tggcagctac tgtgggacga 60
aaggacgcgg gttcttgcac ctcgtcgacc gcgagaccgc agctggtgct tgtgtcgaac 120
cggaagagcg catctaatgt ggcaggcact tcggtggttc ccgtgccggt tcatgtatgg 180
tctaggggat ctagctttcc gttgccgcgg agtacgatga cggaaaaccc tactcctcaa 240
aagcaagaaa catacaccgt gggagattac atgactcctg tttcagaatt gtattgtgca 300
acagtgaaca ctactattga tgaagcattg gaagtgcttg ttgaaaagcg aatcactggc 360
atgcccgtga ttgatgattt tggagcgttg gtgggggttg tctccgatta cgacttgttg 420
gcgctggact caatatcagg acaaagacaa cctgaaacta gcttatttcc agaagctggc 480
aggacatgga aggcttttaa ggagatccag aagctgttga ttaaaactaa tggaaagacc 540
gtaggagatg tgatgacccc atcaccgctt gttgttagcg agcagaccaa ccttgaagat 600
gcagcaaggg ttttgcttga taccaagttt aggcgcttgc cagttgttgg tgatgatgga 660
aaattggtcg gacttctaac cagaggtaat gttgtaagag ctgcacttgt tatgaaaaga 720
gctgctgagg aagagcttgg agggaaagga gccgtggagg acatgttcgg tggtgacacg 780
tga 783
<210> 134
<211> 260
<212> PRT
<213> Physcomitrella patens
<400> 134
Met Ala Ala Leu Leu Val Ala Ser Ser Thr Gly Val Gly Leu Ala Ala
1 5 10 15
Thr Val Gly Arg Lys Asp Ala Gly Ser Cys Thr Ser Ser Thr Ala Arg
20 25 30
Pro Gln Leu Val Leu Val Ser Asn Arg Lys Ser Ala Ser Asn Val Ala
35 40 45
Gly Thr Ser Val Val Pro Val Pro Val His Val Trp Ser Arg Gly Ser
50 55 60
Ser Phe Pro Leu Pro Arg Ser Thr Met Thr Glu Asn Pro Thr Pro Gln
65 70 75 80
Lys Gln Glu Thr Tyr Thr Val Gly Asp Tyr Met Thr Pro Val Ser Glu
85 90 95
Leu Tyr Cys Ala Thr Val Asn Thr Thr Ile Asp Glu Ala Leu Glu Val
100 105 110
Leu Val Glu Lys Arg Ile Thr Gly Met Pro Val Ile Asp Asp Phe Gly
115 120 125
Ala Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser
130 135 140
Ile Ser Gly Gln Arg Gln Pro Glu Thr Ser Leu Phe Pro Glu Ala Gly
145 150 155 160
Arg Thr Trp Lys Ala Phe Lys Glu Ile Gln Lys Leu Leu Ile Lys Thr
165 170 175
Asn Gly Lys Thr Val Gly Asp Val Met Thr Pro Ser Pro Leu Val Val
180 185 190
Ser Glu Gln Thr Asn Leu Glu Asp Ala Ala Arg Val Leu Leu Asp Thr
195 200 205
Lys Phe Arg Arg Leu Pro Val Val Gly Asp Asp Gly Lys Leu Val Gly
210 215 220
Leu Leu Thr Arg Gly Asn Val Val Arg Ala Ala Leu Val Met Lys Arg
225 230 235 240
Ala Ala Glu Glu Glu Leu Gly Gly Lys Gly Ala Val Glu Asp Met Phe
245 250 255
Gly Gly Asp Thr
260
<210> 135
<211> 804
<212> DNA
<213> Physcomitrella patens
<400> 135
atggcggcca tgttggtggc ctcgagcacg gcagtgggag cggcaacttt tgcggtgagg 60
aaagacatag gaacttctac ttcgtcgact gcaagtccgc agctagtatt tgcgtcgaac 120
cgcaaggttg tgtctagcgt ggcgggcacg ctggtggttt ccatgcaggt gcatatgcgg 180
cccaggggaa ctagctttat gcttgcgcgg agtacgatga tggaaaaccc tgctcctcaa 240
aagcaagagc catacacggt gggagattac atgacccctg tttcggattt gtattgtgca 300
acagtgaata ccactattga tgaagcattg gaagtgctgg ttgaaaagcg tatcactggc 360
atgcccgtaa ttgatgatgc tggagcattg gtgggggttg tctccgatta cgacctgttg 420
gcgcttgatt caatatcagg tcaaagacaa ccagaaacta gtttatttcc agaagcaggc 480
aggacctgga aggctttcag ggagatccag aagttgttgg ttaaaaccaa tggaaagatg 540
gttggagatg ttatgactcc atcaccactc gttgttcgtg agcacaccaa ccttgaggat 600
gcagcaaggg ttttgcttga taccaagttc aggcgtttgc ctgttgtcgg tgatgatgga 660
aaattggtaa gtttgtgctt tttgcatgca tgtcaaattc attgccgttt aatgttcttt 720
ttagtaaagt tgaaagtagc actggatcca caaatctgca tgcatacaga atgctcaagt 780
tccaaacttt tgttgaccat ttaa 804
<210> 136
<211> 267
<212> PRT
<213> Physcomitrella patens
<400> 136
Met Ala Ala Met Leu Val Ala Ser Ser Thr Ala Val Gly Ala Ala Thr
1 5 10 15
Phe Ala Val Arg Lys Asp Ile Gly Thr Ser Thr Ser Ser Thr Ala Ser
20 25 30
Pro Gln Leu Val Phe Ala Ser Asn Arg Lys Val Val Ser Ser Val Ala
35 40 45
Gly Thr Leu Val Val Ser Met Gln Val His Met Arg Pro Arg Gly Thr
50 55 60
Ser Phe Met Leu Ala Arg Ser Thr Met Met Glu Asn Pro Ala Pro Gln
65 70 75 80
Lys Gln Glu Pro Tyr Thr Val Gly Asp Tyr Met Thr Pro Val Ser Asp
85 90 95
Leu Tyr Cys Ala Thr Val Asn Thr Thr Ile Asp Glu Ala Leu Glu Val
100 105 110
Leu Val Glu Lys Arg Ile Thr Gly Met Pro Val Ile Asp Asp Ala Gly
115 120 125
Ala Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser
130 135 140
Ile Ser Gly Gln Arg Gln Pro Glu Thr Ser Leu Phe Pro Glu Ala Gly
145 150 155 160
Arg Thr Trp Lys Ala Phe Arg Glu Ile Gln Lys Leu Leu Val Lys Thr
165 170 175
Asn Gly Lys Met Val Gly Asp Val Met Thr Pro Ser Pro Leu Val Val
180 185 190
Arg Glu His Thr Asn Leu Glu Asp Ala Ala Arg Val Leu Leu Asp Thr
195 200 205
Lys Phe Arg Arg Leu Pro Val Val Gly Asp Asp Gly Lys Leu Val Ser
210 215 220
Leu Cys Phe Leu His Ala Cys Gln Ile His Cys Arg Leu Met Phe Phe
225 230 235 240
Leu Val Lys Leu Lys Val Ala Leu Asp Pro Gln Ile Cys Met His Thr
245 250 255
Glu Cys Ser Ser Ser Lys Leu Leu Leu Thr Ile
260 265
<210> 137
<211> 780
<212> DNA
<213> Physcomitrella patens
<400> 137
atggcggcca tgttggtggc ctcgagcacg gcagtgggag cggcaacttt tgcggtgagg 60
aaagacatag gaacttctac ttcgtcgact gcaagtccgc agctagtatt tgcgtcgaac 120
cgcaaggttg tgtctagcgt ggcgggcacg ctggtggttt ccatgcaggt gcatatgcgg 180
cccaggggaa ctagctttat gcttgcgcgg agtacgatga tggaaaaccc tgctcctcaa 240
aagcaagagc catacacggt gggagattac atgacccctg tttcggattt gtattgtgca 300
acagtgaata ccactattga tgaagcattg gaagtgctgg ttgaaaagcg tatcactggc 360
atgcccgtaa ttgatgatgc tggagcattg gtgggggttg tctccgatta cgacctgttg 420
gcgcttgatt caatatcagg tcaaagacaa ccagaaacta gtttatttcc agaagcaggc 480
aggacctgga aggctttcag ggagatccag aagttgttgg ttaaaaccaa tggaaagatg 540
gttggagatg ttatgactcc atcaccactc gttgttcgtg agcacaccaa ccttgaggat 600
gcagcaaggg ttttgcttga taccaagttc aggcgtttgc ctgttgtcgg tgatgatgga 660
aaattggtcg gacttctaac cagaggcaat gttgtaagag ctgcacttat tatgaaacga 720
gctgctgaga aagagcttgg aggaaaagaa gccgtagagg atatgtttgg agacacatga 780
<210> 138
<211> 259
<212> PRT
<213> Physcomitrella patens
<400> 138
Met Ala Ala Met Leu Val Ala Ser Ser Thr Ala Val Gly Ala Ala Thr
1 5 10 15
Phe Ala Val Arg Lys Asp Ile Gly Thr Ser Thr Ser Ser Thr Ala Ser
20 25 30
Pro Gln Leu Val Phe Ala Ser Asn Arg Lys Val Val Ser Ser Val Ala
35 40 45
Gly Thr Leu Val Val Ser Met Gln Val His Met Arg Pro Arg Gly Thr
50 55 60
Ser Phe Met Leu Ala Arg Ser Thr Met Met Glu Asn Pro Ala Pro Gln
65 70 75 80
Lys Gln Glu Pro Tyr Thr Val Gly Asp Tyr Met Thr Pro Val Ser Asp
85 90 95
Leu Tyr Cys Ala Thr Val Asn Thr Thr Ile Asp Glu Ala Leu Glu Val
100 105 110
Leu Val Glu Lys Arg Ile Thr Gly Met Pro Val Ile Asp Asp Ala Gly
115 120 125
Ala Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser
130 135 140
Ile Ser Gly Gln Arg Gln Pro Glu Thr Ser Leu Phe Pro Glu Ala Gly
145 150 155 160
Arg Thr Trp Lys Ala Phe Arg Glu Ile Gln Lys Leu Leu Val Lys Thr
165 170 175
Asn Gly Lys Met Val Gly Asp Val Met Thr Pro Ser Pro Leu Val Val
180 185 190
Arg Glu His Thr Asn Leu Glu Asp Ala Ala Arg Val Leu Leu Asp Thr
195 200 205
Lys Phe Arg Arg Leu Pro Val Val Gly Asp Asp Gly Lys Leu Val Gly
210 215 220
Leu Leu Thr Arg Gly Asn Val Val Arg Ala Ala Leu Ile Met Lys Arg
225 230 235 240
Ala Ala Glu Lys Glu Leu Gly Gly Lys Glu Ala Val Glu Asp Met Phe
245 250 255
Gly Asp Thr
<210> 139
<211> 777
<212> DNA
<213> Physcomitrella patens
<400> 139
atggcggcca tggtggtggc ctcgagcacg gcgatgggga tgcctgccgt gggtagaagg 60
gagttgggtc cttgctcatc gcccaccgcc aggccgcagc tggtgcagtt gcccagtcgg 120
aagaatgtat ccagcgtggt gggtacgtcg gtggtcttgg gaaaagtgaa tgcgcggtcc 180
agggaaagta gctttccagt cacacggagt gcgttggtag agaatccttt tccgcataaa 240
cacgagtcat atacggtggg tgacttcatg acacctatga cggagttata ttgtgcaaca 300
gaaaacacca caatagatga agcactagag gtccttgtcg ataggcgcat cactgggatg 360
cctgtggtcg acgacactgg agctttggtg ggggttgtct ccgattatga tctattagcg 420
cttgactcaa tatcagggca aagacaacct gaaactagtt tatttccgga ggcaggcagg 480
acgtggaagg catttaaaga gatccagaaa ttgttagtta aaactaatgg aaagacaatt 540
ggagatgtga tgaccccatc acccctcgtt gttcgtaaac aaaccaacct tgaagatgca 600
gcaaaagttt tgctggatac caaatttagg cgcttgcctg ttgttgatca ggatggtaaa 660
ttggtgggtc ttttgacaag aggtaatgtc gttagagctg cactgtatat gaagcgaact 720
gctgaagatg cgcttggagg aaagaaagct gcagaagata tattcaaaga aatataa 777
<210> 140
<211> 258
<212> PRT
<213> Physcomitrella patens
<400> 140
Met Ala Ala Met Val Val Ala Ser Ser Thr Ala Met Gly Met Pro Ala
1 5 10 15
Val Gly Arg Arg Glu Leu Gly Pro Cys Ser Ser Pro Thr Ala Arg Pro
20 25 30
Gln Leu Val Gln Leu Pro Ser Arg Lys Asn Val Ser Ser Val Val Gly
35 40 45
Thr Ser Val Val Leu Gly Lys Val Asn Ala Arg Ser Arg Glu Ser Ser
50 55 60
Phe Pro Val Thr Arg Ser Ala Leu Val Glu Asn Pro Phe Pro His Lys
65 70 75 80
His Glu Ser Tyr Thr Val Gly Asp Phe Met Thr Pro Met Thr Glu Leu
85 90 95
Tyr Cys Ala Thr Glu Asn Thr Thr Ile Asp Glu Ala Leu Glu Val Leu
100 105 110
Val Asp Arg Arg Ile Thr Gly Met Pro Val Val Asp Asp Thr Gly Ala
115 120 125
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
130 135 140
Ser Gly Gln Arg Gln Pro Glu Thr Ser Leu Phe Pro Glu Ala Gly Arg
145 150 155 160
Thr Trp Lys Ala Phe Lys Glu Ile Gln Lys Leu Leu Val Lys Thr Asn
165 170 175
Gly Lys Thr Ile Gly Asp Val Met Thr Pro Ser Pro Leu Val Val Arg
180 185 190
Lys Gln Thr Asn Leu Glu Asp Ala Ala Lys Val Leu Leu Asp Thr Lys
195 200 205
Phe Arg Arg Leu Pro Val Val Asp Gln Asp Gly Lys Leu Val Gly Leu
210 215 220
Leu Thr Arg Gly Asn Val Val Arg Ala Ala Leu Tyr Met Lys Arg Thr
225 230 235 240
Ala Glu Asp Ala Leu Gly Gly Lys Lys Ala Ala Glu Asp Ile Phe Lys
245 250 255
Glu Ile
<210> 141
<211> 534
<212> DNA
<213> Prunus persica
<400> 141
atggggacct tcaccgtcgg cgatttcatg accactaagg agtatttgca cgtcgtcaag 60
ccctccacga ccgtcgacca agcattggat gctcttgtgg agaagagaat taccggcttt 120
cctgtgattg acgatgactg gaaactcgtt ggtgttgttt cagattatga cttgttagcg 180
ttagactcca tatctggaaa cataaaaggt ggtcaaagtg acacaaactt gtttccagat 240
gttgatagtt cttggaaaac attccacgag atacagaaac tgcttagcaa gaccaacggc 300
aaagttgttg gtgacgtgat gacacctgct ccacttgttg ttcgtgaaac caccaaccta 360
gaagatgctg ctaggttgtt gcttgcaaca aaatatcgcc gactgccagt tgtagatagt 420
gaggggaagc tggttgggat cattacgagg ggaaacgttg ttaaagctgc cctacagata 480
aacgtgctgg tgaaaaatga gtttagttca ggggaacatt ggcggagctc atag 534
<210> 142
<211> 177
<212> PRT
<213> Prunus persica
<400> 142
Met Gly Thr Phe Thr Val Gly Asp Phe Met Thr Thr Lys Glu Tyr Leu
1 5 10 15
His Val Val Lys Pro Ser Thr Thr Val Asp Gln Ala Leu Asp Ala Leu
20 25 30
Val Glu Lys Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys
35 40 45
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
50 55 60
Ser Gly Asn Ile Lys Gly Gly Gln Ser Asp Thr Asn Leu Phe Pro Asp
65 70 75 80
Val Asp Ser Ser Trp Lys Thr Phe His Glu Ile Gln Lys Leu Leu Ser
85 90 95
Lys Thr Asn Gly Lys Val Val Gly Asp Val Met Thr Pro Ala Pro Leu
100 105 110
Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu
115 120 125
Ala Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Glu Gly Lys Leu
130 135 140
Val Gly Ile Ile Thr Arg Gly Asn Val Val Lys Ala Ala Leu Gln Ile
145 150 155 160
Asn Val Leu Val Lys Asn Glu Phe Ser Ser Gly Glu His Trp Arg Ser
165 170 175
Ser
<210> 143
<211> 759
<212> DNA
<213> Pinus taeda
<400> 143
atgggggttt attcagttgc agcagaaatg gcttctgttg ctacttattc aactggctat 60
tgctattact gctgctccat tccccctaat tccaattcaa tttccatgac gaggttccca 120
gtgcagttga atagaggaac cgtggctaag ttaagcaaac accaacacca tcttagcagg 180
ggatttacaa agggattcag aggtctccac atcaatacca caagacttca ccttcccaag 240
agcactttaa tggcgaccga cgtgccgcat aagcaagaag tttttacagt aggtgatttc 300
atgaccagga aagagtacct gtttgtggtg aagccaacaa ctatggttga tgaggccttg 360
gaaactctag tggcaaaccg gatcactggc ttaccagtgg ttgatgatga ttggaaacta 420
gttggagttg tttctgatta tgacttgtta gcactggact ctatatcagg tgctgggcga 480
actgaaacag gttttttccc acaagttgga agcacatgga aagctttcaa tgaattacag 540
aaattgctaa acaaaactaa tgggaagatt gttgctgagg tgatgacgcc ttcaccactt 600
gttgttcgtg aatacaccaa ccttgaggat gcagctagat tattgctaga aaccaaatac 660
cggagattgc ctgtagtgga caatagtggg aaactggttg gattacttac aagggggaat 720
gtgattaaag ctgcactgca aatgaaacac gctgcttag 759
<210> 144
<211> 252
<212> PRT
<213> Pinus taeda
<400> 144
Met Gly Val Tyr Ser Val Ala Ala Glu Met Ala Ser Val Ala Thr Tyr
1 5 10 15
Ser Thr Gly Tyr Cys Tyr Tyr Cys Cys Ser Ile Pro Pro Asn Ser Asn
20 25 30
Ser Ile Ser Met Thr Arg Phe Pro Val Gln Leu Asn Arg Gly Thr Val
35 40 45
Ala Lys Leu Ser Lys His Gln His His Leu Ser Arg Gly Phe Thr Lys
50 55 60
Gly Phe Arg Gly Leu His Ile Asn Thr Thr Arg Leu His Leu Pro Lys
65 70 75 80
Ser Thr Leu Met Ala Thr Asp Val Pro His Lys Gln Glu Val Phe Thr
85 90 95
Val Gly Asp Phe Met Thr Arg Lys Glu Tyr Leu Phe Val Val Lys Pro
100 105 110
Thr Thr Met Val Asp Glu Ala Leu Glu Thr Leu Val Ala Asn Arg Ile
115 120 125
Thr Gly Leu Pro Val Val Asp Asp Asp Trp Lys Leu Val Gly Val Val
130 135 140
Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ala Gly Arg
145 150 155 160
Thr Glu Thr Gly Phe Phe Pro Gln Val Gly Ser Thr Trp Lys Ala Phe
165 170 175
Asn Glu Leu Gln Lys Leu Leu Asn Lys Thr Asn Gly Lys Ile Val Ala
180 185 190
Glu Val Met Thr Pro Ser Pro Leu Val Val Arg Glu Tyr Thr Asn Leu
195 200 205
Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro
210 215 220
Val Val Asp Asn Ser Gly Lys Leu Val Gly Leu Leu Thr Arg Gly Asn
225 230 235 240
Val Ile Lys Ala Ala Leu Gln Met Lys His Ala Ala
245 250
<210> 145
<211> 711
<212> DNA
<213> Populus trichocarpa
<400> 145
atggcttctg ttgcgaacac tttactactc tctctgcctc cgccactctg tttcaatacc 60
aataacaacc agtcaccacc accttctctt tttgtttcta aaaccccaag atcgaaatgt 120
tgtcgtcttc gctcctcctc cgtccctcga tcaccatacc gttcttctgt tgcagttgcc 180
ttgtccactg tagcaaactc cgttccggcg agaagtggga tttacacagt tggtgatttt 240
atgaccaaga aggagggttt atatgtcgtt aaagctaaca caaccgttga tgaggcattg 300
gaggctcttg tagagaagag aataactggg tttcccgtca ttgatgatga ctggagattg 360
gttggtgttg tttcggatta tgacctgtta gcgctcgatt ccatttcagg tggctgtcaa 420
aatgacacaa acttgtttcc taatgttgat agttcttgga agacttttaa tgagttacag 480
aaactgttaa tcaagaacaa cggcaaactt gttggtgatt tgatgactcc taatcctcta 540
gttgtttatg aaactaccaa tctagaggat gctgttaggt tgctgcttga aacaaaatat 600
cggcgactcc cagtggtaga tgatgatgga aagctggttg gaatcattac acggggagac 660
attgttagag ctgctctaca gataaaaaat gccactgaaa ggtcagcatg a 711
<210> 146
<211> 236
<212> PRT
<213> Populus trichocarpa
<400> 146
Met Ala Ser Val Ala Asn Thr Leu Leu Leu Ser Leu Pro Pro Pro Leu
1 5 10 15
Cys Phe Asn Thr Asn Asn Asn Gln Ser Pro Pro Pro Ser Leu Phe Val
20 25 30
Ser Lys Thr Pro Arg Ser Lys Cys Cys Arg Leu Arg Ser Ser Ser Val
35 40 45
Pro Arg Ser Pro Tyr Arg Ser Ser Val Ala Val Ala Leu Ser Thr Val
50 55 60
Ala Asn Ser Val Pro Ala Arg Ser Gly Ile Tyr Thr Val Gly Asp Phe
65 70 75 80
Met Thr Lys Lys Glu Gly Leu Tyr Val Val Lys Ala Asn Thr Thr Val
85 90 95
Asp Glu Ala Leu Glu Ala Leu Val Glu Lys Arg Ile Thr Gly Phe Pro
100 105 110
Val Ile Asp Asp Asp Trp Arg Leu Val Gly Val Val Ser Asp Tyr Asp
115 120 125
Leu Leu Ala Leu Asp Ser Ile Ser Gly Gly Cys Gln Asn Asp Thr Asn
130 135 140
Leu Phe Pro Asn Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Leu Gln
145 150 155 160
Lys Leu Leu Ile Lys Asn Asn Gly Lys Leu Val Gly Asp Leu Met Thr
165 170 175
Pro Asn Pro Leu Val Val Tyr Glu Thr Thr Asn Leu Glu Asp Ala Val
180 185 190
Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Asp
195 200 205
Asp Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asp Ile Val Arg Ala
210 215 220
Ala Leu Gln Ile Lys Asn Ala Thr Glu Arg Ser Ala
225 230 235
<210> 147
<211> 738
<212> DNA
<213> Poncirus trifoliata
<400> 147
atggactcga ttgtactccc acactcaatc tccgtcgcgc gcctacgctc ccccgctgcc 60
ggccgtacca gtggtagtac ttcattcgct ctccagctgc catgcctact tctctctcgt 120
cccggttgta gagtgttctc agtgttggcg acctcatccg atcgcgtctc ggcgcttcgc 180
aggtcctcgg ttgtttccgc cagtggcacc ttgacggcca accccgctgc gccgagcagt 240
ggagtttata cggttggtga tttcatgaca acaaaagagg agttgcatgt ggtaaaacct 300
acaacgactg tagatgaagc tctggaaatt cttgtagaga agagaattac tggttttcct 360
gtgattgacg atgactggaa attggttggt cttgtatccg attatgactt gttagcattg 420
gactctatat caggcagcgg acgagctgat aacagcatgt ttcccgaagt tgacagcact 480
tggaaaacat tcaacgaggt gcagaagttg cttagtaaaa ccaatgggaa gatggtgggt 540
gacttaatga cgccagcccc agtcgtagtt cgggaaacga ctaatcttga ggatgctgct 600
agattgttac ttgagacaaa ataccgcaga cttccagtcg tggatgctga tggtaagctg 660
gttggaatta tcacaagagg aaatgtagta agggcggctc ttcaaataaa acgtgagact 720
gaaatgggag cacaatag 738
<210> 148
<211> 245
<212> PRT
<213> Poncirus trifoliata
<400> 148
Met Asp Ser Ile Val Leu Pro His Ser Ile Ser Val Ala Arg Leu Arg
1 5 10 15
Ser Pro Ala Ala Gly Arg Thr Ser Gly Ser Thr Ser Phe Ala Leu Gln
20 25 30
Leu Pro Cys Leu Leu Leu Ser Arg Pro Gly Cys Arg Val Phe Ser Val
35 40 45
Leu Ala Thr Ser Ser Asp Arg Val Ser Ala Leu Arg Arg Ser Ser Val
50 55 60
Val Ser Ala Ser Gly Thr Leu Thr Ala Asn Pro Ala Ala Pro Ser Ser
65 70 75 80
Gly Val Tyr Thr Val Gly Asp Phe Met Thr Thr Lys Glu Glu Leu His
85 90 95
Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Ile Leu Val
100 105 110
Glu Lys Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu
115 120 125
Val Gly Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser
130 135 140
Gly Ser Gly Arg Ala Asp Asn Ser Met Phe Pro Glu Val Asp Ser Thr
145 150 155 160
Trp Lys Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly
165 170 175
Lys Met Val Gly Asp Leu Met Thr Pro Ala Pro Val Val Val Arg Glu
180 185 190
Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr
195 200 205
Arg Arg Leu Pro Val Val Asp Ala Asp Gly Lys Leu Val Gly Ile Ile
210 215 220
Thr Arg Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Glu Thr
225 230 235 240
Glu Met Gly Ala Gln
245
<210> 149
<211> 690
<212> DNA
<213> Phaseolus vulgaris
<400> 149
atggactcgg ttctcttcca cttccatctc cacactctcc ctccgttttc ctccgccact 60
cactctcctc tgtaccagcc acgcgccgcc gctgccgccg cctctttccc ccgctcttcc 120
cctctccgga gcctccgtcc accgccgctt ctcgccgcca acaccctcac cgctaattca 180
gtctcgccga gaagtggact gtacactgtt ggtgacttta tgacaaggaa agaggattta 240
catgtggtaa aacccacaac tactgtggac gaagctttgg atattcttgt tgaaaaaagg 300
ataactggtt ttcctgtgat agatgataac tggaaactgg ttggtgttgt ttcagattat 360
gacttgttag cactggactc tatatctggt catgggctaa aggataatag catgtttcca 420
gaagttgaca gtacttggaa aacttttaac gagattcaaa agctgctcag taagaccaac 480
ggaaaattga ttggtgaatt gatgaccact gcccctatgg tcgttcgtga gaccaccaat 540
ctcgaggatg ctgcaaggtt gttgctagaa accaaatttc gacgccttcc agttgtagat 600
gctgagggta gactggttgg gattatcaca agaggaaatg ttgtaagagc cgcactgcta 660
gtgaaacgag aaaatcaaaa gaaagcatga 690
<210> 150
<211> 229
<212> PRT
<213> Phaseolus vulgaris
<400> 150
Met Asp Ser Val Leu Phe His Phe His Leu His Thr Leu Pro Pro Phe
1 5 10 15
Ser Ser Ala Thr His Ser Pro Leu Tyr Gln Pro Arg Ala Ala Ala Ala
20 25 30
Ala Ala Ser Phe Pro Arg Ser Ser Pro Leu Arg Ser Leu Arg Pro Pro
35 40 45
Pro Leu Leu Ala Ala Asn Thr Leu Thr Ala Asn Ser Val Ser Pro Arg
50 55 60
Ser Gly Leu Tyr Thr Val Gly Asp Phe Met Thr Arg Lys Glu Asp Leu
65 70 75 80
His Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Asp Ile Leu
85 90 95
Val Glu Lys Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys
100 105 110
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
115 120 125
Ser Gly His Gly Leu Lys Asp Asn Ser Met Phe Pro Glu Val Asp Ser
130 135 140
Thr Trp Lys Thr Phe Asn Glu Ile Gln Lys Leu Leu Ser Lys Thr Asn
145 150 155 160
Gly Lys Leu Ile Gly Glu Leu Met Thr Thr Ala Pro Met Val Val Arg
165 170 175
Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys
180 185 190
Phe Arg Arg Leu Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile
195 200 205
Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Leu Val Lys Arg Glu
210 215 220
Asn Gln Lys Lys Ala
225
<210> 151
<211> 720
<212> DNA
<213> Ricinus communis
<400> 151
atggactctt gttccatttt ccatcaccaa cttctcaacc accctctcac gcgcctacgc 60
tccaccgctt cccctactgt cgtttctttc gctcatcagc ttccatgcct tctctcgtct 120
gccaccgttt cacgccgact ctttcatcta tcagtcattt cctggccccg tcgttcctct 180
actatctccg ccactggcac cttgatggcc aattccccaa aaagtggagt gtatacagtg 240
ggtgatttta tgaccaggaa agaggatcta tgtgtggtaa aacctacgac aacagttgat 300
gaagccttgc aaactcttgt tgagcacaga attactggtt ttcctgtgat tgatgatgat 360
tggaaactgg ttggtcttgt gtcagattat gacttgttag cattggactc tatatcaggt 420
ggtggaagaa ctgataacag catgtttccc gaggttgaca gcacttggaa aacttttaat 480
gaggtgcaaa agttactcag taaaaccaat gggaagcttg tcggtgactt aatgacacca 540
gccccagttg ttgttcgtga aaccactaat cttgaggatg ctgcaagatt attgctcgag 600
acaaaatacc gaagacttcc agttgtagat gctgaaggca agctggttgg aattatcaca 660
agaggaaatg ttgtaagagc tgcacttgaa ataaaacgtg acatggaagg gaatgagtaa 720
<210> 152
<211> 239
<212> PRT
<213> Ricinus communis
<400> 152
Met Asp Ser Cys Ser Ile Phe His His Gln Leu Leu Asn His Pro Leu
1 5 10 15
Thr Arg Leu Arg Ser Thr Ala Ser Pro Thr Val Val Ser Phe Ala His
20 25 30
Gln Leu Pro Cys Leu Leu Ser Ser Ala Thr Val Ser Arg Arg Leu Phe
35 40 45
His Leu Ser Val Ile Ser Trp Pro Arg Arg Ser Ser Thr Ile Ser Ala
50 55 60
Thr Gly Thr Leu Met Ala Asn Ser Pro Lys Ser Gly Val Tyr Thr Val
65 70 75 80
Gly Asp Phe Met Thr Arg Lys Glu Asp Leu Cys Val Val Lys Pro Thr
85 90 95
Thr Thr Val Asp Glu Ala Leu Gln Thr Leu Val Glu His Arg Ile Thr
100 105 110
Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser
115 120 125
Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Gly Gly Arg Thr
130 135 140
Asp Asn Ser Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn
145 150 155 160
Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Leu Val Gly Asp
165 170 175
Leu Met Thr Pro Ala Pro Val Val Val Arg Glu Thr Thr Asn Leu Glu
180 185 190
Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val
195 200 205
Val Asp Ala Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val
210 215 220
Val Arg Ala Ala Leu Glu Ile Lys Arg Asp Met Glu Gly Asn Glu
225 230 235
<210> 153
<211> 687
<212> DNA
<213> Sorghum bicolor
<400> 153
atggacatta ggctgctggt atccgcggac gccaccctcg ccgccgcccg ctcccgccct 60
tccacgtccg cgctccagcg ccagattgtc gtcccgggcc gccgccgggc gtcgtgcagg 120
tccgtccgcg cgcgctccgc cgcagctgcc gcgccagccg cgggaggcat ctccgggcat 180
agcaatggag tgtacacggt tggtgacttc atgacaggaa gggacaatct ccatgttgtc 240
caaccttcta caccggttga ccaagccctg gagctgctgg tacagcacaa gatctctggc 300
ttacctgtgg ttgacgatga tgggaagttg gttggggttg tatcagatta tgatctgcta 360
gctttggatt cgatttcagg aaatgaattg cccgatacaa atacaaacat gtttcctgat 420
gtggatagta catggaagac tttccacgag atacagagac tattaagcaa aactaatggg 480
aaggtcattg gtgatgtaat gacgtcttca cctttagcgg tgcgtcaaaa tactaatctt 540
gatgctgcta caaggttgct gcttgaaact aaataccgga gattacctgt agttgatagc 600
atggggaaac tagttgggat gattacaagg ggaaacgtcg tcagcgctgc cctcaaaata 660
aagaagaaaa ctgaagaagg tgcttga 687
<210> 154
<211> 228
<212> PRT
<213> Sorghum bicolor
<400> 154
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Thr Leu Ala Ala Ala
1 5 10 15
Arg Ser Arg Pro Ser Thr Ser Ala Leu Gln Arg Gln Ile Val Val Pro
20 25 30
Gly Arg Arg Arg Ala Ser Cys Arg Ser Val Arg Ala Arg Ser Ala Ala
35 40 45
Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Gly Val
50 55 60
Tyr Thr Val Gly Asp Phe Met Thr Gly Arg Asp Asn Leu His Val Val
65 70 75 80
Gln Pro Ser Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His
85 90 95
Lys Ile Ser Gly Leu Pro Val Val Asp Asp Asp Gly Lys Leu Val Gly
100 105 110
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Asn
115 120 125
Glu Leu Pro Asp Thr Asn Thr Asn Met Phe Pro Asp Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe His Glu Ile Gln Arg Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Val Ile Gly Asp Val Met Thr Ser Ser Pro Leu Ala Val Arg Gln
165 170 175
Asn Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr
180 185 190
Arg Arg Leu Pro Val Val Asp Ser Met Gly Lys Leu Val Gly Met Ile
195 200 205
Thr Arg Gly Asn Val Val Ser Ala Ala Leu Lys Ile Lys Lys Lys Thr
210 215 220
Glu Glu Gly Ala
225
<210> 155
<211> 657
<212> DNA
<213> Sorghum bicolor
<400> 155
atggacatta ggctgctggt atccgcggac gccaccctcg ccgccgcccg ctcccgccct 60
tccacgtccg cgctccagcg ccagattgtc gtcccgggcc gccgccgggc gtcgtgcagg 120
tccgtccgcg cgcgctccgc cgcagctgcc gcgccagccg cgggaggcat ctccgggcat 180
agcaatggag tgtacacggt tggtgacttc atgacaggaa gggacaatct ccatgttgtc 240
caaccttcta caccggttga ccaagccctg gagctgctgg tacagcacaa gatctctggc 300
ttacctgtgg ttgacgatga tgggaagttg gttggggttg tatcagatta tgatctgcta 360
gctttggatt cgatttcagg aaatgaattg cccgatacaa atacaaacat gtttcctgat 420
gtggatagta catggaagac tttccacgag atacagagac tattaagcaa aactaatggg 480
aaggtcattg gtgatgtaat gacgtcttca cctttagcgg tgcgtcaaaa tactaatctt 540
gatgctgcta caaggttgct gcttgaaact aaataccgga gattacctgt agttgatagc 600
atggggaaac tagtgagtgg atccttcctt cgttccttgc aatttatgtt catttga 657
<210> 156
<211> 218
<212> PRT
<213> Sorghum bicolor
<400> 156
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Thr Leu Ala Ala Ala
1 5 10 15
Arg Ser Arg Pro Ser Thr Ser Ala Leu Gln Arg Gln Ile Val Val Pro
20 25 30
Gly Arg Arg Arg Ala Ser Cys Arg Ser Val Arg Ala Arg Ser Ala Ala
35 40 45
Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Gly Val
50 55 60
Tyr Thr Val Gly Asp Phe Met Thr Gly Arg Asp Asn Leu His Val Val
65 70 75 80
Gln Pro Ser Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His
85 90 95
Lys Ile Ser Gly Leu Pro Val Val Asp Asp Asp Gly Lys Leu Val Gly
100 105 110
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Asn
115 120 125
Glu Leu Pro Asp Thr Asn Thr Asn Met Phe Pro Asp Val Asp Ser Thr
130 135 140
Trp Lys Thr Phe His Glu Ile Gln Arg Leu Leu Ser Lys Thr Asn Gly
145 150 155 160
Lys Val Ile Gly Asp Val Met Thr Ser Ser Pro Leu Ala Val Arg Gln
165 170 175
Asn Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr
180 185 190
Arg Arg Leu Pro Val Val Asp Ser Met Gly Lys Leu Val Ser Gly Ser
195 200 205
Phe Leu Arg Ser Leu Gln Phe Met Phe Ile
210 215
<210> 157
<211> 630
<212> DNA
<213> Saruma henryi
<400> 157
atggattctg ttcttctgac taaccctgtc cgtctgtctg gcgccggcga ctcttcatcg 60
tcccgtcatc tggcgctttt tcggtccgac ccacctatat ctttcattcg gattttctcc 120
ccatcgcaca acgccgccgc gcgagccacc ctccctcgca gggcctccct tgccgtcagg 180
agcagcgcgt tgatcaccaa ctccacacac cctaagagcg gagtatacac agtaggtgag 240
tttatgacga agaaggagca tttacatgtt gtaaaaccta caagtactgt tgatgaagca 300
ttggaagctc ttgtggagaa caggattact ggctttcccg tgattgatga tgattggaaa 360
ctggttggac tagtttctga ttacgatttg ttagcactcg actccatatc aggaaatgga 420
cgaacagata caagcttgtt tccagaagtc gatagcactt ggaaaacgtt taatgagata 480
caaaagttgc ttagtaaaac caacgggaaa gtgattgctg atgtaatgac accggctcct 540
cttgttgttt gcgaaacaac caaccttgaa gatgttgcaa ggtttatctt tgaatgccac 600
tcgctctcac gtacccatca atcagtttga 630
<210> 158
<211> 209
<212> PRT
<213> Saruma henryi
<400> 158
Met Asp Ser Val Leu Leu Thr Asn Pro Val Arg Leu Ser Gly Ala Gly
1 5 10 15
Asp Ser Ser Ser Ser Arg His Leu Ala Leu Phe Arg Ser Asp Pro Pro
20 25 30
Ile Ser Phe Ile Arg Ile Phe Ser Pro Ser His Asn Ala Ala Ala Arg
35 40 45
Ala Thr Leu Pro Arg Arg Ala Ser Leu Ala Val Arg Ser Ser Ala Leu
50 55 60
Ile Thr Asn Ser Thr His Pro Lys Ser Gly Val Tyr Thr Val Gly Glu
65 70 75 80
Phe Met Thr Lys Lys Glu His Leu His Val Val Lys Pro Thr Ser Thr
85 90 95
Val Asp Glu Ala Leu Glu Ala Leu Val Glu Asn Arg Ile Thr Gly Phe
100 105 110
Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Asn Gly Arg Thr Asp Thr
130 135 140
Ser Leu Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Ala Asp Val Met
165 170 175
Thr Pro Ala Pro Leu Val Val Cys Glu Thr Thr Asn Leu Glu Asp Val
180 185 190
Ala Arg Phe Ile Phe Glu Cys His Ser Leu Ser Arg Thr His Gln Ser
195 200 205
Val
<210> 159
<211> 717
<212> DNA
<213> Saruma henryi
<400> 159
atggattctg ttcttctgac taaccctgtc cgtctgtctg gcgccggcga ctcttcatcg 60
tcccgtcatc tggcgctttt tcggtccgac ccacctatat ctttcattcg gattttctcc 120
ccatcgcaca acgccgccgc gcgagccacc ctccctcgca gggcctccct tgccgtcagg 180
agcagcgcgt tgatcaccaa ctccacacac cctaagagcg gagtatacac agtaggtgag 240
tttatgacga agaaggagca tttacatgtt gtaaaaccta caagtactgt tgatgaagca 300
ttggaagctc ttgtggagaa caggattact ggctttcccg tgattgatga tgattggaaa 360
ctggttggac tagtttctga ttacgatttg ttagcactcg actccatatc aggaaatgga 420
cgaacagata caagcttgtt tccagaagtc gatagcactt ggaaaacgtt taatgagata 480
caaaagttgc ttagtaaaac caacgggaaa gtgattgctg atgtaatgac accggctcct 540
cttgttgttt gcgaaacaac caaccttgaa gatgttgcaa gattattgct tgaaacaaaa 600
taccgacgac tgcccgtggt tgatggagct ggtaagctgg ttgggattat cacaagggga 660
tatgttgtac gagctgcctt acaaataaag cgtgctacga aagattacac ggtgtaa 717
<210> 160
<211> 238
<212> PRT
<213> Saruma henryi
<400> 160
Met Asp Ser Val Leu Leu Thr Asn Pro Val Arg Leu Ser Gly Ala Gly
1 5 10 15
Asp Ser Ser Ser Ser Arg His Leu Ala Leu Phe Arg Ser Asp Pro Pro
20 25 30
Ile Ser Phe Ile Arg Ile Phe Ser Pro Ser His Asn Ala Ala Ala Arg
35 40 45
Ala Thr Leu Pro Arg Arg Ala Ser Leu Ala Val Arg Ser Ser Ala Leu
50 55 60
Ile Thr Asn Ser Thr His Pro Lys Ser Gly Val Tyr Thr Val Gly Glu
65 70 75 80
Phe Met Thr Lys Lys Glu His Leu His Val Val Lys Pro Thr Ser Thr
85 90 95
Val Asp Glu Ala Leu Glu Ala Leu Val Glu Asn Arg Ile Thr Gly Phe
100 105 110
Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Asn Gly Arg Thr Asp Thr
130 135 140
Ser Leu Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Ala Asp Val Met
165 170 175
Thr Pro Ala Pro Leu Val Val Cys Glu Thr Thr Asn Leu Glu Asp Val
180 185 190
Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp
195 200 205
Gly Ala Gly Lys Leu Val Gly Ile Ile Thr Arg Gly Tyr Val Val Arg
210 215 220
Ala Ala Leu Gln Ile Lys Arg Ala Thr Lys Asp Tyr Thr Val
225 230 235
<210> 161
<211> 582
<212> DNA
<213> Saruma henryi
<400> 161
atggattccg tccttctcgc cgaccctctc tccctctctt cctactctct cagccgtcgg 60
ggacattttc cggctgcctt ctccaccaag gctcctccca cattcgtttg ccttatagct 120
tcgtctttcg atgcccctgc gcgagcaacc caccctcggg gggtttccgt cgtcgccagg 180
ggcgccaccg caatggccag ttcctcgccc cctaagaatg gagagtacat agtgggtgat 240
tttatgacta aaagagagca tttgcatgtt gtaaaatcta caactactgt tgatgaagca 300
cttgagattc tggtggagaa aagaattact ggttttcctg tgattgatga tgactggaaa 360
ctggttgggc tggtttcaga ttatgatttg ttggcgctgg attccatttc aggaagtagc 420
caaagtgata caagcttctt cccagaagtt gatagcagtt ggaaaacatt taatgagata 480
cagaagttgc ttagcaaaac caatgggaaa gtgattgctg atgtgatgac accggctcct 540
cttgttgttc gcgagaccac caacctttgg agatgctgct ag 582
<210> 162
<211> 193
<212> PRT
<213> Saruma henryi
<400> 162
Met Asp Ser Val Leu Leu Ala Asp Pro Leu Ser Leu Ser Ser Tyr Ser
1 5 10 15
Leu Ser Arg Arg Gly His Phe Pro Ala Ala Phe Ser Thr Lys Ala Pro
20 25 30
Pro Thr Phe Val Cys Leu Ile Ala Ser Ser Phe Asp Ala Pro Ala Arg
35 40 45
Ala Thr His Pro Arg Gly Val Ser Val Val Ala Arg Gly Ala Thr Ala
50 55 60
Met Ala Ser Ser Ser Pro Pro Lys Asn Gly Glu Tyr Ile Val Gly Asp
65 70 75 80
Phe Met Thr Lys Arg Glu His Leu His Val Val Lys Ser Thr Thr Thr
85 90 95
Val Asp Glu Ala Leu Glu Ile Leu Val Glu Lys Arg Ile Thr Gly Phe
100 105 110
Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ser Ser Gln Ser Asp Thr
130 135 140
Ser Phe Phe Pro Glu Val Asp Ser Ser Trp Lys Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Ile Ala Asp Val Met
165 170 175
Thr Pro Ala Pro Leu Val Val Arg Glu Thr Thr Asn Leu Trp Arg Cys
180 185 190
Cys
<210> 163
<211> 711
<212> DNA
<213> Solanum lycopersicum
<400> 163
atggcatcta tctcgccgtc gggagtctcc ctccaccgca gctccgccgc tttccaccac 60
cagctgcctt gtctgctctt atctctgcca tgccacaaag ttgctacttt cgctaaatgt 120
ttcctctccg tacgcctttg gaattcgcgc aaccattttt ccgttaccgc cagcaacact 180
ttgacggcca attcagtaga gccaagaaat ggtgtatata cagtaggtga tttcatgaca 240
agaaaagatg atctacatgt ggtaaaacca tcaacatccg tagatgaagc cttggaaacg 300
ttggtagaac gcagaatcac tgggttccct gtggttgatg atgactggaa attggttggt 360
cttgtttctg attatgatct attggctctg gattctgtat caggtacagg aggagctgat 420
gcaaacatgt tccccgaagt gggcagcaac tggaaaacat tcaatgaggt tcaaaagttg 480
ataagtaaga ccaaggggaa agtggttggt gatttgatga cgcctgctcc actagtagtt 540
agggagtcca ccaatctaga ggatgcagca agacttctgc tcaaaacaaa ataccgccgg 600
cttcctgttg tagatagtga tggaaagctg gtgggaataa taacaagggg aaatgttgtg 660
agagctgccc ttcatattaa acggatcatg gaaatggaag gccaacagta a 711
<210> 164
<211> 236
<212> PRT
<213> Solanum lycopersicum
<400> 164
Met Ala Ser Ile Ser Pro Ser Gly Val Ser Leu His Arg Ser Ser Ala
1 5 10 15
Ala Phe His His Gln Leu Pro Cys Leu Leu Leu Ser Leu Pro Cys His
20 25 30
Lys Val Ala Thr Phe Ala Lys Cys Phe Leu Ser Val Arg Leu Trp Asn
35 40 45
Ser Arg Asn His Phe Ser Val Thr Ala Ser Asn Thr Leu Thr Ala Asn
50 55 60
Ser Val Glu Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Asp Asp Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Thr Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Gly Ala Asp Ala Asn Met Phe
130 135 140
Pro Glu Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Ile Ser Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Asp Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
His Ile Lys Arg Ile Met Glu Met Glu Gly Gln Gln
225 230 235
<210> 165
<211> 729
<212> DNA
<213> Solanum lycopersicum
<400> 165
atggagtccg ttctcaattt caactcaatt tctccgattt gcgtacttaa ctatcgcctt 60
tttccgacca cgctctcttg ctcgcctcgt ccactttcag gagatccagc cgttgctaca 120
tctcgccgat gtttatctca acggaaactt tctcgatctc tccctccggc gtctcttcct 180
tcaacctccg ctaatgccgc tgcttctact tcaaattctc agtctccaag cgatggacat 240
tactcggttg gtgactttat gactaggaaa gaagatttac atgtagtaaa aactacaact 300
aaagttggtg aagcccttga gatgcttgtg gaaaaaagag ttactgggct tcctgtagtt 360
gatgatgact ggaaattggt tggcgttgtt tctgattatg acctactggc actcgactct 420
atatcaggag ctggccaagc tgacacaaat ctgtttcctg atgttgatag tacttggaag 480
acattcaatg aggttcaaaa gctactgagc aaaactaatg ggaaagttgt tggtgatgtc 540
atgacgccga gtccattgtc cgtctgtgaa aacaccaacc ttgaagatgc ttcgaggttg 600
ttgctccaaa cgaaataccg tcggctacca gttgtagatg ttgatggtaa actggttggg 660
attatcacaa ggggcaatgt tgtcagagct gctcttcaaa taaaacgcac cactgacaat 720
accaactga 729
<210> 166
<211> 242
<212> PRT
<213> Solanum lycopersicum
<400> 166
Met Glu Ser Val Leu Asn Phe Asn Ser Ile Ser Pro Ile Cys Val Leu
1 5 10 15
Asn Tyr Arg Leu Phe Pro Thr Thr Leu Ser Cys Ser Pro Arg Pro Leu
20 25 30
Ser Gly Asp Pro Ala Val Ala Thr Ser Arg Arg Cys Leu Ser Gln Arg
35 40 45
Lys Leu Ser Arg Ser Leu Pro Pro Ala Ser Leu Pro Ser Thr Ser Ala
50 55 60
Asn Ala Ala Ala Ser Thr Ser Asn Ser Gln Ser Pro Ser Asp Gly His
65 70 75 80
Tyr Ser Val Gly Asp Phe Met Thr Arg Lys Glu Asp Leu His Val Val
85 90 95
Lys Thr Thr Thr Lys Val Gly Glu Ala Leu Glu Met Leu Val Glu Lys
100 105 110
Arg Val Thr Gly Leu Pro Val Val Asp Asp Asp Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ala
130 135 140
Gly Gln Ala Asp Thr Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val
165 170 175
Val Gly Asp Val Met Thr Pro Ser Pro Leu Ser Val Cys Glu Asn Thr
180 185 190
Asn Leu Glu Asp Ala Ser Arg Leu Leu Leu Gln Thr Lys Tyr Arg Arg
195 200 205
Leu Pro Val Val Asp Val Asp Gly Lys Leu Val Gly Ile Ile Thr Arg
210 215 220
Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Thr Thr Asp Asn
225 230 235 240
Thr Asn
<210> 167
<211> 705
<212> DNA
<213> Solanum lycopersicum
<400> 167
atggcatcta tatcaccctc tggaagctgt ctccaccgca cacccgccgc attccaccgt 60
cagctgcctt gcttgctctt atctctaccc ggccacatac ttgctgcttc cactaaattt 120
taccttcctc tacgtctttc ggactctcga gatacctttc gccttgcttc agccaacact 180
ttgacggcca attctgtacc gcccagaaat ggtgtgtata cggttggtga tttcatgacc 240
aggaaagagg agttacatgt ggtaaagccc acaacatccg tagatgaagc attggaagct 300
ctagtggaac acaggatcac tggtttccct gtgattgatg ataactggaa actagttggt 360
cttgtttctg actatgatct attagcgctc gactctgtat caggtacagg aacagctgat 420
gcaggcatat ttcctgaagt agacagcaac tggaaaacat tcaatgaggt tcaaaagttg 480
cttggcaaga ccaaagggaa agtggttggt gatctgatga cacctgctcc tttagtagtt 540
cgtgaatcta ccaatcttga agatgcagca agacttctac tcaaaacaaa atatcgtcgg 600
cttcctgtgg tagatggtaa gggtaagctg gtgggaataa taacaagagg aaacgttgta 660
agggccgccc ttcaaataaa gcgggctaca gaaatggaag attga 705
<210> 168
<211> 234
<212> PRT
<213> Solanum lycopersicum
<400> 168
Met Ala Ser Ile Ser Pro Ser Gly Ser Cys Leu His Arg Thr Pro Ala
1 5 10 15
Ala Phe His Arg Gln Leu Pro Cys Leu Leu Leu Ser Leu Pro Gly His
20 25 30
Ile Leu Ala Ala Ser Thr Lys Phe Tyr Leu Pro Leu Arg Leu Ser Asp
35 40 45
Ser Arg Asp Thr Phe Arg Leu Ala Ser Ala Asn Thr Leu Thr Ala Asn
50 55 60
Ser Val Pro Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Thr Ala Asp Ala Gly Ile Phe
130 135 140
Pro Glu Val Asp Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Leu Gly Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Lys Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Gln Ile Lys Arg Ala Thr Glu Met Glu Asp
225 230
<210> 169
<211> 540
<212> DNA
<213> Saccharum officinarum
<400> 169
atggacgcca cgctactcct cctctccgcc gactgcacgg ccgccgccag cgggcggctg 60
cggcctcgac tgcctgcggg cccacatgtg gcttcccctg gtccctccgc gcggccaagg 120
acctccatcc gcgcctcagc tgcgtccgcg gccctcgccg tccgtggcct gccgcatcat 180
gcttccgtgg ccgggcaaag cactggaagt tatacggttg gtgatgttat gaccaaaagg 240
gaagacctgc atgttgtgaa accaacaact tcagttgatg aagctcttga gatgctggtg 300
aagcatagga tcactggctt tcctgttatt gatgacgact ggaatttggt tggtgttgtc 360
tcagattatg atttattggc actggattca atatcaggag ctggaccggc tgaagcagac 420
atatttcctg aggtggatag cacttggaag acatttcgtg agatacaaag gcttttgagc 480
aaaaccaaag ggaaggttat tggggatgtt atgaccctca gcacctcttg tggggcgtga 540
<210> 170
<211> 179
<212> PRT
<213> Saccharum officinarum
<400> 170
Met Asp Ala Thr Leu Leu Leu Leu Ser Ala Asp Cys Thr Ala Ala Ala
1 5 10 15
Ser Gly Arg Leu Arg Pro Arg Leu Pro Ala Gly Pro His Val Ala Ser
20 25 30
Pro Gly Pro Ser Ala Arg Pro Arg Thr Ser Ile Arg Ala Ser Ala Ala
35 40 45
Ser Ala Ala Leu Ala Val Arg Gly Leu Pro His His Ala Ser Val Ala
50 55 60
Gly Gln Ser Thr Gly Ser Tyr Thr Val Gly Asp Val Met Thr Lys Arg
65 70 75 80
Glu Asp Leu His Val Val Lys Pro Thr Thr Ser Val Asp Glu Ala Leu
85 90 95
Glu Met Leu Val Lys His Arg Ile Thr Gly Phe Pro Val Ile Asp Asp
100 105 110
Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu
115 120 125
Asp Ser Ile Ser Gly Ala Gly Pro Ala Glu Ala Asp Ile Phe Pro Glu
130 135 140
Val Asp Ser Thr Trp Lys Thr Phe Arg Glu Ile Gln Arg Leu Leu Ser
145 150 155 160
Lys Thr Lys Gly Lys Val Ile Gly Asp Val Met Thr Leu Ser Thr Ser
165 170 175
Cys Gly Ala
<210> 171
<211> 711
<212> DNA
<213> Solanum tuberosum
<400> 171
atggcatctt tctcgccgtc gggactctcc ctccgccgca gctccgccgc cttccaccac 60
cagctccctt gtctgctctt atctctgcca tgccacaaag ttgctacttt cgctaaatgt 120
ttcctctccg tacgcctttg gaattcgcgc aagcattttt ccgttaccgc tagcaacact 180
ttgatggcca attctataga gccaagaaat ggtgtatata cagtaggtga tttcatgaca 240
agaaaagatg aactacatgt ggtaaaacca tcaacatctg tagatgaagc cttggaaatt 300
ttggtagaac gcagaatcac tggtttccct gtggttgatg atgactggaa attggttggt 360
cttgtttctg attatgatct attggctctg gactctgtat caggtacagg aggacctgat 420
gcaaacatgt tccccgaagt gggcagcaac tggaaaacat tcaatgaggt tcaaaagttg 480
ataagtaaga ccaaggggaa agtggttggt gatttgatga cacctgctcc actagtagtt 540
agggagtcta ccaatctcga ggatgcagca agacttctgc tcaaaacaaa atatcgccgg 600
cttcctgttg tagatagtga cggaaagctg gtgggaataa taacaagggg aaatgttgtg 660
agagctgccc ttcatataaa acggatcatg gaaatggaag gccaacagta a 711
<210> 172
<211> 236
<212> PRT
<213> Solanum tuberosum
<400> 172
Met Ala Ser Phe Ser Pro Ser Gly Leu Ser Leu Arg Arg Ser Ser Ala
1 5 10 15
Ala Phe His His Gln Leu Pro Cys Leu Leu Leu Ser Leu Pro Cys His
20 25 30
Lys Val Ala Thr Phe Ala Lys Cys Phe Leu Ser Val Arg Leu Trp Asn
35 40 45
Ser Arg Lys His Phe Ser Val Thr Ala Ser Asn Thr Leu Met Ala Asn
50 55 60
Ser Ile Glu Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Asp Glu Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ile Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Gly Pro Asp Ala Asn Met Phe
130 135 140
Pro Glu Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Ile Ser Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Asp Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
His Ile Lys Arg Ile Met Glu Met Glu Gly Gln Gln
225 230 235
<210> 173
<211> 705
<212> DNA
<213> Solanum tuberosum
<400> 173
atggcatcta tatcaccgtc tggaatctgt ctccaccgca catccgccgc attccaccgt 60
cagctgtctt gcttgctctt atctctatcc ggccacaaac ttgctgcttc cactaaattt 120
taccttcctc tacgtttttc gtactctcga gatacctttc gccttgcttc agtcaacact 180
ttgacggcca attctgtacc gcccagaaat ggtgtgtata cggtaggtga tttcatgacc 240
aggaaagagg agttacatgt ggtaaagccc acaacatccg tagatgaagc attggaagct 300
ctagtggaac acaggatcac tggtttccct gtgattgatg ataactggaa actagttggt 360
cttgtttctg actatgatct attagcactc gactctgtat caggtacagg aacagctgat 420
gcaggcatat ttcctgaagt agacagcaac tggaaaacat tcaatgaggt tcaaaaattg 480
cttggcaaga ccaaagggaa agtggttggt gatctgatga cacctgctcc tttagtagtt 540
cgtgaatcta ccaatcttga ggatgcagca agacttttac tcaaaacaaa atatcgtcgg 600
cttcctgtgg tagatggtaa gggcaagctg gtgggaataa taacaagagg aaacgttgta 660
agggccgccc ttcaaataaa gcgggctaca gaaatggaag attga 705
<210> 174
<211> 234
<212> PRT
<213> Solanum tuberosum
<400> 174
Met Ala Ser Ile Ser Pro Ser Gly Ile Cys Leu His Arg Thr Ser Ala
1 5 10 15
Ala Phe His Arg Gln Leu Ser Cys Leu Leu Leu Ser Leu Ser Gly His
20 25 30
Lys Leu Ala Ala Ser Thr Lys Phe Tyr Leu Pro Leu Arg Phe Ser Tyr
35 40 45
Ser Arg Asp Thr Phe Arg Leu Ala Ser Val Asn Thr Leu Thr Ala Asn
50 55 60
Ser Val Pro Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ala Leu Val Glu His Arg Ile Thr Gly Phe Pro Val Ile
100 105 110
Asp Asp Asn Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Thr Ala Asp Ala Gly Ile Phe
130 135 140
Pro Glu Val Asp Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Leu Gly Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Gly Lys Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
Gln Ile Lys Arg Ala Thr Glu Met Glu Asp
225 230
<210> 175
<211> 636
<212> DNA
<213> Solanum tuberosum
<400> 175
atggagtccg ttctcaattt caactcaatt tctccgtttt gcgtacttaa ctatcgcctt 60
tttccgacca cgttctcttg ctcggcccgt ccactttcag gagacccatc cgttgctaaa 120
tctcgccgat gtttatctca acagaaactt tctcgatctc ttcctccggc gtctcttcct 180
tcaacctccg ctaatgccgc tgcttctact tcaaattctc agtctccaag cgatggacat 240
tactcagttg gtgactttat gactaggaaa gaagatttac atgtagtaaa aactacaact 300
aaagttggtg aagcccttga gatgcttgtg gaaaaaagag ttactgggct tcctgtagtt 360
gatgatgact ggaaattggt tggcgttgtt tctgattatg acctactggc tctcgactct 420
atatcaggag ctggccaagc tgacacaaat ctgtttcctg atgttgatag tacttggaag 480
acattcaatg aggttcaaaa gctactgagc aaaactaatg gaaaagttgt tggtgatgtc 540
atgacaccga gtccattgtc cgtctgtgaa aacccaacct tgaagatgct gcgaggttat 600
tgctccaaac gaaataccgt cgactaccag ttgtag 636
<210> 176
<211> 211
<212> PRT
<213> Solanum tuberosum
<400> 176
Met Glu Ser Val Leu Asn Phe Asn Ser Ile Ser Pro Phe Cys Val Leu
1 5 10 15
Asn Tyr Arg Leu Phe Pro Thr Thr Phe Ser Cys Ser Ala Arg Pro Leu
20 25 30
Ser Gly Asp Pro Ser Val Ala Lys Ser Arg Arg Cys Leu Ser Gln Gln
35 40 45
Lys Leu Ser Arg Ser Leu Pro Pro Ala Ser Leu Pro Ser Thr Ser Ala
50 55 60
Asn Ala Ala Ala Ser Thr Ser Asn Ser Gln Ser Pro Ser Asp Gly His
65 70 75 80
Tyr Ser Val Gly Asp Phe Met Thr Arg Lys Glu Asp Leu His Val Val
85 90 95
Lys Thr Thr Thr Lys Val Gly Glu Ala Leu Glu Met Leu Val Glu Lys
100 105 110
Arg Val Thr Gly Leu Pro Val Val Asp Asp Asp Trp Lys Leu Val Gly
115 120 125
Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Ala
130 135 140
Gly Gln Ala Asp Thr Asn Leu Phe Pro Asp Val Asp Ser Thr Trp Lys
145 150 155 160
Thr Phe Asn Glu Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val
165 170 175
Val Gly Asp Val Met Thr Pro Ser Pro Leu Ser Val Cys Glu Asn Pro
180 185 190
Thr Leu Lys Met Leu Arg Gly Tyr Cys Ser Lys Arg Asn Thr Val Asp
195 200 205
Tyr Gln Leu
210
<210> 177
<211> 711
<212> DNA
<213> Solanum tuberosum
<400> 177
atggcatcta tctcgccgtc gggactctcc ctccgccgca gctccgccgc tttccaccac 60
cagcttcctt gtctgctctt atctctgcca ttccacaaag ttgctacttt cgctaaatgt 120
ttcctctccg tacgcctttg gaattcgcgc aagcattttt ccgttaccgc cagcaacact 180
ttgacggcca attctataga gccaagaaat ggtgtatata cagtaggtga tttcatgaca 240
agaaaagatg aactacatgt ggtaaaacca tcaacatctg tagatgaagc cttggaaatt 300
ttggtagaac gcagaatcac tggtttccct gtggttgatg atgactggaa attggttggt 360
cttgtttctg attatgatct attggctctg gactctgtat caggtacagg aggagctgat 420
gcaaacatgt tccccgaagt gggcagcaac tggaaaacat tcaatgaggt tcaaaagttg 480
ataagtaaga ccaaggggaa agtggttggt gatttgatga cacctgctcc actagtagtt 540
agggagtcta ccaatctcga ggatgcagca agacttctgc tcaaaacaaa atatcgccgg 600
cttcctgttg tagatagtga tggaaagctg gtgggaataa taacaagggg aaatgttgtg 660
agagctgccc ttcatataaa acggatcatg gaaatggaag gccaacagta a 711
<210> 178
<211> 236
<212> PRT
<213> Solanum tuberosum
<400> 178
Met Ala Ser Ile Ser Pro Ser Gly Leu Ser Leu Arg Arg Ser Ser Ala
1 5 10 15
Ala Phe His His Gln Leu Pro Cys Leu Leu Leu Ser Leu Pro Phe His
20 25 30
Lys Val Ala Thr Phe Ala Lys Cys Phe Leu Ser Val Arg Leu Trp Asn
35 40 45
Ser Arg Lys His Phe Ser Val Thr Ala Ser Asn Thr Leu Thr Ala Asn
50 55 60
Ser Ile Glu Pro Arg Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr
65 70 75 80
Arg Lys Asp Glu Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu
85 90 95
Ala Leu Glu Ile Leu Val Glu Arg Arg Ile Thr Gly Phe Pro Val Val
100 105 110
Asp Asp Asp Trp Lys Leu Val Gly Leu Val Ser Asp Tyr Asp Leu Leu
115 120 125
Ala Leu Asp Ser Val Ser Gly Thr Gly Gly Ala Asp Ala Asn Met Phe
130 135 140
Pro Glu Val Gly Ser Asn Trp Lys Thr Phe Asn Glu Val Gln Lys Leu
145 150 155 160
Ile Ser Lys Thr Lys Gly Lys Val Val Gly Asp Leu Met Thr Pro Ala
165 170 175
Pro Leu Val Val Arg Glu Ser Thr Asn Leu Glu Asp Ala Ala Arg Leu
180 185 190
Leu Leu Lys Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Asp Gly
195 200 205
Lys Leu Val Gly Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu
210 215 220
His Ile Lys Arg Ile Met Glu Met Glu Gly Gln Gln
225 230 235
<210> 179
<211> 693
<212> DNA
<213> Triticum aestivum
<400> 179
atggccgcca ggctgctgct cctctccttc gattgcccgg ccgtcgctgg cgggcggcgg 60
tctcgtctgt ctgcagtgcc acggatgtct tccggtgcac ccctcgtgcg gcccccagcc 120
tcatccgtcc gcgcgttcgc ggtcaccgcc gctagaggca agctgccgca ccgcacctcc 180
gtggctgtgg agggtggtgg agtttacact gttggtgact ttatgactaa aagggaacaa 240
ctccatgttg tgaaaccatc cacttcagta gatgaagctc ttgagaggct ggtggagcat 300
cgaataactg gctttcctgt taccgatgat cactggaatt tggttggtgt ggtctcagat 360
tatgatctgt tagcactgga ctcgatatca ggaaatggac agactgaagc tgacatattt 420
cctgaggtgg acagcacttg gaagactttc catcacatac aaaagctctt aagcaaaacc 480
aatgggaaag tagttagtga tgttatgact tctgcacctc ttgtggtgcg tgaaactact 540
aaccttgaag atgctgcaag gttacttctt gttactaaat accgcaggct gccagtagtc 600
gacagttcgg gcaaattggt tggaatcatc acaagaggga acgtcgtcag agctgctctt 660
gagtttaaga aaaatgttga agggagtctt tga 693
<210> 180
<211> 230
<212> PRT
<213> Triticum aestivum
<400> 180
Met Ala Ala Arg Leu Leu Leu Leu Ser Phe Asp Cys Pro Ala Val Ala
1 5 10 15
Gly Gly Arg Arg Ser Arg Leu Ser Ala Val Pro Arg Met Ser Ser Gly
20 25 30
Ala Pro Leu Val Arg Pro Pro Ala Ser Ser Val Arg Ala Phe Ala Val
35 40 45
Thr Ala Ala Arg Gly Lys Leu Pro His Arg Thr Ser Val Ala Val Glu
50 55 60
Gly Gly Gly Val Tyr Thr Val Gly Asp Phe Met Thr Lys Arg Glu Gln
65 70 75 80
Leu His Val Val Lys Pro Ser Thr Ser Val Asp Glu Ala Leu Glu Arg
85 90 95
Leu Val Glu His Arg Ile Thr Gly Phe Pro Val Thr Asp Asp His Trp
100 105 110
Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser
115 120 125
Ile Ser Gly Asn Gly Gln Thr Glu Ala Asp Ile Phe Pro Glu Val Asp
130 135 140
Ser Thr Trp Lys Thr Phe His His Ile Gln Lys Leu Leu Ser Lys Thr
145 150 155 160
Asn Gly Lys Val Val Ser Asp Val Met Thr Ser Ala Pro Leu Val Val
165 170 175
Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Val Thr
180 185 190
Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Ser Gly Lys Leu Val Gly
195 200 205
Ile Ile Thr Arg Gly Asn Val Val Arg Ala Ala Leu Glu Phe Lys Lys
210 215 220
Asn Val Glu Gly Ser Leu
225 230
<210> 181
<211> 705
<212> DNA
<213> Triticum aestivum
<400> 181
atggaggccg ccgcgtcccc tctgctcctc tccgccgacg cgcccctcgc cgccggccgc 60
cgcctcctcc tcgtcccttc tcggcccgcg cgcgccccac ggcggggcgc cgcgcccagc 120
aggtgccggc gggcgtccgt ccgcgcgtac gccgcggccg ccgcgccagc gccggcctct 180
ggaaacggcc tcgtcgggaa taacaacgga gtgtacactg ttggagactt catgacgaaa 240
agggaggatc tccatgtcgt caaagcgtca accccggttg atgaagcgct cgagatgctg 300
gtgcagaaca ggatctctgg tttccctgtt atcgatgacg actggaagtt ggttggcgtt 360
gtctcagatt atgatctatt agctttggac tcaatggcag gatgtggact ggctgataca 420
aattcaagta tgttccctga agtagatagc acttggaaga catttcgcga gatccagaga 480
ctcttgagca aaaccagtgg caaagttatc ggtgatgtta tgactccctc acctcttgtg 540
gtgcgtgaaa ctactaacct cgacgctgct gcaaggttgc tgcttgaaac caaataccac 600
agattgcctg ttgttgatag cacgggaaat ttggttggga tgatcacaag ggggaatgtc 660
gtcagagctg ctctcaaaat aaagaagaaa gctgaaggtg cttaa 705
<210> 182
<211> 234
<212> PRT
<213> Triticum aestivum
<400> 182
Met Glu Ala Ala Ala Ser Pro Leu Leu Leu Ser Ala Asp Ala Pro Leu
1 5 10 15
Ala Ala Gly Arg Arg Leu Leu Leu Val Pro Ser Arg Pro Ala Arg Ala
20 25 30
Pro Arg Arg Gly Ala Ala Pro Ser Arg Cys Arg Arg Ala Ser Val Arg
35 40 45
Ala Tyr Ala Ala Ala Ala Ala Pro Ala Pro Ala Ser Gly Asn Gly Leu
50 55 60
Val Gly Asn Asn Asn Gly Val Tyr Thr Val Gly Asp Phe Met Thr Lys
65 70 75 80
Arg Glu Asp Leu His Val Val Lys Ala Ser Thr Pro Val Asp Glu Ala
85 90 95
Leu Glu Met Leu Val Gln Asn Arg Ile Ser Gly Phe Pro Val Ile Asp
100 105 110
Asp Asp Trp Lys Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala
115 120 125
Leu Asp Ser Met Ala Gly Cys Gly Leu Ala Asp Thr Asn Ser Ser Met
130 135 140
Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Arg Glu Ile Gln Arg
145 150 155 160
Leu Leu Ser Lys Thr Ser Gly Lys Val Ile Gly Asp Val Met Thr Pro
165 170 175
Ser Pro Leu Val Val Arg Glu Thr Thr Asn Leu Asp Ala Ala Ala Arg
180 185 190
Leu Leu Leu Glu Thr Lys Tyr His Arg Leu Pro Val Val Asp Ser Thr
195 200 205
Gly Asn Leu Val Gly Met Ile Thr Arg Gly Asn Val Val Arg Ala Ala
210 215 220
Leu Lys Ile Lys Lys Lys Ala Glu Gly Ala
225 230
<210> 183
<211> 726
<212> DNA
<213> Theobroma cacao
<400> 183
atggactcaa ttctccacac agaatccctt tctctcacgc gcctacgcgc cgcttccact 60
tccacctcca ccgctaccat tcaccacatg ccttgccaac tcatctttcg tccggtccac 120
cgtctcctcc ttcccatatc cgccgtcacc gccggctctg gctctcgtag ggcatccact 180
tccgttgtcg ctgctaacgg cactctcacc gccaactccg tttcgccaag aggtggagta 240
tatacggttg gggattttat gacgaggaaa gagaatttgc atgtggtgaa gccaacaaca 300
actgttgatg aagcattgga aactcttgtt gaacacagaa tcactggttt tcctgtcatt 360
gatgatgatt ggaaattggt tggacttgtt tccgattatg acttgttagc attggactcc 420
atatctgggc gacggactga aaatgacatg tttcctgaag ttgacagcac ttggaaaact 480
ttccacgagc tacaaaagtt actcagtaaa accaatggcc agctggttgg tgatttaatg 540
acaccagctc cagtagttgt acgagaaaca actaacctcg aggatgctgc tagattattg 600
ctcgagacaa aatatcgtcg acttccagtt gttgatgttg agggtaagct ggtcggtatc 660
atcacaagag gaaatgttgt gagagctgcc cttcaaataa agcgtgctat tgaaggcgaa 720
gcataa 726
<210> 184
<211> 241
<212> PRT
<213> Theobroma cacao
<400> 184
Met Asp Ser Ile Leu His Thr Glu Ser Leu Ser Leu Thr Arg Leu Arg
1 5 10 15
Ala Ala Ser Thr Ser Thr Ser Thr Ala Thr Ile His His Met Pro Cys
20 25 30
Gln Leu Ile Phe Arg Pro Val His Arg Leu Leu Leu Pro Ile Ser Ala
35 40 45
Val Thr Ala Gly Ser Gly Ser Arg Arg Ala Ser Thr Ser Val Val Ala
50 55 60
Ala Asn Gly Thr Leu Thr Ala Asn Ser Val Ser Pro Arg Gly Gly Val
65 70 75 80
Tyr Thr Val Gly Asp Phe Met Thr Arg Lys Glu Asn Leu His Val Val
85 90 95
Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Thr Leu Val Glu His
100 105 110
Arg Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys Leu Val Gly
115 120 125
Leu Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Arg
130 135 140
Arg Thr Glu Asn Asp Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr
145 150 155 160
Phe His Glu Leu Gln Lys Leu Leu Ser Lys Thr Asn Gly Gln Leu Val
165 170 175
Gly Asp Leu Met Thr Pro Ala Pro Val Val Val Arg Glu Thr Thr Asn
180 185 190
Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu
195 200 205
Pro Val Val Asp Val Glu Gly Lys Leu Val Gly Ile Ile Thr Arg Gly
210 215 220
Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Ala Ile Glu Gly Glu
225 230 235 240
Ala
<210> 185
<211> 720
<212> DNA
<213> Taraxacum officinale
<400> 185
atggactcga tcatcttacc ggcggtgtct atatccggtg ttgtttccgc cgcacgagat 60
cgtcgaatac cgtctacaac ctcacatgct agcgcttttt accaggggaa atttctctct 120
actcgctcgt taccacggtt ctccgatcgc gatcataggc gtttgacagc cgttcatgcc 180
gtcgctgctg atatgactaa ttccgcgcct attagagatg taatatatac agttgctgat 240
tttatgacaa agaaagagaa gttacttgtg gtagaaacaa caactacagt tgatcaggca 300
ttagagattc ttgcggacaa aagaataaca ggctttccgg ttgttgatgc tgattggaat 360
ttggttggtg ttgtttcaga ttacgacttg ttagctcttg attcaatatc aggtgttaat 420
cactgtgaca caagcttgtt tcctgatgtc gatagttctt ggacaacatt caatgagatt 480
caaaaactac ttggtaaaac tgatggaaaa gttgtgggag acttgatgac acctactcca 540
cttgtagttc atgataccac aaatcttgaa gaagctgtaa ggttgttgct tgaaacaaaa 600
taccgtaggc ttccagtagt tgatgataat gggaaactgg ttggacttat tacaagggga 660
gatgttgtta gggctgcact taagataaaa gatgatataa agaaaatgca atcagagtaa 720
<210> 186
<211> 239
<212> PRT
<213> Taraxacum officinale
<400> 186
Met Asp Ser Ile Ile Leu Pro Ala Val Ser Ile Ser Gly Val Val Ser
1 5 10 15
Ala Ala Arg Asp Arg Arg Ile Pro Ser Thr Thr Ser His Ala Ser Ala
20 25 30
Phe Tyr Gln Gly Lys Phe Leu Ser Thr Arg Ser Leu Pro Arg Phe Ser
35 40 45
Asp Arg Asp His Arg Arg Leu Thr Ala Val His Ala Val Ala Ala Asp
50 55 60
Met Thr Asn Ser Ala Pro Ile Arg Asp Val Ile Tyr Thr Val Ala Asp
65 70 75 80
Phe Met Thr Lys Lys Glu Lys Leu Leu Val Val Glu Thr Thr Thr Thr
85 90 95
Val Asp Gln Ala Leu Glu Ile Leu Ala Asp Lys Arg Ile Thr Gly Phe
100 105 110
Pro Val Val Asp Ala Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr
115 120 125
Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly Val Asn His Cys Asp Thr
130 135 140
Ser Leu Phe Pro Asp Val Asp Ser Ser Trp Thr Thr Phe Asn Glu Ile
145 150 155 160
Gln Lys Leu Leu Gly Lys Thr Asp Gly Lys Val Val Gly Asp Leu Met
165 170 175
Thr Pro Thr Pro Leu Val Val His Asp Thr Thr Asn Leu Glu Glu Ala
180 185 190
Val Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg Leu Pro Val Val Asp
195 200 205
Asp Asn Gly Lys Leu Val Gly Leu Ile Thr Arg Gly Asp Val Val Arg
210 215 220
Ala Ala Leu Lys Ile Lys Asp Asp Ile Lys Lys Met Gln Ser Glu
225 230 235
<210> 187
<211> 678
<212> DNA
<213> Trifolium pratense
<400> 187
atggactcgg tcactctccc tttctctgca ctctcttccg ccactcaccg tccaattttc 60
attccacgcg ccactgtcgg tttccgctgc ttccacagct ccgttcatct tccaactact 120
cttcgtggtt cccctctttt cgccgccaat acactcaccg ctaattccgt gccgccaaaa 180
aatggagtgt acactgtcgg tgactttatg acaaagaaag atgagttaca agtagtgaag 240
cccacaacaa ctgtggatga agctttggaa tctcttgttg aacacagaat aaccggtttt 300
ccggtgattg atgataactg gaagctagtt ggcgttgttt cagattacga cttattagca 360
ctggactcta tttcaggtca tgggcgaaca gataacagca tgtttccaga agttgacagt 420
acttggaaga ctttcaacga ggttcaaaga ctactgagca agaccaacgg gaaggtgatt 480
ggtgaattaa tgaccgctgc ccctatggtc gttcgcgaga ccaccaatct cgaggatgct 540
gctagattgt tgctggaaac aaaatttcga cgacttccag ttgtagatgc cgagggtaga 600
ttggttggga ttatcacaag aggaaatgtt gtaagagctg cacttcaaat gaaacgagac 660
aacgaaaaga aagcatga 678
<210> 188
<211> 225
<212> PRT
<213> Trifolium pratense
<400> 188
Met Asp Ser Val Thr Leu Pro Phe Ser Ala Leu Ser Ser Ala Thr His
1 5 10 15
Arg Pro Ile Phe Ile Pro Arg Ala Thr Val Gly Phe Arg Cys Phe His
20 25 30
Ser Ser Val His Leu Pro Thr Thr Leu Arg Gly Ser Pro Leu Phe Ala
35 40 45
Ala Asn Thr Leu Thr Ala Asn Ser Val Pro Pro Lys Asn Gly Val Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Lys Lys Asp Glu Leu Gln Val Val Lys
65 70 75 80
Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Ser Leu Val Glu His Arg
85 90 95
Ile Thr Gly Phe Pro Val Ile Asp Asp Asn Trp Lys Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile Ser Gly His Gly
115 120 125
Arg Thr Asp Asn Ser Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr
130 135 140
Phe Asn Glu Val Gln Arg Leu Leu Ser Lys Thr Asn Gly Lys Val Ile
145 150 155 160
Gly Glu Leu Met Thr Ala Ala Pro Met Val Val Arg Glu Thr Thr Asn
165 170 175
Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg Leu
180 185 190
Pro Val Val Asp Ala Glu Gly Arg Leu Val Gly Ile Ile Thr Arg Gly
195 200 205
Asn Val Val Arg Ala Ala Leu Gln Met Lys Arg Asp Asn Glu Lys Lys
210 215 220
Ala
225
<210> 189
<211> 684
<212> DNA
<213> Zea mays
<400> 189
atggacatta ggctgctggt atccgccgac gccaacctcg ccgccgctct gtcgcgctcc 60
cgctcttcca agtccgcgtt ccagcgccag gttgtcccga gcagccgggc gtcgtcgtgc 120
aggtccgtcc gcgcgcgctc cgccgcagcc gccgcgccgg ctgcgggagg catctccggg 180
catagcaatt acacggttgg tgacttcatg acaagaaggg acaatctcca tgttgtccaa 240
cctactacac cagttgacca agccctggag ctgctggtgc aacacaggat ctctggcttc 300
cctgtggttg acgatgactg gaacttggtt ggggttgtat cagattatga tctcctagct 360
ttggattcga tgtcaggaaa tgaattggcc gatacaagta caaacatgtt tcctgatgtg 420
gatagcacat ggaagacatt ccccgagcta cagaggatat taagcaaaac taatgggaag 480
gtcattggtg atgtaatgcc ctcttcccct ttagcggtgg gtataaatac taatcttgat 540
gctgctacaa ggttgctact tgaaactaaa taccggagac tacctgtagt tgatagcatg 600
gggaaattag ttgggatgat tacaagggga aatgtcgtca gtgctgccct caaaataaag 660
aagaaaactg aagaaggtgc ttga 684
<210> 190
<211> 227
<212> PRT
<213> Zea mays
<400> 190
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Asn Leu Ala Ala Ala
1 5 10 15
Leu Ser Arg Ser Arg Ser Ser Lys Ser Ala Phe Gln Arg Gln Val Val
20 25 30
Pro Ser Ser Arg Ala Ser Ser Cys Arg Ser Val Arg Ala Arg Ser Ala
35 40 45
Ala Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Arg Arg Asp Asn Leu His Val Val Gln
65 70 75 80
Pro Thr Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His Arg
85 90 95
Ile Ser Gly Phe Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Met Ser Gly Asn Glu
115 120 125
Leu Ala Asp Thr Ser Thr Asn Met Phe Pro Asp Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe Pro Glu Leu Gln Arg Ile Leu Ser Lys Thr Asn Gly Lys
145 150 155 160
Val Ile Gly Asp Val Met Pro Ser Ser Pro Leu Ala Val Gly Ile Asn
165 170 175
Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr Arg
180 185 190
Arg Leu Pro Val Val Asp Ser Met Gly Lys Leu Val Gly Met Ile Thr
195 200 205
Arg Gly Asn Val Val Ser Ala Ala Leu Lys Ile Lys Lys Lys Thr Glu
210 215 220
Glu Gly Ala
225
<210> 191
<211> 699
<212> DNA
<213> Zea mays
<400> 191
atggacgcca cgctcctcct cctccccgcc aactgcacgg ccgccgccag cgggcggatg 60
cggcctcgac tgcctgcagg cccacatgtg gcttcccctg gtccctccgc gcggccaagg 120
acctccatcc gggcctcagc cgtgtccgca gccctcgccg ttcgtggcct cccgcaacac 180
gcttccgtgg ccgggcaaag cactggaagt tatagggttg gtgatgttat gaccaaaagg 240
gaagagctcc atgttgtgaa accaacaact tcagttgatg acgcccttga gatgctggtg 300
aagcatagga tctctggctt tcctgttatt gatgatgact ggaatttggt tggcgttgtg 360
tcagattatg atttattggc actggataca atatcaggag ctggaccggc tgaagcagac 420
atatttcctg aggtggatag cacttggaag acatttcatg agatacagaa gcttttgagc 480
aaaaccaacg ggaaggttat tgctgatgtt atgaccccag cgcctctcgt ggtgcgtgaa 540
acaactaacc ttgaagatgc tgcaaggtta ctccttgtga ctaagtaccg caggcttcca 600
gtggtcgata gctcaggcaa actggttggg atcattacaa gagggaacgt cgtccaagcc 660
gccctcgaaa tcaagaaaaa ggttgaaggg acactctga 699
<210> 192
<211> 232
<212> PRT
<213> Zea mays
<400> 192
Met Asp Ala Thr Leu Leu Leu Leu Pro Ala Asn Cys Thr Ala Ala Ala
1 5 10 15
Ser Gly Arg Met Arg Pro Arg Leu Pro Ala Gly Pro His Val Ala Ser
20 25 30
Pro Gly Pro Ser Ala Arg Pro Arg Thr Ser Ile Arg Ala Ser Ala Val
35 40 45
Ser Ala Ala Leu Ala Val Arg Gly Leu Pro Gln His Ala Ser Val Ala
50 55 60
Gly Gln Ser Thr Gly Ser Tyr Arg Val Gly Asp Val Met Thr Lys Arg
65 70 75 80
Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Asp Ala Leu
85 90 95
Glu Met Leu Val Lys His Arg Ile Ser Gly Phe Pro Val Ile Asp Asp
100 105 110
Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu
115 120 125
Asp Thr Ile Ser Gly Ala Gly Pro Ala Glu Ala Asp Ile Phe Pro Glu
130 135 140
Val Asp Ser Thr Trp Lys Thr Phe His Glu Ile Gln Lys Leu Leu Ser
145 150 155 160
Lys Thr Asn Gly Lys Val Ile Ala Asp Val Met Thr Pro Ala Pro Leu
165 170 175
Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu
180 185 190
Val Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Ser Gly Lys Leu
195 200 205
Val Gly Ile Ile Thr Arg Gly Asn Val Val Gln Ala Ala Leu Glu Ile
210 215 220
Lys Lys Lys Val Glu Gly Thr Leu
225 230
<210> 193
<211> 684
<212> DNA
<213> Zea mays
<400> 193
atggacatta ggctgctggt atccgccgac gccaacctcg ccgccgctct gtcgcgctcc 60
cgctcttcca agtccgcgtt ccagcgccag gttgtcccgg gcagccgggc gtcgtcgtgc 120
aggtccgtcc gcgcgcgctc cgccgcagcc gccgcgccgg ccgcgggagg catctccggg 180
catagcaatt acacggttgg tgacttcatg acaacaaggg acaatctcca tgttgtccaa 240
cctactacac cagttgacca agccctggag ctgctggtgc aacacaggat ctctggcttc 300
cctgtggttg acgatgactg gaacttggtt ggggttgtat cagattatga tctcctagct 360
ttggattcga tgtcaggaaa tgaattggcc gatacaagta caaacatgtt tcctgatgtg 420
gatagcacat ggaagacatt ccacgagcta cagaggatat taagcaaaac taatgggaag 480
gtcattggtg atgtaatgac ctcttcacct ttagcggtgc gtataaatac taatcttgat 540
gctgctacaa ggttgctact tgaaactaaa taccggagac tacctgtagt tgatagcatg 600
gggaaactag ttgggatgat tacaagggga aatgtcgtca gtgctgccct caaaataaag 660
aagaaaactg aagaaggtgc ttga 684
<210> 194
<211> 227
<212> PRT
<213> Zea mays
<400> 194
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Asn Leu Ala Ala Ala
1 5 10 15
Leu Ser Arg Ser Arg Ser Ser Lys Ser Ala Phe Gln Arg Gln Val Val
20 25 30
Pro Gly Ser Arg Ala Ser Ser Cys Arg Ser Val Arg Ala Arg Ser Ala
35 40 45
Ala Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Thr Arg Asp Asn Leu His Val Val Gln
65 70 75 80
Pro Thr Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His Arg
85 90 95
Ile Ser Gly Phe Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Met Ser Gly Asn Glu
115 120 125
Leu Ala Asp Thr Ser Thr Asn Met Phe Pro Asp Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe His Glu Leu Gln Arg Ile Leu Ser Lys Thr Asn Gly Lys
145 150 155 160
Val Ile Gly Asp Val Met Thr Ser Ser Pro Leu Ala Val Arg Ile Asn
165 170 175
Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr Arg
180 185 190
Arg Leu Pro Val Val Asp Ser Met Gly Lys Leu Val Gly Met Ile Thr
195 200 205
Arg Gly Asn Val Val Ser Ala Ala Leu Lys Ile Lys Lys Lys Thr Glu
210 215 220
Glu Gly Ala
225
<210> 195
<211> 591
<212> DNA
<213> Zea mays
<400> 195
atggacatta ggctgctggt atccgccgac gccaacctcg ccgccgctct gtcgcgctcc 60
cgctcttcca agtccgcgtt ccagcgccag gttgtcccga gcagccgggc gtcgtcgtgc 120
aggtccgtcc gcgcgcgctc cgccgcagcc gccgcgccgg ctgcgggagg catctccggg 180
catagcaatt acacggttgg tgacttcatg acaagaaggg acaatctcca tgttgtccaa 240
cctactacac cagttgacca agccctggag ctgctggtgc aacacaggat ctctggcttc 300
cctgtggttg acgatgactg gaacttggtt ggggttgtat cagattatga tctcctagct 360
ttggattcga tgtcaggaaa tgaattggcc gatacaagta caaacatgtt tcctgatgtg 420
gatagcacat ggaagacatt ccacgagcta cagaggatat taagcaaaac taatgggaag 480
gtcattggtg atgtaatgac ctcttcacct ttagcggttg ggatgattac aaggggaaat 540
gtcgtcagtg ctgccctcaa aataaagaag aaaactgaag aaggtgcttg a 591
<210> 196
<211> 196
<212> PRT
<213> Zea mays
<400> 196
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Asn Leu Ala Ala Ala
1 5 10 15
Leu Ser Arg Ser Arg Ser Ser Lys Ser Ala Phe Gln Arg Gln Val Val
20 25 30
Pro Ser Ser Arg Ala Ser Ser Cys Arg Ser Val Arg Ala Arg Ser Ala
35 40 45
Ala Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Arg Arg Asp Asn Leu His Val Val Gln
65 70 75 80
Pro Thr Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His Arg
85 90 95
Ile Ser Gly Phe Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Met Ser Gly Asn Glu
115 120 125
Leu Ala Asp Thr Ser Thr Asn Met Phe Pro Asp Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe His Glu Leu Gln Arg Ile Leu Ser Lys Thr Asn Gly Lys
145 150 155 160
Val Ile Gly Asp Val Met Thr Ser Ser Pro Leu Ala Val Gly Met Ile
165 170 175
Thr Arg Gly Asn Val Val Ser Ala Ala Leu Lys Ile Lys Lys Lys Thr
180 185 190
Glu Glu Gly Ala
195
<210> 197
<211> 684
<212> DNA
<213> Zea mays
<400> 197
atggacatta ggctgctggt atccgccgac gccaacctcg ccgccgctct gtcgcgctcc 60
cgctcttcca agtccgcgtt ccagcgccag gttgtcccga gcagccgggc gtcgtcgtgc 120
aggtccgtcc gcgcgcgctc cgccgcagcc gccgcgccgg ctgcgggagg catctccggg 180
catagcaatt acacggttgg tgacttcatg acaagaaggg acaatctcca tgttgtccaa 240
cctactacac cagttgacca agccctggag ctgctggtgc aacacaggat ctctggcttc 300
cctgtggttg acgatgactg gaacttggtt ggggttgtat cagattatga tctcctagct 360
ttggattcga tgtcaggaaa tgaattggcc gatacaagta caaacatgtt tcctgatgtg 420
gatagcacat ggaagacatt ccacgagcta cagaggatat taagcaaaac taatgggaag 480
gtcattggtg atgtaatgac ctcttcacct ttagcggtgc gtataaatac taatcttgat 540
gctgctacaa ggttgctact tgaaactaaa taccggagac tacctgtagt tgatagcatg 600
gggaaattag ttgggatgat tacaagggga aatgtcgtca gtgctgccct caaaataaag 660
aagaaaactg aagaaggtgc ttga 684
<210> 198
<211> 227
<212> PRT
<213> Zea mays
<400> 198
Met Asp Ile Arg Leu Leu Val Ser Ala Asp Ala Asn Leu Ala Ala Ala
1 5 10 15
Leu Ser Arg Ser Arg Ser Ser Lys Ser Ala Phe Gln Arg Gln Val Val
20 25 30
Pro Ser Ser Arg Ala Ser Ser Cys Arg Ser Val Arg Ala Arg Ser Ala
35 40 45
Ala Ala Ala Ala Pro Ala Ala Gly Gly Ile Ser Gly His Ser Asn Tyr
50 55 60
Thr Val Gly Asp Phe Met Thr Arg Arg Asp Asn Leu His Val Val Gln
65 70 75 80
Pro Thr Thr Pro Val Asp Gln Ala Leu Glu Leu Leu Val Gln His Arg
85 90 95
Ile Ser Gly Phe Pro Val Val Asp Asp Asp Trp Asn Leu Val Gly Val
100 105 110
Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Met Ser Gly Asn Glu
115 120 125
Leu Ala Asp Thr Ser Thr Asn Met Phe Pro Asp Val Asp Ser Thr Trp
130 135 140
Lys Thr Phe His Glu Leu Gln Arg Ile Leu Ser Lys Thr Asn Gly Lys
145 150 155 160
Val Ile Gly Asp Val Met Thr Ser Ser Pro Leu Ala Val Arg Ile Asn
165 170 175
Thr Asn Leu Asp Ala Ala Thr Arg Leu Leu Leu Glu Thr Lys Tyr Arg
180 185 190
Arg Leu Pro Val Val Asp Ser Met Gly Lys Leu Val Gly Met Ile Thr
195 200 205
Arg Gly Asn Val Val Ser Ala Ala Leu Lys Ile Lys Lys Lys Thr Glu
210 215 220
Glu Gly Ala
225
<210> 199
<211> 699
<212> DNA
<213> Zea mays
<400> 199
atggacgcca cgctcctcct cctccccgcc aactgcacgg ccgccgccag cgggcggatg 60
cggcctcgac tgcctgcagg cccacatgtg gcttcccctg gtccctccgc gcggccaagg 120
acctccatcc gggcctcagc cgtgtccgca gccctcgccg ttcgtggcct cccgcaacac 180
gcttccgtgg ccgggcaaag cactggaagt tatagggttg gtgatgttat gaccaaaagg 240
gaagagctcc atgttgtgaa accaacaact tcagttgatg acgcccttga gatgctggtg 300
aagcatagga tctctggctt tcctgttatt gatgatgact ggaatttggt tggcgttgtg 360
tcagattatg atttattggc actggataca atatcaggag ctggaccggc tgaagcagac 420
atatttcctg aggtggatag cacttcgaag acatttcatg agatacagaa gcttttgagc 480
aaaaccaacg ggaaggttat tgctgatgtt atgaccccag cgcctctcgt ggtgcgtgaa 540
acaactaacc ttgaagatgc tgcaaggtta ctccttgtga ctaagtaccg caggcttcca 600
gtggtcgata gctcaggcaa actggttggg atcattacaa gagggaacgt cgtccaagcc 660
gccctcgaaa tcaagaaaaa ggttgaaggg acactctga 699
<210> 200
<211> 232
<212> PRT
<213> Zea mays
<400> 200
Met Asp Ala Thr Leu Leu Leu Leu Pro Ala Asn Cys Thr Ala Ala Ala
1 5 10 15
Ser Gly Arg Met Arg Pro Arg Leu Pro Ala Gly Pro His Val Ala Ser
20 25 30
Pro Gly Pro Ser Ala Arg Pro Arg Thr Ser Ile Arg Ala Ser Ala Val
35 40 45
Ser Ala Ala Leu Ala Val Arg Gly Leu Pro Gln His Ala Ser Val Ala
50 55 60
Gly Gln Ser Thr Gly Ser Tyr Arg Val Gly Asp Val Met Thr Lys Arg
65 70 75 80
Glu Glu Leu His Val Val Lys Pro Thr Thr Ser Val Asp Asp Ala Leu
85 90 95
Glu Met Leu Val Lys His Arg Ile Ser Gly Phe Pro Val Ile Asp Asp
100 105 110
Asp Trp Asn Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu
115 120 125
Asp Thr Ile Ser Gly Ala Gly Pro Ala Glu Ala Asp Ile Phe Pro Glu
130 135 140
Val Asp Ser Thr Ser Lys Thr Phe His Glu Ile Gln Lys Leu Leu Ser
145 150 155 160
Lys Thr Asn Gly Lys Val Ile Ala Asp Val Met Thr Pro Ala Pro Leu
165 170 175
Val Val Arg Glu Thr Thr Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu
180 185 190
Val Thr Lys Tyr Arg Arg Leu Pro Val Val Asp Ser Ser Gly Lys Leu
195 200 205
Val Gly Ile Ile Thr Arg Gly Asn Val Val Gln Ala Ala Leu Glu Ile
210 215 220
Lys Lys Lys Val Glu Gly Thr Leu
225 230
<210> 201
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 201
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 202
<211> 3536
<212> DNA
<213> Artificial sequence
<220>
<223> pGOS2::LEJ1::t-zein sequence
<400> 202
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220
tttgtacaaa aaagcaggct taaacaatgg gttcaatctc tttatccaat tctatgccca 2280
taactcgact tccactactt acatcactct atcatcaaag cttccttccg atttcttctt 2340
catctttctc tcttcttcct ctctctaatc gtcgtcgctc ctccactttt tcaccgtcaa 2400
tcaccgtctc tgccttcttc gctgctcctg ccagcgttaa taataataac tctgttccgg 2460
caaaaaatgg aggttacaca gttggggatt tcatgactcc gagacagaat ttgcacgttg 2520
ttaagccctc tacgtcggtc gatgatgcgt tggaacttct ggttgagaag aaagtcacgg 2580
gattgcctgt aattgacgat aattggacac tggttggtgt tgtttctgat tacgatttgc 2640
ttgcattgga ctccatctct ggtcgcagtc aaaatgatac aaacttgttc cctgatgtcg 2700
acagtacctg gaaaacgttt aacgaactac agaaactgat cagtaagaca tatggaaaag 2760
ttgttggaga cttgatgaca ccgtctcctc tcgttgtccg tgattctacc aatttagaag 2820
atgcagccag gttgcttctg gaaacaaagt tccgaagatt acccgttgtt gatgctgatg 2880
gaaaactgat tgggatcctt acaaggggaa acgttgtaag ggctgcgctg cagatcaaac 2940
gggaaaccga gaactctaca tagctaggaa gcagcagtga tggagcagat ctgaataccc 3000
agctttcttg tacaaagtgg tgatatcaca agcccgggcg gtcttctagg gataacaggg 3060
taattatatc cctctagatc acaagcccgg gcggtcttct acgatgattg agtaataatg 3120
tgtcacgcat caccatgggt ggcagtgtca gtgtgagcaa tgacctgaat gaacaattga 3180
aatgaaaaga aaaaaagtac tccatctgtt ccaaattaaa attcatttta accttttaat 3240
aggtttatac aataattgat atatgttttc tgtatatgtc taatttgtta tcatccgggc 3300
ggtcttctag ggataacagg gtaattatat ccctctagac aacacacaac aaataagaga 3360
aaaaacaaat aatattaatt tgagaatgaa caaaaggacc atatcattca ttaactcttc 3420
tccatccatt tccatttcac agttcgatag cgaaaaccga ataaaaaaca cagtaaatta 3480
caagcacaac aaatggtaca agaaaaacag ttttcccaat gccataatac tcgaac 3536
<210> 203
<211> 56
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14149
<400> 203
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggg ttcaatctct ttatcc 56
<210> 204
<211> 50
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14150
<400> 204
ggggaccact ttgtacaaga aagctgggta ttcagatctg ctccatcact 50
<210> 205
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 1
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (8)..(8)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (11)..(11)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (15)..(15)
<223> / replace = "Leu" / replace = "Ile"
<220>
<221> VARIANT
<222> (19)..(19)
<223> / replace = "Lys" / replace = "Asn"
<220>
<221> VARIANT
<222> (20)..(20)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (21)..(21)
<223> / replace = "Val"
<220>
<221> VARIANT
<222> (24)..(24)
<223> / replace = "Leu"
<220>
<221> VARIANT
<222> (27)..(27)
<223> / replace = "Val"
<220>
<221> VARIANT
<222> (30)..(30)
<223> / replace = "Asn"
<220>
<221> VARIANT
<222> (32)..(32)
<223> / replace = "Thr" / replace = "Asn"
<220>
<221> VARIANT
<222> (36)..(36)
<223> / replace = "Leu"
<400> 205
His Val Val Lys Pro Thr Thr Thr Val Asp Glu Ala Leu Glu Ala Leu
1 5 10 15
Val Glu His Lys Ile Thr Gly Phe Pro Val Ile Asp Asp Asp Trp Lys
20 25 30
Leu Val Gly Val Val Ser Asp Tyr Asp Leu Leu Ala Leu Asp Ser Ile
35 40 45
Ser Gly
50
<210> 206
<211> 41
<212> PRT
<213> Artificial sequence
<220>
<223> motif 2
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Leu"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (17)..(17)
<223> / replace = "Ile" / replace = "Leu"
<220>
<221> VARIANT
<222> (21)..(21)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (25)..(25)
<223> / replace = "Tyr"
<220>
<221> VARIANT
<222> (29)..(29)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (32)..(32)
<223> / replace = "Val"
<220>
<221> VARIANT
<222> (36)..(36)
<223> / replace = "Ser"
<400> 206
Thr Asn Met Phe Pro Glu Val Asp Ser Thr Trp Lys Thr Phe Asn Glu
1 5 10 15
Val Gln Lys Leu Leu Ser Lys Thr Asn Gly Lys Val Val Gly Asp Leu
20 25 30
Met Thr Pro Ala Pro Leu Val Val Arg
35 40
<210> 207
<211> 35
<212> PRT
<213> Artificial sequence
<220>
<223> motif 3
<220>
<221> VARIANT
<222> (14)..(14)
<223> / replace = "Phe"
<220>
<221> VARIANT
<222> (22)..(22)
<223> / replace = "Ala"
<220>
<221> VARIANT
<222> (23)..(23)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (27)..(27)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (30)..(30)
<223> / replace = "Leu"
<400> 207
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Tyr Arg Arg
1 5 10 15
Leu Pro Val Val Asp Ser Asp Gly Lys Leu Val Gly Ile Ile Thr Arg
20 25 30
Gly Asn Val
35
<210> 208
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 4
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Gly"
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (5)..(5)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (15)..(15)
<223> / replace = "Pro"
<220>
<221> VARIANT
<222> (16)..(16)
<223> / replace = "Lys"
<220>
<221> VARIANT
<222> (18)..(18)
<223> / replace = "Asn"
<220>
<221> VARIANT
<222> (49)..(49)
<223> / replace = "Asn"
<400> 208
Pro Ala Lys Asn Gly Gly Tyr Thr Val Gly Asp Phe Met Thr Gly Arg
1 5 10 15
Gln His Leu His Val Val Lys Pro Ser Thr Ser Val Asp Asp Ala Leu
20 25 30
Glu Leu Leu Val Glu Lys Lys Val Thr Gly Leu Pro Val Ile Asp Asp
35 40 45
Asp Trp
50
<210> 209
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 5
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (9)..(9)
<223> / replace = "Met"
<220>
<221> VARIANT
<222> (12)..(12)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (16)..(16)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (31)..(31)
<223> / replace = "Tyr"
<220>
<221> VARIANT
<222> (33)..(33)
<223> / replace = "Gln"
<220>
<221> VARIANT
<222> (48)..(48)
<223> / replace = "Asp"
<400> 209
Gly Arg Ser Gln Asn Asp Thr Asn Leu Phe Pro Asn Val Asp Ser Thr
1 5 10 15
Trp Lys Thr Phe Asn Glu Leu Gln Lys Leu Ile Ser Lys Thr His Gly
20 25 30
Lys Val Val Gly Asp Leu Met Thr Pro Ser Pro Leu Val Val Arg Gly
35 40 45
Ser Thr
50
<210> 210
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 6
<220>
<221> VARIANT
<222> (22)..(22)
<223> / replace = "Ala"
<220>
<221> VARIANT
<222> (48)..(48)
<223> / replace = "Lys"
<220>
<221> VARIANT
<222> (50)..(50)
<223> / replace = "Ala"
<400> 210
Asn Leu Glu Asp Ala Ala Arg Leu Leu Leu Glu Thr Lys Phe Arg Arg
1 5 10 15
Leu Pro Val Val Asp Ser Asp Gly Lys Leu Ile Gly Ile Leu Thr Arg
20 25 30
Gly Asn Val Val Arg Ala Ala Leu Gln Ile Lys Arg Glu Thr Glu Asn
35 40 45
Ser Thr
50
<210> 211
<211> 633
<212> DNA
<213> Synechocystis sp.
<400> 211
atggccgggg gcatagtggc ggtgcccctc ctcggttttt ccctgttagc tgtggccctg 60
attatcgagc gtgcctattt ttggagtcag atccagttac ggcaaaatcg gttggtaaat 120
gatgtgctca agctttatcg cagtaatccc ccaggggcga tcgccaagct gaaacaaaat 180
gcggatttac ccatggcacg aatttttctc gaagccctgt gtttggaggg ggccacacca 240
acggagtttc gcctggccct ggaaagcgct acccaagcag aattaccgct tttaaaacga 300
tttaacaccc tatttcagac cattatcacc gtttcccctc tcctgggctt actggggaca 360
attttgggac taatgcgttc cttttcttcc atgagtttag gcagtaccac cgccgccaat 420
gcctcggggg tcaccggggg gatcagtgaa gcattggtgt ccaccgtgat gggcttggta 480
gttgccattg ccactctcct ctttgccaac gtgttccgtt ccctctatct gcgccaattc 540
gccctcatac aggagcaaac ggggcaaatc gaattggtat atcgccgttt ccatgaccaa 600
ccggaggaaa aagagtatgc gacttcccga tga 633
<210> 212
<211> 210
<212> PRT
<213> Synechocystis sp.
<400> 212
Met Ala Gly Gly Ile Val Ala Val Pro Leu Leu Gly Phe Ser Leu Leu
1 5 10 15
Ala Val Ala Leu Ile Ile Glu Arg Ala Tyr Phe Trp Ser Gln Ile Gln
20 25 30
Leu Arg Gln Asn Arg Leu Val Asn Asp Val Leu Lys Leu Tyr Arg Ser
35 40 45
Asn Pro Pro Gly Ala Ile Ala Lys Leu Lys Gln Asn Ala Asp Leu Pro
50 55 60
Met Ala Arg Ile Phe Leu Glu Ala Leu Cys Leu Glu Gly Ala Thr Pro
65 70 75 80
Thr Glu Phe Arg Leu Ala Leu Glu Ser Ala Thr Gln Ala Glu Leu Pro
85 90 95
Leu Leu Lys Arg Phe Asn Thr Leu Phe Gln Thr Ile Ile Thr Val Ser
100 105 110
Pro Leu Leu Gly Leu Leu Gly Thr Ile Leu Gly Leu Met Arg Ser Phe
115 120 125
Ser Ser Met Ser Leu Gly Ser Thr Thr Ala Ala Asn Ala Ser Gly Val
130 135 140
Thr Gly Gly Ile Ser Glu Ala Leu Val Ser Thr Val Met Gly Leu Val
145 150 155 160
Val Ala Ile Ala Thr Leu Leu Phe Ala Asn Val Phe Arg Ser Leu Tyr
165 170 175
Leu Arg Gln Phe Ala Leu Ile Gln Glu Gln Thr Gly Gln Ile Glu Leu
180 185 190
Val Tyr Arg Arg Phe His Asp Gln Pro Glu Glu Lys Glu Tyr Ala Thr
195 200 205
Ser Arg
210
<210> 213
<211> 708
<212> DNA
<213> Acaryochloris marina
<400> 213
gtgtccacaa tctatacttt cctggccaag ggtggcccag tcatgattcc cattgcggga 60
ttatctgtac tgactttagc gtgtgccttc gaacgaacca ttttctggat ccgtttgatc 120
agtcaagaac atcgtattgt tcatgatgtc ttggatgcag ctcgctgcag cttagaggaa 180
gcggaagcca ttgctcagca tgctcggttt ttgcccattg gccgattcct gttagcaccg 240
ctgcgcttgc atcaaccctc gccagagacc ttccgcttag ccctggaagc ggcggcagat 300
aaagaatttg tcagaatgcg caagggcgat aagctactgg aaacaactgt ggcggttgcc 360
cccctgatgg gtcttttggg aacagtaact ggcctgatca atacttttaa taatctcaac 420
attggcagtg ggggcacctc tgaacaggca accaaagcgg ctgcagggat tggtgaagcc 480
ctcttaacca cagcagcggg gatggtcgtt gccattttgg ccctgattgt tctacgcatt 540
tttgtgattt tgcaggcccg ccaagtcgat acattctccg aagtgggaag cgaaatggaa 600
ttgatttatc gacaggtctg gtacgaaccc aaccaggtca accgtcctgc ctatttgcca 660
aaaggcagtt cagttgaacc tacccaggtt actttagaaa ctctgtaa 708
<210> 214
<211> 235
<212> PRT
<213> Acaryochloris marina
<400> 214
Val Ser Thr Ile Tyr Thr Phe Leu Ala Lys Gly Gly Pro Val Met Ile
1 5 10 15
Pro Ile Ala Gly Leu Ser Val Leu Thr Leu Ala Cys Ala Phe Glu Arg
20 25 30
Thr Ile Phe Trp Ile Arg Leu Ile Ser Gln Glu His Arg Ile Val His
35 40 45
Asp Val Leu Asp Ala Ala Arg Cys Ser Leu Glu Glu Ala Glu Ala Ile
50 55 60
Ala Gln His Ala Arg Phe Leu Pro Ile Gly Arg Phe Leu Leu Ala Pro
65 70 75 80
Leu Arg Leu His Gln Pro Ser Pro Glu Thr Phe Arg Leu Ala Leu Glu
85 90 95
Ala Ala Ala Asp Lys Glu Phe Val Arg Met Arg Lys Gly Asp Lys Leu
100 105 110
Leu Glu Thr Thr Val Ala Val Ala Pro Leu Met Gly Leu Leu Gly Thr
115 120 125
Val Thr Gly Leu Ile Asn Thr Phe Asn Asn Leu Asn Ile Gly Ser Gly
130 135 140
Gly Thr Ser Glu Gln Ala Thr Lys Ala Ala Ala Gly Ile Gly Glu Ala
145 150 155 160
Leu Leu Thr Thr Ala Ala Gly Met Val Val Ala Ile Leu Ala Leu Ile
165 170 175
Val Leu Arg Ile Phe Val Ile Leu Gln Ala Arg Gln Val Asp Thr Phe
180 185 190
Ser Glu Val Gly Ser Glu Met Glu Leu Ile Tyr Arg Gln Val Trp Tyr
195 200 205
Glu Pro Asn Gln Val Asn Arg Pro Ala Tyr Leu Pro Lys Gly Ser Ser
210 215 220
Val Glu Pro Thr Gln Val Thr Leu Glu Thr Leu
225 230 235
<210> 215
<211> 669
<212> DNA
<213> Acaryochloris marina
<400> 215
gtgaatatta tcgagctatt tgagaaggga gggcccacaa tatggccatt actcggactc 60
tccattttag cgattggaac tgtttttgag cggttatggt tctggagcaa tcttctcaaa 120
ggagaacgaa aaacagcgaa gcaaattctg gatgctgccc gccgagattg ggatgaagcg 180
actcacctgg ctcgacaatt tagcaatcaa cccatcggtc gatttctgtt tactccttta 240
cggttagcga atcaagaacc ggaaattttt cgattagctc tagaagcctc tgcggatgaa 300
gagctgacgg ctatgcgaaa gggaagcaaa gtcctagaag ctgtgattgc tttatctcca 360
ttactgggac tatttggtac tattttaggc ttgcaaaatt ccctaggtaa attaaatttt 420
gaggaatttg gtcaaattgt tggtaatcca gctttaggaa ttgaccaggc tttaaccagt 480
acattggtag gattggccat tgcgattgtt tccctgacct tttatcggct gtttcaagga 540
ttggtcttta atcaggcgcg tatatttcga cggacgggga atgaactaga gctggtctat 600
cgacagtttt ggctgcagcc ctccgaaaca cggcctgccc tgccccctca aaacgattct 660
caagaataa 669
<210> 216
<211> 222
<212> PRT
<213> Acaryochloris marina
<400> 216
Val Asn Ile Ile Glu Leu Phe Glu Lys Gly Gly Pro Thr Ile Trp Pro
1 5 10 15
Leu Leu Gly Leu Ser Ile Leu Ala Ile Gly Thr Val Phe Glu Arg Leu
20 25 30
Trp Phe Trp Ser Asn Leu Leu Lys Gly Glu Arg Lys Thr Ala Lys Gln
35 40 45
Ile Leu Asp Ala Ala Arg Arg Asp Trp Asp Glu Ala Thr His Leu Ala
50 55 60
Arg Gln Phe Ser Asn Gln Pro Ile Gly Arg Phe Leu Phe Thr Pro Leu
65 70 75 80
Arg Leu Ala Asn Gln Glu Pro Glu Ile Phe Arg Leu Ala Leu Glu Ala
85 90 95
Ser Ala Asp Glu Glu Leu Thr Ala Met Arg Lys Gly Ser Lys Val Leu
100 105 110
Glu Ala Val Ile Ala Leu Ser Pro Leu Leu Gly Leu Phe Gly Thr Ile
115 120 125
Leu Gly Leu Gln Asn Ser Leu Gly Lys Leu Asn Phe Glu Glu Phe Gly
130 135 140
Gln Ile Val Gly Asn Pro Ala Leu Gly Ile Asp Gln Ala Leu Thr Ser
145 150 155 160
Thr Leu Val Gly Leu Ala Ile Ala Ile Val Ser Leu Thr Phe Tyr Arg
165 170 175
Leu Phe Gln Gly Leu Val Phe Asn Gln Ala Arg Ile Phe Arg Arg Thr
180 185 190
Gly Asn Glu Leu Glu Leu Val Tyr Arg Gln Phe Trp Leu Gln Pro Ser
195 200 205
Glu Thr Arg Pro Ala Leu Pro Pro Gln Asn Asp Ser Gln Glu
210 215 220
<210> 217
<211> 654
<212> DNA
<213> Acaryochloris marina
<400> 217
atgcagtttg gccaagtgat tattgcggga ggagtggtga tgctcccgct catggttttt 60
tcgttaattg cgatcgcact gatttttgaa cgcctcatct tttggacgag ggtgaatcgc 120
aaccagttgc ggatcgtcaa acaggcactg cagctttatc gccaagataa tgtctatgac 180
gccttgaggt atctccaaga gcaagcaaga tttccgattg cccggatatt cttagctgcc 240
ttgtccttag aagacccgac accggaagaa ttccgattgg cattagaaag tgaagctcaa 300
gctgaattgc cgacattgaa acgatttacg acggtgtttg acaccatcat tagtatttcc 360
cctttactcg gcctattagg gacggtattg ggcctgatca actccttctc ctccctagat 420
gtaggcaata tcggcggtag tgaatcagca gaagtcaccg ggggaataag taccgcccta 480
atttcaacgg ctgcgggatt gattgtcgcc atttcaaccc tgatttttgc caatatgttt 540
cgcagtttat atcagcgcca gttggccttt attcaagagc atggggggca gttggagttg 600
ctttatcgtc accgctatga aagaggcagg gtgaatcatg cgcttacccg atga 654
<210> 218
<211> 217
<212> PRT
<213> Acaryochloris marina
<400> 218
Met Gln Phe Gly Gln Val Ile Ile Ala Gly Gly Val Val Met Leu Pro
1 5 10 15
Leu Met Val Phe Ser Leu Ile Ala Ile Ala Leu Ile Phe Glu Arg Leu
20 25 30
Ile Phe Trp Thr Arg Val Asn Arg Asn Gln Leu Arg Ile Val Lys Gln
35 40 45
Ala Leu Gln Leu Tyr Arg Gln Asp Asn Val Tyr Asp Ala Leu Arg Tyr
50 55 60
Leu Gln Glu Gln Ala Arg Phe Pro Ile Ala Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Ser Leu Glu Asp Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Leu Pro Thr Leu Lys Arg Phe Thr Thr Val
100 105 110
Phe Asp Thr Ile Ile Ser Ile Ser Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Asn Ser Phe Ser Ser Leu Asp Val Gly Asn Ile
130 135 140
Gly Gly Ser Glu Ser Ala Glu Val Thr Gly Gly Ile Ser Thr Ala Leu
145 150 155 160
Ile Ser Thr Ala Ala Gly Leu Ile Val Ala Ile Ser Thr Leu Ile Phe
165 170 175
Ala Asn Met Phe Arg Ser Leu Tyr Gln Arg Gln Leu Ala Phe Ile Gln
180 185 190
Glu His Gly Gly Gln Leu Glu Leu Leu Tyr Arg His Arg Tyr Glu Arg
195 200 205
Gly Arg Val Asn His Ala Leu Thr Arg
210 215
<210> 219
<211> 642
<212> DNA
<213> Anabaena variabilis
<400> 219
atgggaattt tgaatctatt tacagccggt ggcgtggtta tgtggcctct gctggcgttc 60
tctttattag cagtagcgct aatcatcgaa cgtatcagct tttgggtaag aatttcgggc 120
aagcaaaacc gtatagtacg ggaagttctt agactttacc agctagataa tgtggttagc 180
accttggaag cattaaggca aaatgtcgat ttgcccatcg cgcgaatctt tctcgctgct 240
ttagaattgg aggagccgac accagaggaa tttcgattag ctttagaaag tgaagcccaa 300
gctgagatac ctgtactcaa acgctttcaa aatatttttg ataccataat tggtctcgcg 360
cccttattag ggttacttgg tactgttttg ggattaatta attcctttgc atctttaaac 420
atcggtgatg tgggaggaac aaaaacggct ggtgtgacgg ctggtattag tgaagcctta 480
gtttctactg catctggctt agttgttgct atctttaccc tgttttttgc taatagtttc 540
cgggggttat atcagcgtca aatagcttgg attcaggagt atggaggaca gttagaatta 600
ctctaccgtc gtcgttacga gaggagaggc aagcagagtt ga 642
<210> 220
<211> 213
<212> PRT
<213> Anabaena variabilis
<400> 220
Met Gly Ile Leu Asn Leu Phe Thr Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Ala Phe Ser Leu Leu Ala Val Ala Leu Ile Ile Glu Arg Ile
20 25 30
Ser Phe Trp Val Arg Ile Ser Gly Lys Gln Asn Arg Ile Val Arg Glu
35 40 45
Val Leu Arg Leu Tyr Gln Leu Asp Asn Val Val Ser Thr Leu Glu Ala
50 55 60
Leu Arg Gln Asn Val Asp Leu Pro Ile Ala Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Ile Pro Val Leu Lys Arg Phe Gln Asn Ile
100 105 110
Phe Asp Thr Ile Ile Gly Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Asn Ser Phe Ala Ser Leu Asn Ile Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Ala Gly Val Thr Ala Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ser Gly Leu Val Val Ala Ile Phe Thr Leu Phe Phe
165 170 175
Ala Asn Ser Phe Arg Gly Leu Tyr Gln Arg Gln Ile Ala Trp Ile Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Arg Gly Lys Gln Ser
210
<210> 221
<211> 720
<212> DNA
<213> Anabaena variabilis
<400> 221
gtggatatta tagatttgtt ttacaagggt gggccggcaa tgtggccttt gctagctctg 60
tcgatattat ccttgagtgt aatttttgag cgcctttggt tctggttgcg acttttctca 120
caagaaaaag cgatcgttga ccgagttcta gatgcagctc atgataactg ggaaatagcg 180
gcggatattg ccagacaggc tacagaccaa ccaattggcc gatttctcta tgctccctta 240
catttacaaa aaactgacgc agaaactttt cgattagcac tggagtccac agcagaggac 300
gaattagccg gaatgcgtcg gggcgaaaag ttattagaag ctgttattgc cctcgctccc 360
ctactcggat tgttgggtac agttttaggt ttaatccagt ctttacgctc aattcgcatt 420
ggtgatttgg gaactgaatc ggcggctgga gtaacaacgg gtattggtga atccttaatt 480
agtacggcag cagggctaat agttgccatt gttagtttgg tattttaccg actatttcaa 540
agttttgtgg tcaatcaact aaaagttttc cgtaaagccg ggaatgaaat ggaattgtta 600
tatcgccagt ctccacctga tttgagcaac cccagaccag caattgtccg tgatgcttta 660
cctagcaaaa ctggtagggg taagttttca caaccacctg aaccaccaaa tttaccttag 720
<210> 222
<211> 239
<212> PRT
<213> Anabaena variabilis
<400> 222
Val Asp Ile Ile Asp Leu Phe Tyr Lys Gly Gly Pro Ala Met Trp Pro
1 5 10 15
Leu Leu Ala Leu Ser Ile Leu Ser Leu Ser Val Ile Phe Glu Arg Leu
20 25 30
Trp Phe Trp Leu Arg Leu Phe Ser Gln Glu Lys Ala Ile Val Asp Arg
35 40 45
Val Leu Asp Ala Ala His Asp Asn Trp Glu Ile Ala Ala Asp Ile Ala
50 55 60
Arg Gln Ala Thr Asp Gln Pro Ile Gly Arg Phe Leu Tyr Ala Pro Leu
65 70 75 80
His Leu Gln Lys Thr Asp Ala Glu Thr Phe Arg Leu Ala Leu Glu Ser
85 90 95
Thr Ala Glu Asp Glu Leu Ala Gly Met Arg Arg Gly Glu Lys Leu Leu
100 105 110
Glu Ala Val Ile Ala Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gln Ser Leu Arg Ser Ile Arg Ile Gly Asp Leu Gly
130 135 140
Thr Glu Ser Ala Ala Gly Val Thr Thr Gly Ile Gly Glu Ser Leu Ile
145 150 155 160
Ser Thr Ala Ala Gly Leu Ile Val Ala Ile Val Ser Leu Val Phe Tyr
165 170 175
Arg Leu Phe Gln Ser Phe Val Val Asn Gln Leu Lys Val Phe Arg Lys
180 185 190
Ala Gly Asn Glu Met Glu Leu Leu Tyr Arg Gln Ser Pro Pro Asp Leu
195 200 205
Ser Asn Pro Arg Pro Ala Ile Val Arg Asp Ala Leu Pro Ser Lys Thr
210 215 220
Gly Arg Gly Lys Phe Ser Gln Pro Pro Glu Pro Pro Asn Leu Pro
225 230 235
<210> 223
<211> 654
<212> DNA
<213> Anabaena variabilis
<400> 223
atgggaatcc aaaatctttt tgcagcaggc ggcgtagtca tgtggcctct gttaggtttt 60
tctgtgttgg gagtagcatt gattgttgag cgtgccagat tttggctaaa aatcaacaat 120
cgccaacagc gcgtagttag agatgtgttg aacctctatc ggctagataa tgtagttggc 180
gcaatagata aactcagaaa aaatgtagat ttaccactgg cgcgtgtctt tttatcggct 240
ttggaattag aagaaccaac accggaggaa tttcgcctgg cgctagaaag cgaagctcaa 300
gccgaaatcc ccgtactcaa gcgatttcaa aatattttcg acacaattat cggtttagca 360
ccgctcttag gtttgctggg tacagtgtta ggtttgatta cttccttcgc ttctttagat 420
attggtgatg tgggagggac aaaaaccgca ggtgtgacgg cgggtattag tgaagcttta 480
gtatctacag cagcaggatt ggtagtggca atattcacac tgttttttgc caactccttt 540
cggggacttt acaccagaca gatggcacta tttcaggagt atggcggtca attagaatta 600
ctttaccgcc gccgctacga aagaggagag aggacttatg cgtctacaag atga 654
<210> 224
<211> 217
<212> PRT
<213> Anabaena variabilis
<400> 224
Met Gly Ile Gln Asn Leu Phe Ala Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Gly Phe Ser Val Leu Gly Val Ala Leu Ile Val Glu Arg Ala
20 25 30
Arg Phe Trp Leu Lys Ile Asn Asn Arg Gln Gln Arg Val Val Arg Asp
35 40 45
Val Leu Asn Leu Tyr Arg Leu Asp Asn Val Val Gly Ala Ile Asp Lys
50 55 60
Leu Arg Lys Asn Val Asp Leu Pro Leu Ala Arg Val Phe Leu Ser Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Ile Pro Val Leu Lys Arg Phe Gln Asn Ile
100 105 110
Phe Asp Thr Ile Ile Gly Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Thr Ser Phe Ala Ser Leu Asp Ile Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Ala Gly Val Thr Ala Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ala Gly Leu Val Val Ala Ile Phe Thr Leu Phe Phe
165 170 175
Ala Asn Ser Phe Arg Gly Leu Tyr Thr Arg Gln Met Ala Leu Phe Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Gly Glu Arg Thr Tyr Ala Ser Thr Arg
210 215
<210> 225
<211> 744
<212> DNA
<213> Chlorobaculum tepidum
<400> 225
atgaagcagg gattttttac ggcgatactg attgtggtga cctacgcggt atcccttggt 60
ttttatgtct ggatgggcac aacaccaccg gagtccatgt tccatgccgt ctggaaaggc 120
gggccgatcg tgtcggtgct gatggcgctg attctgatgg tgatcgccta catcgtcgag 180
cggatcgtcg cgctaaacaa agcttccggc aaaggctcca tcacggagtt cgtacaaagc 240
ctcaagcagg atgtcgattc gggctccatc gaccaggcca tctcccgctg tgacgaccac 300
cagagctccc tctccgccgt gctccgcgcc gtgctcgacc gctacaagat gctcgccgta 360
cacaacgtga ccgaccgtga gaagcgcatc agcgagatgc agaaagctgt cgaggaggcg 420
accctcatgg agatgccgct gctcgaaaag aacctcgtcg ccatctcgac catcgcctcg 480
atctccacga tggtcggcct gctcggtacc acgctcggca tgatccgcgc cttctcggcg 540
atggccacca gcggcgcgcc cgacgcggtg cagctctcgc tcggcatctc cgaggcgctc 600
ttcaacacgg cgctcggcat tctcggcggt atcatgggca tcgtcaccta caacgtcttt 660
accagccggg ttgaccgctt cagctaccag atcgacgagg cggcgttcta cattatccag 720
acccttggca gcagtaaatc ctga 744
<210> 226
<211> 247
<212> PRT
<213> Chlorobaculum tepidum
<400> 226
Met Lys Gln Gly Phe Phe Thr Ala Ile Leu Ile Val Val Thr Tyr Ala
1 5 10 15
Val Ser Leu Gly Phe Tyr Val Trp Met Gly Thr Thr Pro Pro Glu Ser
20 25 30
Met Phe His Ala Val Trp Lys Gly Gly Pro Ile Val Ser Val Leu Met
35 40 45
Ala Leu Ile Leu Met Val Ile Ala Tyr Ile Val Glu Arg Ile Val Ala
50 55 60
Leu Asn Lys Ala Ser Gly Lys Gly Ser Ile Thr Glu Phe Val Gln Ser
65 70 75 80
Leu Lys Gln Asp Val Asp Ser Gly Ser Ile Asp Gln Ala Ile Ser Arg
85 90 95
Cys Asp Asp His Gln Ser Ser Leu Ser Ala Val Leu Arg Ala Val Leu
100 105 110
Asp Arg Tyr Lys Met Leu Ala Val His Asn Val Thr Asp Arg Glu Lys
115 120 125
Arg Ile Ser Glu Met Gln Lys Ala Val Glu Glu Ala Thr Leu Met Glu
130 135 140
Met Pro Leu Leu Glu Lys Asn Leu Val Ala Ile Ser Thr Ile Ala Ser
145 150 155 160
Ile Ser Thr Met Val Gly Leu Leu Gly Thr Thr Leu Gly Met Ile Arg
165 170 175
Ala Phe Ser Ala Met Ala Thr Ser Gly Ala Pro Asp Ala Val Gln Leu
180 185 190
Ser Leu Gly Ile Ser Glu Ala Leu Phe Asn Thr Ala Leu Gly Ile Leu
195 200 205
Gly Gly Ile Met Gly Ile Val Thr Tyr Asn Val Phe Thr Ser Arg Val
210 215 220
Asp Arg Phe Ser Tyr Gln Ile Asp Glu Ala Ala Phe Tyr Ile Ile Gln
225 230 235 240
Thr Leu Gly Ser Ser Lys Ser
245
<210> 227
<211> 696
<212> DNA
<213> Cyanobacteria Yellowstone B-Prime
<400> 227
atgatccagg gttggtacta ctccatcccc ctgttgacgt tctcggtctt ctcagtggcc 60
tgttgcattg agcgggtgct gttttggtgg aagatcaccc atcggcagga ggaggtggtg 120
cagcaagccc tgagccagta ccgccgcaac ccacgcgctg cccagtattt gctggagcaa 180
aatgccgatc tgccgattgc ccgcatcttt ttggccgggt tggagctgaa cgaggccagc 240
ccggaagatt ttaagctggc tctggaaacg gccctggcgg cagaagtgcc tctgctgaag 300
cgcttcaaca ctgtcttcga caccgtaatc accgttgccc ccttcttggg cttgttgggc 360
accgtcaccg gcatcatcca gatcctcagc tccattcaac tgggggatat cggcggcacc 420
gatacccagg gggtaggtcg ggggatcgcc gaagccttgt actcgacggc ctttggactg 480
attgtggcta ttcccaccct gttgatttcc aacgtcttcc gctctttgta cctgcggcaa 540
ctctctaaga tccaagagta cggcggcatg ctggagctgc tgcatcggca gcggcaagag 600
atgcaggccc aacagctttc ccagtattcc tacacccaat ctagccccag tggcagctcc 660
acccttcccc cctactcctc gcttgagccc tcctaa 696
<210> 228
<211> 231
<212> PRT
<213> Cyanobacteria Yellowstone B-Prime
<400> 228
Met Ile Gln Gly Trp Tyr Tyr Ser Ile Pro Leu Leu Thr Phe Ser Val
1 5 10 15
Phe Ser Val Ala Cys Cys Ile Glu Arg Val Leu Phe Trp Trp Lys Ile
20 25 30
Thr His Arg Gln Glu Glu Val Val Gln Gln Ala Leu Ser Gln Tyr Arg
35 40 45
Arg Asn Pro Arg Ala Ala Gln Tyr Leu Leu Glu Gln Asn Ala Asp Leu
50 55 60
Pro Ile Ala Arg Ile Phe Leu Ala Gly Leu Glu Leu Asn Glu Ala Ser
65 70 75 80
Pro Glu Asp Phe Lys Leu Ala Leu Glu Thr Ala Leu Ala Ala Glu Val
85 90 95
Pro Leu Leu Lys Arg Phe Asn Thr Val Phe Asp Thr Val Ile Thr Val
100 105 110
Ala Pro Phe Leu Gly Leu Leu Gly Thr Val Thr Gly Ile Ile Gln Ile
115 120 125
Leu Ser Ser Ile Gln Leu Gly Asp Ile Gly Gly Thr Asp Thr Gln Gly
130 135 140
Val Gly Arg Gly Ile Ala Glu Ala Leu Tyr Ser Thr Ala Phe Gly Leu
145 150 155 160
Ile Val Ala Ile Pro Thr Leu Leu Ile Ser Asn Val Phe Arg Ser Leu
165 170 175
Tyr Leu Arg Gln Leu Ser Lys Ile Gln Glu Tyr Gly Gly Met Leu Glu
180 185 190
Leu Leu His Arg Gln Arg Gln Glu Met Gln Ala Gln Gln Leu Ser Gln
195 200 205
Tyr Ser Tyr Thr Gln Ser Ser Pro Ser Gly Ser Ser Thr Leu Pro Pro
210 215 220
Tyr Ser Ser Leu Glu Pro Ser
225 230
<210> 229
<211> 690
<212> DNA
<213> Cyanothece sp.
<400> 229
gtgaatatcc aagaaattat gacaaaaggc ggagtggcta tgtggccgct tctgattttg 60
tcagtattag ctttaagtac cattattgaa cgctctatat tttggatacg atttttgctc 120
aaagaaggaa aaatcttgaa tcgagtcctc gaaactgctg ctcgcaattg ggatgctgcg 180
ccgaaagtgg ctaaagagaa tagtaaacat cctatgggca gttttctcta tggtcctctg 240
agattagata accccgatcc agaggttttc catttagccc tagaatcatc ggccgatgac 300
gaactggcct tgatgagacg aggggataag gtattagaag cggtgattgc tctgtctccc 360
ttattaggat tactggggac ggtattggga ctgattacct ctttaggcaa catccaaatt 420
agcgatctcg gcacttcctc aaccacaggt gttaccctgg gtattggaga agcccttatt 480
tcaactgcga caggattgat tgttgccatt attagtttga ccttttatcg gattttccag 540
tccctgtggt ctaatcaggt aaggattttt cgtaaagccg gtagtgagtt agaagtaatt 600
tatcgtcaac gctggtctga tagcgaagtt aatccctctg ctttttctgg caatactccc 660
tcaaagttta cagacacttt tgatcaataa 690
<210> 230
<211> 229
<212> PRT
<213> Cyanothece sp.
<400> 230
Val Asn Ile Gln Glu Ile Met Thr Lys Gly Gly Val Ala Met Trp Pro
1 5 10 15
Leu Leu Ile Leu Ser Val Leu Ala Leu Ser Thr Ile Ile Glu Arg Ser
20 25 30
Ile Phe Trp Ile Arg Phe Leu Leu Lys Glu Gly Lys Ile Leu Asn Arg
35 40 45
Val Leu Glu Thr Ala Ala Arg Asn Trp Asp Ala Ala Pro Lys Val Ala
50 55 60
Lys Glu Asn Ser Lys His Pro Met Gly Ser Phe Leu Tyr Gly Pro Leu
65 70 75 80
Arg Leu Asp Asn Pro Asp Pro Glu Val Phe His Leu Ala Leu Glu Ser
85 90 95
Ser Ala Asp Asp Glu Leu Ala Leu Met Arg Arg Gly Asp Lys Val Leu
100 105 110
Glu Ala Val Ile Ala Leu Ser Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Thr Ser Leu Gly Asn Ile Gln Ile Ser Asp Leu Gly
130 135 140
Thr Ser Ser Thr Thr Gly Val Thr Leu Gly Ile Gly Glu Ala Leu Ile
145 150 155 160
Ser Thr Ala Thr Gly Leu Ile Val Ala Ile Ile Ser Leu Thr Phe Tyr
165 170 175
Arg Ile Phe Gln Ser Leu Trp Ser Asn Gln Val Arg Ile Phe Arg Lys
180 185 190
Ala Gly Ser Glu Leu Glu Val Ile Tyr Arg Gln Arg Trp Ser Asp Ser
195 200 205
Glu Val Asn Pro Ser Ala Phe Ser Gly Asn Thr Pro Ser Lys Phe Thr
210 215 220
Asp Thr Phe Asp Gln
225
<210> 231
<211> 681
<212> DNA
<213> Cyanothece sp.
<400> 231
atgactcata tttacgattt atttttgaaa ggaggtccag tgatgtggcc tctcttagct 60
ttatcggttt tcactatcac cattgcctta gaaagaactt ggttttggat aagactttta 120
agccaagaaa atcgtattgt ccatgacgtt ttagaaacag cacgttacga tctcttagaa 180
gctcaaaaaa tcgctcaaca cgcccgtttt ttacccattg gacgcttttt attagccccc 240
ctgcaactaa aaaaaccaag ccctgaaacc ttccgtttgg caatggaagc taggggagac 300
agagaattta ttcaaatgag aaaaggggat aaatttctcg aaacggtgat tgccgttgcc 360
cccttattag gcttattagg aacggtaacg ggattgatta caacttttaa taatttaaaa 420
ataggagaag gggcaaatct tgcagaaacg tctcaagctg ctgctggtat ttctgaagct 480
ttaattacca cagcagccgg gatgattgtg gcgattattg ctttattagt ttatcgtgtt 540
tctgttactt tacaaagtgg acaagttgag tattttgctg aagttggtac agatttagaa 600
ctgatttatc gacagttttg gtatgagcct gaattagaag aaaaacaaaa attttcgact 660
gctttacctc ctactatata g 681
<210> 232
<211> 226
<212> PRT
<213> Cyanothece sp.
<400> 232
Met Thr His Ile Tyr Asp Leu Phe Leu Lys Gly Gly Pro Val Met Trp
1 5 10 15
Pro Leu Leu Ala Leu Ser Val Phe Thr Ile Thr Ile Ala Leu Glu Arg
20 25 30
Thr Trp Phe Trp Ile Arg Leu Leu Ser Gln Glu Asn Arg Ile Val His
35 40 45
Asp Val Leu Glu Thr Ala Arg Tyr Asp Leu Leu Glu Ala Gln Lys Ile
50 55 60
Ala Gln His Ala Arg Phe Leu Pro Ile Gly Arg Phe Leu Leu Ala Pro
65 70 75 80
Leu Gln Leu Lys Lys Pro Ser Pro Glu Thr Phe Arg Leu Ala Met Glu
85 90 95
Ala Arg Gly Asp Arg Glu Phe Ile Gln Met Arg Lys Gly Asp Lys Phe
100 105 110
Leu Glu Thr Val Ile Ala Val Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Thr Gly Leu Ile Thr Thr Phe Asn Asn Leu Lys Ile Gly Glu Gly
130 135 140
Ala Asn Leu Ala Glu Thr Ser Gln Ala Ala Ala Gly Ile Ser Glu Ala
145 150 155 160
Leu Ile Thr Thr Ala Ala Gly Met Ile Val Ala Ile Ile Ala Leu Leu
165 170 175
Val Tyr Arg Val Ser Val Thr Leu Gln Ser Gly Gln Val Glu Tyr Phe
180 185 190
Ala Glu Val Gly Thr Asp Leu Glu Leu Ile Tyr Arg Gln Phe Trp Tyr
195 200 205
Glu Pro Glu Leu Glu Glu Lys Gln Lys Phe Ser Thr Ala Leu Pro Pro
210 215 220
Thr Ile
225
<210> 233
<211> 654
<212> DNA
<213> Cyanothece sp.
<400> 233
atgtcgatca aaaacttttt agtagctggt ggcatcgttg cctggccatt gcttgtgttt 60
tccctattag gcgtggcttt aattattgaa cgtatcatct tttggtatcg gattaagtct 120
cgtgaacgaa agatcatcac cactgtcttg aaactttatc aagggaatga acccatagca 180
gcgatcgcaa aattgaagca aaatgcggat ttaccgatgt gtcgcatttt tttagaagct 240
ttagtccttc aggatgccac accgacagag tttcgtttag ccttagagac ggcaactcaa 300
gcagaactcc ctctttttaa acgctttaat actatttttc agaccattat tgcagtttca 360
ccgttgttgg gactattagg aaccattttg ggactcatgc gctcttttgc gtctcttgac 420
attggtaatg ttagtggaac caacgctact aatgtcactg gagggatctc agaagcgtta 480
acctcgacgg tgatggggtt agtggtagcg attatgaccc tattatttgc taactcgttt 540
cgttctttat acctacaaca atttgcccta gttcaagaat atgcaggtca attagaacta 600
ttgtatcgtc gtttctacga gagaggagat aaaccctatg cagttacccg atga 654
<210> 234
<211> 217
<212> PRT
<213> Cyanothece sp.
<400> 234
Met Ser Ile Lys Asn Phe Leu Val Ala Gly Gly Ile Val Ala Trp Pro
1 5 10 15
Leu Leu Val Phe Ser Leu Leu Gly Val Ala Leu Ile Ile Glu Arg Ile
20 25 30
Ile Phe Trp Tyr Arg Ile Lys Ser Arg Glu Arg Lys Ile Ile Thr Thr
35 40 45
Val Leu Lys Leu Tyr Gln Gly Asn Glu Pro Ile Ala Ala Ile Ala Lys
50 55 60
Leu Lys Gln Asn Ala Asp Leu Pro Met Cys Arg Ile Phe Leu Glu Ala
65 70 75 80
Leu Val Leu Gln Asp Ala Thr Pro Thr Glu Phe Arg Leu Ala Leu Glu
85 90 95
Thr Ala Thr Gln Ala Glu Leu Pro Leu Phe Lys Arg Phe Asn Thr Ile
100 105 110
Phe Gln Thr Ile Ile Ala Val Ser Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Ile Leu Gly Leu Met Arg Ser Phe Ala Ser Leu Asp Ile Gly Asn Val
130 135 140
Ser Gly Thr Asn Ala Thr Asn Val Thr Gly Gly Ile Ser Glu Ala Leu
145 150 155 160
Thr Ser Thr Val Met Gly Leu Val Val Ala Ile Met Thr Leu Leu Phe
165 170 175
Ala Asn Ser Phe Arg Ser Leu Tyr Leu Gln Gln Phe Ala Leu Val Gln
180 185 190
Glu Tyr Ala Gly Gln Leu Glu Leu Leu Tyr Arg Arg Phe Tyr Glu Arg
195 200 205
Gly Asp Lys Pro Tyr Ala Val Thr Arg
210 215
<210> 235
<211> 654
<212> DNA
<213> Fremyella diplosiphon
<400> 235
atggggataa aaaatttatt tgctgcgggt ggcgtggtta tgtggcccct gctggctttc 60
tctgttgtgg cgttagcttt gattgttgag cgtgtgcggt tttggtatcg agtcaatact 120
cgccaagcca aggtagtacg agagattctc aatctctatc ggatggataa tgtggtggga 180
gctattgaaa agtcccgtca gaatgcaaat ttaccgattc cccggatttt ccttgcagcg 240
ttggaattag aagaaccgac tccagaagag tttcgcttgg cgttagaaag tgaagcacaa 300
gcggaactac caattatcaa acgtttcaac acaatttttg acacaatcat cggactttcg 360
ccactatttg gcttgttggg tacggtattg ggtttgattg tttcattcgc ttccctcaac 420
cttggtgatg ttggtgggac aaaaactgca ggtgtgacat cagggattag tgaagcgctt 480
gtttccacag cttccggttt aattgtggca atttttaccc tgttctttgc taattctttc 540
cgaggattgg ctcaacgtca aactggcttg attcaagaat atggtgggca attagaactg 600
ttgtaccgcc gtcgttatga acgaggagac aaagtctatg cgtctacaag atga 654
<210> 236
<211> 217
<212> PRT
<213> Fremyella diplosiphon
<400> 236
Met Gly Ile Lys Asn Leu Phe Ala Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Ala Phe Ser Val Val Ala Leu Ala Leu Ile Val Glu Arg Val
20 25 30
Arg Phe Trp Tyr Arg Val Asn Thr Arg Gln Ala Lys Val Val Arg Glu
35 40 45
Ile Leu Asn Leu Tyr Arg Met Asp Asn Val Val Gly Ala Ile Glu Lys
50 55 60
Ser Arg Gln Asn Ala Asn Leu Pro Ile Pro Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Leu Pro Ile Ile Lys Arg Phe Asn Thr Ile
100 105 110
Phe Asp Thr Ile Ile Gly Leu Ser Pro Leu Phe Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Val Ser Phe Ala Ser Leu Asn Leu Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Ala Gly Val Thr Ser Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ser Gly Leu Ile Val Ala Ile Phe Thr Leu Phe Phe
165 170 175
Ala Asn Ser Phe Arg Gly Leu Ala Gln Arg Gln Thr Gly Leu Ile Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Gly Asp Lys Val Tyr Ala Ser Thr Arg
210 215
<210> 237
<211> 663
<212> DNA
<213> Gloeobacter violaceus
<400> 237
atgaatctcc ttgctgatct ttaccgcttt gttgtcaacg attggtggat tgctgtgccg 60
ctgctgctgt gttcggtttt gaccatcgcc gtggtcaccg agcgctggct ctacatcaac 120
cgcaacaaga ccgacgtcga tcgctttatt gtccggctgc agcgcgaact cgagcgcgcc 180
aacctttctg gagcgcgcaa tctctgcgaa caggtaggcg gcgtgattgg cgaagtggcc 240
gaggatgggg tgcggctgct ttctgtgccg cgcgtcaagt ttgagcaggc cttcgacatc 300
accatcaacc tgggcatgcg caaattcgaa aagcacctca acgtgctggg cacgatcggg 360
gcggtcgccc cctttatcgg cctgctcggc acggtggtcg gcatcttgcg ctccttccag 420
acgtttgcag gcgaaggggc gaccagcaac aaactggcgg ccgaaatcgg ctttgcgctg 480
attgccacgg cggcgggcct catcgtcgcc atcgcctcgg tcgtggccta caacatcttt 540
caaaacatcg tcgcccagtt cgaagacgac tttcagctgc tcaagctgct gtttctcaac 600
tttgccgaca ccgccgaatt tgaaggcgag gtggtcgaag aatccaccat tccccagcag 660
tag 663
<210> 238
<211> 220
<212> PRT
<213> Gloeobacter violaceus
<400> 238
Met Asn Leu Leu Ala Asp Leu Tyr Arg Phe Val Val Asn Asp Trp Trp
1 5 10 15
Ile Ala Val Pro Leu Leu Leu Cys Ser Val Leu Thr Ile Ala Val Val
20 25 30
Thr Glu Arg Trp Leu Tyr Ile Asn Arg Asn Lys Thr Asp Val Asp Arg
35 40 45
Phe Ile Val Arg Leu Gln Arg Glu Leu Glu Arg Ala Asn Leu Ser Gly
50 55 60
Ala Arg Asn Leu Cys Glu Gln Val Gly Gly Val Ile Gly Glu Val Ala
65 70 75 80
Glu Asp Gly Val Arg Leu Leu Ser Val Pro Arg Val Lys Phe Glu Gln
85 90 95
Ala Phe Asp Ile Thr Ile Asn Leu Gly Met Arg Lys Phe Glu Lys His
100 105 110
Leu Asn Val Leu Gly Thr Ile Gly Ala Val Ala Pro Phe Ile Gly Leu
115 120 125
Leu Gly Thr Val Val Gly Ile Leu Arg Ser Phe Gln Thr Phe Ala Gly
130 135 140
Glu Gly Ala Thr Ser Asn Lys Leu Ala Ala Glu Ile Gly Phe Ala Leu
145 150 155 160
Ile Ala Thr Ala Ala Gly Leu Ile Val Ala Ile Ala Ser Val Val Ala
165 170 175
Tyr Asn Ile Phe Gln Asn Ile Val Ala Gln Phe Glu Asp Asp Phe Gln
180 185 190
Leu Leu Lys Leu Leu Phe Leu Asn Phe Ala Asp Thr Ala Glu Phe Glu
195 200 205
Gly Glu Val Val Glu Glu Ser Thr Ile Pro Gln Gln
210 215 220
<210> 239
<211> 636
<212> DNA
<213> Gloeobacter violaceus
<400> 239
atggcagtaa tagactggtt tgtgcggggc ggcatcgtca tgtggccgat gctgctgtgc 60
tcgatcatcg ccctggccat catcatcgag cgcatcatct actacgtccg cctgctgccg 120
cgccagaagg ctttcgtcga acaggccttc gccaccgagc gctaccagcc cgaccagctc 180
aggcggctga ttaacgaaaa tgcggacatt ccgctgggtc ggatcttcgg ttcggcgctc 240
tcggtgcgca ccgacgacga gacggccttc cgcctggcga tcgaaggggc ggccaaaacc 300
gagatcccga agctgaagcg cttcgtgtcg gtactggaca cgatcgtgac cttgtcgccg 360
ttgttgggtc tgttgggaac ggtgctgggt ctgatcaatt cctttgcgtc gctggggttg 420
ggtacggagg cctccagcaa gggtctggaa gtggcgggtg gcatttccga ggcgctgatt 480
gcgacggcga cggggatgat ggtggcgctg tttacgctga tatttgcgag tttgtttcgg 540
gcgttggccc gccgtcagat tgtgctgatg gagacggcgg ggacgcagct ggagttgcgc 600
tggcggatgg cggagaccga gggagtgaag cgatga 636
<210> 240
<211> 211
<212> PRT
<213> Gloeobacter violaceus
<400> 240
Met Ala Val Ile Asp Trp Phe Val Arg Gly Gly Ile Val Met Trp Pro
1 5 10 15
Met Leu Leu Cys Ser Ile Ile Ala Leu Ala Ile Ile Ile Glu Arg Ile
20 25 30
Ile Tyr Tyr Val Arg Leu Leu Pro Arg Gln Lys Ala Phe Val Glu Gln
35 40 45
Ala Phe Ala Thr Glu Arg Tyr Gln Pro Asp Gln Leu Arg Arg Leu Ile
50 55 60
Asn Glu Asn Ala Asp Ile Pro Leu Gly Arg Ile Phe Gly Ser Ala Leu
65 70 75 80
Ser Val Arg Thr Asp Asp Glu Thr Ala Phe Arg Leu Ala Ile Glu Gly
85 90 95
Ala Ala Lys Thr Glu Ile Pro Lys Leu Lys Arg Phe Val Ser Val Leu
100 105 110
Asp Thr Ile Val Thr Leu Ser Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Asn Ser Phe Ala Ser Leu Gly Leu Gly Thr Glu Ala
130 135 140
Ser Ser Lys Gly Leu Glu Val Ala Gly Gly Ile Ser Glu Ala Leu Ile
145 150 155 160
Ala Thr Ala Thr Gly Met Met Val Ala Leu Phe Thr Leu Ile Phe Ala
165 170 175
Ser Leu Phe Arg Ala Leu Ala Arg Arg Gln Ile Val Leu Met Glu Thr
180 185 190
Ala Gly Thr Gln Leu Glu Leu Arg Trp Arg Met Ala Glu Thr Glu Gly
195 200 205
Val Lys Arg
210
<210> 241
<211> 678
<212> DNA
<213> Microcystis aeruginosa
<400> 241
gtgactataa ctgatttaat ccaaaaaggc ggagtggcca tgtggccgct gctttttctg 60
tctattttag ctcttagcac tattatcgaa cgaatttggt tttggagtcg tactctcctc 120
agtgagggcc agattttaaa tcgcattatg gaatccgcca tccgtaactg ggatttggcg 180
gcaaaagtcg ctggagattc ccgcaatcac cccattggta gctatctcta cgcacccctg 240
cgcttagaaa atccagatcc agaggttttt cactttgccc tcgaatcggc tgccgatgaa 300
caattatccc taatgaaacg gggcgataaa atccttgagg cagtcattgc cctttctccc 360
ctgttaggat tattagggac ggtactcggt ttaattacct ctttggccaa tattcaatta 420
agtgacctgg gaacttcctc gacggcggga gtaactttag gtattagtga agctttaatt 480
tccaccgcta ccggcttaat tgtcgctatt tttagcctcg ctttctatcg tgtttttcag 540
ggactctggt tcaatcaagc ccgaattttt cgcaaggccg gcagtgattt agaaattatc 600
taccgccaac gctggttaca ccaagaagac caacaatacg ccctcagtgc taacctagaa 660
aaacctctcg atcgctaa 678
<210> 242
<211> 225
<212> PRT
<213> Microcystis aeruginosa
<400> 242
Val Thr Ile Thr Asp Leu Ile Gln Lys Gly Gly Val Ala Met Trp Pro
1 5 10 15
Leu Leu Phe Leu Ser Ile Leu Ala Leu Ser Thr Ile Ile Glu Arg Ile
20 25 30
Trp Phe Trp Ser Arg Thr Leu Leu Ser Glu Gly Gln Ile Leu Asn Arg
35 40 45
Ile Met Glu Ser Ala Ile Arg Asn Trp Asp Leu Ala Ala Lys Val Ala
50 55 60
Gly Asp Ser Arg Asn His Pro Ile Gly Ser Tyr Leu Tyr Ala Pro Leu
65 70 75 80
Arg Leu Glu Asn Pro Asp Pro Glu Val Phe His Phe Ala Leu Glu Ser
85 90 95
Ala Ala Asp Glu Gln Leu Ser Leu Met Lys Arg Gly Asp Lys Ile Leu
100 105 110
Glu Ala Val Ile Ala Leu Ser Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Thr Ser Leu Ala Asn Ile Gln Leu Ser Asp Leu Gly
130 135 140
Thr Ser Ser Thr Ala Gly Val Thr Leu Gly Ile Ser Glu Ala Leu Ile
145 150 155 160
Ser Thr Ala Thr Gly Leu Ile Val Ala Ile Phe Ser Leu Ala Phe Tyr
165 170 175
Arg Val Phe Gln Gly Leu Trp Phe Asn Gln Ala Arg Ile Phe Arg Lys
180 185 190
Ala Gly Ser Asp Leu Glu Ile Ile Tyr Arg Gln Arg Trp Leu His Gln
195 200 205
Glu Asp Gln Gln Tyr Ala Leu Ser Ala Asn Leu Glu Lys Pro Leu Asp
210 215 220
Arg
225
<210> 243
<211> 654
<212> DNA
<213> Nostoc punctiforme
<400> 243
atggaaatta gtaatctgtt tacagcaggt ggcgtggtca tgtggcctct cctggcgttc 60
tctttgttag gagtagcgct gattatcgag cggatcatct tttgggtaag aataaataat 120
cggcaaaata aggtagtgcg agaggtgcta cagctttatc gccttgataa tgtagttagt 180
gctttagata agttgcaaaa aaatactgat ttacccattg cccgaatttt tttagcagct 240
ttagagttag aagaggcgac accagaagaa tttcggttgg cattagaaag cgaagcacaa 300
gccgaaattc ccttacttaa gcgatcgcaa aatatttttg agacaattat tggtcttgcg 360
ccgttgttgg gacttctcgg tactgtctta ggattaatta actcctttgc ctctctaaat 420
attggagatg tgggaggtac taaaacaaca ggtgtaacat ctggaattag tgaagcttta 480
gtatccacag catcaggatt agtagtagca atctttacac tattatttgc taatactttc 540
cggggactct atcagcgtca gatagcttgg attcaagaat atggtggaca gttagaatta 600
ctctaccgcc gtcgctacga aagaggcgat aaatcttatg tgcctaccag atga 654
<210> 244
<211> 217
<212> PRT
<213> Nostoc punctiforme
<400> 244
Met Glu Ile Ser Asn Leu Phe Thr Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Ala Phe Ser Leu Leu Gly Val Ala Leu Ile Ile Glu Arg Ile
20 25 30
Ile Phe Trp Val Arg Ile Asn Asn Arg Gln Asn Lys Val Val Arg Glu
35 40 45
Val Leu Gln Leu Tyr Arg Leu Asp Asn Val Val Ser Ala Leu Asp Lys
50 55 60
Leu Gln Lys Asn Thr Asp Leu Pro Ile Ala Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Glu Leu Glu Glu Ala Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Ile Pro Leu Leu Lys Arg Ser Gln Asn Ile
100 105 110
Phe Glu Thr Ile Ile Gly Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Asn Ser Phe Ala Ser Leu Asn Ile Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Thr Gly Val Thr Ser Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ser Gly Leu Val Val Ala Ile Phe Thr Leu Leu Phe
165 170 175
Ala Asn Thr Phe Arg Gly Leu Tyr Gln Arg Gln Ile Ala Trp Ile Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Gly Asp Lys Ser Tyr Val Pro Thr Arg
210 215
<210> 245
<211> 729
<212> DNA
<213> Nostoc punctiforme
<400> 245
gtggatattt tagatttatt ttataagggc gggccagcga tgtggccttt acttgtcctg 60
tcgattctat ctttgagtgt gatttttgag cgtttgtggt tctggttgcg aattttgact 120
caggaaaagc aaatagttga tcgcattctg gatgctgcac aagataattg gcaagcagct 180
gctgacattg ccaaacaagc aagccatcaa cctgtcgggc gttttctcta tgccccttta 240
cgttttgcaa aaactgatgt ggaaaccttt cgactagcac ttgaggctac agcagaagat 300
gaattggctg gaatgcggcg cggcgaaaag cttttagagg ctgtgattgc cctcgcgccc 360
ctgctgggat tgttgggtac agttctgggt ctaatccagt ctctgcgctc aattcggatt 420
ggcgatttgg gaactgaatc taccgccgga gtgactactg gtattggtga atccttaatt 480
agtacggcaa ctgggttaat agttgccatt attagcttgg cattttatcg actatttcaa 540
agttttgtag ttaaccaagt caaagttttt cggaaggcag ggaatgagat ggaattactc 600
taccgccagt ccccccctga ttttagtaat attacatcac caattgtccg ggaaaatttc 660
actccacccc gcaagccagg aaagactagg ttgcctgaac ctcctgaacc cccgaattta 720
cctaattag 729
<210> 246
<211> 242
<212> PRT
<213> Nostoc punctiforme
<400> 246
Val Asp Ile Leu Asp Leu Phe Tyr Lys Gly Gly Pro Ala Met Trp Pro
1 5 10 15
Leu Leu Val Leu Ser Ile Leu Ser Leu Ser Val Ile Phe Glu Arg Leu
20 25 30
Trp Phe Trp Leu Arg Ile Leu Thr Gln Glu Lys Gln Ile Val Asp Arg
35 40 45
Ile Leu Asp Ala Ala Gln Asp Asn Trp Gln Ala Ala Ala Asp Ile Ala
50 55 60
Lys Gln Ala Ser His Gln Pro Val Gly Arg Phe Leu Tyr Ala Pro Leu
65 70 75 80
Arg Phe Ala Lys Thr Asp Val Glu Thr Phe Arg Leu Ala Leu Glu Ala
85 90 95
Thr Ala Glu Asp Glu Leu Ala Gly Met Arg Arg Gly Glu Lys Leu Leu
100 105 110
Glu Ala Val Ile Ala Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gln Ser Leu Arg Ser Ile Arg Ile Gly Asp Leu Gly
130 135 140
Thr Glu Ser Thr Ala Gly Val Thr Thr Gly Ile Gly Glu Ser Leu Ile
145 150 155 160
Ser Thr Ala Thr Gly Leu Ile Val Ala Ile Ile Ser Leu Ala Phe Tyr
165 170 175
Arg Leu Phe Gln Ser Phe Val Val Asn Gln Val Lys Val Phe Arg Lys
180 185 190
Ala Gly Asn Glu Met Glu Leu Leu Tyr Arg Gln Ser Pro Pro Asp Phe
195 200 205
Ser Asn Ile Thr Ser Pro Ile Val Arg Glu Asn Phe Thr Pro Pro Arg
210 215 220
Lys Pro Gly Lys Thr Arg Leu Pro Glu Pro Pro Glu Pro Pro Asn Leu
225 230 235 240
Pro Asn
<210> 247
<211> 654
<212> DNA
<213> Nostoc punctiforme
<400> 247
atgggaattc agaatttgtt tgcagcaggc ggtgtggtca tgtggcccct gttggcgttt 60
tcggtattgg gtgtggcact gatcatcgag cggatcaggt tttgggtacg gattaatcag 120
cgtcaaaacc gtgtagtgcg agatgttttg aatctctacc gtcttgataa tgttgtcggc 180
gcaatggata aacttcagaa aaacgcagat ttaccattgg cacggatttt tcttgcggct 240
ttagaattgg aagagccaaa tccagaagaa tttcgtttgg cgttagaaag cgaatcccag 300
gctgagatac ctgtgttaaa acgttttcaa aacattttcg agacaatcat tagtctggca 360
ccactgttgg gtcttctcgg cacagtatta ggattgatag cctcctttgc ttccctaaat 420
cttggtgatg tgggaggtag caaaacgaca aatgttaccg ccgggattag tgaagctttg 480
gtatcaacag catcaggatt aatagttgct atattcatac tcatgtttgc caataccttc 540
cggggattgt atcaaaggca aattgcctta attcaagagt atgggggaca gttagaatta 600
ctctaccgtc gtcgttatga aagaggagaa aaaacttatg cgtctaccag atga 654
<210> 248
<211> 217
<212> PRT
<213> Nostoc punctiforme
<400> 248
Met Gly Ile Gln Asn Leu Phe Ala Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Ala Phe Ser Val Leu Gly Val Ala Leu Ile Ile Glu Arg Ile
20 25 30
Arg Phe Trp Val Arg Ile Asn Gln Arg Gln Asn Arg Val Val Arg Asp
35 40 45
Val Leu Asn Leu Tyr Arg Leu Asp Asn Val Val Gly Ala Met Asp Lys
50 55 60
Leu Gln Lys Asn Ala Asp Leu Pro Leu Ala Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Asn Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ser Gln Ala Glu Ile Pro Val Leu Lys Arg Phe Gln Asn Ile
100 105 110
Phe Glu Thr Ile Ile Ser Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Ala Ser Phe Ala Ser Leu Asn Leu Gly Asp Val
130 135 140
Gly Gly Ser Lys Thr Thr Asn Val Thr Ala Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ser Gly Leu Ile Val Ala Ile Phe Ile Leu Met Phe
165 170 175
Ala Asn Thr Phe Arg Gly Leu Tyr Gln Arg Gln Ile Ala Leu Ile Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Gly Glu Lys Thr Tyr Ala Ser Thr Arg
210 215
<210> 249
<211> 654
<212> DNA
<213> Nostoc sp.
<400> 249
atgggaatcc aaaatctttt tgcagcaggc ggcgtggtca tgtggccgct attaggtttt 60
tctgtgttgg gagtagcact gattgttgag cgtactaggt tttggctgaa aatcaacaat 120
cgtcaacagc gcgtagttag agatgtgtta aacctctatc ggctagataa tgtagttggc 180
gcaatagaca agctcagaaa aaatgtagat ttgccattgg cgcgtgtgtt tttatcggct 240
ttggaattag aagaaccaac accagaggaa tttcgcttgg cgctagaaag cgaagctcaa 300
gccgaaatac cattactcaa acgatttcaa aatatttttg acacaattat tggtctagca 360
ccccttttag gcttgctggg tacagtgtta ggtttgatta cttccttcgc ttctttagat 420
attggcgatg tgggaggtac aaaaaccgca ggtgtgacgg cggggatcag cgaagctcta 480
gtatctacag cagcaggatt ggtcgtggca atattcacac tgttttttgc caactccttt 540
cggggacttt acaccagaca gatggcacta tttcaagagt atggcggtca attagaatta 600
ctttatcgcc gccgctatga acgaggagag agaacctatg cgtctacaag atga 654
<210> 250
<211> 217
<212> PRT
<213> Nostoc sp.
<400> 250
Met Gly Ile Gln Asn Leu Phe Ala Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Gly Phe Ser Val Leu Gly Val Ala Leu Ile Val Glu Arg Thr
20 25 30
Arg Phe Trp Leu Lys Ile Asn Asn Arg Gln Gln Arg Val Val Arg Asp
35 40 45
Val Leu Asn Leu Tyr Arg Leu Asp Asn Val Val Gly Ala Ile Asp Lys
50 55 60
Leu Arg Lys Asn Val Asp Leu Pro Leu Ala Arg Val Phe Leu Ser Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Ile Pro Leu Leu Lys Arg Phe Gln Asn Ile
100 105 110
Phe Asp Thr Ile Ile Gly Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Thr Ser Phe Ala Ser Leu Asp Ile Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Ala Gly Val Thr Ala Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ala Gly Leu Val Val Ala Ile Phe Thr Leu Phe Phe
165 170 175
Ala Asn Ser Phe Arg Gly Leu Tyr Thr Arg Gln Met Ala Leu Phe Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Gly Glu Arg Thr Tyr Ala Ser Thr Arg
210 215
<210> 251
<211> 642
<212> DNA
<213> Nostoc sp.
<400> 251
atgggaattc tgaatctatt tacagccggt ggtgtggtta tgtggcctct gctggcgttc 60
tccttattag cggtagcact aatcatcgaa cgtatcagct tttgggtaag aattttgggc 120
aagcaaaacc tcatagtacg ggaagttctg agactttacc aactagataa tgtggttagc 180
accttagaag cattacggca aaatgccgat ttacccatcg cgcgaatttt cctcgccgct 240
ttagaattgg aggagccgac accagaagaa tttcgattgg ctttagaaag tgaagcccag 300
gctgagatac ctgtactcaa acgctttcaa aatatttttg ataccataat tggtctcgcg 360
cccttattag ggttacttgg tactgttttg ggattaatta attcctttgc atctttagac 420
atcggtgatg tgggaggaac aaagacggct ggtgtaacgg ctggtattag tgaagcctta 480
gtttctactg catctggctt ggttgttgct atcctgacac tgttttttgc taatagtttc 540
cggggtttct atcagcgtca aattgcctgg attcaggagt atgggggaca gctagaatta 600
ctctaccgtc gtcgttacga gaggagaggc aagcaaggtt ga 642
<210> 252
<211> 213
<212> PRT
<213> Nostoc sp.
<400> 252
Met Gly Ile Leu Asn Leu Phe Thr Ala Gly Gly Val Val Met Trp Pro
1 5 10 15
Leu Leu Ala Phe Ser Leu Leu Ala Val Ala Leu Ile Ile Glu Arg Ile
20 25 30
Ser Phe Trp Val Arg Ile Leu Gly Lys Gln Asn Leu Ile Val Arg Glu
35 40 45
Val Leu Arg Leu Tyr Gln Leu Asp Asn Val Val Ser Thr Leu Glu Ala
50 55 60
Leu Arg Gln Asn Ala Asp Leu Pro Ile Ala Arg Ile Phe Leu Ala Ala
65 70 75 80
Leu Glu Leu Glu Glu Pro Thr Pro Glu Glu Phe Arg Leu Ala Leu Glu
85 90 95
Ser Glu Ala Gln Ala Glu Ile Pro Val Leu Lys Arg Phe Gln Asn Ile
100 105 110
Phe Asp Thr Ile Ile Gly Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr
115 120 125
Val Leu Gly Leu Ile Asn Ser Phe Ala Ser Leu Asp Ile Gly Asp Val
130 135 140
Gly Gly Thr Lys Thr Ala Gly Val Thr Ala Gly Ile Ser Glu Ala Leu
145 150 155 160
Val Ser Thr Ala Ser Gly Leu Val Val Ala Ile Leu Thr Leu Phe Phe
165 170 175
Ala Asn Ser Phe Arg Gly Phe Tyr Gln Arg Gln Ile Ala Trp Ile Gln
180 185 190
Glu Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Arg Tyr Glu Arg
195 200 205
Arg Gly Lys Gln Gly
210
<210> 253
<211> 720
<212> DNA
<213> Nostoc sp.
<400> 253
gtggatatta tagatttgtt ttacaagggt gggccggcaa tgtggccttt gctggctctg 60
tcgattttat ccttgagtgt gatttttgag cgcctttggt tctggctgcg acttttctca 120
caagaaaaag cgatcgttga ccgagttcta gatgcagctc atgataactg ggaaatagcg 180
ggggatattg ctagacaggc tacagaccaa ccaattggtc gatttctcta tgctccctta 240
catttacaaa aaactgacgc ggaaaccttt cgattagcac tggagtccac agcagaggac 300
gaactagccg gaatgcgtcg gggcgaaaag ttattagaag ctgtcattgc cctcgctccc 360
ttactaggat tgttgggtac agttttaggt ttaatccagt ctttacgctc aattcgcatt 420
ggtgatttgg gaactgaatc ggcggctgga gtaacgacgg gtattggtga atccttaatt 480
agtacggcag ccgggctaat agttgccatt gttagtttgg tattttaccg attatttcaa 540
agttttgtag tcaatcaact caaagttttc cgtaaagcgg ggaatgaaat ggaattgtta 600
tatcgccagt ctccgcctga tttgagcaac cccacaccag caattgtccg tgatgcttta 660
ccgagcaaaa ctggtagggg taagtttccg caaccacctg aaccaccaaa tctaccttag 720
<210> 254
<211> 239
<212> PRT
<213> Nostoc sp.
<400> 254
Val Asp Ile Ile Asp Leu Phe Tyr Lys Gly Gly Pro Ala Met Trp Pro
1 5 10 15
Leu Leu Ala Leu Ser Ile Leu Ser Leu Ser Val Ile Phe Glu Arg Leu
20 25 30
Trp Phe Trp Leu Arg Leu Phe Ser Gln Glu Lys Ala Ile Val Asp Arg
35 40 45
Val Leu Asp Ala Ala His Asp Asn Trp Glu Ile Ala Gly Asp Ile Ala
50 55 60
Arg Gln Ala Thr Asp Gln Pro Ile Gly Arg Phe Leu Tyr Ala Pro Leu
65 70 75 80
His Leu Gln Lys Thr Asp Ala Glu Thr Phe Arg Leu Ala Leu Glu Ser
85 90 95
Thr Ala Glu Asp Glu Leu Ala Gly Met Arg Arg Gly Glu Lys Leu Leu
100 105 110
Glu Ala Val Ile Ala Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gln Ser Leu Arg Ser Ile Arg Ile Gly Asp Leu Gly
130 135 140
Thr Glu Ser Ala Ala Gly Val Thr Thr Gly Ile Gly Glu Ser Leu Ile
145 150 155 160
Ser Thr Ala Ala Gly Leu Ile Val Ala Ile Val Ser Leu Val Phe Tyr
165 170 175
Arg Leu Phe Gln Ser Phe Val Val Asn Gln Leu Lys Val Phe Arg Lys
180 185 190
Ala Gly Asn Glu Met Glu Leu Leu Tyr Arg Gln Ser Pro Pro Asp Leu
195 200 205
Ser Asn Pro Thr Pro Ala Ile Val Arg Asp Ala Leu Pro Ser Lys Thr
210 215 220
Gly Arg Gly Lys Phe Pro Gln Pro Pro Glu Pro Pro Asn Leu Pro
225 230 235
<210> 255
<211> 987
<212> DNA
<213> Rhodopseudomonas palustris
<400> 255
atgccagccc gccatcctgc accggttccg gaaaatagcc gctttgagcc agaacaaacc 60
gcgtccggtg ggtttatgcg atggcctccg gcatcggacc cgggggccag aattgatttc 120
gggtggccgg cgatccgtgc gatagctcgc ggccccgcgc cgaacgtctt tgcctgtcga 180
aagtggatga tgccgccatt ttgcgtcccg ccgatgatcc gcaatctcgt caacgccagc 240
gcgctcgggt tcgtggtcgc gctgttacac ggcaccgccg cttatgccgc cgccgatatc 300
gccagcctgc cgcgcgacct gtcggcctgg ggcatgttca agaacgccga cattgtcgtg 360
aaggtggtga tggccggcct cgcgctggcg tcgctcgcga cctggacggt gtggctgtcg 420
aagaccatcg agctgcggcg cgaaaccgcg cgcgcccgcg atggtctcag caagctcgaa 480
accgatacca cgctggccga gctcggccgc ggcagcgagg gtgcgcatga cgcggtgtct 540
cagctgatcc agacggcggc gcgcgaaggc agcctgtcgg gctggacttt cgatgccgac 600
ttcaaggagc gcgtcgcgct gcggctggag cgggtcgaag cggcgatggc gcgcaagatc 660
gccagcggca ccggcattct cgccaccgtc ggcgcggtgg cgccgttcgt cggcctgttc 720
ggcacggtgt ggggcatcat gaacgccttc atcggcattt ccgaagcgca cactaccaat 780
ctggcggtgg tggcaccggg catcgccgag gcgctgctgg cgaccgcgct cggcctggtc 840
gccgcggtgc cggcggtggt gatctacaac tatctggtcc gcgccattgc gacctatcgg 900
gcgctgcttg gcgacgcctc ggcgcaggtg ctgctgctcg tcagccgcga ccgcggccgc 960
tcggcgcggc agatgcgggc agggtga 987
<210> 256
<211> 328
<212> PRT
<213> Rhodopseudomonas palustris
<400> 256
Met Pro Ala Arg His Pro Ala Pro Val Pro Glu Asn Ser Arg Phe Glu
1 5 10 15
Pro Glu Gln Thr Ala Ser Gly Gly Phe Met Arg Trp Pro Pro Ala Ser
20 25 30
Asp Pro Gly Ala Arg Ile Asp Phe Gly Trp Pro Ala Ile Arg Ala Ile
35 40 45
Ala Arg Gly Pro Ala Pro Asn Val Phe Ala Cys Arg Lys Trp Met Met
50 55 60
Pro Pro Phe Cys Val Pro Pro Met Ile Arg Asn Leu Val Asn Ala Ser
65 70 75 80
Ala Leu Gly Phe Val Val Ala Leu Leu His Gly Thr Ala Ala Tyr Ala
85 90 95
Ala Ala Asp Ile Ala Ser Leu Pro Arg Asp Leu Ser Ala Trp Gly Met
100 105 110
Phe Lys Asn Ala Asp Ile Val Val Lys Val Val Met Ala Gly Leu Ala
115 120 125
Leu Ala Ser Leu Ala Thr Trp Thr Val Trp Leu Ser Lys Thr Ile Glu
130 135 140
Leu Arg Arg Glu Thr Ala Arg Ala Arg Asp Gly Leu Ser Lys Leu Glu
145 150 155 160
Thr Asp Thr Thr Leu Ala Glu Leu Gly Arg Gly Ser Glu Gly Ala His
165 170 175
Asp Ala Val Ser Gln Leu Ile Gln Thr Ala Ala Arg Glu Gly Ser Leu
180 185 190
Ser Gly Trp Thr Phe Asp Ala Asp Phe Lys Glu Arg Val Ala Leu Arg
195 200 205
Leu Glu Arg Val Glu Ala Ala Met Ala Arg Lys Ile Ala Ser Gly Thr
210 215 220
Gly Ile Leu Ala Thr Val Gly Ala Val Ala Pro Phe Val Gly Leu Phe
225 230 235 240
Gly Thr Val Trp Gly Ile Met Asn Ala Phe Ile Gly Ile Ser Glu Ala
245 250 255
His Thr Thr Asn Leu Ala Val Val Ala Pro Gly Ile Ala Glu Ala Leu
260 265 270
Leu Ala Thr Ala Leu Gly Leu Val Ala Ala Val Pro Ala Val Val Ile
275 280 285
Tyr Asn Tyr Leu Val Arg Ala Ile Ala Thr Tyr Arg Ala Leu Leu Gly
290 295 300
Asp Ala Ser Ala Gln Val Leu Leu Leu Val Ser Arg Asp Arg Gly Arg
305 310 315 320
Ser Ala Arg Gln Met Arg Ala Gly
325
<210> 257
<211> 798
<212> DNA
<213> Rhodopseudomonas palustris
<400> 257
gtgcgtaaac cccaaggcgc cgcggcaggg cgggcgggcg cagcgatcgc ggcggtcgcc 60
ttcattgccg cggcgctgcc gggggatgcg tgggcggcgg ccgatcttgc gacgctgccg 120
cgcgacctgt cgccctgggg gatgttcctc ggcgccgatg cggtggtgag gaccgtgatg 180
gtcgggctgg cgctggcttc gctcgctgca tggacggtgt ggctggcgaa gtcgatcgaa 240
ctgcgccgca gcgttgcggt ggcgcagcgt ggtctcgaaa ggctggagag cgacgtcacg 300
ctgcagcagg ctgcggctga gaccgccgat cagcacgatg cggtggcgca gatgatccag 360
accgtcgatc gcgaggccag cctgtccggc ggcgcccatg acgacggctt ccgtgagcgg 420
gtggcgctgc ggctggagcg ggtcgaggct gcggaagcgc gccgcgccgc gatcggcacg 480
ggtctgctcg cgagcattgg cgcggtggcg ccgttcgtcg gcctgttcgg cacggtgtgg 540
gggatcatga acgcgttcat cggcatttcg aaagccaaca ccaccaatct tgcggtggtg 600
gcgccgggca tcgccgaggc gctgctcgcc acggcgctcg ggctcgtcgc cgcgatcccg 660
gcggtggtga tctacaatca tctgacccgg cgagtgacgg cgtatcgagc gctactcggc 720
gacgcgtcga cccaattgct gctgatgatc agccgcgagg cgacgcggcc ggcgcaacgt 780
gcccgcatgg tgaggtaa 798
<210> 258
<211> 265
<212> PRT
<213> Rhodopseudomonas palustris
<400> 258
Val Arg Lys Pro Gln Gly Ala Ala Ala Gly Arg Ala Gly Ala Ala Ile
1 5 10 15
Ala Ala Val Ala Phe Ile Ala Ala Ala Leu Pro Gly Asp Ala Trp Ala
20 25 30
Ala Ala Asp Leu Ala Thr Leu Pro Arg Asp Leu Ser Pro Trp Gly Met
35 40 45
Phe Leu Gly Ala Asp Ala Val Val Arg Thr Val Met Val Gly Leu Ala
50 55 60
Leu Ala Ser Leu Ala Ala Trp Thr Val Trp Leu Ala Lys Ser Ile Glu
65 70 75 80
Leu Arg Arg Ser Val Ala Val Ala Gln Arg Gly Leu Glu Arg Leu Glu
85 90 95
Ser Asp Val Thr Leu Gln Gln Ala Ala Ala Glu Thr Ala Asp Gln His
100 105 110
Asp Ala Val Ala Gln Met Ile Gln Thr Val Asp Arg Glu Ala Ser Leu
115 120 125
Ser Gly Gly Ala His Asp Asp Gly Phe Arg Glu Arg Val Ala Leu Arg
130 135 140
Leu Glu Arg Val Glu Ala Ala Glu Ala Arg Arg Ala Ala Ile Gly Thr
145 150 155 160
Gly Leu Leu Ala Ser Ile Gly Ala Val Ala Pro Phe Val Gly Leu Phe
165 170 175
Gly Thr Val Trp Gly Ile Met Asn Ala Phe Ile Gly Ile Ser Lys Ala
180 185 190
Asn Thr Thr Asn Leu Ala Val Val Ala Pro Gly Ile Ala Glu Ala Leu
195 200 205
Leu Ala Thr Ala Leu Gly Leu Val Ala Ala Ile Pro Ala Val Val Ile
210 215 220
Tyr Asn His Leu Thr Arg Arg Val Thr Ala Tyr Arg Ala Leu Leu Gly
225 230 235 240
Asp Ala Ser Thr Gln Leu Leu Leu Met Ile Ser Arg Glu Ala Thr Arg
245 250 255
Pro Ala Gln Arg Ala Arg Met Val Arg
260 265
<210> 259
<211> 651
<212> DNA
<213> Synechococcus elongatus
<400> 259
gtgaatattc tgacgctgtt ccaaaaaggc ggccttgcga tgctgccgct gactggcctg 60
tcgatcttgg cattgggtac catctttgag cgggcttggt tctggtacgc cctcctcaag 120
caagagagcc agatcgtcca tcgggtcttg gatgctgctg accaagattg ggacttagcg 180
gcagaagttg ccagtcgggc taagaattca ccgatcgggc gtttcctcgc ggctccgttg 240
cagttacagc agcccgatcc agagctcttc cggcttgccc tagaggcctc cgctgaagaa 300
gaacttgcca acatgcggcg tggcgacaag ctgctagagg cagtgatcgc aatttcgccg 360
ctcttgggac tgttgggaac cgtcttgggt ctgattcaaa ccctcggcaa cctgcggatt 420
ggtgatttgg gcagttcctc gactgctggc gtgagcgctg ggatcggaga agccttgatc 480
actacagcca ctggcttgat cgtggcgatc gtcgctttgg ccgcctatcg agtcttccaa 540
ggactcattg ttcagcaaat gaaagtcttc cggcgggcgg gcaatcaact cgaactgatg 600
tatcgccaag cttgggcacg gcgtggcctc cccagccagt cgctccgcta g 651
<210> 260
<211> 216
<212> PRT
<213> Synechococcus elongatus
<400> 260
Val Asn Ile Leu Thr Leu Phe Gln Lys Gly Gly Leu Ala Met Leu Pro
1 5 10 15
Leu Thr Gly Leu Ser Ile Leu Ala Leu Gly Thr Ile Phe Glu Arg Ala
20 25 30
Trp Phe Trp Tyr Ala Leu Leu Lys Gln Glu Ser Gln Ile Val His Arg
35 40 45
Val Leu Asp Ala Ala Asp Gln Asp Trp Asp Leu Ala Ala Glu Val Ala
50 55 60
Ser Arg Ala Lys Asn Ser Pro Ile Gly Arg Phe Leu Ala Ala Pro Leu
65 70 75 80
Gln Leu Gln Gln Pro Asp Pro Glu Leu Phe Arg Leu Ala Leu Glu Ala
85 90 95
Ser Ala Glu Glu Glu Leu Ala Asn Met Arg Arg Gly Asp Lys Leu Leu
100 105 110
Glu Ala Val Ile Ala Ile Ser Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gln Thr Leu Gly Asn Leu Arg Ile Gly Asp Leu Gly
130 135 140
Ser Ser Ser Thr Ala Gly Val Ser Ala Gly Ile Gly Glu Ala Leu Ile
145 150 155 160
Thr Thr Ala Thr Gly Leu Ile Val Ala Ile Val Ala Leu Ala Ala Tyr
165 170 175
Arg Val Phe Gln Gly Leu Ile Val Gln Gln Met Lys Val Phe Arg Arg
180 185 190
Ala Gly Asn Gln Leu Glu Leu Met Tyr Arg Gln Ala Trp Ala Arg Arg
195 200 205
Gly Leu Pro Ser Gln Ser Leu Arg
210 215
<210> 261
<211> 717
<212> DNA
<213> Synechococcus sp.
<400> 261
atggatagag tcttgcagct cctgatccag ggttggtact attccatccc cctgttgacg 60
ttctcagtct tctcggtggc ctgttgcatc gagcgggcct tgttttggtg gaaagtcacc 120
caccggcagg aggaggtggt gcggcaagcc ctgagccagt accgccgcaa cccacgcgct 180
gcccagtacc tgctggagca aaatgcggat ctccccattg cccgcatctt tttggccggc 240
ctggagctga acgaagccag ccccgaagat tttaagctgg ccctggagac agccttggcg 300
gcagaggtgc ccctgctgaa gcgcttcaat acggtcttcg acaccgtcat taccgttgcc 360
cccttcctgg gcctgctggg caccgttacc ggcatcatcc agatcctcag ctccatccaa 420
ctgggggata tcggcggcac cgatacgcaa ggggtagggc aggggatcgc cgaagccctc 480
tactcgaccg cttttgggct gatcgtggcc attcccactt tgctaatctc caacgtcttc 540
cgctctctgt acctgcggca gctctccaag atccaggagt acggcggcga gctggagttg 600
ctgcatcgcc agcggcaaga gatgcaagcc caacagcttt cccagtattc ttacgccaag 660
cccagcccca gcggcagctc cactcttcct ccctactccc cccttgagcc ctcctag 717
<210> 262
<211> 238
<212> PRT
<213> Synechococcus sp.
<400> 262
Met Asp Arg Val Leu Gln Leu Leu Ile Gln Gly Trp Tyr Tyr Ser Ile
1 5 10 15
Pro Leu Leu Thr Phe Ser Val Phe Ser Val Ala Cys Cys Ile Glu Arg
20 25 30
Ala Leu Phe Trp Trp Lys Val Thr His Arg Gln Glu Glu Val Val Arg
35 40 45
Gln Ala Leu Ser Gln Tyr Arg Arg Asn Pro Arg Ala Ala Gln Tyr Leu
50 55 60
Leu Glu Gln Asn Ala Asp Leu Pro Ile Ala Arg Ile Phe Leu Ala Gly
65 70 75 80
Leu Glu Leu Asn Glu Ala Ser Pro Glu Asp Phe Lys Leu Ala Leu Glu
85 90 95
Thr Ala Leu Ala Ala Glu Val Pro Leu Leu Lys Arg Phe Asn Thr Val
100 105 110
Phe Asp Thr Val Ile Thr Val Ala Pro Phe Leu Gly Leu Leu Gly Thr
115 120 125
Val Thr Gly Ile Ile Gln Ile Leu Ser Ser Ile Gln Leu Gly Asp Ile
130 135 140
Gly Gly Thr Asp Thr Gln Gly Val Gly Gln Gly Ile Ala Glu Ala Leu
145 150 155 160
Tyr Ser Thr Ala Phe Gly Leu Ile Val Ala Ile Pro Thr Leu Leu Ile
165 170 175
Ser Asn Val Phe Arg Ser Leu Tyr Leu Arg Gln Leu Ser Lys Ile Gln
180 185 190
Glu Tyr Gly Gly Glu Leu Glu Leu Leu His Arg Gln Arg Gln Glu Met
195 200 205
Gln Ala Gln Gln Leu Ser Gln Tyr Ser Tyr Ala Lys Pro Ser Pro Ser
210 215 220
Gly Ser Ser Thr Leu Pro Pro Tyr Ser Pro Leu Glu Pro Ser
225 230 235
<210> 263
<211> 648
<212> DNA
<213> Synechococcus sp.
<400> 263
atgaacatca caaatttctt tgccgccggt ggcatcgttg cttatccctt gttcctcttc 60
tctttggccg gtgtagcctg cattattgag cgagccgttt tttggtggcg gattaatcgt 120
cggcagcgtc aagttgtccg ggacgccctc ggtctatatc ggcaagatcc gttcaatgcg 180
atgaaatttt tgaagcgtaa cgcggatcta cccattgccc ggattttttt agaagccctt 240
gatttagaaa atcccaacag tgaagagttt cgtctcgccc tcgaaagtgc aacccaagcc 300
gaaatcccga ccctaaaacg gtttaatact gtgtttgaca caattattgc tgttgcgccc 360
ctactgggat tgttgggaac gatcctcggt ttgatgcaat ccttttcggc gctcaacatt 420
ggtgatgtgg gtaataccaa tgccgctggg gtgactggtg gaattagtga agcattggtt 480
tcgactgtga tgggtctggt tgtggcaatc ttcaccctgc tctttgccaa tctctttaat 540
gggttatatc aacgtaactt agcatttatc caagagtatg gtggccagtt agaattacta 600
tatcgccgct tctatgaaaa gagtgaagaa gcaattatga accgctaa 648
<210> 264
<211> 215
<212> PRT
<213> Synechococcus sp.
<400> 264
Met Asn Ile Thr Asn Phe Phe Ala Ala Gly Gly Ile Val Ala Tyr Pro
1 5 10 15
Leu Phe Leu Phe Ser Leu Ala Gly Val Ala Cys Ile Ile Glu Arg Ala
20 25 30
Val Phe Trp Trp Arg Ile Asn Arg Arg Gln Arg Gln Val Val Arg Asp
35 40 45
Ala Leu Gly Leu Tyr Arg Gln Asp Pro Phe Asn Ala Met Lys Phe Leu
50 55 60
Lys Arg Asn Ala Asp Leu Pro Ile Ala Arg Ile Phe Leu Glu Ala Leu
65 70 75 80
Asp Leu Glu Asn Pro Asn Ser Glu Glu Phe Arg Leu Ala Leu Glu Ser
85 90 95
Ala Thr Gln Ala Glu Ile Pro Thr Leu Lys Arg Phe Asn Thr Val Phe
100 105 110
Asp Thr Ile Ile Ala Val Ala Pro Leu Leu Gly Leu Leu Gly Thr Ile
115 120 125
Leu Gly Leu Met Gln Ser Phe Ser Ala Leu Asn Ile Gly Asp Val Gly
130 135 140
Asn Thr Asn Ala Ala Gly Val Thr Gly Gly Ile Ser Glu Ala Leu Val
145 150 155 160
Ser Thr Val Met Gly Leu Val Val Ala Ile Phe Thr Leu Leu Phe Ala
165 170 175
Asn Leu Phe Asn Gly Leu Tyr Gln Arg Asn Leu Ala Phe Ile Gln Glu
180 185 190
Tyr Gly Gly Gln Leu Glu Leu Leu Tyr Arg Arg Phe Tyr Glu Lys Ser
195 200 205
Glu Glu Ala Ile Met Asn Arg
210 215
<210> 265
<211> 765
<212> DNA
<213> Synechocystis sp.
<400> 265
gtgctggata attgcaagag attattattt agaaaatttc cctgttttct gtccatggcc 60
ccatcccccc tgtttttgac tcaaactccg cggctactcg atgagtttct taagggaggg 120
gtagtgatgt ttcctttgtt actgctgtcc atccttgccc ttaccactgc cttcgaacga 180
ggttggtttt ggagtcgcct actgattcaa gaagaccagg ttgtgcggga tgtgctcgat 240
gcggcggttg aggatttggt aaaggctcgg gaaattgctg aacatgctcg acatttagcc 300
attggtcgtt ttctgctggc tccccttaaa ctacgccatc ctagtccaga aactttccgt 360
ttggccatgg aagccaccgc cgataaagaa tttgcccgaa tgcgacgggg ggataaactc 420
ctggaaacta tcattgccct agctcctctc ttgggcttgt taggcaccgt aacgggctta 480
attcgcactt ttaacaatct caatatcggg ggaggaggct ccagtgcgga ggctacccag 540
gccgcctcgg gcattggaga agcgttgatt accacggcag cggggatgat ggtggcgatt 600
tttgccctgt tagtatttag ggttttggtc agtttacagt cccaacaaat ggattatttt 660
gccgcagtgg gcagtgaatt agaacttatt taccgtgagg tctggtacga acctcatcag 720
ccaatgccca atttattaat ggcggctaga attgctgagc cataa 765
<210> 266
<211> 254
<212> PRT
<213> Synechocystis sp.
<400> 266
Val Leu Asp Asn Cys Lys Arg Leu Leu Phe Arg Lys Phe Pro Cys Phe
1 5 10 15
Leu Ser Met Ala Pro Ser Pro Leu Phe Leu Thr Gln Thr Pro Arg Leu
20 25 30
Leu Asp Glu Phe Leu Lys Gly Gly Val Val Met Phe Pro Leu Leu Leu
35 40 45
Leu Ser Ile Leu Ala Leu Thr Thr Ala Phe Glu Arg Gly Trp Phe Trp
50 55 60
Ser Arg Leu Leu Ile Gln Glu Asp Gln Val Val Arg Asp Val Leu Asp
65 70 75 80
Ala Ala Val Glu Asp Leu Val Lys Ala Arg Glu Ile Ala Glu His Ala
85 90 95
Arg His Leu Ala Ile Gly Arg Phe Leu Leu Ala Pro Leu Lys Leu Arg
100 105 110
His Pro Ser Pro Glu Thr Phe Arg Leu Ala Met Glu Ala Thr Ala Asp
115 120 125
Lys Glu Phe Ala Arg Met Arg Arg Gly Asp Lys Leu Leu Glu Thr Ile
130 135 140
Ile Ala Leu Ala Pro Leu Leu Gly Leu Leu Gly Thr Val Thr Gly Leu
145 150 155 160
Ile Arg Thr Phe Asn Asn Leu Asn Ile Gly Gly Gly Gly Ser Ser Ala
165 170 175
Glu Ala Thr Gln Ala Ala Ser Gly Ile Gly Glu Ala Leu Ile Thr Thr
180 185 190
Ala Ala Gly Met Met Val Ala Ile Phe Ala Leu Leu Val Phe Arg Val
195 200 205
Leu Val Ser Leu Gln Ser Gln Gln Met Asp Tyr Phe Ala Ala Val Gly
210 215 220
Ser Glu Leu Glu Leu Ile Tyr Arg Glu Val Trp Tyr Glu Pro His Gln
225 230 235 240
Pro Met Pro Asn Leu Leu Met Ala Ala Arg Ile Ala Glu Pro
245 250
<210> 267
<211> 684
<212> DNA
<213> Synechocystis sp.
<400> 267
gtgaatccca ttgagttgat gcaaaagggc ggcgtggcca tgtggcccct gcttctccta 60
tcgattttgt ccgtcagcac catcatcgag aggttgtggt tttggggcca agtcattctc 120
aaaagctccc aaacggcttc ccgtatttta gacacggcgg cccgggattg ggatacggcc 180
attcgagtcg cccaggacag tcgtcgtttt cccattgcta aatatctgtt ggctccattg 240
cgtttgcccc acccagaccc agaggttttt cacctggcgt tggagtcggc ggcggacgat 300
caattggctc tcatgcggcg gggagacaaa attctggaag ccattattgc cctgtccccc 360
ctattgggac tgttgggtac cgtgttgggt ttgatccaat cccttagttc catccaaatt 420
agcgatttgg gtacagcttc caccgctgga gtcacccttg gtattgggga agcactgatt 480
tccacagcgg ccggtttgat catagccatt gttagtttgg ccttttaccg tgtgtttcag 540
gggctatggt tcaaccaaat gcgagtcttc cgtaaagtag gcagtgaact agaggtgctc 600
tatcgccaac gctggtttga agaggaaatg gcctacgatg acggcctaac ccccagcccg 660
gaagcggaaa gtttgcccca atag 684
<210> 268
<211> 227
<212> PRT
<213> Synechocystis sp.
<400> 268
Val Asn Pro Ile Glu Leu Met Gln Lys Gly Gly Val Ala Met Trp Pro
1 5 10 15
Leu Leu Leu Leu Ser Ile Leu Ser Val Ser Thr Ile Ile Glu Arg Leu
20 25 30
Trp Phe Trp Gly Gln Val Ile Leu Lys Ser Ser Gln Thr Ala Ser Arg
35 40 45
Ile Leu Asp Thr Ala Ala Arg Asp Trp Asp Thr Ala Ile Arg Val Ala
50 55 60
Gln Asp Ser Arg Arg Phe Pro Ile Ala Lys Tyr Leu Leu Ala Pro Leu
65 70 75 80
Arg Leu Pro His Pro Asp Pro Glu Val Phe His Leu Ala Leu Glu Ser
85 90 95
Ala Ala Asp Asp Gln Leu Ala Leu Met Arg Arg Gly Asp Lys Ile Leu
100 105 110
Glu Ala Ile Ile Ala Leu Ser Pro Leu Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gln Ser Leu Ser Ser Ile Gln Ile Ser Asp Leu Gly
130 135 140
Thr Ala Ser Thr Ala Gly Val Thr Leu Gly Ile Gly Glu Ala Leu Ile
145 150 155 160
Ser Thr Ala Ala Gly Leu Ile Ile Ala Ile Val Ser Leu Ala Phe Tyr
165 170 175
Arg Val Phe Gln Gly Leu Trp Phe Asn Gln Met Arg Val Phe Arg Lys
180 185 190
Val Gly Ser Glu Leu Glu Val Leu Tyr Arg Gln Arg Trp Phe Glu Glu
195 200 205
Glu Met Ala Tyr Asp Asp Gly Leu Thr Pro Ser Pro Glu Ala Glu Ser
210 215 220
Leu Pro Gln
225
<210> 269
<211> 855
<212> DNA
<213> Thermosynechococcus elongatus
<400> 269
atgcggttgc cgctgatagg gataaagata cactcatgcg aggtatcgct ccatgaacgt 60
aatcacctat ttagacaggg cagcaaagac aatggttcaa gacccttggc agtgcgcttt 120
gccagaattt gggaaacaat tactgctacg ggctggacta tactaaacct cggatgctct 180
aacagggaat cgatcgtgaa tatcgctgaa atttttaacc gtggtggcct ggccatgtgg 240
ccactactga tcctctcgat cttgacctta ggcaccattt ttgagcggct ttggttttgg 300
ggcatggttc tccgaggaga aaccaaactg gcagagcaaa ttctggatgc cgctcgccac 360
gattggcaag aagcgcttga gctagcagcc aatgcctgtg atcaacccat tgggcgcttc 420
ctctacactc ctttacaact gattgacacc aacccagaaa tctttcgctt ggctctagag 480
gctgcggctg atgaggaact gagtgccatg cggcgaggcg aaaaggtcct agaggcaacg 540
attacaatgg cacctctcct gggtttgttg ggaacggtgc tcggtctaat tagtgccctc 600
agttctattc gcttgggaga tattggcaca cccgcaaccc tgggcgtggg tctgggcatt 660
agtgaggcct taattagtac cgcatctggc ttggtgatcg cgattattgc ccttgccttt 720
cagcggctct ttcaagcttt tctcttgcag caggcacaaa tttttcgtcg cactggcaat 780
gaattagaac tcacctatcg ccaagcatgg cttgagcagc ggatcaaagg ggaagccgaa 840
aaaaccttgt tctaa 855
<210> 270
<211> 284
<212> PRT
<213> Thermosynechococcus elongatus
<400> 270
Met Arg Leu Pro Leu Ile Gly Ile Lys Ile His Ser Cys Glu Val Ser
1 5 10 15
Leu His Glu Arg Asn His Leu Phe Arg Gln Gly Ser Lys Asp Asn Gly
20 25 30
Ser Arg Pro Leu Ala Val Arg Phe Ala Arg Ile Trp Glu Thr Ile Thr
35 40 45
Ala Thr Gly Trp Thr Ile Leu Asn Leu Gly Cys Ser Asn Arg Glu Ser
50 55 60
Ile Val Asn Ile Ala Glu Ile Phe Asn Arg Gly Gly Leu Ala Met Trp
65 70 75 80
Pro Leu Leu Ile Leu Ser Ile Leu Thr Leu Gly Thr Ile Phe Glu Arg
85 90 95
Leu Trp Phe Trp Gly Met Val Leu Arg Gly Glu Thr Lys Leu Ala Glu
100 105 110
Gln Ile Leu Asp Ala Ala Arg His Asp Trp Gln Glu Ala Leu Glu Leu
115 120 125
Ala Ala Asn Ala Cys Asp Gln Pro Ile Gly Arg Phe Leu Tyr Thr Pro
130 135 140
Leu Gln Leu Ile Asp Thr Asn Pro Glu Ile Phe Arg Leu Ala Leu Glu
145 150 155 160
Ala Ala Ala Asp Glu Glu Leu Ser Ala Met Arg Arg Gly Glu Lys Val
165 170 175
Leu Glu Ala Thr Ile Thr Met Ala Pro Leu Leu Gly Leu Leu Gly Thr
180 185 190
Val Leu Gly Leu Ile Ser Ala Leu Ser Ser Ile Arg Leu Gly Asp Ile
195 200 205
Gly Thr Pro Ala Thr Leu Gly Val Gly Leu Gly Ile Ser Glu Ala Leu
210 215 220
Ile Ser Thr Ala Ser Gly Leu Val Ile Ala Ile Ile Ala Leu Ala Phe
225 230 235 240
Gln Arg Leu Phe Gln Ala Phe Leu Leu Gln Gln Ala Gln Ile Phe Arg
245 250 255
Arg Thr Gly Asn Glu Leu Glu Leu Thr Tyr Arg Gln Ala Trp Leu Glu
260 265 270
Gln Arg Ile Lys Gly Glu Ala Glu Lys Thr Leu Phe
275 280
<210> 271
<211> 786
<212> DNA
<213> Trichodesmium erythraeum
<400> 271
gtgacttttg aagagctgat tcagaaggga ggccccgcta tgtggccttt gttagtttta 60
tcaatcttgt cccttagtac cataattgat cgcatctggt tctggacaag tctattaatt 120
aaggaaaaac aaacggttaa tagggtatta gagtcggcac gccgtgactg gagcatagca 180
acagaaatgg caagacgtaa ccagaaacaa cctataggtc gttttttata cgcaccttta 240
cgactacaac atccagaacc ggaagtattt aagttggcac tggaggctgc tgctgatgat 300
gagttggcct caatgcgaaa gggagataag ttacttgaag gagtaattgc tttggctcct 360
atgttaggct tactgggtac tgttttaggt cttattggtt ccctaggatc aattcgtcta 420
ggtgatctgg gtacttcttc cactgctggg gtaacagtag gtattggtga agctttaatt 480
agtacagcta ctggtttggt agtagctatt tttagtctgg tattttatcg attatttcaa 540
agtttattgt ttaatcaaat gaaggttttt cggaaggctg gcaatgagtt ggagttgctc 600
taccgacaat attggcaaca ggtattttta agtagttcat cagaaaatca aaatcctggt 660
ttttctactt catttattca gaatactcag aataatataa atactttaga accagatcaa 720
aaacccacag attttttatc tgaaaatgat cctgaacaat ctcaagataa ttctcatgat 780
caatga 786
<210> 272
<211> 261
<212> PRT
<213> Trichodesmium erythraeum
<400> 272
Val Thr Phe Glu Glu Leu Ile Gln Lys Gly Gly Pro Ala Met Trp Pro
1 5 10 15
Leu Leu Val Leu Ser Ile Leu Ser Leu Ser Thr Ile Ile Asp Arg Ile
20 25 30
Trp Phe Trp Thr Ser Leu Leu Ile Lys Glu Lys Gln Thr Val Asn Arg
35 40 45
Val Leu Glu Ser Ala Arg Arg Asp Trp Ser Ile Ala Thr Glu Met Ala
50 55 60
Arg Arg Asn Gln Lys Gln Pro Ile Gly Arg Phe Leu Tyr Ala Pro Leu
65 70 75 80
Arg Leu Gln His Pro Glu Pro Glu Val Phe Lys Leu Ala Leu Glu Ala
85 90 95
Ala Ala Asp Asp Glu Leu Ala Ser Met Arg Lys Gly Asp Lys Leu Leu
100 105 110
Glu Gly Val Ile Ala Leu Ala Pro Met Leu Gly Leu Leu Gly Thr Val
115 120 125
Leu Gly Leu Ile Gly Ser Leu Gly Ser Ile Arg Leu Gly Asp Leu Gly
130 135 140
Thr Ser Ser Thr Ala Gly Val Thr Val Gly Ile Gly Glu Ala Leu Ile
145 150 155 160
Ser Thr Ala Thr Gly Leu Val Val Ala Ile Phe Ser Leu Val Phe Tyr
165 170 175
Arg Leu Phe Gln Ser Leu Leu Phe Asn Gln Met Lys Val Phe Arg Lys
180 185 190
Ala Gly Asn Glu Leu Glu Leu Leu Tyr Arg Gln Tyr Trp Gln Gln Val
195 200 205
Phe Leu Ser Ser Ser Ser Glu Asn Gln Asn Pro Gly Phe Ser Thr Ser
210 215 220
Phe Ile Gln Asn Thr Gln Asn Asn Ile Asn Thr Leu Glu Pro Asp Gln
225 230 235 240
Lys Pro Thr Asp Phe Leu Ser Glu Asn Asp Pro Glu Gln Ser Gln Asp
245 250 255
Asn Ser His Asp Gln
260
<210> 273
<211> 633
<212> DNA
<213> Chroococcales cyanobacterium
<400> 273
gttgccggtg gcattgttgc ctggccatta ctagcattct ctctcttagg agtagctctg 60
attatcgaac gttttttgtt ttggtttcag ataaaagctc gtgaaaaaag agttgtaaac 120
actgttttga aactctatca agggaatgaa ccaatggcag cgatcgccaa attaaagaaa 180
aatgctgatt tacccttgtg ccgtattttt ctagaagcat taatcctcta tgatgctact 240
cccacagagt ttcgcttagc actagaaaca gcaactcaag gtgaactccc cctcttaaaa 300
cgttttaata ctgtctttca aactatcatt gcagtatcac cgttattggg actattagga 360
accattttag gtttaatgcg ttcttttgct gctttagata ttgggaatac tggcggaaca 420
aatacaggtg cagtgactgg aggtatatca gaagctttga cttccacagt aatggggtta 480
gtggtagcta ttgcaattct attattttct aactcatttc gttctttgta tctcaaagaa 540
tttgccctaa ttcaagaata tgcaggtcaa ttagaacttt tatatcgtcg tcattacgaa 600
aaaggaaata aaccctatgc gactaccaga tga 633
<210> 274
<211> 210
<212> PRT
<213> Chroococcales cyanobacterium
<400> 274
Val Ala Gly Gly Ile Val Ala Trp Pro Leu Leu Ala Phe Ser Leu Leu
1 5 10 15
Gly Val Ala Leu Ile Ile Glu Arg Phe Leu Phe Trp Phe Gln Ile Lys
20 25 30
Ala Arg Glu Lys Arg Val Val Asn Thr Val Leu Lys Leu Tyr Gln Gly
35 40 45
Asn Glu Pro Met Ala Ala Ile Ala Lys Leu Lys Lys Asn Ala Asp Leu
50 55 60
Pro Leu Cys Arg Ile Phe Leu Glu Ala Leu Ile Leu Tyr Asp Ala Thr
65 70 75 80
Pro Thr Glu Phe Arg Leu Ala Leu Glu Thr Ala Thr Gln Gly Glu Leu
85 90 95
Pro Leu Leu Lys Arg Phe Asn Thr Val Phe Gln Thr Ile Ile Ala Val
100 105 110
Ser Pro Leu Leu Gly Leu Leu Gly Thr Ile Leu Gly Leu Met Arg Ser
115 120 125
Phe Ala Ala Leu Asp Ile Gly Asn Thr Gly Gly Thr Asn Thr Gly Ala
130 135 140
Val Thr Gly Gly Ile Ser Glu Ala Leu Thr Ser Thr Val Met Gly Leu
145 150 155 160
Val Val Ala Ile Ala Ile Leu Leu Phe Ser Asn Ser Phe Arg Ser Leu
165 170 175
Tyr Leu Lys Glu Phe Ala Leu Ile Gln Glu Tyr Ala Gly Gln Leu Glu
180 185 190
Leu Leu Tyr Arg Arg His Tyr Glu Lys Gly Asn Lys Pro Tyr Ala Thr
195 200 205
Thr Arg
210
<210> 275
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 275
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 276
<211> 1264
<212> DNA
<213> Oryza sativa
<400> 276
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatc 1264
<210> 277
<211> 51
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14244
<400> 277
ggggacaagt ttgtacaaaa aagcaggctt aaacaatggc cgggggcata g 51
<210> 278
<211> 52
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14243
<400> 278
ggggaccact ttgtacaaga aagctgggtt catcgggaag tcgcatactc tt 52
<210> 279
<211> 3419
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette pGOS2::ExbB::terminator
<400> 279
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220
tttgtacaaa aaagcaggct taaacaatgg ccgggggcat agtggcggtg cccctcctcg 2280
gtttttccct gttagctgtg gccctgatta tcgagcgtgc ctatttttgg agtcagatcc 2340
agttacggca aaatcggttg gtaaatgatg tgctcaagct ttatcgcagt aatcccccag 2400
gggcgatcgc caagctgaaa caaaatgcgg atttacccat ggcacgaatt tttctcgaag 2460
ccctgtgttt ggagggggcc acaccaacgg agtttcgcct ggccctggaa agcgctaccc 2520
aagcagaatt accgctttta aaacgattta acaccctatt tcagaccatt atcaccgttt 2580
cccctctcct gggcttactg gggacaattt tgggactaat gcgttccttt tcttccatga 2640
gtttaggcag taccaccgcc gccaatgcct cgggggtcac cggggggatc agtgaagcat 2700
tggtgtccac cgtgatgggc ttggtagttg ccattgccac tctcctcttt gccaacgtgt 2760
tccgttccct ctatctgcgc caattcgccc tcatacagga gcaaacgggg caaatcgaat 2820
tggtatatcg ccgtttccat gaccaaccgg aggaaaaaga gtatgcgact tcccgatgaa 2880
cccagctttc ttgtacaaag tggtgatatc acaagcccgg gcggtcttct agggataaca 2940
gggtaattat atccctctag atcacaagcc cgggcggtct tctacgatga ttgagtaata 3000
atgtgtcacg catcaccatg ggtggcagtg tcagtgtgag caatgacctg aatgaacaat 3060
tgaaatgaaa agaaaaaaag tactccatct gttccaaatt aaaattcatt ttaacctttt 3120
aataggttta tacaataatt gatatatgtt ttctgtatat gtctaatttg ttatcatccg 3180
ggcggtcttc tagggataac agggtaatta tatccctcta gacaacacac aacaaataag 3240
agaaaaaaca aataatatta atttgagaat gaacaaaagg accatatcat tcattaactc 3300
ttctccatcc atttccattt cacagttcga tagcgaaaac cgaataaaaa acacagtaaa 3360
ttacaagcac aacaaatggt acaagaaaaa cagttttccc aatgccataa tactcgaac 3419
<210> 280
<211> 2490
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette pRs::ExbB::terminator
<400> 280
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatcatttaa atcaactagg gatatcacaa gtttgtacaa aaaagcaggc ttaaacaatg 1320
gccgggggca tagtggcggt gcccctcctc ggtttttccc tgttagctgt ggccctgatt 1380
atcgagcgtg cctatttttg gagtcagatc cagttacggc aaaatcggtt ggtaaatgat 1440
gtgctcaagc tttatcgcag taatccccca ggggcgatcg ccaagctgaa acaaaatgcg 1500
gatttaccca tggcacgaat ttttctcgaa gccctgtgtt tggagggggc cacaccaacg 1560
gagtttcgcc tggccctgga aagcgctacc caagcagaat taccgctttt aaaacgattt 1620
aacaccctat ttcagaccat tatcaccgtt tcccctctcc tgggcttact ggggacaatt 1680
ttgggactaa tgcgttcctt ttcttccatg agtttaggca gtaccaccgc cgccaatgcc 1740
tcgggggtca ccggggggat cagtgaagca ttggtgtcca ccgtgatggg cttggtagtt 1800
gccattgcca ctctcctctt tgccaacgtg ttccgttccc tctatctgcg ccaattcgcc 1860
ctcatacagg agcaaacggg gcaaatcgaa ttggtatatc gccgtttcca tgaccaaccg 1920
gaggaaaaag agtatgcgac ttcccgatga acccagcttt cttgtacaaa gtggtgatat 1980
cacaagcccg ggcggtcttc tagggataac agggtaatta tatccctcta gatcacaagc 2040
ccgggcggtc ttctacgatg attgagtaat aatgtgtcac gcatcaccat gggtggcagt 2100
gtcagtgtga gcaatgacct gaatgaacaa ttgaaatgaa aagaaaaaaa gtactccatc 2160
tgttccaaat taaaattcat tttaaccttt taataggttt atacaataat tgatatatgt 2220
tttctgtata tgtctaattt gttatcatcc gggcggtctt ctagggataa cagggtaatt 2280
atatccctct agacaacaca caacaaataa gagaaaaaac aaataatatt aatttgagaa 2340
tgaacaaaag gaccatatca ttcattaact cttctccatc catttccatt tcacagttcg 2400
atagcgaaaa ccgaataaaa aacacagtaa attacaagca caacaaatgg tacaagaaaa 2460
acagttttcc caatgccata atactcgaac 2490
<210> 281
<211> 1389
<212> DNA
<213> Synechocystis sp.
<400> 281
atgaatacta atctcattct ggatgtggac tcctataaag tgagccactg gttgcagtat 60
cctcctgaca caacggcaat gtattcctat gtggaaagtc gtgggggaag gtatcctgtc 120
actgtctttt ttggtctcca atacatttta aagcggtatc tgactcaatc cattgaaccc 180
tggatggtgg aggaagctaa tcgccttttg acagcccatg gcttaccttt caactatggc 240
ggttggcgat acattgcgga ggatttgcag ggtcgtttac ctgtacgtat taaggcggtt 300
ccagagggct cggtcatccc ggttcataat gttttgatga cagtggaatc cacggaccca 360
aaggtttttt ggttagtttc ctggttagaa actttgttga tgcgggtttg gtatcccatt 420
acggtggcaa cccagagttg gcatttaaaa caacgcatct atcaatccct atgccgtact 480
gcggatgatc ctgatggtga aatcaatttt aaactccacg attttggggc ccggggggtt 540
tctagtggtg aatcgtccgg cattggcgga ctggctcact tagttaattt ccaaggttct 600
gacacagtaa aggccctggt gtatgggcag caatattaca actgccccat ggcggcctat 660
tcgattcccg ccgcagaaca ttccaccatt acagcttggg gaagggaagg ggaagttttg 720
gcctatgaaa atatgttgac ccagtttgcc aagccagggt cggtgttggc ggtggtttcc 780
gattcctatg atctctggaa tgccattgac catctctggg gcgatcacct aagggcacag 840
gtgcttgatt cgggggctac ggtggttatc cgtccggatt caggtgaccc ggtggccatt 900
gtggcccaaa ctttggaacg gttggaggct tgttttggca gcaccctcaa cagtaagggc 960
tttcgagttc taaatgctgt gcgggttatc caaggggatg gggttgatga agagagtatc 1020
agcgccattc tagagaagac tgagagcctt ggctttagta ctactaattt agcttttggt 1080
atggggggag ctttgttgca aaaggtgaat cgggataccc aaaaatttgc catgaagtgc 1140
agtgaggtaa cggtggagga caaggcgatc cctgtttata aagaccctgt tactgatcct 1200
ggtaaaacta gcaaaaaggg gcgattatcc ctggttaaaa ctgactctgg ttatggcact 1260
gtacccactt cttctgagga tttattgcag gttgtctatg aaaatggaca tttactgcaa 1320
gaccaatgct tggatgctat tcgtcaacga gcctggccat taatcagggt caatgttccc 1380
gcaagctag 1389
<210> 282
<211> 462
<212> PRT
<213> Synechocystis sp.
<400> 282
Met Asn Thr Asn Leu Ile Leu Asp Val Asp Ser Tyr Lys Val Ser His
1 5 10 15
Trp Leu Gln Tyr Pro Pro Asp Thr Thr Ala Met Tyr Ser Tyr Val Glu
20 25 30
Ser Arg Gly Gly Arg Tyr Pro Val Thr Val Phe Phe Gly Leu Gln Tyr
35 40 45
Ile Leu Lys Arg Tyr Leu Thr Gln Ser Ile Glu Pro Trp Met Val Glu
50 55 60
Glu Ala Asn Arg Leu Leu Thr Ala His Gly Leu Pro Phe Asn Tyr Gly
65 70 75 80
Gly Trp Arg Tyr Ile Ala Glu Asp Leu Gln Gly Arg Leu Pro Val Arg
85 90 95
Ile Lys Ala Val Pro Glu Gly Ser Val Ile Pro Val His Asn Val Leu
100 105 110
Met Thr Val Glu Ser Thr Asp Pro Lys Val Phe Trp Leu Val Ser Trp
115 120 125
Leu Glu Thr Leu Leu Met Arg Val Trp Tyr Pro Ile Thr Val Ala Thr
130 135 140
Gln Ser Trp His Leu Lys Gln Arg Ile Tyr Gln Ser Leu Cys Arg Thr
145 150 155 160
Ala Asp Asp Pro Asp Gly Glu Ile Asn Phe Lys Leu His Asp Phe Gly
165 170 175
Ala Arg Gly Val Ser Ser Gly Glu Ser Ser Gly Ile Gly Gly Leu Ala
180 185 190
His Leu Val Asn Phe Gln Gly Ser Asp Thr Val Lys Ala Leu Val Tyr
195 200 205
Gly Gln Gln Tyr Tyr Asn Cys Pro Met Ala Ala Tyr Ser Ile Pro Ala
210 215 220
Ala Glu His Ser Thr Ile Thr Ala Trp Gly Arg Glu Gly Glu Val Leu
225 230 235 240
Ala Tyr Glu Asn Met Leu Thr Gln Phe Ala Lys Pro Gly Ser Val Leu
245 250 255
Ala Val Val Ser Asp Ser Tyr Asp Leu Trp Asn Ala Ile Asp His Leu
260 265 270
Trp Gly Asp His Leu Arg Ala Gln Val Leu Asp Ser Gly Ala Thr Val
275 280 285
Val Ile Arg Pro Asp Ser Gly Asp Pro Val Ala Ile Val Ala Gln Thr
290 295 300
Leu Glu Arg Leu Glu Ala Cys Phe Gly Ser Thr Leu Asn Ser Lys Gly
305 310 315 320
Phe Arg Val Leu Asn Ala Val Arg Val Ile Gln Gly Asp Gly Val Asp
325 330 335
Glu Glu Ser Ile Ser Ala Ile Leu Glu Lys Thr Glu Ser Leu Gly Phe
340 345 350
Ser Thr Thr Asn Leu Ala Phe Gly Met Gly Gly Ala Leu Leu Gln Lys
355 360 365
Val Asn Arg Asp Thr Gln Lys Phe Ala Met Lys Cys Ser Glu Val Thr
370 375 380
Val Glu Asp Lys Ala Ile Pro Val Tyr Lys Asp Pro Val Thr Asp Pro
385 390 395 400
Gly Lys Thr Ser Lys Lys Gly Arg Leu Ser Leu Val Lys Thr Asp Ser
405 410 415
Gly Tyr Gly Thr Val Pro Thr Ser Ser Glu Asp Leu Leu Gln Val Val
420 425 430
Tyr Glu Asn Gly His Leu Leu Gln Asp Gln Cys Leu Asp Ala Ile Arg
435 440 445
Gln Arg Ala Trp Pro Leu Ile Arg Val Asn Val Pro Ala Ser
450 455 460
<210> 283
<211> 1494
<212> DNA
<213> Aureococcus anophagefferens
<400> 283
atggacaaca tcctcctgct cacggactcc tacaaggtca gccactggaa gcagtacccg 60
gcgaagacga cgacggtcta tagctacttc gagtcccgcg gcggcaagta cgacgaggtc 120
gtcttcttcg gcctccagta ctacgtcaag aagtacctcg tcggcgagca ggtcacgaag 180
gcgaagatcg acgaggcgga gcggttctac ggcgagcact tcccgccggg cttcgagttt 240
aaccgcgcgg gctgggagca catcctcgag aagcacggcg gccggctgcc gctgcgcatc 300
aaggccgcgc ccgagggcac ggtcgtcggc gcgaagaacg tgctcatgac cgtcgagaac 360
acggacccgg cgtgcttctg gctcacgaac tttgtggaga cgctcctggt ccaggtctgg 420
tacccgatga ccgtggcgac gcactcgcgg gagcagaaga aggtcgtggc caagtacttg 480
gatgtgacgg gcgacgtcgc cggcctgggc ttcaagctcc acgacttcgg gttccgcggc 540
gtgtcgtccg tcgagaccgc cggcgtcggg tcctgcgcgc acctcgtcaa cttcctgggc 600
acggacacgg tcgcgggtct cgtcgtggcc aaggactact acggcgccga gtccgcggcg 660
gggttcagca tccccgcgtc ggagcactcg acgatcacgt cgtggggcga gagccgggaa 720
gtcgacgcga tgcggaacat gctcgaggtc tacccggcgg gcctcgtggc ctgcgtctcc 780
gactcctacg acatcttcaa ggcctgcggc gacctgtggg gcacgcagct caaggacgcg 840
gtgctcgcgc gcgacgggtg cctcgtcgtc cggcccgact cgggcgaccc gccgtcgacg 900
gcgatgcgcg tgctgaccat cctcggcgac aagttcggca aggagaagaa cgacaagggc 960
tactgggtcc tcgacagcca cgtgcgcgtc atctggggcg acggcatcga ctacgagatg 1020
atctgcgccg tgctgtcgac gctcgcggac gcgggctggt ccgcggacaa catcggcttc 1080
ggctccggcg gcggcctgct ccagaagctg aaccgcgaca cgcagaagtg cgccttcaag 1140
tgctcgtcca tcgtcgtcga cggcgcggcg cgcgacgtct tcaaggaccc cgtcacggac 1200
aagggcaagg cgtcgaagaa ggggcgcctc gcgctcgtgg acgtcgacgg gacgctgacg 1260
acgaagacgc agtgcgcgcc ggggcccgtc gagggcgacg tgctcgcgac cgtcttcgag 1320
gacggcgcgc tcctcgtcga cgacacgctc gagaccgtcc gcgagcgcgc ggcgctgccg 1380
ccgctggaca cgttgccgct gccccgcggc aagagcgccg cgccgccgcc gccgttgaag 1440
aagcccgagg tcctcgccgc gtgcccgacg ctcggcggca tgctcggctt ctag 1494
<210> 284
<211> 497
<212> PRT
<213> Aureococcus anophagefferens
<400> 284
Met Asp Asn Ile Leu Leu Leu Thr Asp Ser Tyr Lys Val Ser His Trp
1 5 10 15
Lys Gln Tyr Pro Ala Lys Thr Thr Thr Val Tyr Ser Tyr Phe Glu Ser
20 25 30
Arg Gly Gly Lys Tyr Asp Glu Val Val Phe Phe Gly Leu Gln Tyr Tyr
35 40 45
Val Lys Lys Tyr Leu Val Gly Glu Gln Val Thr Lys Ala Lys Ile Asp
50 55 60
Glu Ala Glu Arg Phe Tyr Gly Glu His Phe Pro Pro Gly Phe Glu Phe
65 70 75 80
Asn Arg Ala Gly Trp Glu His Ile Leu Glu Lys His Gly Gly Arg Leu
85 90 95
Pro Leu Arg Ile Lys Ala Ala Pro Glu Gly Thr Val Val Gly Ala Lys
100 105 110
Asn Val Leu Met Thr Val Glu Asn Thr Asp Pro Ala Cys Phe Trp Leu
115 120 125
Thr Asn Phe Val Glu Thr Leu Leu Val Gln Val Trp Tyr Pro Met Thr
130 135 140
Val Ala Thr His Ser Arg Glu Gln Lys Lys Val Val Ala Lys Tyr Leu
145 150 155 160
Asp Val Thr Gly Asp Val Ala Gly Leu Gly Phe Lys Leu His Asp Phe
165 170 175
Gly Phe Arg Gly Val Ser Ser Val Glu Thr Ala Gly Val Gly Ser Cys
180 185 190
Ala His Leu Val Asn Phe Leu Gly Thr Asp Thr Val Ala Gly Leu Val
195 200 205
Val Ala Lys Asp Tyr Tyr Gly Ala Glu Ser Ala Ala Gly Phe Ser Ile
210 215 220
Pro Ala Ser Glu His Ser Thr Ile Thr Ser Trp Gly Glu Ser Arg Glu
225 230 235 240
Val Asp Ala Met Arg Asn Met Leu Glu Val Tyr Pro Ala Gly Leu Val
245 250 255
Ala Cys Val Ser Asp Ser Tyr Asp Ile Phe Lys Ala Cys Gly Asp Leu
260 265 270
Trp Gly Thr Gln Leu Lys Asp Ala Val Leu Ala Arg Asp Gly Cys Leu
275 280 285
Val Val Arg Pro Asp Ser Gly Asp Pro Pro Ser Thr Ala Met Arg Val
290 295 300
Leu Thr Ile Leu Gly Asp Lys Phe Gly Lys Glu Lys Asn Asp Lys Gly
305 310 315 320
Tyr Trp Val Leu Asp Ser His Val Arg Val Ile Trp Gly Asp Gly Ile
325 330 335
Asp Tyr Glu Met Ile Cys Ala Val Leu Ser Thr Leu Ala Asp Ala Gly
340 345 350
Trp Ser Ala Asp Asn Ile Gly Phe Gly Ser Gly Gly Gly Leu Leu Gln
355 360 365
Lys Leu Asn Arg Asp Thr Gln Lys Cys Ala Phe Lys Cys Ser Ser Ile
370 375 380
Val Val Asp Gly Ala Ala Arg Asp Val Phe Lys Asp Pro Val Thr Asp
385 390 395 400
Lys Gly Lys Ala Ser Lys Lys Gly Arg Leu Ala Leu Val Asp Val Asp
405 410 415
Gly Thr Leu Thr Thr Lys Thr Gln Cys Ala Pro Gly Pro Val Glu Gly
420 425 430
Asp Val Leu Ala Thr Val Phe Glu Asp Gly Ala Leu Leu Val Asp Asp
435 440 445
Thr Leu Glu Thr Val Arg Glu Arg Ala Ala Leu Pro Pro Leu Asp Thr
450 455 460
Leu Pro Leu Pro Arg Gly Lys Ser Ala Ala Pro Pro Pro Pro Leu Lys
465 470 475 480
Lys Pro Glu Val Leu Ala Ala Cys Pro Thr Leu Gly Gly Met Leu Gly
485 490 495
Phe
<210> 285
<211> 1428
<212> DNA
<213> Burkholderia phytofirmans
<400> 285
atgcaaaacg agtccagcgg tcccgacgat atcgcgtcga tcctgtccaa tccgatcctc 60
aacacggatt cgtacaaggc gtcgcactac ctgcaatatc cgcccgaagc gtcggcgatg 120
ttttcataca tcgaatcgcg cggcgggcgc tacgaccgca cgctgttctt cggcctgcag 180
atgctgatca aggaatatct gtgccgaccg atcacgccgg ccatgatcga gcaggccaag 240
gcatttttca cggcgcacgg cgagccgttc aacgaagcgg gctggcgcta catcgtcgaa 300
catcacggcg gctatctgcc ggtgcgcatc cgtgcggtgc cggaaggctc ggtcgtgccg 360
acacacaacg tgctcgtcac ggtggaatgc gacgacccgc aggtgttctg gctggcgtcg 420
tatctggaga ccatgctgct gcgcgtgtgg tatccgatta cggtcgcgac acaaagctgg 480
catctgcgcg agacgatacg cggctatctg ctgaagagca gcgacgacct cgcgcaattg 540
ccgttcaagc tgcacgactt cggcgcgcgc ggcgtgtcga gcgcggagtc ggcggcgatc 600
ggcggcgcgg cgcatctcgt cagcttcatg ggctcggata ccgtgctcgg tgtggtcgcg 660
gcgaaccact actacaacga aaccatggcg gcgttttccg tgccggcggc ggagcacagc 720
acgatcacct cgtggggccg cgagcgcgaa accgacgcgt ttcgcaacat gatcgcgcgc 780
ttcggcaagc cgggcgcaat cgtgtcggtg gtatccgact cctatgatct gttcgccgcg 840
ctgaacgcct ggggcacgga gttaaagcag gcggtgctcg actccggcgg cacgctggtc 900
atccggcccg actctggcga tccgcaaacc atcgtgctgc aaacgctgcg ggcattggag 960
gcgtcgttcg gatcggtggt gaacggcaaa gggcggcgtg tgctcaacaa cgtgcgcgtg 1020
atccagggcg acggcgtcaa tcccgattcg atcgaagcaa ctctcgccac catggaccag 1080
gccggtttcg ctacggacaa catcgtgttc ggcatgggcg gtgcgctgtt gcagcagatc 1140
aatcgcgaca cgcagcgctt cgcgatgaag tgctcggcaa tccggttagg cgacgagtgg 1200
cacgacgtgc tcaaggaccc tgtcacggac gccggaaagc gctccatgaa agggcggctg 1260
acgctgctga agaatcacca cacgggcgag tatcgaacga ccacgctgcc cgttgccgtc 1320
gaaggcgatt gggaagaagc gttggtgaca gtgttcgatt ccggcaagct gctggtcgat 1380
atgtcgcttg ctgaaatcag aagccgcgct cacgcgcacg aaggctaa 1428
<210> 286
<211> 475
<212> PRT
<213> Burkholderia phytofirmans
<400> 286
Met Gln Asn Glu Ser Ser Gly Pro Asp Asp Ile Ala Ser Ile Leu Ser
1 5 10 15
Asn Pro Ile Leu Asn Thr Asp Ser Tyr Lys Ala Ser His Tyr Leu Gln
20 25 30
Tyr Pro Pro Glu Ala Ser Ala Met Phe Ser Tyr Ile Glu Ser Arg Gly
35 40 45
Gly Arg Tyr Asp Arg Thr Leu Phe Phe Gly Leu Gln Met Leu Ile Lys
50 55 60
Glu Tyr Leu Cys Arg Pro Ile Thr Pro Ala Met Ile Glu Gln Ala Lys
65 70 75 80
Ala Phe Phe Thr Ala His Gly Glu Pro Phe Asn Glu Ala Gly Trp Arg
85 90 95
Tyr Ile Val Glu His His Gly Gly Tyr Leu Pro Val Arg Ile Arg Ala
100 105 110
Val Pro Glu Gly Ser Val Val Pro Thr His Asn Val Leu Val Thr Val
115 120 125
Glu Cys Asp Asp Pro Gln Val Phe Trp Leu Ala Ser Tyr Leu Glu Thr
130 135 140
Met Leu Leu Arg Val Trp Tyr Pro Ile Thr Val Ala Thr Gln Ser Trp
145 150 155 160
His Leu Arg Glu Thr Ile Arg Gly Tyr Leu Leu Lys Ser Ser Asp Asp
165 170 175
Leu Ala Gln Leu Pro Phe Lys Leu His Asp Phe Gly Ala Arg Gly Val
180 185 190
Ser Ser Ala Glu Ser Ala Ala Ile Gly Gly Ala Ala His Leu Val Ser
195 200 205
Phe Met Gly Ser Asp Thr Val Leu Gly Val Val Ala Ala Asn His Tyr
210 215 220
Tyr Asn Glu Thr Met Ala Ala Phe Ser Val Pro Ala Ala Glu His Ser
225 230 235 240
Thr Ile Thr Ser Trp Gly Arg Glu Arg Glu Thr Asp Ala Phe Arg Asn
245 250 255
Met Ile Ala Arg Phe Gly Lys Pro Gly Ala Ile Val Ser Val Val Ser
260 265 270
Asp Ser Tyr Asp Leu Phe Ala Ala Leu Asn Ala Trp Gly Thr Glu Leu
275 280 285
Lys Gln Ala Val Leu Asp Ser Gly Gly Thr Leu Val Ile Arg Pro Asp
290 295 300
Ser Gly Asp Pro Gln Thr Ile Val Leu Gln Thr Leu Arg Ala Leu Glu
305 310 315 320
Ala Ser Phe Gly Ser Val Val Asn Gly Lys Gly Arg Arg Val Leu Asn
325 330 335
Asn Val Arg Val Ile Gln Gly Asp Gly Val Asn Pro Asp Ser Ile Glu
340 345 350
Ala Thr Leu Ala Thr Met Asp Gln Ala Gly Phe Ala Thr Asp Asn Ile
355 360 365
Val Phe Gly Met Gly Gly Ala Leu Leu Gln Gln Ile Asn Arg Asp Thr
370 375 380
Gln Arg Phe Ala Met Lys Cys Ser Ala Ile Arg Leu Gly Asp Glu Trp
385 390 395 400
His Asp Val Leu Lys Asp Pro Val Thr Asp Ala Gly Lys Arg Ser Met
405 410 415
Lys Gly Arg Leu Thr Leu Leu Lys Asn His His Thr Gly Glu Tyr Arg
420 425 430
Thr Thr Thr Leu Pro Val Ala Val Glu Gly Asp Trp Glu Glu Ala Leu
435 440 445
Val Thr Val Phe Asp Ser Gly Lys Leu Leu Val Asp Met Ser Leu Ala
450 455 460
Glu Ile Arg Ser Arg Ala His Ala His Glu Gly
465 470 475
<210> 287
<211> 1521
<212> DNA
<213> Chlamydomonas reinhardtii
<400> 287
atgcttcctg tcggtgttcc cataagcgtc ttgacggaca gttacaaggc gacacacttc 60
ctgcaatatc ctaaagctca gaagatggtc gcgtatggcg agttccgtca aggattcaat 120
aaggataaga cagacacacg tttggtgtcc tacggcatgc ggtacctagt tgaaacctat 180
atcagccggc agtggacgat ggaggacgtg gagatggccg acgcgttcta ccggacgcat 240
atggcgccaa accacacggc gtttcccttc ccgcgcgccc tcttcgagaa gttcgtgcgg 300
gaaaacaacg gtttcttccc cgtgaagttg gagacgttgc ccgagggcac ttgtgcacat 360
gtgcgggtgc ccgtgtacca gatcaccgcg gtcggcgagt acgcgccgct atgcacgttc 420
ttggagacca tcctgaccat gatctggtac cccacctccg tcgcaacgct ctcccgccgc 480
gcgcgcgatg tggtggaggc cagcttcgcg cgcactagcg acggcggcgt gggcagcccg 540
ctggtgcaga gcaagctgca cgacttcggc ttccgcggct gcaccggcgt ggagcagtcc 600
atcatcggcg gctgcgcgca cttgctcagc ttcacgggca gcgacaccat gtcggcggcc 660
ttctacgcgc agttcaagct gaacggcggg cggcctgtgg cgatgtccat ccccgccacg 720
gagcacagcg tcatgacggc ctggcccacc gaggccgctg ccatgaacaa catgatcgac 780
cactttggca ccggcatcta tgcctgcgtc atggacagct acgactacgc caaggcgctg 840
tcggaggtgc tgccgtccgt gtcggtgcac aagctgagca agggcggcta cctggtgctg 900
cggccagaca gcggcgaccc cacggaggcg gtgctcatgg cgctggcggc ggcggagaag 960
gtgtttggca ccacgcgcaa cggcaagggc ttcaaggtca tccccggctg cggcgtcatc 1020
cagggcgacg gcatcgattt gcccaccatg gagaagatcg cactcgcaat tgaggccgcg 1080
ggctacgccg ccgacaacgt gtcttacggc atgggcggcg ggctgctgca gaaggtgaac 1140
cgcgacacca tgtccttcgc cacgaagctc aaccacatca tctacgagga cggccgcgcc 1200
gccgacatca tgaagcagcc gcagaccgac accggcaagt tctcgctgcc aggcgtgctg 1260
gcggtgaagc gcgtggacgg cgtgcccacg gtgttccccg ccgacagcgg cgaggtggcc 1320
ccgcacgaga acctgctgcg ggtggtgtac gactgcggcc cgctggcggg cgtgtgggag 1380
gacttcgaca ccgtgcgcgc gcgtgtggcg gcggagtgga cggcgctgcc caagacgtcg 1440
gacaacatca gcgccagcct gaaggagaag gtgcggcagc aaatggcgct acgcggcaag 1500
gtgccggcgt tggcccacta g 1521
<210> 288
<211> 506
<212> PRT
<213> Chlamydomonas reinhardtii
<400> 288
Met Leu Pro Val Gly Val Pro Ile Ser Val Leu Thr Asp Ser Tyr Lys
1 5 10 15
Ala Thr His Phe Leu Gln Tyr Pro Lys Ala Gln Lys Met Val Ala Tyr
20 25 30
Gly Glu Phe Arg Gln Gly Phe Asn Lys Asp Lys Thr Asp Thr Arg Leu
35 40 45
Val Ser Tyr Gly Met Arg Tyr Leu Val Glu Thr Tyr Ile Ser Arg Gln
50 55 60
Trp Thr Met Glu Asp Val Glu Met Ala Asp Ala Phe Tyr Arg Thr His
65 70 75 80
Met Ala Pro Asn His Thr Ala Phe Pro Phe Pro Arg Ala Leu Phe Glu
85 90 95
Lys Phe Val Arg Glu Asn Asn Gly Phe Phe Pro Val Lys Leu Glu Thr
100 105 110
Leu Pro Glu Gly Thr Cys Ala His Val Arg Val Pro Val Tyr Gln Ile
115 120 125
Thr Ala Val Gly Glu Tyr Ala Pro Leu Cys Thr Phe Leu Glu Thr Ile
130 135 140
Leu Thr Met Ile Trp Tyr Pro Thr Ser Val Ala Thr Leu Ser Arg Arg
145 150 155 160
Ala Arg Asp Val Val Glu Ala Ser Phe Ala Arg Thr Ser Asp Gly Gly
165 170 175
Val Gly Ser Pro Leu Val Gln Ser Lys Leu His Asp Phe Gly Phe Arg
180 185 190
Gly Cys Thr Gly Val Glu Gln Ser Ile Ile Gly Gly Cys Ala His Leu
195 200 205
Leu Ser Phe Thr Gly Ser Asp Thr Met Ser Ala Ala Phe Tyr Ala Gln
210 215 220
Phe Lys Leu Asn Gly Gly Arg Pro Val Ala Met Ser Ile Pro Ala Thr
225 230 235 240
Glu His Ser Val Met Thr Ala Trp Pro Thr Glu Ala Ala Ala Met Asn
245 250 255
Asn Met Ile Asp His Phe Gly Thr Gly Ile Tyr Ala Cys Val Met Asp
260 265 270
Ser Tyr Asp Tyr Ala Lys Ala Leu Ser Glu Val Leu Pro Ser Val Ser
275 280 285
Val His Lys Leu Ser Lys Gly Gly Tyr Leu Val Leu Arg Pro Asp Ser
290 295 300
Gly Asp Pro Thr Glu Ala Val Leu Met Ala Leu Ala Ala Ala Glu Lys
305 310 315 320
Val Phe Gly Thr Thr Arg Asn Gly Lys Gly Phe Lys Val Ile Pro Gly
325 330 335
Cys Gly Val Ile Gln Gly Asp Gly Ile Asp Leu Pro Thr Met Glu Lys
340 345 350
Ile Ala Leu Ala Ile Glu Ala Ala Gly Tyr Ala Ala Asp Asn Val Ser
355 360 365
Tyr Gly Met Gly Gly Gly Leu Leu Gln Lys Val Asn Arg Asp Thr Met
370 375 380
Ser Phe Ala Thr Lys Leu Asn His Ile Ile Tyr Glu Asp Gly Arg Ala
385 390 395 400
Ala Asp Ile Met Lys Gln Pro Gln Thr Asp Thr Gly Lys Phe Ser Leu
405 410 415
Pro Gly Val Leu Ala Val Lys Arg Val Asp Gly Val Pro Thr Val Phe
420 425 430
Pro Ala Asp Ser Gly Glu Val Ala Pro His Glu Asn Leu Leu Arg Val
435 440 445
Val Tyr Asp Cys Gly Pro Leu Ala Gly Val Trp Glu Asp Phe Asp Thr
450 455 460
Val Arg Ala Arg Val Ala Ala Glu Trp Thr Ala Leu Pro Lys Thr Ser
465 470 475 480
Asp Asn Ile Ser Ala Ser Leu Lys Glu Lys Val Arg Gln Gln Met Ala
485 490 495
Leu Arg Gly Lys Val Pro Ala Leu Ala His
500 505
<210> 289
<211> 1938
<212> DNA
<213> Chlorella vulgaris
<400> 289
atgcacgtgt acccagtctt gctgcttttg aaccaggcaa agattggcag tagccagata 60
gagaacatca acaatgacgc aaaacgggac ctgcttgccg ctctgtcgtc cgtacaggac 120
aatggcgtgt atggaataga gagtgcccag cgagatgagc tactgaagag gattgaggac 180
ctggaggcat gcaatcctct ggaggctccc actgagcact tggatcagtg ccatggctcc 240
tggcgcctgc tgttctctac agtcaccatc ctgggacgga ggaggatcaa gctagggctg 300
agaaacattg tcaatgtggg ggcgctcaca cagcacattg acattgtcac tcgccacacg 360
gtgaataagg tcaatttcga cattctggtg tttggaaagt tcaagggtgc cttgactatt 420
gaagccagct atgagccggt gtccccaacc agagtagcca tcaagctgga gaaggcgaca 480
ctgtacgggg aatttcgctc gggatatgga ggtgacaacg aagacacgcg catggtgttc 540
tttgggatgc gatacattct ggagaattac ttgttgcggc agtggactgt cgaggatgtg 600
gagaaatctg agaagttcta caggacacat atggcgccgg ccatgactgc attccccttc 660
ccaatggact tatttatgcg cttcattgaa aaacatgatg gttacttccc tatcaggctt 720
gaagcgttgc ccgaggggac ttgcataaat gcccatgttc cagtctatca gatcacatca 780
accggggagt ttgccccact ttgcacatac cttgagacaa tattgacaat gatctggtac 840
cccacaactg tagcaacgct gagcagacga gcccgcgatg ttatagaggc agcctttgag 900
cagagcgtgg acgacggtgc tgcgtcgccg ctggtgccct ccaagctcca tgactttggc 960
ttcaggggct gctgcactgt cgagcagagc gtgctgggcg gagtggccca tctgctcaac 1020
tttgatggca cagacaccct atctgccgcc tactacgcac aggcatgcgc atctccaatc 1080
tttgagttga acgatggaga gccggttgga gtcagcatac cggcgacaga gcacagcgtg 1140
atgacggcgt ggcccagcga aagagaggcc atcctcaaca tgatctccca ctttggcagc 1200
ggcatctttg cctgtgtcat ggactcatat gactatgcaa aggcactggc agaggtggtg 1260
ccaagcattg cacaggaaaa ggtaggagca ggcggctaca tggtgctcag gccagactct 1320
ggggatccta tagaagctgt cttggcagcg ctggatgctg cggagaaggt gtttggggtg 1380
gacacaaaca agaaggggta caaggtgcct tgtggttgtg gagtcatcca gggcgatggc 1440
ataaaccttc gaatgctgtc caagattctg acagccgtca tggagaaggg atatagcgct 1500
gaggctgttg cgtttgggat gggcggcgga ctactgcaga aagtgaacag ggacacgctg 1560
tcctttgcta ccaagctgag ccacatagtg tatgcggacg gcacccctgc tgacatcatg 1620
aaggcaccag tcggcgactc tgccaagatt tcatttccag gggctcttgc agtcaaacgt 1680
gtgggtggtg ttcctactgt cttcccagct gaaggagggc acgtggcatc agaagagaac 1740
ttgctgcagg ttgtatacga ccacggacca gttcagaaca attggaagag tctcacgaag 1800
cttcggcagc aggttgctga ggaatggacg gcgcttccta aagcaccaat tgtggtcagt 1860
gaggccctat cggagaaggt ggcaaagtct tttgcatatg agttcggctt tgcaaattct 1920
ttgggcctcc atccttga 1938
<210> 290
<211> 645
<212> PRT
<213> Chlorella vulgaris
<400> 290
Met His Val Tyr Pro Val Leu Leu Leu Leu Asn Gln Ala Lys Ile Gly
1 5 10 15
Ser Ser Gln Ile Glu Asn Ile Asn Asn Asp Ala Lys Arg Asp Leu Leu
20 25 30
Ala Ala Leu Ser Ser Val Gln Asp Asn Gly Val Tyr Gly Ile Glu Ser
35 40 45
Ala Gln Arg Asp Glu Leu Leu Lys Arg Ile Glu Asp Leu Glu Ala Cys
50 55 60
Asn Pro Leu Glu Ala Pro Thr Glu His Leu Asp Gln Cys His Gly Ser
65 70 75 80
Trp Arg Leu Leu Phe Ser Thr Val Thr Ile Leu Gly Arg Arg Arg Ile
85 90 95
Lys Leu Gly Leu Arg Asn Ile Val Asn Val Gly Ala Leu Thr Gln His
100 105 110
Ile Asp Ile Val Thr Arg His Thr Val Asn Lys Val Asn Phe Asp Ile
115 120 125
Leu Val Phe Gly Lys Phe Lys Gly Ala Leu Thr Ile Glu Ala Ser Tyr
130 135 140
Glu Pro Val Ser Pro Thr Arg Val Ala Ile Lys Leu Glu Lys Ala Thr
145 150 155 160
Leu Tyr Gly Glu Phe Arg Ser Gly Tyr Gly Gly Asp Asn Glu Asp Thr
165 170 175
Arg Met Val Phe Phe Gly Met Arg Tyr Ile Leu Glu Asn Tyr Leu Leu
180 185 190
Arg Gln Trp Thr Val Glu Asp Val Glu Lys Ser Glu Lys Phe Tyr Arg
195 200 205
Thr His Met Ala Pro Ala Met Thr Ala Phe Pro Phe Pro Met Asp Leu
210 215 220
Phe Met Arg Phe Ile Glu Lys His Asp Gly Tyr Phe Pro Ile Arg Leu
225 230 235 240
Glu Ala Leu Pro Glu Gly Thr Cys Ile Asn Ala His Val Pro Val Tyr
245 250 255
Gln Ile Thr Ser Thr Gly Glu Phe Ala Pro Leu Cys Thr Tyr Leu Glu
260 265 270
Thr Ile Leu Thr Met Ile Trp Tyr Pro Thr Thr Val Ala Thr Leu Ser
275 280 285
Arg Arg Ala Arg Asp Val Ile Glu Ala Ala Phe Glu Gln Ser Val Asp
290 295 300
Asp Gly Ala Ala Ser Pro Leu Val Pro Ser Lys Leu His Asp Phe Gly
305 310 315 320
Phe Arg Gly Cys Cys Thr Val Glu Gln Ser Val Leu Gly Gly Val Ala
325 330 335
His Leu Leu Asn Phe Asp Gly Thr Asp Thr Leu Ser Ala Ala Tyr Tyr
340 345 350
Ala Gln Ala Cys Ala Ser Pro Ile Phe Glu Leu Asn Asp Gly Glu Pro
355 360 365
Val Gly Val Ser Ile Pro Ala Thr Glu His Ser Val Met Thr Ala Trp
370 375 380
Pro Ser Glu Arg Glu Ala Ile Leu Asn Met Ile Ser His Phe Gly Ser
385 390 395 400
Gly Ile Phe Ala Cys Val Met Asp Ser Tyr Asp Tyr Ala Lys Ala Leu
405 410 415
Ala Glu Val Val Pro Ser Ile Ala Gln Glu Lys Val Gly Ala Gly Gly
420 425 430
Tyr Met Val Leu Arg Pro Asp Ser Gly Asp Pro Ile Glu Ala Val Leu
435 440 445
Ala Ala Leu Asp Ala Ala Glu Lys Val Phe Gly Val Asp Thr Asn Lys
450 455 460
Lys Gly Tyr Lys Val Pro Cys Gly Cys Gly Val Ile Gln Gly Asp Gly
465 470 475 480
Ile Asn Leu Arg Met Leu Ser Lys Ile Leu Thr Ala Val Met Glu Lys
485 490 495
Gly Tyr Ser Ala Glu Ala Val Ala Phe Gly Met Gly Gly Gly Leu Leu
500 505 510
Gln Lys Val Asn Arg Asp Thr Leu Ser Phe Ala Thr Lys Leu Ser His
515 520 525
Ile Val Tyr Ala Asp Gly Thr Pro Ala Asp Ile Met Lys Ala Pro Val
530 535 540
Gly Asp Ser Ala Lys Ile Ser Phe Pro Gly Ala Leu Ala Val Lys Arg
545 550 555 560
Val Gly Gly Val Pro Thr Val Phe Pro Ala Glu Gly Gly His Val Ala
565 570 575
Ser Glu Glu Asn Leu Leu Gln Val Val Tyr Asp His Gly Pro Val Gln
580 585 590
Asn Asn Trp Lys Ser Leu Thr Lys Leu Arg Gln Gln Val Ala Glu Glu
595 600 605
Trp Thr Ala Leu Pro Lys Ala Pro Ile Val Val Ser Glu Ala Leu Ser
610 615 620
Glu Lys Val Ala Lys Ser Phe Ala Tyr Glu Phe Gly Phe Ala Asn Ser
625 630 635 640
Leu Gly Leu His Pro
645
<210> 291
<211> 1500
<212> DNA
<213> Chlorella sp.
<400> 291
atgttctcac gcaagcaccg gcggcaggag caggcggcgc cagccaaggc ggaggcagcc 60
gccgctgtcg ccgttgccgc cgcgccggcc accaccgcag cgccccactt gctcaccagc 120
tacctcccca tcgcgtatgg ggagttccgc caggggtatg acaaggacac gagggacacg 180
cgggcggtgt tctatggcct gcgatacatc ctggaaaact ttgtggcccg gcggtggacc 240
ctgcaggatg tggagctggc agaccgcttt ttcggctcgc acatggcccc cggatacacc 300
gccttcccct acccaaagga cctcttcctc aagttcatcg ccgagaacga cggctacatg 360
ccggtgcggg tggaggcgct gcctgagggc acgtgcatgc acgcccatgt gcccgtcttc 420
cagctgacgg ctgaggcgcc ctacgccccg ctctgcacct acctggagac gctgctgacc 480
cagctgtggt accccaccac agtggccacc cttagccggc ggtgcaagga cctgatagcg 540
gcagcgtttg agcagagcgt ggatgccggc cgttccagcc cgctcctcaa cagccggctg 600
cacgactttg ggttcagggg ttgcacctgc gtggagcaga gcgtgctggg aggggtggcg 660
cacttgctca actttgatgg cacagacacg ctgtcggcgg cttactacgc ccagtttgcg 720
ctcaacggcg gcaggccggt ggggcagagc atccccgcca ccgagcacag cgtcatgacc 780
agctggccgt cagagcgtgc cgccatctcc aacatggtgt cccactttgg ccgcggcctg 840
tttgccaccg tcatggactc ttacgactac cagcgggcgc tggacgaggt ggtgcctgcg 900
gtggctgagg agaagaacgc gcagggcggc ttctgggtgc tgcggccaga ctcaggggac 960
ccaacagagg cagtgcttca gggcctgcgg ggcgcggagc gcgcgtttgg ggcggacgtc 1020
aacggcaagg ggttcaaggt gctgcgaggc gtcggcgtca tccagggaga cggcattgac 1080
taccacaaca tcgaggccat cctagaggcg gtgctggcag cagggtacag cgcagagaac 1140
gtggcgtttg gcatgggcgg cggcctgctg cagcgcctca accccgtgga tgtgatgaag 1200
gcgcccaaga ctggcccgga gaagggctcc ctgcccgggc cgctggcagt caagcgggtg 1260
tcaggcgtgc ccaccgtgtt cccagcagac caggtggccc cagaggacaa cctgctgcag 1320
gtggtttacg acaagcggcc ggtggaggtg cagtgggaga gcttcgacaa gctgcggcag 1380
cgggtggagc gagagtgggc ggcgctgccc cccgcggcag atgtgctggc ggcgccgctg 1440
cgggagaagc gggcggcggt ggcggcgcgt ctgggcgtgc agggccaggt gctggggtag 1500
<210> 292
<211> 499
<212> PRT
<213> Chlorella sp.
<400> 292
Met Phe Ser Arg Lys His Arg Arg Gln Glu Gln Ala Ala Pro Ala Lys
1 5 10 15
Ala Glu Ala Ala Ala Ala Val Ala Val Ala Ala Ala Pro Ala Thr Thr
20 25 30
Ala Ala Pro His Leu Leu Thr Ser Tyr Leu Pro Ile Ala Tyr Gly Glu
35 40 45
Phe Arg Gln Gly Tyr Asp Lys Asp Thr Arg Asp Thr Arg Ala Val Phe
50 55 60
Tyr Gly Leu Arg Tyr Ile Leu Glu Asn Phe Val Ala Arg Arg Trp Thr
65 70 75 80
Leu Gln Asp Val Glu Leu Ala Asp Arg Phe Phe Gly Ser His Met Ala
85 90 95
Pro Gly Tyr Thr Ala Phe Pro Tyr Pro Lys Asp Leu Phe Leu Lys Phe
100 105 110
Ile Ala Glu Asn Asp Gly Tyr Met Pro Val Arg Val Glu Ala Leu Pro
115 120 125
Glu Gly Thr Cys Met His Ala His Val Pro Val Phe Gln Leu Thr Ala
130 135 140
Glu Ala Pro Tyr Ala Pro Leu Cys Thr Tyr Leu Glu Thr Leu Leu Thr
145 150 155 160
Gln Leu Trp Tyr Pro Thr Thr Val Ala Thr Leu Ser Arg Arg Cys Lys
165 170 175
Asp Leu Ile Ala Ala Ala Phe Glu Gln Ser Val Asp Ala Gly Arg Ser
180 185 190
Ser Pro Leu Leu Asn Ser Arg Leu His Asp Phe Gly Phe Arg Gly Cys
195 200 205
Thr Cys Val Glu Gln Ser Val Leu Gly Gly Val Ala His Leu Leu Asn
210 215 220
Phe Asp Gly Thr Asp Thr Leu Ser Ala Ala Tyr Tyr Ala Gln Phe Ala
225 230 235 240
Leu Asn Gly Gly Arg Pro Val Gly Gln Ser Ile Pro Ala Thr Glu His
245 250 255
Ser Val Met Thr Ser Trp Pro Ser Glu Arg Ala Ala Ile Ser Asn Met
260 265 270
Val Ser His Phe Gly Arg Gly Leu Phe Ala Thr Val Met Asp Ser Tyr
275 280 285
Asp Tyr Gln Arg Ala Leu Asp Glu Val Val Pro Ala Val Ala Glu Glu
290 295 300
Lys Asn Ala Gln Gly Gly Phe Trp Val Leu Arg Pro Asp Ser Gly Asp
305 310 315 320
Pro Thr Glu Ala Val Leu Gln Gly Leu Arg Gly Ala Glu Arg Ala Phe
325 330 335
Gly Ala Asp Val Asn Gly Lys Gly Phe Lys Val Leu Arg Gly Val Gly
340 345 350
Val Ile Gln Gly Asp Gly Ile Asp Tyr His Asn Ile Glu Ala Ile Leu
355 360 365
Glu Ala Val Leu Ala Ala Gly Tyr Ser Ala Glu Asn Val Ala Phe Gly
370 375 380
Met Gly Gly Gly Leu Leu Gln Arg Leu Asn Pro Val Asp Val Met Lys
385 390 395 400
Ala Pro Lys Thr Gly Pro Glu Lys Gly Ser Leu Pro Gly Pro Leu Ala
405 410 415
Val Lys Arg Val Ser Gly Val Pro Thr Val Phe Pro Ala Asp Gln Val
420 425 430
Ala Pro Glu Asp Asn Leu Leu Gln Val Val Tyr Asp Lys Arg Pro Val
435 440 445
Glu Val Gln Trp Glu Ser Phe Asp Lys Leu Arg Gln Arg Val Glu Arg
450 455 460
Glu Trp Ala Ala Leu Pro Pro Ala Ala Asp Val Leu Ala Ala Pro Leu
465 470 475 480
Arg Glu Lys Arg Ala Ala Val Ala Ala Arg Leu Gly Val Gln Gly Gln
485 490 495
Val Leu Gly
<210> 293
<211> 1389
<212> DNA
<213> Deinococcus radiodurans
<400> 293
atgaccaccc cgctttcgga cctcaacctg attctggaca ccgactcgta caagtcgagc 60
cactttttgc agtacccgcc cggcaccacc cggctgtttt catatctgga atcgcgcggc 120
gggcgctacc cggtcacgcg ctttttcggc ttgcagtaca tcctgagccg ctacctgacc 180
cgccgggtga cgatggagat ggtcgaagaa gcccgcgccg tcatcgaggc gcacggcgag 240
ccgtttccct atgagggctg gcggcgagta gtggaggtgc acggcggcaa gctgccgctg 300
gaaatccgcg cggtgcccga agggacgctg gtgcccatcc acaacgtgct gatgagctgc 360
accaacaccg accccgagct gccctggctg cccggctggt tcgagacgat gctgatgcgg 420
gtgtggtatc ccaccaccgt ctgcacccag agctggcata tccgcgaaat cattcggcag 480
gcgctggaag acacctccga ccgcgccgcc gaggagctgc ccttcaagct gcacgatttc 540
ggctcgcgcg gcgtgagcag ccgcgaaagc gcgggcatcg gcgggctggc gcatctcgtc 600
aactttcagg gcagcgacac cctggaggcc ctgcgggtgg gccgcaacta ctacggcgcc 660
gagctggcgg gcttttctat tcccgccgcc gagcactcca ccatcaccag ctggggcaag 720
gagcacgagg tggacgccta ccgcaacatg gtccggcagt tcggcaagcc cggtaaggtg 780
tacgccgtcg tctcggacag ctacgacctg aaacacgcca tcaacgtgca ctggggcgaa 840
accttgcgga aagaagtcga ggagagcggc ggcaccctgg tcgtccgtcc cgactccggc 900
gaccccccgg cgatggtgcg cctcgcggtg aacgcgctgg ccgccaagta cggcaccacc 960
accaactcca agggcttcaa ggtgctgcaa cacgtccggg tgattcaggg cgacggcata 1020
gacgagagca ccattcgcca gattctgcaa aacctgtacg tggacggctt ttccgccgaa 1080
aacgtcacct tcggcatggg cggggcgctg ctgcaaaagg tggaccgcga cacccagcgc 1140
ttcgcctaca aggccagcgc gggcctgatc gacggcgaat accggggcat ctacaaagac 1200
ccggtgaccg accccggcaa gcgcagcaag gacggcgtgc tggatttggt ggaggaaaac 1260
ggacgcatgg tgacccggca gtaccgcacc ttcgacaccg atttccccgg ctcgctgatg 1320
cgcaccgtct accgcgacgg cgaactgctg gtgcaggaca cgctggagga gattcgggga 1380
cgaggatga 1389
<210> 294
<211> 462
<212> PRT
<213> Deinococcus radiodurans
<400> 294
Met Thr Thr Pro Leu Ser Asp Leu Asn Leu Ile Leu Asp Thr Asp Ser
1 5 10 15
Tyr Lys Ser Ser His Phe Leu Gln Tyr Pro Pro Gly Thr Thr Arg Leu
20 25 30
Phe Ser Tyr Leu Glu Ser Arg Gly Gly Arg Tyr Pro Val Thr Arg Phe
35 40 45
Phe Gly Leu Gln Tyr Ile Leu Ser Arg Tyr Leu Thr Arg Arg Val Thr
50 55 60
Met Glu Met Val Glu Glu Ala Arg Ala Val Ile Glu Ala His Gly Glu
65 70 75 80
Pro Phe Pro Tyr Glu Gly Trp Arg Arg Val Val Glu Val His Gly Gly
85 90 95
Lys Leu Pro Leu Glu Ile Arg Ala Val Pro Glu Gly Thr Leu Val Pro
100 105 110
Ile His Asn Val Leu Met Ser Cys Thr Asn Thr Asp Pro Glu Leu Pro
115 120 125
Trp Leu Pro Gly Trp Phe Glu Thr Met Leu Met Arg Val Trp Tyr Pro
130 135 140
Thr Thr Val Cys Thr Gln Ser Trp His Ile Arg Glu Ile Ile Arg Gln
145 150 155 160
Ala Leu Glu Asp Thr Ser Asp Arg Ala Ala Glu Glu Leu Pro Phe Lys
165 170 175
Leu His Asp Phe Gly Ser Arg Gly Val Ser Ser Arg Glu Ser Ala Gly
180 185 190
Ile Gly Gly Leu Ala His Leu Val Asn Phe Gln Gly Ser Asp Thr Leu
195 200 205
Glu Ala Leu Arg Val Gly Arg Asn Tyr Tyr Gly Ala Glu Leu Ala Gly
210 215 220
Phe Ser Ile Pro Ala Ala Glu His Ser Thr Ile Thr Ser Trp Gly Lys
225 230 235 240
Glu His Glu Val Asp Ala Tyr Arg Asn Met Val Arg Gln Phe Gly Lys
245 250 255
Pro Gly Lys Val Tyr Ala Val Val Ser Asp Ser Tyr Asp Leu Lys His
260 265 270
Ala Ile Asn Val His Trp Gly Glu Thr Leu Arg Lys Glu Val Glu Glu
275 280 285
Ser Gly Gly Thr Leu Val Val Arg Pro Asp Ser Gly Asp Pro Pro Ala
290 295 300
Met Val Arg Leu Ala Val Asn Ala Leu Ala Ala Lys Tyr Gly Thr Thr
305 310 315 320
Thr Asn Ser Lys Gly Phe Lys Val Leu Gln His Val Arg Val Ile Gln
325 330 335
Gly Asp Gly Ile Asp Glu Ser Thr Ile Arg Gln Ile Leu Gln Asn Leu
340 345 350
Tyr Val Asp Gly Phe Ser Ala Glu Asn Val Thr Phe Gly Met Gly Gly
355 360 365
Ala Leu Leu Gln Lys Val Asp Arg Asp Thr Gln Arg Phe Ala Tyr Lys
370 375 380
Ala Ser Ala Gly Leu Ile Asp Gly Glu Tyr Arg Gly Ile Tyr Lys Asp
385 390 395 400
Pro Val Thr Asp Pro Gly Lys Arg Ser Lys Asp Gly Val Leu Asp Leu
405 410 415
Val Glu Glu Asn Gly Arg Met Val Thr Arg Gln Tyr Arg Thr Phe Asp
420 425 430
Thr Asp Phe Pro Gly Ser Leu Met Arg Thr Val Tyr Arg Asp Gly Glu
435 440 445
Leu Leu Val Gln Asp Thr Leu Glu Glu Ile Arg Gly Arg Gly
450 455 460
<210> 295
<211> 2547
<212> DNA
<213> Emiliania huxleyi
<400> 295
atgtcctgct tgaagtcctg cctaggcgac gccagcgtcg gcagcgcgcc gccgaccggc 60
agcagcgacg ggcacaacat cctgctcatg acagacggct acaagttttc gcaccacaag 120
cagtacccgg tctcatggat gccagagcac gctcgacccg gctcgcagag cggcgagtac 180
ttcccagccg tgctcttccc gcccaccagc aaggcgccgg gtgccaagct gctgcagctc 240
gccaccgttc cgggaggagg cagcgactcg ctcgtgctca tcaccaacgc gtcgaccgca 300
gtggtcaagg tgctcgggcc ggcagaggcg gacgccgcag cggacatcaa ctatgcctgc 360
gcggcggtgg agtacgcggg cccgctaaag gccggcgctt gccgagagga ggggagagga 420
gaggaggaga ggaggcgccg ccgacttcgt cctcctcccg gacgcgacaa ggagggcgcc 480
ggcgaccaca tcgtcttctt cggcctgcag tatttcatca aggagtatct ggcggaggag 540
tttatcgcgc ggtacatggc cgacgtgcgc atcgccggcc cagcgttcgc cggcggctgg 600
gaccggacga tgttcccgcg cggcgattgg gaggcgatgg caagcggcga ctacgaatgc 660
acgggcgtgc cgacgcccgg tgccgtcccg ggcgctttgc ccatcaagat cgaggcctta 720
cccgagggct cgatcgtcgc gcccggcgtc gcgttcttca agctgaccaa cacgcacccc 780
cgtttctact ggctgccaaa cttcctcgag accctcctcc tagcacgcgg gatgcacgcg 840
cgcgaacacg cacgcactcc gccgtcgttg gtctggtacc ccacaacggt ggcgacgcag 900
gcgcgcgagt tccgcaagac catccaggcg tacagcgttc tctcgcagcg ggtctcgcag 960
gtcgacttcc tgccgggcga gcgcgacttc acgccggaga acatcgccgc cgacgacctt 1020
ccagtccaca tcgcgcaagt cttcgacctg ctcgactttg gctaccgggg cgtctcttcg 1080
cacgagacgg cgggtctcgg ctcgggtgcc tactacaccg ccggcttcga gggctccgac 1140
acggtcgccg gctcgcgcat gctgctccgc cactacaacg ctgcggaccc gaagctgggc 1200
ggcaccccgg tagagagctt ccgcgcgatg ttcgagcagc tgcactgcgc cacctccgtc 1260
ccggcggccg agcactcgac gatcacctcg tgggcggaca tgtcccccgg cgccgacccg 1320
gccaagtatg aggcggacga gtacgccgcg tttgtcaaca tgatccggca gtacatgccc 1380
tcctttgcgg tctcgctcgt gtcggacggc ttcaacatct ggaacgcagt cgccaacttg 1440
tggccgtcgg agaaggtggt cgagggcggc gaggcgggcg gcttgtcgat gcgcgccatc 1500
atccgcgcgc gcctcaaggc gggccagctc acgctcgtgc gccccgactc tggcgagggc 1560
gtcgagacgc tgccgcagct cctctccctc ttccacgcca cgctcccgga ggcttgggag 1620
tcgggcctct cgccgctccg gccgctgttc gcgccgaccg acccgcgtca ggcagagtac 1680
gaggctgtgt gcgagtcgat ccgcaaggcg aagggcttgc ccgcgggcga caacccgttc 1740
cgtcgcttcg tggggcagca gttccgcata ctgcagggcg acggcgtggc gcttgacacg 1800
gtcggcgaca tgtgcgcatc gatcctcgca aacggcttct gcgtcaacgc ggtgcacttc 1860
ggctccggcg gcgggctgct gcagaagctc aaccgcgact ccctctccgt cgccttcaag 1920
tgctgcgcca tgtacgtcgg cgggcgcatg tacgccatag ggaaggaccc gatcgcgggc 1980
ggcaaaaagt cgtaccccgg caacccgccc gtcctgcgcg gcgccgacgg cgtgctacgg 2040
aatcgcggca cctacgacag cgcgggcgag ccgagtggcg cgatgctcga ggcccagccg 2100
atgtcgtacg ccgagttttg cagcggcgtc gagggcgacg tgttgcagcc cgtctttgaa 2160
aacgggacgg tgctggtgga cacgccttgg agctctatcg tcagccgtgc caaggcgttg 2220
gcagtccggc tggccgaggc gtcgtgcggc tccaagtgga tgcactgcca ccccacaaag 2280
atggcggcca tgcaggccga gccagcgttt gccgcgctgg ggctggagaa gagcgcagcc 2340
aagctgggcc tgacggcgac cctcgactcg catgcactcg tcgcggccat caaggagaag 2400
cacgtgtgcg acaagaaggc ggccgaaacc gggggttgcc gtgcttactg ccgagaggcg 2460
gccaagaagg tgctcgccgc cattgccgag agcgacatgg cggctgccga gaaggcaatg 2520
aagggcaaga tcatgctgac actgtga 2547
<210> 296
<211> 848
<212> PRT
<213> Emiliania huxleyi
<400> 296
Met Ser Cys Leu Lys Ser Cys Leu Gly Asp Ala Ser Val Gly Ser Ala
1 5 10 15
Pro Pro Thr Gly Ser Ser Asp Gly His Asn Ile Leu Leu Met Thr Asp
20 25 30
Gly Tyr Lys Phe Ser His His Lys Gln Tyr Pro Val Ser Trp Met Pro
35 40 45
Glu His Ala Arg Pro Gly Ser Gln Ser Gly Glu Tyr Phe Pro Ala Val
50 55 60
Leu Phe Pro Pro Thr Ser Lys Ala Pro Gly Ala Lys Leu Leu Gln Leu
65 70 75 80
Ala Thr Val Pro Gly Gly Gly Ser Asp Ser Leu Val Leu Ile Thr Asn
85 90 95
Ala Ser Thr Ala Val Val Lys Val Leu Gly Pro Ala Glu Ala Asp Ala
100 105 110
Ala Ala Asp Ile Asn Tyr Ala Cys Ala Ala Val Glu Tyr Ala Gly Pro
115 120 125
Leu Lys Ala Gly Ala Cys Arg Glu Glu Gly Arg Gly Glu Glu Glu Arg
130 135 140
Arg Arg Arg Arg Leu Arg Pro Pro Pro Gly Arg Asp Lys Glu Gly Ala
145 150 155 160
Gly Asp His Ile Val Phe Phe Gly Leu Gln Tyr Phe Ile Lys Glu Tyr
165 170 175
Leu Ala Glu Glu Phe Ile Ala Arg Tyr Met Ala Asp Val Arg Ile Ala
180 185 190
Gly Pro Ala Phe Ala Gly Gly Trp Asp Arg Thr Met Phe Pro Arg Gly
195 200 205
Asp Trp Glu Ala Met Ala Ser Gly Asp Tyr Glu Cys Thr Gly Val Pro
210 215 220
Thr Pro Gly Ala Val Pro Gly Ala Leu Pro Ile Lys Ile Glu Ala Leu
225 230 235 240
Pro Glu Gly Ser Ile Val Ala Pro Gly Val Ala Phe Phe Lys Leu Thr
245 250 255
Asn Thr His Pro Arg Phe Tyr Trp Leu Pro Asn Phe Leu Glu Thr Leu
260 265 270
Leu Leu Ala Arg Gly Met His Ala Arg Glu His Ala Arg Thr Pro Pro
275 280 285
Ser Leu Val Trp Tyr Pro Thr Thr Val Ala Thr Gln Ala Arg Glu Phe
290 295 300
Arg Lys Thr Ile Gln Ala Tyr Ser Val Leu Ser Gln Arg Val Ser Gln
305 310 315 320
Val Asp Phe Leu Pro Gly Glu Arg Asp Phe Thr Pro Glu Asn Ile Ala
325 330 335
Ala Asp Asp Leu Pro Val His Ile Ala Gln Val Phe Asp Leu Leu Asp
340 345 350
Phe Gly Tyr Arg Gly Val Ser Ser His Glu Thr Ala Gly Leu Gly Ser
355 360 365
Gly Ala Tyr Tyr Thr Ala Gly Phe Glu Gly Ser Asp Thr Val Ala Gly
370 375 380
Ser Arg Met Leu Leu Arg His Tyr Asn Ala Ala Asp Pro Lys Leu Gly
385 390 395 400
Gly Thr Pro Val Glu Ser Phe Arg Ala Met Phe Glu Gln Leu His Cys
405 410 415
Ala Thr Ser Val Pro Ala Ala Glu His Ser Thr Ile Thr Ser Trp Ala
420 425 430
Asp Met Ser Pro Gly Ala Asp Pro Ala Lys Tyr Glu Ala Asp Glu Tyr
435 440 445
Ala Ala Phe Val Asn Met Ile Arg Gln Tyr Met Pro Ser Phe Ala Val
450 455 460
Ser Leu Val Ser Asp Gly Phe Asn Ile Trp Asn Ala Val Ala Asn Leu
465 470 475 480
Trp Pro Ser Glu Lys Val Val Glu Gly Gly Glu Ala Gly Gly Leu Ser
485 490 495
Met Arg Ala Ile Ile Arg Ala Arg Leu Lys Ala Gly Gln Leu Thr Leu
500 505 510
Val Arg Pro Asp Ser Gly Glu Gly Val Glu Thr Leu Pro Gln Leu Leu
515 520 525
Ser Leu Phe His Ala Thr Leu Pro Glu Ala Trp Glu Ser Gly Leu Ser
530 535 540
Pro Leu Arg Pro Leu Phe Ala Pro Thr Asp Pro Arg Gln Ala Glu Tyr
545 550 555 560
Glu Ala Val Cys Glu Ser Ile Arg Lys Ala Lys Gly Leu Pro Ala Gly
565 570 575
Asp Asn Pro Phe Arg Arg Phe Val Gly Gln Gln Phe Arg Ile Leu Gln
580 585 590
Gly Asp Gly Val Ala Leu Asp Thr Val Gly Asp Met Cys Ala Ser Ile
595 600 605
Leu Ala Asn Gly Phe Cys Val Asn Ala Val His Phe Gly Ser Gly Gly
610 615 620
Gly Leu Leu Gln Lys Leu Asn Arg Asp Ser Leu Ser Val Ala Phe Lys
625 630 635 640
Cys Cys Ala Met Tyr Val Gly Gly Arg Met Tyr Ala Ile Gly Lys Asp
645 650 655
Pro Ile Ala Gly Gly Lys Lys Ser Tyr Pro Gly Asn Pro Pro Val Leu
660 665 670
Arg Gly Ala Asp Gly Val Leu Arg Asn Arg Gly Thr Tyr Asp Ser Ala
675 680 685
Gly Glu Pro Ser Gly Ala Met Leu Glu Ala Gln Pro Met Ser Tyr Ala
690 695 700
Glu Phe Cys Ser Gly Val Glu Gly Asp Val Leu Gln Pro Val Phe Glu
705 710 715 720
Asn Gly Thr Val Leu Val Asp Thr Pro Trp Ser Ser Ile Val Ser Arg
725 730 735
Ala Lys Ala Leu Ala Val Arg Leu Ala Glu Ala Ser Cys Gly Ser Lys
740 745 750
Trp Met His Cys His Pro Thr Lys Met Ala Ala Met Gln Ala Glu Pro
755 760 765
Ala Phe Ala Ala Leu Gly Leu Glu Lys Ser Ala Ala Lys Leu Gly Leu
770 775 780
Thr Ala Thr Leu Asp Ser His Ala Leu Val Ala Ala Ile Lys Glu Lys
785 790 795 800
His Val Cys Asp Lys Lys Ala Ala Glu Thr Gly Gly Cys Arg Ala Tyr
805 810 815
Cys Arg Glu Ala Ala Lys Lys Val Leu Ala Ala Ile Ala Glu Ser Asp
820 825 830
Met Ala Ala Ala Glu Lys Ala Met Lys Gly Lys Ile Met Leu Thr Leu
835 840 845
<210> 297
<211> 1380
<212> DNA
<213> Hahella chejuensis
<400> 297
atgaaaaaca gcattatctt aaacgtagat tcttacaaaa cctctcacta cctgcagtat 60
ccggctggcg ccacgcaggt ttccagctac atcgaatcac ggggcggcgc ttttgagaaa 120
gcggtgttct tcggtctgca gatgttcatc aaagagtacc tgaccaaacc gattaccgcg 180
gacgatatcg aagaagccaa gctggtttat caagcccacg gcgtgccctt caatgaagaa 240
ggctggcgct atattctgga gaagcacgag ggttatctgc cgatagaaat ccaggctgcg 300
ccggaaggaa ccgtcatgga tgtgaaaaac gtgatggtgc aggtcatcaa caccgaccgt 360
aattgcgcct ggttgaccag ctatgtggaa acggcgttgt tgagagcggt ctggtatccg 420
actacggtcg ccaccgtatc ctggagctgc cgcaacatca tcaagcgtta cctggaagaa 480
acggcggaca ctatcgaagg attgccattc aaactgcacg acttcggcgc tcgcggcgcc 540
agttctgaag aaaccgcagc gattggcggg gccgctcact tggtgaactt tatgggcact 600
gacactgtta gcggcatcat ggcggcgaga cgctactacg gcgctgatat ggcgggcttt 660
tcaatcccag cagcggagca cagcaccatt accagctggg gcaaggaagc ggaagtggac 720
gcctacgcca acatgctgga ccagttcgcc gagcccggca aactggtggc ggtggtcagc 780
gactcttatg acttgtggaa cgctatcgac aacctctggg gcgaagcgct gaaaaccaaa 840
atcgagcgca gcggcggcac cttggtggtg cgtcctgaca gtggcgatcc tgtagcgatc 900
gtgaccgaaa ccatcgaacg actgatgcgg aaattcggct tcaccgtcaa cagcaaagga 960
tatcgggtat tgccggcgtg catccgggtg attcaaggcg acggcatctc tttgcacacg 1020
atcgaagcca ttctggcggc gatgaaagcg cgcaagcaaa gcgctgaaaa cattgctttc 1080
ggcatggggg gagaactgct gcagaaggtg aaccgggata cgttgaaatt cgccatgaag 1140
gcttctgcga tatgcgtaaa aggcatctgg agagatgtct ataaagaccc catcaccgat 1200
cagggcaaac gttccaagaa aggacttctg gcgctggtta aagacttgga tggcggcttt 1260
cagacagtgc gccggcagga cctgggtaat cgggaggacc aattggttac cgtcttccgt 1320
aatggcgatc tgatgaagga atggactttc gatgaagtca gagccaacgc ggcgcaataa 1380
<210> 298
<211> 459
<212> PRT
<213> Hahella chejuensis
<400> 298
Met Lys Asn Ser Ile Ile Leu Asn Val Asp Ser Tyr Lys Thr Ser His
1 5 10 15
Tyr Leu Gln Tyr Pro Ala Gly Ala Thr Gln Val Ser Ser Tyr Ile Glu
20 25 30
Ser Arg Gly Gly Ala Phe Glu Lys Ala Val Phe Phe Gly Leu Gln Met
35 40 45
Phe Ile Lys Glu Tyr Leu Thr Lys Pro Ile Thr Ala Asp Asp Ile Glu
50 55 60
Glu Ala Lys Leu Val Tyr Gln Ala His Gly Val Pro Phe Asn Glu Glu
65 70 75 80
Gly Trp Arg Tyr Ile Leu Glu Lys His Glu Gly Tyr Leu Pro Ile Glu
85 90 95
Ile Gln Ala Ala Pro Glu Gly Thr Val Met Asp Val Lys Asn Val Met
100 105 110
Val Gln Val Ile Asn Thr Asp Arg Asn Cys Ala Trp Leu Thr Ser Tyr
115 120 125
Val Glu Thr Ala Leu Leu Arg Ala Val Trp Tyr Pro Thr Thr Val Ala
130 135 140
Thr Val Ser Trp Ser Cys Arg Asn Ile Ile Lys Arg Tyr Leu Glu Glu
145 150 155 160
Thr Ala Asp Thr Ile Glu Gly Leu Pro Phe Lys Leu His Asp Phe Gly
165 170 175
Ala Arg Gly Ala Ser Ser Glu Glu Thr Ala Ala Ile Gly Gly Ala Ala
180 185 190
His Leu Val Asn Phe Met Gly Thr Asp Thr Val Ser Gly Ile Met Ala
195 200 205
Ala Arg Arg Tyr Tyr Gly Ala Asp Met Ala Gly Phe Ser Ile Pro Ala
210 215 220
Ala Glu His Ser Thr Ile Thr Ser Trp Gly Lys Glu Ala Glu Val Asp
225 230 235 240
Ala Tyr Ala Asn Met Leu Asp Gln Phe Ala Glu Pro Gly Lys Leu Val
245 250 255
Ala Val Val Ser Asp Ser Tyr Asp Leu Trp Asn Ala Ile Asp Asn Leu
260 265 270
Trp Gly Glu Ala Leu Lys Thr Lys Ile Glu Arg Ser Gly Gly Thr Leu
275 280 285
Val Val Arg Pro Asp Ser Gly Asp Pro Val Ala Ile Val Thr Glu Thr
290 295 300
Ile Glu Arg Leu Met Arg Lys Phe Gly Phe Thr Val Asn Ser Lys Gly
305 310 315 320
Tyr Arg Val Leu Pro Ala Cys Ile Arg Val Ile Gln Gly Asp Gly Ile
325 330 335
Ser Leu His Thr Ile Glu Ala Ile Leu Ala Ala Met Lys Ala Arg Lys
340 345 350
Gln Ser Ala Glu Asn Ile Ala Phe Gly Met Gly Gly Glu Leu Leu Gln
355 360 365
Lys Val Asn Arg Asp Thr Leu Lys Phe Ala Met Lys Ala Ser Ala Ile
370 375 380
Cys Val Lys Gly Ile Trp Arg Asp Val Tyr Lys Asp Pro Ile Thr Asp
385 390 395 400
Gln Gly Lys Arg Ser Lys Lys Gly Leu Leu Ala Leu Val Lys Asp Leu
405 410 415
Asp Gly Gly Phe Gln Thr Val Arg Arg Gln Asp Leu Gly Asn Arg Glu
420 425 430
Asp Gln Leu Val Thr Val Phe Arg Asn Gly Asp Leu Met Lys Glu Trp
435 440 445
Thr Phe Asp Glu Val Arg Ala Asn Ala Ala Gln
450 455
<210> 299
<211> 1407
<212> DNA
<213> Magnetospirillum magneticum
<400> 299
atgaggggcg gtctcaatcc catcctggcg gtggacagct acaaggccag ccacaagtgg 60
caatacccgc cggggacgga atacgtgtcc tcctatgtgg aggcgcgggc cgacaacagt 120
ggcctggacc ttcccggcac tctggtgttc ggcctccagc ccctgctgcg caccctggcc 180
gcccatccgg tgggtgaggc ggatatcgtg cgggcggcgc gcctgttcgc ggcccatggc 240
gttcccttcc acgaggaagg gtggcgccac atcctgagcc gccatggcgg gcggcttccc 300
gtggagatcc gggcggtagc cgaggggacg ctggtgccgt tctccaacgt ggtggcccag 360
gtggtcaaca ccgatcccca ggcattctgg ctgacctcct atctggagac catgctgcag 420
cgggccctgt ggtatccctc gacggtggcc accgtctcct gggcggtgaa gcggatcttg 480
cgggaattct ggctgctgac atcggacgat gccgagggca gcctggactt caagctgcac 540
gatttcgggg cgcgcggcgc atcctcgggg gaaagcgccg ccctgggcgg attggcccat 600
ctggtcaact tcaagggcac cgacaccgtc gaggcgctgc tggccgccga ggagcattac 660
gccgagccca tggccggcta ttccattccc gccgccgaac actccaccat cactagctgg 720
gggcggcagg gcgaggtcga cgcctatgcc aacatgctcg agcagttcgg cgggccgggg 780
cgtctggtgg cggtggtgtc ggattcctac gacgtgtttc acgccgtcga gaacctttgg 840
gggcgggaat tgcgcgccca ggtgctggac atgggcggaa ccctggtgat ccgccccgat 900
tccggcgatc cggtggatgt ggtgtcccag gtgctgcgcc tggccgccgc cgccttcggc 960
tcgacccgaa attccaaggg ctttcgcatc ctcaatccgg cagtccgggt catccagggc 1020
gatggggtca atcccaaatc cattcgggcc atcctcgccc gcatggtcga ggatggcttc 1080
gccatcgaca atattgcctt cggcatgggt ggcgcgctgc tgcagaaagt ggaccgcgac 1140
accttttcgt gggccatgaa ggcttcggcg gtgcgggtgg ccggccagtg gcgcgacgtc 1200
tacaaggaac cggtgaccga tggcggcaag ggctccaagc ggggccgtct ggccctggtc 1260
cgcgatccgg cggaaggcct gcgcaccgta aggctcgagg attgtccggc gggggaagac 1320
cttctccgcc cggtcttccg cgacggaacc ctgctggtcg aggacagtct ggcccaggtg 1380
cgccaccggg cctatttcgg caggtag 1407
<210> 300
<211> 468
<212> PRT
<213> Magnetospirillum magneticum
<400> 300
Met Arg Gly Gly Leu Asn Pro Ile Leu Ala Val Asp Ser Tyr Lys Ala
1 5 10 15
Ser His Lys Trp Gln Tyr Pro Pro Gly Thr Glu Tyr Val Ser Ser Tyr
20 25 30
Val Glu Ala Arg Ala Asp Asn Ser Gly Leu Asp Leu Pro Gly Thr Leu
35 40 45
Val Phe Gly Leu Gln Pro Leu Leu Arg Thr Leu Ala Ala His Pro Val
50 55 60
Gly Glu Ala Asp Ile Val Arg Ala Ala Arg Leu Phe Ala Ala His Gly
65 70 75 80
Val Pro Phe His Glu Glu Gly Trp Arg His Ile Leu Ser Arg His Gly
85 90 95
Gly Arg Leu Pro Val Glu Ile Arg Ala Val Ala Glu Gly Thr Leu Val
100 105 110
Pro Phe Ser Asn Val Val Ala Gln Val Val Asn Thr Asp Pro Gln Ala
115 120 125
Phe Trp Leu Thr Ser Tyr Leu Glu Thr Met Leu Gln Arg Ala Leu Trp
130 135 140
Tyr Pro Ser Thr Val Ala Thr Val Ser Trp Ala Val Lys Arg Ile Leu
145 150 155 160
Arg Glu Phe Trp Leu Leu Thr Ser Asp Asp Ala Glu Gly Ser Leu Asp
165 170 175
Phe Lys Leu His Asp Phe Gly Ala Arg Gly Ala Ser Ser Gly Glu Ser
180 185 190
Ala Ala Leu Gly Gly Leu Ala His Leu Val Asn Phe Lys Gly Thr Asp
195 200 205
Thr Val Glu Ala Leu Leu Ala Ala Glu Glu His Tyr Ala Glu Pro Met
210 215 220
Ala Gly Tyr Ser Ile Pro Ala Ala Glu His Ser Thr Ile Thr Ser Trp
225 230 235 240
Gly Arg Gln Gly Glu Val Asp Ala Tyr Ala Asn Met Leu Glu Gln Phe
245 250 255
Gly Gly Pro Gly Arg Leu Val Ala Val Val Ser Asp Ser Tyr Asp Val
260 265 270
Phe His Ala Val Glu Asn Leu Trp Gly Arg Glu Leu Arg Ala Gln Val
275 280 285
Leu Asp Met Gly Gly Thr Leu Val Ile Arg Pro Asp Ser Gly Asp Pro
290 295 300
Val Asp Val Val Ser Gln Val Leu Arg Leu Ala Ala Ala Ala Phe Gly
305 310 315 320
Ser Thr Arg Asn Ser Lys Gly Phe Arg Ile Leu Asn Pro Ala Val Arg
325 330 335
Val Ile Gln Gly Asp Gly Val Asn Pro Lys Ser Ile Arg Ala Ile Leu
340 345 350
Ala Arg Met Val Glu Asp Gly Phe Ala Ile Asp Asn Ile Ala Phe Gly
355 360 365
Met Gly Gly Ala Leu Leu Gln Lys Val Asp Arg Asp Thr Phe Ser Trp
370 375 380
Ala Met Lys Ala Ser Ala Val Arg Val Ala Gly Gln Trp Arg Asp Val
385 390 395 400
Tyr Lys Glu Pro Val Thr Asp Gly Gly Lys Gly Ser Lys Arg Gly Arg
405 410 415
Leu Ala Leu Val Arg Asp Pro Ala Glu Gly Leu Arg Thr Val Arg Leu
420 425 430
Glu Asp Cys Pro Ala Gly Glu Asp Leu Leu Arg Pro Val Phe Arg Asp
435 440 445
Gly Thr Leu Leu Val Glu Asp Ser Leu Ala Gln Val Arg His Arg Ala
450 455 460
Tyr Phe Gly Arg
465
<210> 301
<211> 1389
<212> DNA
<213> Pasteurella multocida
<400> 301
atgtatactt ctaattttct taatcttatc ttgaatacag atagctataa agcctctcat 60
tggctccaat atcctcctaa tacagaatat atttcttact atattgaagc gcgtggagga 120
aactttgatg tgcttgcgtt tggtttacaa gcatttatta aagaatattt acttaaacct 180
atctcgcaaa atgatattga tgaagcagaa gttgttttga cggcacacgg cttgccattt 240
aatcgtcaag gttggcaacg tttattggag aaacatcaag gtttattacc aatcaaaatc 300
gaagcagtac cagaaggcac tgtgttacct actggaaatg tggtttgtca aatcgttaat 360
actgatcctg agtttttttg gttagttggc tatttagaaa ccgcgttatt gcgtgcgatt 420
tggtatcctt ctacggtggc gagtgtgtca tatttctgta aacaaaaaat taaaacggca 480
ttagaaaaat cgtcagataa tttagcagga ctcggtttta aattacacga ttttggtgct 540
cgtggtgcat caagtttaga aactgtggca ttaggtggtt tagcacactt agtgaatttt 600
atgggaaccg acagtgtgtc tgcgcttgtc gcagcaaagc gttggtataa cacgactagc 660
atgcctgcgt tttcgattcc tgcggcggaa catagcacga tgacgtcttg gggaaaagat 720
agagaggcgg atgcttatcg taatatggtt gagcaatttg caggtgaaca taaaatatat 780
gcagtcgtgt cagatagtta tgacctttgg aatgctttag aaaatatttg gggcacgcaa 840
ctaaaagatc tggtggagat aaaaggaggc actttagtgg ttcgccctga tagtggagat 900
cctgctgaag tggtttgtcg cactttagcg atcttggctg agaaatttgg tacgacttta 960
aatagtaaag gttataaagt cttgcctgat tgtgtgcgcc ttattcaagg cgatggtatt 1020
aatgtgaatt ctttaggtaa aattttggag gcaattcttg ccagcggttt tagtgttgag 1080
aatgtcgcct ttggtatggg aggcggatta ttgcagcaag tgaatcgaga cacaatgagt 1140
tgggcaatga aggccagtgc agtgtgtatt gcaggcgaat ggcatgatgt gtataaagac 1200
ccgattacta gccaagcaaa gcgctcgaaa agaggcgtgc ttgccttagt gaaacaagag 1260
aaccggtggc acacgattga acaaaaggcg cttggacagc aaaagaacca gctccgcaca 1320
gtgtttctga atggagaatt actgattgat gaacattttg atgatattcg gaggagagcg 1380
ggtttctaa 1389
<210> 302
<211> 462
<212> PRT
<213> Pasteurella multocida
<400> 302
Met Tyr Thr Ser Asn Phe Leu Asn Leu Ile Leu Asn Thr Asp Ser Tyr
1 5 10 15
Lys Ala Ser His Trp Leu Gln Tyr Pro Pro Asn Thr Glu Tyr Ile Ser
20 25 30
Tyr Tyr Ile Glu Ala Arg Gly Gly Asn Phe Asp Val Leu Ala Phe Gly
35 40 45
Leu Gln Ala Phe Ile Lys Glu Tyr Leu Leu Lys Pro Ile Ser Gln Asn
50 55 60
Asp Ile Asp Glu Ala Glu Val Val Leu Thr Ala His Gly Leu Pro Phe
65 70 75 80
Asn Arg Gln Gly Trp Gln Arg Leu Leu Glu Lys His Gln Gly Leu Leu
85 90 95
Pro Ile Lys Ile Glu Ala Val Pro Glu Gly Thr Val Leu Pro Thr Gly
100 105 110
Asn Val Val Cys Gln Ile Val Asn Thr Asp Pro Glu Phe Phe Trp Leu
115 120 125
Val Gly Tyr Leu Glu Thr Ala Leu Leu Arg Ala Ile Trp Tyr Pro Ser
130 135 140
Thr Val Ala Ser Val Ser Tyr Phe Cys Lys Gln Lys Ile Lys Thr Ala
145 150 155 160
Leu Glu Lys Ser Ser Asp Asn Leu Ala Gly Leu Gly Phe Lys Leu His
165 170 175
Asp Phe Gly Ala Arg Gly Ala Ser Ser Leu Glu Thr Val Ala Leu Gly
180 185 190
Gly Leu Ala His Leu Val Asn Phe Met Gly Thr Asp Ser Val Ser Ala
195 200 205
Leu Val Ala Ala Lys Arg Trp Tyr Asn Thr Thr Ser Met Pro Ala Phe
210 215 220
Ser Ile Pro Ala Ala Glu His Ser Thr Met Thr Ser Trp Gly Lys Asp
225 230 235 240
Arg Glu Ala Asp Ala Tyr Arg Asn Met Val Glu Gln Phe Ala Gly Glu
245 250 255
His Lys Ile Tyr Ala Val Val Ser Asp Ser Tyr Asp Leu Trp Asn Ala
260 265 270
Leu Glu Asn Ile Trp Gly Thr Gln Leu Lys Asp Leu Val Glu Ile Lys
275 280 285
Gly Gly Thr Leu Val Val Arg Pro Asp Ser Gly Asp Pro Ala Glu Val
290 295 300
Val Cys Arg Thr Leu Ala Ile Leu Ala Glu Lys Phe Gly Thr Thr Leu
305 310 315 320
Asn Ser Lys Gly Tyr Lys Val Leu Pro Asp Cys Val Arg Leu Ile Gln
325 330 335
Gly Asp Gly Ile Asn Val Asn Ser Leu Gly Lys Ile Leu Glu Ala Ile
340 345 350
Leu Ala Ser Gly Phe Ser Val Glu Asn Val Ala Phe Gly Met Gly Gly
355 360 365
Gly Leu Leu Gln Gln Val Asn Arg Asp Thr Met Ser Trp Ala Met Lys
370 375 380
Ala Ser Ala Val Cys Ile Ala Gly Glu Trp His Asp Val Tyr Lys Asp
385 390 395 400
Pro Ile Thr Ser Gln Ala Lys Arg Ser Lys Arg Gly Val Leu Ala Leu
405 410 415
Val Lys Gln Glu Asn Arg Trp His Thr Ile Glu Gln Lys Ala Leu Gly
420 425 430
Gln Gln Lys Asn Gln Leu Arg Thr Val Phe Leu Asn Gly Glu Leu Leu
435 440 445
Ile Asp Glu His Phe Asp Asp Ile Arg Arg Arg Ala Gly Phe
450 455 460
<210> 303
<211> 1398
<212> DNA
<213> Psychrobacter sp.
<400> 303
atgtttaccg caaattttaa taatttgatt ttaaattctg acagttataa gacctcacac 60
tggctacaat atccacctgg tagtgagtat atgtcaagct atgtcgaggc gcgtaaaggc 120
gactatgatg tggtgttttt tggtctacaa gcttttataa aagaatacct taataagccg 180
attaccacag cggatatcga tgacgctgag ctggtgatta aagcgcatgg cctgcctttt 240
aatcgcagcg gctgggagcg cctagtcgaa aaacataacg gctacttacc cattcgtatt 300
caagcagtgc ccgaaggcag cttggttcct gtatctaatg tggtgtgcca aatcattaat 360
accgatcctg agttttattg gctgccaagc tatcttgaga ccagcttgct tagggccatt 420
tggtacccct cgactgtggc cagcttatcg tattactgca aaaatattat taaagctgcc 480
ctagaaaaat ctgcagatag cagcgcaggc ttgcccttta agctgcatga ttttggtgct 540
cgcggagctt ctagcatgga gtctgtggca ttaggtagcc ttgcacattt ggttaatttc 600
tcaggtactg acagtatgac ggcactggtt gctgcaagcc gctggtatgg catgagcgat 660
aacatgccag ccttctcaat cccagccgct gagcacagta ctatgaccgc ctggggccgt 720
gagcgtgaga ctcaggccta tgccaatatg ctcgatcaat tcggcggtga aggtcacatg 780
gtcgctgtgg tgtctgacag ctataactta tggaatgcca ttgataatat ttggggtgat 840
gcgcttaaac agcaggtaga aaccatggga ggcaccttag tggtccgtcc agacagtggt 900
gatccagcca aagtcgtgcg agaggcactc gagcgcttat cggtcaaatt tggataccgt 960
gttaatagta aaggctacaa ggttttgcca gactatgtac gcctaattca aggtgatggc 1020
attagtccgc agagtctagg taaaatttta gacaccatta tgcaagcagg ctttagtgcc 1080
gataatgtca cctttggcat gggcggcggc ttattacaac aagtcaaccg cgataccatg 1140
agctgggcaa tgaaggccag tgccattcgc atcgatggtg agttgaaaga tatctttaaa 1200
gaccccatca ctagccgctc aaagcgctcg aaaaaaggcc gcttggcatt aattaagcag 1260
accaatggca cgctcaccac cattaaagag gacagcttaa actcccccga agacaactta 1320
ctacgcgatg tctttgtcga tggtaagctg ttagtcgatg ataatctaac caccatccgt 1380
caacgtactg gctggtag 1398
<210> 304
<211> 465
<212> PRT
<213> Psychrobacter sp.
<400> 304
Met Phe Thr Ala Asn Phe Asn Asn Leu Ile Leu Asn Ser Asp Ser Tyr
1 5 10 15
Lys Thr Ser His Trp Leu Gln Tyr Pro Pro Gly Ser Glu Tyr Met Ser
20 25 30
Ser Tyr Val Glu Ala Arg Lys Gly Asp Tyr Asp Val Val Phe Phe Gly
35 40 45
Leu Gln Ala Phe Ile Lys Glu Tyr Leu Asn Lys Pro Ile Thr Thr Ala
50 55 60
Asp Ile Asp Asp Ala Glu Leu Val Ile Lys Ala His Gly Leu Pro Phe
65 70 75 80
Asn Arg Ser Gly Trp Glu Arg Leu Val Glu Lys His Asn Gly Tyr Leu
85 90 95
Pro Ile Arg Ile Gln Ala Val Pro Glu Gly Ser Leu Val Pro Val Ser
100 105 110
Asn Val Val Cys Gln Ile Ile Asn Thr Asp Pro Glu Phe Tyr Trp Leu
115 120 125
Pro Ser Tyr Leu Glu Thr Ser Leu Leu Arg Ala Ile Trp Tyr Pro Ser
130 135 140
Thr Val Ala Ser Leu Ser Tyr Tyr Cys Lys Asn Ile Ile Lys Ala Ala
145 150 155 160
Leu Glu Lys Ser Ala Asp Ser Ser Ala Gly Leu Pro Phe Lys Leu His
165 170 175
Asp Phe Gly Ala Arg Gly Ala Ser Ser Met Glu Ser Val Ala Leu Gly
180 185 190
Ser Leu Ala His Leu Val Asn Phe Ser Gly Thr Asp Ser Met Thr Ala
195 200 205
Leu Val Ala Ala Ser Arg Trp Tyr Gly Met Ser Asp Asn Met Pro Ala
210 215 220
Phe Ser Ile Pro Ala Ala Glu His Ser Thr Met Thr Ala Trp Gly Arg
225 230 235 240
Glu Arg Glu Thr Gln Ala Tyr Ala Asn Met Leu Asp Gln Phe Gly Gly
245 250 255
Glu Gly His Met Val Ala Val Val Ser Asp Ser Tyr Asn Leu Trp Asn
260 265 270
Ala Ile Asp Asn Ile Trp Gly Asp Ala Leu Lys Gln Gln Val Glu Thr
275 280 285
Met Gly Gly Thr Leu Val Val Arg Pro Asp Ser Gly Asp Pro Ala Lys
290 295 300
Val Val Arg Glu Ala Leu Glu Arg Leu Ser Val Lys Phe Gly Tyr Arg
305 310 315 320
Val Asn Ser Lys Gly Tyr Lys Val Leu Pro Asp Tyr Val Arg Leu Ile
325 330 335
Gln Gly Asp Gly Ile Ser Pro Gln Ser Leu Gly Lys Ile Leu Asp Thr
340 345 350
Ile Met Gln Ala Gly Phe Ser Ala Asp Asn Val Thr Phe Gly Met Gly
355 360 365
Gly Gly Leu Leu Gln Gln Val Asn Arg Asp Thr Met Ser Trp Ala Met
370 375 380
Lys Ala Ser Ala Ile Arg Ile Asp Gly Glu Leu Lys Asp Ile Phe Lys
385 390 395 400
Asp Pro Ile Thr Ser Arg Ser Lys Arg Ser Lys Lys Gly Arg Leu Ala
405 410 415
Leu Ile Lys Gln Thr Asn Gly Thr Leu Thr Thr Ile Lys Glu Asp Ser
420 425 430
Leu Asn Ser Pro Glu Asp Asn Leu Leu Arg Asp Val Phe Val Asp Gly
435 440 445
Lys Leu Leu Val Asp Asp Asn Leu Thr Thr Ile Arg Gln Arg Thr Gly
450 455 460
Trp
465
<210> 305
<211> 1452
<212> DNA
<213> Ralstonia solanacearum
<400> 305
atgcaaaacg atctgcccgg cctgtcggcc atcctgtcca atccgatcct caatacggat 60
tcgtacaagg cttcccacta cctgcagtat ccggccggca cgtcggccat gttttcctac 120
gtcgagtcgc gcggcggccg ctatgaccgc accgtgttct tcgggctaca gatgctggcg 180
aaggaatacc tgtgccgccc catcacgccg gccatgatcg acgcggcgcg cgggttcttc 240
gccgcgcacg gcgagccgtt caacgaagcc ggctggcgct acatcgtcgc acgctacgac 300
ggctacctgc cggtgcgcat ccgcgcggtg ccggagggca gcgtggtgcc caaccacaat 360
gtgctgatga cggtcgagtg cgacgacccc gaggtgttct ggctcgcgtc gtatctcgag 420
acgatgctgc tgcgcgtgtg gtatccgatc acggtggcga cgcagagctg gcacctgcgc 480
caactggtgc accgctacct ggagcagacc agcgacgacc ccggccagtt gccgttcaag 540
gtgcacgact tcggcgcgcg cggcgtgtcg agcgcggagt cgtcggccat cggcggggcg 600
gcgcacctgg tcagcttcat ggggtcggac accgtgctgg gcgtggcggc ggccaatctg 660
tactacaacg cgcagatggc cgccttctcg gtgccggccg ccgagcacag caccatcacc 720
gcgtggggca gggcgggcga ggccgacgcc taccgcaaca tgctgcgcca gttcggcaag 780
ccgggcgcga tcgtctcggt ggtgtccgat tcgtacgatc tgttcgccgc gctgcgcctg 840
tggggcggcg agctgcggca ggcggtgatc gattccggcg ccacgctggt ggtgcgcccc 900
gattcgggcg atccgcgcag catcgtgctg cagacggtgc gcgcgctcga tgcgtcgttc 960
ggggccaccg tcaacggcaa gggctaccgc gtgctcaacc atgtgcgcgt gatccagggc 1020
gacggcatca acgccgcgtc gatcgaggcg atcctggccg agctggaggc cgcgggctat 1080
gcggcggaca acatcgtctt cggcatgggg ggtgccctgc tgcagcagct caaccgcgat 1140
acccagcgct tcgccatgaa gtgctcggcg gtgcgggtgg acggcgcctg gcgcgaggtc 1200
tgcaaggacc cggtcaccga tgccggcaag cgctcgaaga agggccgcct gaccttgctg 1260
cgcaaccgcg tgtccggcga gtacgcgacg gccacgctgc cgctcgcctg ggacgaccgc 1320
cggatcgaag gggaatggga ggacgccctg gtgacggtgt tcgaaaacgg ccgcctgttg 1380
caggacgtgt cgctggacgc cgtgcgggca cgcgcccagg cacacgagct ggcgccggcg 1440
ctcgtcgact ga 1452
<210> 306
<211> 483
<212> PRT
<213> Ralstonia solanacearum
<400> 306
Met Gln Asn Asp Leu Pro Gly Leu Ser Ala Ile Leu Ser Asn Pro Ile
1 5 10 15
Leu Asn Thr Asp Ser Tyr Lys Ala Ser His Tyr Leu Gln Tyr Pro Ala
20 25 30
Gly Thr Ser Ala Met Phe Ser Tyr Val Glu Ser Arg Gly Gly Arg Tyr
35 40 45
Asp Arg Thr Val Phe Phe Gly Leu Gln Met Leu Ala Lys Glu Tyr Leu
50 55 60
Cys Arg Pro Ile Thr Pro Ala Met Ile Asp Ala Ala Arg Gly Phe Phe
65 70 75 80
Ala Ala His Gly Glu Pro Phe Asn Glu Ala Gly Trp Arg Tyr Ile Val
85 90 95
Ala Arg Tyr Asp Gly Tyr Leu Pro Val Arg Ile Arg Ala Val Pro Glu
100 105 110
Gly Ser Val Val Pro Asn His Asn Val Leu Met Thr Val Glu Cys Asp
115 120 125
Asp Pro Glu Val Phe Trp Leu Ala Ser Tyr Leu Glu Thr Met Leu Leu
130 135 140
Arg Val Trp Tyr Pro Ile Thr Val Ala Thr Gln Ser Trp His Leu Arg
145 150 155 160
Gln Leu Val His Arg Tyr Leu Glu Gln Thr Ser Asp Asp Pro Gly Gln
165 170 175
Leu Pro Phe Lys Val His Asp Phe Gly Ala Arg Gly Val Ser Ser Ala
180 185 190
Glu Ser Ser Ala Ile Gly Gly Ala Ala His Leu Val Ser Phe Met Gly
195 200 205
Ser Asp Thr Val Leu Gly Val Ala Ala Ala Asn Leu Tyr Tyr Asn Ala
210 215 220
Gln Met Ala Ala Phe Ser Val Pro Ala Ala Glu His Ser Thr Ile Thr
225 230 235 240
Ala Trp Gly Arg Ala Gly Glu Ala Asp Ala Tyr Arg Asn Met Leu Arg
245 250 255
Gln Phe Gly Lys Pro Gly Ala Ile Val Ser Val Val Ser Asp Ser Tyr
260 265 270
Asp Leu Phe Ala Ala Leu Arg Leu Trp Gly Gly Glu Leu Arg Gln Ala
275 280 285
Val Ile Asp Ser Gly Ala Thr Leu Val Val Arg Pro Asp Ser Gly Asp
290 295 300
Pro Arg Ser Ile Val Leu Gln Thr Val Arg Ala Leu Asp Ala Ser Phe
305 310 315 320
Gly Ala Thr Val Asn Gly Lys Gly Tyr Arg Val Leu Asn His Val Arg
325 330 335
Val Ile Gln Gly Asp Gly Ile Asn Ala Ala Ser Ile Glu Ala Ile Leu
340 345 350
Ala Glu Leu Glu Ala Ala Gly Tyr Ala Ala Asp Asn Ile Val Phe Gly
355 360 365
Met Gly Gly Ala Leu Leu Gln Gln Leu Asn Arg Asp Thr Gln Arg Phe
370 375 380
Ala Met Lys Cys Ser Ala Val Arg Val Asp Gly Ala Trp Arg Glu Val
385 390 395 400
Cys Lys Asp Pro Val Thr Asp Ala Gly Lys Arg Ser Lys Lys Gly Arg
405 410 415
Leu Thr Leu Leu Arg Asn Arg Val Ser Gly Glu Tyr Ala Thr Ala Thr
420 425 430
Leu Pro Leu Ala Trp Asp Asp Arg Arg Ile Glu Gly Glu Trp Glu Asp
435 440 445
Ala Leu Val Thr Val Phe Glu Asn Gly Arg Leu Leu Gln Asp Val Ser
450 455 460
Leu Asp Ala Val Arg Ala Arg Ala Gln Ala His Glu Leu Ala Pro Ala
465 470 475 480
Leu Val Asp
<210> 307
<211> 1410
<212> DNA
<213> Stenotrophomonas maltophilia
<400> 307
atgcactacc tcgataatct tctcctcaac accgacagct acaaggccag ccattggctg 60
cagtatccgc cgggtaccga tgccacgttc ttctacgtcg aatcacgtgg cggcctgcac 120
gatcgcacgg tgttcttcgg cctgcaggcg atcctcaagg acgcgctggc acgaccggtc 180
acccacgccg acatcgacga cgctgctgcg gtattcgccg cgcacggcga accgttcaac 240
gaggccggct ggcgcgatat cgtcgaccgg cttggcggcc acctgccggt gcgcatccgc 300
gccgttcccg agggcagcgt ggtgcccacc caccaggcac tgatgaccat cgagtcgacc 360
gatccggctg cgttctgggt gccgtcgtat ctggaaacgc tgctgctgcg cgtgtggtat 420
ccggtcaccg tggccaccat cagctggcac gcacggcaga ccatcgccgc gttcctgcag 480
cagaccagcg acgacccgca ggggcagctg ccgttcaagc tgcacgactt cggcgcgcgc 540
ggtgtatcga gcctggaatc ggccgcgttg ggcggtgccg cgcacctggt caacttcctc 600
ggcaccgata ccgtgtcggc gctgtgcctg gcacgcgcgc actaccacgc gccgatggcc 660
ggctattcga ttccggccgc cgagcacagc accatcacca gttggggccg cgaacgcgag 720
gtggacgcct atcgcaacat gctgcgccag ttcggcaagc ccggttcgat cgtggcggtg 780
gtgtcggaca gctatgacat ctaccgcgcg atcagcgaac actggggcac caccctgcgc 840
gatgacgtga tcgcgtcggg cgccaccctg gtcatccgtc ccgactcggg tgacccggtg 900
gaggtggtgg ccgaaagcct gcgccggctg gatgaagcct tcggccacgc gatcaacggc 960
aagggctatc gcgtgctcaa ccacgtgcgg gtgatccagg gcgatggcat caatccggac 1020
accatccgcg cgatcctgca gcgcatcacc gacgacggct acgccgccga caacgtggcc 1080
ttcggcatgg gcggtgcgct gctgcagcgg ctggaccgcg atacgcagaa gttcgcactg 1140
aagtgctcgg cggcgagggt cgagggtgag tggatcgacg tctacaagga tccggtcacc 1200
gacgccggca aggccagcaa gcgcggccgc atgcgcctgc tgcgccgcct ggacgatggc 1260
agcctgcata cggtgccact gccggccaac ggcgacgaca ccctgccgga cggcttcgag 1320
gacgcaatgg tgaccgtgtg ggagaacggc catcttctgt acgaccagcg gctggacgac 1380
atccgcacgc gggcggccgt ggggcattga 1410
<210> 308
<211> 469
<212> PRT
<213> Stenotrophomonas maltophilia
<400> 308
Met His Tyr Leu Asp Asn Leu Leu Leu Asn Thr Asp Ser Tyr Lys Ala
1 5 10 15
Ser His Trp Leu Gln Tyr Pro Pro Gly Thr Asp Ala Thr Phe Phe Tyr
20 25 30
Val Glu Ser Arg Gly Gly Leu His Asp Arg Thr Val Phe Phe Gly Leu
35 40 45
Gln Ala Ile Leu Lys Asp Ala Leu Ala Arg Pro Val Thr His Ala Asp
50 55 60
Ile Asp Asp Ala Ala Ala Val Phe Ala Ala His Gly Glu Pro Phe Asn
65 70 75 80
Glu Ala Gly Trp Arg Asp Ile Val Asp Arg Leu Gly Gly His Leu Pro
85 90 95
Val Arg Ile Arg Ala Val Pro Glu Gly Ser Val Val Pro Thr His Gln
100 105 110
Ala Leu Met Thr Ile Glu Ser Thr Asp Pro Ala Ala Phe Trp Val Pro
115 120 125
Ser Tyr Leu Glu Thr Leu Leu Leu Arg Val Trp Tyr Pro Val Thr Val
130 135 140
Ala Thr Ile Ser Trp His Ala Arg Gln Thr Ile Ala Ala Phe Leu Gln
145 150 155 160
Gln Thr Ser Asp Asp Pro Gln Gly Gln Leu Pro Phe Lys Leu His Asp
165 170 175
Phe Gly Ala Arg Gly Val Ser Ser Leu Glu Ser Ala Ala Leu Gly Gly
180 185 190
Ala Ala His Leu Val Asn Phe Leu Gly Thr Asp Thr Val Ser Ala Leu
195 200 205
Cys Leu Ala Arg Ala His Tyr His Ala Pro Met Ala Gly Tyr Ser Ile
210 215 220
Pro Ala Ala Glu His Ser Thr Ile Thr Ser Trp Gly Arg Glu Arg Glu
225 230 235 240
Val Asp Ala Tyr Arg Asn Met Leu Arg Gln Phe Gly Lys Pro Gly Ser
245 250 255
Ile Val Ala Val Val Ser Asp Ser Tyr Asp Ile Tyr Arg Ala Ile Ser
260 265 270
Glu His Trp Gly Thr Thr Leu Arg Asp Asp Val Ile Ala Ser Gly Ala
275 280 285
Thr Leu Val Ile Arg Pro Asp Ser Gly Asp Pro Val Glu Val Val Ala
290 295 300
Glu Ser Leu Arg Arg Leu Asp Glu Ala Phe Gly His Ala Ile Asn Gly
305 310 315 320
Lys Gly Tyr Arg Val Leu Asn His Val Arg Val Ile Gln Gly Asp Gly
325 330 335
Ile Asn Pro Asp Thr Ile Arg Ala Ile Leu Gln Arg Ile Thr Asp Asp
340 345 350
Gly Tyr Ala Ala Asp Asn Val Ala Phe Gly Met Gly Gly Ala Leu Leu
355 360 365
Gln Arg Leu Asp Arg Asp Thr Gln Lys Phe Ala Leu Lys Cys Ser Ala
370 375 380
Ala Arg Val Glu Gly Glu Trp Ile Asp Val Tyr Lys Asp Pro Val Thr
385 390 395 400
Asp Ala Gly Lys Ala Ser Lys Arg Gly Arg Met Arg Leu Leu Arg Arg
405 410 415
Leu Asp Asp Gly Ser Leu His Thr Val Pro Leu Pro Ala Asn Gly Asp
420 425 430
Asp Thr Leu Pro Asp Gly Phe Glu Asp Ala Met Val Thr Val Trp Glu
435 440 445
Asn Gly His Leu Leu Tyr Asp Gln Arg Leu Asp Asp Ile Arg Thr Arg
450 455 460
Ala Ala Val Gly His
465
<210> 309
<211> 1389
<212> DNA
<213> Synechococcus elongatus
<400> 309
atggacctca atcttctgtt cgataccgac tcatacaaag tcagccactg gctgcaatat 60
cctgccgata cgactgcgat cggagcttat ttagaaagcc ggggtggaga ttgctcgcac 120
acgctctttt ttggcttgca atatctacta ctgcgttatt tcttccagcc aatcactagc 180
gctgacattc aagaagccgc cgcgctgttt caagcgcatg ggctgccttt caatcaagcg 240
ggctggcaac gagtttgcga tcgctatggc gggtatttac ctttacgaat tcgggctgtc 300
ccggaaggta gccttgtccc caccggcaat atcttgctga cagtggaatc gaccgatcct 360
gaattggctt ggctggccac ttgggttgag acactactgc tgcgggtttg gtatccgata 420
actgtggcta cacgcagttg gcagcttcgg caaatcattc agcaagcgct ggagcaatca 480
gccgaaaatc cagcagctga aattgacttc aaactgcatg actttggatc acgcggggta 540
tcgagccaag aaagtgctgc aatcggcggg ctggctcatt tggtcaactt tcaaggcact 600
gatacgatcg ctgcgttact ggcaggacag cgctattacg attgcgcgat cgctggcttt 660
tcgattccgg cggcggagca ttcaacgatt acggcttggg gcccatcggg tgagttagat 720
gcttaccgca atatgctcga tcgctttgca aatccgggat ctgtggtggc tgttgtatcg 780
gactcctatg atctctggca tgccgtcgat cagctttggg gtgaggatct ccgcgatcgc 840
attttgcaat cgggagcaac cgttgtcatt cggcctgact caggcaatcc tgagcagatt 900
gtgccggaat tactgcgtcg tttggccgct aagttcggct gcgatcgcaa tcagaagggt 960
tatcaagttt tgcgatcggt gcgggtgatt cagggcgatg ggatcacagt ggacagtctg 1020
cccaaagttc tgcaagcggt tatggccgct ggctttagtg ccagtaatgt cgcttttggc 1080
atgggtggcg ggctgttgca gcaggtcaat cgcgataccc aacgctttgc ctacaagtgc 1140
agctggatcg agcgatcggg acaagtgatt cccatttgca agcgaccagc cacggatctg 1200
cgcaaggcta gcaaagcagg acgcttggat ttaattcgcg atcgcgaggg gcaataccga 1260
acagtctcgt tactgacgtc agagcctgac ccgcaatcct gcctgcaaac ggtgtttgaa 1320
aatggtgcga tcgtgcggcg acaaagcttg caggaaatcc gcgatcgcgc tcgttctgag 1380
acacgctag 1389
<210> 310
<211> 462
<212> PRT
<213> Synechococcus elongatus
<400> 310
Met Asp Leu Asn Leu Leu Phe Asp Thr Asp Ser Tyr Lys Val Ser His
1 5 10 15
Trp Leu Gln Tyr Pro Ala Asp Thr Thr Ala Ile Gly Ala Tyr Leu Glu
20 25 30
Ser Arg Gly Gly Asp Cys Ser His Thr Leu Phe Phe Gly Leu Gln Tyr
35 40 45
Leu Leu Leu Arg Tyr Phe Phe Gln Pro Ile Thr Ser Ala Asp Ile Gln
50 55 60
Glu Ala Ala Ala Leu Phe Gln Ala His Gly Leu Pro Phe Asn Gln Ala
65 70 75 80
Gly Trp Gln Arg Val Cys Asp Arg Tyr Gly Gly Tyr Leu Pro Leu Arg
85 90 95
Ile Arg Ala Val Pro Glu Gly Ser Leu Val Pro Thr Gly Asn Ile Leu
100 105 110
Leu Thr Val Glu Ser Thr Asp Pro Glu Leu Ala Trp Leu Ala Thr Trp
115 120 125
Val Glu Thr Leu Leu Leu Arg Val Trp Tyr Pro Ile Thr Val Ala Thr
130 135 140
Arg Ser Trp Gln Leu Arg Gln Ile Ile Gln Gln Ala Leu Glu Gln Ser
145 150 155 160
Ala Glu Asn Pro Ala Ala Glu Ile Asp Phe Lys Leu His Asp Phe Gly
165 170 175
Ser Arg Gly Val Ser Ser Gln Glu Ser Ala Ala Ile Gly Gly Leu Ala
180 185 190
His Leu Val Asn Phe Gln Gly Thr Asp Thr Ile Ala Ala Leu Leu Ala
195 200 205
Gly Gln Arg Tyr Tyr Asp Cys Ala Ile Ala Gly Phe Ser Ile Pro Ala
210 215 220
Ala Glu His Ser Thr Ile Thr Ala Trp Gly Pro Ser Gly Glu Leu Asp
225 230 235 240
Ala Tyr Arg Asn Met Leu Asp Arg Phe Ala Asn Pro Gly Ser Val Val
245 250 255
Ala Val Val Ser Asp Ser Tyr Asp Leu Trp His Ala Val Asp Gln Leu
260 265 270
Trp Gly Glu Asp Leu Arg Asp Arg Ile Leu Gln Ser Gly Ala Thr Val
275 280 285
Val Ile Arg Pro Asp Ser Gly Asn Pro Glu Gln Ile Val Pro Glu Leu
290 295 300
Leu Arg Arg Leu Ala Ala Lys Phe Gly Cys Asp Arg Asn Gln Lys Gly
305 310 315 320
Tyr Gln Val Leu Arg Ser Val Arg Val Ile Gln Gly Asp Gly Ile Thr
325 330 335
Val Asp Ser Leu Pro Lys Val Leu Gln Ala Val Met Ala Ala Gly Phe
340 345 350
Ser Ala Ser Asn Val Ala Phe Gly Met Gly Gly Gly Leu Leu Gln Gln
355 360 365
Val Asn Arg Asp Thr Gln Arg Phe Ala Tyr Lys Cys Ser Trp Ile Glu
370 375 380
Arg Ser Gly Gln Val Ile Pro Ile Cys Lys Arg Pro Ala Thr Asp Leu
385 390 395 400
Arg Lys Ala Ser Lys Ala Gly Arg Leu Asp Leu Ile Arg Asp Arg Glu
405 410 415
Gly Gln Tyr Arg Thr Val Ser Leu Leu Thr Ser Glu Pro Asp Pro Gln
420 425 430
Ser Cys Leu Gln Thr Val Phe Glu Asn Gly Ala Ile Val Arg Arg Gln
435 440 445
Ser Leu Gln Glu Ile Arg Asp Arg Ala Arg Ser Glu Thr Arg
450 455 460
<210> 311
<211> 1542
<212> DNA
<213> Volvox carteri
<400> 311
atgctgcctc tgggagtgcc aatcagtgtg ctgagtgata gctacaaggc tacgcacttt 60
ctgcagtacc caaaggcgca taagatggtt gcgtatggtg agtttcgcca ggggttcaat 120
aaagacaagg cagacacgcg catggtgtca tacggcatcc gttacctggt tgagaattat 180
gttgcgaagc cctggacaat ggaggacgtc gagatggctg aggcgttcta cagtcgagag 240
ggcgacctaa ccttaccagc tgcgccccct cagacgccct tctcctcagc cacacgtgat 300
tacccgccgc cacgtcctgt gtgccgagca ggttacttcc ctgtgaagct ggaggcgctg 360
cccgagggca cttgcatcca cgcccgcgtc ccggtgtacc agatcaccgc caccggcgag 420
tacagtcccc tctgcacctt tttggagacg ttgctgacca tgatctggta ccccaccacc 480
gtggcgaccc tgtcacggaa ggcgcgggat gtggtagagg tgtccttcgg acgcaccagc 540
gacggcggcc ccaccagcag gctggtggag agcaggctgg tggatttcgg gtttcggggc 600
tgcacgtccg tggagcagtc catcattggc ggctgtgcgc acctcctcag cttcaactcc 660
tcggatacca tgtccgcagc gttttatgca cagttcaagc tgaatggtgg gcgacccgtg 720
ggtcagtcca ttcccgccac ggagcacagc gtcatgacgt catggcccac tgaagcggct 780
gcgatgacca acatgattga caactttggc actgggatat acgcttgcgt catggacagc 840
tacgactatt gcaaggctct gtccgaggtc cttccttccg tggccgcaca caaggtgtcg 900
cgaggggggt acctggtgct gagacctgac agcggcgacc ccacggaggc cgtgctgatg 960
gccctaaacg ccgctgacaa ggtgttcggc agtgtccgca acagcaaggg cttccgggtc 1020
atccagggct gtggggtaat tcagggggac ggtatcgacc tgacgactat ggagaagata 1080
tcggtggcta tcgaagaggc tggctttgcg gctgacaatg tgtcgtacgg catgggcggc 1140
ggcctgctcc aaaaggtcaa ccgggacacc atgtccttcg ccaccaagct gtgtcacatc 1200
gtgtatgagg acggccggcc cgcggacatc atgaagcagc cgcagacgga cacgggcaaa 1260
ttctcccttc ctggtatcct ggcagtcaaa cgagtgaatg gcgtccccac ggttttcccc 1320
gccgacacgg ccgaagttgc accccatgag aacttgctgc gggttgtgta cgacaaaggc 1380
ccgttggagg gggtgtggga cgactttgac acggtgcgcg cgcgcgtggc ggcggagtgg 1440
atggcattgc ctcgcagcgc cgacaacatc agcagttcgt tgagggagaa agtgcggcaa 1500
cagatggcgc tgaggggcaa ggtgccggca atcgcgcgct ga 1542
<210> 312
<211> 513
<212> PRT
<213> Volvox carteri
<400> 312
Met Leu Pro Leu Gly Val Pro Ile Ser Val Leu Ser Asp Ser Tyr Lys
1 5 10 15
Ala Thr His Phe Leu Gln Tyr Pro Lys Ala His Lys Met Val Ala Tyr
20 25 30
Gly Glu Phe Arg Gln Gly Phe Asn Lys Asp Lys Ala Asp Thr Arg Met
35 40 45
Val Ser Tyr Gly Ile Arg Tyr Leu Val Glu Asn Tyr Val Ala Lys Pro
50 55 60
Trp Thr Met Glu Asp Val Glu Met Ala Glu Ala Phe Tyr Ser Arg Glu
65 70 75 80
Gly Asp Leu Thr Leu Pro Ala Ala Pro Pro Gln Thr Pro Phe Ser Ser
85 90 95
Ala Thr Arg Asp Tyr Pro Pro Pro Arg Pro Val Cys Arg Ala Gly Tyr
100 105 110
Phe Pro Val Lys Leu Glu Ala Leu Pro Glu Gly Thr Cys Ile His Ala
115 120 125
Arg Val Pro Val Tyr Gln Ile Thr Ala Thr Gly Glu Tyr Ser Pro Leu
130 135 140
Cys Thr Phe Leu Glu Thr Leu Leu Thr Met Ile Trp Tyr Pro Thr Thr
145 150 155 160
Val Ala Thr Leu Ser Arg Lys Ala Arg Asp Val Val Glu Val Ser Phe
165 170 175
Gly Arg Thr Ser Asp Gly Gly Pro Thr Ser Arg Leu Val Glu Ser Arg
180 185 190
Leu Val Asp Phe Gly Phe Arg Gly Cys Thr Ser Val Glu Gln Ser Ile
195 200 205
Ile Gly Gly Cys Ala His Leu Leu Ser Phe Asn Ser Ser Asp Thr Met
210 215 220
Ser Ala Ala Phe Tyr Ala Gln Phe Lys Leu Asn Gly Gly Arg Pro Val
225 230 235 240
Gly Gln Ser Ile Pro Ala Thr Glu His Ser Val Met Thr Ser Trp Pro
245 250 255
Thr Glu Ala Ala Ala Met Thr Asn Met Ile Asp Asn Phe Gly Thr Gly
260 265 270
Ile Tyr Ala Cys Val Met Asp Ser Tyr Asp Tyr Cys Lys Ala Leu Ser
275 280 285
Glu Val Leu Pro Ser Val Ala Ala His Lys Val Ser Arg Gly Gly Tyr
290 295 300
Leu Val Leu Arg Pro Asp Ser Gly Asp Pro Thr Glu Ala Val Leu Met
305 310 315 320
Ala Leu Asn Ala Ala Asp Lys Val Phe Gly Ser Val Arg Asn Ser Lys
325 330 335
Gly Phe Arg Val Ile Gln Gly Cys Gly Val Ile Gln Gly Asp Gly Ile
340 345 350
Asp Leu Thr Thr Met Glu Lys Ile Ser Val Ala Ile Glu Glu Ala Gly
355 360 365
Phe Ala Ala Asp Asn Val Ser Tyr Gly Met Gly Gly Gly Leu Leu Gln
370 375 380
Lys Val Asn Arg Asp Thr Met Ser Phe Ala Thr Lys Leu Cys His Ile
385 390 395 400
Val Tyr Glu Asp Gly Arg Pro Ala Asp Ile Met Lys Gln Pro Gln Thr
405 410 415
Asp Thr Gly Lys Phe Ser Leu Pro Gly Ile Leu Ala Val Lys Arg Val
420 425 430
Asn Gly Val Pro Thr Val Phe Pro Ala Asp Thr Ala Glu Val Ala Pro
435 440 445
His Glu Asn Leu Leu Arg Val Val Tyr Asp Lys Gly Pro Leu Glu Gly
450 455 460
Val Trp Asp Asp Phe Asp Thr Val Arg Ala Arg Val Ala Ala Glu Trp
465 470 475 480
Met Ala Leu Pro Arg Ser Ala Asp Asn Ile Ser Ser Ser Leu Arg Glu
485 490 495
Lys Val Arg Gln Gln Met Ala Leu Arg Gly Lys Val Pro Ala Ile Ala
500 505 510
Arg
<210> 313
<211> 1464
<212> DNA
<213> Xanthomonas campestris
<400> 313
atgacctccc gctggcggac agaccgccgg ccctcccgac gcgaaggagc ttccgtcatg 60
cattatctcg acaacctgct gctcaacacc gacagctaca aggccagcca ctggctgcaa 120
tatccgcctg gcaccgatgc ctcgtttttc tacgtggaat cgcgcggcgg cgtgtacgac 180
cagaccgtgt tcttcggcct gcagtcgatc ctgaaagaag cgatcaaccg cccggtgacg 240
cacgccgaca tcgacgatgc caaggcgttg ctggcggcgc atggcgagcc gttcaacgag 300
gccggctggc gcgatatcgt cgaccgcttg ggtgggcagt tgccgatccg catccgtgcg 360
gtgcccgaag gctgcgtggt gcccacgcac aacgtgctga tgacgatcga atccaccgac 420
gccaaggcgt tctgggtgcc gtcgtatctg gaaaccttgc tgctgcgcgt gtggtatccg 480
gtgaccgtgg ccacggtgag ctggcaggtg aagcagatcg tgcgcgattt cctgcaacgc 540
accagcgacg atcccgaagg ccagttgccg ttcaagctgc atgacttcgg tgcgcgtggc 600
gtgtccagcc tgggctcggc cgcgctgggt ggcgcggcgc acctggtgaa cttcctcggc 660
accgatactt tatcggcgtt gttgctggcg cgcgcgcatt accacacgcc ggtggccggt 720
tattcgatcc ccgcggccga gcacagcacc atcaccagct gggggcgcga gcgcgaagtc 780
gatgcatacc gcaacatgct cacgcagttt gcgcggccgg gcgcgatcgt ggcggtggtg 840
tcggacagct acgacatcta ccgcgccatt cgcgagcatt ggggcaccac gctgcgcgag 900
gagatcatcg cctccggtgc caccgtggtg atccgccccg attcgggcga cccggtggat 960
gtggtcgagc agtgtctgtt gttgctggac gaggcgttcg gccatcaggt caacggcaag 1020
ggctacaagg tgctcaatca cgtgcgcgtg atccagggcg atggcatcaa tccgcagtcg 1080
ctgcgcgcca tcctcgaacg catcaccgct gccggatatg cggccgacaa tgtcgccttc 1140
ggcatgggcg gtgcgctgct gcagaaggtg gaccgcgaca cgcagaagtt cgcactgaag 1200
tgctcggcgg tgcgcgtgga tggcgcatgg atcgatgtct acaaggaccc gatcaccgat 1260
cagggcaagc agagcaagcg cggccggctg acgctgctgc gcgaccgtac cacgggccaa 1320
taccgcagtg ccttgctcga cgaggtcgcc acgcacgcgg gcgacagtga cgatgcattg 1380
gtcacggtgt gggagaacgg caagatgctg caggaatgga cgcttgagca ggtgcgtgca 1440
catgcagacg ctgcccggtt gtga 1464
<210> 314
<211> 487
<212> PRT
<213> Xanthomonas campestris
<400> 314
Met Thr Ser Arg Trp Arg Thr Asp Arg Arg Pro Ser Arg Arg Glu Gly
1 5 10 15
Ala Ser Val Met His Tyr Leu Asp Asn Leu Leu Leu Asn Thr Asp Ser
20 25 30
Tyr Lys Ala Ser His Trp Leu Gln Tyr Pro Pro Gly Thr Asp Ala Ser
35 40 45
Phe Phe Tyr Val Glu Ser Arg Gly Gly Val Tyr Asp Gln Thr Val Phe
50 55 60
Phe Gly Leu Gln Ser Ile Leu Lys Glu Ala Ile Asn Arg Pro Val Thr
65 70 75 80
His Ala Asp Ile Asp Asp Ala Lys Ala Leu Leu Ala Ala His Gly Glu
85 90 95
Pro Phe Asn Glu Ala Gly Trp Arg Asp Ile Val Asp Arg Leu Gly Gly
100 105 110
Gln Leu Pro Ile Arg Ile Arg Ala Val Pro Glu Gly Cys Val Val Pro
115 120 125
Thr His Asn Val Leu Met Thr Ile Glu Ser Thr Asp Ala Lys Ala Phe
130 135 140
Trp Val Pro Ser Tyr Leu Glu Thr Leu Leu Leu Arg Val Trp Tyr Pro
145 150 155 160
Val Thr Val Ala Thr Val Ser Trp Gln Val Lys Gln Ile Val Arg Asp
165 170 175
Phe Leu Gln Arg Thr Ser Asp Asp Pro Glu Gly Gln Leu Pro Phe Lys
180 185 190
Leu His Asp Phe Gly Ala Arg Gly Val Ser Ser Leu Gly Ser Ala Ala
195 200 205
Leu Gly Gly Ala Ala His Leu Val Asn Phe Leu Gly Thr Asp Thr Leu
210 215 220
Ser Ala Leu Leu Leu Ala Arg Ala His Tyr His Thr Pro Val Ala Gly
225 230 235 240
Tyr Ser Ile Pro Ala Ala Glu His Ser Thr Ile Thr Ser Trp Gly Arg
245 250 255
Glu Arg Glu Val Asp Ala Tyr Arg Asn Met Leu Thr Gln Phe Ala Arg
260 265 270
Pro Gly Ala Ile Val Ala Val Val Ser Asp Ser Tyr Asp Ile Tyr Arg
275 280 285
Ala Ile Arg Glu His Trp Gly Thr Thr Leu Arg Glu Glu Ile Ile Ala
290 295 300
Ser Gly Ala Thr Val Val Ile Arg Pro Asp Ser Gly Asp Pro Val Asp
305 310 315 320
Val Val Glu Gln Cys Leu Leu Leu Leu Asp Glu Ala Phe Gly His Gln
325 330 335
Val Asn Gly Lys Gly Tyr Lys Val Leu Asn His Val Arg Val Ile Gln
340 345 350
Gly Asp Gly Ile Asn Pro Gln Ser Leu Arg Ala Ile Leu Glu Arg Ile
355 360 365
Thr Ala Ala Gly Tyr Ala Ala Asp Asn Val Ala Phe Gly Met Gly Gly
370 375 380
Ala Leu Leu Gln Lys Val Asp Arg Asp Thr Gln Lys Phe Ala Leu Lys
385 390 395 400
Cys Ser Ala Val Arg Val Asp Gly Ala Trp Ile Asp Val Tyr Lys Asp
405 410 415
Pro Ile Thr Asp Gln Gly Lys Gln Ser Lys Arg Gly Arg Leu Thr Leu
420 425 430
Leu Arg Asp Arg Thr Thr Gly Gln Tyr Arg Ser Ala Leu Leu Asp Glu
435 440 445
Val Ala Thr His Ala Gly Asp Ser Asp Asp Ala Leu Val Thr Val Trp
450 455 460
Glu Asn Gly Lys Met Leu Gln Glu Trp Thr Leu Glu Gln Val Arg Ala
465 470 475 480
His Ala Asp Ala Ala Arg Leu
485
<210> 315
<211> 242
<212> PRT
<213> Artificial sequence
<220>
<223> conserved domain
<400> 315
Phe Lys Leu His Asp Phe Gly Ala Arg Gly Val Ser Ser Gly Glu Ser
1 5 10 15
Ser Gly Ile Gly Gly Leu Ala His Leu Val Asn Phe Gln Gly Ser Asp
20 25 30
Thr Val Lys Ala Leu Val Tyr Gly Gln Gln Tyr Tyr Asn Cys Pro Met
35 40 45
Ala Ala Tyr Ser Ile Pro Ala Ala Glu His Ser Thr Ile Thr Ala Trp
50 55 60
Gly Arg Glu Gly Glu Val Leu Ala Tyr Glu Asn Met Leu Thr Gln Phe
65 70 75 80
Ala Lys Pro Gly Ser Val Leu Ala Val Val Ser Asp Ser Tyr Asp Leu
85 90 95
Trp Asn Ala Ile Asp His Leu Trp Gly Asp His Leu Arg Ala Gln Val
100 105 110
Leu Asp Ser Gly Ala Thr Val Val Ile Arg Pro Asp Ser Gly Asp Pro
115 120 125
Val Ala Ile Val Ala Gln Thr Leu Glu Arg Leu Glu Ala Cys Phe Gly
130 135 140
Ser Thr Leu Asn Ser Lys Gly Phe Arg Val Leu Asn Ala Val Arg Val
145 150 155 160
Ile Gln Gly Asp Gly Val Asp Glu Glu Ser Ile Ser Ala Ile Leu Glu
165 170 175
Lys Thr Glu Ser Leu Gly Phe Ser Thr Thr Asn Leu Ala Phe Gly Met
180 185 190
Gly Gly Ala Leu Leu Gln Lys Val Asn Arg Asp Thr Gln Lys Phe Ala
195 200 205
Met Lys Cys Ser Glu Val Thr Val Glu Asp Lys Ala Ile Pro Val Tyr
210 215 220
Lys Asp Pro Val Thr Asp Pro Gly Lys Thr Ser Lys Lys Gly Arg Leu
225 230 235 240
Ser Leu
<210> 316
<211> 60
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14234
<400> 316
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa tactaatctc attctggatg 60
<210> 317
<211> 47
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm14233
<400> 317
ggggaccact ttgtacaaga aagctgggtc tagcttgcgg gaacatt 47
<210> 318
<211> 34
<212> PRT
<213> Artificial sequence
<220>
<223> motif 7
<400> 318
Phe Lys Leu His Asp Phe Gly Ala Arg Gly Val Ser Ser Gly Glu Ser
1 5 10 15
Ser Gly Ile Gly Gly Leu Ala His Leu Val Asn Phe Gln Gly Ser Asp
20 25 30
Thr Val
<210> 319
<211> 17
<212> PRT
<213> Artificial sequence
<220>
<223> motif 8
<400> 319
Ala Ala Tyr Ser Ile Pro Ala Ala Glu His Ser Thr Ile Thr Ala Trp
1 5 10 15
Gly
<210> 320
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> motif 9
<400> 320
Ala Val Val Ser Asp Ser Tyr Asp Leu
1 5
<210> 321
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> motif 10
<400> 321
Val Ile Arg Pro Asp Ser Gly Asp Pro
1 5
<210> 322
<211> 9
<212> PRT
<213> Artificial sequence
<220>
<223> motif 11
<400> 322
Val Arg Val Ile Gln Gly Asp Gly Val
1 5
<210> 323
<211> 18
<212> PRT
<213> Artificial sequence
<220>
<223> motif 12
<400> 323
Asn Leu Ala Phe Gly Met Gly Gly Ala Leu Leu Gln Lys Val Asn Arg
1 5 10 15
Asp Thr
<210> 324
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 324
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 325
<211> 1389
<212> DNA
<213> Synechococcus elongatus
<400> 325
atggacctca atcttctgtt cgataccgac tcatacaaag tcagccactg gctgcaatat 60
cctgccgata cgactgcgat cggagcttat ttagaaagcc ggggtggaga ttgctcgcac 120
acgctctttt ttggcttgca atatctacta ctgcgttatt tcttccagcc aatcactagc 180
gctgacattc aagaagccgc cgcgctgttt caagcgcatg ggctgccttt caatcaagcg 240
ggctggcaac gagtttgcga tcgctatggc gggtatttac ctttacgaat tcgggctgtc 300
ccggaaggta gccttgtccc caccggcaat atcttgctga cagtggaatc gaccgatcct 360
gaattggctt ggctggccac ttgggttgag acactactgc tgcgggtttg gtatccgata 420
actgtggcta cacgcagttg gcagcttcgg caaatcattc agcaagcgct ggagcaatca 480
gccgaaaatc cagcagctga aattgacttc aaactgcatg actttggatc acgcggggta 540
tcgagccaag aaagtgctgc aatcggcggg ctggctcatt tggtcaactt tcaaggcact 600
gatacgatcg ctgcgttact ggcaggacag cgctattacg attgcgcgat cgctggcttt 660
tcgattccgg cggcggagca ttcaacgatt acggcttggg gcccatcggg tgagttagat 720
gcttaccgca atatgctcga tcgctttgca aatccgggat ctgtggtggc tgttgtatcg 780
gactcctatg atctctggca tgccgtcgat cagctttggg gtgaggatct ccgcgatcgc 840
attttgcaat cgggagcaac cgttgtcatt cggcctgact caggcaatcc tgagcagatt 900
gtgccggaat tactgcgtcg tttggccgct aagttcggct gcgatcgcaa tcagaagggt 960
tatcaagttt tgcgatcggt gcgggtgatt cagggcgatg ggatcacagt ggacagtctg 1020
cccaaagttc tgcaagcggt tatggccgct ggctttagtg ccagtaatgt cgcttttggc 1080
atgggtggcg ggctgttgca gcaggtcaat cgcgataccc aacgctttgc ctacaagtgc 1140
agctggatcg agcgatcggg acaagtgatt cccatttgca agcgaccagc cacggatctg 1200
cgcaaggcta gcaaagcagg acgcttggat ttaattcgcg atcgcgaggg gcaataccga 1260
acagtctcgt tactgacgtc agagcctgac ccgcaatcct gcctgcaaac ggtgtttgaa 1320
aatggtgcga tcgtgcggcg acaaagcttg caggaaatcc gcgatcgcgc tcgttctgag 1380
acacgctag 1389
<210> 326
<211> 462
<212> PRT
<213> Synechococcus elongatus
<400> 326
Met Asp Leu Asn Leu Leu Phe Asp Thr Asp Ser Tyr Lys Val Ser His
1 5 10 15
Trp Leu Gln Tyr Pro Ala Asp Thr Thr Ala Ile Gly Ala Tyr Leu Glu
20 25 30
Ser Arg Gly Gly Asp Cys Ser His Thr Leu Phe Phe Gly Leu Gln Tyr
35 40 45
Leu Leu Leu Arg Tyr Phe Phe Gln Pro Ile Thr Ser Ala Asp Ile Gln
50 55 60
Glu Ala Ala Ala Leu Phe Gln Ala His Gly Leu Pro Phe Asn Gln Ala
65 70 75 80
Gly Trp Gln Arg Val Cys Asp Arg Tyr Gly Gly Tyr Leu Pro Leu Arg
85 90 95
Ile Arg Ala Val Pro Glu Gly Ser Leu Val Pro Thr Gly Asn Ile Leu
100 105 110
Leu Thr Val Glu Ser Thr Asp Pro Glu Leu Ala Trp Leu Ala Thr Trp
115 120 125
Val Glu Thr Leu Leu Leu Arg Val Trp Tyr Pro Ile Thr Val Ala Thr
130 135 140
Arg Ser Trp Gln Leu Arg Gln Ile Ile Gln Gln Ala Leu Glu Gln Ser
145 150 155 160
Ala Glu Asn Pro Ala Ala Glu Ile Asp Phe Lys Leu His Asp Phe Gly
165 170 175
Ser Arg Gly Val Ser Ser Gln Glu Ser Ala Ala Ile Gly Gly Leu Ala
180 185 190
His Leu Val Asn Phe Gln Gly Thr Asp Thr Ile Ala Ala Leu Leu Ala
195 200 205
Gly Gln Arg Tyr Tyr Asp Cys Ala Ile Ala Gly Phe Ser Ile Pro Ala
210 215 220
Ala Glu His Ser Thr Ile Thr Ala Trp Gly Pro Ser Gly Glu Leu Asp
225 230 235 240
Ala Tyr Arg Asn Met Leu Asp Arg Phe Ala Asn Pro Gly Ser Val Val
245 250 255
Ala Val Val Ser Asp Ser Tyr Asp Leu Trp His Ala Val Asp Gln Leu
260 265 270
Trp Gly Glu Asp Leu Arg Asp Arg Ile Leu Gln Ser Gly Ala Thr Val
275 280 285
Val Ile Arg Pro Asp Ser Gly Asn Pro Glu Gln Ile Val Pro Glu Leu
290 295 300
Leu Arg Arg Leu Ala Ala Lys Phe Gly Cys Asp Arg Asn Gln Lys Gly
305 310 315 320
Tyr Gln Val Leu Arg Ser Val Arg Val Ile Gln Gly Asp Gly Ile Thr
325 330 335
Val Asp Ser Leu Pro Lys Val Leu Gln Ala Val Met Ala Ala Gly Phe
340 345 350
Ser Ala Ser Asn Val Ala Phe Gly Met Gly Gly Gly Leu Leu Gln Gln
355 360 365
Val Asn Arg Asp Thr Gln Arg Phe Ala Tyr Lys Cys Ser Trp Ile Glu
370 375 380
Arg Ser Gly Gln Val Ile Pro Ile Cys Lys Arg Pro Ala Thr Asp Leu
385 390 395 400
Arg Lys Ala Ser Lys Ala Gly Arg Leu Asp Leu Ile Arg Asp Arg Glu
405 410 415
Gly Gln Tyr Arg Thr Val Ser Leu Leu Thr Ser Glu Pro Asp Pro Gln
420 425 430
Ser Cys Leu Gln Thr Val Phe Glu Asn Gly Ala Ile Val Arg Arg Gln
435 440 445
Ser Leu Gln Glu Ile Arg Asp Arg Ala Arg Ser Glu Thr Arg
450 455 460
<210> 327
<211> 4175
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette pGOS2::NMPRT::terminator
<400> 327
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctcctcctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt cttcgatcca tatcttccgg tcgagttctt ggtcgatctc ttccctcctc 1140
cacctcctcc tcacagggta tgtgcccttc ggttgttctt ggatttattg ttctaggttg 1200
tgtagtacgg gcgttgatgt taggaaaggg gatctgtatc tgtgatgatt cctgttcttg 1260
gatttgggat agaggggttc ttgatgttgc atgttatcgg ttcggtttga ttagtagtat 1320
ggttttcaat cgtctggaga gctctatgga aatgaaatgg tttagggtac ggaatcttgc 1380
gattttgtga gtaccttttg tttgaggtaa aatcagagca ccggtgattt tgcttggtgt 1440
aataaaagta cggttgtttg gtcctcgatt ctggtagtga tgcttctcga tttgacgaag 1500
ctatcctttg tttattccct attgaacaaa aataatccaa ctttgaagac ggtcccgttg 1560
atgagattga atgattgatt cttaagcctg tccaaaattt cgcagctggc ttgtttagat 1620
acagtagtcc ccatcacgaa attcatggaa acagttataa tcctcaggaa caggggattc 1680
cctgttcttc cgatttgctt tagtcccaga attttttttc ccaaatatct taaaaagtca 1740
ctttctggtt cagttcaatg aattgattgc tacaaataat gcttttatag cgttatccta 1800
gctgtagttc agttaatagg taatacccct atagtttagt caggagaaga acttatccga 1860
tttctgatct ccatttttaa ttatatgaaa tgaactgtag cataagcagt attcatttgg 1920
attatttttt ttattagctc tcaccccttc attattctga gctgaaagtc tggcatgaac 1980
tgtcctcaat tttgttttca aattcacatc gattatctat gcattatcct cttgtatcta 2040
cctgtagaag tttctttttg gttattcctt gactgcttga ttacagaaag aaatttatga 2100
agctgtaatc gggatagtta tactgcttgt tcttatgatt catttccttt gtgcagttct 2160
tggtgtagct tgccactttc accagcaaag ttcatttaaa tcaactaggg atatcacaag 2220
tttgtacaaa aaagcaggct taaacaatga atactaatct cattctggat gtggactcct 2280
ataaagtgag ccactggttg cagtatcctc ctgacacaac ggcaatgtat tcctatgtgg 2340
aaagtcgtgg gggaaggtat cctgtcactg tcttttttgg tctccaatac attttaaagc 2400
ggtatctgac tcaatccatt gaaccctgga tggtggagga agctaatcgc cttttgacag 2460
cccatggctt acctttcaac tatggcggtt ggcgatacat tgcggaggat ttgcagggtc 2520
gtttacctgt acgtattaag gcggttccag agggctcggt catcccggtt cataatgttt 2580
tgatgacagt ggaatccacg gacccaaagg ttttttggtt agtttcctgg ttagaaactt 2640
tgttgatgcg ggtttggtat cccattacgg tggcaaccca gagttggcat ttaaaacaac 2700
gcatctatca atccctatgc cgtactgcgg atgatcctga tggtgaaatc aattttaaac 2760
tccacgattt tggggcccgg ggggtttcta gtggtgaatc gtccggcatt ggcggactgg 2820
ctcacttagt taatttccaa ggttctgaca cagtaaaggc cctggtgtat gggcagcaat 2880
attacaactg ccccatggcg gcctattcga ttcccgccgc agaacattcc accattacag 2940
cttggggaag ggaaggggaa gttttggcct atgaaaatat gttgacccag tttgccaagc 3000
cagggtcggt gttggcggtg gtttccgatt cctatgatct ctggaatgcc attgaccatc 3060
tctggggcga tcacctaagg gcacaggtgc ttgattcggg ggctacggtg gttatccgtc 3120
cggattcagg tgacccggtg gccattgtgg cccaaacttt ggaacggttg gaggcttgtt 3180
ttggcagcac cctcaacagt aagggctttc gagttctaaa tgctgtgcgg gttatccaag 3240
gggatggggt tgatgaagag agtatcagcg ccattctaga gaagactgag agccttggct 3300
ttagtactac taatttagct tttggtatgg ggggagcttt gttgcaaaag gtgaatcggg 3360
atacccaaaa atttgccatg aagtgcagtg aggtaacggt ggaggacaag gcgatccctg 3420
tttataaaga ccctgttact gatcctggta aaactagcaa aaaggggcga ttatccctgg 3480
ttaaaactga ctctggttat ggcactgtac ccacttcttc tgaggattta ttgcaggttg 3540
tctatgaaaa tggacattta ctgcaagacc aatgcttgga tgctattcgt caacgagcct 3600
ggccattaat cagggtcaat gttcccgcaa gctagaccca gctttcttgt acaaagtggt 3660
gatatcacaa gcccgggcgg tcttctaggg ataacagggt aattatatcc ctctagatca 3720
caagcccggg cggtcttcta cgatgattga gtaataatgt gtcacgcatc accatgggtg 3780
gcagtgtcag tgtgagcaat gacctgaatg aacaattgaa atgaaaagaa aaaaagtact 3840
ccatctgttc caaattaaaa ttcattttaa ccttttaata ggtttataca ataattgata 3900
tatgttttct gtatatgtct aatttgttat catccgggcg gtcttctagg gataacaggg 3960
taattatatc cctctagaca acacacaaca aataagagaa aaaacaaata atattaattt 4020
gagaatgaac aaaaggacca tatcattcat taactcttct ccatccattt ccatttcaca 4080
gttcgatagc gaaaaccgaa taaaaaacac agtaaattac aagcacaaca aatggtacaa 4140
gaaaaacagt tttcccaatg ccataatact cgaac 4175
<210> 328
<211> 891
<212> DNA
<213> Oryza sativa
<400> 328
atgagcaatg cttttttata atgccaactt tgtacaaaaa agcaggctat ggcagctgct 60
atagaaggaa atctgatgcg ggcgctggga gaggctccgt cgccgcagat gcagaagatc 120
gcgccgccgc cgtttcatcc cggcttgccg ccggcgccgg cgaacttctc ctcggccgga 180
gtccacgggt tccactacat gggcccggcc cagctcagcc cggcccagat ccagcgcgtc 240
caggcccaac tccacatgca gcggcaggcc cagtcggggc tcggcccgcg ggcccagccc 300
atgaagcccg cttcggcggc tgctccggcg gcggcggcgg cgcgggcgca gaagctgtac 360
cgcggcgtgc ggcagcggca ctggggcaag tgggtggcgg agatccggct gccgcgcaac 420
cgcaccaggc tctggctcgg caccttcgac accgccgagg aggcggcgct cacctacgac 480
caggccgcgt accgcctccg cggcgacgcg gcgcggctca acttcccgga caacgccgcg 540
tcgcggggcc cgctcgacgc cgccgtggac gccaagctcc aggccatctg cgacaccatc 600
gccgcgtcca agaacgcctc atccaggtcc aggggcggcg ccggcagggc catgcccatc 660
aacgcgcccc tggtcgccgc ggcgtcgtcg tcctccggct ccgaccactc cggcggcggc 720
gacgacggcg gctcggagac gtcgtcgtcg tctgcggcgg cgtcgccgct ggcggagatg 780
gagcagctgg acttcagcga ggtgccgtgg gacgaggcgg aggggttcgc gctcaccaag 840
tacccgtcgt acgagatcga ctgggactcg ctgctcaaca acaataacta g 891
<210> 329
<211> 280
<212> PRT
<213> Oryza sativa
<400> 329
Met Ala Ala Ala Ile Glu Gly Asn Leu Met Arg Ala Leu Gly Glu Ala
1 5 10 15
Pro Ser Pro Gln Met Gln Lys Ile Ala Pro Pro Pro Phe His Pro Gly
20 25 30
Leu Pro Pro Ala Pro Ala Asn Phe Ser Ser Ala Gly Val His Gly Phe
35 40 45
His Tyr Met Gly Pro Ala Gln Leu Ser Pro Ala Gln Ile Gln Arg Val
50 55 60
Gln Ala Gln Leu His Met Gln Arg Gln Ala Gln Ser Gly Leu Gly Pro
65 70 75 80
Arg Ala Gln Pro Met Lys Pro Ala Ser Ala Ala Ala Pro Ala Ala Ala
85 90 95
Ala Ala Arg Ala Gln Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp
100 105 110
Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu
115 120 125
Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala Ala Leu Thr Tyr Asp
130 135 140
Gln Ala Ala Tyr Arg Leu Arg Gly Asp Ala Ala Arg Leu Asn Phe Pro
145 150 155 160
Asp Asn Ala Ala Ser Arg Gly Pro Leu Asp Ala Ala Val Asp Ala Lys
165 170 175
Leu Gln Ala Ile Cys Asp Thr Ile Ala Ala Ser Lys Asn Ala Ser Ser
180 185 190
Arg Ser Arg Gly Gly Ala Gly Arg Ala Met Pro Ile Asn Ala Pro Leu
195 200 205
Val Ala Ala Ala Ser Ser Ser Ser Gly Ser Asp His Ser Gly Gly Gly
210 215 220
Asp Asp Gly Gly Ser Glu Thr Ser Ser Ser Ser Ala Ala Ala Ser Pro
225 230 235 240
Leu Ala Glu Met Glu Gln Leu Asp Phe Ser Glu Val Pro Trp Asp Glu
245 250 255
Ala Glu Gly Phe Ala Leu Thr Lys Tyr Pro Ser Tyr Glu Ile Asp Trp
260 265 270
Asp Ser Leu Leu Asn Asn Asn Asn
275 280
<210> 330
<211> 1005
<212> DNA
<213> Arabidopsis thaliana
<400> 330
atggcagctg ctatgaattt gtacacttgt agcagatcgt ttcaagactc tggtggtgaa 60
ctcatggacg cgcttgtacc ttttatcaaa agcgtttccg attctccttc ttcttcttct 120
gcagcgtctg cgtctgcgtt tcttcacccc tctgcgtttt ctctccctcc tctccccggt 180
tattacccgg attcaacgtt cttgacccaa ccgttttcat acgggtcgga tcttcaacaa 240
accgggtcat taatcggact caacaacctc tcttcttctc agatccacca gatccagtct 300
cagatccatc atcctcttcc tccgacgcat cacaacaaca acaactcttt ctcgaatctt 360
ctcagcccaa agccgttact gatgaagcaa tctggagtcg ctggatcttg tttcgcttac 420
ggttcaggtg ttccttcgaa gccgacgaag ctttacagag gtgtgaggca acgtcactgg 480
ggaaaatggg tggctgagat ccgtttgccg agaaatcgga ctcgtctctg gcttgggact 540
tttgacacgg cggaggaagc tgcgttggcc tatgataagg cggcgtacaa gctgcgcggc 600
gatttcgccc ggcttaactt ccctaaccta cgtcataacg gatctcacat cggaggcgat 660
ttcggtgaat ataaacctct tcactcctca gtcgacgcta agcttgaagc tatttgtaaa 720
agcatggcgg agactcagaa acaggacaaa tcgacgaaat catcgaagaa acgtgagaag 780
aaggtttcgt cgccagatct atcggagaaa gtgaaggcgg aggagaattc ggtttcgatc 840
ggtggatctc caccggtgac ggagtttgaa gagtccaccg ctggatcttc gccgttgtcg 900
gacttgacgt tcgctgaccc ggaggagccg ccgcagtgga acgagacgtt ctcgttggag 960
aagtatccgt cgtacgagat cgattgggat tcgattctag cttag 1005
<210> 331
<211> 334
<212> PRT
<213> Arabidopsis thaliana
<400> 331
Met Ala Ala Ala Met Asn Leu Tyr Thr Cys Ser Arg Ser Phe Gln Asp
1 5 10 15
Ser Gly Gly Glu Leu Met Asp Ala Leu Val Pro Phe Ile Lys Ser Val
20 25 30
Ser Asp Ser Pro Ser Ser Ser Ser Ala Ala Ser Ala Ser Ala Phe Leu
35 40 45
His Pro Ser Ala Phe Ser Leu Pro Pro Leu Pro Gly Tyr Tyr Pro Asp
50 55 60
Ser Thr Phe Leu Thr Gln Pro Phe Ser Tyr Gly Ser Asp Leu Gln Gln
65 70 75 80
Thr Gly Ser Leu Ile Gly Leu Asn Asn Leu Ser Ser Ser Gln Ile His
85 90 95
Gln Ile Gln Ser Gln Ile His His Pro Leu Pro Pro Thr His His Asn
100 105 110
Asn Asn Asn Ser Phe Ser Asn Leu Leu Ser Pro Lys Pro Leu Leu Met
115 120 125
Lys Gln Ser Gly Val Ala Gly Ser Cys Phe Ala Tyr Gly Ser Gly Val
130 135 140
Pro Ser Lys Pro Thr Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp
145 150 155 160
Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu
165 170 175
Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp
180 185 190
Lys Ala Ala Tyr Lys Leu Arg Gly Asp Phe Ala Arg Leu Asn Phe Pro
195 200 205
Asn Leu Arg His Asn Gly Ser His Ile Gly Gly Asp Phe Gly Glu Tyr
210 215 220
Lys Pro Leu His Ser Ser Val Asp Ala Lys Leu Glu Ala Ile Cys Lys
225 230 235 240
Ser Met Ala Glu Thr Gln Lys Gln Asp Lys Ser Thr Lys Ser Ser Lys
245 250 255
Lys Arg Glu Lys Lys Val Ser Ser Pro Asp Leu Ser Glu Lys Val Lys
260 265 270
Ala Glu Glu Asn Ser Val Ser Ile Gly Gly Ser Pro Pro Val Thr Glu
275 280 285
Phe Glu Glu Ser Thr Ala Gly Ser Ser Pro Leu Ser Asp Leu Thr Phe
290 295 300
Ala Asp Pro Glu Glu Pro Pro Gln Trp Asn Glu Thr Phe Ser Leu Glu
305 310 315 320
Lys Tyr Pro Ser Tyr Glu Ile Asp Trp Asp Ser Ile Leu Ala
325 330
<210> 332
<211> 987
<212> DNA
<213> Brassica napus
<400> 332
atggaagctg ctatgaatat gtacaatagc ataacgtttc aacagccaga ttcgtttggt 60
ggtggtgaac tcatggaagc gcttgtacct tatataaata gcgtttccaa ttcttctcct 120
tatcccgcgt ctgcgtttat tcaacccgca gcgtctgcgt ttcctccttc tctacctacc 180
ttccccgctt actacccgga agactattca acgttcatga cccaaccgtt tacttacggg 240
tcggatcttc accaaaccgg gtcattaacc gggctcaacc acctcttttc cagccaagct 300
catcctcttc ctcccatgca ccatcagagc cacaacaaca ccttctcgaa ccttctcagc 360
cctaagccgt tactgatgaa gcagaccggt gccaccggat cttgtttcgc ctacggtgct 420
ccggccaagc cgacgaagct gtacagaggc gtgaggcagc gtcactgggg gaaatgggtg 480
gcggagatcc gtttgccgag gaaccgtacc cgtctctggc ttgggacgtt cgacacggcg 540
gaggaagctg cgttggccta cgacaaggcg gcgtataagc tgcgcggcga tttcgcccgg 600
cttaacttcc ctaacctgcg tcacaacggg tcccacatcg gaggcgagtt cggcgagtac 660
aaaccgcttc actccaccgt cgacgccaag ctcgaagcta tatgtcagag catggcggag 720
gcggagaaac agggcaaaac tacgacgaaa gcatcgaaga aacgtgcctc gaagacggtt 780
tcatcgccgg agaaagtcaa ggcggaggat aactcgaact cggtcgatga atctacgccg 840
gtgacggagt tcgttgagtc cgccggttct tcgccgttgt cggacttaac gttcgccgac 900
actgaggagc cgccgcagtg gaacgagacg ttctcgttgg agaagtatcc gtcgtacgag 960
atagattggg attcgatcct gtcttga 987
<210> 333
<211> 328
<212> PRT
<213> Brassica napus
<400> 333
Met Glu Ala Ala Met Asn Met Tyr Asn Ser Ile Thr Phe Gln Gln Pro
1 5 10 15
Asp Ser Phe Gly Gly Gly Glu Leu Met Glu Ala Leu Val Pro Tyr Ile
20 25 30
Asn Ser Val Ser Asn Ser Ser Pro Tyr Pro Ala Ser Ala Phe Ile Gln
35 40 45
Pro Ala Ala Ser Ala Phe Pro Pro Ser Leu Pro Thr Phe Pro Ala Tyr
50 55 60
Tyr Pro Glu Asp Tyr Ser Thr Phe Met Thr Gln Pro Phe Thr Tyr Gly
65 70 75 80
Ser Asp Leu His Gln Thr Gly Ser Leu Thr Gly Leu Asn His Leu Phe
85 90 95
Ser Ser Gln Ala His Pro Leu Pro Pro Met His His Gln Ser His Asn
100 105 110
Asn Thr Phe Ser Asn Leu Leu Ser Pro Lys Pro Leu Leu Met Lys Gln
115 120 125
Thr Gly Ala Thr Gly Ser Cys Phe Ala Tyr Gly Ala Pro Ala Lys Pro
130 135 140
Thr Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
145 150 155 160
Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr
165 170 175
Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Lys Ala Ala Tyr
180 185 190
Lys Leu Arg Gly Asp Phe Ala Arg Leu Asn Phe Pro Asn Leu Arg His
195 200 205
Asn Gly Ser His Ile Gly Gly Glu Phe Gly Glu Tyr Lys Pro Leu His
210 215 220
Ser Thr Val Asp Ala Lys Leu Glu Ala Ile Cys Gln Ser Met Ala Glu
225 230 235 240
Ala Glu Lys Gln Gly Lys Thr Thr Thr Lys Ala Ser Lys Lys Arg Ala
245 250 255
Ser Lys Thr Val Ser Ser Pro Glu Lys Val Lys Ala Glu Asp Asn Ser
260 265 270
Asn Ser Val Asp Glu Ser Thr Pro Val Thr Glu Phe Val Glu Ser Ala
275 280 285
Gly Ser Ser Pro Leu Ser Asp Leu Thr Phe Ala Asp Thr Glu Glu Pro
290 295 300
Pro Gln Trp Asn Glu Thr Phe Ser Leu Glu Lys Tyr Pro Ser Tyr Glu
305 310 315 320
Ile Asp Trp Asp Ser Ile Leu Ser
325
<210> 334
<211> 933
<212> DNA
<213> Brassica napus
<400> 334
atggaagctg ctatgaatat gtacagtagc agaacggttc accaatcaga ttcgtttggt 60
ggtggtgaac tcatggaagc gcttgtacct tttatcaaaa gcgtttccac ctcttcttct 120
tctcctcccg cgaccgcgtc tgcgtttatt aactccgcag cgtctgcgtt ctctcttcct 180
actttccccg gatatcacac ggaacacttc atgacccaac cgtttacata cgggtcggat 240
cttaaccaaa ccgggtcatc attaatcggg ctaaacaacc tctcttcttc ccaaatccac 300
cagatccaat ctcagatcca ccacaaccat cctctcctca ggccaaagcc tttactcatg 360
aagcaaaccg gagtcgccgg atcttgtttc ctggcgaagc cgacgaagct gtacagaggc 420
gtgaggcagc gtcactgggg caaatgggtg gcggagatcc gtttgccgag gaaccgtact 480
cgtctctggc taggaacgtt cgacacggcg gaggaagcag ccttggctta cgacaaggcg 540
gcgtttaagc tgcgcggcga tcacgcccgg cttaacttcc ctaacttacg tcacaacggt 600
tcccacatcg gcggcgagtt cggcgagtac aagcctcttc actcaacggt cgacgctaag 660
ctcgaagcta tttgtcagag catggcggag acgcagaaac aggacaaaac agcgaaagct 720
tcgaagaaac gtgcctcgaa ggtgaagaaa actgagaagg ttgatttgtc ggagaaagtc 780
agtccggtga cggagttcgt tgagtccgcc gggtcttcgc cgttgtcgga gctgacgttc 840
gctgacaccg aggagcagcc gcggtggaac gagaccttct cgttggagaa gtatccgtct 900
tacgagatcg actgggattc gatactgtcg tga 933
<210> 335
<211> 310
<212> PRT
<213> Brassica napus
<400> 335
Met Glu Ala Ala Met Asn Met Tyr Ser Ser Arg Thr Val His Gln Ser
1 5 10 15
Asp Ser Phe Gly Gly Gly Glu Leu Met Glu Ala Leu Val Pro Phe Ile
20 25 30
Lys Ser Val Ser Thr Ser Ser Ser Ser Pro Pro Ala Thr Ala Ser Ala
35 40 45
Phe Ile Asn Ser Ala Ala Ser Ala Phe Ser Leu Pro Thr Phe Pro Gly
50 55 60
Tyr His Thr Glu His Phe Met Thr Gln Pro Phe Thr Tyr Gly Ser Asp
65 70 75 80
Leu Asn Gln Thr Gly Ser Ser Leu Ile Gly Leu Asn Asn Leu Ser Ser
85 90 95
Ser Gln Ile His Gln Ile Gln Ser Gln Ile His His Asn His Pro Leu
100 105 110
Leu Arg Pro Lys Pro Leu Leu Met Lys Gln Thr Gly Val Ala Gly Ser
115 120 125
Cys Phe Leu Ala Lys Pro Thr Lys Leu Tyr Arg Gly Val Arg Gln Arg
130 135 140
His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr
145 150 155 160
Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala
165 170 175
Tyr Asp Lys Ala Ala Phe Lys Leu Arg Gly Asp His Ala Arg Leu Asn
180 185 190
Phe Pro Asn Leu Arg His Asn Gly Ser His Ile Gly Gly Glu Phe Gly
195 200 205
Glu Tyr Lys Pro Leu His Ser Thr Val Asp Ala Lys Leu Glu Ala Ile
210 215 220
Cys Gln Ser Met Ala Glu Thr Gln Lys Gln Asp Lys Thr Ala Lys Ala
225 230 235 240
Ser Lys Lys Arg Ala Ser Lys Val Lys Lys Thr Glu Lys Val Asp Leu
245 250 255
Ser Glu Lys Val Ser Pro Val Thr Glu Phe Val Glu Ser Ala Gly Ser
260 265 270
Ser Pro Leu Ser Glu Leu Thr Phe Ala Asp Thr Glu Glu Gln Pro Arg
275 280 285
Trp Asn Glu Thr Phe Ser Leu Glu Lys Tyr Pro Ser Tyr Glu Ile Asp
290 295 300
Trp Asp Ser Ile Leu Ser
305 310
<210> 336
<211> 807
<212> DNA
<213> Brassica napus
<400> 336
atggaagctg ctatgaatat gtacaatagc ataacgtttc aacagccaga ttcgtttggt 60
ggtggtgaac tcatggaagc gctagtacct tatataagta gcgtttccaa ttcttctcct 120
catcctcttc ctcccatgca ccatcagagc cacaacaaca ccttctcgaa ccttctcagc 180
cctaagccgt tactgatgaa gcagaccggt gccaccggat cttgtttcgc ctatggtgct 240
ccggccaagc cgacgaagct gtacagaggc gtgaggcagc gtcactgggg gaaatgggtg 300
gcggagatcc gtttgccgag gaaccgtacc cgtctctggc ttgggacgtt cgacacggcg 360
gaggaagctg cgttggccta cgacaaggcg gcgtataagc tgcgcggcga tttcgcccgg 420
cttaacttcc ctaacctgcg tcacaatggg tcccacatcg gaggcgagtt cggcgagtac 480
aaaccgcttc actccaccgt cgacgccaag ctcgaagcta tttgtcagag catggcggag 540
gcggagaaac agggcaaaac tacgacgaaa gcatcgaaga aacgtgcctc gaagacggtt 600
tcatcgccgg agaaagttaa ggcggaggat aactcgaact cggtcggtgg atctccgccg 660
gtgacggagt tcgttgagtc cgccggttct tcgccgttgt cggacttaac gttcgccgac 720
acggaggagc tgccgcagtg gaacgagacg ttctcgttgg agaagtatcc gtcgtacgag 780
atagattggg attcgatcct gtcttga 807
<210> 337
<211> 268
<212> PRT
<213> Brassica napus
<400> 337
Met Glu Ala Ala Met Asn Met Tyr Asn Ser Ile Thr Phe Gln Gln Pro
1 5 10 15
Asp Ser Phe Gly Gly Gly Glu Leu Met Glu Ala Leu Val Pro Tyr Ile
20 25 30
Ser Ser Val Ser Asn Ser Ser Pro His Pro Leu Pro Pro Met His His
35 40 45
Gln Ser His Asn Asn Thr Phe Ser Asn Leu Leu Ser Pro Lys Pro Leu
50 55 60
Leu Met Lys Gln Thr Gly Ala Thr Gly Ser Cys Phe Ala Tyr Gly Ala
65 70 75 80
Pro Ala Lys Pro Thr Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp
85 90 95
Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu
100 105 110
Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp
115 120 125
Lys Ala Ala Tyr Lys Leu Arg Gly Asp Phe Ala Arg Leu Asn Phe Pro
130 135 140
Asn Leu Arg His Asn Gly Ser His Ile Gly Gly Glu Phe Gly Glu Tyr
145 150 155 160
Lys Pro Leu His Ser Thr Val Asp Ala Lys Leu Glu Ala Ile Cys Gln
165 170 175
Ser Met Ala Glu Ala Glu Lys Gln Gly Lys Thr Thr Thr Lys Ala Ser
180 185 190
Lys Lys Arg Ala Ser Lys Thr Val Ser Ser Pro Glu Lys Val Lys Ala
195 200 205
Glu Asp Asn Ser Asn Ser Val Gly Gly Ser Pro Pro Val Thr Glu Phe
210 215 220
Val Glu Ser Ala Gly Ser Ser Pro Leu Ser Asp Leu Thr Phe Ala Asp
225 230 235 240
Thr Glu Glu Leu Pro Gln Trp Asn Glu Thr Phe Ser Leu Glu Lys Tyr
245 250 255
Pro Ser Tyr Glu Ile Asp Trp Asp Ser Ile Leu Ser
260 265
<210> 338
<211> 927
<212> DNA
<213> Glycine max
<400> 338
atgaatttct acaacggaac atcacaagaa caagttgagt cagatccatt cagaggtgag 60
ctcatggaag ttctagaacc ttttatgaaa actagtcctt cctcaacaac tccctctatt 120
attctctctt cagattcacc ttcatcttca tcttttaatt tcccttcctc ttctttactt 180
tctccacacc ccaatttcta cacacacact cccccccctt cctacttact ccaaagccaa 240
caatccttaa taggctttga gcaaccaccg agttcccttc tcgggctcaa ccacctaagc 300
ccgtctcaga tttctcagat ccaggcccag atcgaggccc aacagagcca aaaccagaac 360
ccacactctc tcaactttct cggcccgaag cccgtcccaa tgaagcacgt gggcgggcct 420
ccgaagccca cgaagctgta ccggggcgta aggcagaggc attgggggaa gtgggtggcg 480
gagatcaggc tcccgaagaa ccgaaccagg ctctggctcg gaaccttcga cacggcggag 540
gaagctgctt tggcttacga caaagccgcg tataggctcc gaggcgactt cgcgaggctg 600
aacttcccga gcctgaaagg ctcgtgcccc ggggaggagt acaagcctgt gcattccgcg 660
gtggacgcta agctcgacgc gatttgcgcc aacttggcgg aaatgcagaa gcaagggaag 720
acggagaaag gtgccaggtc agcgaagaaa tcgaagcaag gtccgaacca ggaggccaag 780
cccgaacctc aagcttccgc tgaaagtgag ggttctgcgg attcttctcc gctgtctgat 840
cttacctttg atgtaaccga gccgcaatgg gaacatttta atttgcagaa gtttccttct 900
tatgagatcg attgggattc tctctga 927
<210> 339
<211> 308
<212> PRT
<213> Glycine max
<400> 339
Met Asn Phe Tyr Asn Gly Thr Ser Gln Glu Gln Val Glu Ser Asp Pro
1 5 10 15
Phe Arg Gly Glu Leu Met Glu Val Leu Glu Pro Phe Met Lys Thr Ser
20 25 30
Pro Ser Ser Thr Thr Pro Ser Ile Ile Leu Ser Ser Asp Ser Pro Ser
35 40 45
Ser Ser Ser Phe Asn Phe Pro Ser Ser Ser Leu Leu Ser Pro His Pro
50 55 60
Asn Phe Tyr Thr His Thr Pro Pro Pro Ser Tyr Leu Leu Gln Ser Gln
65 70 75 80
Gln Ser Leu Ile Gly Phe Glu Gln Pro Pro Ser Ser Leu Leu Gly Leu
85 90 95
Asn His Leu Ser Pro Ser Gln Ile Ser Gln Ile Gln Ala Gln Ile Glu
100 105 110
Ala Gln Gln Ser Gln Asn Gln Asn Pro His Ser Leu Asn Phe Leu Gly
115 120 125
Pro Lys Pro Val Pro Met Lys His Val Gly Gly Pro Pro Lys Pro Thr
130 135 140
Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala
145 150 155 160
Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe
165 170 175
Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Lys Ala Ala Tyr Arg
180 185 190
Leu Arg Gly Asp Phe Ala Arg Leu Asn Phe Pro Ser Leu Lys Gly Ser
195 200 205
Cys Pro Gly Glu Glu Tyr Lys Pro Val His Ser Ala Val Asp Ala Lys
210 215 220
Leu Asp Ala Ile Cys Ala Asn Leu Ala Glu Met Gln Lys Gln Gly Lys
225 230 235 240
Thr Glu Lys Gly Ala Arg Ser Ala Lys Lys Ser Lys Gln Gly Pro Asn
245 250 255
Gln Glu Ala Lys Pro Glu Pro Gln Ala Ser Ala Glu Ser Glu Gly Ser
260 265 270
Ala Asp Ser Ser Pro Leu Ser Asp Leu Thr Phe Asp Val Thr Glu Pro
275 280 285
Gln Trp Glu His Phe Asn Leu Gln Lys Phe Pro Ser Tyr Glu Ile Asp
290 295 300
Trp Asp Ser Leu
305
<210> 340
<211> 852
<212> DNA
<213> Hordeum vulgare
<400> 340
atggctgcag ctatagatct gtccggggag gatctggtga gagcactcga gccttttatc 60
cgagaggcct ctgccccccc tccgctccac tcccatccta gtcccacctc gccattctcc 120
ttcccccacg ccgcctacag tggttacccg tacggggtgc aggcacaggc ccagaccgag 180
ctcagcccgg cccagatgca ctacatccag gcacgcctcc acctccagcg ccagaccggc 240
cagccgggcc acctcggccc gcggccccag cccatgaagc ccgcttcggc ggcagcggcc 300
acaccgccgc ggccgcagaa gctctaccgc ggcgttcggc agcgccactg gggcaagtgg 360
gtggcggaga tccgcctccc ccgcaaccgc acccgcctct ggctcggcac cttcgacacc 420
gccgaggagg cggctctcgc ctacgaccag gccgcctacc gcctccgtgg cgacgcagcg 480
cgcctcaact tccccgacaa cgccgcctcc cgcggcccgc tccatgcctc tgttgacgcc 540
aagctccaga ccctctgcca gaacatcacc gcttccaaga acgccaagaa gtccgcctcc 600
gtctccgcgt ccaccgccgc agccacgtcg tccaccccca ccagcaactg ctcctcgccg 660
tcctccgacg aggcgtcgtc ctcgctcgag tccgccgagt cgtcaccatc acccaccacc 720
accgcagcag aggttcctga gatgcagcag ctcgacttca gcgaggcacc atgggacgag 780
gcagccggct tcgccctcac caagtacccg tcctatgaga tcgactggga ctcgctcctc 840
gccaccaatt ag 852
<210> 341
<211> 283
<212> PRT
<213> Hordeum vulgare
<400> 341
Met Ala Ala Ala Ile Asp Leu Ser Gly Glu Asp Leu Val Arg Ala Leu
1 5 10 15
Glu Pro Phe Ile Arg Glu Ala Ser Ala Pro Pro Pro Leu His Ser His
20 25 30
Pro Ser Pro Thr Ser Pro Phe Ser Phe Pro His Ala Ala Tyr Ser Gly
35 40 45
Tyr Pro Tyr Gly Val Gln Ala Gln Ala Gln Thr Glu Leu Ser Pro Ala
50 55 60
Gln Met His Tyr Ile Gln Ala Arg Leu His Leu Gln Arg Gln Thr Gly
65 70 75 80
Gln Pro Gly His Leu Gly Pro Arg Pro Gln Pro Met Lys Pro Ala Ser
85 90 95
Ala Ala Ala Ala Thr Pro Pro Arg Pro Gln Lys Leu Tyr Arg Gly Val
100 105 110
Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg
115 120 125
Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala
130 135 140
Ala Leu Ala Tyr Asp Gln Ala Ala Tyr Arg Leu Arg Gly Asp Ala Ala
145 150 155 160
Arg Leu Asn Phe Pro Asp Asn Ala Ala Ser Arg Gly Pro Leu His Ala
165 170 175
Ser Val Asp Ala Lys Leu Gln Thr Leu Cys Gln Asn Ile Thr Ala Ser
180 185 190
Lys Asn Ala Lys Lys Ser Ala Ser Val Ser Ala Ser Thr Ala Ala Ala
195 200 205
Thr Ser Ser Thr Pro Thr Ser Asn Cys Ser Ser Pro Ser Ser Asp Glu
210 215 220
Ala Ser Ser Ser Leu Glu Ser Ala Glu Ser Ser Pro Ser Pro Thr Thr
225 230 235 240
Thr Ala Ala Glu Val Pro Glu Met Gln Gln Leu Asp Phe Ser Glu Ala
245 250 255
Pro Trp Asp Glu Ala Ala Gly Phe Ala Leu Thr Lys Tyr Pro Ser Tyr
260 265 270
Glu Ile Asp Trp Asp Ser Leu Leu Ala Thr Asn
275 280
<210> 342
<211> 1017
<212> DNA
<213> Oryza sativa
<400> 342
atggccgcag caatagacat gtacaagtat aacactagca cacaccagat cgcatcctcg 60
gatcaggagc tcatgaaagc gctcgaacct tttattagga gcgcttcttc ttcctccgct 120
tcctccccct gccaccacta ctactcttct tctccttcca tgagccaaga ttcttacatg 180
cccaccccat cttatcccac ttcctctatc acaaccgccg ccgccaccac cacctcgtct 240
ttctcgcagc tacctccgct gtactcttcg cagtatcatg ctgcttcacc tgcggcgtcg 300
gcgacgaacg ggccgatggg gctgacccac ctgggcccag cccagatcca gcagatccag 360
gcccagttct tggcccagca gcagcagcag agggccctgg ccggcgcctt ccttcggccg 420
cgtggccagc cgatgaagca gtccgggtcg ccgccgcgcg cggggccgtt cgcggcggtc 480
gccggggcgg cgcagtcgaa gctctaccgc ggagtgcggc agcgccactg ggggaagtgg 540
gtggcggaga tccgcctccc gaagaaccgg acgcggctgt ggctcggcac cttcgacacc 600
gccgaggacg ccgcgctcgc ctacgacaag gccgccttcc gcctccgcgg cgacctcgcg 660
cggctcaact tccccaccct ccgccgcggc ggcgcccacc tcgccggccc gctccacgcc 720
tccgtcgacg ccaagctcac cgccatctgc cagtccctcg ccacgagctc gtccaagaac 780
acccccgccg agtcagcggc ctccgcggcg gagccggagt cccccaagtg ctcggcgtcg 840
acggaagggg aggactcggt gtccgccggc tcccctcctc cgcccacgcc gctgtcgccc 900
ccggtgccgg agatggagaa gctggacttc acggaggcgc catgggacga gtcggagaca 960
ttccacctgc gcaagtaccc gtcctgggag atcgactggg actcaatcct ctcataa 1017
<210> 343
<211> 338
<212> PRT
<213> Oryza sativa
<400> 343
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Asn Thr Ser Thr His Gln
1 5 10 15
Ile Ala Ser Ser Asp Gln Glu Leu Met Lys Ala Leu Glu Pro Phe Ile
20 25 30
Arg Ser Ala Ser Ser Ser Ser Ala Ser Ser Pro Cys His His Tyr Tyr
35 40 45
Ser Ser Ser Pro Ser Met Ser Gln Asp Ser Tyr Met Pro Thr Pro Ser
50 55 60
Tyr Pro Thr Ser Ser Ile Thr Thr Ala Ala Ala Thr Thr Thr Ser Ser
65 70 75 80
Phe Ser Gln Leu Pro Pro Leu Tyr Ser Ser Gln Tyr His Ala Ala Ser
85 90 95
Pro Ala Ala Ser Ala Thr Asn Gly Pro Met Gly Leu Thr His Leu Gly
100 105 110
Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln Phe Leu Ala Gln Gln Gln
115 120 125
Gln Gln Arg Ala Leu Ala Gly Ala Phe Leu Arg Pro Arg Gly Gln Pro
130 135 140
Met Lys Gln Ser Gly Ser Pro Pro Arg Ala Gly Pro Phe Ala Ala Val
145 150 155 160
Ala Gly Ala Ala Gln Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His
165 170 175
Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg
180 185 190
Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Asp Ala Ala Leu Ala Tyr
195 200 205
Asp Lys Ala Ala Phe Arg Leu Arg Gly Asp Leu Ala Arg Leu Asn Phe
210 215 220
Pro Thr Leu Arg Arg Gly Gly Ala His Leu Ala Gly Pro Leu His Ala
225 230 235 240
Ser Val Asp Ala Lys Leu Thr Ala Ile Cys Gln Ser Leu Ala Thr Ser
245 250 255
Ser Ser Lys Asn Thr Pro Ala Glu Ser Ala Ala Ser Ala Ala Glu Pro
260 265 270
Glu Ser Pro Lys Cys Ser Ala Ser Thr Glu Gly Glu Asp Ser Val Ser
275 280 285
Ala Gly Ser Pro Pro Pro Pro Thr Pro Leu Ser Pro Pro Val Pro Glu
290 295 300
Met Glu Lys Leu Asp Phe Thr Glu Ala Pro Trp Asp Glu Ser Glu Thr
305 310 315 320
Phe His Leu Arg Lys Tyr Pro Ser Trp Glu Ile Asp Trp Asp Ser Ile
325 330 335
Leu Ser
<210> 344
<211> 876
<212> DNA
<213> Oryza sativa
<400> 344
atggctgcag ctatagatct gtcaggggag gagctgatga gagcactcga gccttttatc 60
cgagatgcct ccggctcgcc tccggtttgt tcccagttta gtcccacctc gccattctcc 120
ttcccgcacg cgttcgcgta cggtggcggg ctggcccagc agccagagct cagcccggcc 180
cagatgcact acatccaggc ccgcctccac ctccagcggc aggcggcgca ggccggcccg 240
ctcggcccgc gcgcgcagcc gatgaaggcg tcgtcgtcgt cggcttcggc ggcgggggcg 300
gcggcgacgc cgccgcggcc gcagaagctg taccgcggcg tgcggcagcg gcactggggg 360
aagtgggtgg cggagatccg cctcccgcgg aaccgcacgc ggctctggct cggcaccttc 420
gacacagccg aggaggcggc gcttgcctac gaccaggcgg cgtaccgcct ccgcggcgac 480
gcggcgcggc tcaacttccc cgacaacgcc gcctcccgcg gcccgctcca cgcctccgtc 540
gacgccaagc tccagacgct ctgccagaac atcgccgccg ccaagaacgc caagaagtcc 600
tctgtctccg cctccgccgc cgcaacatcc tccgcgccca ccagcaactg ctcgtcgccg 660
tcctccgacg acgcgtcgtc ctgcctggag tccgccgact cgtcgccctc cctgtcgccg 720
tcctccgccg ccaccacggc cgagacgccg gcgaccgtgc cggagatgca gcagctcgac 780
ttcagcgagg cgccgtggga cgaggccgcc gccttcgccc tcaccaagta cccgtcctac 840
gagatcgact gggactccct cctcgccgcc aattaa 876
<210> 345
<211> 291
<212> PRT
<213> Oryza sativa
<400> 345
Met Ala Ala Ala Ile Asp Leu Ser Gly Glu Glu Leu Met Arg Ala Leu
1 5 10 15
Glu Pro Phe Ile Arg Asp Ala Ser Gly Ser Pro Pro Val Cys Ser Gln
20 25 30
Phe Ser Pro Thr Ser Pro Phe Ser Phe Pro His Ala Phe Ala Tyr Gly
35 40 45
Gly Gly Leu Ala Gln Gln Pro Glu Leu Ser Pro Ala Gln Met His Tyr
50 55 60
Ile Gln Ala Arg Leu His Leu Gln Arg Gln Ala Ala Gln Ala Gly Pro
65 70 75 80
Leu Gly Pro Arg Ala Gln Pro Met Lys Ala Ser Ser Ser Ser Ala Ser
85 90 95
Ala Ala Gly Ala Ala Ala Thr Pro Pro Arg Pro Gln Lys Leu Tyr Arg
100 105 110
Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu
115 120 125
Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu
130 135 140
Glu Ala Ala Leu Ala Tyr Asp Gln Ala Ala Tyr Arg Leu Arg Gly Asp
145 150 155 160
Ala Ala Arg Leu Asn Phe Pro Asp Asn Ala Ala Ser Arg Gly Pro Leu
165 170 175
His Ala Ser Val Asp Ala Lys Leu Gln Thr Leu Cys Gln Asn Ile Ala
180 185 190
Ala Ala Lys Asn Ala Lys Lys Ser Ser Val Ser Ala Ser Ala Ala Ala
195 200 205
Thr Ser Ser Ala Pro Thr Ser Asn Cys Ser Ser Pro Ser Ser Asp Asp
210 215 220
Ala Ser Ser Cys Leu Glu Ser Ala Asp Ser Ser Pro Ser Leu Ser Pro
225 230 235 240
Ser Ser Ala Ala Thr Thr Ala Glu Thr Pro Ala Thr Val Pro Glu Met
245 250 255
Gln Gln Leu Asp Phe Ser Glu Ala Pro Trp Asp Glu Ala Ala Ala Phe
260 265 270
Ala Leu Thr Lys Tyr Pro Ser Tyr Glu Ile Asp Trp Asp Ser Leu Leu
275 280 285
Ala Ala Asn
290
<210> 346
<211> 978
<212> DNA
<213> Populus trichocarpa
<400> 346
atggaagctc ttgaaccttt tatgagaagt gcttcccctt caactacccc atctccttct 60
caaacctcta actatccttc ttctccttct cccccctcta catcatccaa tcggttttct 120
ttctccccac aaccaccaca gcaacatcaa cagtcccttt tcaacccaga tggttgctgc 180
tctacgtcga caacctatcc attttcaact gggttgtcgt tcaacgaccc aatgggtctc 240
cagcaaccat ccagttcaat tgggcttaac caccttacac caacccaggt ccaccagatc 300
caaacccaga tgcaccataa taacctctca tatcttcaag cttaccaaca accccaaacc 360
ctcaaattct tatccccaaa gccgatcccc atgaaacaaa tcggcacacc accaaaagcc 420
acaaaacttt atagaggagt aaggcaaagg cactggggca aatgggtcgc tgagatccgt 480
ttgcccaaga accgaacccg actctggctt ggcacatttg acacagcaga ggaggcagct 540
ttggcttatg acagagcagc ttataaacta agaggcgact ttgcaagact gaacttccca 600
aacttactcc accaagggtc ctacatcggc gaatacaagc ctctccattc ctcagtggat 660
gcgaaacttc aagctatttg taaaagcttg gagaactctt cgcagcagaa acaaggaggg 720
aaagcaaaga ggcaaagtaa ctcgacgaag aagaaagcca acttggcagt ggtgacccag 780
gaggaggagc aagtggttgt taaggctgag acagagtccc cggcattgac ggagagtact 840
gcgtcgggtg gatcttcgcc tttgtcggat ctgacgtttc cggattttga ggaagcaccg 900
ttggattttg aatcggggaa ttttatgttg cagaagtatc cctcttatga gattgattgg 960
gcttcaattt tatcttag 978
<210> 347
<211> 325
<212> PRT
<213> Populus trichocarpa
<400> 347
Met Glu Ala Leu Glu Pro Phe Met Arg Ser Ala Ser Pro Ser Thr Thr
1 5 10 15
Pro Ser Pro Ser Gln Thr Ser Asn Tyr Pro Ser Ser Pro Ser Pro Pro
20 25 30
Ser Thr Ser Ser Asn Arg Phe Ser Phe Ser Pro Gln Pro Pro Gln Gln
35 40 45
His Gln Gln Ser Leu Phe Asn Pro Asp Gly Cys Cys Ser Thr Ser Thr
50 55 60
Thr Tyr Pro Phe Ser Thr Gly Leu Ser Phe Asn Asp Pro Met Gly Leu
65 70 75 80
Gln Gln Pro Ser Ser Ser Ile Gly Leu Asn His Leu Thr Pro Thr Gln
85 90 95
Val His Gln Ile Gln Thr Gln Met His His Asn Asn Leu Ser Tyr Leu
100 105 110
Gln Ala Tyr Gln Gln Pro Gln Thr Leu Lys Phe Leu Ser Pro Lys Pro
115 120 125
Ile Pro Met Lys Gln Ile Gly Thr Pro Pro Lys Ala Thr Lys Leu Tyr
130 135 140
Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg
145 150 155 160
Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala
165 170 175
Glu Glu Ala Ala Leu Ala Tyr Asp Arg Ala Ala Tyr Lys Leu Arg Gly
180 185 190
Asp Phe Ala Arg Leu Asn Phe Pro Asn Leu Leu His Gln Gly Ser Tyr
195 200 205
Ile Gly Glu Tyr Lys Pro Leu His Ser Ser Val Asp Ala Lys Leu Gln
210 215 220
Ala Ile Cys Lys Ser Leu Glu Asn Ser Ser Gln Gln Lys Gln Gly Gly
225 230 235 240
Lys Ala Lys Arg Gln Ser Asn Ser Thr Lys Lys Lys Ala Asn Leu Ala
245 250 255
Val Val Thr Gln Glu Glu Glu Gln Val Val Val Lys Ala Glu Thr Glu
260 265 270
Ser Pro Ala Leu Thr Glu Ser Thr Ala Ser Gly Gly Ser Ser Pro Leu
275 280 285
Ser Asp Leu Thr Phe Pro Asp Phe Glu Glu Ala Pro Leu Asp Phe Glu
290 295 300
Ser Gly Asn Phe Met Leu Gln Lys Tyr Pro Ser Tyr Glu Ile Asp Trp
305 310 315 320
Ala Ser Ile Leu Ser
325
<210> 348
<211> 1119
<212> DNA
<213> Populus trichocarpa
<400> 348
atggcagcag ctatcgatat ctacaacaca acagtgccag ttttttcaga tccttgtaga 60
gaagaactca tgaaagcact tgaacctttt atgaaaagtg cttcgccatc accaacttcc 120
acttattctt caccttctcc atcaacttct tctcctcctt tctcttctca cccttcttgc 180
ttttacaaca ataactctct catctcttca tatcccaact tggaccttag cttttgctct 240
ccaacgagca cccagatgtt ttctaatggg ttcttggatt ataaccaaat gggttttgag 300
caaacaggtc caattgggct taaccacctt acaccttcac aaatcctcca aatccaagcc 360
aaaatccact tccaacaaca acagcagcag aaaatggaaa atcttgctac caccacatca 420
cagtttgtcc ataaccaaag ggctagtaac ttcttggctc caaaacctgt ccctatgaaa 480
caatctgctg cttctcctca aaagccaaca aagctttata gaggagtcag gcagaggcat 540
tggggaaaat gggttgctga gattagactt ccaaagaaca gaactagact ctggcttggc 600
acttatgaca cagctgaaga ggcagctttg gcttatgata atgctgctta taagctgaga 660
ggagaatatg ctaggcttaa ctttccacat cttcgccacc agggagctca tgtgtctggt 720
gaatttggtg attacaagcc tctccattcc tctgttgatg caaagttaca agcaatttgt 780
caaagcctgg gcttgcaaaa acaggggaaa acaagggagc ccagctctgt tgctaattcc 840
aaaaagactg caacagctcc tttgcaagca aaaattgaag atgattgttc tttgagaggc 900
gaattgaaaa cggagtatga gaattttgga gttgaggact ataaggtgga gatcccatca 960
ccatcaccag cttcatctga cgaatcattg gctggttctt cttcaccaga atctgagatt 1020
tctttcttgg atttctctgg ttctttacag tgggacgagt ttgagaattt tggtttggag 1080
aagtaccctt cagttgagat tgactggtca tccatctaa 1119
<210> 349
<211> 372
<212> PRT
<213> Populus trichocarpa
<400> 349
Met Ala Ala Ala Ile Asp Ile Tyr Asn Thr Thr Val Pro Val Phe Ser
1 5 10 15
Asp Pro Cys Arg Glu Glu Leu Met Lys Ala Leu Glu Pro Phe Met Lys
20 25 30
Ser Ala Ser Pro Ser Pro Thr Ser Thr Tyr Ser Ser Pro Ser Pro Ser
35 40 45
Thr Ser Ser Pro Pro Phe Ser Ser His Pro Ser Cys Phe Tyr Asn Asn
50 55 60
Asn Ser Leu Ile Ser Ser Tyr Pro Asn Leu Asp Leu Ser Phe Cys Ser
65 70 75 80
Pro Thr Ser Thr Gln Met Phe Ser Asn Gly Phe Leu Asp Tyr Asn Gln
85 90 95
Met Gly Phe Glu Gln Thr Gly Pro Ile Gly Leu Asn His Leu Thr Pro
100 105 110
Ser Gln Ile Leu Gln Ile Gln Ala Lys Ile His Phe Gln Gln Gln Gln
115 120 125
Gln Gln Lys Met Glu Asn Leu Ala Thr Thr Thr Ser Gln Phe Val His
130 135 140
Asn Gln Arg Ala Ser Asn Phe Leu Ala Pro Lys Pro Val Pro Met Lys
145 150 155 160
Gln Ser Ala Ala Ser Pro Gln Lys Pro Thr Lys Leu Tyr Arg Gly Val
165 170 175
Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Lys
180 185 190
Asn Arg Thr Arg Leu Trp Leu Gly Thr Tyr Asp Thr Ala Glu Glu Ala
195 200 205
Ala Leu Ala Tyr Asp Asn Ala Ala Tyr Lys Leu Arg Gly Glu Tyr Ala
210 215 220
Arg Leu Asn Phe Pro His Leu Arg His Gln Gly Ala His Val Ser Gly
225 230 235 240
Glu Phe Gly Asp Tyr Lys Pro Leu His Ser Ser Val Asp Ala Lys Leu
245 250 255
Gln Ala Ile Cys Gln Ser Leu Gly Leu Gln Lys Gln Gly Lys Thr Arg
260 265 270
Glu Pro Ser Ser Val Ala Asn Ser Lys Lys Thr Ala Thr Ala Pro Leu
275 280 285
Gln Ala Lys Ile Glu Asp Asp Cys Ser Leu Arg Gly Glu Leu Lys Thr
290 295 300
Glu Tyr Glu Asn Phe Gly Val Glu Asp Tyr Lys Val Glu Ile Pro Ser
305 310 315 320
Pro Ser Pro Ala Ser Ser Asp Glu Ser Leu Ala Gly Ser Ser Ser Pro
325 330 335
Glu Ser Glu Ile Ser Phe Leu Asp Phe Ser Gly Ser Leu Gln Trp Asp
340 345 350
Glu Phe Glu Asn Phe Gly Leu Glu Lys Tyr Pro Ser Val Glu Ile Asp
355 360 365
Trp Ser Ser Ile
370
<210> 350
<211> 1035
<212> DNA
<213> Populus trichocarpa
<400> 350
atggatttcc acagtagtag tccgcttcaa tcagacctcc tcgggggtgg tgagttaatg 60
gaagcacttg aaccttttat gagaagtgct tccccttcaa ctaccctatc tccttctcaa 120
acctctaact atccttcttc tccttctccc ccctctacat catccaatcg gttttctttc 180
tccccacaac caccacagca acatcaacag tcccttttca acccagatgg ttgctgctct 240
acgtcgacaa cctatccatt ttcaactggg ttgtcgttca acgacccaat gggtctccag 300
caaccatcca gttcaattgg gcttaaccac cttacaccaa cccagatcca ccagatccaa 360
acccagatgc accataataa cctctcatat cttcaagctt accaacaacc ccaaaccctc 420
aaattcttat ccccaaagcc gatccccatg aaacaaatcg gtacaccacc aaaagccaca 480
aaactttata gaggagtaag gcaaaggcac tggggcaaat gggtcgctga gatccgtttg 540
cccaagaacc gaacccgact ctggcttggc acatttgaca cagcagagga ggcagctttg 600
gcttatgaca gagcagctta taaactaaga ggcgactttg caagactgaa cttcccaaac 660
ttactccacc aagggtccta catcggcgaa tacaagcctc tccattcctc agtggatgcg 720
aaacttcaag ctatttgtaa aagcttggag aactcttcgc agcagaaaca aggagggaaa 780
gcaaagaggc aaagtaactc gacgaagaag aaagccaact tggcagtggt gacccaggag 840
gaggagcaag tggttgttaa ggctgagaca gagtccccgg cattgacgga gagtactgcg 900
tcgggtggat cttcgccttt gtcggatctg acgtttccgg attttgagga agcaccgttg 960
gattttgaat cggggaattt tatgttgcag aagtatccct cttatgagat tgattgggct 1020
tcaattttat cttag 1035
<210> 351
<211> 344
<212> PRT
<213> Populus trichocarpa
<400> 351
Met Asp Phe His Ser Ser Ser Pro Leu Gln Ser Asp Leu Leu Gly Gly
1 5 10 15
Gly Glu Leu Met Glu Ala Leu Glu Pro Phe Met Arg Ser Ala Ser Pro
20 25 30
Ser Thr Thr Leu Ser Pro Ser Gln Thr Ser Asn Tyr Pro Ser Ser Pro
35 40 45
Ser Pro Pro Ser Thr Ser Ser Asn Arg Phe Ser Phe Ser Pro Gln Pro
50 55 60
Pro Gln Gln His Gln Gln Ser Leu Phe Asn Pro Asp Gly Cys Cys Ser
65 70 75 80
Thr Ser Thr Thr Tyr Pro Phe Ser Thr Gly Leu Ser Phe Asn Asp Pro
85 90 95
Met Gly Leu Gln Gln Pro Ser Ser Ser Ile Gly Leu Asn His Leu Thr
100 105 110
Pro Thr Gln Ile His Gln Ile Gln Thr Gln Met His His Asn Asn Leu
115 120 125
Ser Tyr Leu Gln Ala Tyr Gln Gln Pro Gln Thr Leu Lys Phe Leu Ser
130 135 140
Pro Lys Pro Ile Pro Met Lys Gln Ile Gly Thr Pro Pro Lys Ala Thr
145 150 155 160
Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala
165 170 175
Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe
180 185 190
Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Arg Ala Ala Tyr Lys
195 200 205
Leu Arg Gly Asp Phe Ala Arg Leu Asn Phe Pro Asn Leu Leu His Gln
210 215 220
Gly Ser Tyr Ile Gly Glu Tyr Lys Pro Leu His Ser Ser Val Asp Ala
225 230 235 240
Lys Leu Gln Ala Ile Cys Lys Ser Leu Glu Asn Ser Ser Gln Gln Lys
245 250 255
Gln Gly Gly Lys Ala Lys Arg Gln Ser Asn Ser Thr Lys Lys Lys Ala
260 265 270
Asn Leu Ala Val Val Thr Gln Glu Glu Glu Gln Val Val Val Lys Ala
275 280 285
Glu Thr Glu Ser Pro Ala Leu Thr Glu Ser Thr Ala Ser Gly Gly Ser
290 295 300
Ser Pro Leu Ser Asp Leu Thr Phe Pro Asp Phe Glu Glu Ala Pro Leu
305 310 315 320
Asp Phe Glu Ser Gly Asn Phe Met Leu Gln Lys Tyr Pro Ser Tyr Glu
325 330 335
Ile Asp Trp Ala Ser Ile Leu Ser
340
<210> 352
<211> 855
<212> DNA
<213> Triticum aestivum
<400> 352
atggctgcag ctatagatct gtccggggag gatctggtga gagcactcga gccttttatc 60
cgagaagcct ctgcccccct tccactccac tcccatctta gtcccacctc gccattctcc 120
ttcccccacg ccgcctacag tgggtacccg tacggggtgc aggcacaggc ccagaccgag 180
ctcagcccgg cccagatgca ctacatccag gcacgcctcc acctccagcg ccagaccggc 240
cagccgggcc acctcggccc acggccccag cccatgaagc ccgcttcggt ggcagcggcg 300
accccgccgc ggccgcagaa gctctaccgt ggcgtgcggc agcgccactg gggcaagtgg 360
gtggcggaga tccgcctccc ccgcaaccgc acccgcctct ggctaggcac cttcgacacc 420
gccgaggagg cggccctcgc ctacaacaag cacgcctacc gcctccgcgg cgaccaagcg 480
cggctcaact tccccgacaa cgccgcctcc cgcggcccgc tcaatgcctc cgttgatgcc 540
aagctccaga ccctctgcca gaacatcacc gcctccaaga acggcaagaa gtccgcctcc 600
gtctccgcgt ccaccgccgc agccacgtcg tccaccccca ccagcaactg ctcctcgccg 660
tcctccgacg aggcgtcgtc ctcgctggag tccgcggagt cgtcaccgtc tctctctctc 720
tctctctctg tctctgtttc tgtgtttctg tctctctctt tctgtgtgtc tctctgggac 780
gaggcagcct gcttcgccct caccaagtac ccgtcgtacg agatcgactg ggactcgctt 840
ctcgccacca attag 855
<210> 353
<211> 284
<212> PRT
<213> Triticum aestivum
<400> 353
Met Ala Ala Ala Ile Asp Leu Ser Gly Glu Asp Leu Val Arg Ala Leu
1 5 10 15
Glu Pro Phe Ile Arg Glu Ala Ser Ala Pro Leu Pro Leu His Ser His
20 25 30
Leu Ser Pro Thr Ser Pro Phe Ser Phe Pro His Ala Ala Tyr Ser Gly
35 40 45
Tyr Pro Tyr Gly Val Gln Ala Gln Ala Gln Thr Glu Leu Ser Pro Ala
50 55 60
Gln Met His Tyr Ile Gln Ala Arg Leu His Leu Gln Arg Gln Thr Gly
65 70 75 80
Gln Pro Gly His Leu Gly Pro Arg Pro Gln Pro Met Lys Pro Ala Ser
85 90 95
Val Ala Ala Ala Thr Pro Pro Arg Pro Gln Lys Leu Tyr Arg Gly Val
100 105 110
Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg
115 120 125
Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Glu Ala
130 135 140
Ala Leu Ala Tyr Asn Lys His Ala Tyr Arg Leu Arg Gly Asp Gln Ala
145 150 155 160
Arg Leu Asn Phe Pro Asp Asn Ala Ala Ser Arg Gly Pro Leu Asn Ala
165 170 175
Ser Val Asp Ala Lys Leu Gln Thr Leu Cys Gln Asn Ile Thr Ala Ser
180 185 190
Lys Asn Gly Lys Lys Ser Ala Ser Val Ser Ala Ser Thr Ala Ala Ala
195 200 205
Thr Ser Ser Thr Pro Thr Ser Asn Cys Ser Ser Pro Ser Ser Asp Glu
210 215 220
Ala Ser Ser Ser Leu Glu Ser Ala Glu Ser Ser Pro Ser Leu Ser Leu
225 230 235 240
Ser Leu Ser Val Ser Val Ser Val Phe Leu Ser Leu Ser Phe Cys Val
245 250 255
Ser Leu Trp Asp Glu Ala Ala Cys Phe Ala Leu Thr Lys Tyr Pro Ser
260 265 270
Tyr Glu Ile Asp Trp Asp Ser Leu Leu Ala Thr Asn
275 280
<210> 354
<211> 987
<212> DNA
<213> Triticum aestivum
<400> 354
atggccgctg ccatagacat gtacaagtac aacaccagca cgcaccagat cggctccgcc 60
gcctctgcct cggatcagga gctcatgaaa gcactcgaac cttttatcac gattgcttcc 120
tcctcttcct ctcactaccc ctaccactac tactcctctc cctccatgac ccaagattcg 180
tacatggcca ccccatcgtc gtcgtcctac gcctcctcgt tcgcagcctc tcctctgccc 240
accaccgccc ccgcctcgcc gtctttctcc cagcttccgc cgctctactc ctcgcagtat 300
gccgtgaacg gatccatggg gctggcccag ctcggcccgg cccagatcca gcagatccag 360
gcccagttct tcgtccagca gcagcagcag cagcagaggg gcctggctgg tggctccttc 420
ctcggcccgc gcgcgctgcc gatgaagcag tccgggtcgc cgccgcgcgc gtccgccgcc 480
gcgctggcgc tggccggagt ggcgcccgcg cagtccaagc tgtaccgcgg cgtgcggcag 540
cggcactggg gcaagtgggt ggcggagatc cgcctcccca agaaccgcac caggctgtgg 600
ctcggcacct tcgacaccgc cgaggacgcc gcgctcgcct acgacaaggc cgccttccgc 660
ctccgcggcg acctcgcccg cctcaacttc ccgtcgctcc ggcgcggcgg cgcccacctg 720
gccggcccgc tccacgcctc cgtcgacgcc aagctcaccg ccatctgcga gtccctcgcc 780
gcgccctcgt ccaagaactc ggagccggag tcccccaagt gctcggcgtc gacggagggc 840
gaggactcgg cgtccgccgg gtccacgccg ccggtcccgg agatggagaa gctggacttc 900
acggaggcgc cgtgggacga gtcggagacc ttccacctgc gcaagtaccc gtccgtggag 960
atcgactggg actccatcct gtcgtga 987
<210> 355
<211> 328
<212> PRT
<213> Triticum aestivum
<400> 355
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Asn Thr Ser Thr His Gln
1 5 10 15
Ile Gly Ser Ala Ala Ser Ala Ser Asp Gln Glu Leu Met Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ile Ala Ser Ser Ser Ser Ser His Tyr Pro Tyr
35 40 45
His Tyr Tyr Ser Ser Pro Ser Met Thr Gln Asp Ser Tyr Met Ala Thr
50 55 60
Pro Ser Ser Ser Ser Tyr Ala Ser Ser Phe Ala Ala Ser Pro Leu Pro
65 70 75 80
Thr Thr Ala Pro Ala Ser Pro Ser Phe Ser Gln Leu Pro Pro Leu Tyr
85 90 95
Ser Ser Gln Tyr Ala Val Asn Gly Ser Met Gly Leu Ala Gln Leu Gly
100 105 110
Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln Phe Phe Val Gln Gln Gln
115 120 125
Gln Gln Gln Gln Arg Gly Leu Ala Gly Gly Ser Phe Leu Gly Pro Arg
130 135 140
Ala Leu Pro Met Lys Gln Ser Gly Ser Pro Pro Arg Ala Ser Ala Ala
145 150 155 160
Ala Leu Ala Leu Ala Gly Val Ala Pro Ala Gln Ser Lys Leu Tyr Arg
165 170 175
Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu
180 185 190
Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu
195 200 205
Asp Ala Ala Leu Ala Tyr Asp Lys Ala Ala Phe Arg Leu Arg Gly Asp
210 215 220
Leu Ala Arg Leu Asn Phe Pro Ser Leu Arg Arg Gly Gly Ala His Leu
225 230 235 240
Ala Gly Pro Leu His Ala Ser Val Asp Ala Lys Leu Thr Ala Ile Cys
245 250 255
Glu Ser Leu Ala Ala Pro Ser Ser Lys Asn Ser Glu Pro Glu Ser Pro
260 265 270
Lys Cys Ser Ala Ser Thr Glu Gly Glu Asp Ser Ala Ser Ala Gly Ser
275 280 285
Thr Pro Pro Val Pro Glu Met Glu Lys Leu Asp Phe Thr Glu Ala Pro
290 295 300
Trp Asp Glu Ser Glu Thr Phe His Leu Arg Lys Tyr Pro Ser Val Glu
305 310 315 320
Ile Asp Trp Asp Ser Ile Leu Ser
325
<210> 356
<211> 1062
<212> DNA
<213> Triticum aestivum
<400> 356
atggccgctg ccatagacat gtacaagtac aacaccagca cgcaccagat cggctccgcc 60
gcctctgctt cggatcagga gctcatgaaa gcactcgaac cttttatcac gattgcttcc 120
tcctcttcct ctcactaccc gtaccagtac tactcttctc cctccatgac ccaaaattca 180
tacatggcca ccccatcgtc gtcctacgcc tcctcgttcg cagtctctcc tctgcccacc 240
accgcgcccg cctcgccgtc tttctcgcag cttccgccgc tctactcctc gcagtatgcc 300
gcttcgggca tgaacggatc catggggctg gcccagctcg gcccggccca gatccagcag 360
atccaggccc agttcttcgt ccagcagcag cagcagcaga ggggcctggc tggtggctcg 420
ttccttgggc cgcgcgcgca gccgatgaag cagtccgggt cgccgccgcg cgcgtccgcc 480
gcggcgctgg cgctggccgg agtggcgccc gcgcagtcca agctgtaccg cggcgtgcgg 540
cagcgccact ggggcaagtg ggtggcggag atccgcctcc ccaagaaccg cacgaggctg 600
tggctcggca ccttcgacac cgccgaggac gccgcgctcg cctacgacaa ggccgccctt 660
ccgcctccgc ggcgacctcg cccgcctcaa cttcccgtcg ctccgccgcg gcggcgccca 720
cctggccggc ccgctccacg cctccgtcga cgccaagctc accgccatct gcgagtccct 780
cgccgcgccc tcgtccaaga actcggagcc ggagtccccc aagtgctcgg cgtcgacgga 840
gggcgaggac tcggcgtccg ccgggtcccc gccgccgccc acgccgcccg tcccggagat 900
ggagaagctg gacttcacgg aggcgccgtg ggacgagtcg gagaccttcc acctgcgcaa 960
gtacccgtcc gtggagatcg actgggactc catcctgtcg tgaacagcaa gcagctgcta 1020
ctactagtac agtcttcgtt aagctccgta gctatgatgt aa 1062
<210> 357
<211> 353
<212> PRT
<213> Triticum aestivum
<400> 357
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Asn Thr Ser Thr His Gln
1 5 10 15
Ile Gly Ser Ala Ala Ser Ala Ser Asp Gln Glu Leu Met Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ile Ala Ser Ser Ser Ser Ser His Tyr Pro Tyr
35 40 45
Gln Tyr Tyr Ser Ser Pro Ser Met Thr Gln Asn Ser Tyr Met Ala Thr
50 55 60
Pro Ser Ser Ser Tyr Ala Ser Ser Phe Ala Val Ser Pro Leu Pro Thr
65 70 75 80
Thr Ala Pro Ala Ser Pro Ser Phe Ser Gln Leu Pro Pro Leu Tyr Ser
85 90 95
Ser Gln Tyr Ala Ala Ser Gly Met Asn Gly Ser Met Gly Leu Ala Gln
100 105 110
Leu Gly Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln Phe Phe Val Gln
115 120 125
Gln Gln Gln Gln Gln Arg Gly Leu Ala Gly Gly Ser Phe Leu Gly Pro
130 135 140
Arg Ala Gln Pro Met Lys Gln Ser Gly Ser Pro Pro Arg Ala Ser Ala
145 150 155 160
Ala Ala Leu Ala Leu Ala Gly Val Ala Pro Ala Gln Ser Lys Leu Tyr
165 170 175
Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg
180 185 190
Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala
195 200 205
Glu Asp Ala Ala Leu Ala Tyr Asp Lys Ala Ala Leu Pro Pro Pro Arg
210 215 220
Arg Pro Arg Pro Pro Gln Leu Pro Val Ala Pro Pro Arg Arg Arg Pro
225 230 235 240
Pro Gly Arg Pro Ala Pro Arg Leu Arg Arg Arg Gln Ala His Arg His
245 250 255
Leu Arg Val Pro Arg Arg Ala Leu Val Gln Glu Leu Gly Ala Gly Val
260 265 270
Pro Gln Val Leu Gly Val Asp Gly Gly Arg Gly Leu Gly Val Arg Arg
275 280 285
Val Pro Ala Ala Ala His Ala Ala Arg Pro Gly Asp Gly Glu Ala Gly
290 295 300
Leu His Gly Gly Ala Val Gly Arg Val Gly Asp Leu Pro Pro Ala Gln
305 310 315 320
Val Pro Val Arg Gly Asp Arg Leu Gly Leu His Pro Val Val Asn Ser
325 330 335
Lys Gln Leu Leu Leu Leu Val Gln Ser Ser Leu Ser Ser Val Ala Met
340 345 350
Met
<210> 358
<211> 1002
<212> DNA
<213> Triticum aestivum
<400> 358
atggccgctg ccatagacat gtacaagtac aacaccagca cgcaccagat cggctctgcc 60
gcctctgctt cggatcagga gctcatgaaa gcactcgaac cttttatcac gattgcttcc 120
tcctctccct acccctacca gtactactct tctccctcca tgacccaaga ttcatacacg 180
gccaccccat catcatcgta cgcctcgttc gcgacctctc ctctacccac caccgcaccc 240
acctcgccgt ctttctcgca gcttccgccg ctctactcct cgcagtattc caccgcttcg 300
ggcatgaacg gatccatggg gctggcccag ctcggcccgg cccagatcca gcagatccag 360
gcccagttct tcgtccagca gcagcagcag cagaggggcc tggctggctc cttccttggg 420
ccgcgcgcgc agccgatgaa gcagtccggg tcgccgccgc gcgcgtccgc cgcggcgctg 480
gccctggccg gagtggcgcc tgcgcagtcc aagctgtacc gcggcgtgcg gcagcgtcac 540
tggggcaagt gggtggcgga gatccgcctc cccaagaacc gcacgaggct gtggctcggc 600
accttcgaca ccgccgagga cgccgcgctc gcctacgaca aggccgcctt ccgcctccgc 660
ggggacctcg cccgcctcaa cttcccgtcg ctccgacgcg gcggcgccca cctggccggc 720
ccgctccacg cctccgtcga cgccaagctc accgccatct gcgagtccct cgccgcgccc 780
tcgtccaaga actcggccga ggcggagccg gagtccccca agtgctcggc gtcgacggag 840
ggtgaggact cggcgtccgc cgggtccccc ccgccgccca cgccgccggt cccggagatg 900
gagaagctgg acttcacgga ggcgccgtgg gacgagtcgg agaccttcca cctgcgcaag 960
tacccgtccg tggagatcga ctgggactcc atcctgtcgt ga 1002
<210> 359
<211> 333
<212> PRT
<213> Triticum aestivum
<400> 359
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Asn Thr Ser Thr His Gln
1 5 10 15
Ile Gly Ser Ala Ala Ser Ala Ser Asp Gln Glu Leu Met Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ile Ala Ser Ser Ser Pro Tyr Pro Tyr Gln Tyr
35 40 45
Tyr Ser Ser Pro Ser Met Thr Gln Asp Ser Tyr Thr Ala Thr Pro Ser
50 55 60
Ser Ser Tyr Ala Ser Phe Ala Thr Ser Pro Leu Pro Thr Thr Ala Pro
65 70 75 80
Thr Ser Pro Ser Phe Ser Gln Leu Pro Pro Leu Tyr Ser Ser Gln Tyr
85 90 95
Ser Thr Ala Ser Gly Met Asn Gly Ser Met Gly Leu Ala Gln Leu Gly
100 105 110
Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln Phe Phe Val Gln Gln Gln
115 120 125
Gln Gln Gln Arg Gly Leu Ala Gly Ser Phe Leu Gly Pro Arg Ala Gln
130 135 140
Pro Met Lys Gln Ser Gly Ser Pro Pro Arg Ala Ser Ala Ala Ala Leu
145 150 155 160
Ala Leu Ala Gly Val Ala Pro Ala Gln Ser Lys Leu Tyr Arg Gly Val
165 170 175
Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Lys
180 185 190
Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala Glu Asp Ala
195 200 205
Ala Leu Ala Tyr Asp Lys Ala Ala Phe Arg Leu Arg Gly Asp Leu Ala
210 215 220
Arg Leu Asn Phe Pro Ser Leu Arg Arg Gly Gly Ala His Leu Ala Gly
225 230 235 240
Pro Leu His Ala Ser Val Asp Ala Lys Leu Thr Ala Ile Cys Glu Ser
245 250 255
Leu Ala Ala Pro Ser Ser Lys Asn Ser Ala Glu Ala Glu Pro Glu Ser
260 265 270
Pro Lys Cys Ser Ala Ser Thr Glu Gly Glu Asp Ser Ala Ser Ala Gly
275 280 285
Ser Pro Pro Pro Pro Thr Pro Pro Val Pro Glu Met Glu Lys Leu Asp
290 295 300
Phe Thr Glu Ala Pro Trp Asp Glu Ser Glu Thr Phe His Leu Arg Lys
305 310 315 320
Tyr Pro Ser Val Glu Ile Asp Trp Asp Ser Ile Leu Ser
325 330
<210> 360
<211> 915
<212> DNA
<213> Zea mays
<400> 360
atggcggcta cgacgataga ttggcacgcc cgcaacaacg ccgcgcttcc cgccgccatg 60
tatggcgtgg ccgtgccgga cagcaaggag ctcgtgcgcg cgcttgctcc gcccacgcag 120
caggccccga ccatctcgtt cgcgtacccc tgctccggcg tggagcagca gagcgcggcg 180
ggctcgtttc tgggtgccgg cggcagtggc ctgaccccgg cgcagatcct ccaggtgcag 240
tcgcggctcc agttcctgcg ccggccggcg ggggccgcgg tcgccaccca gccgatgaag 300
cggcagggcg tgccgctgcc gcaggcgccg gcggtgtcca agctgtaccg cggcgtccgg 360
cagcggcatt gggggaagtg ggtggcggag atccgcctgc cacgaaaccg cacccgcctc 420
tggctcggca ccttcgacac cgccgaggag gctgcgctcg cctacgacag cgccgcgttc 480
cgcctccgcg gggactccgc caggctcaac tttcccgagc tcaggcgcgg cggccagcac 540
ctcggcccgc cgctccacgc cgcggtcgac gccaagctcc acgccatctg caacggcacg 600
gacgtcgtcg tgccgccgcc gcagagccgg agcaacgacg ccacggtggt agcgacggcg 660
acggcgacgg cgacaaccgc cccgagcccc ttctcctcgg cgagtccaca cgtcaagagc 720
gagccgggct cctccggctc cgatagctcg ttttccgcag acggcgacgt gtcctccact 780
gggtcctccg acgtggtgct ggatatgcaa ctgctcgact tctcagaagc gccatgggat 840
gattccgaga gcttccgcct tcgcaaatac ccctccatgg agatcgactg ggactcgata 900
ctactaattt cataa 915
<210> 361
<211> 304
<212> PRT
<213> Zea mays
<400> 361
Met Ala Ala Thr Thr Ile Asp Trp His Ala Arg Asn Asn Ala Ala Leu
1 5 10 15
Pro Ala Ala Met Tyr Gly Val Ala Val Pro Asp Ser Lys Glu Leu Val
20 25 30
Arg Ala Leu Ala Pro Pro Thr Gln Gln Ala Pro Thr Ile Ser Phe Ala
35 40 45
Tyr Pro Cys Ser Gly Val Glu Gln Gln Ser Ala Ala Gly Ser Phe Leu
50 55 60
Gly Ala Gly Gly Ser Gly Leu Thr Pro Ala Gln Ile Leu Gln Val Gln
65 70 75 80
Ser Arg Leu Gln Phe Leu Arg Arg Pro Ala Gly Ala Ala Val Ala Thr
85 90 95
Gln Pro Met Lys Arg Gln Gly Val Pro Leu Pro Gln Ala Pro Ala Val
100 105 110
Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
115 120 125
Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr
130 135 140
Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Ser Ala Ala Phe
145 150 155 160
Arg Leu Arg Gly Asp Ser Ala Arg Leu Asn Phe Pro Glu Leu Arg Arg
165 170 175
Gly Gly Gln His Leu Gly Pro Pro Leu His Ala Ala Val Asp Ala Lys
180 185 190
Leu His Ala Ile Cys Asn Gly Thr Asp Val Val Val Pro Pro Pro Gln
195 200 205
Ser Arg Ser Asn Asp Ala Thr Val Val Ala Thr Ala Thr Ala Thr Ala
210 215 220
Thr Thr Ala Pro Ser Pro Phe Ser Ser Ala Ser Pro His Val Lys Ser
225 230 235 240
Glu Pro Gly Ser Ser Gly Ser Asp Ser Ser Phe Ser Ala Asp Gly Asp
245 250 255
Val Ser Ser Thr Gly Ser Ser Asp Val Val Leu Asp Met Gln Leu Leu
260 265 270
Asp Phe Ser Glu Ala Pro Trp Asp Asp Ser Glu Ser Phe Arg Leu Arg
275 280 285
Lys Tyr Pro Ser Met Glu Ile Asp Trp Asp Ser Ile Leu Leu Ile Ser
290 295 300
<210> 362
<211> 1023
<212> DNA
<213> Zea mays
<400> 362
atggccgcag ccatcgacat gtacaagtac tacaatacca gcgcacacca gatcccctcc 60
tcctccccct cggatcagga gctctcgaaa gcactcgagc cttttataac gagtgcttcc 120
tcctcttcgt cctcctcccc ctaccatggc tactcgtcct ctccatgcat gtcccaagat 180
tcttacatgc ctacaccctc ttacaccagc tacgccacct cgcctcttcc cactcccgcc 240
gccgcctcct cctcgcagtc gcagcttccg ccgctctact cgtcgcctta tgcggcgccg 300
tgcatggccg gccagatggg cctgaaccag ctcggcccgg cccagatcca gcagatccag 360
gcccagttca tgttccagca gcagcagcag cagaggggcc tgcacgcggc gttcctgggc 420
ccgcgggcgc agccgatgaa gcagtcaggg tcgccgccgc cgccgctggc gccggcgcag 480
tcgaagctgt accgcggcgt gcggcagcgc cactggggca agtgggtggc ggagatccgg 540
ctccccaaga accgcacgcg gctgtggctc ggcaccttcg acaccgccga ggacgcggcg 600
ctcgcctacg acaaggcggc cttccgcctc cgcggcgaca cggcgcggct caacttcccg 660
gccctccggc gcggcggcgc gcacctcgcc ggcccgctgc acgcctccgt ggacgccaag 720
ctgaccgcca tctgccagtc cctgtcggag tccaagtcca agagcggctc gtccggcgac 780
gagtcggccg cgtccccgcc ggactccccc aagtgctcgg cgtcgacgac ggagggagag 840
ggggaggagg agtcgggctc cgccggctcc cctcctcctc ctcctcctcc cccgacgctg 900
gcgccgcccg tgccggagat ggcgaagctg gacttcacgg aggcgccgtg ggacgagacg 960
gaggccttcc acctgcgcaa gtacccgtcc tgggagatcg actgggattc catcctgtca 1020
tga 1023
<210> 363
<211> 340
<212> PRT
<213> Zea mays
<400> 363
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Tyr Asn Thr Ser Ala His
1 5 10 15
Gln Ile Pro Ser Ser Ser Pro Ser Asp Gln Glu Leu Ser Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ser Ala Ser Ser Ser Ser Ser Ser Ser Pro Tyr
35 40 45
His Gly Tyr Ser Ser Ser Pro Cys Met Ser Gln Asp Ser Tyr Met Pro
50 55 60
Thr Pro Ser Tyr Thr Ser Tyr Ala Thr Ser Pro Leu Pro Thr Pro Ala
65 70 75 80
Ala Ala Ser Ser Ser Gln Ser Gln Leu Pro Pro Leu Tyr Ser Ser Pro
85 90 95
Tyr Ala Ala Pro Cys Met Ala Gly Gln Met Gly Leu Asn Gln Leu Gly
100 105 110
Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln Phe Met Phe Gln Gln Gln
115 120 125
Gln Gln Gln Arg Gly Leu His Ala Ala Phe Leu Gly Pro Arg Ala Gln
130 135 140
Pro Met Lys Gln Ser Gly Ser Pro Pro Pro Pro Leu Ala Pro Ala Gln
145 150 155 160
Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
165 170 175
Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr
180 185 190
Phe Asp Thr Ala Glu Asp Ala Ala Leu Ala Tyr Asp Lys Ala Ala Phe
195 200 205
Arg Leu Arg Gly Asp Thr Ala Arg Leu Asn Phe Pro Ala Leu Arg Arg
210 215 220
Gly Gly Ala His Leu Ala Gly Pro Leu His Ala Ser Val Asp Ala Lys
225 230 235 240
Leu Thr Ala Ile Cys Gln Ser Leu Ser Glu Ser Lys Ser Lys Ser Gly
245 250 255
Ser Ser Gly Asp Glu Ser Ala Ala Ser Pro Pro Asp Ser Pro Lys Cys
260 265 270
Ser Ala Ser Thr Thr Glu Gly Glu Gly Glu Glu Glu Ser Gly Ser Ala
275 280 285
Gly Ser Pro Pro Pro Pro Pro Pro Pro Pro Thr Leu Ala Pro Pro Val
290 295 300
Pro Glu Met Ala Lys Leu Asp Phe Thr Glu Ala Pro Trp Asp Glu Thr
305 310 315 320
Glu Ala Phe His Leu Arg Lys Tyr Pro Ser Trp Glu Ile Asp Trp Asp
325 330 335
Ser Ile Leu Ser
340
<210> 364
<211> 951
<212> DNA
<213> Zea mays
<400> 364
atggccgcag ccatagacat gtacaagtac tgcaatacca gcgcacacct tatcgcctcc 60
tcgtccccct cggatcagga gctcgcgaaa gcactcgagc cttttataac gagtgcttcc 120
tccccctacc atcgctactc gttggcccca gattcttaca tgcctacacc ctcctcctac 180
accacctcgc ctcttcccac ccccacctcc tcgcctttct cgcagcttcc gccactctac 240
tcgtcgcctt acgcggcttc gacggcgtcg ggcgtggctg ggccgatggg cctgaaccag 300
ctcggcccgg cccagatcca gcagatccag gcccagctca tgttccagca ccagcagcag 360
aggggcctgc acgcggcgtt cctgggcccg cgggcgcagc cgatgaagca gtccgggtcg 420
ccgccggcgc agtcgaagct gtaccgcggc gtgcgccagc gccactgggg caagtgggtg 480
gcggagatcc gcctccccaa gaaccgcacg cggctgtggc tcggcacctt cgacaccgcc 540
gagggcgcgg cgctggccta cgacgaggcg gccttccgcc tccgcggcga cacggcgcgc 600
ctcaacttcc cgtccctccg ccgcggcggc ggcgcgcgcc tcgccggccc gctccacgcc 660
tccgtggacg ccaagctcac cgccatctgc cagtccctgg cggggtccaa gaacagctcg 720
tccagcgacg agtcggccgc gtccctgccg gactccccca agtgctcagc gtcgacggag 780
ggggatgagg actcggcctc cgccggctcc cctccttccc cgacgcaggc gccgcccgtg 840
ccggagatgg cgaagctgga cttcaccgag gcgccgtggg acgaaacgga ggccttccca 900
ctgcgcaagt acccgtcctg ggagatcgac tgggattcca tcctttcatg a 951
<210> 365
<211> 316
<212> PRT
<213> Zea mays
<400> 365
Met Ala Ala Ala Ile Asp Met Tyr Lys Tyr Cys Asn Thr Ser Ala His
1 5 10 15
Leu Ile Ala Ser Ser Ser Pro Ser Asp Gln Glu Leu Ala Lys Ala Leu
20 25 30
Glu Pro Phe Ile Thr Ser Ala Ser Ser Pro Tyr His Arg Tyr Ser Leu
35 40 45
Ala Pro Asp Ser Tyr Met Pro Thr Pro Ser Ser Tyr Thr Thr Ser Pro
50 55 60
Leu Pro Thr Pro Thr Ser Ser Pro Phe Ser Gln Leu Pro Pro Leu Tyr
65 70 75 80
Ser Ser Pro Tyr Ala Ala Ser Thr Ala Ser Gly Val Ala Gly Pro Met
85 90 95
Gly Leu Asn Gln Leu Gly Pro Ala Gln Ile Gln Gln Ile Gln Ala Gln
100 105 110
Leu Met Phe Gln His Gln Gln Gln Arg Gly Leu His Ala Ala Phe Leu
115 120 125
Gly Pro Arg Ala Gln Pro Met Lys Gln Ser Gly Ser Pro Pro Ala Gln
130 135 140
Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
145 150 155 160
Ala Glu Ile Arg Leu Pro Lys Asn Arg Thr Arg Leu Trp Leu Gly Thr
165 170 175
Phe Asp Thr Ala Glu Gly Ala Ala Leu Ala Tyr Asp Glu Ala Ala Phe
180 185 190
Arg Leu Arg Gly Asp Thr Ala Arg Leu Asn Phe Pro Ser Leu Arg Arg
195 200 205
Gly Gly Gly Ala Arg Leu Ala Gly Pro Leu His Ala Ser Val Asp Ala
210 215 220
Lys Leu Thr Ala Ile Cys Gln Ser Leu Ala Gly Ser Lys Asn Ser Ser
225 230 235 240
Ser Ser Asp Glu Ser Ala Ala Ser Leu Pro Asp Ser Pro Lys Cys Ser
245 250 255
Ala Ser Thr Glu Gly Asp Glu Asp Ser Ala Ser Ala Gly Ser Pro Pro
260 265 270
Ser Pro Thr Gln Ala Pro Pro Val Pro Glu Met Ala Lys Leu Asp Phe
275 280 285
Thr Glu Ala Pro Trp Asp Glu Thr Glu Ala Phe Pro Leu Arg Lys Tyr
290 295 300
Pro Ser Trp Glu Ile Asp Trp Asp Ser Ile Leu Ser
305 310 315
<210> 366
<211> 780
<212> DNA
<213> Zea mays
<400> 366
atggccgctg ctataaatct ccccgggccc agcgaggatc tgatgcgagc gatggagtcc 60
ttcatgcaag acgacgcccc atcccctctg gccatgccgc cggcgccgtc tttcccagcg 120
gccgcagccc acggggccca gtacccggcg acccacctga gcccggcgca gatgcagttc 180
atccaggccc agctccacct gcagcggaac ccggggctgg gcccgcgggc gcagcccatg 240
aagcccgccg tcccagtgcc gccggcgccg gcgccgcagc ggcctgtgaa gctgtaccgc 300
ggcgtgcggc agcgtcactg gggcaagtgg gtggccgaga tccggctccc ccggaaccgc 360
acccgcctgt ggctcgggac cttcgacacc gccgagcagg cggcgctggc ctacgaccca 420
ggcggcgtac cgcctccgcg gggacgcggc gcggctcatc ttccccgaca acgcggagtc 480
cagggcgccg ctcgaccccg ccgtggacgc caagctgcag gccatctgcg ccaccttcgc 540
cgccgcgtcg tcgtcttcct agatttccat ggccatgagc aaggcgatgc caatcaacgc 600
gtccgttctg ggagcggctg cggcgtctcc gagcaactgc tcctccgacg aaagttccgg 660
ctccgggttc gggtcggacg acgagatgtc ctcgtcctcc ccgacgccgg tggtggcgcc 720
gccggtggcg ggcttgggac cgctggtttt ccgcgagggt tcctggggct tggtccatag 780
<210> 367
<211> 259
<212> PRT
<213> Zea mays
<400> 367
Met Ala Ala Ala Ile Asn Leu Pro Gly Pro Ser Glu Asp Leu Met Arg
1 5 10 15
Ala Met Glu Ser Phe Met Gln Asp Asp Ala Pro Ser Pro Leu Ala Met
20 25 30
Pro Pro Ala Pro Ser Phe Pro Ala Ala Ala Ala His Gly Ala Gln Tyr
35 40 45
Pro Ala Thr His Leu Ser Pro Ala Gln Met Gln Phe Ile Gln Ala Gln
50 55 60
Leu His Leu Gln Arg Asn Pro Gly Leu Gly Pro Arg Ala Gln Pro Met
65 70 75 80
Lys Pro Ala Val Pro Val Pro Pro Ala Pro Ala Pro Gln Arg Pro Val
85 90 95
Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala
100 105 110
Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe
115 120 125
Asp Thr Ala Glu Gln Ala Ala Leu Ala Tyr Asp Pro Gly Gly Val Pro
130 135 140
Pro Pro Arg Gly Arg Gly Ala Ala His Leu Pro Arg Gln Arg Gly Val
145 150 155 160
Gln Gly Ala Ala Arg Pro Arg Arg Gly Arg Gln Ala Ala Gly His Leu
165 170 175
Arg His Leu Arg Arg Arg Val Val Val Phe Leu Asp Phe His Gly His
180 185 190
Glu Gln Gly Asp Ala Asn Gln Arg Val Arg Ser Gly Ser Gly Cys Gly
195 200 205
Val Ser Glu Gln Leu Leu Leu Arg Arg Lys Phe Arg Leu Arg Val Arg
210 215 220
Val Gly Arg Arg Asp Val Leu Val Leu Pro Asp Ala Gly Gly Gly Ala
225 230 235 240
Ala Gly Gly Gly Leu Gly Thr Ala Gly Phe Pro Arg Gly Phe Leu Gly
245 250 255
Leu Gly Pro
<210> 368
<211> 903
<212> DNA
<213> Zea mays
<400> 368
atggcggcta cgacgataga ttggcacgcc cgcaacaacg ccgcgcttcc cgccgccatg 60
tatggcgtgg ccgtgccgga cagcaaggag ctcgtgcgcg cgcttgctcc gcccacgcag 120
caggcaccga ccatctcgtt cgcgtacccc cgctccggcg tggagcagca gagcgcggcg 180
ggctcgtttc tgggtgccgg cggtagtggc ctgaccccgg cacagatcct ccaggtgcag 240
tcgcggctcc agttcctgcg ccggccggcg ggggccgcgg tcgccaccca gccgatgaag 300
cggcagggcg tgccgctgcc gcaggcgccg gcggtgtcca agctgtaccg cggcgtccgg 360
cagcggcatt gggggaagtg ggtcgcggag atccgcctgc cacgaaaccg cacccgcctc 420
tggctcggca ccttcgacac cgctgaggag gctgcgctcg cctacgacag cgccgcgttc 480
cgcctccgcg gggactccgc caggctcaac tttcccgagc tcaggcgcgg cggccagcac 540
ctcggcccgc cgctccacgc cgcggtcgac gccaagctcc acgccatctg caacggcacg 600
gacgtcgtcg tgccgctgcc gcagagccgg agcaacgacg ccacggcggc ggcgacggcg 660
acaaccgccc cgagcccctt ctcctcggcg agtccacacg tcaagagcga gccgggctcc 720
tccggctccg atagctcgtt ttccgcagac ggcgacgtgt cctccactgg gtcctccgac 780
gtggtgctgg atatgcaact gctcgacttc tcagaagcgc catgggatga ttctgagagc 840
ttcggccttc gcaaataccc ctccttggag atcgactggg actcgatact actaatttca 900
taa 903
<210> 369
<211> 300
<212> PRT
<213> Zea mays
<400> 369
Met Ala Ala Thr Thr Ile Asp Trp His Ala Arg Asn Asn Ala Ala Leu
1 5 10 15
Pro Ala Ala Met Tyr Gly Val Ala Val Pro Asp Ser Lys Glu Leu Val
20 25 30
Arg Ala Leu Ala Pro Pro Thr Gln Gln Ala Pro Thr Ile Ser Phe Ala
35 40 45
Tyr Pro Arg Ser Gly Val Glu Gln Gln Ser Ala Ala Gly Ser Phe Leu
50 55 60
Gly Ala Gly Gly Ser Gly Leu Thr Pro Ala Gln Ile Leu Gln Val Gln
65 70 75 80
Ser Arg Leu Gln Phe Leu Arg Arg Pro Ala Gly Ala Ala Val Ala Thr
85 90 95
Gln Pro Met Lys Arg Gln Gly Val Pro Leu Pro Gln Ala Pro Ala Val
100 105 110
Ser Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val
115 120 125
Ala Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr
130 135 140
Phe Asp Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Ser Ala Ala Phe
145 150 155 160
Arg Leu Arg Gly Asp Ser Ala Arg Leu Asn Phe Pro Glu Leu Arg Arg
165 170 175
Gly Gly Gln His Leu Gly Pro Pro Leu His Ala Ala Val Asp Ala Lys
180 185 190
Leu His Ala Ile Cys Asn Gly Thr Asp Val Val Val Pro Leu Pro Gln
195 200 205
Ser Arg Ser Asn Asp Ala Thr Ala Ala Ala Thr Ala Thr Thr Ala Pro
210 215 220
Ser Pro Phe Ser Ser Ala Ser Pro His Val Lys Ser Glu Pro Gly Ser
225 230 235 240
Ser Gly Ser Asp Ser Ser Phe Ser Ala Asp Gly Asp Val Ser Ser Thr
245 250 255
Gly Ser Ser Asp Val Val Leu Asp Met Gln Leu Leu Asp Phe Ser Glu
260 265 270
Ala Pro Trp Asp Asp Ser Glu Ser Phe Gly Leu Arg Lys Tyr Pro Ser
275 280 285
Leu Glu Ile Asp Trp Asp Ser Ile Leu Leu Ile Ser
290 295 300
<210> 370
<211> 828
<212> DNA
<213> Zea mays
<400> 370
atgactacgg cggccatgga taggcactgg cgccgccttc aagctactcc gccgccgcta 60
ggcgccgtgc agtactacag agagctaatc cactccctag acaccccggt gcaagctgct 120
ccgatcatgg tggacaccga gccgggccaa gccatggcta tcgtcggcgc cagcagaagc 180
aagtgctacc acctcatcac gccggcgcag gcggcctact actaccgcgt cgtaggcggg 240
cgcctgggat cggcgccgcg cctgatgaag ccgtaccgct gtctgggcgc gccggcaccc 300
tcgacgacga cgacgaagct gtaccgcggc gtgcgtcagc ggcactgggg caagtgggtg 360
gcggagatca ggctgccgcg gaaccggacg cgcctgtggc tcggcacgta cgacaccgcc 420
gaggaggccg cgcttgccta cgacggcgcc gcgttccggc tgcgcggcga tgccgcccgc 480
ctcaacttcc cggagcttcg gctaggcggt acgcaccttg cgccgccgct ccacccgacc 540
gtcgatgcca agctccaagc cgtgacgaca tccgcgccag cggcgcctgc cttgccccga 600
cccgagagcc tggatatcga gagcgagacc tcgacgacca ccacggcaac ggcgtacggc 660
acaggcctct gtccatcatc caccggctca tcgtcgttgg ctaagacggc gccactgccc 720
gatatgcagg agctcgactt ctcggaggtg ccgtgggatg agggcgacgg cgtcgcgctc 780
tgcaagtacc cgtcgttaga aatcgactgg aacgccatcc tctcatga 828
<210> 371
<211> 275
<212> PRT
<213> Zea mays
<400> 371
Met Thr Thr Ala Ala Met Asp Arg His Trp Arg Arg Leu Gln Ala Thr
1 5 10 15
Pro Pro Pro Leu Gly Ala Val Gln Tyr Tyr Arg Glu Leu Ile His Ser
20 25 30
Leu Asp Thr Pro Val Gln Ala Ala Pro Ile Met Val Asp Thr Glu Pro
35 40 45
Gly Gln Ala Met Ala Ile Val Gly Ala Ser Arg Ser Lys Cys Tyr His
50 55 60
Leu Ile Thr Pro Ala Gln Ala Ala Tyr Tyr Tyr Arg Val Val Gly Gly
65 70 75 80
Arg Leu Gly Ser Ala Pro Arg Leu Met Lys Pro Tyr Arg Cys Leu Gly
85 90 95
Ala Pro Ala Pro Ser Thr Thr Thr Thr Lys Leu Tyr Arg Gly Val Arg
100 105 110
Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg Leu Pro Arg Asn
115 120 125
Arg Thr Arg Leu Trp Leu Gly Thr Tyr Asp Thr Ala Glu Glu Ala Ala
130 135 140
Leu Ala Tyr Asp Gly Ala Ala Phe Arg Leu Arg Gly Asp Ala Ala Arg
145 150 155 160
Leu Asn Phe Pro Glu Leu Arg Leu Gly Gly Thr His Leu Ala Pro Pro
165 170 175
Leu His Pro Thr Val Asp Ala Lys Leu Gln Ala Val Thr Thr Ser Ala
180 185 190
Pro Ala Ala Pro Ala Leu Pro Arg Pro Glu Ser Leu Asp Ile Glu Ser
195 200 205
Glu Thr Ser Thr Thr Thr Thr Ala Thr Ala Tyr Gly Thr Gly Leu Cys
210 215 220
Pro Ser Ser Thr Gly Ser Ser Ser Leu Ala Lys Thr Ala Pro Leu Pro
225 230 235 240
Asp Met Gln Glu Leu Asp Phe Ser Glu Val Pro Trp Asp Glu Gly Asp
245 250 255
Gly Val Ala Leu Cys Lys Tyr Pro Ser Leu Glu Ile Asp Trp Asn Ala
260 265 270
Ile Leu Ser
275
<210> 372
<211> 831
<212> DNA
<213> Zea mays
<400> 372
atggccgctg ctataaatct ccccgggccc agcgaggatc tgatgcgagc gatggagtcc 60
ttcatgcaag acgacgcccc atcccctctg gccatgccgc cggcgccgtc tttcccagcg 120
gccgcagccc agtacccggc gacccacctg agcccggcgc agatgcagtt catccaggcc 180
cagctccact tgcagcggaa cccggggctg ggcccgcggg cgcagcccat gaagcccgcc 240
gtcccagtgc cgccggcgcc ggcgccgcag cggcctgtga agctgtaccg cggcgtgcgg 300
cagcgtcact ggggcaagtg ggtggccgag atccggctcc cccggaaccg cacccgcctg 360
tggctcggga ccttcgacac cgccgagcag gcggcgctgg cctacgacca ggcggcgtac 420
cgcctccgcg gggacgcggc gcggctcaac ttccccgaca acgcggagtc cagggcgccg 480
ctcgaccccg ccgtggacgc caagctgcag gccatctgcg ccaccatcgc cgccgcgtcg 540
tcgtcatcca agaattccaa ggccaagagc aaggcgacgc caatcaacgc gtccgttctg 600
gaagcggcag cggcgtctcc gagcaacagc tcctccgacg aaggttccgg ctccgggttc 660
gggtcggacg acgagatgtc ctcgtcctcc ccgacgccgg tggtggcgcc gccggtggcg 720
gacatgggac agctggattt cagcgaggtt ccgtgggacg aggacgagag cttcgtgctc 780
cgcaagtacc cgtcctacga gatcgactgg gacgcgctgc tctccaacta g 831
<210> 373
<211> 276
<212> PRT
<213> Zea mays
<400> 373
Met Ala Ala Ala Ile Asn Leu Pro Gly Pro Ser Glu Asp Leu Met Arg
1 5 10 15
Ala Met Glu Ser Phe Met Gln Asp Asp Ala Pro Ser Pro Leu Ala Met
20 25 30
Pro Pro Ala Pro Ser Phe Pro Ala Ala Ala Ala Gln Tyr Pro Ala Thr
35 40 45
His Leu Ser Pro Ala Gln Met Gln Phe Ile Gln Ala Gln Leu His Leu
50 55 60
Gln Arg Asn Pro Gly Leu Gly Pro Arg Ala Gln Pro Met Lys Pro Ala
65 70 75 80
Val Pro Val Pro Pro Ala Pro Ala Pro Gln Arg Pro Val Lys Leu Tyr
85 90 95
Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu Ile Arg
100 105 110
Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp Thr Ala
115 120 125
Glu Gln Ala Ala Leu Ala Tyr Asp Gln Ala Ala Tyr Arg Leu Arg Gly
130 135 140
Asp Ala Ala Arg Leu Asn Phe Pro Asp Asn Ala Glu Ser Arg Ala Pro
145 150 155 160
Leu Asp Pro Ala Val Asp Ala Lys Leu Gln Ala Ile Cys Ala Thr Ile
165 170 175
Ala Ala Ala Ser Ser Ser Ser Lys Asn Ser Lys Ala Lys Ser Lys Ala
180 185 190
Thr Pro Ile Asn Ala Ser Val Leu Glu Ala Ala Ala Ala Ser Pro Ser
195 200 205
Asn Ser Ser Ser Asp Glu Gly Ser Gly Ser Gly Phe Gly Ser Asp Asp
210 215 220
Glu Met Ser Ser Ser Ser Pro Thr Pro Val Val Ala Pro Pro Val Ala
225 230 235 240
Asp Met Gly Gln Leu Asp Phe Ser Glu Val Pro Trp Asp Glu Asp Glu
245 250 255
Ser Phe Val Leu Arg Lys Tyr Pro Ser Tyr Glu Ile Asp Trp Asp Ala
260 265 270
Leu Leu Ser Asn
275
<210> 374
<211> 789
<212> DNA
<213> Zea mays
<400> 374
atgcgagcga tggagtcctt catgcaagac gacgccccat cccctctggc catgccgccg 60
gcgccgtctt tcccagcggc cgcagcccag tacccggcga cccacctgag cccggcgcag 120
atgcagttca tccaggccca gctccacttg cagcggaacc cggggctggg cccgcgggcg 180
cagcccatga agcccgccgt cccagtgccg ccggcgccgg cgccgcagcg gcctgtgaag 240
ctgtaccgcg gcgtgcggca gcgtcactgg ggcaagtggg tggccgagat ccggctcccc 300
cggaaccgca cccgcctgtg gctcgggacc ttcgacaccg ccgagcaggc ggcgctggcc 360
tacgaccagg cggcgtaccg cctccgcggg gacgcggcgc ggctcaactt ccccgacaac 420
gcggagtcca gggcgccgct cgaccccgcc gtggacgcca agctgcaggc catctgcgcc 480
accatcgccg ccgcgtcgtc gtcatccaag aattccaagg ccaagagcaa ggcgacgcca 540
atcaacgcgt ccgttctgga agcggcagcg gcgtctccga gcaacagctc ctccgacgaa 600
ggttccggct ccgggttcgg gtcggacgac gagatgtcct cgtcctcccc gacgccggtg 660
gtggcgccgc cggtggcgga catgggacag ctggatttca gcgaggttcc gtgggacgag 720
gacgagagct tcgtgctccg caagtacccg tcctacgaga tcgactggga cgcgctgctc 780
tccaactag 789
<210> 375
<211> 262
<212> PRT
<213> Zea mays
<400> 375
Met Arg Ala Met Glu Ser Phe Met Gln Asp Asp Ala Pro Ser Pro Leu
1 5 10 15
Ala Met Pro Pro Ala Pro Ser Phe Pro Ala Ala Ala Ala Gln Tyr Pro
20 25 30
Ala Thr His Leu Ser Pro Ala Gln Met Gln Phe Ile Gln Ala Gln Leu
35 40 45
His Leu Gln Arg Asn Pro Gly Leu Gly Pro Arg Ala Gln Pro Met Lys
50 55 60
Pro Ala Val Pro Val Pro Pro Ala Pro Ala Pro Gln Arg Pro Val Lys
65 70 75 80
Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu
85 90 95
Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp
100 105 110
Thr Ala Glu Gln Ala Ala Leu Ala Tyr Asp Gln Ala Ala Tyr Arg Leu
115 120 125
Arg Gly Asp Ala Ala Arg Leu Asn Phe Pro Asp Asn Ala Glu Ser Arg
130 135 140
Ala Pro Leu Asp Pro Ala Val Asp Ala Lys Leu Gln Ala Ile Cys Ala
145 150 155 160
Thr Ile Ala Ala Ala Ser Ser Ser Ser Lys Asn Ser Lys Ala Lys Ser
165 170 175
Lys Ala Thr Pro Ile Asn Ala Ser Val Leu Glu Ala Ala Ala Ala Ser
180 185 190
Pro Ser Asn Ser Ser Ser Asp Glu Gly Ser Gly Ser Gly Phe Gly Ser
195 200 205
Asp Asp Glu Met Ser Ser Ser Ser Pro Thr Pro Val Val Ala Pro Pro
210 215 220
Val Ala Asp Met Gly Gln Leu Asp Phe Ser Glu Val Pro Trp Asp Glu
225 230 235 240
Asp Glu Ser Phe Val Leu Arg Lys Tyr Pro Ser Tyr Glu Ile Asp Trp
245 250 255
Asp Ala Leu Leu Ser Asn
260
<210> 376
<211> 894
<212> DNA
<213> Zea mays
<400> 376
atggcggcta cgacgataga ttggcacggc cgcaacgccg ccttgtatgg cgtgccggac 60
agcaaggagc tggtgcgcgc gctggctccg cccatgcagc aggccccgac catctcgttc 120
gcgtacccct gcccaggcgt ggagcagcag agccagtgcg cggcggcggg ctcgtttctg 180
ggcgccggcg gcctgacccc ggcgcagctt ctccaggtgc agtcgcggct ccggttcctg 240
cgccggccgg cggcagcggg cggcgccgcg cagccgatga agcggcaggg cgtgccgcag 300
caggctccgc ttcccgcgcg gccggcggtg tccaagctgt accgcggcgt ccggcagcgg 360
cattggggca agtgggtggc ggagatccgc ctgccgcgca accgcacccg cctctggctc 420
ggcaccttcg acaccgccga ggaggccgcg ctcgcctacg acggcgccgc gttccgcctc 480
cgcggggact ccgccaggct caacttcccc gagctcaggc gcggcgggca gcacctcggc 540
ccgccgctcc acgccgcggt cgacgccaag ctccacgcca tctgcagcgg cgcggacgtc 600
ggcgcgccgc tgccgcaggg ccagagccag agccacgcca cggcggcggc gactacagcc 660
accccgagcc ccttctcctc ggtgagccca cacgtcaaga gtgagccggg ctgctccgtc 720
tcagagagct cgttctctgc agacggcgac gtgtcctcca ctgggtcttc cgacgtggtg 780
ccggagatgc agctgctcga cttctcggaa gcgccatggg acgagtcaga cagcttccac 840
cttcgcaagt acccctccct ggagatcgac tgggactcga tactgatttc ataa 894
<210> 377
<211> 297
<212> PRT
<213> Zea mays
<400> 377
Met Ala Ala Thr Thr Ile Asp Trp His Gly Arg Asn Ala Ala Leu Tyr
1 5 10 15
Gly Val Pro Asp Ser Lys Glu Leu Val Arg Ala Leu Ala Pro Pro Met
20 25 30
Gln Gln Ala Pro Thr Ile Ser Phe Ala Tyr Pro Cys Pro Gly Val Glu
35 40 45
Gln Gln Ser Gln Cys Ala Ala Ala Gly Ser Phe Leu Gly Ala Gly Gly
50 55 60
Leu Thr Pro Ala Gln Leu Leu Gln Val Gln Ser Arg Leu Arg Phe Leu
65 70 75 80
Arg Arg Pro Ala Ala Ala Gly Gly Ala Ala Gln Pro Met Lys Arg Gln
85 90 95
Gly Val Pro Gln Gln Ala Pro Leu Pro Ala Arg Pro Ala Val Ser Lys
100 105 110
Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala Glu
115 120 125
Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe Asp
130 135 140
Thr Ala Glu Glu Ala Ala Leu Ala Tyr Asp Gly Ala Ala Phe Arg Leu
145 150 155 160
Arg Gly Asp Ser Ala Arg Leu Asn Phe Pro Glu Leu Arg Arg Gly Gly
165 170 175
Gln His Leu Gly Pro Pro Leu His Ala Ala Val Asp Ala Lys Leu His
180 185 190
Ala Ile Cys Ser Gly Ala Asp Val Gly Ala Pro Leu Pro Gln Gly Gln
195 200 205
Ser Gln Ser His Ala Thr Ala Ala Ala Thr Thr Ala Thr Pro Ser Pro
210 215 220
Phe Ser Ser Val Ser Pro His Val Lys Ser Glu Pro Gly Cys Ser Val
225 230 235 240
Ser Glu Ser Ser Phe Ser Ala Asp Gly Asp Val Ser Ser Thr Gly Ser
245 250 255
Ser Asp Val Val Pro Glu Met Gln Leu Leu Asp Phe Ser Glu Ala Pro
260 265 270
Trp Asp Glu Ser Asp Ser Phe His Leu Arg Lys Tyr Pro Ser Leu Glu
275 280 285
Ile Asp Trp Asp Ser Ile Leu Ile Ser
290 295
<210> 378
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 13
<220>
<221> VARIANT
<222> (22)..(22)
<223> / replace = "Lys"
<220>
<221> VARIANT
<222> (37)..(37)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (41)..(41)
<223> / replace = "Ala"
<220>
<221> VARIANT
<222> (44)..(44)
<223> / replace = "Gln"
<220>
<221> VARIANT
<222> (47)..(47)
<223> / replace = "Phe"
<220>
<221> VARIANT
<222> (48)..(48)
<223> / replace = "Lys"
<400> 378
Lys Leu Tyr Arg Gly Val Arg Gln Arg His Trp Gly Lys Trp Val Ala
1 5 10 15
Glu Ile Arg Leu Pro Arg Asn Arg Thr Arg Leu Trp Leu Gly Thr Phe
20 25 30
Asp Thr Ala Glu Glu Ala Ala Leu Thr Tyr Asp Lys Ala Ala Tyr Arg
35 40 45
Leu Arg
50
<210> 379
<211> 21
<212> PRT
<213> Artificial sequence
<220>
<223> motif 14
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "His" / replace = "Ala"
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Leu" / replace = "Ser"
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Arg" / replace = "Ala"
<220>
<221> VARIANT
<222> (4)..(4)
<223> / replace = "Lys" / replace = "Pro"
<220>
<221> VARIANT
<222> (7)..(7)
<223> / replace = "His"
<220>
<221> VARIANT
<222> (8)..(8)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (9)..(9)
<223> / replace = "Ala" / replace = "Thr"
<220>
<221> VARIANT
<222> (15)..(15)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (19)..(19)
<223> / replace = "Gln"
<220>
<221> VARIANT
<222> (20)..(20)
<223> / replace = "Ser" / replace = "Asn"
<220>
<221> VARIANT
<222> (21)..(21)
<223> / replace = "Leu" / replace = "Met"
<400> 379
Gly Glu Tyr Gly Pro Leu Asp Ala Ser Val Asp Ala Lys Leu Gln Ala
1 5 10 15
Ile Cys Asp Thr Ile
20
<210> 380
<211> 7
<212> PRT
<213> Artificial sequence
<220>
<223> motif 15
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Tyr" / replace = "Val" / replace = "Trp" / replace =
"Leu"
<400> 380
Pro Ser Tyr Glu Ile Asp Trp
1 5
<210> 381
<211> 2194
<212> DNA
<213> Oryza sativa
<400> 381
aatccgaaaa gtttctgcac cgttttcacc ccctaactaa caatataggg aacgtgtgct 60
aaatataaaa tgagacctta tatatgtagc gctgataact agaactatgc aagaaaaact 120
catccaccta ctttagtggc aatcgggcta aataaaaaag agtcgctaca ctagtttcgt 180
tttccttagt aattaagtgg gaaaatgaaa tcattattgc ttagaatata cgttcacatc 240
tctgtcatga agttaaatta ttcgaggtag ccataattgt catcaaactc ttcttgaata 300
aaaaaatctt tctagctgaa ctcaatgggt aaagagagag atttttttta aaaaaataga 360
atgaagatat tctgaacgta ttggcaaaga tttaaacata taattatata attttatagt 420
ttgtgcattc gtcatatcgc acatcattaa ggacatgtct tactccatcc caatttttat 480
ttagtaatta aagacaattg acttattttt attatttatc ttttttcgat tagatgcaag 540
gtacttacgc acacactttg tgctcatgtg catgtgtgag tgcacctcct caatacacgt 600
tcaactagca acacatctct aatatcactc gcctatttaa tacatttagg tagcaatatc 660
tgaattcaag cactccacca tcaccagacc acttttaata atatctaaaa tacaaaaaat 720
aattttacag aatagcatga aaagtatgaa acgaactatt taggtttttc acatacaaaa 780
aaaaaaagaa ttttgctcgt gcgcgagcgc caatctccca tattgggcac acaggcaaca 840
acagagtggc tgcccacaga acaacccaca aaaaacgatg atctaacgga ggacagcaag 900
tccgcaacaa ccttttaaca gcaggctttg cggccaggag agaggaggag aggcaaagaa 960
aaccaagcat cctccttctc ccatctataa attcctcccc ccttttcccc tctctatata 1020
ggaggcatcc aagccaagaa gagggagagc accaaggaca cgcgactagc agaagccgag 1080
cgaccgcctt ctcgatccat atcttccggt cgagttcttg gtcgatctct tccctcctcc 1140
acctcctcct cacagggtat gtgcctccct tcggttgttc ttggatttat tgttctaggt 1200
tgtgtagtac gggcgttgat gttaggaaag gggatctgta tctgtgatga ttcctgttct 1260
tggatttggg atagaggggt tcttgatgtt gcatgttatc ggttcggttt gattagtagt 1320
atggttttca atcgtctgga gagctctatg gaaatgaaat ggtttaggga tcggaatctt 1380
gcgattttgt gagtaccttt tgtttgaggt aaaatcagag caccggtgat tttgcttggt 1440
gtaataaagt acggttgttt ggtcctcgat tctggtagtg atgcttctcg atttgacgaa 1500
gctatccttt gtttattccc tattgaacaa aaataatcca actttgaaga cggtcccgtt 1560
gatgagattg aatgattgat tcttaagcct gtccaaaatt tcgcagctgg cttgtttaga 1620
tacagtagtc cccatcacga aattcatgga aacagttata atcctcagga acaggggatt 1680
ccctgttctt ccgatttgct ttagtcccag aatttttttt cccaaatatc ttaaaaagtc 1740
actttctggt tcagttcaat gaattgattg ctacaaataa tgcttttata gcgttatcct 1800
agctgtagtt cagttaatag gtaatacccc tatagtttag tcaggagaag aacttatccg 1860
atttctgatc tccattttta attatatgaa atgaactgta gcataagcag tattcatttg 1920
gattattttt tttattagct ctcacccctt cattattctg agctgaaagt ctggcatgaa 1980
ctgtcctcaa ttttgttttc aaattcacat cgattatcta tgcattatcc tcttgtatct 2040
acctgtagaa gtttcttttt ggttattcct tgactgcttg attacagaaa gaaatttatg 2100
aagctgtaat cgggatagtt atactgcttg ttcttatgat tcatttcctt tgtgcagttc 2160
ttggtgtagc ttgccacttt caccagcaaa gttc 2194
<210> 382
<211> 1264
<212> DNA
<213> Oryza sativa
<400> 382
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatc 1264
<210> 383
<211> 2454
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette with RCc3 promoter
<400> 383
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatcatttaa atcaactagg gatatcacaa gtttgtacaa aaaagcaggc tatggcagct 1320
gctatagaag gaaatctgat gcgggcgctg ggagaggctc cgtcgccgca gatgcagaag 1380
atcgcgccgc cgccgtttca tcccggcttg ccgccggcgc cggcgaactt ctcctcggcc 1440
ggagtccacg ggttccacta catgggcccg gcccagctca gcccggccca gatccagcgc 1500
gtccaggccc aactccacat gcagcggcag gcccagtcgg ggctcggccc gcgggcccag 1560
cccatgaagc ccgcttcggc ggctgctccg gcggcggcgg cggcgcgggc gcagaagctg 1620
taccgcggcg tgcggcagcg gcactggggc aagtgggtgg cggagatccg gctgccgcgc 1680
aaccgcacca ggctctggct cggcaccttc gacaccgccg aggaggcggc gctcacctac 1740
gaccaggccg cgtaccgcct ccgcggcgac gcggcgcggc tcaacttccc ggacaacgcc 1800
gcgtcgcggg gcccgctcga cgccgccgtg gacgccaagc tccaggccat ctgcgacacc 1860
atcgccgcgt ccaagaacgc ctcatccagg tccaggggcg gcgccggcag ggccatgccc 1920
atcaacgcgc ccctggtcgc cgcggcgtcg tcgtcctccg gctccgacca ctccggcggc 1980
ggcgacgacg gcggctcgga gacgtcgtcg tcgtctgcgg cggcgtcgcc gctggcggag 2040
atggagcagc tggacttcag cgaggtgccg tgggacgagg cggaggggtt cgcgctcacc 2100
aagtacccgt cgtacgagat cgactgggac tcgctgctca acaacaataa ctagacccag 2160
ctttcttgta caaagtggtg atatcacaag cccgggcggt cttctaggga taacagggta 2220
attatatccc tctagatcac aagcccgggc ggtcttctac gatgattgag taataatgtg 2280
tcacgcatca ccatgggtgg cagtgtcagt gtgagcaatg acctgaatga acaattgaaa 2340
tgaaaagaaa aaaagtactc catctgttcc aaattaaaat tggttttaac cttttaatag 2400
gtttatacaa taattgatat atgttttctg tatatgtcta atttgttatc atcc 2454
<210> 384
<211> 2361
<212> DNA
<213> Oryza sativa
<400> 384
atgaacggcg agcttaaact tatggcttcc tatgtgagca agcttaagtt catcttgcaa 60
aaagatcagc agcaggagcc ccatactgcg aaccttctag tcctacttgg gagtagcaat 120
caggacaaaa gaaatggcct ctcacaggga gaaaacagaa tggacacttg taccagaaag 180
aagccaagaa gataccaact cctcaccatg caacaaaaag aaacgcttaa tcgtgcattt 240
caatcatgtc cgaaccctga tagaaatgac ttgaagaagt tggccaagga actaaacatg 300
actgagaccc aaatcaaata ttggttccag aactgcagga caaagatgaa gaaattcaag 360
aacaatgagg agcgcaaact actgcagaag gagaatgagg agctaaagaa ggagaatgca 420
gagttgagaa ataggatgaa gaactcaaca tgccgcgctt gtgacctccc tttgttccat 480
atagattgcc gtcattggga gaatccaatg ctcaacaagg gtaatcatgg cgttacaagt 540
aatctcattc ctcaggcagt gtcatccttg ctccccagct caagtggttt tgtagcttca 600
ggctccaatc ttagtagcaa tgctgtgctc atgcccgtat ctgccatgcc atcatcagtt 660
ttgcagcctg ctccagccgt ctctggtgcc aattttccca tcttgcacaa tctatctgcc 720
aatgcaaatg atggctatac ggaaaaaaac gtacttcttg atctggcgaa ccgtgcaatg 780
gaagagttct ttagtctaat gaaggagaat gagtctcttc ttgtcaaaaa aaaggagaat 840
gggcctctct ggctcccaca catggatatt ctgggagtcg aatcacttaa ctaccaggaa 900
taccttgcaa aatccaggac gattggacaa aaacctgttg acttcaaagt ggtcgtcacc 960
agggacactg ccattgtcaa tggtagctgt gttgacctcg tcaaaagcct tttggatgct 1020
aaccgctgga gagagttgtt tccaggcatc gtggcaagtg caaacaccac caagatcatc 1080
tctactgggc cctctaactt gcacgacggg ttgcttcaat tgatgcgtgc agagctccag 1140
gtaatgtcac ctgaagtccc agtttgcgat gtgacattct tgaggcagag tgtgcagttt 1200
ggaagtggac tgtggtgtgt ggttgatgtg tctattgata ccatccttcc tggagagagt 1260
aaaacagctc agtccagtgt gcagaccagc agtacagctg ccagacgcat ggaagtcagg 1320
ctgttgccat caggctgtgt tattgaagaa atggagaatg gctattccaa ggtgacctgg 1380
atggtgcatg cagcttatga tgagagagca gtgccagtgc tttatcattc acttctccgc 1440
tctgcaaaag cccttggtgc gtgccgctgg gtagcatcac tccagagaca cagccagttc 1500
ctttccggcc tgcacaaata catcttttgt cctgacagca caatgacaga agtggtgatg 1560
cgaagaaaag tcctgtacct ggtgaagcag atgacgagca gcttcacagg cctatttgcg 1620
tcgatgtcta aggccacgct gcaagatggt gatgatactc acttcgcgca tcagatagtt 1680
ggtggtgcaa caggtgaacc tgccggactg ctgctgagcg ccaccacaac catatggctc 1740
cccggcgtga acccgaggca cgtgtatgac cacctgcgtg atgagcagtg ccatggtgaa 1800
tggcgctgcc tcctcggtga gcagctgcat cagggcaatg ccttgccgta tggtgccccc 1860
ctgaatggtg agaccgtgcc agagttctat cgcatggtga acgggctgca tgaagggcat 1920
gctatctccc tgatcagccc cagagaaatg ggtggtaaca taagcaacac tctgctcctg 1980
caagaggcaa gaactgatct ttctggctcc ctcatagttt acgccaggac agatgtgaac 2040
accgtgcatt ccatcatgaa cagtggcctc aaccctgcca ccgtcttcct cgtatcctct 2100
ggatgtgcca ttcttcctga ttgcctggaa tcattccctc tacacccagc tgcaactgca 2160
gatcaggccg gcacctccag tgccgctatc gctagcagga gcgaaaccgg tgggtcattc 2220
gtcaccgtca cttaccagat gtttttcagc agccaaggtg gcgcagcacc tgccagctca 2280
tcaattcatc aaggccgtga tgcgctcaag aaagccaccg acattttcaa ggtggtcctc 2340
gacactctca ccgtggcata g 2361
<210> 385
<211> 786
<212> PRT
<213> Oryza sativa
<400> 385
Met Asn Gly Glu Leu Lys Leu Met Ala Ser Tyr Val Ser Lys Leu Lys
1 5 10 15
Phe Ile Leu Gln Lys Asp Gln Gln Gln Glu Pro His Thr Ala Asn Leu
20 25 30
Leu Val Leu Leu Gly Ser Ser Asn Gln Asp Lys Arg Asn Gly Leu Ser
35 40 45
Gln Gly Glu Asn Arg Met Asp Thr Cys Thr Arg Lys Lys Pro Arg Arg
50 55 60
Tyr Gln Leu Leu Thr Met Gln Gln Lys Glu Thr Leu Asn Arg Ala Phe
65 70 75 80
Gln Ser Cys Pro Asn Pro Asp Arg Asn Asp Leu Lys Lys Leu Ala Lys
85 90 95
Glu Leu Asn Met Thr Glu Thr Gln Ile Lys Tyr Trp Phe Gln Asn Cys
100 105 110
Arg Thr Lys Met Lys Lys Phe Lys Asn Asn Glu Glu Arg Lys Leu Leu
115 120 125
Gln Lys Glu Asn Glu Glu Leu Lys Lys Glu Asn Ala Glu Leu Arg Asn
130 135 140
Arg Met Lys Asn Ser Thr Cys Arg Ala Cys Asp Leu Pro Leu Phe His
145 150 155 160
Ile Asp Cys Arg His Trp Glu Asn Pro Met Leu Asn Lys Gly Asn His
165 170 175
Gly Val Thr Ser Asn Leu Ile Pro Gln Ala Val Ser Ser Leu Leu Pro
180 185 190
Ser Ser Ser Gly Phe Val Ala Ser Gly Ser Asn Leu Ser Ser Asn Ala
195 200 205
Val Leu Met Pro Val Ser Ala Met Pro Ser Ser Val Leu Gln Pro Ala
210 215 220
Pro Ala Val Ser Gly Ala Asn Phe Pro Ile Leu His Asn Leu Ser Ala
225 230 235 240
Asn Ala Asn Asp Gly Tyr Thr Glu Lys Asn Val Leu Leu Asp Leu Ala
245 250 255
Asn Arg Ala Met Glu Glu Phe Phe Ser Leu Met Lys Glu Asn Glu Ser
260 265 270
Leu Leu Val Lys Lys Lys Glu Asn Gly Pro Leu Trp Leu Pro His Met
275 280 285
Asp Ile Leu Gly Val Glu Ser Leu Asn Tyr Gln Glu Tyr Leu Ala Lys
290 295 300
Ser Arg Thr Ile Gly Gln Lys Pro Val Asp Phe Lys Val Val Val Thr
305 310 315 320
Arg Asp Thr Ala Ile Val Asn Gly Ser Cys Val Asp Leu Val Lys Ser
325 330 335
Leu Leu Asp Ala Asn Arg Trp Arg Glu Leu Phe Pro Gly Ile Val Ala
340 345 350
Ser Ala Asn Thr Thr Lys Ile Ile Ser Thr Gly Pro Ser Asn Leu His
355 360 365
Asp Gly Leu Leu Gln Leu Met Arg Ala Glu Leu Gln Val Met Ser Pro
370 375 380
Glu Val Pro Val Cys Asp Val Thr Phe Leu Arg Gln Ser Val Gln Phe
385 390 395 400
Gly Ser Gly Leu Trp Cys Val Val Asp Val Ser Ile Asp Thr Ile Leu
405 410 415
Pro Gly Glu Ser Lys Thr Ala Gln Ser Ser Val Gln Thr Ser Ser Thr
420 425 430
Ala Ala Arg Arg Met Glu Val Arg Leu Leu Pro Ser Gly Cys Val Ile
435 440 445
Glu Glu Met Glu Asn Gly Tyr Ser Lys Val Thr Trp Met Val His Ala
450 455 460
Ala Tyr Asp Glu Arg Ala Val Pro Val Leu Tyr His Ser Leu Leu Arg
465 470 475 480
Ser Ala Lys Ala Leu Gly Ala Cys Arg Trp Val Ala Ser Leu Gln Arg
485 490 495
His Ser Gln Phe Leu Ser Gly Leu His Lys Tyr Ile Phe Cys Pro Asp
500 505 510
Ser Thr Met Thr Glu Val Val Met Arg Arg Lys Val Leu Tyr Leu Val
515 520 525
Lys Gln Met Thr Ser Ser Phe Thr Gly Leu Phe Ala Ser Met Ser Lys
530 535 540
Ala Thr Leu Gln Asp Gly Asp Asp Thr His Phe Ala His Gln Ile Val
545 550 555 560
Gly Gly Ala Thr Gly Glu Pro Ala Gly Leu Leu Leu Ser Ala Thr Thr
565 570 575
Thr Ile Trp Leu Pro Gly Val Asn Pro Arg His Val Tyr Asp His Leu
580 585 590
Arg Asp Glu Gln Cys His Gly Glu Trp Arg Cys Leu Leu Gly Glu Gln
595 600 605
Leu His Gln Gly Asn Ala Leu Pro Tyr Gly Ala Pro Leu Asn Gly Glu
610 615 620
Thr Val Pro Glu Phe Tyr Arg Met Val Asn Gly Leu His Glu Gly His
625 630 635 640
Ala Ile Ser Leu Ile Ser Pro Arg Glu Met Gly Gly Asn Ile Ser Asn
645 650 655
Thr Leu Leu Leu Gln Glu Ala Arg Thr Asp Leu Ser Gly Ser Leu Ile
660 665 670
Val Tyr Ala Arg Thr Asp Val Asn Thr Val His Ser Ile Met Asn Ser
675 680 685
Gly Leu Asn Pro Ala Thr Val Phe Leu Val Ser Ser Gly Cys Ala Ile
690 695 700
Leu Pro Asp Cys Leu Glu Ser Phe Pro Leu His Pro Ala Ala Thr Ala
705 710 715 720
Asp Gln Ala Gly Thr Ser Ser Ala Ala Ile Ala Ser Arg Ser Glu Thr
725 730 735
Gly Gly Ser Phe Val Thr Val Thr Tyr Gln Met Phe Phe Ser Ser Gln
740 745 750
Gly Gly Ala Ala Pro Ala Ser Ser Ser Ile His Gln Gly Arg Asp Ala
755 760 765
Leu Lys Lys Ala Thr Asp Ile Phe Lys Val Val Leu Asp Thr Leu Thr
770 775 780
Val Ala
785
<210> 386
<211> 1834
<212> DNA
<213> Medicago truncatula
<400> 386
atgcaacgag caagtgacct tcctgcagtc tcaatattta ttgcgaataa aatcattgat 60
cgtgcacgtt cagctatgaa cgaactgtgc aaaataggaa ttgcagaaaa caatgtatgg 120
catcaacata gggaacatag gtacgaaatt ctcgatgatt ttgaatattt gaaacaattt 180
ggctgtgttg atgcaacatt attggagatt gttaagttgg ttgaagttgg agagcttcaa 240
actttaccta gttttgattt gtgtcgaaac caaaattcaa tgtatacaat ggaagttttt 300
gaacaaggtt tgcagattga agcttctcgg gacaaggcat tgattaagat aagtccaact 360
aaactagttg aattacttat ggatgtgaat caatggtcga cggcatttta caacattgtc 420
tcaggagcaa ggattctagg aagcatagaa ggaagctatg atgaaaaaat gcatgtgatg 480
agtgcagaat ttcatttacc aagtcctgtt ataccaactc ggaagtgtgt ttttgcaaga 540
tatagcaaac aattcactca taacatatgg gctgttgttg atgtatcttt ggaggacatt 600
ttacaatctc cttctaacaa ttttcataaa agaccttctg gctgtttgat tgaaggaatg 660
cccgatggaa actccaaggt tatatggttg gagcacgtgg aagcagacta tagtaaattg 720
agtgatcttt ttaggccatt agttacctca gctttggctt ttggtgcaac acgttggcta 780
acttccattg tccgatacat tgagtggtct gaaacactga aggctccaaa acttattgca 840
gatgctggag ttcttatacc acaaattggg aggacaagtt tcttgaaatt ggccgataga 900
atgatgagaa gattctgtgc caatcttggt tccaccacta agaatccatg gattcgacta 960
gctcctcttc ctgctggttc agcagatatt agagttatga ttgcaaatga tatggctggt 1020
agtacaaatg agcctattgg aacatcactg tttttttgta ctactctttg gcttaatgtc 1080
tccccaaatc gattattcaa cttccttcgg catgagaaat ccagaagcaa gtgggataaa 1140
cattcacaaa acctttctat tcgagaattc gcatgcattc tcaccggcaa acatccagag 1200
aatcgtgttt ctttgcttag agcaagggac aagaatgaaa tattttacct acaagagagt 1260
tacaaagata caacagcttc ctacgtgatt tattgtcctt tagacgagca aaagttgaca 1320
catcttgcaa ctggatcgaa cccagacgat gtagttgctt ttccatcagg gtttgctatt 1380
atcccaggag ggttaccaag agatggtgat aaaggaaaag gaaatgccaa cagtactgct 1440
aacgatgaaa gtcttctaac tatctcattt catatcattg gtaaagccaa caatgctgca 1500
tcaatccctc cggaatcagt tcaaaccatc tataacatgg ttacagaaac aatggctgct 1560
ataaaagatg cagtgtcgta tcatagtcga ctcaacaact gggatcaaga tgaagtggca 1620
aatagcttgg cagcatagta gtttagaaca atatatacat tctccctcat ttttttgttg 1680
tcccttgcta aagtcataaa tattgtgctg gatttcatac aaattttacg accatatgat 1740
tgttgatatt aatgtattta ttttatatgt ggaataaaca attaatttcc ttgttaaact 1800
atgttttgtt aactatgcat aggttgaatt gttg 1834
<210> 387
<211> 545
<212> PRT
<213> Medicago truncatula
<400> 387
Met Gln Arg Ala Ser Asp Leu Pro Ala Val Ser Ile Phe Ile Ala Asn
1 5 10 15
Lys Ile Ile Asp Arg Ala Arg Ser Ala Met Asn Glu Leu Cys Lys Ile
20 25 30
Gly Ile Ala Glu Asn Asn Val Trp His Gln His Arg Glu His Arg Tyr
35 40 45
Glu Ile Leu Asp Asp Phe Glu Tyr Leu Lys Gln Phe Gly Cys Val Asp
50 55 60
Ala Thr Leu Leu Glu Ile Val Lys Leu Val Glu Val Gly Glu Leu Gln
65 70 75 80
Thr Leu Pro Ser Phe Asp Leu Cys Arg Asn Gln Asn Ser Met Tyr Thr
85 90 95
Met Glu Val Phe Glu Gln Gly Leu Gln Ile Glu Ala Ser Arg Asp Lys
100 105 110
Ala Leu Ile Lys Ile Ser Pro Thr Lys Leu Val Glu Leu Leu Met Asp
115 120 125
Val Asn Gln Trp Ser Thr Ala Phe Tyr Asn Ile Val Ser Gly Ala Arg
130 135 140
Ile Leu Gly Ser Ile Glu Gly Ser Tyr Asp Glu Lys Met His Val Met
145 150 155 160
Ser Ala Glu Phe His Leu Pro Ser Pro Val Ile Pro Thr Arg Lys Cys
165 170 175
Val Phe Ala Arg Tyr Ser Lys Gln Phe Thr His Asn Ile Trp Ala Val
180 185 190
Val Asp Val Ser Leu Glu Asp Ile Leu Gln Ser Pro Ser Asn Asn Phe
195 200 205
His Lys Arg Pro Ser Gly Cys Leu Ile Glu Gly Met Pro Asp Gly Asn
210 215 220
Ser Lys Val Ile Trp Leu Glu His Val Glu Ala Asp Tyr Ser Lys Leu
225 230 235 240
Ser Asp Leu Phe Arg Pro Leu Val Thr Ser Ala Leu Ala Phe Gly Ala
245 250 255
Thr Arg Trp Leu Thr Ser Ile Val Arg Tyr Ile Glu Trp Ser Glu Thr
260 265 270
Leu Lys Ala Pro Lys Leu Ile Ala Asp Ala Gly Val Leu Ile Pro Gln
275 280 285
Ile Gly Arg Thr Ser Phe Leu Lys Leu Ala Asp Arg Met Met Arg Arg
290 295 300
Phe Cys Ala Asn Leu Gly Ser Thr Thr Lys Asn Pro Trp Ile Arg Leu
305 310 315 320
Ala Pro Leu Pro Ala Gly Ser Ala Asp Ile Arg Val Met Ile Ala Asn
325 330 335
Asp Met Ala Gly Ser Thr Asn Glu Pro Ile Gly Thr Ser Leu Phe Phe
340 345 350
Cys Thr Thr Leu Trp Leu Asn Val Ser Pro Asn Arg Leu Phe Asn Phe
355 360 365
Leu Arg His Glu Lys Ser Arg Ser Lys Trp Asp Lys His Ser Gln Asn
370 375 380
Leu Ser Ile Arg Glu Phe Ala Cys Ile Leu Thr Gly Lys His Pro Glu
385 390 395 400
Asn Arg Val Ser Leu Leu Arg Ala Arg Asp Lys Asn Glu Ile Phe Tyr
405 410 415
Leu Gln Glu Ser Tyr Lys Asp Thr Thr Ala Ser Tyr Val Ile Tyr Cys
420 425 430
Pro Leu Asp Glu Gln Lys Leu Thr His Leu Ala Thr Gly Ser Asn Pro
435 440 445
Asp Asp Val Val Ala Phe Pro Ser Gly Phe Ala Ile Ile Pro Gly Gly
450 455 460
Leu Pro Arg Asp Gly Asp Lys Gly Lys Gly Asn Ala Asn Ser Thr Ala
465 470 475 480
Asn Asp Glu Ser Leu Leu Thr Ile Ser Phe His Ile Ile Gly Lys Ala
485 490 495
Asn Asn Ala Ala Ser Ile Pro Pro Glu Ser Val Gln Thr Ile Tyr Asn
500 505 510
Met Val Thr Glu Thr Met Ala Ala Ile Lys Asp Ala Val Ser Tyr His
515 520 525
Ser Arg Leu Asn Asn Trp Asp Gln Asp Glu Val Ala Asn Ser Leu Ala
530 535 540
Ala
545
<210> 388
<211> 2049
<212> DNA
<213> Arabidopsis thaliana
<400> 388
atgaatggcg atcttgaagt tgatatgtct agaggagatt tcaatccaag tttttttctt 60
ggaaagctta aagacgatga gtttgagagt agatcattga gtgatgatag ctttgatgca 120
atgtctggtg atgaggataa acaagaacaa cgccctaaga agaagaagag gaagacaaag 180
tatcatagac acacttctta ccagattcaa gaactcgaat ctttcttcaa agagtgtcct 240
catcctaatg agaagcaaag gttggaactt ggcaaaaaac ttactttgga gagtaagcaa 300
attaagtttt ggtttcagaa cagaagaaca caaatgaaga cgcaactaga gcggcatgag 360
aatgtgattc tcaaacaaga gaatgaaaaa ctgcggctag aaaacagttt ccttaaagag 420
tcaatgagag gctctctatg tattgattgt ggtggagcag ttatacctgg tgaggtttct 480
tttgagcagc accaacttag gattgagaat gctaagctta aggaagagct tgataggatt 540
tgtgctttag caaatagatt cattggtggg tctatttcac ttgagcagcc ttcaaatggt 600
gggattggct cacagcattt gcctatagga cattgtgtca gtggtggaac ttcactgatg 660
tttatggatc ttgccatgga agccatggat gagttgttga agttagcaga attggaaact 720
tctttatgga gttcaaagag tgagaaagga tcgatgaacc atttccctgg ttcaagagaa 780
actggtttag tacttatcaa tagcttggct ctagtcgaga ctcttatgga cacgaacaaa 840
tgggcagaaa tgtttgagtg catagtcgcg gttgcatcaa cccttgaagt gatatccaac 900
ggtagtgatg gatcaagaaa cggctctatt ctattgatgc aagcagagtt tcaagtgatg 960
tctccattag ttccaatcaa acaaaagaag tttcttagat attgcaagca acatggagat 1020
ggtttatggg cggtcgtcga tgtttcttat gatataaaca gaggaaatga gaacttgaag 1080
tcttatggtg gctctaaaat gtttccttca ggatgcatta tacaagacat aggcaacggc 1140
tgctccaagg tgacatggat agaacattca gagtacgaag agagtcacac ccactcactt 1200
taccaaccgt tgctcagttc ttcggttggg ttaggcgcaa ccaaatggct tgcgactctg 1260
cagaggcaat gcgagagctt cacaatgctt ttgtcttctg aagatcacac aggtttgtca 1320
catgctggaa caaagagtat actaaagcta gcgcagcgta tgaagctcaa cttttactcg 1380
ggaataactg cttcgtgcat tcacaaatgg gagaagcttc ttgctgagaa cgtgggacag 1440
gacacaagga tactgacaag gaagagtctt gagccgtctg gtattgtcct gagcgctgcg 1500
acatctctgt ggctaccagt gactcagcag agactctttg agtttctgtg tgatggtaaa 1560
tgcagaaacc agtgggatat tttgtctaat ggtgcttcaa tggaaaacac acttctcgtc 1620
ccaaaaggac aacaggaagg aagctgcgtc tctcttcttc gtgctgctgg gaatgatcaa 1680
aatgagagta gtatgctcat cttgcaagag acatggaatg acgtttctgg tgcactggtg 1740
gtttacgcgc ctgttgatat tccatctatg aatactgtaa tgagcggtgg agattcagct 1800
tatgtggcgc ttcttccatc ggggttctcg atattgcctg acggatcatc atcatcgtct 1860
gatcagttcg ataccgatgg cggtttggtg aatcaagaaa gcaaaggatg tctcctgact 1920
gtaggatttc agatcttagt gaacagccta ccgactgcaa aactcaacgt ggaatctgtt 1980
gaaactgtta acaacctcat cgcttgcacc attcacaaga tcagagccgc tcttcgtata 2040
cctgcttag 2049
<210> 389
<211> 682
<212> PRT
<213> Arabidopsis thaliana
<400> 389
Met Asn Gly Asp Leu Glu Val Asp Met Ser Arg Gly Asp Phe Asn Pro
1 5 10 15
Ser Phe Phe Leu Gly Lys Leu Lys Asp Asp Glu Phe Glu Ser Arg Ser
20 25 30
Leu Ser Asp Asp Ser Phe Asp Ala Met Ser Gly Asp Glu Asp Lys Gln
35 40 45
Glu Gln Arg Pro Lys Lys Lys Lys Arg Lys Thr Lys Tyr His Arg His
50 55 60
Thr Ser Tyr Gln Ile Gln Glu Leu Glu Ser Phe Phe Lys Glu Cys Pro
65 70 75 80
His Pro Asn Glu Lys Gln Arg Leu Glu Leu Gly Lys Lys Leu Thr Leu
85 90 95
Glu Ser Lys Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met
100 105 110
Lys Thr Gln Leu Glu Arg His Glu Asn Val Ile Leu Lys Gln Glu Asn
115 120 125
Glu Lys Leu Arg Leu Glu Asn Ser Phe Leu Lys Glu Ser Met Arg Gly
130 135 140
Ser Leu Cys Ile Asp Cys Gly Gly Ala Val Ile Pro Gly Glu Val Ser
145 150 155 160
Phe Glu Gln His Gln Leu Arg Ile Glu Asn Ala Lys Leu Lys Glu Glu
165 170 175
Leu Asp Arg Ile Cys Ala Leu Ala Asn Arg Phe Ile Gly Gly Ser Ile
180 185 190
Ser Leu Glu Gln Pro Ser Asn Gly Gly Ile Gly Ser Gln His Leu Pro
195 200 205
Ile Gly His Cys Val Ser Gly Gly Thr Ser Leu Met Phe Met Asp Leu
210 215 220
Ala Met Glu Ala Met Asp Glu Leu Leu Lys Leu Ala Glu Leu Glu Thr
225 230 235 240
Ser Leu Trp Ser Ser Lys Ser Glu Lys Gly Ser Met Asn His Phe Pro
245 250 255
Gly Ser Arg Glu Thr Gly Leu Val Leu Ile Asn Ser Leu Ala Leu Val
260 265 270
Glu Thr Leu Met Asp Thr Asn Lys Trp Ala Glu Met Phe Glu Cys Ile
275 280 285
Val Ala Val Ala Ser Thr Leu Glu Val Ile Ser Asn Gly Ser Asp Gly
290 295 300
Ser Arg Asn Gly Ser Ile Leu Leu Met Gln Ala Glu Phe Gln Val Met
305 310 315 320
Ser Pro Leu Val Pro Ile Lys Gln Lys Lys Phe Leu Arg Tyr Cys Lys
325 330 335
Gln His Gly Asp Gly Leu Trp Ala Val Val Asp Val Ser Tyr Asp Ile
340 345 350
Asn Arg Gly Asn Glu Asn Leu Lys Ser Tyr Gly Gly Ser Lys Met Phe
355 360 365
Pro Ser Gly Cys Ile Ile Gln Asp Ile Gly Asn Gly Cys Ser Lys Val
370 375 380
Thr Trp Ile Glu His Ser Glu Tyr Glu Glu Ser His Thr His Ser Leu
385 390 395 400
Tyr Gln Pro Leu Leu Ser Ser Ser Val Gly Leu Gly Ala Thr Lys Trp
405 410 415
Leu Ala Thr Leu Gln Arg Gln Cys Glu Ser Phe Thr Met Leu Leu Ser
420 425 430
Ser Glu Asp His Thr Gly Leu Ser His Ala Gly Thr Lys Ser Ile Leu
435 440 445
Lys Leu Ala Gln Arg Met Lys Leu Asn Phe Tyr Ser Gly Ile Thr Ala
450 455 460
Ser Cys Ile His Lys Trp Glu Lys Leu Leu Ala Glu Asn Val Gly Gln
465 470 475 480
Asp Thr Arg Ile Leu Thr Arg Lys Ser Leu Glu Pro Ser Gly Ile Val
485 490 495
Leu Ser Ala Ala Thr Ser Leu Trp Leu Pro Val Thr Gln Gln Arg Leu
500 505 510
Phe Glu Phe Leu Cys Asp Gly Lys Cys Arg Asn Gln Trp Asp Ile Leu
515 520 525
Ser Asn Gly Ala Ser Met Glu Asn Thr Leu Leu Val Pro Lys Gly Gln
530 535 540
Gln Glu Gly Ser Cys Val Ser Leu Leu Arg Ala Ala Gly Asn Asp Gln
545 550 555 560
Asn Glu Ser Ser Met Leu Ile Leu Gln Glu Thr Trp Asn Asp Val Ser
565 570 575
Gly Ala Leu Val Val Tyr Ala Pro Val Asp Ile Pro Ser Met Asn Thr
580 585 590
Val Met Ser Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly
595 600 605
Phe Ser Ile Leu Pro Asp Gly Ser Ser Ser Ser Ser Asp Gln Phe Asp
610 615 620
Thr Asp Gly Gly Leu Val Asn Gln Glu Ser Lys Gly Cys Leu Leu Thr
625 630 635 640
Val Gly Phe Gln Ile Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Asn
645 650 655
Val Glu Ser Val Glu Thr Val Asn Asn Leu Ile Ala Cys Thr Ile His
660 665 670
Lys Ile Arg Ala Ala Leu Arg Ile Pro Ala
675 680
<210> 390
<211> 2232
<212> DNA
<213> Arabidopsis thaliana
<400> 390
atgtaccatc caaacatgtt tgagagccat catatgttcg atatgacccc aaagagtacc 60
tctgataacg acttgggaat caccggtagc cgagaagatg actttgagac caagtcaggt 120
accgaagtca ctactgagaa tccttctggt gaagagcttc aagatcctag ccaacgtccc 180
aacaaaaaga agcgttacca tcgccacacg caacgccaaa ttcaagagct cgaatcattc 240
tttaaggaat gtcctcatcc agatgataag caacgaaaag agttgagccg tgatctcaat 300
ttagagcctc ttcaagttaa gttttggttc caaaacaaac gcacacagat gaaggcacaa 360
agtgagaggc atgagaacca gattctaaag tcagacaatg acaagctcag agcagagaac 420
aatagataca aagaagctct aagcaatgct acatgcccta actgtggcgg tccagctgct 480
attggagaaa tgtcttttga cgaacaacat ctcaggatcg aaaatgctcg gctccgcgaa 540
gagattgata ggatctctgc tattgctgcg aaatacgttg ggaagccgtt aggatcgtct 600
ttcgctccac tagcgatcca cgcgccttct cgttcgcttg atcttgaagt tggaaacttt 660
gggaaccaga caggctttgt aggagaaatg tatggaacag gggacatttt gaggtcagtt 720
tcgattcctt ctgagactga taagcctata atcgtggagc tagcggttgc agctatggag 780
gaactcgtga gaatggctca aactggagat cctttatggc tttcaaccga taattcagtc 840
gagattctca acgaagaaga gtatttcaga acgtttccga gaggaattgg accaaagcca 900
ttaggattaa gatcagaggc gtcaagacaa tctgcagttg ttataatgaa tcacatcaat 960
ctcgttgaga ttctcatgga tgtgaatcaa tggtcttgtg ttttctctgg gattgtgtca 1020
agagccttga cacttgaagt tctttcaact ggagttgctg ggaactacaa cggtgcttta 1080
caagtgatga cagctgagtt tcaagttcca tcacccctag tcccaacgcg tgagaactac 1140
tttgtgagat actgcaaaca acacagtgac ggctcttggg ctgtggttga tgtctctttg 1200
gacagcctta gaccaagtac tccaatctta agaactagaa gaaggccttc aggttgtctg 1260
attcaagaat tgcctaatgg ttattctaag gttacatgga tagagcatat ggaggtagat 1320
gatagatcag ttcacaacat gtataaaccg ttggttcagt ccggtttagc tttcggtgcg 1380
aaacgttggg tggctacact cgaacgacaa tgcgagcggc ttgctagctc catggccagc 1440
aacattcctg gtgatctttc cgtgataacg agtcctgaag gaaggaagag tatgttgaag 1500
ctagctgaga gaatggttat gagtttctgc agtggtgttg gcgcgtcgac tgcacacgct 1560
tggacaacaa tgtcgacaac aggatccgat gatgttcggg tcatgacccg caagagtatg 1620
gatgatccag gaagacctcc gggtattgtt cttagtgcag ctacttcatt ctggatccca 1680
gttgctccca aacgtgtttt tgatttcctc cgtgacgaaa attcaagaaa agagtgggat 1740
attctgtcaa atggaggtat ggttcaggaa atggctcata tagccaatgg tcatgaacct 1800
ggaaactgtg tctccttgct ccgagtcaat agtggaaact cgagccagag caacatgttg 1860
attctacaag agagctgtac agatgcatca ggatcgtatg tgatttacgc gccagtggat 1920
atagtggcga tgaatgtggt tctaagcggt ggagatcctg attacgtggc gttgttgccg 1980
tctggttttg ctattttacc ggatggttcg gttggaggag gagatgggaa tcagcatcag 2040
gaaatggttt ctactacttc ttctgggagt tgtggtggtt cgcttttaac cgttgcgttt 2100
cagattcttg ttgactctgt tcctacagct aaactctcac ttggctcggt ggctacggtt 2160
aatagtctga tcaaatgtac ggtggagagg attaaagctg ctgtttcttg tgatgttgga 2220
ggaggagcgt ag 2232
<210> 391
<211> 743
<212> PRT
<213> Arabidopsis thaliana
<400> 391
Met Tyr His Pro Asn Met Phe Glu Ser His His Met Phe Asp Met Thr
1 5 10 15
Pro Lys Ser Thr Ser Asp Asn Asp Leu Gly Ile Thr Gly Ser Arg Glu
20 25 30
Asp Asp Phe Glu Thr Lys Ser Gly Thr Glu Val Thr Thr Glu Asn Pro
35 40 45
Ser Gly Glu Glu Leu Gln Asp Pro Ser Gln Arg Pro Asn Lys Lys Lys
50 55 60
Arg Tyr His Arg His Thr Gln Arg Gln Ile Gln Glu Leu Glu Ser Phe
65 70 75 80
Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser
85 90 95
Arg Asp Leu Asn Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn
100 105 110
Lys Arg Thr Gln Met Lys Ala Gln Ser Glu Arg His Glu Asn Gln Ile
115 120 125
Leu Lys Ser Asp Asn Asp Lys Leu Arg Ala Glu Asn Asn Arg Tyr Lys
130 135 140
Glu Ala Leu Ser Asn Ala Thr Cys Pro Asn Cys Gly Gly Pro Ala Ala
145 150 155 160
Ile Gly Glu Met Ser Phe Asp Glu Gln His Leu Arg Ile Glu Asn Ala
165 170 175
Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr
180 185 190
Val Gly Lys Pro Leu Gly Ser Ser Phe Ala Pro Leu Ala Ile His Ala
195 200 205
Pro Ser Arg Ser Leu Asp Leu Glu Val Gly Asn Phe Gly Asn Gln Thr
210 215 220
Gly Phe Val Gly Glu Met Tyr Gly Thr Gly Asp Ile Leu Arg Ser Val
225 230 235 240
Ser Ile Pro Ser Glu Thr Asp Lys Pro Ile Ile Val Glu Leu Ala Val
245 250 255
Ala Ala Met Glu Glu Leu Val Arg Met Ala Gln Thr Gly Asp Pro Leu
260 265 270
Trp Leu Ser Thr Asp Asn Ser Val Glu Ile Leu Asn Glu Glu Glu Tyr
275 280 285
Phe Arg Thr Phe Pro Arg Gly Ile Gly Pro Lys Pro Leu Gly Leu Arg
290 295 300
Ser Glu Ala Ser Arg Gln Ser Ala Val Val Ile Met Asn His Ile Asn
305 310 315 320
Leu Val Glu Ile Leu Met Asp Val Asn Gln Trp Ser Cys Val Phe Ser
325 330 335
Gly Ile Val Ser Arg Ala Leu Thr Leu Glu Val Leu Ser Thr Gly Val
340 345 350
Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Thr Ala Glu Phe Gln
355 360 365
Val Pro Ser Pro Leu Val Pro Thr Arg Glu Asn Tyr Phe Val Arg Tyr
370 375 380
Cys Lys Gln His Ser Asp Gly Ser Trp Ala Val Val Asp Val Ser Leu
385 390 395 400
Asp Ser Leu Arg Pro Ser Thr Pro Ile Leu Arg Thr Arg Arg Arg Pro
405 410 415
Ser Gly Cys Leu Ile Gln Glu Leu Pro Asn Gly Tyr Ser Lys Val Thr
420 425 430
Trp Ile Glu His Met Glu Val Asp Asp Arg Ser Val His Asn Met Tyr
435 440 445
Lys Pro Leu Val Gln Ser Gly Leu Ala Phe Gly Ala Lys Arg Trp Val
450 455 460
Ala Thr Leu Glu Arg Gln Cys Glu Arg Leu Ala Ser Ser Met Ala Ser
465 470 475 480
Asn Ile Pro Gly Asp Leu Ser Val Ile Thr Ser Pro Glu Gly Arg Lys
485 490 495
Ser Met Leu Lys Leu Ala Glu Arg Met Val Met Ser Phe Cys Ser Gly
500 505 510
Val Gly Ala Ser Thr Ala His Ala Trp Thr Thr Met Ser Thr Thr Gly
515 520 525
Ser Asp Asp Val Arg Val Met Thr Arg Lys Ser Met Asp Asp Pro Gly
530 535 540
Arg Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Ile Pro
545 550 555 560
Val Ala Pro Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Asn Ser Arg
565 570 575
Lys Glu Trp Asp Ile Leu Ser Asn Gly Gly Met Val Gln Glu Met Ala
580 585 590
His Ile Ala Asn Gly His Glu Pro Gly Asn Cys Val Ser Leu Leu Arg
595 600 605
Val Asn Ser Gly Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln Glu
610 615 620
Ser Cys Thr Asp Ala Ser Gly Ser Tyr Val Ile Tyr Ala Pro Val Asp
625 630 635 640
Ile Val Ala Met Asn Val Val Leu Ser Gly Gly Asp Pro Asp Tyr Val
645 650 655
Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Ser Val Gly
660 665 670
Gly Gly Asp Gly Asn Gln His Gln Glu Met Val Ser Thr Thr Ser Ser
675 680 685
Gly Ser Cys Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val
690 695 700
Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val
705 710 715 720
Asn Ser Leu Ile Lys Cys Thr Val Glu Arg Ile Lys Ala Ala Val Ser
725 730 735
Cys Asp Val Gly Gly Gly Ala
740
<210> 392
<211> 1713
<212> DNA
<213> Arabidopsis thaliana
<400> 392
atgaacttcg gtagtctctt cgataacaca cccggtggtg gctctaccgg agcaagactt 60
ctctccggtt taagttatgg caaccacacc gccgcaacta acgtcttacc cggtggtgct 120
atggctcaag cggcagcggc tgctagtctc ttctctcctc ctctaacgaa atctgtttac 180
gcttcttctg gcctctctct agccctcgag caaccggaga gaggaaccaa ccgtggagaa 240
gcatcgatga ggaacaataa taacgtcgga ggaggaggcg atactttcga tgggagtgtg 300
aacagaagaa gccgagaaga agaacatgag agtagatctg gtagtgataa cgttgaaggt 360
atctccggtg aagatcaaga cgctgctgat aagcctcctc ggaagaaacg ttatcaccga 420
cacactcctc aacaaatcca agaactcgaa tctatgttca aagagtgtcc gcatccagac 480
gagaaacaaa gattagaact aagtaagaga ctttgcttag agacaagaca agtcaagttc 540
tggttccaga atcgtcgcac tcagatgaag actcaattag agaggcatga gaacgcgtta 600
ttgagacaag agaacgataa gttaagagct gagaacatgt ctattcgtga agcaatgagg 660
aatccaatct gcaccaattg tggtggacct gccatgcttg gtgatgtctc tcttgaagaa 720
catcatctcc gtatcgaaaa cgctcgttta aaagacgagc ttgatcgtgt ctgtaacctc 780
accggtaagt tccttggcca ccaccataat caccactaca actcctcctt agaactcgct 840
gtcggcacca acaacaacgg tggacatttc gctttccctc ctgatttcgg cggtggtggt 900
ggttgcttac ctccgcagca gcagcagtcg acggtgatta atgggattga tcagaagtca 960
gttttgctgg agctggcttt aactgctatg gatgagttag tgaagcttgc tcagagtgaa 1020
gaaccgttat gggtcaaaag cttggacggt gagagagacg agcttaacca agatgagtac 1080
atgagaacat tttcatctac taaaccaacc ggtttagcta ctgaagcttc tagaacctct 1140
ggtatggtca tcatcaatag cttagctctc gtcgagactt taatggactc caatcggtgg 1200
acggagatgt tcccgtgtaa cgtcgcaaga gctacaacca ccgacgttat atccggtggg 1260
atggctggaa caataaatgg tgcacttcaa ctgatgaatg cagagctaca agttttgtct 1320
ccactggttc cggttcgtaa tgttaatttc ctccggttct gcaaacagca cgcggagggt 1380
gtgtgggcgg tggtggatgt atcaattgat cctgtcaggg aaaactctgg tggtgccccg 1440
gtaatccggc gactaccatc aggatgtgtg gtgcaggatg tgtctaatgg atactctaag 1500
gtcacgtggg tggagcatgc agaatacgac gagaaccaaa tccaccagct gtacaggccg 1560
ttgctacggt caggccttgg ttttggctct caaagatggc tcgctacact tcagagacag 1620
tgcgagtgtc tcgccatcct catttcttcc tccgttacat ctcacgacaa cacatgtccg 1680
tttcttacac acttgtcatt atgcttaaca taa 1713
<210> 393
<211> 570
<212> PRT
<213> Arabidopsis thaliana
<400> 393
Met Asn Phe Gly Ser Leu Phe Asp Asn Thr Pro Gly Gly Gly Ser Thr
1 5 10 15
Gly Ala Arg Leu Leu Ser Gly Leu Ser Tyr Gly Asn His Thr Ala Ala
20 25 30
Thr Asn Val Leu Pro Gly Gly Ala Met Ala Gln Ala Ala Ala Ala Ala
35 40 45
Ser Leu Phe Ser Pro Pro Leu Thr Lys Ser Val Tyr Ala Ser Ser Gly
50 55 60
Leu Ser Leu Ala Leu Glu Gln Pro Glu Arg Gly Thr Asn Arg Gly Glu
65 70 75 80
Ala Ser Met Arg Asn Asn Asn Asn Val Gly Gly Gly Gly Asp Thr Phe
85 90 95
Asp Gly Ser Val Asn Arg Arg Ser Arg Glu Glu Glu His Glu Ser Arg
100 105 110
Ser Gly Ser Asp Asn Val Glu Gly Ile Ser Gly Glu Asp Gln Asp Ala
115 120 125
Ala Asp Lys Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
130 135 140
Gln Ile Gln Glu Leu Glu Ser Met Phe Lys Glu Cys Pro His Pro Asp
145 150 155 160
Glu Lys Gln Arg Leu Glu Leu Ser Lys Arg Leu Cys Leu Glu Thr Arg
165 170 175
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
180 185 190
Leu Glu Arg His Glu Asn Ala Leu Leu Arg Gln Glu Asn Asp Lys Leu
195 200 205
Arg Ala Glu Asn Met Ser Ile Arg Glu Ala Met Arg Asn Pro Ile Cys
210 215 220
Thr Asn Cys Gly Gly Pro Ala Met Leu Gly Asp Val Ser Leu Glu Glu
225 230 235 240
His His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
245 250 255
Val Cys Asn Leu Thr Gly Lys Phe Leu Gly His His His Asn His His
260 265 270
Tyr Asn Ser Ser Leu Glu Leu Ala Val Gly Thr Asn Asn Asn Gly Gly
275 280 285
His Phe Ala Phe Pro Pro Asp Phe Gly Gly Gly Gly Gly Cys Leu Pro
290 295 300
Pro Gln Gln Gln Gln Ser Thr Val Ile Asn Gly Ile Asp Gln Lys Ser
305 310 315 320
Val Leu Leu Glu Leu Ala Leu Thr Ala Met Asp Glu Leu Val Lys Leu
325 330 335
Ala Gln Ser Glu Glu Pro Leu Trp Val Lys Ser Leu Asp Gly Glu Arg
340 345 350
Asp Glu Leu Asn Gln Asp Glu Tyr Met Arg Thr Phe Ser Ser Thr Lys
355 360 365
Pro Thr Gly Leu Ala Thr Glu Ala Ser Arg Thr Ser Gly Met Val Ile
370 375 380
Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg Trp
385 390 395 400
Thr Glu Met Phe Pro Cys Asn Val Ala Arg Ala Thr Thr Thr Asp Val
405 410 415
Ile Ser Gly Gly Met Ala Gly Thr Ile Asn Gly Ala Leu Gln Leu Met
420 425 430
Asn Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Asn Val
435 440 445
Asn Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp Ala Val
450 455 460
Val Asp Val Ser Ile Asp Pro Val Arg Glu Asn Ser Gly Gly Ala Pro
465 470 475 480
Val Ile Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp Val Ser Asn
485 490 495
Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr Asp Glu Asn
500 505 510
Gln Ile His Gln Leu Tyr Arg Pro Leu Leu Arg Ser Gly Leu Gly Phe
515 520 525
Gly Ser Gln Arg Trp Leu Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu
530 535 540
Ala Ile Leu Ile Ser Ser Ser Val Thr Ser His Asp Asn Thr Cys Pro
545 550 555 560
Phe Leu Thr His Leu Ser Leu Cys Leu Thr
565 570
<210> 394
<211> 2244
<212> DNA
<213> Arabidopsis thaliana
<400> 394
atgtcaatgg ccgtcgacat gtcttccaaa caacccacca aagacttttt ctcctctcca 60
gccctctctc tatctctcgc tgggatattc cggaatgcat cctccggcag caccaaccct 120
gaggaggatt tcctgggcag aagagtagtt gacgatgagg atcgcactgt ggagatgagc 180
agcgagaact caggacccac gagatccaga tcagaggagg atttggaggg tgaggatcac 240
gacgatgagg aggaggaaga ggaggacggc gcagctggaa acaagggcac taataagaga 300
aagaggaaga agtatcatcg tcacaccacc gatcagatca gacacatgga agcgctattc 360
aaagagacac cacatccgga cgagaagcaa agacagcagc tgagcaagca actagggctg 420
gcccctcgcc aggtcaagtt ctggttccaa aaccgccgca cacagatcaa ggctattcaa 480
gaacggcacg agaactccct gctcaaggcg gaactagaga agctgcgaga ggaaaacaaa 540
gccatgaggg agtctttttc caaggctaat tcctcctgcc ccaactgcgg aggaggcccc 600
gatgatctcc acctcgaaaa ctccaaactg aaagccgagc tcgataagct tcgtgcagct 660
cttggacgca ctccctatcc cctgcaggct tcatgctccg acgatcaaga acaccgtctc 720
ggctctctcg atttctacac gggcgtcttt gccctcgaga agtcccgtat tgccgagatt 780
tctaaccgag ccacccttga actccagaag atggccacct caggcgaacc tatgtggctc 840
cgcagcgttg agactggccg tgagattctc aactacgatg agtacctcaa ggagtttccc 900
caagcgcaag cctcttcgtt tcctggaagg aaaaccatcg aagcatctag agatgcgggg 960
attgtgttta tggacgcaca taaacttgcc cagagtttca tggacgtggg acaatggaaa 1020
gagacatttg catgcttgat ctcaaaggct gcaacggtcg atgttatccg gcaaggcgaa 1080
gggccttcac ggatcgacgg ggctattcag ctgatgttcg gagagatgca gctgctcact 1140
ccggtcgtcc ccacaagaga agtgtacttc gtgagaagct gccggcagct gagccctgag 1200
aaatgggcaa tagtggacgt ctcggtctcc gtggaggaca gcaacacgga gaaggaggct 1260
tctcttctga aatgtcgaaa actcccctcc ggttgcatca tcgaggacac ctccaacggt 1320
cactccaagg tcacctgggt ggagcacctc gacgtgtctg catccacagt tcagcctctc 1380
ttccgctcct tagtcaacac cggtttggcc tttggggctc gacactgggt cgccaccctt 1440
cagctccatt gcgaacgcct tgtcttcttc atggctacca acgtccccac caaagactct 1500
ctcggagtta caactcttgc cgggagaaag agtgtgctga agatggctca gagaatgaca 1560
caaagcttct accgcgccat tgctgcatca agctaccatc aatggaccaa aatcaccacc 1620
aaaactggac aagacatgcg ggtttcttcc aggaagaacc ttcatgatcc tggcgagccc 1680
acgggagtca ttgtctgcgc ttcttcttcg ctgtggttac ctgtttctcc agctcttctc 1740
ttcgatttct ttagagatga agctcgtcgg catgagtggg atgctttgtc aaacggagct 1800
catgttcagt ctattgcaaa cttatccaag ggacaagaca gaggcaactc agtggcaatc 1860
cagacagtga aatcgagaga aaagagcata tgggtgctgc aagacagcag cactaactcg 1920
tatgagtcgg tggtggtata cgctcccgta gatataaaca cgacacagct ggtgctcgcg 1980
ggacatgatc caagcaacat ccaaatcctc ccctctggat tctcaatcat acctgatgga 2040
gtagagtcac ggccactggt aataacgtct acacaagacg acagaaacag ccaaggaggg 2100
tcgctcctga cactcgccct ccaaaccctc atcaaccctt ctcctgcagc aaagctgaat 2160
atggagtctg tggaatccgt gacaaacctc gtctcagtca cactacacaa cattaagaga 2220
agtctacaaa tcgaagattg ctga 2244
<210> 395
<211> 747
<212> PRT
<213> Arabidopsis thaliana
<400> 395
Met Ser Met Ala Val Asp Met Ser Ser Lys Gln Pro Thr Lys Asp Phe
1 5 10 15
Phe Ser Ser Pro Ala Leu Ser Leu Ser Leu Ala Gly Ile Phe Arg Asn
20 25 30
Ala Ser Ser Gly Ser Thr Asn Pro Glu Glu Asp Phe Leu Gly Arg Arg
35 40 45
Val Val Asp Asp Glu Asp Arg Thr Val Glu Met Ser Ser Glu Asn Ser
50 55 60
Gly Pro Thr Arg Ser Arg Ser Glu Glu Asp Leu Glu Gly Glu Asp His
65 70 75 80
Asp Asp Glu Glu Glu Glu Glu Glu Asp Gly Ala Ala Gly Asn Lys Gly
85 90 95
Thr Asn Lys Arg Lys Arg Lys Lys Tyr His Arg His Thr Thr Asp Gln
100 105 110
Ile Arg His Met Glu Ala Leu Phe Lys Glu Thr Pro His Pro Asp Glu
115 120 125
Lys Gln Arg Gln Gln Leu Ser Lys Gln Leu Gly Leu Ala Pro Arg Gln
130 135 140
Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Ile Lys Ala Ile Gln
145 150 155 160
Glu Arg His Glu Asn Ser Leu Leu Lys Ala Glu Leu Glu Lys Leu Arg
165 170 175
Glu Glu Asn Lys Ala Met Arg Glu Ser Phe Ser Lys Ala Asn Ser Ser
180 185 190
Cys Pro Asn Cys Gly Gly Gly Pro Asp Asp Leu His Leu Glu Asn Ser
195 200 205
Lys Leu Lys Ala Glu Leu Asp Lys Leu Arg Ala Ala Leu Gly Arg Thr
210 215 220
Pro Tyr Pro Leu Gln Ala Ser Cys Ser Asp Asp Gln Glu His Arg Leu
225 230 235 240
Gly Ser Leu Asp Phe Tyr Thr Gly Val Phe Ala Leu Glu Lys Ser Arg
245 250 255
Ile Ala Glu Ile Ser Asn Arg Ala Thr Leu Glu Leu Gln Lys Met Ala
260 265 270
Thr Ser Gly Glu Pro Met Trp Leu Arg Ser Val Glu Thr Gly Arg Glu
275 280 285
Ile Leu Asn Tyr Asp Glu Tyr Leu Lys Glu Phe Pro Gln Ala Gln Ala
290 295 300
Ser Ser Phe Pro Gly Arg Lys Thr Ile Glu Ala Ser Arg Asp Ala Gly
305 310 315 320
Ile Val Phe Met Asp Ala His Lys Leu Ala Gln Ser Phe Met Asp Val
325 330 335
Gly Gln Trp Lys Glu Thr Phe Ala Cys Leu Ile Ser Lys Ala Ala Thr
340 345 350
Val Asp Val Ile Arg Gln Gly Glu Gly Pro Ser Arg Ile Asp Gly Ala
355 360 365
Ile Gln Leu Met Phe Gly Glu Met Gln Leu Leu Thr Pro Val Val Pro
370 375 380
Thr Arg Glu Val Tyr Phe Val Arg Ser Cys Arg Gln Leu Ser Pro Glu
385 390 395 400
Lys Trp Ala Ile Val Asp Val Ser Val Ser Val Glu Asp Ser Asn Thr
405 410 415
Glu Lys Glu Ala Ser Leu Leu Lys Cys Arg Lys Leu Pro Ser Gly Cys
420 425 430
Ile Ile Glu Asp Thr Ser Asn Gly His Ser Lys Val Thr Trp Val Glu
435 440 445
His Leu Asp Val Ser Ala Ser Thr Val Gln Pro Leu Phe Arg Ser Leu
450 455 460
Val Asn Thr Gly Leu Ala Phe Gly Ala Arg His Trp Val Ala Thr Leu
465 470 475 480
Gln Leu His Cys Glu Arg Leu Val Phe Phe Met Ala Thr Asn Val Pro
485 490 495
Thr Lys Asp Ser Leu Gly Val Thr Thr Leu Ala Gly Arg Lys Ser Val
500 505 510
Leu Lys Met Ala Gln Arg Met Thr Gln Ser Phe Tyr Arg Ala Ile Ala
515 520 525
Ala Ser Ser Tyr His Gln Trp Thr Lys Ile Thr Thr Lys Thr Gly Gln
530 535 540
Asp Met Arg Val Ser Ser Arg Lys Asn Leu His Asp Pro Gly Glu Pro
545 550 555 560
Thr Gly Val Ile Val Cys Ala Ser Ser Ser Leu Trp Leu Pro Val Ser
565 570 575
Pro Ala Leu Leu Phe Asp Phe Phe Arg Asp Glu Ala Arg Arg His Glu
580 585 590
Trp Asp Ala Leu Ser Asn Gly Ala His Val Gln Ser Ile Ala Asn Leu
595 600 605
Ser Lys Gly Gln Asp Arg Gly Asn Ser Val Ala Ile Gln Thr Val Lys
610 615 620
Ser Arg Glu Lys Ser Ile Trp Val Leu Gln Asp Ser Ser Thr Asn Ser
625 630 635 640
Tyr Glu Ser Val Val Val Tyr Ala Pro Val Asp Ile Asn Thr Thr Gln
645 650 655
Leu Val Leu Ala Gly His Asp Pro Ser Asn Ile Gln Ile Leu Pro Ser
660 665 670
Gly Phe Ser Ile Ile Pro Asp Gly Val Glu Ser Arg Pro Leu Val Ile
675 680 685
Thr Ser Thr Gln Asp Asp Arg Asn Ser Gln Gly Gly Ser Leu Leu Thr
690 695 700
Leu Ala Leu Gln Thr Leu Ile Asn Pro Ser Pro Ala Ala Lys Leu Asn
705 710 715 720
Met Glu Ser Val Glu Ser Val Thr Asn Leu Val Ser Val Thr Leu His
725 730 735
Asn Ile Lys Arg Ser Leu Gln Ile Glu Asp Cys
740 745
<210> 396
<211> 2178
<212> DNA
<213> Arabidopsis thaliana
<400> 396
atgtctcagt caaacatggt accagtggct aacaacggag acaacaacaa cgacaacgaa 60
aacaacaaca acaacaacaa caatggtgga actgacaaca ctaatgctgg aaatgattct 120
ggagatcaag atttcgacag tgggaatacc tcaagtggca atcatggaga agggttggga 180
aacaatcaag ctcctcgtca taagaagaaa aaatacaatc gtcacaccca acttcagatt 240
tcggagatgg aagctttctt cagagagtgt cctcacccag atgacaaaca aaggtacgac 300
cttagcgctc aattgggatt ggaccctgtt cagatcaaat tctggttcca gaacaaacgc 360
actcaaaaca agaatcaaca agaacgcttt gagaactcag aacttcggaa tctgaacaac 420
caccttaggt ctgaaaatca gcggttacga gaagctattc atcaagcctt atgccctaag 480
tgtggaggcc aaactgcaat tggcgaaatg accttcgaag agcaccatct tcgcatcctc 540
aacgctcgtt tgactgaaga gatcaagcaa ctttccgtga cagcggaaaa gatatcaagg 600
cttacgggga taccagtaag gagccatccc cgtgtgtctc ctcctaatcc tcctccaaat 660
ttcgagttcg ggatgggatc taagggaaat gtcggaaacc actcgaggga aaccactgga 720
cctgcagatg ctaataccaa gccgatcatc atggagttgg catttggagc catggaggag 780
ctcttggtga tggctcaagt ggctgaacca ctgtggatgg gaggatttaa tggcactagc 840
ttagctttga acttggatga atacgaaaag acgtttcgca cgggtctcgg tcctagactt 900
ggcgggtttc gaaccgaggc atccagggaa actgcactcg tggcaatgtg tcctactggc 960
attgttgaaa tgctcatgca agagaatctg tggtcaacaa tgtttgccgg aattgttggt 1020
agagccagga ctcatgaaca gataatggct gatgctgctg gaaacttcaa tggaaatctc 1080
caaataatga gtgctgagta ccaagtgctt tccccgctag tcacaacccg cgaaagctac 1140
ttcgtccgct actgtaagca acaaggagag ggtttgtggg cggtggtcga tatttccatc 1200
gaccatctcc tcccaaacat caacctaaaa tgtcgccgcc gaccctctgg atgtctgatt 1260
caagaaatgc atagtggtta ctccaaggtt acatgggtgg aacatgtgga agtagatgat 1320
gcaggaagtt acagcatctt tgagaaatta atctgtactg gtcaagcttt tgctgctaac 1380
cgctgggttg gtacattggt acgccagtgt gagcggatat ctagcatctt gtcgacagat 1440
tttcaatctg tcgattccgg tgatcacata acgctaacta accatggaaa gatgagcatg 1500
ctgaagatag ctgagcggat tgcgagaacc ttctttgctg gaatgaccaa tgcgacgggg 1560
tctacaatat tttctggtgt tgaaggagaa gatatcagag tgatgacaat gaagagcgtg 1620
aatgatccag gaaagcctcc cggtgtcatt atttgtgcag ccacttcctt ttggcttcct 1680
gctcctccta acactgtctt tgacttcctc agagaggcta ctcaccgaca caattgggat 1740
gttctctgca acggagagat gatgcacaag atagcagaga ttacgaatgg gatagacaaa 1800
aggaactgtg caagtttact ccggcatgga cacactagca agagcaagat gatgatagtt 1860
caagagactt ctactgaccc aacagcttca tttgtgcttt atgcgcctgt tgatatgaca 1920
tcaatggata ttactctcca tggaggtggt gatcctgact ttgtggtgat cctgccttct 1980
ggttttgcta tttttccaga tggtacgggt aagcctggag gaaaagaagg aggatcactt 2040
ttgaccattt ccttccaaat gctggttgag tcaggtcctg aggctaggct gagtgttagc 2100
tctgttgcaa ctactgagaa tctgattcgt acaaccgtgc ggaggatcaa agatttgttt 2160
ccttgtcaga ctgcttga 2178
<210> 397
<211> 725
<212> PRT
<213> Arabidopsis thaliana
<400> 397
Met Ser Gln Ser Asn Met Val Pro Val Ala Asn Asn Gly Asp Asn Asn
1 5 10 15
Asn Asp Asn Glu Asn Asn Asn Asn Asn Asn Asn Asn Gly Gly Thr Asp
20 25 30
Asn Thr Asn Ala Gly Asn Asp Ser Gly Asp Gln Asp Phe Asp Ser Gly
35 40 45
Asn Thr Ser Ser Gly Asn His Gly Glu Gly Leu Gly Asn Asn Gln Ala
50 55 60
Pro Arg His Lys Lys Lys Lys Tyr Asn Arg His Thr Gln Leu Gln Ile
65 70 75 80
Ser Glu Met Glu Ala Phe Phe Arg Glu Cys Pro His Pro Asp Asp Lys
85 90 95
Gln Arg Tyr Asp Leu Ser Ala Gln Leu Gly Leu Asp Pro Val Gln Ile
100 105 110
Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Asn Lys Asn Gln Gln Glu
115 120 125
Arg Phe Glu Asn Ser Glu Leu Arg Asn Leu Asn Asn His Leu Arg Ser
130 135 140
Glu Asn Gln Arg Leu Arg Glu Ala Ile His Gln Ala Leu Cys Pro Lys
145 150 155 160
Cys Gly Gly Gln Thr Ala Ile Gly Glu Met Thr Phe Glu Glu His His
165 170 175
Leu Arg Ile Leu Asn Ala Arg Leu Thr Glu Glu Ile Lys Gln Leu Ser
180 185 190
Val Thr Ala Glu Lys Ile Ser Arg Leu Thr Gly Ile Pro Val Arg Ser
195 200 205
His Pro Arg Val Ser Pro Pro Asn Pro Pro Pro Asn Phe Glu Phe Gly
210 215 220
Met Gly Ser Lys Gly Asn Val Gly Asn His Ser Arg Glu Thr Thr Gly
225 230 235 240
Pro Ala Asp Ala Asn Thr Lys Pro Ile Ile Met Glu Leu Ala Phe Gly
245 250 255
Ala Met Glu Glu Leu Leu Val Met Ala Gln Val Ala Glu Pro Leu Trp
260 265 270
Met Gly Gly Phe Asn Gly Thr Ser Leu Ala Leu Asn Leu Asp Glu Tyr
275 280 285
Glu Lys Thr Phe Arg Thr Gly Leu Gly Pro Arg Leu Gly Gly Phe Arg
290 295 300
Thr Glu Ala Ser Arg Glu Thr Ala Leu Val Ala Met Cys Pro Thr Gly
305 310 315 320
Ile Val Glu Met Leu Met Gln Glu Asn Leu Trp Ser Thr Met Phe Ala
325 330 335
Gly Ile Val Gly Arg Ala Arg Thr His Glu Gln Ile Met Ala Asp Ala
340 345 350
Ala Gly Asn Phe Asn Gly Asn Leu Gln Ile Met Ser Ala Glu Tyr Gln
355 360 365
Val Leu Ser Pro Leu Val Thr Thr Arg Glu Ser Tyr Phe Val Arg Tyr
370 375 380
Cys Lys Gln Gln Gly Glu Gly Leu Trp Ala Val Val Asp Ile Ser Ile
385 390 395 400
Asp His Leu Leu Pro Asn Ile Asn Leu Lys Cys Arg Arg Arg Pro Ser
405 410 415
Gly Cys Leu Ile Gln Glu Met His Ser Gly Tyr Ser Lys Val Thr Trp
420 425 430
Val Glu His Val Glu Val Asp Asp Ala Gly Ser Tyr Ser Ile Phe Glu
435 440 445
Lys Leu Ile Cys Thr Gly Gln Ala Phe Ala Ala Asn Arg Trp Val Gly
450 455 460
Thr Leu Val Arg Gln Cys Glu Arg Ile Ser Ser Ile Leu Ser Thr Asp
465 470 475 480
Phe Gln Ser Val Asp Ser Gly Asp His Ile Thr Leu Thr Asn His Gly
485 490 495
Lys Met Ser Met Leu Lys Ile Ala Glu Arg Ile Ala Arg Thr Phe Phe
500 505 510
Ala Gly Met Thr Asn Ala Thr Gly Ser Thr Ile Phe Ser Gly Val Glu
515 520 525
Gly Glu Asp Ile Arg Val Met Thr Met Lys Ser Val Asn Asp Pro Gly
530 535 540
Lys Pro Pro Gly Val Ile Ile Cys Ala Ala Thr Ser Phe Trp Leu Pro
545 550 555 560
Ala Pro Pro Asn Thr Val Phe Asp Phe Leu Arg Glu Ala Thr His Arg
565 570 575
His Asn Trp Asp Val Leu Cys Asn Gly Glu Met Met His Lys Ile Ala
580 585 590
Glu Ile Thr Asn Gly Ile Asp Lys Arg Asn Cys Ala Ser Leu Leu Arg
595 600 605
His Gly His Thr Ser Lys Ser Lys Met Met Ile Val Gln Glu Thr Ser
610 615 620
Thr Asp Pro Thr Ala Ser Phe Val Leu Tyr Ala Pro Val Asp Met Thr
625 630 635 640
Ser Met Asp Ile Thr Leu His Gly Gly Gly Asp Pro Asp Phe Val Val
645 650 655
Ile Leu Pro Ser Gly Phe Ala Ile Phe Pro Asp Gly Thr Gly Lys Pro
660 665 670
Gly Gly Lys Glu Gly Gly Ser Leu Leu Thr Ile Ser Phe Gln Met Leu
675 680 685
Val Glu Ser Gly Pro Glu Ala Arg Leu Ser Val Ser Ser Val Ala Thr
690 695 700
Thr Glu Asn Leu Ile Arg Thr Thr Val Arg Arg Ile Lys Asp Leu Phe
705 710 715 720
Pro Cys Gln Thr Ala
725
<210> 398
<211> 2061
<212> DNA
<213> Arabidopsis thaliana
<400> 398
atgaatggac aaggtgattt ggatgcggtt ggaaacattc caaaaccagg tgaagctgaa 60
ggcgatgaga ttgatatgat taatgatatg tctggtgtta atgatcaaga tggtggaagg 120
atgagaagaa cccataggcg cactgcttat caaactcaag aacttgaaaa tttctacatg 180
gaaaatcctc atcccactga agaacagagg tacgagcttg gacaaaggct taatatgggt 240
gtcaatcaag tcaagaattg gttccagaat aaaagaaatc tcgagaagat caataatgac 300
caccttgaga atgtaactct tagagaagag catgacagat tgctagcaac tcaggatcag 360
cttagaagcg caatgctacg tagtttatgc aacatttgtg gtaaggcaac taattgtgga 420
gacactgaat atgaggtgca aaaacttatg gctgagaatg ctaacttgga gcgggagata 480
gaccagttca attccagata cctttctcat cccaaacaaa ggatggtcag tacatccgaa 540
caggcgcctt cttcttcctc taatccagga ataaatgcaa caccagtact tgattttagt 600
ggtggaacta ggacgtctga gaaggagaca tcaatttttc tgaatcttgc cattacggct 660
ttgagagagt tgattacatt gggagaagtg gactgtccat tttggatgat agatccaatc 720
gttagatcca aaggagtatc aaagatctat gagaagtata gaagttcttt caacaatgtc 780
acaaaacctc ccgggcaaat tgtggaggct tcaagagcta aaggtttagt tcccatgact 840
tgcgtgactc tggtcaagac tcttatggac acaggcaaat gggtcaacgt gtttgcacct 900
atagtccctg tggcatcaac ccataaagtg ctatctaccg gttctggtgg aaccaaaagt 960
ggctcactcc aacagattca agcagaattt caagtaattt ctccgctggt accaaagaga 1020
aaagtaacgt ttattagata ctgcaaagag atcagacagg gcttatgggt ggtcgtcgac 1080
gttactccta ctcaaaatcc gactttgctg ccctatggtt gttctaagag gctaccctca 1140
ggccttatca tagacgacct gtccaatggg tactcccagg ttacatggat tgaacaagcg 1200
gaatataatg agagtcacat ccaccaactc taccagcctt tgattggcta tgggatcggg 1260
ctaggtgcaa agagatggct cgcgacgctg cagagacact gcgaaagcct ctcgaccctt 1320
tcatctacca acttgactga aattagtcca ggattgtctg caaaaggtgc aactgaaata 1380
gtgaagctag cacagcgaat gactctcaac tactacagag gtattacgag tccttcggtg 1440
gacaagtggc agaaaattca ggtggagaat gtggcacaaa acatgagttt catgatccga 1500
aagaacgtga atgagcctgg tgagctaact gggattgtgc tgagtgcatc cacttctgtt 1560
tggctcccag tgaaccagca tacactcttt gctttcatta gccacctgag tttcagacac 1620
gagtgggata tcttgaccaa tgatactacc atggaagaaa caatccggat tcaaaaagca 1680
aaacgccatg gaaacatcat ctctcttctg aaaatcgtta ataatggtat gctggttctg 1740
caagagattt ggaatgatgc atcaggtgca atggtggtgt atgcaccagt ggaaaccaat 1800
tctattgagc tggtcaagag aggtgaaaat tcagattctg tgaagtttct tccttcggga 1860
ttttcgatag tgccagatgg agtaaatggg tcatatcata gaggcaatac tggtggagga 1920
tgtctactga catttggact tcagatcttg gtgggcatca atccaactgc tgcactcatt 1980
caaggtactg tcaaaagtgt cgagacactc atggctcata ctattgtcaa gatcaaatcc 2040
gcgttagatt tacagacgta a 2061
<210> 399
<211> 686
<212> PRT
<213> Arabidopsis thaliana
<400> 399
Met Asn Gly Gln Gly Asp Leu Asp Ala Val Gly Asn Ile Pro Lys Pro
1 5 10 15
Gly Glu Ala Glu Gly Asp Glu Ile Asp Met Ile Asn Asp Met Ser Gly
20 25 30
Val Asn Asp Gln Asp Gly Gly Arg Met Arg Arg Thr His Arg Arg Thr
35 40 45
Ala Tyr Gln Thr Gln Glu Leu Glu Asn Phe Tyr Met Glu Asn Pro His
50 55 60
Pro Thr Glu Glu Gln Arg Tyr Glu Leu Gly Gln Arg Leu Asn Met Gly
65 70 75 80
Val Asn Gln Val Lys Asn Trp Phe Gln Asn Lys Arg Asn Leu Glu Lys
85 90 95
Ile Asn Asn Asp His Leu Glu Asn Val Thr Leu Arg Glu Glu His Asp
100 105 110
Arg Leu Leu Ala Thr Gln Asp Gln Leu Arg Ser Ala Met Leu Arg Ser
115 120 125
Leu Cys Asn Ile Cys Gly Lys Ala Thr Asn Cys Gly Asp Thr Glu Tyr
130 135 140
Glu Val Gln Lys Leu Met Ala Glu Asn Ala Asn Leu Glu Arg Glu Ile
145 150 155 160
Asp Gln Phe Asn Ser Arg Tyr Leu Ser His Pro Lys Gln Arg Met Val
165 170 175
Ser Thr Ser Glu Gln Ala Pro Ser Ser Ser Ser Asn Pro Gly Ile Asn
180 185 190
Ala Thr Pro Val Leu Asp Phe Ser Gly Gly Thr Arg Thr Ser Glu Lys
195 200 205
Glu Thr Ser Ile Phe Leu Asn Leu Ala Ile Thr Ala Leu Arg Glu Leu
210 215 220
Ile Thr Leu Gly Glu Val Asp Cys Pro Phe Trp Met Ile Asp Pro Ile
225 230 235 240
Val Arg Ser Lys Gly Val Ser Lys Ile Tyr Glu Lys Tyr Arg Ser Ser
245 250 255
Phe Asn Asn Val Thr Lys Pro Pro Gly Gln Ile Val Glu Ala Ser Arg
260 265 270
Ala Lys Gly Leu Val Pro Met Thr Cys Val Thr Leu Val Lys Thr Leu
275 280 285
Met Asp Thr Gly Lys Trp Val Asn Val Phe Ala Pro Ile Val Pro Val
290 295 300
Ala Ser Thr His Lys Val Leu Ser Thr Gly Ser Gly Gly Thr Lys Ser
305 310 315 320
Gly Ser Leu Gln Gln Ile Gln Ala Glu Phe Gln Val Ile Ser Pro Leu
325 330 335
Val Pro Lys Arg Lys Val Thr Phe Ile Arg Tyr Cys Lys Glu Ile Arg
340 345 350
Gln Gly Leu Trp Val Val Val Asp Val Thr Pro Thr Gln Asn Pro Thr
355 360 365
Leu Leu Pro Tyr Gly Cys Ser Lys Arg Leu Pro Ser Gly Leu Ile Ile
370 375 380
Asp Asp Leu Ser Asn Gly Tyr Ser Gln Val Thr Trp Ile Glu Gln Ala
385 390 395 400
Glu Tyr Asn Glu Ser His Ile His Gln Leu Tyr Gln Pro Leu Ile Gly
405 410 415
Tyr Gly Ile Gly Leu Gly Ala Lys Arg Trp Leu Ala Thr Leu Gln Arg
420 425 430
His Cys Glu Ser Leu Ser Thr Leu Ser Ser Thr Asn Leu Thr Glu Ile
435 440 445
Ser Pro Gly Leu Ser Ala Lys Gly Ala Thr Glu Ile Val Lys Leu Ala
450 455 460
Gln Arg Met Thr Leu Asn Tyr Tyr Arg Gly Ile Thr Ser Pro Ser Val
465 470 475 480
Asp Lys Trp Gln Lys Ile Gln Val Glu Asn Val Ala Gln Asn Met Ser
485 490 495
Phe Met Ile Arg Lys Asn Val Asn Glu Pro Gly Glu Leu Thr Gly Ile
500 505 510
Val Leu Ser Ala Ser Thr Ser Val Trp Leu Pro Val Asn Gln His Thr
515 520 525
Leu Phe Ala Phe Ile Ser His Leu Ser Phe Arg His Glu Trp Asp Ile
530 535 540
Leu Thr Asn Asp Thr Thr Met Glu Glu Thr Ile Arg Ile Gln Lys Ala
545 550 555 560
Lys Arg His Gly Asn Ile Ile Ser Leu Leu Lys Ile Val Asn Asn Gly
565 570 575
Met Leu Val Leu Gln Glu Ile Trp Asn Asp Ala Ser Gly Ala Met Val
580 585 590
Val Tyr Ala Pro Val Glu Thr Asn Ser Ile Glu Leu Val Lys Arg Gly
595 600 605
Glu Asn Ser Asp Ser Val Lys Phe Leu Pro Ser Gly Phe Ser Ile Val
610 615 620
Pro Asp Gly Val Asn Gly Ser Tyr His Arg Gly Asn Thr Gly Gly Gly
625 630 635 640
Cys Leu Leu Thr Phe Gly Leu Gln Ile Leu Val Gly Ile Asn Pro Thr
645 650 655
Ala Ala Leu Ile Gln Gly Thr Val Lys Ser Val Glu Thr Leu Met Ala
660 665 670
His Thr Ile Val Lys Ile Lys Ser Ala Leu Asp Leu Gln Thr
675 680 685
<210> 400
<211> 2427
<212> DNA
<213> Arabidopsis thaliana
<400> 400
atgaatttca acggttttct cgacgacggt gctggagcct caaagctact ctctgatgct 60
ccgtacaaca accacttctc tttctccgcc gtagacacca tgctcggaag cgccgccatt 120
gctccttctc agtctcttcc tttctcttct tcaggcctct ctctcggact ccaaacaaat 180
ggagaaatga gtagaaacgg agagattatg gagtcaaacg taagtcgtaa gagtagtaga 240
ggagaagatg tagaaagcag atctgaaagt gataacgctg aagctgtctc cggtgacgat 300
ttagatacct ccgatagacc tttaaagaag aagaaacgtt accatcgtca cactcctaaa 360
caaattcaag acctcgaatc ggtttttaaa gagtgtgcac atccagacga gaagcaacgt 420
cttgatctta gccgtcgact taacttagat cctcgtcaag tcaagttctg gttccagaat 480
cgtcgtactc agatgaagac tcaaatcgaa cgacatgaga atgctttgtt gaggcaagag 540
aacgataagc ttcgagctga gaatatgtct gtacgcgaag ctatgagaaa ccctatgtgt 600
ggtaattgcg gcggacctgc cgttatcggt gagatctcaa tggaagagca acatctgaga 660
attgaaaact ctcgtctcaa agatgagtta gaccgagtct gtgccttaac cggtaagttt 720
cttggccggt ctaatggttc acatcatata ccggactcag cacttgttct cggcgttggt 780
gttggttctg gtggatgtaa tgttggtggt ggtttcactc tctcttctcc gctgttgcct 840
caagcttctc ctagatttga gatttctaat ggaaccggtt ctggtttggt ggctacggtt 900
aaccgtcaac aaccggttag tgttagtgat tttgatcaga gatcgaggta tttggattta 960
gctcttgcgg ctatggatga gcttgtgaag atggctcaga cacgtgagcc gctctgggtt 1020
cgaagctcgg attctggttt tgaagtgctg aaccaggaag agtacgacac aagtttctct 1080
cggtgtgttg gaccaaaaca agatgggttt gtctcagaag cttctaaaga agctggaact 1140
gttatcatca atagcttagc gctcgttgaa accttaatgg actcggaacg gtgggcggaa 1200
atgtttccta gtatggtctc aagaacttca accacagaga ttatctctag tggcatggga 1260
gggcgaaatg gtgcacttca cctgatgcac gcagagcttc aactgctgtc tccactcgtg 1320
ccggttagac aagtgtcgtt cttgcggttc tgtaaacagc acgcggaagg tgtttgggca 1380
gtcgtggatg tctcaattga ttccattaga gaaggttctt cttcgagctg tagaagatta 1440
ccatccggtt gcctcgtaca agacatggcc aatggctact caaaggtaac atggatcgag 1500
cacacggagt atgacgaaaa ccacatccac cgtttatacc gcccattact caggtgcggt 1560
ctagcgtttg gtgcgcatcg atggatggct gcattacaac gtcaatgcga atgcctcacg 1620
attctcatgt cctccactgt ttccacttcc actaatccat cccctataaa ctgcaatggg 1680
agaaaaagca tgctaaagct agcgaagagg atgactgata atttctgtgg aggggtttgt 1740
gcttcgtcgt tacagaaatg gagcaaactc aacgttggca acgtcgacga agacgttagg 1800
ataatgacta ggaagagtgt aaacaatcct ggcgagccgc ctgggataat tctaaatgcg 1860
gcgacgtcag tttggatgcc ggtatctccg aggcggttgt ttgacttcct tggaaacgaa 1920
cggcttagat cggaatggga tatcttatcc aacggtggac caatgaaaga gatggcccat 1980
atagctaaag gccatgaccg ttccaactcc gtctccctcc tccgtgccag cgcgataaat 2040
gcgaatcaga gtagtatgct gatattacaa gagacaagca tagacgctgc aggagcggtt 2100
gtcgtgtacg cgcctgttga tatcccagca atgcaagctg tgatgaacgg tggagattct 2160
gcttacgtgg cactccttcc ttcaggattc gccattctcc ctaacggtca ggctggtacg 2220
caacgctgcg ccgcagagga acgtaacagt attggtaacg gtgggtgcat ggaggaagga 2280
gggtcgttac taacggtggc gtttcagata ctggtgaata gtttgcctac ggctaagcta 2340
acggtggaat ctgtggagac ggttaataat ttgatatcgt gcaccgttca gaagattaaa 2400
gctgctcttc attgtgatag cacctga 2427
<210> 401
<211> 808
<212> PRT
<213> Arabidopsis thaliana
<400> 401
Met Asn Phe Asn Gly Phe Leu Asp Asp Gly Ala Gly Ala Ser Lys Leu
1 5 10 15
Leu Ser Asp Ala Pro Tyr Asn Asn His Phe Ser Phe Ser Ala Val Asp
20 25 30
Thr Met Leu Gly Ser Ala Ala Ile Ala Pro Ser Gln Ser Leu Pro Phe
35 40 45
Ser Ser Ser Gly Leu Ser Leu Gly Leu Gln Thr Asn Gly Glu Met Ser
50 55 60
Arg Asn Gly Glu Ile Met Glu Ser Asn Val Ser Arg Lys Ser Ser Arg
65 70 75 80
Gly Glu Asp Val Glu Ser Arg Ser Glu Ser Asp Asn Ala Glu Ala Val
85 90 95
Ser Gly Asp Asp Leu Asp Thr Ser Asp Arg Pro Leu Lys Lys Lys Lys
100 105 110
Arg Tyr His Arg His Thr Pro Lys Gln Ile Gln Asp Leu Glu Ser Val
115 120 125
Phe Lys Glu Cys Ala His Pro Asp Glu Lys Gln Arg Leu Asp Leu Ser
130 135 140
Arg Arg Leu Asn Leu Asp Pro Arg Gln Val Lys Phe Trp Phe Gln Asn
145 150 155 160
Arg Arg Thr Gln Met Lys Thr Gln Ile Glu Arg His Glu Asn Ala Leu
165 170 175
Leu Arg Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Ser Val Arg
180 185 190
Glu Ala Met Arg Asn Pro Met Cys Gly Asn Cys Gly Gly Pro Ala Val
195 200 205
Ile Gly Glu Ile Ser Met Glu Glu Gln His Leu Arg Ile Glu Asn Ser
210 215 220
Arg Leu Lys Asp Glu Leu Asp Arg Val Cys Ala Leu Thr Gly Lys Phe
225 230 235 240
Leu Gly Arg Ser Asn Gly Ser His His Ile Pro Asp Ser Ala Leu Val
245 250 255
Leu Gly Val Gly Val Gly Ser Gly Gly Cys Asn Val Gly Gly Gly Phe
260 265 270
Thr Leu Ser Ser Pro Leu Leu Pro Gln Ala Ser Pro Arg Phe Glu Ile
275 280 285
Ser Asn Gly Thr Gly Ser Gly Leu Val Ala Thr Val Asn Arg Gln Gln
290 295 300
Pro Val Ser Val Ser Asp Phe Asp Gln Arg Ser Arg Tyr Leu Asp Leu
305 310 315 320
Ala Leu Ala Ala Met Asp Glu Leu Val Lys Met Ala Gln Thr Arg Glu
325 330 335
Pro Leu Trp Val Arg Ser Ser Asp Ser Gly Phe Glu Val Leu Asn Gln
340 345 350
Glu Glu Tyr Asp Thr Ser Phe Ser Arg Cys Val Gly Pro Lys Gln Asp
355 360 365
Gly Phe Val Ser Glu Ala Ser Lys Glu Ala Gly Thr Val Ile Ile Asn
370 375 380
Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Glu Arg Trp Ala Glu
385 390 395 400
Met Phe Pro Ser Met Val Ser Arg Thr Ser Thr Thr Glu Ile Ile Ser
405 410 415
Ser Gly Met Gly Gly Arg Asn Gly Ala Leu His Leu Met His Ala Glu
420 425 430
Leu Gln Leu Leu Ser Pro Leu Val Pro Val Arg Gln Val Ser Phe Leu
435 440 445
Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp Ala Val Val Asp Val
450 455 460
Ser Ile Asp Ser Ile Arg Glu Gly Ser Ser Ser Ser Cys Arg Arg Leu
465 470 475 480
Pro Ser Gly Cys Leu Val Gln Asp Met Ala Asn Gly Tyr Ser Lys Val
485 490 495
Thr Trp Ile Glu His Thr Glu Tyr Asp Glu Asn His Ile His Arg Leu
500 505 510
Tyr Arg Pro Leu Leu Arg Cys Gly Leu Ala Phe Gly Ala His Arg Trp
515 520 525
Met Ala Ala Leu Gln Arg Gln Cys Glu Cys Leu Thr Ile Leu Met Ser
530 535 540
Ser Thr Val Ser Thr Ser Thr Asn Pro Ser Pro Ile Asn Cys Asn Gly
545 550 555 560
Arg Lys Ser Met Leu Lys Leu Ala Lys Arg Met Thr Asp Asn Phe Cys
565 570 575
Gly Gly Val Cys Ala Ser Ser Leu Gln Lys Trp Ser Lys Leu Asn Val
580 585 590
Gly Asn Val Asp Glu Asp Val Arg Ile Met Thr Arg Lys Ser Val Asn
595 600 605
Asn Pro Gly Glu Pro Pro Gly Ile Ile Leu Asn Ala Ala Thr Ser Val
610 615 620
Trp Met Pro Val Ser Pro Arg Arg Leu Phe Asp Phe Leu Gly Asn Glu
625 630 635 640
Arg Leu Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Pro Met Lys
645 650 655
Glu Met Ala His Ile Ala Lys Gly His Asp Arg Ser Asn Ser Val Ser
660 665 670
Leu Leu Arg Ala Ser Ala Ile Asn Ala Asn Gln Ser Ser Met Leu Ile
675 680 685
Leu Gln Glu Thr Ser Ile Asp Ala Ala Gly Ala Val Val Val Tyr Ala
690 695 700
Pro Val Asp Ile Pro Ala Met Gln Ala Val Met Asn Gly Gly Asp Ser
705 710 715 720
Ala Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asn Gly
725 730 735
Gln Ala Gly Thr Gln Arg Cys Ala Ala Glu Glu Arg Asn Ser Ile Gly
740 745 750
Asn Gly Gly Cys Met Glu Glu Gly Gly Ser Leu Leu Thr Val Ala Phe
755 760 765
Gln Ile Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser
770 775 780
Val Glu Thr Val Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys
785 790 795 800
Ala Ala Leu His Cys Asp Ser Thr
805
<210> 402
<211> 2064
<212> DNA
<213> Arabidopsis thaliana
<400> 402
atggagtttc tcggcgacag tcaaaatcac gatagctctg aaacagagaa gaagaacaag 60
aagaagaagc gatttcaccg tcacacacct caccagatcc aacggcttga atcaactttc 120
aatgagtgtc aacatccaga tgagaaacag aggaaccaac ttagtagaga gttgggttta 180
gctccaagac agatcaagtt ctggtttcaa aacagaagaa ctcaaaagaa ggcacaacac 240
gaaagagctg ataattgtgc attgaaagaa gagaatgata agattcgatg cgaaaacatt 300
gctattagag aagctattaa acacgccatt tgccccagct gtggtgattc tcctgttaat 360
gaagactctt actttgatga gcaaaagctt cgcatcgaaa atgcacagct tagagatgag 420
ctcgaaaggg tttcgagtat tgcagctaaa ttcttaggaa gaccaatctc ccatcttcca 480
ccattactaa atccgatgca tgtttcgcca ttagagttat tccataccgg accttcactt 540
gattttgatc ttctcccagg aagttgttct tcaatgtctg ttccaagttt accatctcag 600
ccaaacttgg ttttatcaga gatggataag tctcttatga ccaacattgc tgtgaccgct 660
atggaagaat tgcttaggct tcttcaaaca aatgagcctc tgtggatcaa aactgatgga 720
tgcagagatg ttctcaatct cgaaaactat gagaatatgt ttacaagatc aagtactagt 780
ggtggaaaga agaataacct tggaatggaa gcatctagat cttctggtgt tgttttcact 840
aatgctatta cacttgtgga catgcttatg aactctgtca aattaacaga gctttttccc 900
tcgatcgttg catcatctaa aacccttgca gtgatttcat cgggattgcg tggaaaccat 960
ggagatgcat tgcatttgat gattgaagag cttcaagtgc tttcaccatt ggtaacaacg 1020
cgtgagttct gtgtgctaag atattgtcag caaatcgaac atggaacttg ggcaatagta 1080
aatgtctcat atgagtttcc tcagtttata tctcaatctc ggtcatatag atttccttct 1140
ggttgcttga tccaagatat gtccaatggc tattcaaagg ttacttgggt ggaacatggt 1200
gaattcgagg agcaagaacc gatacatgag atgtttaaag atatagttca taaaggatta 1260
gcttttggag ctgaacgttg gattgctact ctccaaagaa tgtgtgagag attcacgaat 1320
ctattggaac ctgcaacatc atcccttgat cttggaggag tgattccatc gccagaaggg 1380
aagagaagta taatgagact tgctcacaga atggtaagca acttctgctt gagtgttggc 1440
acatctaaca acactcgctc aacggttgtc tcgggactgg atgaatttgg aatccgtgtg 1500
acttcgcata agagcagaca tgaaccaaat ggaatggttc tatgtgcagc cacaagtttc 1560
tggctcccta tttctccaca aaacgtcttc aatttcctca aagatgagag aactcggcct 1620
cagtgggacg ttctttcaaa tggaaactct gttcaagaag ttgctcatat cacaaacgga 1680
tcaaatcctg gaaactgcat atctgttctt cgtggattca atgcatcatc atcacaaaac 1740
aacatgttga ttctacaaga aagctgcata gactcatcaa gtgcagcgct tgtgatctac 1800
actccagtgg atctaccagc gttgaacata gcaatgagtg gtcaagacac atcttatatt 1860
ccgatattac cctcaggttt tgccatttca ccagacggaa gcagcaaagg aggaggatca 1920
ttgataacgg ttgggtttca gataatggtg agtggtttgc aaccggcaaa actgaacatg 1980
gagtcaatgg agacagtaaa taatctcatc aataccactg tccaccaaat taaaacgacc 2040
ttgaattgtc cttcaactgc ttga 2064
<210> 403
<211> 687
<212> PRT
<213> Arabidopsis thaliana
<400> 403
Met Glu Phe Leu Gly Asp Ser Gln Asn His Asp Ser Ser Glu Thr Glu
1 5 10 15
Lys Lys Asn Lys Lys Lys Lys Arg Phe His Arg His Thr Pro His Gln
20 25 30
Ile Gln Arg Leu Glu Ser Thr Phe Asn Glu Cys Gln His Pro Asp Glu
35 40 45
Lys Gln Arg Asn Gln Leu Ser Arg Glu Leu Gly Leu Ala Pro Arg Gln
50 55 60
Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Lys Lys Ala Gln His
65 70 75 80
Glu Arg Ala Asp Asn Cys Ala Leu Lys Glu Glu Asn Asp Lys Ile Arg
85 90 95
Cys Glu Asn Ile Ala Ile Arg Glu Ala Ile Lys His Ala Ile Cys Pro
100 105 110
Ser Cys Gly Asp Ser Pro Val Asn Glu Asp Ser Tyr Phe Asp Glu Gln
115 120 125
Lys Leu Arg Ile Glu Asn Ala Gln Leu Arg Asp Glu Leu Glu Arg Val
130 135 140
Ser Ser Ile Ala Ala Lys Phe Leu Gly Arg Pro Ile Ser His Leu Pro
145 150 155 160
Pro Leu Leu Asn Pro Met His Val Ser Pro Leu Glu Leu Phe His Thr
165 170 175
Gly Pro Ser Leu Asp Phe Asp Leu Leu Pro Gly Ser Cys Ser Ser Met
180 185 190
Ser Val Pro Ser Leu Pro Ser Gln Pro Asn Leu Val Leu Ser Glu Met
195 200 205
Asp Lys Ser Leu Met Thr Asn Ile Ala Val Thr Ala Met Glu Glu Leu
210 215 220
Leu Arg Leu Leu Gln Thr Asn Glu Pro Leu Trp Ile Lys Thr Asp Gly
225 230 235 240
Cys Arg Asp Val Leu Asn Leu Glu Asn Tyr Glu Asn Met Phe Thr Arg
245 250 255
Ser Ser Thr Ser Gly Gly Lys Lys Asn Asn Leu Gly Met Glu Ala Ser
260 265 270
Arg Ser Ser Gly Val Val Phe Thr Asn Ala Ile Thr Leu Val Asp Met
275 280 285
Leu Met Asn Ser Val Lys Leu Thr Glu Leu Phe Pro Ser Ile Val Ala
290 295 300
Ser Ser Lys Thr Leu Ala Val Ile Ser Ser Gly Leu Arg Gly Asn His
305 310 315 320
Gly Asp Ala Leu His Leu Met Ile Glu Glu Leu Gln Val Leu Ser Pro
325 330 335
Leu Val Thr Thr Arg Glu Phe Cys Val Leu Arg Tyr Cys Gln Gln Ile
340 345 350
Glu His Gly Thr Trp Ala Ile Val Asn Val Ser Tyr Glu Phe Pro Gln
355 360 365
Phe Ile Ser Gln Ser Arg Ser Tyr Arg Phe Pro Ser Gly Cys Leu Ile
370 375 380
Gln Asp Met Ser Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Gly
385 390 395 400
Glu Phe Glu Glu Gln Glu Pro Ile His Glu Met Phe Lys Asp Ile Val
405 410 415
His Lys Gly Leu Ala Phe Gly Ala Glu Arg Trp Ile Ala Thr Leu Gln
420 425 430
Arg Met Cys Glu Arg Phe Thr Asn Leu Leu Glu Pro Ala Thr Ser Ser
435 440 445
Leu Asp Leu Gly Gly Val Ile Pro Ser Pro Glu Gly Lys Arg Ser Ile
450 455 460
Met Arg Leu Ala His Arg Met Val Ser Asn Phe Cys Leu Ser Val Gly
465 470 475 480
Thr Ser Asn Asn Thr Arg Ser Thr Val Val Ser Gly Leu Asp Glu Phe
485 490 495
Gly Ile Arg Val Thr Ser His Lys Ser Arg His Glu Pro Asn Gly Met
500 505 510
Val Leu Cys Ala Ala Thr Ser Phe Trp Leu Pro Ile Ser Pro Gln Asn
515 520 525
Val Phe Asn Phe Leu Lys Asp Glu Arg Thr Arg Pro Gln Trp Asp Val
530 535 540
Leu Ser Asn Gly Asn Ser Val Gln Glu Val Ala His Ile Thr Asn Gly
545 550 555 560
Ser Asn Pro Gly Asn Cys Ile Ser Val Leu Arg Gly Phe Asn Ala Ser
565 570 575
Ser Ser Gln Asn Asn Met Leu Ile Leu Gln Glu Ser Cys Ile Asp Ser
580 585 590
Ser Ser Ala Ala Leu Val Ile Tyr Thr Pro Val Asp Leu Pro Ala Leu
595 600 605
Asn Ile Ala Met Ser Gly Gln Asp Thr Ser Tyr Ile Pro Ile Leu Pro
610 615 620
Ser Gly Phe Ala Ile Ser Pro Asp Gly Ser Ser Lys Gly Gly Gly Ser
625 630 635 640
Leu Ile Thr Val Gly Phe Gln Ile Met Val Ser Gly Leu Gln Pro Ala
645 650 655
Lys Leu Asn Met Glu Ser Met Glu Thr Val Asn Asn Leu Ile Asn Thr
660 665 670
Thr Val His Gln Ile Lys Thr Thr Leu Asn Cys Pro Ser Thr Ala
675 680 685
<210> 404
<211> 2169
<212> DNA
<213> Arabidopsis thaliana
<400> 404
atgagtttcg tcgtcggcgt cggcggaagt ggtagtggaa gcggcggaga cggtggtggt 60
agtcatcatc acgacggctc tgaaactgat aggaagaaga aacgttacca tcgtcacacc 120
gctcaacaga ttcaacgcct tgaatcgagt ttcaaggagt gtcctcatcc agatgagaaa 180
cagaggaacc agcttagcag agaattgggt ttggctccaa gacaaatcaa gttctggttt 240
cagaacagaa gaactcagct taaggctcaa catgagagag cagataatag tgcactaaag 300
gcagagaatg ataaaattcg ttgcgaaaac attgctatta gagaagctct caagcatgct 360
atatgtccta actgtggagg tcctcctgtt agtgaagatc cttactttga tgaacaaaag 420
cttcggattg aaaatgcaca ccttagagaa gagcttgaaa gaatgtctac cattgcatca 480
aagtacatgg gaagaccgat atcgcaactc tctacgctac atccaatgca catctcaccg 540
ttggatttgt caatgactag tttaactggt tgtggacctt ttggtcatgg tccttcactc 600
gattttgatc ttcttccagg aagttctatg gctgttggtc ctaataataa tctgcaatct 660
cagcctaact tggctatatc agacatggat aagcctatta tgaccggcat tgctttgact 720
gcaatggaag aattgctcag gcttcttcag acaaatgaac ctctatggac aagaacagat 780
ggctgcagag acattctcaa tcttggtagc tatgagaatg ttttcccaag atcaagtaac 840
cgagggaaga accagaactt tcgagtcgaa gcatcaaggt cttctggtat tgtcttcatg 900
aatgctatgg cacttgtcga catgttcatg gattgtgtca agtggacaga actctttccc 960
tctatcattg cagcttctaa aacacttgca gtgatttctt caggaatggg aggtacccat 1020
gagggtgcat tgcatttgtt gtatgaagaa atggaagtgc tttcgccttt agtagcaaca 1080
cgcgaattct gcgagctacg ctattgtcaa cagactgaac aaggaagctg gatagttgta 1140
aacgtctcat atgatcttcc tcagtttgtt tctcactctc agtcctatag atttccatct 1200
ggatgcttga ttcaggatat gcccaatgga tattccaagg ttacttgggt tgaacatatt 1260
gaaactgaag aaaaagaact ggttcatgag ctatacagag agattattca cagagggatt 1320
gcttttgggg ctgatcgttg ggttaccact ctccagagaa tgtgtgaaag atttgcttct 1380
ctatcggtac cagcgtcttc atctcgtgat ctcggtggag tgattctatc accggaaggg 1440
aagagaagca tgatgagact tgctcagagg atgatcagca actactgttt aagtgtcagc 1500
agatccaaca acacacgctc aaccgttgtt tcggaactga acgaagttgg aatccgtgtg 1560
actgcacata agagccctga accaaacggc acagtcctat gtgcagccac cactttctgg 1620
cttcccaatt ctcctcaaaa tgtcttcaat ttcctcaaag acgaaagaac ccgtcctcag 1680
tgggatgttc tttcaaacgg aaacgcagtg caagaagttg ctcacatctc aaacggatca 1740
catcctggaa actgcatatc ggttctacgt ggatccaatg caacacatag caacaacatg 1800
cttattctgc aagaaagctc aacagactca tcaggagcat ttgtggtcta cagtccagtg 1860
gatttagcag cattgaacat cgcaatgagc ggtgaagatc cttcttatat tcctctcttg 1920
tcctcaggtt tcacaatctc accagatgga aatggctcaa actctgaaca aggaggagcc 1980
tcgacgagct caggacgggc atcagctagc ggttcgttga taacggttgg gtttcagata 2040
atggtaagca atttaccgac ggcaaaactg aatatggagt cggtggaaac ggttaataac 2100
ctgataggaa caactgtaca tcaaattaaa accgccttga gcggtcctac agcttcaact 2160
acagcttga 2169
<210> 405
<211> 722
<212> PRT
<213> Arabidopsis thaliana
<400> 405
Met Ser Phe Val Val Gly Val Gly Gly Ser Gly Ser Gly Ser Gly Gly
1 5 10 15
Asp Gly Gly Gly Ser His His His Asp Gly Ser Glu Thr Asp Arg Lys
20 25 30
Lys Lys Arg Tyr His Arg His Thr Ala Gln Gln Ile Gln Arg Leu Glu
35 40 45
Ser Ser Phe Lys Glu Cys Pro His Pro Asp Glu Lys Gln Arg Asn Gln
50 55 60
Leu Ser Arg Glu Leu Gly Leu Ala Pro Arg Gln Ile Lys Phe Trp Phe
65 70 75 80
Gln Asn Arg Arg Thr Gln Leu Lys Ala Gln His Glu Arg Ala Asp Asn
85 90 95
Ser Ala Leu Lys Ala Glu Asn Asp Lys Ile Arg Cys Glu Asn Ile Ala
100 105 110
Ile Arg Glu Ala Leu Lys His Ala Ile Cys Pro Asn Cys Gly Gly Pro
115 120 125
Pro Val Ser Glu Asp Pro Tyr Phe Asp Glu Gln Lys Leu Arg Ile Glu
130 135 140
Asn Ala His Leu Arg Glu Glu Leu Glu Arg Met Ser Thr Ile Ala Ser
145 150 155 160
Lys Tyr Met Gly Arg Pro Ile Ser Gln Leu Ser Thr Leu His Pro Met
165 170 175
His Ile Ser Pro Leu Asp Leu Ser Met Thr Ser Leu Thr Gly Cys Gly
180 185 190
Pro Phe Gly His Gly Pro Ser Leu Asp Phe Asp Leu Leu Pro Gly Ser
195 200 205
Ser Met Ala Val Gly Pro Asn Asn Asn Leu Gln Ser Gln Pro Asn Leu
210 215 220
Ala Ile Ser Asp Met Asp Lys Pro Ile Met Thr Gly Ile Ala Leu Thr
225 230 235 240
Ala Met Glu Glu Leu Leu Arg Leu Leu Gln Thr Asn Glu Pro Leu Trp
245 250 255
Thr Arg Thr Asp Gly Cys Arg Asp Ile Leu Asn Leu Gly Ser Tyr Glu
260 265 270
Asn Val Phe Pro Arg Ser Ser Asn Arg Gly Lys Asn Gln Asn Phe Arg
275 280 285
Val Glu Ala Ser Arg Ser Ser Gly Ile Val Phe Met Asn Ala Met Ala
290 295 300
Leu Val Asp Met Phe Met Asp Cys Val Lys Trp Thr Glu Leu Phe Pro
305 310 315 320
Ser Ile Ile Ala Ala Ser Lys Thr Leu Ala Val Ile Ser Ser Gly Met
325 330 335
Gly Gly Thr His Glu Gly Ala Leu His Leu Leu Tyr Glu Glu Met Glu
340 345 350
Val Leu Ser Pro Leu Val Ala Thr Arg Glu Phe Cys Glu Leu Arg Tyr
355 360 365
Cys Gln Gln Thr Glu Gln Gly Ser Trp Ile Val Val Asn Val Ser Tyr
370 375 380
Asp Leu Pro Gln Phe Val Ser His Ser Gln Ser Tyr Arg Phe Pro Ser
385 390 395 400
Gly Cys Leu Ile Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr Trp
405 410 415
Val Glu His Ile Glu Thr Glu Glu Lys Glu Leu Val His Glu Leu Tyr
420 425 430
Arg Glu Ile Ile His Arg Gly Ile Ala Phe Gly Ala Asp Arg Trp Val
435 440 445
Thr Thr Leu Gln Arg Met Cys Glu Arg Phe Ala Ser Leu Ser Val Pro
450 455 460
Ala Ser Ser Ser Arg Asp Leu Gly Gly Val Ile Leu Ser Pro Glu Gly
465 470 475 480
Lys Arg Ser Met Met Arg Leu Ala Gln Arg Met Ile Ser Asn Tyr Cys
485 490 495
Leu Ser Val Ser Arg Ser Asn Asn Thr Arg Ser Thr Val Val Ser Glu
500 505 510
Leu Asn Glu Val Gly Ile Arg Val Thr Ala His Lys Ser Pro Glu Pro
515 520 525
Asn Gly Thr Val Leu Cys Ala Ala Thr Thr Phe Trp Leu Pro Asn Ser
530 535 540
Pro Gln Asn Val Phe Asn Phe Leu Lys Asp Glu Arg Thr Arg Pro Gln
545 550 555 560
Trp Asp Val Leu Ser Asn Gly Asn Ala Val Gln Glu Val Ala His Ile
565 570 575
Ser Asn Gly Ser His Pro Gly Asn Cys Ile Ser Val Leu Arg Gly Ser
580 585 590
Asn Ala Thr His Ser Asn Asn Met Leu Ile Leu Gln Glu Ser Ser Thr
595 600 605
Asp Ser Ser Gly Ala Phe Val Val Tyr Ser Pro Val Asp Leu Ala Ala
610 615 620
Leu Asn Ile Ala Met Ser Gly Glu Asp Pro Ser Tyr Ile Pro Leu Leu
625 630 635 640
Ser Ser Gly Phe Thr Ile Ser Pro Asp Gly Asn Gly Ser Asn Ser Glu
645 650 655
Gln Gly Gly Ala Ser Thr Ser Ser Gly Arg Ala Ser Ala Ser Gly Ser
660 665 670
Leu Ile Thr Val Gly Phe Gln Ile Met Val Ser Asn Leu Pro Thr Ala
675 680 685
Lys Leu Asn Met Glu Ser Val Glu Thr Val Asn Asn Leu Ile Gly Thr
690 695 700
Thr Val His Gln Ile Lys Thr Ala Leu Ser Gly Pro Thr Ala Ser Thr
705 710 715 720
Thr Ala
<210> 406
<211> 2166
<212> DNA
<213> Arabidopsis thaliana
<400> 406
atgttcgagc caaatatgct gcttgcggct atgaacaacg cagacagcaa taaccacaac 60
tacaaccatg aagacaacaa taatgaagga tttcttcggg acgatgaatt cgacagtccg 120
aatactaaat cgggaagtga gaatcaagaa ggaggatcag gaaacgacca agatcctctt 180
catcctaaca agaagaaacg atatcatcga cacacccaac ttcagatcca ggagatggaa 240
gcgttcttca aagagtgtcc tcacccagat gacaagcaaa ggaaacagct aagccgtgaa 300
ttgaatttgg aacctcttca ggtcaaattc tggttccaaa acaaacgtac ccaaatgaag 360
aatcatcacg agcggcatga gaactcacat cttcgggcgg agaacgaaaa gcttcgaaac 420
gacaacctaa gatatcgaga ggctcttgca aatgcttcgt gtcctaattg tggtggtcca 480
acagctatcg gagaaatgtc attcgacgaa caccaactcc gtctcgaaaa tgctcgatta 540
agggaagaga tcgaccgtat atccgcaatc gcagctaaat acgtaggcaa gccagtctca 600
aactatccac ttatgtctcc tcctcctctt cctccacgtc cactagaact cgccatggga 660
aatattggag gagaagctta tggaaacaat ccaaacgatc tccttaagtc catcactgca 720
ccaacagaat ctgacaaacc tgtcatcatc gacttatccg tggctgcaat ggaagagctc 780
atgaggatgg ttcaagtaga cgagcctctg tggaagagtt tggttttaga cgaagaagaa 840
tatgcaagga cctttcctag agggatcgga cctagaccgg ctggatatag atcagaagct 900
tcgcgagaaa gcgcggttgt gatcatgaat catgttaaca tcgttgagat tctcatggat 960
gtgaatcaat ggtcgacgat tttcgcgggg atggtttcta gagcaatgac attagcggtt 1020
ttatcgacag gagttgcagg aaactataat ggagctcttc aagtgatgag tgcagagttt 1080
caagttccat ctccattagt cccaacacgt gaaacctatt tcgcacgtta ctgtaaacaa 1140
caaggagatg gttcgtgggc ggttgtcgat atttcgttgg atagtctcca accaaatccc 1200
ccggctagat gcaggcggcg agcttcagga tgtttgattc aagaattgcc aaatggatat 1260
tctaaggtga cttgggtgga gcatgtggaa gttgatgaca gaggagttca taacttatac 1320
aaacacatgg ttagtactgg tcatgccttt ggtgctaaac gctgggtagc cattcttgac 1380
cgccaatgcg agcggttagc tagtgtcatg gctacaaaca tttcctctgg agaagttggc 1440
gtgataacca accaagaagg gaggaggagt atgctgaaat tggcagagcg gatggttata 1500
agcttttgtg caggagtgag tgcttcaacc gctcacacgt ggactacatt gtccggtaca 1560
ggagctgaag atgttagagt gatgactagg aagagtgtgg atgatccagg aaggcctcct 1620
ggtattgttc ttagtgcagc cacttctttt tggatccctg ttcctccaaa gcgagtcttt 1680
gacttcctca gagacgagaa ttcaagaaat gagtgggata ttctgtctaa tggaggagtt 1740
gtgcaagaaa tggcacatat tgctaacggg agggataccg gaaactgtgt ttctcttctt 1800
cgggtaaata gtgcaaactc tagccagagc aatatgctga tcctacaaga gagctgcact 1860
gatcctacag cttcctttgt gatctatgct ccagtcgata ttgtagctat gaacatagtg 1920
cttaatggag gtgatccaga ctatgtggct ctgcttccat caggttttgc tattcttcct 1980
gatggtaatg ccaatagtgg agcccctgga ggagatggag ggtcgctctt gactgttgct 2040
tttcagattc tggttgactc agttcctacg gctaagctgt ctcttggctc tgttgcaact 2100
gtcaacaatc taatagcttg cactgttgag agaatcaaag cttcaatgtc ttgtgagact 2160
gcttga 2166
<210> 407
<211> 721
<212> PRT
<213> Arabidopsis thaliana
<400> 407
Met Phe Glu Pro Asn Met Leu Leu Ala Ala Met Asn Asn Ala Asp Ser
1 5 10 15
Asn Asn His Asn Tyr Asn His Glu Asp Asn Asn Asn Glu Gly Phe Leu
20 25 30
Arg Asp Asp Glu Phe Asp Ser Pro Asn Thr Lys Ser Gly Ser Glu Asn
35 40 45
Gln Glu Gly Gly Ser Gly Asn Asp Gln Asp Pro Leu His Pro Asn Lys
50 55 60
Lys Lys Arg Tyr His Arg His Thr Gln Leu Gln Ile Gln Glu Met Glu
65 70 75 80
Ala Phe Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Gln
85 90 95
Leu Ser Arg Glu Leu Asn Leu Glu Pro Leu Gln Val Lys Phe Trp Phe
100 105 110
Gln Asn Lys Arg Thr Gln Met Lys Asn His His Glu Arg His Glu Asn
115 120 125
Ser His Leu Arg Ala Glu Asn Glu Lys Leu Arg Asn Asp Asn Leu Arg
130 135 140
Tyr Arg Glu Ala Leu Ala Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro
145 150 155 160
Thr Ala Ile Gly Glu Met Ser Phe Asp Glu His Gln Leu Arg Leu Glu
165 170 175
Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala
180 185 190
Lys Tyr Val Gly Lys Pro Val Ser Asn Tyr Pro Leu Met Ser Pro Pro
195 200 205
Pro Leu Pro Pro Arg Pro Leu Glu Leu Ala Met Gly Asn Ile Gly Gly
210 215 220
Glu Ala Tyr Gly Asn Asn Pro Asn Asp Leu Leu Lys Ser Ile Thr Ala
225 230 235 240
Pro Thr Glu Ser Asp Lys Pro Val Ile Ile Asp Leu Ser Val Ala Ala
245 250 255
Met Glu Glu Leu Met Arg Met Val Gln Val Asp Glu Pro Leu Trp Lys
260 265 270
Ser Leu Val Leu Asp Glu Glu Glu Tyr Ala Arg Thr Phe Pro Arg Gly
275 280 285
Ile Gly Pro Arg Pro Ala Gly Tyr Arg Ser Glu Ala Ser Arg Glu Ser
290 295 300
Ala Val Val Ile Met Asn His Val Asn Ile Val Glu Ile Leu Met Asp
305 310 315 320
Val Asn Gln Trp Ser Thr Ile Phe Ala Gly Met Val Ser Arg Ala Met
325 330 335
Thr Leu Ala Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala
340 345 350
Leu Gln Val Met Ser Ala Glu Phe Gln Val Pro Ser Pro Leu Val Pro
355 360 365
Thr Arg Glu Thr Tyr Phe Ala Arg Tyr Cys Lys Gln Gln Gly Asp Gly
370 375 380
Ser Trp Ala Val Val Asp Ile Ser Leu Asp Ser Leu Gln Pro Asn Pro
385 390 395 400
Pro Ala Arg Cys Arg Arg Arg Ala Ser Gly Cys Leu Ile Gln Glu Leu
405 410 415
Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp
420 425 430
Asp Arg Gly Val His Asn Leu Tyr Lys His Met Val Ser Thr Gly His
435 440 445
Ala Phe Gly Ala Lys Arg Trp Val Ala Ile Leu Asp Arg Gln Cys Glu
450 455 460
Arg Leu Ala Ser Val Met Ala Thr Asn Ile Ser Ser Gly Glu Val Gly
465 470 475 480
Val Ile Thr Asn Gln Glu Gly Arg Arg Ser Met Leu Lys Leu Ala Glu
485 490 495
Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala Ser Thr Ala His
500 505 510
Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Glu Asp Val Arg Val Met
515 520 525
Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu
530 535 540
Ser Ala Ala Thr Ser Phe Trp Ile Pro Val Pro Pro Lys Arg Val Phe
545 550 555 560
Asp Phe Leu Arg Asp Glu Asn Ser Arg Asn Glu Trp Asp Ile Leu Ser
565 570 575
Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp
580 585 590
Thr Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser Ser
595 600 605
Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Pro Thr Ala
610 615 620
Ser Phe Val Ile Tyr Ala Pro Val Asp Ile Val Ala Met Asn Ile Val
625 630 635 640
Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe
645 650 655
Ala Ile Leu Pro Asp Gly Asn Ala Asn Ser Gly Ala Pro Gly Gly Asp
660 665 670
Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val
675 680 685
Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Asn Leu
690 695 700
Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ser Met Ser Cys Glu Thr
705 710 715 720
Ala
<210> 408
<211> 2160
<212> DNA
<213> Arabidopsis thaliana
<400> 408
atgttcgagc caaatatgct gcttgcggct atgaacaacg cagacagcaa taaccacaac 60
tacaaccatg aagacaacaa taatgaagga tttcttcggg acgatgaatt cgacagtccg 120
aatactaaat cgggaagtga gaatcaagaa ggaggatcag gaaacgacca agatcctctt 180
catcctaaca agaagaaacg atatcatcga cacacccaac ttcagatcca ggagatggaa 240
gcgttcttca aagagtgtcc tcacccagat gacaagcaaa ggaaacagct aagccgtgaa 300
ttgaatttgg aacctcttca ggtcaaattc tggttccaaa acaaacgtac ccaaatgaag 360
aatcatcacg agcggcatga gaactcacat cttcgggcgg agaacgaaaa gcttcgaaac 420
gacaacctaa gatatcgaga ggctcttgca aatgcttcgt gtcctaattg tggtggtcca 480
acagctatcg gagaaatgtc attcgacgaa caccaactcc gtctcgaaaa tgctcgatta 540
agggaagaga tcgaccgtat atccgcaatc gcagctaaat acgtaggcaa gccagtctca 600
aactatccac ttatgtctcc tcctcctctt cctccacgtc cactagaact cgccatggga 660
aatattggag gagaagctta tggaaacaat ccaaacgatc tccttaagtc catcactgca 720
ccaacagaat ctgacaaacc tgtcatcatc gacttatccg tggctgcaat ggaagagctc 780
atgaggatgg ttcaagtaga cgagcctctg tggaagagtt tggttttaga cgaagaagaa 840
tatgcaagga cctttcctag agggatcgga cctagaccgg ctggatatag atcagaagct 900
tcgcgagaaa gcgcggttgt gatcatgaat catgttaaca tcgttgagat tctcatggat 960
gtgaatcaat ggtcgacgat tttcgcgggg atggtttcta gagcaatgac attagcggtt 1020
ttatcgacag gagttgcagg aaactataat ggagctcttc aagtgatgag tgcagagttt 1080
caagttccat ctccattagt cccaacacgt gaaacctatt tcgcacgtta ctgtaaacaa 1140
caaggagatg gttcgtgggc ggttgtcgat atttcgttgg atagtctcca accaaatccc 1200
ccggctagat gcaggcggcg agcttcagga tgtttgattc aagaattgcc aaatggatat 1260
tctaaggtga cttgggtgga gcatgtggaa gttgatgaca gaggagttca taacttatac 1320
aaacacatgg ttagtactgg tcatgccttt ggtgctaaac gctgggtagc cattcttgac 1380
cgccaatgcg agcggttagc tagtgtcatg gctacaaaca tttcctctgg agaagttggc 1440
gtgataacca accaagaagg gaggaggagt atgctgaaat tggcagagcg gatggttata 1500
agcttttgtg caggagtgag tgcttcaacc gctcacacgt ggactacatt gtccggtaca 1560
ggagctgaag atgttagagt gatgactagg aagagtgtgg atgatccagg aaggcctcct 1620
ggtattgttc ttagtgcagc cacttctttt tggatccctg ttcctccaaa gcgagtcttt 1680
gacttcctca gagacgagaa ttcaagaaat gagtgggata ttctgtctaa tggaggagtt 1740
gtgcaagaaa tggcacatat tgctaacggg agggataccg gaaactgtgt ttctcttctt 1800
cggagtgcaa actctagcca gagcaatatg ctgatcctac aagagagctg cactgatcct 1860
acagcttcct ttgtgatcta tgctccagtc gatattgtag ctatgaacat agtgcttaat 1920
ggaggtgatc cagactatgt ggctctgctt ccatcaggtt ttgctattct tcctgatggt 1980
aatgccaata gtggagcccc tggaggagat ggagggtcgc tcttgactgt tgcttttcag 2040
attctggttg actcagttcc tacggctaag ctgtctcttg gctctgttgc aactgtcaac 2100
aatctaatag cttgcactgt tgagagaatc aaagcttcaa tgtcttgtga gactgcttga 2160
<210> 409
<211> 719
<212> PRT
<213> Arabidopsis thaliana
<400> 409
Met Phe Glu Pro Asn Met Leu Leu Ala Ala Met Asn Asn Ala Asp Ser
1 5 10 15
Asn Asn His Asn Tyr Asn His Glu Asp Asn Asn Asn Glu Gly Phe Leu
20 25 30
Arg Asp Asp Glu Phe Asp Ser Pro Asn Thr Lys Ser Gly Ser Glu Asn
35 40 45
Gln Glu Gly Gly Ser Gly Asn Asp Gln Asp Pro Leu His Pro Asn Lys
50 55 60
Lys Lys Arg Tyr His Arg His Thr Gln Leu Gln Ile Gln Glu Met Glu
65 70 75 80
Ala Phe Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Gln
85 90 95
Leu Ser Arg Glu Leu Asn Leu Glu Pro Leu Gln Val Lys Phe Trp Phe
100 105 110
Gln Asn Lys Arg Thr Gln Met Lys Asn His His Glu Arg His Glu Asn
115 120 125
Ser His Leu Arg Ala Glu Asn Glu Lys Leu Arg Asn Asp Asn Leu Arg
130 135 140
Tyr Arg Glu Ala Leu Ala Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro
145 150 155 160
Thr Ala Ile Gly Glu Met Ser Phe Asp Glu His Gln Leu Arg Leu Glu
165 170 175
Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala
180 185 190
Lys Tyr Val Gly Lys Pro Val Ser Asn Tyr Pro Leu Met Ser Pro Pro
195 200 205
Pro Leu Pro Pro Arg Pro Leu Glu Leu Ala Met Gly Asn Ile Gly Gly
210 215 220
Glu Ala Tyr Gly Asn Asn Pro Asn Asp Leu Leu Lys Ser Ile Thr Ala
225 230 235 240
Pro Thr Glu Ser Asp Lys Pro Val Ile Ile Asp Leu Ser Val Ala Ala
245 250 255
Met Glu Glu Leu Met Arg Met Val Gln Val Asp Glu Pro Leu Trp Lys
260 265 270
Ser Leu Val Leu Asp Glu Glu Glu Tyr Ala Arg Thr Phe Pro Arg Gly
275 280 285
Ile Gly Pro Arg Pro Ala Gly Tyr Arg Ser Glu Ala Ser Arg Glu Ser
290 295 300
Ala Val Val Ile Met Asn His Val Asn Ile Val Glu Ile Leu Met Asp
305 310 315 320
Val Asn Gln Trp Ser Thr Ile Phe Ala Gly Met Val Ser Arg Ala Met
325 330 335
Thr Leu Ala Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala
340 345 350
Leu Gln Val Met Ser Ala Glu Phe Gln Val Pro Ser Pro Leu Val Pro
355 360 365
Thr Arg Glu Thr Tyr Phe Ala Arg Tyr Cys Lys Gln Gln Gly Asp Gly
370 375 380
Ser Trp Ala Val Val Asp Ile Ser Leu Asp Ser Leu Gln Pro Asn Pro
385 390 395 400
Pro Ala Arg Cys Arg Arg Arg Ala Ser Gly Cys Leu Ile Gln Glu Leu
405 410 415
Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp
420 425 430
Asp Arg Gly Val His Asn Leu Tyr Lys His Met Val Ser Thr Gly His
435 440 445
Ala Phe Gly Ala Lys Arg Trp Val Ala Ile Leu Asp Arg Gln Cys Glu
450 455 460
Arg Leu Ala Ser Val Met Ala Thr Asn Ile Ser Ser Gly Glu Val Gly
465 470 475 480
Val Ile Thr Asn Gln Glu Gly Arg Arg Ser Met Leu Lys Leu Ala Glu
485 490 495
Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala Ser Thr Ala His
500 505 510
Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Glu Asp Val Arg Val Met
515 520 525
Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu
530 535 540
Ser Ala Ala Thr Ser Phe Trp Ile Pro Val Pro Pro Lys Arg Val Phe
545 550 555 560
Asp Phe Leu Arg Asp Glu Asn Ser Arg Asn Glu Trp Asp Ile Leu Ser
565 570 575
Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp
580 585 590
Thr Gly Asn Cys Val Ser Leu Leu Arg Ser Ala Asn Ser Ser Gln Ser
595 600 605
Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Pro Thr Ala Ser Phe
610 615 620
Val Ile Tyr Ala Pro Val Asp Ile Val Ala Met Asn Ile Val Leu Asn
625 630 635 640
Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile
645 650 655
Leu Pro Asp Gly Asn Ala Asn Ser Gly Ala Pro Gly Gly Asp Gly Gly
660 665 670
Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr
675 680 685
Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Asn Leu Ile Ala
690 695 700
Cys Thr Val Glu Arg Ile Lys Ala Ser Met Ser Cys Glu Thr Ala
705 710 715
<210> 410
<211> 2409
<212> DNA
<213> Arabidopsis thaliana
<400> 410
atgaacttcg gtagtctctt cgataacaca cccggtggtg gctctaccgg agcaagactt 60
ctctccggtt taagttatgg caaccacacc gccgcaacta acgtcttacc cggtggtgct 120
atggctcaag cggcagcggc tgctagtctc ttctctcctc ctctaacgaa atctgtttac 180
gcttcttctg gcctctctct agccctcgag caaccggaga gaggaaccaa ccgtggagaa 240
gcatcgatga ggaacaataa taacgtcgga ggaggaggcg atactttcga tgggagtgtg 300
aacagaagaa gccgagaaga agaacatgag agtagatctg gtagtgataa cgttgaaggt 360
atctccggtg aagatcaaga cgctgctgat aagcctcctc ggaagaaacg ttatcaccga 420
cacactcctc aacaaatcca agaactcgaa tctatgttca aagagtgtcc gcatccagac 480
gagaaacaaa gattagaact aagtaagaga ctttgcttag agacaagaca agtcaagttc 540
tggttccaga atcgtcgcac tcagatgaag actcaattag agaggcatga gaacgcgtta 600
ttgagacaag agaacgataa gttaagagct gagaacatgt ctattcgtga agcaatgagg 660
aatccaatct gcaccaattg tggtggacct gccatgcttg gtgatgtctc tcttgaagaa 720
catcatctcc gtatcgaaaa cgctcgttta aaagacgagc ttgatcgtgt ctgtaacctc 780
accggtaagt tccttggcca ccaccataat caccactaca actcctcctt agaactcgct 840
gtcggcacca acaacaacgg tggacatttc gctttccctc ctgatttcgg cggtggtggt 900
ggttgcttac ctccgcagca gcagcagtcg acggtgatta atgggattga tcagaagtca 960
gttttgctgg agctggcttt aactgctatg gatgagttag tgaagcttgc tcagagtgaa 1020
gaaccgttat gggtcaaaag cttggacggt gagagagacg agcttaacca agatgagtac 1080
atgagaacat tttcatctac taaaccaacc ggtttagcta ctgaagcttc tagaacctct 1140
ggtatggtca tcatcaatag cttagctctc gtcgagactt taatggactc caatcggtgg 1200
acggagatgt tcccgtgtaa cgtcgcaaga gctacaacca ccgacgttat atccggtggg 1260
atggctggaa caataaatgg tgcacttcaa ctgatgaatg cagagctaca agttttgtct 1320
ccactggttc cggttcgtaa tgttaatttc ctccggttct gcaaacagca cgcggagggt 1380
gtgtgggcgg tggtggatgt atcaattgat cctgtcaggg aaaactctgg tggtgccccg 1440
gtaatccggc gactaccatc aggatgtgtg gtgcaggatg tgtctaatgg atactctaag 1500
gtcacgtggg tggagcatgc agaatacgac gagaaccaaa tccaccagct gtacaggccg 1560
ttgctacggt caggccttgg ttttggctct caaagatggc tcgctacact tcagagacag 1620
tgcgagtgtc tcgccatcct catttcttcc tccgttacat ctcacgacaa cacatcaata 1680
acgcctggtg gtcgaaaaag catgctgaag ttagctcaac gcatgacgtt caacttctgt 1740
tcgggaatct cggcgccgtc ggtccacaat tggagcaagc tcactgttgg aaatgttgac 1800
ccggacgttc gagttatgac ccgtaagagt gtggacgatc caggagagcc tccggggatt 1860
gttttgagtg ctgccacttc tgtttggcta cctgctgcac cacagcgtct gtatgatttc 1920
ttgcggaacg aacggatgag atgcgaatgg gatattctat ccaacggtgg tcccatgcag 1980
gagatggccc atatcaccaa aggtcaagat cagggtgtct ctctgctccg ctccaatgca 2040
atgaacgcga atcagagtag tatgctaatt cttcaggaga catgcattga cgcatctgga 2100
gcgcttgtag tatacgcgcc tgtcgacatt cccgccatgc atgtggtgat gaacggtggt 2160
gattcatcct acgtggctct ccttccgtcc ggtttcgctg ttcttcctga cggaggcatt 2220
gacggtggtg ggtcaggtga tggtgaccag cgaccggttg gtggtggatc cctcttgaca 2280
gtggcgtttc aaatccttgt aaacaatctc ccaacggcaa aactcacggt tgagtcggtg 2340
gagactgtca acaacctaat atcatgcacc gttcagaaga ttcgtgccgc tttacaatgc 2400
gaaagctga 2409
<210> 411
<211> 802
<212> PRT
<213> Arabidopsis thaliana
<400> 411
Met Asn Phe Gly Ser Leu Phe Asp Asn Thr Pro Gly Gly Gly Ser Thr
1 5 10 15
Gly Ala Arg Leu Leu Ser Gly Leu Ser Tyr Gly Asn His Thr Ala Ala
20 25 30
Thr Asn Val Leu Pro Gly Gly Ala Met Ala Gln Ala Ala Ala Ala Ala
35 40 45
Ser Leu Phe Ser Pro Pro Leu Thr Lys Ser Val Tyr Ala Ser Ser Gly
50 55 60
Leu Ser Leu Ala Leu Glu Gln Pro Glu Arg Gly Thr Asn Arg Gly Glu
65 70 75 80
Ala Ser Met Arg Asn Asn Asn Asn Val Gly Gly Gly Gly Asp Thr Phe
85 90 95
Asp Gly Ser Val Asn Arg Arg Ser Arg Glu Glu Glu His Glu Ser Arg
100 105 110
Ser Gly Ser Asp Asn Val Glu Gly Ile Ser Gly Glu Asp Gln Asp Ala
115 120 125
Ala Asp Lys Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
130 135 140
Gln Ile Gln Glu Leu Glu Ser Met Phe Lys Glu Cys Pro His Pro Asp
145 150 155 160
Glu Lys Gln Arg Leu Glu Leu Ser Lys Arg Leu Cys Leu Glu Thr Arg
165 170 175
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
180 185 190
Leu Glu Arg His Glu Asn Ala Leu Leu Arg Gln Glu Asn Asp Lys Leu
195 200 205
Arg Ala Glu Asn Met Ser Ile Arg Glu Ala Met Arg Asn Pro Ile Cys
210 215 220
Thr Asn Cys Gly Gly Pro Ala Met Leu Gly Asp Val Ser Leu Glu Glu
225 230 235 240
His His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
245 250 255
Val Cys Asn Leu Thr Gly Lys Phe Leu Gly His His His Asn His His
260 265 270
Tyr Asn Ser Ser Leu Glu Leu Ala Val Gly Thr Asn Asn Asn Gly Gly
275 280 285
His Phe Ala Phe Pro Pro Asp Phe Gly Gly Gly Gly Gly Cys Leu Pro
290 295 300
Pro Gln Gln Gln Gln Ser Thr Val Ile Asn Gly Ile Asp Gln Lys Ser
305 310 315 320
Val Leu Leu Glu Leu Ala Leu Thr Ala Met Asp Glu Leu Val Lys Leu
325 330 335
Ala Gln Ser Glu Glu Pro Leu Trp Val Lys Ser Leu Asp Gly Glu Arg
340 345 350
Asp Glu Leu Asn Gln Asp Glu Tyr Met Arg Thr Phe Ser Ser Thr Lys
355 360 365
Pro Thr Gly Leu Ala Thr Glu Ala Ser Arg Thr Ser Gly Met Val Ile
370 375 380
Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg Trp
385 390 395 400
Thr Glu Met Phe Pro Cys Asn Val Ala Arg Ala Thr Thr Thr Asp Val
405 410 415
Ile Ser Gly Gly Met Ala Gly Thr Ile Asn Gly Ala Leu Gln Leu Met
420 425 430
Asn Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Asn Val
435 440 445
Asn Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp Ala Val
450 455 460
Val Asp Val Ser Ile Asp Pro Val Arg Glu Asn Ser Gly Gly Ala Pro
465 470 475 480
Val Ile Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp Val Ser Asn
485 490 495
Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr Asp Glu Asn
500 505 510
Gln Ile His Gln Leu Tyr Arg Pro Leu Leu Arg Ser Gly Leu Gly Phe
515 520 525
Gly Ser Gln Arg Trp Leu Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu
530 535 540
Ala Ile Leu Ile Ser Ser Ser Val Thr Ser His Asp Asn Thr Ser Ile
545 550 555 560
Thr Pro Gly Gly Arg Lys Ser Met Leu Lys Leu Ala Gln Arg Met Thr
565 570 575
Phe Asn Phe Cys Ser Gly Ile Ser Ala Pro Ser Val His Asn Trp Ser
580 585 590
Lys Leu Thr Val Gly Asn Val Asp Pro Asp Val Arg Val Met Thr Arg
595 600 605
Lys Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val Leu Ser Ala
610 615 620
Ala Thr Ser Val Trp Leu Pro Ala Ala Pro Gln Arg Leu Tyr Asp Phe
625 630 635 640
Leu Arg Asn Glu Arg Met Arg Cys Glu Trp Asp Ile Leu Ser Asn Gly
645 650 655
Gly Pro Met Gln Glu Met Ala His Ile Thr Lys Gly Gln Asp Gln Gly
660 665 670
Val Ser Leu Leu Arg Ser Asn Ala Met Asn Ala Asn Gln Ser Ser Met
675 680 685
Leu Ile Leu Gln Glu Thr Cys Ile Asp Ala Ser Gly Ala Leu Val Val
690 695 700
Tyr Ala Pro Val Asp Ile Pro Ala Met His Val Val Met Asn Gly Gly
705 710 715 720
Asp Ser Ser Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Val Leu Pro
725 730 735
Asp Gly Gly Ile Asp Gly Gly Gly Ser Gly Asp Gly Asp Gln Arg Pro
740 745 750
Val Gly Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asn
755 760 765
Asn Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr Val Asn
770 775 780
Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Arg Ala Ala Leu Gln Cys
785 790 795 800
Glu Ser
<210> 412
<211> 2289
<212> DNA
<213> Arabidopsis thaliana
<400> 412
atgtatcatc caaacatgtt cgaatctcat catcatatgt tcgatatgac gccgaaaaac 60
tccgaaaacg atttgggtat caccgggagc cacgaagagg atttcgagac taagtccggc 120
gcagaagtca ccatggagaa tcctttagaa gaagagcttc aagatcctaa tcagcgtccc 180
aacaaaaaga agcgttacca ccgtcacaca caacgccaga ttcaagagct agagtcgttc 240
ttcaaggaat gtcctcatcc agacgataag caaagaaagg agctgagtcg cgagctaagc 300
ttagaacctc ttcaagtcaa gttttggttc caaaacaaac gcactcaaat gaaggcacaa 360
catgagaggc acgagaacca gatactgaag tcagaaaatg acaagctccg agcagagaac 420
aataggtaca aggatgctct aagcaacgca acatgcccaa actgtggtgg tccggcagct 480
ataggagaaa tgtccttcga cgaacagcat ttaaggatcg aaaatgctcg tttacgcgaa 540
gagattgaca gaatctctgc catagctgct aaatacgtag ggaagccttt aatggctaat 600
tcctcttctt tccctcagct ctcttcttca caccacattc cctcgcgctc gcttgatctt 660
gaagttggga actttgggaa caataacaat agccacactg gtttcgttgg ggaaatgttt 720
ggaagcagcg acattttgag gtcggtttcg ataccttctg aggctgataa gcctatgatt 780
gttgagttag ctgttgcagc aatggaagag cttgtgagaa tggctcaaac tggtgatccc 840
ttatgggttt caagcgataa ttctgttgag attctcaatg aagaagagta ttttaggacg 900
tttcctagag gaattggacc gaaacctatc ggtttgagat cagaagcttc aagagagtct 960
actgttgtta tcatgaatca tatcaatctc attgagattc taatggatgt gaatcaatgg 1020
tctagtgtgt tctgcgggat tgtatcaaga gcattgactc tagaagttct ctcaactggc 1080
gtagcaggga actacaatgg ggcattgcaa gtgatgacag cagagttcca agtcccatcg 1140
ccgcttgtcc ctactcgtga gaactacttt gtaaggtact gtaaacagca cagtgacggt 1200
atttgggcgg ttgtggatgt ctctttggac agcctaagac caagtccgat cactagaagc 1260
agaagaagac cctctggttg tctgattcaa gaattgcaga atggttactc caaggtgaca 1320
tgggtagagc atattgaggt ggatgataga tcggttcaca acatgtataa accgttggtt 1380
aataccggtt tagctttcgg tgcaaaacgt tgggtggcta cacttgaccg ccaatgtgag 1440
cggctcgcca gttccatggc cagcaacatt ccggcttgtg atctttccgt gataacgagt 1500
cctgagggga gaaagagcat gctgaaacta gcggagagaa tggtgatgag cttctgtacc 1560
ggagtcggcg cgtcaactgc gcatgcctgg actacattgt cgaccacagg atccgacgac 1620
gttcgggtca tgacccgaaa gagcatggat gatccgggaa gacctccagg catcgttctc 1680
agcgccgcta cttctttctg gatccctgta gctccaaaac gagtgttcga ttttctcaga 1740
gatgaaaact caagaagcga gtgggatata ctttccaatg gaggcttggt tcaagaaatg 1800
gctcatatcg caaatggtcg tgatcctggg aatagtgtct ccttgcttcg agtcaatagt 1860
gggaactcag ggcagagcaa catgttgatc ttacaagaaa gttgtacgga cgcatcaggg 1920
tcctatgtga tatacgcacc agttgatata atagctatga acgttgtcct gagtggtggt 1980
gatccggatt atgtcgcttt gttaccatcc ggattcgcta ttttgccgga tggctctgct 2040
agaggaggag gaggtagtgc taatgccagt gctggagccg gagttgaagg aggaggagag 2100
gggaataatc ttgaagtggt tactactact gggagttgtg gcggttcact actcacagtt 2160
gcgtttcaga tacttgttga ctctgttcct accgctaaac tctctctcgg ttcagttgct 2220
acagtcaata gtctgatcaa atgcactgtc gagcggatta aagccgctct ggcctgcgac 2280
ggagcctaa 2289
<210> 413
<211> 762
<212> PRT
<213> Arabidopsis thaliana
<400> 413
Met Tyr His Pro Asn Met Phe Glu Ser His His His Met Phe Asp Met
1 5 10 15
Thr Pro Lys Asn Ser Glu Asn Asp Leu Gly Ile Thr Gly Ser His Glu
20 25 30
Glu Asp Phe Glu Thr Lys Ser Gly Ala Glu Val Thr Met Glu Asn Pro
35 40 45
Leu Glu Glu Glu Leu Gln Asp Pro Asn Gln Arg Pro Asn Lys Lys Lys
50 55 60
Arg Tyr His Arg His Thr Gln Arg Gln Ile Gln Glu Leu Glu Ser Phe
65 70 75 80
Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser
85 90 95
Arg Glu Leu Ser Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn
100 105 110
Lys Arg Thr Gln Met Lys Ala Gln His Glu Arg His Glu Asn Gln Ile
115 120 125
Leu Lys Ser Glu Asn Asp Lys Leu Arg Ala Glu Asn Asn Arg Tyr Lys
130 135 140
Asp Ala Leu Ser Asn Ala Thr Cys Pro Asn Cys Gly Gly Pro Ala Ala
145 150 155 160
Ile Gly Glu Met Ser Phe Asp Glu Gln His Leu Arg Ile Glu Asn Ala
165 170 175
Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr
180 185 190
Val Gly Lys Pro Leu Met Ala Asn Ser Ser Ser Phe Pro Gln Leu Ser
195 200 205
Ser Ser His His Ile Pro Ser Arg Ser Leu Asp Leu Glu Val Gly Asn
210 215 220
Phe Gly Asn Asn Asn Asn Ser His Thr Gly Phe Val Gly Glu Met Phe
225 230 235 240
Gly Ser Ser Asp Ile Leu Arg Ser Val Ser Ile Pro Ser Glu Ala Asp
245 250 255
Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met Glu Glu Leu Val
260 265 270
Arg Met Ala Gln Thr Gly Asp Pro Leu Trp Val Ser Ser Asp Asn Ser
275 280 285
Val Glu Ile Leu Asn Glu Glu Glu Tyr Phe Arg Thr Phe Pro Arg Gly
290 295 300
Ile Gly Pro Lys Pro Ile Gly Leu Arg Ser Glu Ala Ser Arg Glu Ser
305 310 315 320
Thr Val Val Ile Met Asn His Ile Asn Leu Ile Glu Ile Leu Met Asp
325 330 335
Val Asn Gln Trp Ser Ser Val Phe Cys Gly Ile Val Ser Arg Ala Leu
340 345 350
Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala
355 360 365
Leu Gln Val Met Thr Ala Glu Phe Gln Val Pro Ser Pro Leu Val Pro
370 375 380
Thr Arg Glu Asn Tyr Phe Val Arg Tyr Cys Lys Gln His Ser Asp Gly
385 390 395 400
Ile Trp Ala Val Val Asp Val Ser Leu Asp Ser Leu Arg Pro Ser Pro
405 410 415
Ile Thr Arg Ser Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu Leu
420 425 430
Gln Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Ile Glu Val Asp
435 440 445
Asp Arg Ser Val His Asn Met Tyr Lys Pro Leu Val Asn Thr Gly Leu
450 455 460
Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu Asp Arg Gln Cys Glu
465 470 475 480
Arg Leu Ala Ser Ser Met Ala Ser Asn Ile Pro Ala Cys Asp Leu Ser
485 490 495
Val Ile Thr Ser Pro Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu
500 505 510
Arg Met Val Met Ser Phe Cys Thr Gly Val Gly Ala Ser Thr Ala His
515 520 525
Ala Trp Thr Thr Leu Ser Thr Thr Gly Ser Asp Asp Val Arg Val Met
530 535 540
Thr Arg Lys Ser Met Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu
545 550 555 560
Ser Ala Ala Thr Ser Phe Trp Ile Pro Val Ala Pro Lys Arg Val Phe
565 570 575
Asp Phe Leu Arg Asp Glu Asn Ser Arg Ser Glu Trp Asp Ile Leu Ser
580 585 590
Asn Gly Gly Leu Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp
595 600 605
Pro Gly Asn Ser Val Ser Leu Leu Arg Val Asn Ser Gly Asn Ser Gly
610 615 620
Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ala Ser Gly
625 630 635 640
Ser Tyr Val Ile Tyr Ala Pro Val Asp Ile Ile Ala Met Asn Val Val
645 650 655
Leu Ser Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe
660 665 670
Ala Ile Leu Pro Asp Gly Ser Ala Arg Gly Gly Gly Gly Ser Ala Asn
675 680 685
Ala Ser Ala Gly Ala Gly Val Glu Gly Gly Gly Glu Gly Asn Asn Leu
690 695 700
Glu Val Val Thr Thr Thr Gly Ser Cys Gly Gly Ser Leu Leu Thr Val
705 710 715 720
Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu
725 730 735
Gly Ser Val Ala Thr Val Asn Ser Leu Ile Lys Cys Thr Val Glu Arg
740 745 750
Ile Lys Ala Ala Leu Ala Cys Asp Gly Ala
755 760
<210> 414
<211> 2157
<212> DNA
<213> Glycine max
<400> 414
atggagtttg gaagtggttc tcctggtgat cgccatcatc accatgatgg ttcttctgat 60
tcccagcgaa ggaagaagcg ttaccaccgt cacacagcta accagattca aaggcttgaa 120
tcgatgttca aggagtgtcc gcacccagat gagaagcaga gattgcagtt gagtagggag 180
ttaggcttgg cgcctagaca gatcaaattt tggttccaga acaggaggac ccagatgaag 240
gctcagcatg agagagctga taattgtgca ctccgggcag agaatgataa gatacgttgt 300
gagaacatag ccataaggga agccttgaaa aatgttatct gcccctcttg tggtggtcct 360
cctatgaatg atgattgtta ttttgatgaa cagaagttga gattggagaa tgcccaactc 420
aaagaggagc ttgatagagt atctagcatt gcagctaagt acattggaag gccaatttct 480
caactcccac ctgttcagcc tatccacata tcttctctgg acttgtcaat ggggactttt 540
gcaagccaag ggttgggtgg cccttccctt gatcttgatc ttctcccagg gagttcttca 600
tcatccatgc cgaatgtgcc tcctttccaa cccccttgtc tttcggacat ggataagtcc 660
ctcatgtcag acattgcctc aaatgccatg gaggaaatga tcaggctatt gcaaacaaat 720
gagcccttgt ggatgaaagg tgctgatggg agggatgtgc ttgatcttga ttcctatgaa 780
aggatgttcc ccaaggctaa tagtcacttg aagaacccca atgttcacgt tgaagcttct 840
agagattcag gagttgttat tatgaatggc ttaactttgg ttgacatgtt tatggacccg 900
aacaagtgga tggagctatt ttccaccatt gtcacaatgg ctagaacaat tgaggttata 960
tcttctggaa tgatgggtgg ccatggtggt tctttgcaat tgatgtatga ggagttgcaa 1020
gtgctttctc cacttgtttc tactagagaa ttctatttcc tgcgttactg tcaacaaatt 1080
gaacaaggct tatgggcaat agtagatgtt tcatatgatt ttactcaaga taaccaattt 1140
gctcctcaat ttcgatctca ccgtcttcct tctggtgtct ttatccaaga catgcctaat 1200
ggatattcca aggttacttg gattgaacat gtagagattg aagacaaaac cccagttcat 1260
aggctctata gaaacattat ttacagtggc attgcatttg gagcacaaag atggctaact 1320
acacttcaga ggatgtgtga aaggattgct tgtctattgg tgacaggaaa ttcaacccgt 1380
gatcttggag gagtgattcc ttctcctgag ggcaagagga gcatgatgaa acttgcacaa 1440
agaatggtca ccaatttttg tgcaagcatt agttcatcag ctggccacag atggaccaca 1500
ctctctggga gtggcatgaa tgaggttgga gtcagagtca ctgtgcacaa gagctcagac 1560
cctggccaac ctaatggtgt ggttctaagt gcagctacca ccatttggct ccccatccct 1620
ccacaaactg tgttcaattt ctttaaggat gaaaagaaaa ggcctcagtg ggatgttctt 1680
tccaatggca atgctgtgca agaggttgct catatagcaa atggttcaca ccctggtaac 1740
tgcatatctg tgcttcgagc attcaactca agtcaaaaca acatgctgat cctccaggag 1800
agctgtgtgg actcctcagg ttccctagtg gtgtactgtc cagttgatct gccagccatc 1860
aacatagcaa tgagtggtga ggacccttct tacatccctc tccttccctc aggtttcacc 1920
atttccccgg acggccaagc cgaccaagac ggcggaggag cctcaaccag cacaagcagc 1980
agggtcatgg ggggtggttc tggttctggt ggctcactca tcactgttgc attccaaatc 2040
ctagtgagta gcttgccatc tgccaaactc aacatggagt cggtgacaac tgttaatagc 2100
ctcattggca acactgtcca acacattaag gctgctttga attgtcctag ttcctga 2157
<210> 415
<211> 718
<212> PRT
<213> Glycine max
<400> 415
Met Glu Phe Gly Ser Gly Ser Pro Gly Asp Arg His His His His Asp
1 5 10 15
Gly Ser Ser Asp Ser Gln Arg Arg Lys Lys Arg Tyr His Arg His Thr
20 25 30
Ala Asn Gln Ile Gln Arg Leu Glu Ser Met Phe Lys Glu Cys Pro His
35 40 45
Pro Asp Glu Lys Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly Leu Ala
50 55 60
Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
65 70 75 80
Ala Gln His Glu Arg Ala Asp Asn Cys Ala Leu Arg Ala Glu Asn Asp
85 90 95
Lys Ile Arg Cys Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys Asn Val
100 105 110
Ile Cys Pro Ser Cys Gly Gly Pro Pro Met Asn Asp Asp Cys Tyr Phe
115 120 125
Asp Glu Gln Lys Leu Arg Leu Glu Asn Ala Gln Leu Lys Glu Glu Leu
130 135 140
Asp Arg Val Ser Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro Ile Ser
145 150 155 160
Gln Leu Pro Pro Val Gln Pro Ile His Ile Ser Ser Leu Asp Leu Ser
165 170 175
Met Gly Thr Phe Ala Ser Gln Gly Leu Gly Gly Pro Ser Leu Asp Leu
180 185 190
Asp Leu Leu Pro Gly Ser Ser Ser Ser Ser Met Pro Asn Val Pro Pro
195 200 205
Phe Gln Pro Pro Cys Leu Ser Asp Met Asp Lys Ser Leu Met Ser Asp
210 215 220
Ile Ala Ser Asn Ala Met Glu Glu Met Ile Arg Leu Leu Gln Thr Asn
225 230 235 240
Glu Pro Leu Trp Met Lys Gly Ala Asp Gly Arg Asp Val Leu Asp Leu
245 250 255
Asp Ser Tyr Glu Arg Met Phe Pro Lys Ala Asn Ser His Leu Lys Asn
260 265 270
Pro Asn Val His Val Glu Ala Ser Arg Asp Ser Gly Val Val Ile Met
275 280 285
Asn Gly Leu Thr Leu Val Asp Met Phe Met Asp Pro Asn Lys Trp Met
290 295 300
Glu Leu Phe Ser Thr Ile Val Thr Met Ala Arg Thr Ile Glu Val Ile
305 310 315 320
Ser Ser Gly Met Met Gly Gly His Gly Gly Ser Leu Gln Leu Met Tyr
325 330 335
Glu Glu Leu Gln Val Leu Ser Pro Leu Val Ser Thr Arg Glu Phe Tyr
340 345 350
Phe Leu Arg Tyr Cys Gln Gln Ile Glu Gln Gly Leu Trp Ala Ile Val
355 360 365
Asp Val Ser Tyr Asp Phe Thr Gln Asp Asn Gln Phe Ala Pro Gln Phe
370 375 380
Arg Ser His Arg Leu Pro Ser Gly Val Phe Ile Gln Asp Met Pro Asn
385 390 395 400
Gly Tyr Ser Lys Val Thr Trp Ile Glu His Val Glu Ile Glu Asp Lys
405 410 415
Thr Pro Val His Arg Leu Tyr Arg Asn Ile Ile Tyr Ser Gly Ile Ala
420 425 430
Phe Gly Ala Gln Arg Trp Leu Thr Thr Leu Gln Arg Met Cys Glu Arg
435 440 445
Ile Ala Cys Leu Leu Val Thr Gly Asn Ser Thr Arg Asp Leu Gly Gly
450 455 460
Val Ile Pro Ser Pro Glu Gly Lys Arg Ser Met Met Lys Leu Ala Gln
465 470 475 480
Arg Met Val Thr Asn Phe Cys Ala Ser Ile Ser Ser Ser Ala Gly His
485 490 495
Arg Trp Thr Thr Leu Ser Gly Ser Gly Met Asn Glu Val Gly Val Arg
500 505 510
Val Thr Val His Lys Ser Ser Asp Pro Gly Gln Pro Asn Gly Val Val
515 520 525
Leu Ser Ala Ala Thr Thr Ile Trp Leu Pro Ile Pro Pro Gln Thr Val
530 535 540
Phe Asn Phe Phe Lys Asp Glu Lys Lys Arg Pro Gln Trp Asp Val Leu
545 550 555 560
Ser Asn Gly Asn Ala Val Gln Glu Val Ala His Ile Ala Asn Gly Ser
565 570 575
His Pro Gly Asn Cys Ile Ser Val Leu Arg Ala Phe Asn Ser Ser Gln
580 585 590
Asn Asn Met Leu Ile Leu Gln Glu Ser Cys Val Asp Ser Ser Gly Ser
595 600 605
Leu Val Val Tyr Cys Pro Val Asp Leu Pro Ala Ile Asn Ile Ala Met
610 615 620
Ser Gly Glu Asp Pro Ser Tyr Ile Pro Leu Leu Pro Ser Gly Phe Thr
625 630 635 640
Ile Ser Pro Asp Gly Gln Ala Asp Gln Asp Gly Gly Gly Ala Ser Thr
645 650 655
Ser Thr Ser Ser Arg Val Met Gly Gly Gly Ser Gly Ser Gly Gly Ser
660 665 670
Leu Ile Thr Val Ala Phe Gln Ile Leu Val Ser Ser Leu Pro Ser Ala
675 680 685
Lys Leu Asn Met Glu Ser Val Thr Thr Val Asn Ser Leu Ile Gly Asn
690 695 700
Thr Val Gln His Ile Lys Ala Ala Leu Asn Cys Pro Ser Ser
705 710 715
<210> 416
<211> 2256
<212> DNA
<213> Glycine max
<400> 416
atggagggcc ccagtgagat aggtctcatt ggagaaaatt ttgatgctgg tttgatgggg 60
aggatgaggg acgatgagta tgaaagccgt tctggaagtg ataactttga aggcgcatct 120
ggtgatgatc aggatggtgg tgatgatcag ccacagagga agaagagata ccacagacac 180
acccctcacc aaattcaaga gcttgaggct ttcttcaagg agtgtcctca tcctgatgag 240
aagcaaaggt tggatctaag taagaggctt gctttggaga ataagcaagt caagttttgg 300
tttcagaatc gacgaaccca aatgaagacc caactggaac gccatgagaa cataatgctt 360
aggcaggaga atgataagct cagagctgag aacagtttga tgaaggacgc catgtcaaat 420
ccagtgtgta acaactgtgg tggccctgct attcctggcc aaatttcatt tgaagagcat 480
cagattagaa ttgagaatgc tagactaaag gatgaattga accgtatatg cgccttagca 540
aacaagttcc ttggcaagcc aatctcatca ttgaccaatc ccatggctct cccaacctca 600
aattctggtc ttgaacttgg tattggaagg aatgggattg gtggttcaag cacccttggc 660
actcccttgc ctatggggct tgatttggga gatggagtgt tgggcactca acctgcaatg 720
cctgggatta gaccagcatt gggattgatg ggaaatgaag ttcagcttga gagatctatg 780
cttatagatc ttgcattggc tgctatggag gaattgctga agatgactca ggcagagagc 840
ccactttgga tcaagagttt ggatggtgag aaggaaatgt ttaaccatga ggagtatgca 900
aggttgtttt ctccttgtat tggtccaaaa cccactggct atataactga agctacaaga 960
gaaactggga tagtaatcat caacagttta gcccttgtgg aaactttgat ggacgcgaat 1020
cgatgggcag agatgtttcc ctctatgatt gctagagcta tcaacctcga tgttatatct 1080
aatggcatgg gtggaacaag aaatggtgct ctacaagtga tgcatgctga ggttcaattg 1140
ctttcgccac tagttcctgt ccgtcaagta agattcatcc gattctgtaa gcagcatgca 1200
gaaggtgttt gggctgtggt tgatgtttct attgagattg gtcatgatgc tgctaatgca 1260
cagccagtca tgagctgtag gaggcttcct tctggctgta ttgtgcagga tatgcccaat 1320
ggttactcca aggttacttg gcttgaacac tgggagtatg atgagaatgt tgtacaccaa 1380
ctttatcgcc cattgcttag ttctggtgtt ggatttggtg ctcatagatg gatcgctacc 1440
ctccaaaggc aatgtgaatg cttggctatc ctcatgtcct cttccatttc aagtgatgat 1500
cacacagcat tgagccaagc tggtaggaga agcatgttga aattggcaca acgcatgact 1560
agtaacttct gttccggggt ttgtgcttcg tccgctcgga agtgggacag ccttcacata 1620
gggactcttg gtgatgacat gaaagtgatg actaggaaaa acgtggatga ccctggtgag 1680
cctcctggga ttgtactcag tgctgccact tctgtttggg tgccagtgtc acggcaaagg 1740
ctgttcgact ttctacgtga tgaacgcttg agaagtgagt gggacatctt gtccaatggt 1800
ggaccaatgc aggagatggt acatattgcc aaaggacaag gacatggaaa ctgcgtttct 1860
cttcttcgtg ctaatgccgt taacgccaac gatagcagca tgctgattct gcaggaaaca 1920
tggatggacg cgtcgtgctc agtggtggta tatgcaccag ttgacgtgca atcactgaac 1980
gtggtgatga gtggtggaga ttctgcatac gttgcactct tgccttcagg ctttgcaatt 2040
ctccccgatg gccactgcaa cgacaacggc tgcaacggga ctttacagaa gggtggcggt 2100
ggcaatgacg gcggcggaag ccttctcaca gtcgggttcc aaatactggt gaacagtctc 2160
ccaacagcaa agctcacagt ggagtcagtg gacactgtga acaacctcat ctcctgcacc 2220
attcagaaga tcaaagcttc tctcagagtt gcatga 2256
<210> 417
<211> 751
<212> PRT
<213> Glycine max
<400> 417
Met Glu Gly Pro Ser Glu Ile Gly Leu Ile Gly Glu Asn Phe Asp Ala
1 5 10 15
Gly Leu Met Gly Arg Met Arg Asp Asp Glu Tyr Glu Ser Arg Ser Gly
20 25 30
Ser Asp Asn Phe Glu Gly Ala Ser Gly Asp Asp Gln Asp Gly Gly Asp
35 40 45
Asp Gln Pro Gln Arg Lys Lys Arg Tyr His Arg His Thr Pro His Gln
50 55 60
Ile Gln Glu Leu Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp Glu
65 70 75 80
Lys Gln Arg Leu Asp Leu Ser Lys Arg Leu Ala Leu Glu Asn Lys Gln
85 90 95
Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu
100 105 110
Glu Arg His Glu Asn Ile Met Leu Arg Gln Glu Asn Asp Lys Leu Arg
115 120 125
Ala Glu Asn Ser Leu Met Lys Asp Ala Met Ser Asn Pro Val Cys Asn
130 135 140
Asn Cys Gly Gly Pro Ala Ile Pro Gly Gln Ile Ser Phe Glu Glu His
145 150 155 160
Gln Ile Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg Ile
165 170 175
Cys Ala Leu Ala Asn Lys Phe Leu Gly Lys Pro Ile Ser Ser Leu Thr
180 185 190
Asn Pro Met Ala Leu Pro Thr Ser Asn Ser Gly Leu Glu Leu Gly Ile
195 200 205
Gly Arg Asn Gly Ile Gly Gly Ser Ser Thr Leu Gly Thr Pro Leu Pro
210 215 220
Met Gly Leu Asp Leu Gly Asp Gly Val Leu Gly Thr Gln Pro Ala Met
225 230 235 240
Pro Gly Ile Arg Pro Ala Leu Gly Leu Met Gly Asn Glu Val Gln Leu
245 250 255
Glu Arg Ser Met Leu Ile Asp Leu Ala Leu Ala Ala Met Glu Glu Leu
260 265 270
Leu Lys Met Thr Gln Ala Glu Ser Pro Leu Trp Ile Lys Ser Leu Asp
275 280 285
Gly Glu Lys Glu Met Phe Asn His Glu Glu Tyr Ala Arg Leu Phe Ser
290 295 300
Pro Cys Ile Gly Pro Lys Pro Thr Gly Tyr Ile Thr Glu Ala Thr Arg
305 310 315 320
Glu Thr Gly Ile Val Ile Ile Asn Ser Leu Ala Leu Val Glu Thr Leu
325 330 335
Met Asp Ala Asn Arg Trp Ala Glu Met Phe Pro Ser Met Ile Ala Arg
340 345 350
Ala Ile Asn Leu Asp Val Ile Ser Asn Gly Met Gly Gly Thr Arg Asn
355 360 365
Gly Ala Leu Gln Val Met His Ala Glu Val Gln Leu Leu Ser Pro Leu
370 375 380
Val Pro Val Arg Gln Val Arg Phe Ile Arg Phe Cys Lys Gln His Ala
385 390 395 400
Glu Gly Val Trp Ala Val Val Asp Val Ser Ile Glu Ile Gly His Asp
405 410 415
Ala Ala Asn Ala Gln Pro Val Met Ser Cys Arg Arg Leu Pro Ser Gly
420 425 430
Cys Ile Val Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Leu
435 440 445
Glu His Trp Glu Tyr Asp Glu Asn Val Val His Gln Leu Tyr Arg Pro
450 455 460
Leu Leu Ser Ser Gly Val Gly Phe Gly Ala His Arg Trp Ile Ala Thr
465 470 475 480
Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile Leu Met Ser Ser Ser Ile
485 490 495
Ser Ser Asp Asp His Thr Ala Leu Ser Gln Ala Gly Arg Arg Ser Met
500 505 510
Leu Lys Leu Ala Gln Arg Met Thr Ser Asn Phe Cys Ser Gly Val Cys
515 520 525
Ala Ser Ser Ala Arg Lys Trp Asp Ser Leu His Ile Gly Thr Leu Gly
530 535 540
Asp Asp Met Lys Val Met Thr Arg Lys Asn Val Asp Asp Pro Gly Glu
545 550 555 560
Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Val Trp Val Pro Val
565 570 575
Ser Arg Gln Arg Leu Phe Asp Phe Leu Arg Asp Glu Arg Leu Arg Ser
580 585 590
Glu Trp Asp Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Val His
595 600 605
Ile Ala Lys Gly Gln Gly His Gly Asn Cys Val Ser Leu Leu Arg Ala
610 615 620
Asn Ala Val Asn Ala Asn Asp Ser Ser Met Leu Ile Leu Gln Glu Thr
625 630 635 640
Trp Met Asp Ala Ser Cys Ser Val Val Val Tyr Ala Pro Val Asp Val
645 650 655
Gln Ser Leu Asn Val Val Met Ser Gly Gly Asp Ser Ala Tyr Val Ala
660 665 670
Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly His Cys Asn Asp
675 680 685
Asn Gly Cys Asn Gly Thr Leu Gln Lys Gly Gly Gly Gly Asn Asp Gly
690 695 700
Gly Gly Ser Leu Leu Thr Val Gly Phe Gln Ile Leu Val Asn Ser Leu
705 710 715 720
Pro Thr Ala Lys Leu Thr Val Glu Ser Val Asp Thr Val Asn Asn Leu
725 730 735
Ile Ser Cys Thr Ile Gln Lys Ile Lys Ala Ser Leu Arg Val Ala
740 745 750
<210> 418
<211> 2256
<212> DNA
<213> Glycine max
<400> 418
atggccgccg acatgtccaa caataataat cctcctccca cttctcacgc caaagacttc 60
tttgcttctc ctgctctctc tctcagcctt gctggtattt ttcgccatgc cggggttgcc 120
gcggcggatg aggctgccac ttcggtggag gagggtgaag agtgtgagag gttagatgat 180
attagcagcg agaactccgg tcccacaaga tccagatcag aggatgattt cgaagttgaa 240
gctgaacatg aagatgacga tgctgatgga gacaagaaca agaacaagaa gaggaagaaa 300
tatcacaggc acactgctga ccagatcaaa gaaatggaag cgcttttcaa agagtcacca 360
catcctgatg aaaagcagag gcaacaacta agcaagcaat taggccttgc cccaaggcaa 420
gtcaagtttt ggttccaaaa tcgtcgaacc caaatcaagg caatacaaga gcgtcatgaa 480
aattctttgt tgaagtcaga aatagagaaa ctaaaggaga aaaacaagac cttacgagag 540
accataaaca aagcttgttg ccccaactgt ggcgtgccta ccacaagcag agatggtgcc 600
atgccaactg aagaacaaca actacgtatt gaaaatgcca aactcaaagc tgaggtagag 660
aagctccgag cagttttagg gaaatacgca ccagggtcaa cgtccccttc atgttcttct 720
ggccatgacc aagagaatag aagctctttg gatttttaca ctggaatttt tggacttgat 780
aagtcaagga taatggatac agtaaaccaa gctatggagg agctcatcaa gatggctacc 840
gtgggggaac cattatggct tcgtagcttc gagactggtc gcgaaattct taactatgat 900
gaatatgtta gggagtttgc agttgaaaat tcaagcagtg gaaagccaag gagatccatt 960
gaagcctcaa gagacactgc agttgttttt gtggatctcc ctcggcttgt ccaaagtttt 1020
ctagatgtga atcagtggaa ggaaatgttt ccgtgtttaa tatctaaggc ggccactgtt 1080
gatgtaatat gcaatggaga gggtcctggc aggaatggtg cagtgcaact gatgtttgct 1140
gagctgcaaa tgctcactcc tatggtgccc acaagagaag tatattttgt ccgtttctgc 1200
aagcagttga gtgctgaaca gtgggcaatc gttgatgtat ccatagacaa agtagaagac 1260
aacattgacg cgtccctcgt gaaatgcaga aaacgccctt ccggttgcat tattgaggac 1320
aagtccaatg gccattgcaa agtaatatgg gtggagcact tggaatgcca gaagagtgca 1380
gtccattcaa tgtatcgcac cattgtgaac agtggcctag cttttggggc caggcattgg 1440
attgcgactc tacaacttca atgtgaacgt ctagttttct tcatggcaac aaatgttccc 1500
atgaaggatt caaccggtgt tgccacgttg gccgggagaa aaagcatttt gaagttggca 1560
caaagaatga catggagttt ctgccatgca attggcgcgt caagcttcca cacatggact 1620
aagtttacaa gtaaaactgg agaagacata aggataagtt ctagaaagaa cttgaacgat 1680
cctggtgaac ctcttgggtt gatattgtgc gctgtttgtt ctgtatggtt gcctgtctca 1740
cctaatgttc tgtttgattt cctgagggat gaaacgcgac gaactgaatg ggacatcatg 1800
tcaagtggtg ggacagtgca gtccattgca aatttagcca aaggacaaga ccgaggaaat 1860
gccgtagcca ttcaaacaat taaatcgaaa gaaaacagtg tgtggatact gcaagatagc 1920
tacacaaacc cttatgagtc aatggtggta tatgcttctg tggacattac tggcactcag 1980
tctgtgatga caggatgtga ttcgagcaat cttgccatac tgccctcagg attctctatt 2040
attcctgatg gtcttgagtc aaggccattg gtgattagtt caaggcagga agaaaaaaat 2100
accgagggag gatctttgtt tacaatggca ttccagattc ttaccaatgc ttctcccgct 2160
gccaagttaa caatggagtc tgtggactcg gtcaacactc ttgtatcttg tacattgaga 2220
aatatccgaa cgagtctaca atgtgaagat ggctag 2256
<210> 419
<211> 751
<212> PRT
<213> Glycine max
<400> 419
Met Ala Ala Asp Met Ser Asn Asn Asn Asn Pro Pro Pro Thr Ser His
1 5 10 15
Ala Lys Asp Phe Phe Ala Ser Pro Ala Leu Ser Leu Ser Leu Ala Gly
20 25 30
Ile Phe Arg His Ala Gly Val Ala Ala Ala Asp Glu Ala Ala Thr Ser
35 40 45
Val Glu Glu Gly Glu Glu Cys Glu Arg Leu Asp Asp Ile Ser Ser Glu
50 55 60
Asn Ser Gly Pro Thr Arg Ser Arg Ser Glu Asp Asp Phe Glu Val Glu
65 70 75 80
Ala Glu His Glu Asp Asp Asp Ala Asp Gly Asp Lys Asn Lys Asn Lys
85 90 95
Lys Arg Lys Lys Tyr His Arg His Thr Ala Asp Gln Ile Lys Glu Met
100 105 110
Glu Ala Leu Phe Lys Glu Ser Pro His Pro Asp Glu Lys Gln Arg Gln
115 120 125
Gln Leu Ser Lys Gln Leu Gly Leu Ala Pro Arg Gln Val Lys Phe Trp
130 135 140
Phe Gln Asn Arg Arg Thr Gln Ile Lys Ala Ile Gln Glu Arg His Glu
145 150 155 160
Asn Ser Leu Leu Lys Ser Glu Ile Glu Lys Leu Lys Glu Lys Asn Lys
165 170 175
Thr Leu Arg Glu Thr Ile Asn Lys Ala Cys Cys Pro Asn Cys Gly Val
180 185 190
Pro Thr Thr Ser Arg Asp Gly Ala Met Pro Thr Glu Glu Gln Gln Leu
195 200 205
Arg Ile Glu Asn Ala Lys Leu Lys Ala Glu Val Glu Lys Leu Arg Ala
210 215 220
Val Leu Gly Lys Tyr Ala Pro Gly Ser Thr Ser Pro Ser Cys Ser Ser
225 230 235 240
Gly His Asp Gln Glu Asn Arg Ser Ser Leu Asp Phe Tyr Thr Gly Ile
245 250 255
Phe Gly Leu Asp Lys Ser Arg Ile Met Asp Thr Val Asn Gln Ala Met
260 265 270
Glu Glu Leu Ile Lys Met Ala Thr Val Gly Glu Pro Leu Trp Leu Arg
275 280 285
Ser Phe Glu Thr Gly Arg Glu Ile Leu Asn Tyr Asp Glu Tyr Val Arg
290 295 300
Glu Phe Ala Val Glu Asn Ser Ser Ser Gly Lys Pro Arg Arg Ser Ile
305 310 315 320
Glu Ala Ser Arg Asp Thr Ala Val Val Phe Val Asp Leu Pro Arg Leu
325 330 335
Val Gln Ser Phe Leu Asp Val Asn Gln Trp Lys Glu Met Phe Pro Cys
340 345 350
Leu Ile Ser Lys Ala Ala Thr Val Asp Val Ile Cys Asn Gly Glu Gly
355 360 365
Pro Gly Arg Asn Gly Ala Val Gln Leu Met Phe Ala Glu Leu Gln Met
370 375 380
Leu Thr Pro Met Val Pro Thr Arg Glu Val Tyr Phe Val Arg Phe Cys
385 390 395 400
Lys Gln Leu Ser Ala Glu Gln Trp Ala Ile Val Asp Val Ser Ile Asp
405 410 415
Lys Val Glu Asp Asn Ile Asp Ala Ser Leu Val Lys Cys Arg Lys Arg
420 425 430
Pro Ser Gly Cys Ile Ile Glu Asp Lys Ser Asn Gly His Cys Lys Val
435 440 445
Ile Trp Val Glu His Leu Glu Cys Gln Lys Ser Ala Val His Ser Met
450 455 460
Tyr Arg Thr Ile Val Asn Ser Gly Leu Ala Phe Gly Ala Arg His Trp
465 470 475 480
Ile Ala Thr Leu Gln Leu Gln Cys Glu Arg Leu Val Phe Phe Met Ala
485 490 495
Thr Asn Val Pro Met Lys Asp Ser Thr Gly Val Ala Thr Leu Ala Gly
500 505 510
Arg Lys Ser Ile Leu Lys Leu Ala Gln Arg Met Thr Trp Ser Phe Cys
515 520 525
His Ala Ile Gly Ala Ser Ser Phe His Thr Trp Thr Lys Phe Thr Ser
530 535 540
Lys Thr Gly Glu Asp Ile Arg Ile Ser Ser Arg Lys Asn Leu Asn Asp
545 550 555 560
Pro Gly Glu Pro Leu Gly Leu Ile Leu Cys Ala Val Cys Ser Val Trp
565 570 575
Leu Pro Val Ser Pro Asn Val Leu Phe Asp Phe Leu Arg Asp Glu Thr
580 585 590
Arg Arg Thr Glu Trp Asp Ile Met Ser Ser Gly Gly Thr Val Gln Ser
595 600 605
Ile Ala Asn Leu Ala Lys Gly Gln Asp Arg Gly Asn Ala Val Ala Ile
610 615 620
Gln Thr Ile Lys Ser Lys Glu Asn Ser Val Trp Ile Leu Gln Asp Ser
625 630 635 640
Tyr Thr Asn Pro Tyr Glu Ser Met Val Val Tyr Ala Ser Val Asp Ile
645 650 655
Thr Gly Thr Gln Ser Val Met Thr Gly Cys Asp Ser Ser Asn Leu Ala
660 665 670
Ile Leu Pro Ser Gly Phe Ser Ile Ile Pro Asp Gly Leu Glu Ser Arg
675 680 685
Pro Leu Val Ile Ser Ser Arg Gln Glu Glu Lys Asn Thr Glu Gly Gly
690 695 700
Ser Leu Phe Thr Met Ala Phe Gln Ile Leu Thr Asn Ala Ser Pro Ala
705 710 715 720
Ala Lys Leu Thr Met Glu Ser Val Asp Ser Val Asn Thr Leu Val Ser
725 730 735
Cys Thr Leu Arg Asn Ile Arg Thr Ser Leu Gln Cys Glu Asp Gly
740 745 750
<210> 420
<211> 2463
<212> DNA
<213> Glycine max
<400> 420
atgagttttg ggggatttct tgagaccaaa caaagtggtg gaggtggagg taggatcgta 60
gcagatattc cttacagcaa caacagcaac aatataatgc cctctagtgc tatctcgcag 120
cctcgtttag ccactcctac tttggtcaaa tccatgttca actcccctgg tctttctctt 180
gcacttcaaa gtgatataga tggaaaaagg gatgtgaaca gattaatgcc cgagaatttc 240
gagcagaatg gtttgagaag gaaccgggaa gaggagcatg aaagcagatc tggcagtgac 300
aacatggatg gtggttctgg tgatgatttt gatgctgccg acaacccacc gaggaaaaaa 360
cgctatcacc gacacactcc tcagcaaatt caagagcttg aatcgctctt caaggagtgt 420
cctcacccgg atgagaaaca aaggcttgaa ctcagcagaa ggcttaattt ggaaacgagg 480
caagtaaagt tttggttcca aaatcgaaga acacaaatga agacacaatt ggaacggcac 540
gagaactcac tcctaaggca agagaatgac aagcttagag cagaaaacat gtctatgagg 600
gaagccatga ggaatccaat atgcacaaac tgtggaggtc ctgcaatgat tggtgaaatt 660
tcactcgaag aacagcatct tagaattgag aatgctagat tgaaggacga actagaccgt 720
gtttgtgcac tcgctggcaa gtttttaggt cgacccattt catctctaac aggctcaatt 780
gggcctccat tgccaaactc aagcttggag cttggtgttg ggagcaatgg ttttggagga 840
ttaagcactg tgccttcaac aatgcctgat tttggggttg gaatatcaag ccctttagct 900
atggtgtcac cttcaagtac tagaccaacc acaacagcaa caacaacatt ggtgactcct 960
ccttctggct ttgacaacag atcaattgag aggtctattg ttcttgaact tgctttggct 1020
gcaatggatg agttggtgaa gatggctcag actgatgagc ctctttggat cagaagcttg 1080
gaaggtggaa gagaaattct caaccatgac gagtacacaa ggactatcac tccttgcatt 1140
ggcttgagac ccaatggctt tgtcactgag gcctctagac aaactggcat ggtcatcata 1200
aacagcttgg cccttgttga aacattaatg gactcaaatc gttggtcaga gatgttccct 1260
tgtatgattg ctagaacctc aaccgctgaa gttatatcta atggaataaa tggaactaga 1320
aatggtgccc ttcagctaat gcatgctgag cttcaagttc tttctccctt ggttcctgtt 1380
cgtgaggtca attttctacg cttttgcaag cagcacgcag aggggttatg ggcagtggta 1440
gatgtgtcca tagataccat ccgagacact tctggtgcac ccacttttgt gaactgtagg 1500
aggcttcctt ctggttgcgt ggtgcaagat atgccaaatg gttactctaa ggtgacatgg 1560
gtggaacatg cagaatacga cgaaagccaa attcaccagc tctatagacc cttgttgagc 1620
tcaggcatgg ggtttggtgc acaacgttgg gttgccactc ttcaacgcca atgcgagtgc 1680
ctagctattc taatatcctc agcagttccc tctagagaac attcagcaat aagttcaggt 1740
ggaaggagaa gcatgttgaa gctggcacag cgcatgacga acaacttctg tgctggtgtg 1800
tgtgcctcaa cagtgcacaa gtggaacaag ctgaacgcgg gaaacgtggg ggaggacgtg 1860
agggtgatga cgaggaagag cgtggatgac cccggtgaac cgccggggat cgtcctcagt 1920
gccgccacct cggtgtggct tcccgtctcg ccacagaggc tcttcgactt cctccgtgac 1980
gagcggctcc ggagtgagtg ggacatcctc tccaacggtg gaccaatgca agagatggct 2040
cacattgcca agggacaaga ccatgctaac tgtgtctccc tccttagagc cagtgctata 2100
aatgcgaacc agagcagcat gttgattctg caagagacgt gcacagacgc gtcggggtcg 2160
cttgtggtgt acgcgccggt ggacattccg gcaatgcacg tcgtgatgaa cggcggcgac 2220
tctgcttacg tggcgcttct tccgtcgggg ttcgccatcg tgcccgacgg gtccgtcgag 2280
gagaacggtg gcgcgtcgca gcagagggcg gcgagtggcg ggtgcctcct gacggtggcg 2340
tttcagattc tggtgaacag cctccccacg gcgaagctca cggtggagtc ggtggagacg 2400
gtgaacaacc tcatctcctg caccgtgcag aagatcaaat cagcgcttca ctgcgaaagc 2460
tga 2463
<210> 421
<211> 820
<212> PRT
<213> Glycine max
<400> 421
Met Ser Phe Gly Gly Phe Leu Glu Thr Lys Gln Ser Gly Gly Gly Gly
1 5 10 15
Gly Arg Ile Val Ala Asp Ile Pro Tyr Ser Asn Asn Ser Asn Asn Ile
20 25 30
Met Pro Ser Ser Ala Ile Ser Gln Pro Arg Leu Ala Thr Pro Thr Leu
35 40 45
Val Lys Ser Met Phe Asn Ser Pro Gly Leu Ser Leu Ala Leu Gln Ser
50 55 60
Asp Ile Asp Gly Lys Arg Asp Val Asn Arg Leu Met Pro Glu Asn Phe
65 70 75 80
Glu Gln Asn Gly Leu Arg Arg Asn Arg Glu Glu Glu His Glu Ser Arg
85 90 95
Ser Gly Ser Asp Asn Met Asp Gly Gly Ser Gly Asp Asp Phe Asp Ala
100 105 110
Ala Asp Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
115 120 125
Gln Ile Gln Glu Leu Glu Ser Leu Phe Lys Glu Cys Pro His Pro Asp
130 135 140
Glu Lys Gln Arg Leu Glu Leu Ser Arg Arg Leu Asn Leu Glu Thr Arg
145 150 155 160
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
165 170 175
Leu Glu Arg His Glu Asn Ser Leu Leu Arg Gln Glu Asn Asp Lys Leu
180 185 190
Arg Ala Glu Asn Met Ser Met Arg Glu Ala Met Arg Asn Pro Ile Cys
195 200 205
Thr Asn Cys Gly Gly Pro Ala Met Ile Gly Glu Ile Ser Leu Glu Glu
210 215 220
Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
225 230 235 240
Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro Ile Ser Ser Leu
245 250 255
Thr Gly Ser Ile Gly Pro Pro Leu Pro Asn Ser Ser Leu Glu Leu Gly
260 265 270
Val Gly Ser Asn Gly Phe Gly Gly Leu Ser Thr Val Pro Ser Thr Met
275 280 285
Pro Asp Phe Gly Val Gly Ile Ser Ser Pro Leu Ala Met Val Ser Pro
290 295 300
Ser Ser Thr Arg Pro Thr Thr Thr Ala Thr Thr Thr Leu Val Thr Pro
305 310 315 320
Pro Ser Gly Phe Asp Asn Arg Ser Ile Glu Arg Ser Ile Val Leu Glu
325 330 335
Leu Ala Leu Ala Ala Met Asp Glu Leu Val Lys Met Ala Gln Thr Asp
340 345 350
Glu Pro Leu Trp Ile Arg Ser Leu Glu Gly Gly Arg Glu Ile Leu Asn
355 360 365
His Asp Glu Tyr Thr Arg Thr Ile Thr Pro Cys Ile Gly Leu Arg Pro
370 375 380
Asn Gly Phe Val Thr Glu Ala Ser Arg Gln Thr Gly Met Val Ile Ile
385 390 395 400
Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg Trp Ser
405 410 415
Glu Met Phe Pro Cys Met Ile Ala Arg Thr Ser Thr Ala Glu Val Ile
420 425 430
Ser Asn Gly Ile Asn Gly Thr Arg Asn Gly Ala Leu Gln Leu Met His
435 440 445
Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Glu Val Asn
450 455 460
Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Leu Trp Ala Val Val
465 470 475 480
Asp Val Ser Ile Asp Thr Ile Arg Asp Thr Ser Gly Ala Pro Thr Phe
485 490 495
Val Asn Cys Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp Met Pro
500 505 510
Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr Asp Glu
515 520 525
Ser Gln Ile His Gln Leu Tyr Arg Pro Leu Leu Ser Ser Gly Met Gly
530 535 540
Phe Gly Ala Gln Arg Trp Val Ala Thr Leu Gln Arg Gln Cys Glu Cys
545 550 555 560
Leu Ala Ile Leu Ile Ser Ser Ala Val Pro Ser Arg Glu His Ser Ala
565 570 575
Ile Ser Ser Gly Gly Arg Arg Ser Met Leu Lys Leu Ala Gln Arg Met
580 585 590
Thr Asn Asn Phe Cys Ala Gly Val Cys Ala Ser Thr Val His Lys Trp
595 600 605
Asn Lys Leu Asn Ala Gly Asn Val Gly Glu Asp Val Arg Val Met Thr
610 615 620
Arg Lys Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val Leu Ser
625 630 635 640
Ala Ala Thr Ser Val Trp Leu Pro Val Ser Pro Gln Arg Leu Phe Asp
645 650 655
Phe Leu Arg Asp Glu Arg Leu Arg Ser Glu Trp Asp Ile Leu Ser Asn
660 665 670
Gly Gly Pro Met Gln Glu Met Ala His Ile Ala Lys Gly Gln Asp His
675 680 685
Ala Asn Cys Val Ser Leu Leu Arg Ala Ser Ala Ile Asn Ala Asn Gln
690 695 700
Ser Ser Met Leu Ile Leu Gln Glu Thr Cys Thr Asp Ala Ser Gly Ser
705 710 715 720
Leu Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Val Val Met
725 730 735
Asn Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala
740 745 750
Ile Val Pro Asp Gly Ser Val Glu Glu Asn Gly Gly Ala Ser Gln Gln
755 760 765
Arg Ala Ala Ser Gly Gly Cys Leu Leu Thr Val Ala Phe Gln Ile Leu
770 775 780
Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr
785 790 795 800
Val Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ser Ala Leu
805 810 815
His Cys Glu Ser
820
<210> 422
<211> 2508
<212> DNA
<213> Glycine max
<400> 422
atgagttttg ggggtttttt agacgacaaa tcaggtagtg gcggtgccag aatcaacaat 60
ttttcagata ttccttacaa taacaacaac gttaccaaca ccaccaccac caacaacaac 120
aacaacgata gaatgccctt tggtgcaatc tctcagccac gcctcgtgac cacaactccc 180
actttagcca aatccatgtt caactcacca gggctatctc tggcacttca aacgagtata 240
gatggacaag aagatgtgaa tagaatggct gagaatagct tcgaaccgaa cggtttgaga 300
agaagccgtg aagatgaaca tgaaagcaga tctggcagcg acaacatgga cggcggttcc 360
ggcgacgaac acgacgccgc cgacaaccct ccgaggaaaa aacgctatca ccgacacacc 420
cctcagcaga tacaagaact tgaagcgttg ttcaaggagt gtcctcatcc agatgaaaag 480
caaaggcttg aactgagtag aaggctgtgt ttggaaactc gtcaggtgaa gttttggttc 540
caaaatcgtc gaacccaaat gaagacccag ttggagcggc acgagaacac gttgctgagg 600
caagagaacg acaagcttcg agcggagaac atgtccataa gggacgcaat gaggaacccc 660
atgtgctcca attgcggcgg cctagccatc atcggcgaga tttcgctgga ggagcagcac 720
ctccgcatcg agaatgcgcg cctcaaagac gaacttgacc gcgtgtgtgc actcgcgggc 780
aagttcttgg ggcgccccgt ttcctccctg ccgagtctag agctcggcat gggaggaaac 840
gggttcgcag gaatgcctgc ggcaacattg ccgctggcac aagatttcgc aatgggtatg 900
tctgtgtcaa tgaataataa tgcgttggct atggtgtctc caccgactag tactaggccg 960
gccgcggccg gattcgatag gtcggtggag aggtcgatgt ttctcgagct agccttggct 1020
gctatggatg agttggtgaa gatggcgcag actggggaac ctctttggat gaggaatgtt 1080
gaaggaggga gggaaatttt gaaccatgag gagtacgtga ggaacttcac tccttccatt 1140
ggtttgagac ccaatggttt tgtgtctgag gcctctaggg aaaatgggat ggtcatcatt 1200
aacagcttgg cacttgttga gactcttatg gactcgaatc ggtgggcaga gatgtttcct 1260
tgtatcattg ccagaacatc caccacggaa gtgatatcta gtggaattaa cggaacaaga 1320
aatggagcac ttcaattaat gcatgctgaa cttcaagttc tttcgccttt ggtgccggtt 1380
cgtgaggtga atttcctacg gttttgcaag cagcacgcag aagggttgtg ggctgtggtg 1440
gatgtgtcca tagatagcat cagagaaagt tcaggagcac ccacttttgt gaacggtagg 1500
aggcttcctt ctggttgcgt ggtgcaagat atgcccaatg gttattccaa ggtgacatgg 1560
gtggagcatg cagaatacga agaaagccaa gttcaccagc tctataggcc tttgttgagc 1620
tcaggcatgg ggtttggtgc ccaacgttgg gtggctaccc ttcaacgcca atgcgagtgc 1680
cttgccattc taatgtcctc agcagcaccc tctcgagacc attccgcaat aacagcaggg 1740
ggaaggagga gcatggtgaa gctggcgcag cggatgacga acaacttctg cgcgggggtg 1800
tgcgcctcga cggtgcacaa gtggaacaag ctcaacgccg ccgctaacgt cgacgaggat 1860
gtcagggtca tgacgcgcaa gagcgtcgac gaccccgggg agccgccggg gatcgtcctc 1920
agcgccgcca cctccgtctg gctacccgtc tccccccacc gcctcttcga cttcctccgc 1980
gacgagcgcc tccgcagcga gtgggacatc ctctccaacg gtggccccat gcaggagatg 2040
gcccacatcg ccaagggcca agaccacggc aacgccgtct ctctccttag agccagtgcg 2100
ataaattcca accagagtag catgctgata ctgcaggaga catgcataga cgcagcaggg 2160
tcgcttgtgg tgtacgcgcc ggtggatatc ccagccatgc acgtggtgat gaacggtggc 2220
gattcggctt acgtggcgtt gttaccttca gggttcgcga tcgtccccga tgggcctggg 2280
tctcgtgggc ctcatcagaa cgggcccact tcctcaacaa caacaacaac aaacggcggt 2340
gataacggcg tgacgcgcgt gagtgggtcc ctcctaacgg tggcgtttca gatccttgtg 2400
aatagtctcc ctacggcgaa gctcacggta gagtccgtgg aaaccgtgaa caacctcatc 2460
tcctgcaccg ttcaaaagat caaagccgcg ctacactgcg aaagttaa 2508
<210> 423
<211> 835
<212> PRT
<213> Glycine max
<400> 423
Met Ser Phe Gly Gly Phe Leu Asp Asp Lys Ser Gly Ser Gly Gly Ala
1 5 10 15
Arg Ile Asn Asn Phe Ser Asp Ile Pro Tyr Asn Asn Asn Asn Val Thr
20 25 30
Asn Thr Thr Thr Thr Asn Asn Asn Asn Asn Asp Arg Met Pro Phe Gly
35 40 45
Ala Ile Ser Gln Pro Arg Leu Val Thr Thr Thr Pro Thr Leu Ala Lys
50 55 60
Ser Met Phe Asn Ser Pro Gly Leu Ser Leu Ala Leu Gln Thr Ser Ile
65 70 75 80
Asp Gly Gln Glu Asp Val Asn Arg Met Ala Glu Asn Ser Phe Glu Pro
85 90 95
Asn Gly Leu Arg Arg Ser Arg Glu Asp Glu His Glu Ser Arg Ser Gly
100 105 110
Ser Asp Asn Met Asp Gly Gly Ser Gly Asp Glu His Asp Ala Ala Asp
115 120 125
Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln Gln Ile
130 135 140
Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp Glu Lys
145 150 155 160
Gln Arg Leu Glu Leu Ser Arg Arg Leu Cys Leu Glu Thr Arg Gln Val
165 170 175
Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu
180 185 190
Arg His Glu Asn Thr Leu Leu Arg Gln Glu Asn Asp Lys Leu Arg Ala
195 200 205
Glu Asn Met Ser Ile Arg Asp Ala Met Arg Asn Pro Met Cys Ser Asn
210 215 220
Cys Gly Gly Leu Ala Ile Ile Gly Glu Ile Ser Leu Glu Glu Gln His
225 230 235 240
Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg Val Cys
245 250 255
Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro Val Ser Ser Leu Pro Ser
260 265 270
Leu Glu Leu Gly Met Gly Gly Asn Gly Phe Ala Gly Met Pro Ala Ala
275 280 285
Thr Leu Pro Leu Ala Gln Asp Phe Ala Met Gly Met Ser Val Ser Met
290 295 300
Asn Asn Asn Ala Leu Ala Met Val Ser Pro Pro Thr Ser Thr Arg Pro
305 310 315 320
Ala Ala Ala Gly Phe Asp Arg Ser Val Glu Arg Ser Met Phe Leu Glu
325 330 335
Leu Ala Leu Ala Ala Met Asp Glu Leu Val Lys Met Ala Gln Thr Gly
340 345 350
Glu Pro Leu Trp Met Arg Asn Val Glu Gly Gly Arg Glu Ile Leu Asn
355 360 365
His Glu Glu Tyr Val Arg Asn Phe Thr Pro Ser Ile Gly Leu Arg Pro
370 375 380
Asn Gly Phe Val Ser Glu Ala Ser Arg Glu Asn Gly Met Val Ile Ile
385 390 395 400
Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg Trp Ala
405 410 415
Glu Met Phe Pro Cys Ile Ile Ala Arg Thr Ser Thr Thr Glu Val Ile
420 425 430
Ser Ser Gly Ile Asn Gly Thr Arg Asn Gly Ala Leu Gln Leu Met His
435 440 445
Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Glu Val Asn
450 455 460
Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Leu Trp Ala Val Val
465 470 475 480
Asp Val Ser Ile Asp Ser Ile Arg Glu Ser Ser Gly Ala Pro Thr Phe
485 490 495
Val Asn Gly Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp Met Pro
500 505 510
Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr Glu Glu
515 520 525
Ser Gln Val His Gln Leu Tyr Arg Pro Leu Leu Ser Ser Gly Met Gly
530 535 540
Phe Gly Ala Gln Arg Trp Val Ala Thr Leu Gln Arg Gln Cys Glu Cys
545 550 555 560
Leu Ala Ile Leu Met Ser Ser Ala Ala Pro Ser Arg Asp His Ser Ala
565 570 575
Ile Thr Ala Gly Gly Arg Arg Ser Met Val Lys Leu Ala Gln Arg Met
580 585 590
Thr Asn Asn Phe Cys Ala Gly Val Cys Ala Ser Thr Val His Lys Trp
595 600 605
Asn Lys Leu Asn Ala Ala Ala Asn Val Asp Glu Asp Val Arg Val Met
610 615 620
Thr Arg Lys Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val Leu
625 630 635 640
Ser Ala Ala Thr Ser Val Trp Leu Pro Val Ser Pro His Arg Leu Phe
645 650 655
Asp Phe Leu Arg Asp Glu Arg Leu Arg Ser Glu Trp Asp Ile Leu Ser
660 665 670
Asn Gly Gly Pro Met Gln Glu Met Ala His Ile Ala Lys Gly Gln Asp
675 680 685
His Gly Asn Ala Val Ser Leu Leu Arg Ala Ser Ala Ile Asn Ser Asn
690 695 700
Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Cys Ile Asp Ala Ala Gly
705 710 715 720
Ser Leu Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Val Val
725 730 735
Met Asn Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly Phe
740 745 750
Ala Ile Val Pro Asp Gly Pro Gly Ser Arg Gly Pro His Gln Asn Gly
755 760 765
Pro Thr Ser Ser Thr Thr Thr Thr Thr Asn Gly Gly Asp Asn Gly Val
770 775 780
Thr Arg Val Ser Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val
785 790 795 800
Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr Val
805 810 815
Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ala Ala Leu His
820 825 830
Cys Glu Ser
835
<210> 424
<211> 2346
<212> DNA
<213> Glycine max
<400> 424
atgccagctg gtattatgat tccagcaaga aacatgccct cgatgattgg aagaaacgga 60
accgttggtg gctttggatt atcttcaggg ctttctcttg gccagattga aaaccataag 120
gcttcggaat ctcaaagatc tgaagaaatg ttccagccaa acctgatgga agctggtcag 180
ctccacccac tggacatgcc tcagaacact tcagagagcg atgtcccaag aatccgtgaa 240
gatgactttg acagtgccac caagtcaggt agtgaaaacc tagaaggtgc ttccggtgaa 300
gaccaagacc ctcgtcccaa caagaagaaa cgctaccacc gccacactca gcaccagatc 360
caggagatgg aagcgttctt taaggagtgt ccgcaccctg atgataaaca aaggaaggag 420
ctgagtcgag agttagggtt agagccattg caggttaagt tttggttcca gaacaagcgc 480
actcagatga agacccaaca tgaacgccat gagaacacac agctgagaac tgaaaacgag 540
aagcttcgag cagataacat gaggttcagg gaagctctcg gcaatgcctc gtgtcctaac 600
tgtggtgggc caaccgccat tggggaaatg tcattcgatg aacatcactt gaggctcgaa 660
aatgctcgcc tgagagaaga gattgatagg atttctgcca ttgctgcaaa gtatgttggg 720
aagcctgtgg tgagctatcc acttgtttct ccttcatcta ttcctccgcg cccactagag 780
cttgggattg gaggtggttt tggtggccaa cctggaggca ctggtgggga tatgtatggt 840
ggagctgcag gagatcttct taggtcaata agtggaccta ctgaagctga taagccaatc 900
ataatagagc ttgctgttgc agccatggag gagctcattg gaatggcgca aatgggtgag 960
cctctctggt tgactaccct ggatggcaca actgtgctca acgaggatga gtacatcagg 1020
tcctttcctc gagggattgg tcctaaacct gctggtttca agtttgaagc ttcgagggaa 1080
acggctgttg ttatcatgaa ccatgttaac cttgttgaga tcctcatgga cgtgaaccaa 1140
tggtccacag tgttcgctgg catagtctca agagcaatga ctttggaagt gttatcaaca 1200
ggggtggcag ggaattacaa cggtgcattg caagtgatga cagcagaagt gcaagtacct 1260
tcacctctgg tgccaactcg agagagctat tttgtgaggt attgtaagca gcacggtgac 1320
gggacttggg cagtagtgga cgtgtcattg gataatttgc gtcctagtcc ttctgccaga 1380
tgtagaagaa ggccctcagg ttgcttaatt caagaaatgc ccaatggcta ctcaaaggtc 1440
atatgggttg agcatgtaga agtggatgac agaggtgtcc ataatctata caagcagctt 1500
gttagctctg ggcatgcatt tggggcaaaa cgttgggttg caaccttgga tcgacaatgt 1560
gaaaggcttg ctagtgccat ggcaacaaac attcccacag tagatgttgg agtgataaca 1620
aaccaagatg ggaggaagag catgttgaaa cttgctgaga gaatggttat aagcttttgt 1680
gctggagtga gtgcatccac tgcacacaca tggacgacac tttctggaac tggtgctgat 1740
gatgtaaggg tgatgacacg taagagtgta gatgacccag gaaggcctcc cggcatcgtt 1800
ctcagtgctg caacttcttt ttggcttcct gtgtcaccaa aaagggtttt tgaattcctc 1860
cgcgatgaga actccagaag tgagtgggat attctttcca acggtggagt tgtccaagaa 1920
atggcacaca ttgccaatgg ccgagacact ggaaattgtg tctccctact tcgtgtgaat 1980
agtgcgaatt caagccaaag caacatgttg atattacaag agagttgcgc ggactcaaca 2040
ggatcttttg tgatatatgc tcctgtagat attgtggcaa tgaacgtggt tctgaatgga 2100
ggggacccgg actacgtggc ccttcttcct tcaggatttg ctatactccc agatggaacc 2160
actgcacatg gaggtggcat tggtgacact ggacatggtg gttctctctt gactgtggca 2220
tttcaaatat tggttgattc ggttccaacc gcaaagcttt ctcttggatc tgttgctact 2280
gttaacaatc tcattgcctg cactgttgag agaattaagg ctgctttatc tggtgaagtt 2340
gcttga 2346
<210> 425
<211> 781
<212> PRT
<213> Glycine max
<400> 425
Met Pro Ala Gly Ile Met Ile Pro Ala Arg Asn Met Pro Ser Met Ile
1 5 10 15
Gly Arg Asn Gly Thr Val Gly Gly Phe Gly Leu Ser Ser Gly Leu Ser
20 25 30
Leu Gly Gln Ile Glu Asn His Lys Ala Ser Glu Ser Gln Arg Ser Glu
35 40 45
Glu Met Phe Gln Pro Asn Leu Met Glu Ala Gly Gln Leu His Pro Leu
50 55 60
Asp Met Pro Gln Asn Thr Ser Glu Ser Asp Val Pro Arg Ile Arg Glu
65 70 75 80
Asp Asp Phe Asp Ser Ala Thr Lys Ser Gly Ser Glu Asn Leu Glu Gly
85 90 95
Ala Ser Gly Glu Asp Gln Asp Pro Arg Pro Asn Lys Lys Lys Arg Tyr
100 105 110
His Arg His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys
115 120 125
Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu
130 135 140
Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg
145 150 155 160
Thr Gln Met Lys Thr Gln His Glu Arg His Glu Asn Thr Gln Leu Arg
165 170 175
Thr Glu Asn Glu Lys Leu Arg Ala Asp Asn Met Arg Phe Arg Glu Ala
180 185 190
Leu Gly Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly
195 200 205
Glu Met Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu
210 215 220
Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly
225 230 235 240
Lys Pro Val Val Ser Tyr Pro Leu Val Ser Pro Ser Ser Ile Pro Pro
245 250 255
Arg Pro Leu Glu Leu Gly Ile Gly Gly Gly Phe Gly Gly Gln Pro Gly
260 265 270
Gly Thr Gly Gly Asp Met Tyr Gly Gly Ala Ala Gly Asp Leu Leu Arg
275 280 285
Ser Ile Ser Gly Pro Thr Glu Ala Asp Lys Pro Ile Ile Ile Glu Leu
290 295 300
Ala Val Ala Ala Met Glu Glu Leu Ile Gly Met Ala Gln Met Gly Glu
305 310 315 320
Pro Leu Trp Leu Thr Thr Leu Asp Gly Thr Thr Val Leu Asn Glu Asp
325 330 335
Glu Tyr Ile Arg Ser Phe Pro Arg Gly Ile Gly Pro Lys Pro Ala Gly
340 345 350
Phe Lys Phe Glu Ala Ser Arg Glu Thr Ala Val Val Ile Met Asn His
355 360 365
Val Asn Leu Val Glu Ile Leu Met Asp Val Asn Gln Trp Ser Thr Val
370 375 380
Phe Ala Gly Ile Val Ser Arg Ala Met Thr Leu Glu Val Leu Ser Thr
385 390 395 400
Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Thr Ala Glu
405 410 415
Val Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val
420 425 430
Arg Tyr Cys Lys Gln His Gly Asp Gly Thr Trp Ala Val Val Asp Val
435 440 445
Ser Leu Asp Asn Leu Arg Pro Ser Pro Ser Ala Arg Cys Arg Arg Arg
450 455 460
Pro Ser Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val
465 470 475 480
Ile Trp Val Glu His Val Glu Val Asp Asp Arg Gly Val His Asn Leu
485 490 495
Tyr Lys Gln Leu Val Ser Ser Gly His Ala Phe Gly Ala Lys Arg Trp
500 505 510
Val Ala Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala
515 520 525
Thr Asn Ile Pro Thr Val Asp Val Gly Val Ile Thr Asn Gln Asp Gly
530 535 540
Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met Val Ile Ser Phe Cys
545 550 555 560
Ala Gly Val Ser Ala Ser Thr Ala His Thr Trp Thr Thr Leu Ser Gly
565 570 575
Thr Gly Ala Asp Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp
580 585 590
Pro Gly Arg Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp
595 600 605
Leu Pro Val Ser Pro Lys Arg Val Phe Glu Phe Leu Arg Asp Glu Asn
610 615 620
Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu
625 630 635 640
Met Ala His Ile Ala Asn Gly Arg Asp Thr Gly Asn Cys Val Ser Leu
645 650 655
Leu Arg Val Asn Ser Ala Asn Ser Ser Gln Ser Asn Met Leu Ile Leu
660 665 670
Gln Glu Ser Cys Ala Asp Ser Thr Gly Ser Phe Val Ile Tyr Ala Pro
675 680 685
Val Asp Ile Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp
690 695 700
Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Thr
705 710 715 720
Thr Ala His Gly Gly Gly Ile Gly Asp Thr Gly His Gly Gly Ser Leu
725 730 735
Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys
740 745 750
Leu Ser Leu Gly Ser Val Ala Thr Val Asn Asn Leu Ile Ala Cys Thr
755 760 765
Val Glu Arg Ile Lys Ala Ala Leu Ser Gly Glu Val Ala
770 775 780
<210> 426
<211> 2166
<212> DNA
<213> Glycine max
<400> 426
atggagtacg gtagcggagg cggtgggtca cagtccccag gggagcaaga tggctcagat 60
tcccaagaga ggaggaagcg ctatcatcgt catactgcca atcagattca gaggcttgag 120
tcaatgttca aagagtgccc ccatccggat gagaaacaaa ggttgcaatt aagcagggag 180
ttaggcctgg ccccgaggca gatcaagttc tggttccaaa ataggaggac ccaaatgaag 240
gcccaacacg aaagagctga caattgtgct cttcgagctg acaatgacaa gatacgttgc 300
gagaacatag ccatcaggga ggccttgaag aatgttatct gcccttcttg tggtgcccca 360
cctctcaatg acgattgtta ttttgatgac caaaagttgc gattagagaa cgcccacctc 420
aaagaagagc ttgatagagt atctagcatt gctgccaagt acattggaag accaatttcc 480
caactcccgc cggtccagcc tattcatata tcgtctctgg acttatcaat ggcgagttat 540
ggaaaccaag ggatggttgg tcctgctcct tcttccctta atcttgatct tcttcctgct 600
gcagggactt cctcatcatc catgccttat catccccctt gcctttcgga catggacaag 660
tccctcatgt cagacattgc ttccaatgcc atggaagaat ttctaaggct cgtgcagaca 720
aacgaaccct tgtggcttaa atcaaacgtc gatgctagag atgttcttag ttgtgatgcc 780
tacgaaagaa tgttccacaa gcccaatact cgccccaaga atcctaacgt tcgcattgaa 840
gcatcccgag attctggagt tgtattaatg aatactttag ctttggttga tatgtttatg 900
gacccaaaca agtggataca actttttccc actattgtct ctgtggcaag gactattcaa 960
gtcatatctt ctgggatgat gggcagttgc agtggttctt tacaattgat gtatcaagag 1020
ttgcaagtgc tttctccact tgtttcaact cgggagtttt acttcctgcg ttactgtcag 1080
caaattgagc agggaacatg ggcagtaatg gacgtttctt atgattttcc ccaagatagc 1140
cactatgctc ctcaatttcg gtctcatcgt tgtccttctg gttgcttgat ccaggacatg 1200
cctgatgggc attccaagat tacttgggtt gaacacgtag agattgaaga taagactctt 1260
cctcaccggc tttatagaaa tcttatttat agtgggatgg catttggagc tgaaagatgg 1320
cttactaccc tccagaggat gtgtgaaaga cttacttatc tgatggctac aagcaatcct 1380
acccgggata atctaggagg agtaatttca tctcctgagg gcaagaggag catgatgaaa 1440
cttgctcaaa ggatggtcac caatttttgt gccaacatta gcacatcaag tggccatcga 1500
tggaccacgc tctctggatt gaatgaaatc gtagtaagag tcactgtcca caaaagctca 1560
gatcctggac aacctaatgg tgtggtgcta agtgcagcca ctactatttg gctccccacc 1620
cctcctcacg ctgtctttaa tttcttcaag gatgaaaaca aaagacctca gtgggatgtt 1680
ctttccaacg gtaatgccgt tcaagaggtt gccaacatag caaatggttt gcaccctggt 1740
aacagtatat cagttcttcg agctttcaac aacagtactc agaacatgtt aatactacaa 1800
gaaagctgca tagattccta tggttcattt gtggtttatt gcccagttga tctgccatcc 1860
atcaacttag caatgagtgg tgaagaccct tcatacattc ccctactacc aaatggattt 1920
accattttgc ctgatggtca gcctgaccag gaaggagatg atggagcatc aaccagctct 1980
aacaacgcaa acaggaatat agtaaggtct ggtggttcac tagttacaat tgcattccaa 2040
attcttgtga gcagcttgcc atctgctaaa ctcaatatgg agtcggtgac aactgttaac 2100
aatcttattg gctccactgt ccagcaaata aagtcttcct taagttgtcc taccctacct 2160
agctag 2166
<210> 427
<211> 721
<212> PRT
<213> Glycine max
<400> 427
Met Glu Tyr Gly Ser Gly Gly Gly Gly Ser Gln Ser Pro Gly Glu Gln
1 5 10 15
Asp Gly Ser Asp Ser Gln Glu Arg Arg Lys Arg Tyr His Arg His Thr
20 25 30
Ala Asn Gln Ile Gln Arg Leu Glu Ser Met Phe Lys Glu Cys Pro His
35 40 45
Pro Asp Glu Lys Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly Leu Ala
50 55 60
Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
65 70 75 80
Ala Gln His Glu Arg Ala Asp Asn Cys Ala Leu Arg Ala Asp Asn Asp
85 90 95
Lys Ile Arg Cys Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys Asn Val
100 105 110
Ile Cys Pro Ser Cys Gly Ala Pro Pro Leu Asn Asp Asp Cys Tyr Phe
115 120 125
Asp Asp Gln Lys Leu Arg Leu Glu Asn Ala His Leu Lys Glu Glu Leu
130 135 140
Asp Arg Val Ser Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro Ile Ser
145 150 155 160
Gln Leu Pro Pro Val Gln Pro Ile His Ile Ser Ser Leu Asp Leu Ser
165 170 175
Met Ala Ser Tyr Gly Asn Gln Gly Met Val Gly Pro Ala Pro Ser Ser
180 185 190
Leu Asn Leu Asp Leu Leu Pro Ala Ala Gly Thr Ser Ser Ser Ser Met
195 200 205
Pro Tyr His Pro Pro Cys Leu Ser Asp Met Asp Lys Ser Leu Met Ser
210 215 220
Asp Ile Ala Ser Asn Ala Met Glu Glu Phe Leu Arg Leu Val Gln Thr
225 230 235 240
Asn Glu Pro Leu Trp Leu Lys Ser Asn Val Asp Ala Arg Asp Val Leu
245 250 255
Ser Cys Asp Ala Tyr Glu Arg Met Phe His Lys Pro Asn Thr Arg Pro
260 265 270
Lys Asn Pro Asn Val Arg Ile Glu Ala Ser Arg Asp Ser Gly Val Val
275 280 285
Leu Met Asn Thr Leu Ala Leu Val Asp Met Phe Met Asp Pro Asn Lys
290 295 300
Trp Ile Gln Leu Phe Pro Thr Ile Val Ser Val Ala Arg Thr Ile Gln
305 310 315 320
Val Ile Ser Ser Gly Met Met Gly Ser Cys Ser Gly Ser Leu Gln Leu
325 330 335
Met Tyr Gln Glu Leu Gln Val Leu Ser Pro Leu Val Ser Thr Arg Glu
340 345 350
Phe Tyr Phe Leu Arg Tyr Cys Gln Gln Ile Glu Gln Gly Thr Trp Ala
355 360 365
Val Met Asp Val Ser Tyr Asp Phe Pro Gln Asp Ser His Tyr Ala Pro
370 375 380
Gln Phe Arg Ser His Arg Cys Pro Ser Gly Cys Leu Ile Gln Asp Met
385 390 395 400
Pro Asp Gly His Ser Lys Ile Thr Trp Val Glu His Val Glu Ile Glu
405 410 415
Asp Lys Thr Leu Pro His Arg Leu Tyr Arg Asn Leu Ile Tyr Ser Gly
420 425 430
Met Ala Phe Gly Ala Glu Arg Trp Leu Thr Thr Leu Gln Arg Met Cys
435 440 445
Glu Arg Leu Thr Tyr Leu Met Ala Thr Ser Asn Pro Thr Arg Asp Asn
450 455 460
Leu Gly Gly Val Ile Ser Ser Pro Glu Gly Lys Arg Ser Met Met Lys
465 470 475 480
Leu Ala Gln Arg Met Val Thr Asn Phe Cys Ala Asn Ile Ser Thr Ser
485 490 495
Ser Gly His Arg Trp Thr Thr Leu Ser Gly Leu Asn Glu Ile Val Val
500 505 510
Arg Val Thr Val His Lys Ser Ser Asp Pro Gly Gln Pro Asn Gly Val
515 520 525
Val Leu Ser Ala Ala Thr Thr Ile Trp Leu Pro Thr Pro Pro His Ala
530 535 540
Val Phe Asn Phe Phe Lys Asp Glu Asn Lys Arg Pro Gln Trp Asp Val
545 550 555 560
Leu Ser Asn Gly Asn Ala Val Gln Glu Val Ala Asn Ile Ala Asn Gly
565 570 575
Leu His Pro Gly Asn Ser Ile Ser Val Leu Arg Ala Phe Asn Asn Ser
580 585 590
Thr Gln Asn Met Leu Ile Leu Gln Glu Ser Cys Ile Asp Ser Tyr Gly
595 600 605
Ser Phe Val Val Tyr Cys Pro Val Asp Leu Pro Ser Ile Asn Leu Ala
610 615 620
Met Ser Gly Glu Asp Pro Ser Tyr Ile Pro Leu Leu Pro Asn Gly Phe
625 630 635 640
Thr Ile Leu Pro Asp Gly Gln Pro Asp Gln Glu Gly Asp Asp Gly Ala
645 650 655
Ser Thr Ser Ser Asn Asn Ala Asn Arg Asn Ile Val Arg Ser Gly Gly
660 665 670
Ser Leu Val Thr Ile Ala Phe Gln Ile Leu Val Ser Ser Leu Pro Ser
675 680 685
Ala Lys Leu Asn Met Glu Ser Val Thr Thr Val Asn Asn Leu Ile Gly
690 695 700
Ser Thr Val Gln Gln Ile Lys Ser Ser Leu Ser Cys Pro Thr Leu Pro
705 710 715 720
Ser
<210> 428
<211> 2169
<212> DNA
<213> Glycine max
<400> 428
atggagtttg gaagtggttc tcctggtgat caccatcatc accatgatgg ttcttctgat 60
tcccagagaa ggaagaagcg ttaccaccgt cacacagcta accagattca gaggcttgaa 120
tctatgttca aggagtgtcc gcacccagat gagaagcaga ggttgcagtt gagtagggag 180
ttaggcttgg cgcctagaca gatcaaattt tggttccaga acaggaggac ccagatgaag 240
gctcagcatg agagagctga taattgtgca ctccgggcag agaatgacaa gatacgttgt 300
gagaacatag ccataaggga agccttgaaa aatgttatct gcccctcttg tggtggtcct 360
cctatgaatg atgattgtta ttttgatgaa cagaagttga gattggagaa tgcccaactc 420
aaagaggagc ttgatagagt atctagcatt gcagctaagt acattggaag gccaatttct 480
caactcccac ctgttcagcc tattcacata tcttctctgg acctgtcaat ggggactttt 540
gcaagccaag ggttgggtgg cccttcactt gatcttgatc ttctccctgg gagttcttca 600
tcacccatgc tgaatgtgcc tcctttccaa ccagcatgtc tctcggacat ggataagtcc 660
ctcatgtcag acattgcctc aaatgccatg gaggaaatga tcaggctatt gcaaacgaat 720
gagcccttgt ggatgaaagg tgctgatggg agggatgtcc ttgatcttga ttcctatgag 780
agaatgttcc ccaaggctaa tagtcacttg aagaacccca atgttcatgt tgaagcttct 840
agagattcag gagttgtaat tatgaacggc ttaactttgg ttgacatgtt tatggacccg 900
aacaagtgga tggagctatt tcccaccatt gtcacaatgg ctagaacaat tgaggttata 960
tcttctggaa tgatgggtag ccatagtggt tctttgcaat tgatgtatga agagttgcaa 1020
gtactttctc cacttgtttc tactagagag ttctactttc tgcgttactg tcagcaaatt 1080
gaacaaggct tatgggcaat agtagatgtt tcatatgatt tccctcaaga taatcaattt 1140
gctcctcaat atcgatccca tcgtcttcct tctggtgtct ttatccaaga tatgcctaat 1200
ggatattcca aggttacttg gattgaacat gtagagattg aagacaaaac tccagttcat 1260
aggctctata gaaaccttat ttatagtggc attgcatttg gagcacaaag atggctaact 1320
acacttcaga ggatgtgtga aaggattgct tgtctaatgg tgacaggcaa ttcaacccgt 1380
gatcttggag gagtgattcc ctctcctgag ggcaagagga gcatgatgaa acttgcacaa 1440
agaatggtca ccaatttttg tgcaagcatt agtgcatcag ctggtcatag atggaccaca 1500
ctctctggga gtggcatgaa tgagattgga gtcagagtca ctgtgcataa gagctcagac 1560
cctggccaac ctaatggtgt ggtgctaagt gcagccacca ccatttggct ccccatccct 1620
ccacaaactg tgttcaattt ctttaaggat gaaaagaaaa ggcctcagtg ggatgttctt 1680
tccaatggca atgctgtgca agaggttgct catatagcaa atggtccaca ccctggtaac 1740
tgcatatctg tgcttcgagc attcaactca agtcaaaaca acatgctgat cctccaggag 1800
agctgtgtgg actcctcagg ttccctagtg gtgtactgtc cagttgatct gccagccatc 1860
aacatagcaa tgagtggtga ggacccttcc tacatccccc tcctcccctc aggcttcacc 1920
atttccccgg acggccaagc tgaccaagac ggcggaggag cctcgaccag cacaagcaca 1980
ggcagcaggg tcatgggggg tggttctggt cctggttctg gtggctcact catcactgtt 2040
gcattccaaa tcctagtgag tagcttgcca tctgccaaac tcaacatgga gtcggtgacc 2100
actgttaata gcctcatcgg caacactgtc caacacatta aggctgcttt gaattgtcct 2160
agttcctga 2169
<210> 429
<211> 722
<212> PRT
<213> Glycine max
<400> 429
Met Glu Phe Gly Ser Gly Ser Pro Gly Asp His His His His His Asp
1 5 10 15
Gly Ser Ser Asp Ser Gln Arg Arg Lys Lys Arg Tyr His Arg His Thr
20 25 30
Ala Asn Gln Ile Gln Arg Leu Glu Ser Met Phe Lys Glu Cys Pro His
35 40 45
Pro Asp Glu Lys Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly Leu Ala
50 55 60
Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
65 70 75 80
Ala Gln His Glu Arg Ala Asp Asn Cys Ala Leu Arg Ala Glu Asn Asp
85 90 95
Lys Ile Arg Cys Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys Asn Val
100 105 110
Ile Cys Pro Ser Cys Gly Gly Pro Pro Met Asn Asp Asp Cys Tyr Phe
115 120 125
Asp Glu Gln Lys Leu Arg Leu Glu Asn Ala Gln Leu Lys Glu Glu Leu
130 135 140
Asp Arg Val Ser Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro Ile Ser
145 150 155 160
Gln Leu Pro Pro Val Gln Pro Ile His Ile Ser Ser Leu Asp Leu Ser
165 170 175
Met Gly Thr Phe Ala Ser Gln Gly Leu Gly Gly Pro Ser Leu Asp Leu
180 185 190
Asp Leu Leu Pro Gly Ser Ser Ser Ser Pro Met Leu Asn Val Pro Pro
195 200 205
Phe Gln Pro Ala Cys Leu Ser Asp Met Asp Lys Ser Leu Met Ser Asp
210 215 220
Ile Ala Ser Asn Ala Met Glu Glu Met Ile Arg Leu Leu Gln Thr Asn
225 230 235 240
Glu Pro Leu Trp Met Lys Gly Ala Asp Gly Arg Asp Val Leu Asp Leu
245 250 255
Asp Ser Tyr Glu Arg Met Phe Pro Lys Ala Asn Ser His Leu Lys Asn
260 265 270
Pro Asn Val His Val Glu Ala Ser Arg Asp Ser Gly Val Val Ile Met
275 280 285
Asn Gly Leu Thr Leu Val Asp Met Phe Met Asp Pro Asn Lys Trp Met
290 295 300
Glu Leu Phe Pro Thr Ile Val Thr Met Ala Arg Thr Ile Glu Val Ile
305 310 315 320
Ser Ser Gly Met Met Gly Ser His Ser Gly Ser Leu Gln Leu Met Tyr
325 330 335
Glu Glu Leu Gln Val Leu Ser Pro Leu Val Ser Thr Arg Glu Phe Tyr
340 345 350
Phe Leu Arg Tyr Cys Gln Gln Ile Glu Gln Gly Leu Trp Ala Ile Val
355 360 365
Asp Val Ser Tyr Asp Phe Pro Gln Asp Asn Gln Phe Ala Pro Gln Tyr
370 375 380
Arg Ser His Arg Leu Pro Ser Gly Val Phe Ile Gln Asp Met Pro Asn
385 390 395 400
Gly Tyr Ser Lys Val Thr Trp Ile Glu His Val Glu Ile Glu Asp Lys
405 410 415
Thr Pro Val His Arg Leu Tyr Arg Asn Leu Ile Tyr Ser Gly Ile Ala
420 425 430
Phe Gly Ala Gln Arg Trp Leu Thr Thr Leu Gln Arg Met Cys Glu Arg
435 440 445
Ile Ala Cys Leu Met Val Thr Gly Asn Ser Thr Arg Asp Leu Gly Gly
450 455 460
Val Ile Pro Ser Pro Glu Gly Lys Arg Ser Met Met Lys Leu Ala Gln
465 470 475 480
Arg Met Val Thr Asn Phe Cys Ala Ser Ile Ser Ala Ser Ala Gly His
485 490 495
Arg Trp Thr Thr Leu Ser Gly Ser Gly Met Asn Glu Ile Gly Val Arg
500 505 510
Val Thr Val His Lys Ser Ser Asp Pro Gly Gln Pro Asn Gly Val Val
515 520 525
Leu Ser Ala Ala Thr Thr Ile Trp Leu Pro Ile Pro Pro Gln Thr Val
530 535 540
Phe Asn Phe Phe Lys Asp Glu Lys Lys Arg Pro Gln Trp Asp Val Leu
545 550 555 560
Ser Asn Gly Asn Ala Val Gln Glu Val Ala His Ile Ala Asn Gly Pro
565 570 575
His Pro Gly Asn Cys Ile Ser Val Leu Arg Ala Phe Asn Ser Ser Gln
580 585 590
Asn Asn Met Leu Ile Leu Gln Glu Ser Cys Val Asp Ser Ser Gly Ser
595 600 605
Leu Val Val Tyr Cys Pro Val Asp Leu Pro Ala Ile Asn Ile Ala Met
610 615 620
Ser Gly Glu Asp Pro Ser Tyr Ile Pro Leu Leu Pro Ser Gly Phe Thr
625 630 635 640
Ile Ser Pro Asp Gly Gln Ala Asp Gln Asp Gly Gly Gly Ala Ser Thr
645 650 655
Ser Thr Ser Thr Gly Ser Arg Val Met Gly Gly Gly Ser Gly Pro Gly
660 665 670
Ser Gly Gly Ser Leu Ile Thr Val Ala Phe Gln Ile Leu Val Ser Ser
675 680 685
Leu Pro Ser Ala Lys Leu Asn Met Glu Ser Val Thr Thr Val Asn Ser
690 695 700
Leu Ile Gly Asn Thr Val Gln His Ile Lys Ala Ala Leu Asn Cys Pro
705 710 715 720
Ser Ser
<210> 430
<211> 2202
<212> DNA
<213> Glycine max
<400> 430
atggggagga tgagggacga tgagtacgag agccgttctg gaagtgataa ctttgaaggc 60
gcatctggtg atgatcagga tggtggtgat gatcagccac agaggaagaa gagataccac 120
agacacactc ctcaccaaat tcaagagctt gaggcttatg tggagtgccc tcatcctgat 180
gagaagcaaa ggttggatct cagtaagagg cttggcttgg agaataagca agtcaagttc 240
tggtttcaga atcgacgaac ccaaatgaag acccaactgg aacgccatga gaacataatg 300
cttaggcagg agaatgataa gctcagagct gagaacagtt tgatcaagga agccatgtca 360
aatccagtgt gtaacaactg cggtggccct gcaattcctg gccaaatttc atttgaggag 420
caccagatta gaattgagaa tgccagacta aaggatgaat tgaaccgtat atgtgtccta 480
gcaaacaagt tccttggcaa gccaatctca tcattgacca gtcccatggc cctcacaacc 540
tcaaattctg gtcttgaact tggtattgga aggaatggga ttggtggttc aagcactctt 600
ggcactccct tgccaatggg gcttgatttg ggagatggag tgttaggcac tcaacctgca 660
atgcctgggg ttagatcagc attgggtttg atgggaaatg aagttcagct tgagagatct 720
atgcttatag atcttgcatt ggctgccatg gaggaattac tgaagatgac tcaggcagag 780
agccctcttt ggatcaagag tttggatggt gagaaggaaa tctttaacca tgaggagtat 840
gcaaggttgt tttctccttg cattggtcca aaacccgctg gctatgtaac tgaagctaca 900
agagaaactg gaatagtaat catcaacagt ttagcccttg tggaaacttt gatggacgcg 960
aatcgatggg cagagatgtt tccgtctatg attgctagag ctatcaacct cgatgttata 1020
tctaatggca tgggtggaac aagaaatggt gctctacaag tgatgcatgc tgaggttcaa 1080
ttgctttctc cactagtccc cgttcgtcaa gtaagattca tcaggttctg taagcagcat 1140
gcagaaggtg tatgggctgt agttgatgtt tccattgaga taggtcatga tgctgctaat 1200
gcacagccat ccattagctg tagaaggctt ccttctggct gtattgtgca ggatatgccg 1260
aatggttact ccaaggttac ttggcttgag cattgggagt acgatgagaa tgttgtccac 1320
caactttatc gcccgttgct aagttctggt gttggattcg gtgctcatag atggattgcc 1380
accctccaaa ggcagtgtga atgcttggct atcctaatgt cctcttccat ttcaagtgat 1440
agtcacacag cattgagcca agctggtagg agaagcatgt tgaaattggc acaacgcatg 1500
actagcaact tctgttccgg ggtttgtgct tcgtcagctc gcaagtggga cagccttcac 1560
attgggactc ttggtgatga catgaaagtg atgacaagga aaaacgtgga tgaccctggt 1620
gagcctcctg ggattgtgct cagtgctgca acttctgttt ggatgccagt gtcacggcaa 1680
aggctgttcg actttctgcg tgatgaacgg ctgagaagtg agtgggacat cttgtccaat 1740
ggtggaccaa tgcaggagat ggtacatatt gccaaaggac aaggacatgg aaactgtgtt 1800
tctcttctcc gtgctaatgc tgttaacgcc aacgatagca gcatgctgat tctgcaagag 1860
acatggatgg acgcgtcatg ctcagtggtg gtatatgcac ctgttgacgt gcaatcactg 1920
aacgtggtga tgagtggtgg agattctgca tacgttgcac tcttgccttc aggctttgca 1980
attcttcccg atggccactg caacgacaac ggctgcaacg ggagtctgca gaagggccgc 2040
ggcagcgacg acggcagtgg cggaagcctt ctcacagtcg gtttccaaat tctggtgaat 2100
agtctcccaa cagcaaagct cacagtggag tcagtggaca ctgtgaataa cctcatctcc 2160
tgcaccattc agaagatcaa agctgcactc agagttgcat ga 2202
<210> 431
<211> 733
<212> PRT
<213> Glycine max
<400> 431
Met Gly Arg Met Arg Asp Asp Glu Tyr Glu Ser Arg Ser Gly Ser Asp
1 5 10 15
Asn Phe Glu Gly Ala Ser Gly Asp Asp Gln Asp Gly Gly Asp Asp Gln
20 25 30
Pro Gln Arg Lys Lys Arg Tyr His Arg His Thr Pro His Gln Ile Gln
35 40 45
Glu Leu Glu Ala Tyr Val Glu Cys Pro His Pro Asp Glu Lys Gln Arg
50 55 60
Leu Asp Leu Ser Lys Arg Leu Gly Leu Glu Asn Lys Gln Val Lys Phe
65 70 75 80
Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu Arg His
85 90 95
Glu Asn Ile Met Leu Arg Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn
100 105 110
Ser Leu Ile Lys Glu Ala Met Ser Asn Pro Val Cys Asn Asn Cys Gly
115 120 125
Gly Pro Ala Ile Pro Gly Gln Ile Ser Phe Glu Glu His Gln Ile Arg
130 135 140
Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg Ile Cys Val Leu
145 150 155 160
Ala Asn Lys Phe Leu Gly Lys Pro Ile Ser Ser Leu Thr Ser Pro Met
165 170 175
Ala Leu Thr Thr Ser Asn Ser Gly Leu Glu Leu Gly Ile Gly Arg Asn
180 185 190
Gly Ile Gly Gly Ser Ser Thr Leu Gly Thr Pro Leu Pro Met Gly Leu
195 200 205
Asp Leu Gly Asp Gly Val Leu Gly Thr Gln Pro Ala Met Pro Gly Val
210 215 220
Arg Ser Ala Leu Gly Leu Met Gly Asn Glu Val Gln Leu Glu Arg Ser
225 230 235 240
Met Leu Ile Asp Leu Ala Leu Ala Ala Met Glu Glu Leu Leu Lys Met
245 250 255
Thr Gln Ala Glu Ser Pro Leu Trp Ile Lys Ser Leu Asp Gly Glu Lys
260 265 270
Glu Ile Phe Asn His Glu Glu Tyr Ala Arg Leu Phe Ser Pro Cys Ile
275 280 285
Gly Pro Lys Pro Ala Gly Tyr Val Thr Glu Ala Thr Arg Glu Thr Gly
290 295 300
Ile Val Ile Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ala
305 310 315 320
Asn Arg Trp Ala Glu Met Phe Pro Ser Met Ile Ala Arg Ala Ile Asn
325 330 335
Leu Asp Val Ile Ser Asn Gly Met Gly Gly Thr Arg Asn Gly Ala Leu
340 345 350
Gln Val Met His Ala Glu Val Gln Leu Leu Ser Pro Leu Val Pro Val
355 360 365
Arg Gln Val Arg Phe Ile Arg Phe Cys Lys Gln His Ala Glu Gly Val
370 375 380
Trp Ala Val Val Asp Val Ser Ile Glu Ile Gly His Asp Ala Ala Asn
385 390 395 400
Ala Gln Pro Ser Ile Ser Cys Arg Arg Leu Pro Ser Gly Cys Ile Val
405 410 415
Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Leu Glu His Trp
420 425 430
Glu Tyr Asp Glu Asn Val Val His Gln Leu Tyr Arg Pro Leu Leu Ser
435 440 445
Ser Gly Val Gly Phe Gly Ala His Arg Trp Ile Ala Thr Leu Gln Arg
450 455 460
Gln Cys Glu Cys Leu Ala Ile Leu Met Ser Ser Ser Ile Ser Ser Asp
465 470 475 480
Ser His Thr Ala Leu Ser Gln Ala Gly Arg Arg Ser Met Leu Lys Leu
485 490 495
Ala Gln Arg Met Thr Ser Asn Phe Cys Ser Gly Val Cys Ala Ser Ser
500 505 510
Ala Arg Lys Trp Asp Ser Leu His Ile Gly Thr Leu Gly Asp Asp Met
515 520 525
Lys Val Met Thr Arg Lys Asn Val Asp Asp Pro Gly Glu Pro Pro Gly
530 535 540
Ile Val Leu Ser Ala Ala Thr Ser Val Trp Met Pro Val Ser Arg Gln
545 550 555 560
Arg Leu Phe Asp Phe Leu Arg Asp Glu Arg Leu Arg Ser Glu Trp Asp
565 570 575
Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Val His Ile Ala Lys
580 585 590
Gly Gln Gly His Gly Asn Cys Val Ser Leu Leu Arg Ala Asn Ala Val
595 600 605
Asn Ala Asn Asp Ser Ser Met Leu Ile Leu Gln Glu Thr Trp Met Asp
610 615 620
Ala Ser Cys Ser Val Val Val Tyr Ala Pro Val Asp Val Gln Ser Leu
625 630 635 640
Asn Val Val Met Ser Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro
645 650 655
Ser Gly Phe Ala Ile Leu Pro Asp Gly His Cys Asn Asp Asn Gly Cys
660 665 670
Asn Gly Ser Leu Gln Lys Gly Arg Gly Ser Asp Asp Gly Ser Gly Gly
675 680 685
Ser Leu Leu Thr Val Gly Phe Gln Ile Leu Val Asn Ser Leu Pro Thr
690 695 700
Ala Lys Leu Thr Val Glu Ser Val Asp Thr Val Asn Asn Leu Ile Ser
705 710 715 720
Cys Thr Ile Gln Lys Ile Lys Ala Ala Leu Arg Val Ala
725 730
<210> 432
<211> 2199
<212> DNA
<213> Glycine max
<400> 432
atgtttcacg caaacatgtt tgattctcac cctcacttgc ttgatatgtc accccacaag 60
actactgctt gctctgagag tgatttggga aaggcctgca gagatgatga gtacgagacc 120
aaatctatca ctgacgccat ggacgctcct tctggcgacg accaagatcc caacccgcga 180
cccaaaaaga agggttaccg ccgccacaca cagcgccaaa tagaagaaat ggaagccttc 240
ttcaagcagt ttcctcaccc ggatgacaag caaagaaaag agctgagccg tgagctgggg 300
ttagagcctt tgcaagtcaa gttttggttc caaaacaagc gcacccagat gaagactcaa 360
catgaacgaa atgagaatgc tattttgaag acagaaaatg aaaagcttcg cgctgagaac 420
aacaggtaca aggaggccct aagcaatgct acatgcccca actgcggagg ctcagctgct 480
cttggcgaaa tgtccttcga cgagcaacac ttgaggattg agaatgctcg gttaagagaa 540
gagattgata ggatttcagg aattgcggcc aagtacgttg gaaagccagt gacttcttcg 600
tactccaacc tttcatctct gaataacaac cacgtgcctg ttggtaagta tggatcacag 660
tcaggcacgg taggagaaat gtatggaggg agtgaccttt ttaggtcact cccagctcct 720
gctgatgctg acaaacccat gattgtggag cttgctgttg cagctatgga ggaactcaca 780
agactagctc aggctggaga ccctttgtgg gtccccagca accaccattc tgagattcta 840
aatgaagagg aatacttgag gactttccct aatagaggct taggtcccaa acccttgggt 900
ttgagatctg aagcttcaag agaatcagtg gtggtcatca tgaatcacat taaccttatt 960
gatatcctta tggacgtgaa ccaatggtca actgtgtttt gcggtattgt ctcgagagcg 1020
ttgacccttg aagtcctttc aactggagta gcaggaaact acaacggagc cttgcaagtg 1080
atgtcatctg agttccaagt cccttcacca cttgttccta ctcgtgagaa ctatttcgta 1140
aggtactgta agcagcaacc agatgggata tgggcagtgg tggatgtttc cttggataat 1200
ctgcgaccca atacaatctc aagaagccga agaaggccct ctggttgttt aattcaagaa 1260
ttgccaaatg gttactccaa ggttacatgg attgaacatg tagaagtgga tgatagagcg 1320
gtgcatagca tatatagacc tctggttaac tcgggcctgg catttggagc taaacgctgg 1380
gtagctacat tagacagaca atgcgaacgt cttgccagtt caatggccaa caacattcca 1440
gcaggggacc tatgtgtgat aacgagtgct gagggaagga aaagtatgat gaagctggcg 1500
gagagaatgg taatgagcta ttgcactggt gttggtgctt ctactgcaca tgcttggaca 1560
acgctgtccg caaccggatg tgatgacgta agggtcatga caagaaagag caccgacgaa 1620
cctggcaggc cccccggtat agtgctcagt gctgccactt ctttctggct tccggttcct 1680
ccaaataggg tttttgattt tctacgtgat gaaaactcaa gaaatgagtg ggacattcta 1740
tccaacgggg gtctagttca agaattagca catatagcaa atggtcgtga tcccggcaac 1800
tgtgtctctt tacttcgagt caatagtgca aattcaagcc aaagcaatat gctgatactt 1860
caagagagtt gcacagattc tactggctca tatgtagttt atgctcctgt ggatattgtt 1920
gctatgaatg ttgtcttgag tggaggagat ccagattatg ttgccctgct cccctcgggc 1980
tttgctattc ttcctgatgg gcctcctgca ttaaatggtg ggcccatgca tgaagttgga 2040
tctggaggtt ctctactcac agttggattc cagatcttag ttgattcagc tccaaccgca 2100
aagttatctc tgggttcagt ggccactgtt aacagtttaa ttaagtgcac agttgaaagg 2160
atcaaagttg cagtcatacg tgacaacaac aacacctga 2199
<210> 433
<211> 732
<212> PRT
<213> Glycine max
<400> 433
Met Phe His Ala Asn Met Phe Asp Ser His Pro His Leu Leu Asp Met
1 5 10 15
Ser Pro His Lys Thr Thr Ala Cys Ser Glu Ser Asp Leu Gly Lys Ala
20 25 30
Cys Arg Asp Asp Glu Tyr Glu Thr Lys Ser Ile Thr Asp Ala Met Asp
35 40 45
Ala Pro Ser Gly Asp Asp Gln Asp Pro Asn Pro Arg Pro Lys Lys Lys
50 55 60
Gly Tyr Arg Arg His Thr Gln Arg Gln Ile Glu Glu Met Glu Ala Phe
65 70 75 80
Phe Lys Gln Phe Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser
85 90 95
Arg Glu Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn
100 105 110
Lys Arg Thr Gln Met Lys Thr Gln His Glu Arg Asn Glu Asn Ala Ile
115 120 125
Leu Lys Thr Glu Asn Glu Lys Leu Arg Ala Glu Asn Asn Arg Tyr Lys
130 135 140
Glu Ala Leu Ser Asn Ala Thr Cys Pro Asn Cys Gly Gly Ser Ala Ala
145 150 155 160
Leu Gly Glu Met Ser Phe Asp Glu Gln His Leu Arg Ile Glu Asn Ala
165 170 175
Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Gly Ile Ala Ala Lys Tyr
180 185 190
Val Gly Lys Pro Val Thr Ser Ser Tyr Ser Asn Leu Ser Ser Leu Asn
195 200 205
Asn Asn His Val Pro Val Gly Lys Tyr Gly Ser Gln Ser Gly Thr Val
210 215 220
Gly Glu Met Tyr Gly Gly Ser Asp Leu Phe Arg Ser Leu Pro Ala Pro
225 230 235 240
Ala Asp Ala Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met
245 250 255
Glu Glu Leu Thr Arg Leu Ala Gln Ala Gly Asp Pro Leu Trp Val Pro
260 265 270
Ser Asn His His Ser Glu Ile Leu Asn Glu Glu Glu Tyr Leu Arg Thr
275 280 285
Phe Pro Asn Arg Gly Leu Gly Pro Lys Pro Leu Gly Leu Arg Ser Glu
290 295 300
Ala Ser Arg Glu Ser Val Val Val Ile Met Asn His Ile Asn Leu Ile
305 310 315 320
Asp Ile Leu Met Asp Val Asn Gln Trp Ser Thr Val Phe Cys Gly Ile
325 330 335
Val Ser Arg Ala Leu Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly
340 345 350
Asn Tyr Asn Gly Ala Leu Gln Val Met Ser Ser Glu Phe Gln Val Pro
355 360 365
Ser Pro Leu Val Pro Thr Arg Glu Asn Tyr Phe Val Arg Tyr Cys Lys
370 375 380
Gln Gln Pro Asp Gly Ile Trp Ala Val Val Asp Val Ser Leu Asp Asn
385 390 395 400
Leu Arg Pro Asn Thr Ile Ser Arg Ser Arg Arg Arg Pro Ser Gly Cys
405 410 415
Leu Ile Gln Glu Leu Pro Asn Gly Tyr Ser Lys Val Thr Trp Ile Glu
420 425 430
His Val Glu Val Asp Asp Arg Ala Val His Ser Ile Tyr Arg Pro Leu
435 440 445
Val Asn Ser Gly Leu Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu
450 455 460
Asp Arg Gln Cys Glu Arg Leu Ala Ser Ser Met Ala Asn Asn Ile Pro
465 470 475 480
Ala Gly Asp Leu Cys Val Ile Thr Ser Ala Glu Gly Arg Lys Ser Met
485 490 495
Met Lys Leu Ala Glu Arg Met Val Met Ser Tyr Cys Thr Gly Val Gly
500 505 510
Ala Ser Thr Ala His Ala Trp Thr Thr Leu Ser Ala Thr Gly Cys Asp
515 520 525
Asp Val Arg Val Met Thr Arg Lys Ser Thr Asp Glu Pro Gly Arg Pro
530 535 540
Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro
545 550 555 560
Pro Asn Arg Val Phe Asp Phe Leu Arg Asp Glu Asn Ser Arg Asn Glu
565 570 575
Trp Asp Ile Leu Ser Asn Gly Gly Leu Val Gln Glu Leu Ala His Ile
580 585 590
Ala Asn Gly Arg Asp Pro Gly Asn Cys Val Ser Leu Leu Arg Val Asn
595 600 605
Ser Ala Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys
610 615 620
Thr Asp Ser Thr Gly Ser Tyr Val Val Tyr Ala Pro Val Asp Ile Val
625 630 635 640
Ala Met Asn Val Val Leu Ser Gly Gly Asp Pro Asp Tyr Val Ala Leu
645 650 655
Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Pro Ala Leu Asn
660 665 670
Gly Gly Pro Met His Glu Val Gly Ser Gly Gly Ser Leu Leu Thr Val
675 680 685
Gly Phe Gln Ile Leu Val Asp Ser Ala Pro Thr Ala Lys Leu Ser Leu
690 695 700
Gly Ser Val Ala Thr Val Asn Ser Leu Ile Lys Cys Thr Val Glu Arg
705 710 715 720
Ile Lys Val Ala Val Ile Arg Asp Asn Asn Asn Thr
725 730
<210> 434
<211> 2229
<212> DNA
<213> Glycine max
<400> 434
atggaaggcc atagcgagat gggtctaatg ggagaaagtt ttgatactag taatttgcta 60
gggaggatga gggatgacga atatgaaagc cggtccggaa gtgataattt tgatggcgga 120
tctggtgatg atcaagatgc tggggatgat cagccacata aaaagaagaa gaaataccat 180
aggcacaccc ctcaacaaat tcaggagctt gaagcgtttt tcaaggagtg tcctcatccc 240
gacgagaagc aaagaacaga tcttagcaag aggcttggct tggagaacaa gcaagtcaag 300
ttctggtttc agaatcgacg aacccaaatg aagacacaac tggaacgcca tgagaacatg 360
attcttaggc aggaaaatga caagctccga gctgagaaca gtgtaatgaa ggatgctttg 420
gcaaatccga tatgtaacaa ctgtggtggc ccagctattc ctggtcaaat ttcattggag 480
gagcaccaaa ctagaatgga aaatgcccga ctgaaggatg aattgaaccg aatatgtgca 540
ttggcaaaca agttcctggg ccggcccctc tcaccactgg ccagtcccat ggctctgcca 600
ccctcaaatt ctggtctaga acttgctatt ggaagaaacg gacttggtgg ttcaagcaat 660
tttggcatgc ccttgccaat gggatttgat gtgggagatg gagctttggg ctcctctcct 720
gcgatgtcta ctatgggtgc tagatcacca atgggaatga tgggaaacga aatccagctt 780
gagagatcca tgcttttaga ccttgcactg agtgctatga atgaattaat taagatggct 840
cagcctgata cctctctttg gattaaaagc tctgatggca ggaatgaagt actgaaccat 900
gatgagtatg caagactgtt ttctccttat attggatcaa aacctgctgc tggttatgtg 960
actgaagcta caagaggaac tggagtagta tcagccagca gtttgggcct tgttgaaata 1020
ttgatggatg cggatcaatg gtcggagatg ttttcatcta tgattgctag tgctgccact 1080
gtggaagtac tatctagtgg cacgggtgga accagaagtg gagcgttgca agtgatgctt 1140
gctgaggttc aattgctttc tccactagtc cctgctcgtc aagtgagttt cctcaggttt 1200
tgcaagaagc acgctgaagg tttatgggct gtggttgatg tttcagttga cattggtcgt 1260
aatgttacca attcacatcc attaatgagc tgcaggaggc ttccctcggg ctgtgttatt 1320
caggacatgc ccaatggttt ttccaatatt acttgggttg aacattccca atatgatgag 1380
agtgtcatcc accaacttta tcgcccattg gttagttctg gcattggttt tggtgctcag 1440
agatggattg ccaccctcct aaggcagtgt gactgcttgg caatcctcag gtctcctcaa 1500
ggcccatctg aggaccccac agcccaagcg ggtaggacaa acatgatgaa gctcgcacaa 1560
cgcatgaccg agtgcttctg ctcagggatc tgtgcttcat ctgcttgcaa gtgggacata 1620
ctgcacattg gtaatctggc tgatgacatg agaatcatgg cccggaaaat cgatgaccca 1680
actgaggctc ctggcattgt gctgagtgct tcaacttctg tttggatgcc ggtgtcacgg 1740
aaaagggtgt ttgattttct gcgtgatgaa aatttgagag gtgagtggga cctgctgtcc 1800
aaagatggac caatgaagga gatgctccat attgctaaag gacaagaccg tggaaattgt 1860
gtttccatcc ttcattctgc taatagcgag tgcaatgtgc tatatctgca agagtcatgg 1920
agtgatgcct ctggctcgat ggtagtgtat tccccgatca acatgcaagc cttgcagatg 1980
gtgatgagct gtggagattc atcatttgtc cctctccgtc catcaggctt tgctattctg 2040
ccagatggca cttcaaacaa cggtgatggc agtgacggtg gtggcagctg cttgcttaca 2100
gttgggttac aaatgttgcc aaatggcaac caccaatcag ccaagttcac aatggagtca 2160
gttgatgctg tcaataacct gatctcattt accattcaga aggtcaaaga tgcacttgga 2220
gttgcatga 2229
<210> 435
<211> 742
<212> PRT
<213> Glycine max
<400> 435
Met Glu Gly His Ser Glu Met Gly Leu Met Gly Glu Ser Phe Asp Thr
1 5 10 15
Ser Asn Leu Leu Gly Arg Met Arg Asp Asp Glu Tyr Glu Ser Arg Ser
20 25 30
Gly Ser Asp Asn Phe Asp Gly Gly Ser Gly Asp Asp Gln Asp Ala Gly
35 40 45
Asp Asp Gln Pro His Lys Lys Lys Lys Lys Tyr His Arg His Thr Pro
50 55 60
Gln Gln Ile Gln Glu Leu Glu Ala Phe Phe Lys Glu Cys Pro His Pro
65 70 75 80
Asp Glu Lys Gln Arg Thr Asp Leu Ser Lys Arg Leu Gly Leu Glu Asn
85 90 95
Lys Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr
100 105 110
Gln Leu Glu Arg His Glu Asn Met Ile Leu Arg Gln Glu Asn Asp Lys
115 120 125
Leu Arg Ala Glu Asn Ser Val Met Lys Asp Ala Leu Ala Asn Pro Ile
130 135 140
Cys Asn Asn Cys Gly Gly Pro Ala Ile Pro Gly Gln Ile Ser Leu Glu
145 150 155 160
Glu His Gln Thr Arg Met Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn
165 170 175
Arg Ile Cys Ala Leu Ala Asn Lys Phe Leu Gly Arg Pro Leu Ser Pro
180 185 190
Leu Ala Ser Pro Met Ala Leu Pro Pro Ser Asn Ser Gly Leu Glu Leu
195 200 205
Ala Ile Gly Arg Asn Gly Leu Gly Gly Ser Ser Asn Phe Gly Met Pro
210 215 220
Leu Pro Met Gly Phe Asp Val Gly Asp Gly Ala Leu Gly Ser Ser Pro
225 230 235 240
Ala Met Ser Thr Met Gly Ala Arg Ser Pro Met Gly Met Met Gly Asn
245 250 255
Glu Ile Gln Leu Glu Arg Ser Met Leu Leu Asp Leu Ala Leu Ser Ala
260 265 270
Met Asn Glu Leu Ile Lys Met Ala Gln Pro Asp Thr Ser Leu Trp Ile
275 280 285
Lys Ser Ser Asp Gly Arg Asn Glu Val Leu Asn His Asp Glu Tyr Ala
290 295 300
Arg Leu Phe Ser Pro Tyr Ile Gly Ser Lys Pro Ala Ala Gly Tyr Val
305 310 315 320
Thr Glu Ala Thr Arg Gly Thr Gly Val Val Ser Ala Ser Ser Leu Gly
325 330 335
Leu Val Glu Ile Leu Met Asp Ala Asp Gln Trp Ser Glu Met Phe Ser
340 345 350
Ser Met Ile Ala Ser Ala Ala Thr Val Glu Val Leu Ser Ser Gly Thr
355 360 365
Gly Gly Thr Arg Ser Gly Ala Leu Gln Val Met Leu Ala Glu Val Gln
370 375 380
Leu Leu Ser Pro Leu Val Pro Ala Arg Gln Val Ser Phe Leu Arg Phe
385 390 395 400
Cys Lys Lys His Ala Glu Gly Leu Trp Ala Val Val Asp Val Ser Val
405 410 415
Asp Ile Gly Arg Asn Val Thr Asn Ser His Pro Leu Met Ser Cys Arg
420 425 430
Arg Leu Pro Ser Gly Cys Val Ile Gln Asp Met Pro Asn Gly Phe Ser
435 440 445
Asn Ile Thr Trp Val Glu His Ser Gln Tyr Asp Glu Ser Val Ile His
450 455 460
Gln Leu Tyr Arg Pro Leu Val Ser Ser Gly Ile Gly Phe Gly Ala Gln
465 470 475 480
Arg Trp Ile Ala Thr Leu Leu Arg Gln Cys Asp Cys Leu Ala Ile Leu
485 490 495
Arg Ser Pro Gln Gly Pro Ser Glu Asp Pro Thr Ala Gln Ala Gly Arg
500 505 510
Thr Asn Met Met Lys Leu Ala Gln Arg Met Thr Glu Cys Phe Cys Ser
515 520 525
Gly Ile Cys Ala Ser Ser Ala Cys Lys Trp Asp Ile Leu His Ile Gly
530 535 540
Asn Leu Ala Asp Asp Met Arg Ile Met Ala Arg Lys Ile Asp Asp Pro
545 550 555 560
Thr Glu Ala Pro Gly Ile Val Leu Ser Ala Ser Thr Ser Val Trp Met
565 570 575
Pro Val Ser Arg Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Asn Leu
580 585 590
Arg Gly Glu Trp Asp Leu Leu Ser Lys Asp Gly Pro Met Lys Glu Met
595 600 605
Leu His Ile Ala Lys Gly Gln Asp Arg Gly Asn Cys Val Ser Ile Leu
610 615 620
His Ser Ala Asn Ser Glu Cys Asn Val Leu Tyr Leu Gln Glu Ser Trp
625 630 635 640
Ser Asp Ala Ser Gly Ser Met Val Val Tyr Ser Pro Ile Asn Met Gln
645 650 655
Ala Leu Gln Met Val Met Ser Cys Gly Asp Ser Ser Phe Val Pro Leu
660 665 670
Arg Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Thr Ser Asn Asn Gly
675 680 685
Asp Gly Ser Asp Gly Gly Gly Ser Cys Leu Leu Thr Val Gly Leu Gln
690 695 700
Met Leu Pro Asn Gly Asn His Gln Ser Ala Lys Phe Thr Met Glu Ser
705 710 715 720
Val Asp Ala Val Asn Asn Leu Ile Ser Phe Thr Ile Gln Lys Val Lys
725 730 735
Asp Ala Leu Gly Val Ala
740
<210> 436
<211> 2190
<212> DNA
<213> Glycine max
<400> 436
atgttccagc cgaacctgat ggacgcgttg gagatgggtc agaacactcc cgagagtgag 60
attcctcgaa tccgtgagga tgagttcgac agtgccacca agtccggtag tgaaaaccat 120
gaaggtgcct ccggtgaaga ccaagaccct cgtcccaaca aaaagaaacg ttaccaccgc 180
cacacccaac accagatcca agaaatggaa gcttttttca aggagtgtcc gcacccagat 240
gataagcaaa ggaaggaact gagcagggaa ttagggttag agccattgca ggttaagttt 300
tggtttcaga acaagcgtac tcagatgaag acacaacacg agcggcacga gaatacaaat 360
cttagaaccg aaaacgagaa gcttcgagca gataacatga ggtataggga ggcacttagc 420
aatgcttcgt gtcccaattg tggtggacca actgctatag gagaaatgtc attcgatgaa 480
catcacttga gacttgaaaa cgcaaggcta agagaagaga ttgatcggat ttcagcaatt 540
gctgcaaagt atgtagggaa gcctgtggtg aattattcaa atatttctcc ttctctccct 600
cctcgtccat tagaaattgg tgttggtggt gctggttttg gaggccaacc agggattggt 660
gtggacatgt atggagctgg ggatcttctt aggtcaatca gtggacccac tgaagctgat 720
aagccaataa tcatagagct agctgttgca gctatggagg agcttattgg aatggcacaa 780
atgggtgagc ctctttggtt aactacactt gatggcacat ccactatgct caatgaggat 840
gagtacatta ggtcttttcc tcgaggtatt ggtccaaaac ctagtggctt caaatgtgaa 900
gcttcaagag aaactgctgt tgttatcatg aaccatgtca acctcgttga gattctcatg 960
gatgtgaacc aatggtccac agtgttctct ggtatagtct caagagccat gactctagaa 1020
gtgttatcaa caggggttgc cgggaactac aatggtgcct tacaagtgat gacagcagaa 1080
ctacaactac ctacaccact tgtgccaact cgtgagagtt attttgtaag gtattgtaag 1140
caacatggag atgggacttg ggctgttgtg gatgtttctt tggataattt gcgcccaagt 1200
ccttcagcca gatgtagaag aaggccttct ggctgcctaa ttcaagaaat gccaaatggc 1260
tattcaaagg tcacatgggt tgagcatgtg gaagtggatg atagaggtgt tcacaatctt 1320
tacaagcagc ttgttagctc cggacatgca tttggtgcaa aacgtttggt agcaacctta 1380
gatcgacaat gtgaaagact cgctagtgcc atggcaacaa acattcccac tgtagatgtt 1440
ggtgtgataa caaaccaaga agggagaaaa agcatgatga agctggctga aagaatggtg 1500
ataagctttt gtgctggagt gagtgcttcc actgctcaca catggacaac actctcaggg 1560
acaggtgctg atgatgtaag ggttatgact cgaaagagtg tggatgaccc tggaagaccc 1620
cctggcattg ttctcagtgc tgccacttct ttttggcttc ctgttcctcc taaacgagtc 1680
tttgacttcc tccgtgacga aaactctagg aatgagtggg atattctttc caatggtgga 1740
gttgtccaag aaatggcaca cattgcaaac ggaagagaca ctggaaactg tgtatctcta 1800
ctacgagtaa atagtgcaaa ttcaagccag agcaacatgt tgatattaca agagagttgc 1860
accgattcaa caggctcttt tgtaatttat gctccagtgg acattgttgc gatgaatgtg 1920
gttctaaacg gtggagaccc agattatgtt gcacttcttc cttcagggtt tgctattctc 1980
ccagatggaa ccacatcgca tggaagtggt ggtggcgtca ttggcgaaac tagccctagt 2040
agtggatctc tcttaactgt tgcctttcaa atattggtcg attctgttcc aaccgctaag 2100
ctttctcttg gatctgtggc cactgtcaac aatctcattg catgcactgt tgagagaatc 2160
aaggcttctt tgtctggtga acctgcttga 2190
<210> 437
<211> 729
<212> PRT
<213> Glycine max
<400> 437
Met Phe Gln Pro Asn Leu Met Asp Ala Leu Glu Met Gly Gln Asn Thr
1 5 10 15
Pro Glu Ser Glu Ile Pro Arg Ile Arg Glu Asp Glu Phe Asp Ser Ala
20 25 30
Thr Lys Ser Gly Ser Glu Asn His Glu Gly Ala Ser Gly Glu Asp Gln
35 40 45
Asp Pro Arg Pro Asn Lys Lys Lys Arg Tyr His Arg His Thr Gln His
50 55 60
Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp
65 70 75 80
Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu Pro Leu
85 90 95
Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Thr Gln
100 105 110
His Glu Arg His Glu Asn Thr Asn Leu Arg Thr Glu Asn Glu Lys Leu
115 120 125
Arg Ala Asp Asn Met Arg Tyr Arg Glu Ala Leu Ser Asn Ala Ser Cys
130 135 140
Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly Glu Met Ser Phe Asp Glu
145 150 155 160
His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg
165 170 175
Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro Val Val Asn Tyr
180 185 190
Ser Asn Ile Ser Pro Ser Leu Pro Pro Arg Pro Leu Glu Ile Gly Val
195 200 205
Gly Gly Ala Gly Phe Gly Gly Gln Pro Gly Ile Gly Val Asp Met Tyr
210 215 220
Gly Ala Gly Asp Leu Leu Arg Ser Ile Ser Gly Pro Thr Glu Ala Asp
225 230 235 240
Lys Pro Ile Ile Ile Glu Leu Ala Val Ala Ala Met Glu Glu Leu Ile
245 250 255
Gly Met Ala Gln Met Gly Glu Pro Leu Trp Leu Thr Thr Leu Asp Gly
260 265 270
Thr Ser Thr Met Leu Asn Glu Asp Glu Tyr Ile Arg Ser Phe Pro Arg
275 280 285
Gly Ile Gly Pro Lys Pro Ser Gly Phe Lys Cys Glu Ala Ser Arg Glu
290 295 300
Thr Ala Val Val Ile Met Asn His Val Asn Leu Val Glu Ile Leu Met
305 310 315 320
Asp Val Asn Gln Trp Ser Thr Val Phe Ser Gly Ile Val Ser Arg Ala
325 330 335
Met Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly
340 345 350
Ala Leu Gln Val Met Thr Ala Glu Leu Gln Leu Pro Thr Pro Leu Val
355 360 365
Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys Gln His Gly Asp
370 375 380
Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Asn Leu Arg Pro Ser
385 390 395 400
Pro Ser Ala Arg Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu
405 410 415
Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val
420 425 430
Asp Asp Arg Gly Val His Asn Leu Tyr Lys Gln Leu Val Ser Ser Gly
435 440 445
His Ala Phe Gly Ala Lys Arg Leu Val Ala Thr Leu Asp Arg Gln Cys
450 455 460
Glu Arg Leu Ala Ser Ala Met Ala Thr Asn Ile Pro Thr Val Asp Val
465 470 475 480
Gly Val Ile Thr Asn Gln Glu Gly Arg Lys Ser Met Met Lys Leu Ala
485 490 495
Glu Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala Ser Thr Ala
500 505 510
His Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Asp Asp Val Arg Val
515 520 525
Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val
530 535 540
Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro Lys Arg Val
545 550 555 560
Phe Asp Phe Leu Arg Asp Glu Asn Ser Arg Asn Glu Trp Asp Ile Leu
565 570 575
Ser Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly Arg
580 585 590
Asp Thr Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser
595 600 605
Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ser Thr
610 615 620
Gly Ser Phe Val Ile Tyr Ala Pro Val Asp Ile Val Ala Met Asn Val
625 630 635 640
Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly
645 650 655
Phe Ala Ile Leu Pro Asp Gly Thr Thr Ser His Gly Ser Gly Gly Gly
660 665 670
Val Ile Gly Glu Thr Ser Pro Ser Ser Gly Ser Leu Leu Thr Val Ala
675 680 685
Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly
690 695 700
Ser Val Ala Thr Val Asn Asn Leu Ile Ala Cys Thr Val Glu Arg Ile
705 710 715 720
Lys Ala Ser Leu Ser Gly Glu Pro Ala
725
<210> 438
<211> 2346
<212> DNA
<213> Glycine max
<400> 438
atgccagctg gtattatgat tccagcaaga aacatgccct cgatgattgg aagaaacgga 60
accgttggtg gctttggatt atcttcaggg ctctctcttg gccatattga aaaccataag 120
gcttcggaat ctcaaagatc tgtagaaatg ttccagccaa acctgatgga agctggtcag 180
ctccacccac tggacatgcc tcagaacact tcagagagcg atgtccctag aatccgtgaa 240
gatgactttg acagtgccac caagtcaggt agtgaaaatc tagaaggtgc ttccggtgaa 300
gaccaagacc ctcgtcccaa caagaagaaa cgctaccacc gccacactca gcaccagatc 360
caggagatgg aagcgttctt taaggagtgt ccgcaccctg atgacaagca aaggaaggag 420
ctgagtcgag agttagggtt agagccattg caggttaagt tttggttcca gaacaagcgc 480
actcagatga agacccaaca tgaacgtcat gagaacacac agctgagaac tgaaaacgag 540
aagcttcgag cagataacat gaggttcagg gaagctctcg gcaatgcctc gtgtcctaac 600
tgtggtggac caaccgctat aggggaaatg tcattcgatg aacatcactt gaggctcgaa 660
aatgctcgcc tgagagaaga gattgatagg atatctgcca ttgctgcaaa gtatgttggg 720
aagcctgtgg tgagctatcc acttgtttct ccttcatctg ttcctcctcg tccactagaa 780
cttggggtta gtggtggttt tggtggccaa cctggaggca ttggagggga catgtatggt 840
ggagctgcag gagatcttct aaggtcaata agtggaccta ctgaagctga taagccaatc 900
ataatagagc ttgctgttgc agccatggag gagctcattg gaatggcgca aatgggtgag 960
cctctttggt tgactaccct ggatggcacc actgtgctca acgaggatga gtacatcagg 1020
tcttttcctc gagggattgg tcctaaaccc gttggtttca agtgtgaagc ttcgagggaa 1080
actgctgttg ttatcatgaa ccatgttaac cttgttgaga tcctcatgga cgtgaatcaa 1140
tggtccacgg tgttctctgg cattgtctca agagcaatga ctttggaagt gctatcaaca 1200
ggggtggcgg ggaattacaa cggtgcattg caagtgatga cagcagaagt gcaagtacct 1260
tcacctctgg tgccaactcg agagagctat tttgtaaggt attgtaagca gcacggtgac 1320
ggaacttggg cagtagtgga cgtgtccttg gataatttgc gtcctagtcc ttcagccaga 1380
tgtagaagaa ggccctcagg ttgcttaatt caagaaatgc ccaatggcta ctctaaggtc 1440
atatgggttg agcacgtaga agtggatgac agaggtgtcc ataatctata caagcagctt 1500
gttagctcgg ggcatgcatt tggtgcaaaa cgttggattg caaacttgga tcgacaatgt 1560
gaaaggcttg ctagtgccat ggcaacaaac attcccacag tagatgttgg agtaataaca 1620
aacccagatg ggaggaagag catgttgaaa ctggctgaga gaatggtcat aagcttttgt 1680
gctggagtga gtgcatctac tgcacacaca tggacaacac tttctggaac tggtgccgat 1740
gatgtaaggg tcatgacacg taagagtgta gatgacccag gaaggcctcc tggcatcgtt 1800
ctcagtgctg caacttcttt ttggcttcct gtgtcaccaa aaagggtttt tgaattcctc 1860
cgcgatgaga actccagaag tgagtgggat attctttcca acggtggagt tgttcaagaa 1920
atggcacaca ttgccaatgg ccgagacact ggaaattgtg tctctctact tcgggtgaat 1980
agtgcgaatt caagccaaag caacatgttg atattacaag agagttgcgc ggactcaacg 2040
ggatcttttg tgatatatgc tcctgtagat attgtggcaa tgaatgtggt tctgaatgga 2100
ggggacccgg actacgtggc ccttctccct tcaggatttg ctatactccc agatgggacc 2160
actgcacatg gaggtggcat tggtgacatt ggacatggtg gttctctctt gactgtggca 2220
tttcaaatat tggttgattc ggttccaacg gcaaagcttt ctcttggatc agttgctact 2280
gttaacaatc tcattgcctg cactgttgag agaattaagg ctgctttatc tggtgaagtt 2340
gcttga 2346
<210> 439
<211> 781
<212> PRT
<213> Glycine max
<400> 439
Met Pro Ala Gly Ile Met Ile Pro Ala Arg Asn Met Pro Ser Met Ile
1 5 10 15
Gly Arg Asn Gly Thr Val Gly Gly Phe Gly Leu Ser Ser Gly Leu Ser
20 25 30
Leu Gly His Ile Glu Asn His Lys Ala Ser Glu Ser Gln Arg Ser Val
35 40 45
Glu Met Phe Gln Pro Asn Leu Met Glu Ala Gly Gln Leu His Pro Leu
50 55 60
Asp Met Pro Gln Asn Thr Ser Glu Ser Asp Val Pro Arg Ile Arg Glu
65 70 75 80
Asp Asp Phe Asp Ser Ala Thr Lys Ser Gly Ser Glu Asn Leu Glu Gly
85 90 95
Ala Ser Gly Glu Asp Gln Asp Pro Arg Pro Asn Lys Lys Lys Arg Tyr
100 105 110
His Arg His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys
115 120 125
Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu
130 135 140
Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg
145 150 155 160
Thr Gln Met Lys Thr Gln His Glu Arg His Glu Asn Thr Gln Leu Arg
165 170 175
Thr Glu Asn Glu Lys Leu Arg Ala Asp Asn Met Arg Phe Arg Glu Ala
180 185 190
Leu Gly Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly
195 200 205
Glu Met Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu
210 215 220
Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly
225 230 235 240
Lys Pro Val Val Ser Tyr Pro Leu Val Ser Pro Ser Ser Val Pro Pro
245 250 255
Arg Pro Leu Glu Leu Gly Val Ser Gly Gly Phe Gly Gly Gln Pro Gly
260 265 270
Gly Ile Gly Gly Asp Met Tyr Gly Gly Ala Ala Gly Asp Leu Leu Arg
275 280 285
Ser Ile Ser Gly Pro Thr Glu Ala Asp Lys Pro Ile Ile Ile Glu Leu
290 295 300
Ala Val Ala Ala Met Glu Glu Leu Ile Gly Met Ala Gln Met Gly Glu
305 310 315 320
Pro Leu Trp Leu Thr Thr Leu Asp Gly Thr Thr Val Leu Asn Glu Asp
325 330 335
Glu Tyr Ile Arg Ser Phe Pro Arg Gly Ile Gly Pro Lys Pro Val Gly
340 345 350
Phe Lys Cys Glu Ala Ser Arg Glu Thr Ala Val Val Ile Met Asn His
355 360 365
Val Asn Leu Val Glu Ile Leu Met Asp Val Asn Gln Trp Ser Thr Val
370 375 380
Phe Ser Gly Ile Val Ser Arg Ala Met Thr Leu Glu Val Leu Ser Thr
385 390 395 400
Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Thr Ala Glu
405 410 415
Val Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val
420 425 430
Arg Tyr Cys Lys Gln His Gly Asp Gly Thr Trp Ala Val Val Asp Val
435 440 445
Ser Leu Asp Asn Leu Arg Pro Ser Pro Ser Ala Arg Cys Arg Arg Arg
450 455 460
Pro Ser Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val
465 470 475 480
Ile Trp Val Glu His Val Glu Val Asp Asp Arg Gly Val His Asn Leu
485 490 495
Tyr Lys Gln Leu Val Ser Ser Gly His Ala Phe Gly Ala Lys Arg Trp
500 505 510
Ile Ala Asn Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala
515 520 525
Thr Asn Ile Pro Thr Val Asp Val Gly Val Ile Thr Asn Pro Asp Gly
530 535 540
Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met Val Ile Ser Phe Cys
545 550 555 560
Ala Gly Val Ser Ala Ser Thr Ala His Thr Trp Thr Thr Leu Ser Gly
565 570 575
Thr Gly Ala Asp Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp
580 585 590
Pro Gly Arg Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp
595 600 605
Leu Pro Val Ser Pro Lys Arg Val Phe Glu Phe Leu Arg Asp Glu Asn
610 615 620
Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu
625 630 635 640
Met Ala His Ile Ala Asn Gly Arg Asp Thr Gly Asn Cys Val Ser Leu
645 650 655
Leu Arg Val Asn Ser Ala Asn Ser Ser Gln Ser Asn Met Leu Ile Leu
660 665 670
Gln Glu Ser Cys Ala Asp Ser Thr Gly Ser Phe Val Ile Tyr Ala Pro
675 680 685
Val Asp Ile Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp
690 695 700
Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Thr
705 710 715 720
Thr Ala His Gly Gly Gly Ile Gly Asp Ile Gly His Gly Gly Ser Leu
725 730 735
Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys
740 745 750
Leu Ser Leu Gly Ser Val Ala Thr Val Asn Asn Leu Ile Ala Cys Thr
755 760 765
Val Glu Arg Ile Lys Ala Ala Leu Ser Gly Glu Val Ala
770 775 780
<210> 440
<211> 2184
<212> DNA
<213> Glycine max
<400> 440
atgttccagc cgaacctgat ggacgcgttg gagatgggtc agaacacttc cgagagtgag 60
gttcctcgaa tcctagaaga cgagttcgac agtgccacca agtccggtag tgaaaaccat 120
gaaggtgcct ctggtgaaga ccaagaccct cgtcccaaca aaaagaagcg ttaccaccgc 180
cacacccaac accagatcca agaaatggaa gcttttttca aggagtgtcc gcacccagat 240
gacaagcaaa ggaaggaact gagcagggag ttagggttag agccattgca ggttaagttt 300
tggtttcaga acaagcgtac tcagatgaag acacagcacg agcggcatga gaatacaaat 360
ctcagaaccg aaaacgagaa gcttcgagca gataatatga ggtataggga ggctcttagc 420
aatgcttcgt gtcctaattg tggtggacca accgctatag gagaaatgtc attcgatgaa 480
catcacttga ggcttgaaaa cgcaaggcta agagaagaga ttgatcgcat ctcagcaatt 540
gctgcaaagt atgtagggaa gccagtggtg aactattcaa atatttctcc ttctctccct 600
cctcgtccgt tagaactagg ggttggtggt gctggttttg gaggccaacc agggattggt 660
gtggacatgt atggagctgg ggatcttctt aggtcaatta gtggacccac tgaagctgat 720
aagccaataa tcatagagct agctgttgca gctatggagg agctcattgg gatggcacaa 780
atgggtgagc ctctttggtt aactaccctt gatggcacat ccactatgct caatgaggat 840
gagtacatta ggtcttttcc tcgagggatt ggtccaaaac ctagtggctt caaatgtgaa 900
gcttcaagag aaactgctgt tgttatcatg aaccatgtca acctcgttga gattctcatg 960
gatgtgaacc aatggtccac agtgttctct ggtatagtct caagagccat gactctggaa 1020
gttctatcaa caggggtggc tgggaactac aatggtgcct tacaagtgat gacagcagaa 1080
ctacaactac ctacaccact tgtgccaact cgcgagagtt attttgtgag gtattgtaag 1140
caacatgcag atgggacttg ggcagttgtg gatgtttctt tggataattt gcgcccaggt 1200
ccttcagcca gatgtagaag aaggccttct ggttgcttaa ttcaagaaat gccaaatggc 1260
tattcaaagg tcacatgggt tgagcatgta gaagtggatg atagaggtgt tcacaatctt 1320
tacaagcagc ttgttagctc tggacatgca tttggtgcaa aacgttgggt tgcaacctta 1380
gatcgacaat gtgaaagact cgctagtgcc atggcaacaa acattcccac tgtagatgtt 1440
ggcgtgataa caaaccaaga cgggagaaag agcatgatga agctggctga aagaatggtg 1500
ataagctttt gtgctggagt gagtgcttcc actgctcaca catggacaac actctctggg 1560
accggtgctg atgatgtaag ggttatgacc agaaagagtg tggatgaccc tggaagaccc 1620
cctggcatag ttctcagtgc tgccacttct ttttggcttc ctgttccacc taaacgagtc 1680
tttgacttcc tccgtgacga aaactctagg aatgagtggg acattctttc caatggagga 1740
gttgtccaag aaatggcaca cattgcaaac ggaagagaca caggaaactg tgtatctcta 1800
cttcgagtaa atagtgcaaa ttcgagccag agcaacatgt tgatattaca agagagttgc 1860
accaattcaa caggctcttt tgtcatttat gctccggtgg acattgttgc aatgaatgtg 1920
gttctaaatg gtggagaccc agattacgtg gcacttcttc cttcagggtt tgctattctc 1980
cctgatggaa ccacatcgca taatggaagt ggtggcattg gcgaaactgg ccctagtggt 2040
tctctcttaa ccgttgcgtt tcaaatattg gtggattctg ttccaaccgc gaagctttct 2100
cttggatctg tggccactgt gaacaatctc attgcatgca ctgttgagag aatcaaggct 2160
tctttgtctg gtgaacctgc ttga 2184
<210> 441
<211> 727
<212> PRT
<213> Glycine max
<400> 441
Met Phe Gln Pro Asn Leu Met Asp Ala Leu Glu Met Gly Gln Asn Thr
1 5 10 15
Ser Glu Ser Glu Val Pro Arg Ile Leu Glu Asp Glu Phe Asp Ser Ala
20 25 30
Thr Lys Ser Gly Ser Glu Asn His Glu Gly Ala Ser Gly Glu Asp Gln
35 40 45
Asp Pro Arg Pro Asn Lys Lys Lys Arg Tyr His Arg His Thr Gln His
50 55 60
Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp
65 70 75 80
Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu Pro Leu
85 90 95
Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Thr Gln
100 105 110
His Glu Arg His Glu Asn Thr Asn Leu Arg Thr Glu Asn Glu Lys Leu
115 120 125
Arg Ala Asp Asn Met Arg Tyr Arg Glu Ala Leu Ser Asn Ala Ser Cys
130 135 140
Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly Glu Met Ser Phe Asp Glu
145 150 155 160
His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg
165 170 175
Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro Val Val Asn Tyr
180 185 190
Ser Asn Ile Ser Pro Ser Leu Pro Pro Arg Pro Leu Glu Leu Gly Val
195 200 205
Gly Gly Ala Gly Phe Gly Gly Gln Pro Gly Ile Gly Val Asp Met Tyr
210 215 220
Gly Ala Gly Asp Leu Leu Arg Ser Ile Ser Gly Pro Thr Glu Ala Asp
225 230 235 240
Lys Pro Ile Ile Ile Glu Leu Ala Val Ala Ala Met Glu Glu Leu Ile
245 250 255
Gly Met Ala Gln Met Gly Glu Pro Leu Trp Leu Thr Thr Leu Asp Gly
260 265 270
Thr Ser Thr Met Leu Asn Glu Asp Glu Tyr Ile Arg Ser Phe Pro Arg
275 280 285
Gly Ile Gly Pro Lys Pro Ser Gly Phe Lys Cys Glu Ala Ser Arg Glu
290 295 300
Thr Ala Val Val Ile Met Asn His Val Asn Leu Val Glu Ile Leu Met
305 310 315 320
Asp Val Asn Gln Trp Ser Thr Val Phe Ser Gly Ile Val Ser Arg Ala
325 330 335
Met Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly
340 345 350
Ala Leu Gln Val Met Thr Ala Glu Leu Gln Leu Pro Thr Pro Leu Val
355 360 365
Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys Gln His Ala Asp
370 375 380
Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Asn Leu Arg Pro Gly
385 390 395 400
Pro Ser Ala Arg Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu
405 410 415
Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val
420 425 430
Asp Asp Arg Gly Val His Asn Leu Tyr Lys Gln Leu Val Ser Ser Gly
435 440 445
His Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu Asp Arg Gln Cys
450 455 460
Glu Arg Leu Ala Ser Ala Met Ala Thr Asn Ile Pro Thr Val Asp Val
465 470 475 480
Gly Val Ile Thr Asn Gln Asp Gly Arg Lys Ser Met Met Lys Leu Ala
485 490 495
Glu Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala Ser Thr Ala
500 505 510
His Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Asp Asp Val Arg Val
515 520 525
Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val
530 535 540
Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro Lys Arg Val
545 550 555 560
Phe Asp Phe Leu Arg Asp Glu Asn Ser Arg Asn Glu Trp Asp Ile Leu
565 570 575
Ser Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly Arg
580 585 590
Asp Thr Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser
595 600 605
Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asn Ser Thr
610 615 620
Gly Ser Phe Val Ile Tyr Ala Pro Val Asp Ile Val Ala Met Asn Val
625 630 635 640
Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly
645 650 655
Phe Ala Ile Leu Pro Asp Gly Thr Thr Ser His Asn Gly Ser Gly Gly
660 665 670
Ile Gly Glu Thr Gly Pro Ser Gly Ser Leu Leu Thr Val Ala Phe Gln
675 680 685
Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val
690 695 700
Ala Thr Val Asn Asn Leu Ile Ala Cys Thr Val Glu Arg Ile Lys Ala
705 710 715 720
Ser Leu Ser Gly Glu Pro Ala
725
<210> 442
<211> 2196
<212> DNA
<213> Glycine max
<400> 442
atgtttgaca caaacatgtt tgattctcac cctcacttgc ttgatatgtc accaccccac 60
aagactactt gctctgagag tgatttggca aagccctgca gagatgatga gtacgagacc 120
aaatctatca ctgacaccat ggacgctcct tctggcgacg accaagatcc caacccgcga 180
cccaaaaaga agggttaccg ccgccacaca cagcgccaaa ttgaagaaat ggaagccttc 240
ttcaagcagt gtcctcaccc ggatgacaag caaagaaaag agctgagccg tgagctgggg 300
ttagagcctt tgcaagtcaa gttttggttc caaaacaagc gcacccagat gaagactcaa 360
catgaacgaa atgaaaatgc tattttgaag gcagagaatg aaaagcttcg cgctgagaac 420
agcaggtaca aggaggccct aaccaatgct acatgcccca actgtggagg cccagctgct 480
cttggcgaaa tgtccttcga cgagcaacac ttgaggattg agaatgctcg gttaagagaa 540
gagatcgata ggatttcagg aattgctgcc aaatatgttg gaaagccagt gacttcttcg 600
tactccaacc tctcatctct gaataacaac cacgtgcctg tcggtaacta tggatcacaa 660
tcaggcacgg taggagaaat gtatggaggc agtgaccttt ttaggccact cccagctcct 720
gctgatgctg acaaacccat gattgtggag cttgctgttg cagctatgga ggaactcaca 780
agactagctc aggctggaga gcctttgtgg gtcccaagca accaccattc tgagattcta 840
aatgaagatg aatacttgag gactttccct actagaggtt taggacccaa acccttgggc 900
ttgagatcag aagcttcaag ggaatccgtg gtggtcatca tgaatcacat taaccttatt 960
gatatcctta tggatgtgaa tcaatggtca actgtgtttt gcggtattgt ctcgagagca 1020
ttgacccttg aagtcctttc aactggaata gcaggaaact acaacggagc cttgcaagtg 1080
atgtcatctg agttccaagt cgcttcacca cttgttccta ctcgtgagaa ctatttcgta 1140
aggtactgta agcagcaacc agatgggata tgggcagtgg tggatgtttc cttggataat 1200
ctgcgaccca gtacaatctc aagaagccga agaaggccct ctggttgttt aattcaagaa 1260
ttgccaaacg gttactccaa ggttacatgg attgaacatg tggaagtgga tgatagagca 1320
gtgcatagca tatatagaac tctggttaat tcgggcctgg cctttggagc taaacgctgg 1380
gtagctacat tagaaagaca atgcgaacgt cttgccagtt caatggccaa caacatacca 1440
gcaggggacc tctgtgtgat aacgagtgct gagggaagga aaagtatgat gaagctggcg 1500
gagagaatgg taatgagcta ttgcactggt gttggtgctt ctaccgcgca tgcttggaca 1560
acgctctccg caactggatg tgatgatgta agggtaatga caagaaagag caccgacgaa 1620
cctggcagac cccccggtat agtgctcagt gctgccactt ctttttggct tcctgttcct 1680
ccaaagaggg tttttcattt cctacgtgat caaaactcaa gaaatgagtg ggacattctc 1740
tccaacgggg gtctagttca agaattggca catatagcaa atggtcgtga tcccggcaac 1800
tgtgtctctt tacttcgagt caatagtgca aattcaagcc aaagcaacat gctgatactt 1860
caagagagtt gcacagattc aactggctca tatgtagttt atgctcctgt ggatattgtt 1920
gctatgaatg ttgtcttgag tggaggggat ccagactatg ttgccctgct cccctcgggc 1980
tttgctattc tacctgatgg gcctcctgca ttaaacggtg ggcccataca tgatgttggg 2040
tctggaggtt ctctactcac agttgcattc cagatcttag ttgattcagc cccaactgca 2100
aagctatctc tgggttcagt cgccactgtt aacagtttaa ttaagtgcac agttgaaagg 2160
atcaaagttg cagtcatacg tgacaacacc acctga 2196
<210> 443
<211> 731
<212> PRT
<213> Glycine max
<400> 443
Met Phe Asp Thr Asn Met Phe Asp Ser His Pro His Leu Leu Asp Met
1 5 10 15
Ser Pro Pro His Lys Thr Thr Cys Ser Glu Ser Asp Leu Ala Lys Pro
20 25 30
Cys Arg Asp Asp Glu Tyr Glu Thr Lys Ser Ile Thr Asp Thr Met Asp
35 40 45
Ala Pro Ser Gly Asp Asp Gln Asp Pro Asn Pro Arg Pro Lys Lys Lys
50 55 60
Gly Tyr Arg Arg His Thr Gln Arg Gln Ile Glu Glu Met Glu Ala Phe
65 70 75 80
Phe Lys Gln Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser
85 90 95
Arg Glu Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn
100 105 110
Lys Arg Thr Gln Met Lys Thr Gln His Glu Arg Asn Glu Asn Ala Ile
115 120 125
Leu Lys Ala Glu Asn Glu Lys Leu Arg Ala Glu Asn Ser Arg Tyr Lys
130 135 140
Glu Ala Leu Thr Asn Ala Thr Cys Pro Asn Cys Gly Gly Pro Ala Ala
145 150 155 160
Leu Gly Glu Met Ser Phe Asp Glu Gln His Leu Arg Ile Glu Asn Ala
165 170 175
Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Gly Ile Ala Ala Lys Tyr
180 185 190
Val Gly Lys Pro Val Thr Ser Ser Tyr Ser Asn Leu Ser Ser Leu Asn
195 200 205
Asn Asn His Val Pro Val Gly Asn Tyr Gly Ser Gln Ser Gly Thr Val
210 215 220
Gly Glu Met Tyr Gly Gly Ser Asp Leu Phe Arg Pro Leu Pro Ala Pro
225 230 235 240
Ala Asp Ala Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met
245 250 255
Glu Glu Leu Thr Arg Leu Ala Gln Ala Gly Glu Pro Leu Trp Val Pro
260 265 270
Ser Asn His His Ser Glu Ile Leu Asn Glu Asp Glu Tyr Leu Arg Thr
275 280 285
Phe Pro Thr Arg Gly Leu Gly Pro Lys Pro Leu Gly Leu Arg Ser Glu
290 295 300
Ala Ser Arg Glu Ser Val Val Val Ile Met Asn His Ile Asn Leu Ile
305 310 315 320
Asp Ile Leu Met Asp Val Asn Gln Trp Ser Thr Val Phe Cys Gly Ile
325 330 335
Val Ser Arg Ala Leu Thr Leu Glu Val Leu Ser Thr Gly Ile Ala Gly
340 345 350
Asn Tyr Asn Gly Ala Leu Gln Val Met Ser Ser Glu Phe Gln Val Ala
355 360 365
Ser Pro Leu Val Pro Thr Arg Glu Asn Tyr Phe Val Arg Tyr Cys Lys
370 375 380
Gln Gln Pro Asp Gly Ile Trp Ala Val Val Asp Val Ser Leu Asp Asn
385 390 395 400
Leu Arg Pro Ser Thr Ile Ser Arg Ser Arg Arg Arg Pro Ser Gly Cys
405 410 415
Leu Ile Gln Glu Leu Pro Asn Gly Tyr Ser Lys Val Thr Trp Ile Glu
420 425 430
His Val Glu Val Asp Asp Arg Ala Val His Ser Ile Tyr Arg Thr Leu
435 440 445
Val Asn Ser Gly Leu Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu
450 455 460
Glu Arg Gln Cys Glu Arg Leu Ala Ser Ser Met Ala Asn Asn Ile Pro
465 470 475 480
Ala Gly Asp Leu Cys Val Ile Thr Ser Ala Glu Gly Arg Lys Ser Met
485 490 495
Met Lys Leu Ala Glu Arg Met Val Met Ser Tyr Cys Thr Gly Val Gly
500 505 510
Ala Ser Thr Ala His Ala Trp Thr Thr Leu Ser Ala Thr Gly Cys Asp
515 520 525
Asp Val Arg Val Met Thr Arg Lys Ser Thr Asp Glu Pro Gly Arg Pro
530 535 540
Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro
545 550 555 560
Pro Lys Arg Val Phe His Phe Leu Arg Asp Gln Asn Ser Arg Asn Glu
565 570 575
Trp Asp Ile Leu Ser Asn Gly Gly Leu Val Gln Glu Leu Ala His Ile
580 585 590
Ala Asn Gly Arg Asp Pro Gly Asn Cys Val Ser Leu Leu Arg Val Asn
595 600 605
Ser Ala Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys
610 615 620
Thr Asp Ser Thr Gly Ser Tyr Val Val Tyr Ala Pro Val Asp Ile Val
625 630 635 640
Ala Met Asn Val Val Leu Ser Gly Gly Asp Pro Asp Tyr Val Ala Leu
645 650 655
Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Pro Ala Leu Asn
660 665 670
Gly Gly Pro Ile His Asp Val Gly Ser Gly Gly Ser Leu Leu Thr Val
675 680 685
Ala Phe Gln Ile Leu Val Asp Ser Ala Pro Thr Ala Lys Leu Ser Leu
690 695 700
Gly Ser Val Ala Thr Val Asn Ser Leu Ile Lys Cys Thr Val Glu Arg
705 710 715 720
Ile Lys Val Ala Val Ile Arg Asp Asn Thr Thr
725 730
<210> 444
<211> 2142
<212> DNA
<213> Glycine max
<400> 444
atggagtacg gtgggtcgca gtccccaggg gagcaagatg gttcggattc ccaagagagg 60
aggaaacgct atcatcgtca tactgccaat cagattcaga ggcttgagtc aatgttcaaa 120
gagtgccccc atccagatga gaaacaaagg ttgcaattaa gcagggagtt aggcctggcc 180
ccgaggcaga ttaagttctg gttccaaaat aggaggaccc aaatgaaggc ccaacacgaa 240
agagctgaca attgtgctct tcgagctgac aatgacaaga tacgttgcga gaacatagcc 300
atcagggagg ccttgaagaa cgttatctgc ccttcttgtg gtggcccacc tctcaatgac 360
gattcttatt ttaatgacca taagttgcga ttagagaatg cccacctcaa agaagagctt 420
gatagagtgt ctagcattgc tgccaagtac attggaagac caatttccca actcccgccg 480
gtccagccta ttcatatatc gtctctggac ttatcaatgg cgagttttgg aaaccaaggg 540
atggttggtc cggctcctgc tccttccctt aatcttgatc ttcttcctgc tgggacttcc 600
tcatccatgc caaatttgcc ttatcagcct ccttgccttt cggacatgga caagtctctc 660
atgtcagaca ttgcctccaa tgccatggaa gaatttctca ggctcgtgca gacaaatgaa 720
cccttgtggc ttaaatcaaa cgtcgaccgt agagatgttc ttagttctga tgcctatgat 780
agaatgttct ccaagcccaa tactcgctcc aagaatccta atgttcgaat tgaagcatcc 840
cgagattctg gagtcgtatt actgaatagt ttagctttgg ttgatatgtt tatggaccca 900
aacaaatgga tccaactttt tcccacaatt gtctcagtgg caaggactat tcaagtcata 960
tcttctgggg tcatgggcag ttgcagtggt tctttacaat tgatgtatca agagttgcaa 1020
gtgctttctc cacttgtttc aactcgggag ttttacttcc tgcgttactg tcagcaaatt 1080
gagcagggca catgggcagt aatggacgtt tcttatgatt ttccccaaga tagccacttt 1140
gctcctcagt ttcggtctca tcgttgtcct tctggttgct tgatccagga catgcctgat 1200
gggcattcca agattacttg gattgaacac gtagagattg aagataaaac tcttcctcat 1260
cggctttata gaaatcttat ttatagtggg atggcatttg gagctgaaag atggcttact 1320
accctccaga ggatgtgtga aagatttact tatctgatgg ctacaagcaa tcctacccgg 1380
gataatcttg gaggagtaat ttcatctcct gagggcaaga ggagcatgat gaaacttgct 1440
caaaggatgg tcaccgattt ttgtgccagc attagcacat caagtggcca tcgatggacc 1500
acgctctctg ggttgaatga aatcgtagta agagtcactg tccacaaaag ctcagatcct 1560
ggacaaccta atggtgtggt gctaagtgca gccactacca tttggctccc cacccctcca 1620
cacactgtct ttaatttctt caaggatgaa aacaaaagac ctcagtggga tgttctttcc 1680
aacggtaatg ccgttcaaga ggttgccaac atagcaaatg gtttgcaccc tggtaactgt 1740
atatcagttc ttcgagcttt caacaacagt cagaacatgt taatactaca agaaagctgc 1800
atagattcct atggttcact tgtggtttat tgcccagttg atctgccatc catcaacaca 1860
gcagtaagtg gtgaagaccc ttcatacatt cccctactac caaatggatt taccattttg 1920
cctgatggtc agcctgacca ggaaggagat ggagcatcaa ctagctcaaa cacaaacagg 1980
aatatagcaa ggtctggtgg ttcactagtt acaattgcat tccaaattct agtgagcagc 2040
ttgccatctg ctaaggtcaa tatggagtcg gtgacaactg ttaacaatct tattggctcc 2100
actgtccagc aaataaagtc ttccctaagt tgtcctacct ag 2142
<210> 445
<211> 713
<212> PRT
<213> Glycine max
<400> 445
Met Glu Tyr Gly Gly Ser Gln Ser Pro Gly Glu Gln Asp Gly Ser Asp
1 5 10 15
Ser Gln Glu Arg Arg Lys Arg Tyr His Arg His Thr Ala Asn Gln Ile
20 25 30
Gln Arg Leu Glu Ser Met Phe Lys Glu Cys Pro His Pro Asp Glu Lys
35 40 45
Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly Leu Ala Pro Arg Gln Ile
50 55 60
Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Ala Gln His Glu
65 70 75 80
Arg Ala Asp Asn Cys Ala Leu Arg Ala Asp Asn Asp Lys Ile Arg Cys
85 90 95
Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys Asn Val Ile Cys Pro Ser
100 105 110
Cys Gly Gly Pro Pro Leu Asn Asp Asp Ser Tyr Phe Asn Asp His Lys
115 120 125
Leu Arg Leu Glu Asn Ala His Leu Lys Glu Glu Leu Asp Arg Val Ser
130 135 140
Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro Ile Ser Gln Leu Pro Pro
145 150 155 160
Val Gln Pro Ile His Ile Ser Ser Leu Asp Leu Ser Met Ala Ser Phe
165 170 175
Gly Asn Gln Gly Met Val Gly Pro Ala Pro Ala Pro Ser Leu Asn Leu
180 185 190
Asp Leu Leu Pro Ala Gly Thr Ser Ser Ser Met Pro Asn Leu Pro Tyr
195 200 205
Gln Pro Pro Cys Leu Ser Asp Met Asp Lys Ser Leu Met Ser Asp Ile
210 215 220
Ala Ser Asn Ala Met Glu Glu Phe Leu Arg Leu Val Gln Thr Asn Glu
225 230 235 240
Pro Leu Trp Leu Lys Ser Asn Val Asp Arg Arg Asp Val Leu Ser Ser
245 250 255
Asp Ala Tyr Asp Arg Met Phe Ser Lys Pro Asn Thr Arg Ser Lys Asn
260 265 270
Pro Asn Val Arg Ile Glu Ala Ser Arg Asp Ser Gly Val Val Leu Leu
275 280 285
Asn Ser Leu Ala Leu Val Asp Met Phe Met Asp Pro Asn Lys Trp Ile
290 295 300
Gln Leu Phe Pro Thr Ile Val Ser Val Ala Arg Thr Ile Gln Val Ile
305 310 315 320
Ser Ser Gly Val Met Gly Ser Cys Ser Gly Ser Leu Gln Leu Met Tyr
325 330 335
Gln Glu Leu Gln Val Leu Ser Pro Leu Val Ser Thr Arg Glu Phe Tyr
340 345 350
Phe Leu Arg Tyr Cys Gln Gln Ile Glu Gln Gly Thr Trp Ala Val Met
355 360 365
Asp Val Ser Tyr Asp Phe Pro Gln Asp Ser His Phe Ala Pro Gln Phe
370 375 380
Arg Ser His Arg Cys Pro Ser Gly Cys Leu Ile Gln Asp Met Pro Asp
385 390 395 400
Gly His Ser Lys Ile Thr Trp Ile Glu His Val Glu Ile Glu Asp Lys
405 410 415
Thr Leu Pro His Arg Leu Tyr Arg Asn Leu Ile Tyr Ser Gly Met Ala
420 425 430
Phe Gly Ala Glu Arg Trp Leu Thr Thr Leu Gln Arg Met Cys Glu Arg
435 440 445
Phe Thr Tyr Leu Met Ala Thr Ser Asn Pro Thr Arg Asp Asn Leu Gly
450 455 460
Gly Val Ile Ser Ser Pro Glu Gly Lys Arg Ser Met Met Lys Leu Ala
465 470 475 480
Gln Arg Met Val Thr Asp Phe Cys Ala Ser Ile Ser Thr Ser Ser Gly
485 490 495
His Arg Trp Thr Thr Leu Ser Gly Leu Asn Glu Ile Val Val Arg Val
500 505 510
Thr Val His Lys Ser Ser Asp Pro Gly Gln Pro Asn Gly Val Val Leu
515 520 525
Ser Ala Ala Thr Thr Ile Trp Leu Pro Thr Pro Pro His Thr Val Phe
530 535 540
Asn Phe Phe Lys Asp Glu Asn Lys Arg Pro Gln Trp Asp Val Leu Ser
545 550 555 560
Asn Gly Asn Ala Val Gln Glu Val Ala Asn Ile Ala Asn Gly Leu His
565 570 575
Pro Gly Asn Cys Ile Ser Val Leu Arg Ala Phe Asn Asn Ser Gln Asn
580 585 590
Met Leu Ile Leu Gln Glu Ser Cys Ile Asp Ser Tyr Gly Ser Leu Val
595 600 605
Val Tyr Cys Pro Val Asp Leu Pro Ser Ile Asn Thr Ala Val Ser Gly
610 615 620
Glu Asp Pro Ser Tyr Ile Pro Leu Leu Pro Asn Gly Phe Thr Ile Leu
625 630 635 640
Pro Asp Gly Gln Pro Asp Gln Glu Gly Asp Gly Ala Ser Thr Ser Ser
645 650 655
Asn Thr Asn Arg Asn Ile Ala Arg Ser Gly Gly Ser Leu Val Thr Ile
660 665 670
Ala Phe Gln Ile Leu Val Ser Ser Leu Pro Ser Ala Lys Val Asn Met
675 680 685
Glu Ser Val Thr Thr Val Asn Asn Leu Ile Gly Ser Thr Val Gln Gln
690 695 700
Ile Lys Ser Ser Leu Ser Cys Pro Thr
705 710
<210> 446
<211> 2349
<212> DNA
<213> Glycine max
<400> 446
atgtcaagta tgggagggaa cgtagtagta aactcagaca ctctcttctc ctcctcgatc 60
cagaactcta gcttcaactt catccccacc atgccctttc aaccttttcc ttccatgaaa 120
gaagaagatg ggatcttgcg agggaaggaa gagatggaaa gtggatcagg aagtgaacaa 180
ttagttgaag acaaatcagg gtatgaacaa gagagtcatg aagaacccac aaagaagaaa 240
cgttatcaca ggcacactgc tcgccagatc caagaaatgg aatctttgtt caaggaatgc 300
ccacaccctg atgataagca gaggctgaaa ctgagccatg aattgggtct taaaccgcgc 360
caggtcaagt tctggttcca gaaccgtcga acccagatga aggcacaaca agaccgggca 420
gataatatga tacttagagc tgagaatgag actctaaaga gtgagaatta tcggttacaa 480
gctgcactgc gtaacgttat ttgtcccaac tgtggtggcc cgtgcataat gggtgctgat 540
atgggtttcg atgaacacca acttcgcatt gaaaatgctc gtttaagaga agagttagaa 600
cgcgtgtgtt gtctcactac aagatacact gggcgtccaa tacaaacaat ggcagcagat 660
cctactctaa tggccccttc attggatttg gacatgaaca tgtacccaag gcacttttcg 720
gatcccattg ctccatgcac agaaatgatt cctgtgccaa tgttgcctcc cgaagcttca 780
ccgttttctg agggtggtgt tttaatggaa gaagagaagt ctctggcctt ggagcttgcg 840
gcttcctcta tggctgaact tgtgaagatg tgtcagacaa atgaaccact ttggatccaa 900
agcagtgagg gtgaaaggga agtgctcaat tttgaagagc atgcaagaat gtttgtttgg 960
cctcagaatc tcaagaaccg aagtgagcta aggacagaag ctagccgtga cacttctgtg 1020
gttataatta atagtgtcac tcttgttgat gctttccttg atgctcaaaa atggatggaa 1080
ttgtttccta caatcgtttc aagagcaaaa actgtccaaa tcatatcttc tggtgcttcc 1140
ggtcttgcaa gcgggactct tcagctgatg tgcgcagaat tccaagttct ttctcctttg 1200
gtgtccactc gtgagactca ttttcttcga tattgtcaac aaaatgctga ggagggaacc 1260
tgggccattg ttgattttcc tgttgatagc tttcaccaaa attttcaccc ttcttaccct 1320
agatactgca ggaggtcctc tggctgcgtt attcaagata tgccaaatgg gtattcaagg 1380
gtaacatggg tggagcatgc aaaagtagaa gagaaacctg tgcatcagat attctgcaat 1440
tatgtgtaca gtggaatggc atttggagca cagcgttggt taggagtttt gcagagacaa 1500
tgtgaaaggg tcgcaagcct catggccaga aacatatcag atcttggagt gataccttcg 1560
ccagatgcgc gaaagaactt gatgaaacta gcccaaagaa tgataaaaac gtttagcctt 1620
aatatgagta cctctggtgg tcaatcatgg acagccatat cagattcccc tgaagacact 1680
gttagaatca caactaggaa aatcacagag cctggccaac ctaatggcgt gattctaagt 1740
gcagtttcaa ccacttggtt gccctattct cacaccaagg tctttgatct cctcagggat 1800
gaacgccaca gatctcagat ggatactctt tcaaacggga actcattgaa tgaagtggct 1860
catattgcaa atggctcaca tccaggaaac tgcatttctc ttcttcgcat aaatgtagca 1920
agcaactcat cccagaacgt agagctaatg ctgcaagaga gttgcaccga ccaatctgga 1980
agcctagtag tgtacacaac catcgacgtg gatgcgatcc agctagccat gagtggcgag 2040
gacccttctt gcattgcact tcttccccaa ggcttcaaga tagtgccaat gctatcatca 2100
cccatcaccg atacaacaaa ctcatcagag cctccaatat ctctcaacaa caactcaggt 2160
ggttgcctct taacaatggg ggtgcaggtt ctcgcgagca caatcccttc tgcaaagctc 2220
aacctctcga gcgtcaccgc catcaacaac cacctttgca acaccttgca ccagattgaa 2280
gctgctcttt cttctactaa ctcccatgag aacggcttct tcctttgcac tgaacccacc 2340
aagcagtga 2349
<210> 447
<211> 782
<212> PRT
<213> Glycine max
<400> 447
Met Ser Ser Met Gly Gly Asn Val Val Val Asn Ser Asp Thr Leu Phe
1 5 10 15
Ser Ser Ser Ile Gln Asn Ser Ser Phe Asn Phe Ile Pro Thr Met Pro
20 25 30
Phe Gln Pro Phe Pro Ser Met Lys Glu Glu Asp Gly Ile Leu Arg Gly
35 40 45
Lys Glu Glu Met Glu Ser Gly Ser Gly Ser Glu Gln Leu Val Glu Asp
50 55 60
Lys Ser Gly Tyr Glu Gln Glu Ser His Glu Glu Pro Thr Lys Lys Lys
65 70 75 80
Arg Tyr His Arg His Thr Ala Arg Gln Ile Gln Glu Met Glu Ser Leu
85 90 95
Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Leu Lys Leu Ser
100 105 110
His Glu Leu Gly Leu Lys Pro Arg Gln Val Lys Phe Trp Phe Gln Asn
115 120 125
Arg Arg Thr Gln Met Lys Ala Gln Gln Asp Arg Ala Asp Asn Met Ile
130 135 140
Leu Arg Ala Glu Asn Glu Thr Leu Lys Ser Glu Asn Tyr Arg Leu Gln
145 150 155 160
Ala Ala Leu Arg Asn Val Ile Cys Pro Asn Cys Gly Gly Pro Cys Ile
165 170 175
Met Gly Ala Asp Met Gly Phe Asp Glu His Gln Leu Arg Ile Glu Asn
180 185 190
Ala Arg Leu Arg Glu Glu Leu Glu Arg Val Cys Cys Leu Thr Thr Arg
195 200 205
Tyr Thr Gly Arg Pro Ile Gln Thr Met Ala Ala Asp Pro Thr Leu Met
210 215 220
Ala Pro Ser Leu Asp Leu Asp Met Asn Met Tyr Pro Arg His Phe Ser
225 230 235 240
Asp Pro Ile Ala Pro Cys Thr Glu Met Ile Pro Val Pro Met Leu Pro
245 250 255
Pro Glu Ala Ser Pro Phe Ser Glu Gly Gly Val Leu Met Glu Glu Glu
260 265 270
Lys Ser Leu Ala Leu Glu Leu Ala Ala Ser Ser Met Ala Glu Leu Val
275 280 285
Lys Met Cys Gln Thr Asn Glu Pro Leu Trp Ile Gln Ser Ser Glu Gly
290 295 300
Glu Arg Glu Val Leu Asn Phe Glu Glu His Ala Arg Met Phe Val Trp
305 310 315 320
Pro Gln Asn Leu Lys Asn Arg Ser Glu Leu Arg Thr Glu Ala Ser Arg
325 330 335
Asp Thr Ser Val Val Ile Ile Asn Ser Val Thr Leu Val Asp Ala Phe
340 345 350
Leu Asp Ala Gln Lys Trp Met Glu Leu Phe Pro Thr Ile Val Ser Arg
355 360 365
Ala Lys Thr Val Gln Ile Ile Ser Ser Gly Ala Ser Gly Leu Ala Ser
370 375 380
Gly Thr Leu Gln Leu Met Cys Ala Glu Phe Gln Val Leu Ser Pro Leu
385 390 395 400
Val Ser Thr Arg Glu Thr His Phe Leu Arg Tyr Cys Gln Gln Asn Ala
405 410 415
Glu Glu Gly Thr Trp Ala Ile Val Asp Phe Pro Val Asp Ser Phe His
420 425 430
Gln Asn Phe His Pro Ser Tyr Pro Arg Tyr Cys Arg Arg Ser Ser Gly
435 440 445
Cys Val Ile Gln Asp Met Pro Asn Gly Tyr Ser Arg Val Thr Trp Val
450 455 460
Glu His Ala Lys Val Glu Glu Lys Pro Val His Gln Ile Phe Cys Asn
465 470 475 480
Tyr Val Tyr Ser Gly Met Ala Phe Gly Ala Gln Arg Trp Leu Gly Val
485 490 495
Leu Gln Arg Gln Cys Glu Arg Val Ala Ser Leu Met Ala Arg Asn Ile
500 505 510
Ser Asp Leu Gly Val Ile Pro Ser Pro Asp Ala Arg Lys Asn Leu Met
515 520 525
Lys Leu Ala Gln Arg Met Ile Lys Thr Phe Ser Leu Asn Met Ser Thr
530 535 540
Ser Gly Gly Gln Ser Trp Thr Ala Ile Ser Asp Ser Pro Glu Asp Thr
545 550 555 560
Val Arg Ile Thr Thr Arg Lys Ile Thr Glu Pro Gly Gln Pro Asn Gly
565 570 575
Val Ile Leu Ser Ala Val Ser Thr Thr Trp Leu Pro Tyr Ser His Thr
580 585 590
Lys Val Phe Asp Leu Leu Arg Asp Glu Arg His Arg Ser Gln Met Asp
595 600 605
Thr Leu Ser Asn Gly Asn Ser Leu Asn Glu Val Ala His Ile Ala Asn
610 615 620
Gly Ser His Pro Gly Asn Cys Ile Ser Leu Leu Arg Ile Asn Val Ala
625 630 635 640
Ser Asn Ser Ser Gln Asn Val Glu Leu Met Leu Gln Glu Ser Cys Thr
645 650 655
Asp Gln Ser Gly Ser Leu Val Val Tyr Thr Thr Ile Asp Val Asp Ala
660 665 670
Ile Gln Leu Ala Met Ser Gly Glu Asp Pro Ser Cys Ile Ala Leu Leu
675 680 685
Pro Gln Gly Phe Lys Ile Val Pro Met Leu Ser Ser Pro Ile Thr Asp
690 695 700
Thr Thr Asn Ser Ser Glu Pro Pro Ile Ser Leu Asn Asn Asn Ser Gly
705 710 715 720
Gly Cys Leu Leu Thr Met Gly Val Gln Val Leu Ala Ser Thr Ile Pro
725 730 735
Ser Ala Lys Leu Asn Leu Ser Ser Val Thr Ala Ile Asn Asn His Leu
740 745 750
Cys Asn Thr Leu His Gln Ile Glu Ala Ala Leu Ser Ser Thr Asn Ser
755 760 765
His Glu Asn Gly Phe Phe Leu Cys Thr Glu Pro Thr Lys Gln
770 775 780
<210> 448
<211> 1890
<212> DNA
<213> Glycine max
<400> 448
atgggcgccg acatgtccaa caataataat cctcctccca cttctcacgc caaagacttg 60
tttgcttctc cagctctctc tctcagcctc gctggcattt ttcgccatgc tggggtggcc 120
gcggctgatg aggctgccac ttctgtggag gagggcgaag aagggagtgg aggagctgct 180
gagaggttag aggagattag cagcgagaac tccggcccca cgagatccag atcagaggat 240
gacttcgaag gaggagaagc tgaacctgaa gatgatgacg atgcccatgg agacaacaag 300
aacaagaaga cgaagaagaa gaggaagaaa tatcacaggc acactgctga ccagatcaga 360
gaaatggaag cgcttttcaa agagtcacca catcctgatg aaaagcagag gcaacaacta 420
agcaagcaat taggccttgc cccaaggcaa gtcaagtttt ggttccaaaa tcgtcgaacc 480
caaatcaagg caatacaaga gcgtcatgaa aattctttgt tgaagtcaga aatagagaaa 540
ctaaaggaga aaaataagag cttacgagag accataaaca aagcttgttg ccccaactgt 600
ggcgtgccca ccacaagcag agatggtgtc atgccaactg aagaacaaca actacgtatt 660
gaaaatgcca aactcaaagc tgaggtagag aaactccgag cagctttagg gaaatacgca 720
ccagggtcaa cgtccccttc atgttcttct ggccatgacc aagagaatag aagctctttg 780
gatttttaca ctggaatttt tggacttgat aagtcaagga taatggacat agtaaaccaa 840
gcaatggagg agctcattaa gatggctacc gtgggggaac cattatggct tcgtagcttc 900
gagactggtc gcgaaattct taactatgat gaatatgtta aggagtttgc agttgaaaat 960
tcaagcagta gtggaaagcc aaagagatcc attgaagcct caagagacac tgcagttgtt 1020
tttgtggatc tccctagtct tgtccaaagt tttctagacg tgaatcagtg gaaggaaatg 1080
tttccgtgtt tgatatctaa ggcggcaact gttgatgtta tatgcaatgg agagggtctt 1140
agcaggaatg gtgcagtgca actgatgttt gctgagcttc aaatgctgac tcctatggtt 1200
cccacaagag aagtctattt tgttcgtttc tgcaagcagt tgagtgctga acagtgggca 1260
atcgttgatg tatccataga caaagtagaa gacaacattg acgcgtccct cgtgaaatgc 1320
agaaaacgcc cttctggttg cattattgag gacaagtcca atggccattg caaagtaata 1380
tgggtggagc actcggaatg ccagaagagt gcagtccatt caatgtatcg caccattgtg 1440
aacagtggcc tagcttttgg ggccaggcat tggattgcga ctcttcaact tcaatgtgaa 1500
cgtctagttt tcttcatggc aacaaatgtt cccatgaagg attcaaccgg tgttgccacc 1560
ttggccggga gaaaaagcat tctgaagttg gcacaaagaa tgacatggag tttctgccat 1620
gcaattggcg cgtcaagcat ccacgcatgg actaaggtta caagtaaaac tggagaagac 1680
ataaggataa gttctagaaa gaacttgaac gatcctggtg aacctcttgg gttgatattg 1740
tgcgctgttt gttctgtatg gttgcctgtc tcacctaatg ttctgtttga tttcttgagg 1800
gatgaaaatc gccgaactga agtaccactc tcttgtctcc tttccttctt aacccttttg 1860
tcaattttgg ttaataattt gaatggttaa 1890
<210> 449
<211> 629
<212> PRT
<213> Glycine max
<400> 449
Met Gly Ala Asp Met Ser Asn Asn Asn Asn Pro Pro Pro Thr Ser His
1 5 10 15
Ala Lys Asp Leu Phe Ala Ser Pro Ala Leu Ser Leu Ser Leu Ala Gly
20 25 30
Ile Phe Arg His Ala Gly Val Ala Ala Ala Asp Glu Ala Ala Thr Ser
35 40 45
Val Glu Glu Gly Glu Glu Gly Ser Gly Gly Ala Ala Glu Arg Leu Glu
50 55 60
Glu Ile Ser Ser Glu Asn Ser Gly Pro Thr Arg Ser Arg Ser Glu Asp
65 70 75 80
Asp Phe Glu Gly Gly Glu Ala Glu Pro Glu Asp Asp Asp Asp Ala His
85 90 95
Gly Asp Asn Lys Asn Lys Lys Thr Lys Lys Lys Arg Lys Lys Tyr His
100 105 110
Arg His Thr Ala Asp Gln Ile Arg Glu Met Glu Ala Leu Phe Lys Glu
115 120 125
Ser Pro His Pro Asp Glu Lys Gln Arg Gln Gln Leu Ser Lys Gln Leu
130 135 140
Gly Leu Ala Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr
145 150 155 160
Gln Ile Lys Ala Ile Gln Glu Arg His Glu Asn Ser Leu Leu Lys Ser
165 170 175
Glu Ile Glu Lys Leu Lys Glu Lys Asn Lys Ser Leu Arg Glu Thr Ile
180 185 190
Asn Lys Ala Cys Cys Pro Asn Cys Gly Val Pro Thr Thr Ser Arg Asp
195 200 205
Gly Val Met Pro Thr Glu Glu Gln Gln Leu Arg Ile Glu Asn Ala Lys
210 215 220
Leu Lys Ala Glu Val Glu Lys Leu Arg Ala Ala Leu Gly Lys Tyr Ala
225 230 235 240
Pro Gly Ser Thr Ser Pro Ser Cys Ser Ser Gly His Asp Gln Glu Asn
245 250 255
Arg Ser Ser Leu Asp Phe Tyr Thr Gly Ile Phe Gly Leu Asp Lys Ser
260 265 270
Arg Ile Met Asp Ile Val Asn Gln Ala Met Glu Glu Leu Ile Lys Met
275 280 285
Ala Thr Val Gly Glu Pro Leu Trp Leu Arg Ser Phe Glu Thr Gly Arg
290 295 300
Glu Ile Leu Asn Tyr Asp Glu Tyr Val Lys Glu Phe Ala Val Glu Asn
305 310 315 320
Ser Ser Ser Ser Gly Lys Pro Lys Arg Ser Ile Glu Ala Ser Arg Asp
325 330 335
Thr Ala Val Val Phe Val Asp Leu Pro Ser Leu Val Gln Ser Phe Leu
340 345 350
Asp Val Asn Gln Trp Lys Glu Met Phe Pro Cys Leu Ile Ser Lys Ala
355 360 365
Ala Thr Val Asp Val Ile Cys Asn Gly Glu Gly Leu Ser Arg Asn Gly
370 375 380
Ala Val Gln Leu Met Phe Ala Glu Leu Gln Met Leu Thr Pro Met Val
385 390 395 400
Pro Thr Arg Glu Val Tyr Phe Val Arg Phe Cys Lys Gln Leu Ser Ala
405 410 415
Glu Gln Trp Ala Ile Val Asp Val Ser Ile Asp Lys Val Glu Asp Asn
420 425 430
Ile Asp Ala Ser Leu Val Lys Cys Arg Lys Arg Pro Ser Gly Cys Ile
435 440 445
Ile Glu Asp Lys Ser Asn Gly His Cys Lys Val Ile Trp Val Glu His
450 455 460
Ser Glu Cys Gln Lys Ser Ala Val His Ser Met Tyr Arg Thr Ile Val
465 470 475 480
Asn Ser Gly Leu Ala Phe Gly Ala Arg His Trp Ile Ala Thr Leu Gln
485 490 495
Leu Gln Cys Glu Arg Leu Val Phe Phe Met Ala Thr Asn Val Pro Met
500 505 510
Lys Asp Ser Thr Gly Val Ala Thr Leu Ala Gly Arg Lys Ser Ile Leu
515 520 525
Lys Leu Ala Gln Arg Met Thr Trp Ser Phe Cys His Ala Ile Gly Ala
530 535 540
Ser Ser Ile His Ala Trp Thr Lys Val Thr Ser Lys Thr Gly Glu Asp
545 550 555 560
Ile Arg Ile Ser Ser Arg Lys Asn Leu Asn Asp Pro Gly Glu Pro Leu
565 570 575
Gly Leu Ile Leu Cys Ala Val Cys Ser Val Trp Leu Pro Val Ser Pro
580 585 590
Asn Val Leu Phe Asp Phe Leu Arg Asp Glu Asn Arg Arg Thr Glu Val
595 600 605
Pro Leu Ser Cys Leu Leu Ser Phe Leu Thr Leu Leu Ser Ile Leu Val
610 615 620
Asn Asn Leu Asn Gly
625
<210> 450
<211> 2214
<212> DNA
<213> Glycine max
<400> 450
atgggtcaaa tcggagaaag ttttgatact agtaatttgc tggggaggct gagggacgat 60
gagtatgaaa gccggtctgg aagtgacaat tttgatggcg gatctggtga tgaccaggat 120
gctggggatg atcagccaca taaaaagaag aagaaatacc acagacacac ccctcaacaa 180
attcaggagc ttgaagcgtt tttcaaggag tgtcctcatc ctgatgagaa gcaaagaact 240
gatcttagca agaggcttgg cttggagaac aagcaagtca agttctggtt tcagaatcga 300
cgaacccaaa tgaagacaca actggaacgc catgagaaca tgattcttag gcaggaaaac 360
gacaagctcc gagctgagaa cagtgtaatg aaggatgctt tggcaaatcc gacatgtaac 420
aactgtggtg gcccagccat tcctggtcaa atttccttgg aggagcacca aactagaatg 480
gaaaatgctc gactgaagga tgaactgaac cgaatatgtg cattggcaaa caagttcctg 540
ggccggccac tctcgccact ggccagtcct atggctctgc caccctcaaa ttctggtcta 600
gagcttgcta ttggaagaaa tggaattggt ggtccaagca attttggcat gtccttgcca 660
atgggatttg atgtgggaga tggagttatg ggctcctcac ctgggatgtc tagtatgggt 720
gctagatcac caatgggaat gatgggaaat gaaatccagc ttgagagatc tatgctttta 780
gaccttgcat taaatgctat gaatgaatta attaagatgg ctcagccaga tacctctctt 840
tggattaaga gctctgatgg caggaatgaa gtactcaacc atgatgagta tgcaagactg 900
ttttctcctt atgttggatc aaaacctgct ggttatgtga ctgaagctac aagagggacc 960
ggagtagtac cagccagcag tttgggcatt gttgaaacat tgatggatgt ggatcgatgg 1020
gcggagatgt tttcatctat gattgctagt gctgccactt tggaagtact gtctagtggc 1080
atgggtgaaa gcagaagtgg agctttgcaa gtgatgcttg ctgaggttca attgctttct 1140
ccactagtcc ctgctcgttc attgagtttc ctcaggtata gcaagcagca cggcgaaggt 1200
gtatgggctg tggttgatgt ttcagttgac attggtcgta atgttaccaa ttcacatcca 1260
ttaatgagct gcaggaggct tccctctggc tgtgttattc aggatatgcc caatggtttc 1320
tccaagatta cttgggttga acattcccaa tatgacgaga gtgttgtcca ccaactttat 1380
cgcccattgg ttagttctgg cattggcttt ggtgctcaga gatggattgc caccctctta 1440
aggcagtgtg actgcttggc aatcctcatg tctcaaatcc catctgagga ccccacagtc 1500
attagcctag agggtaagaa aaacatgctg aagctcgcac aacgcatgac cgagtacttc 1560
tgctcaggga tctgtgcttc gtctgtgcgc aagtgggaaa tactgaacat tggtaatctg 1620
gctgatgaca tgagaatcat ggcccggaaa atcaatatgg atgacccaac tgaggctcct 1680
ggcattgtgc tgagtgcttc aacttctgtt tggatgccgg tgtcacggca aagggtgttt 1740
gattttctgc gtgatgaaaa tttgagaggc gagtgggaca tgctgtccaa agatggacca 1800
atgaaggaga tgctccatat tgctaaagga caagatcgtg gaaattgtgt ttccatcctt 1860
cattctgcta atagcgagtg caatgtgcta tatctgcaag aatcatggac tgatgcttcc 1920
ggctcattgg tagtgtattc cccgatcaac atgcaagcct tgaacatggt gatgaactgt 1980
ggagattcat catttgtcgc tctccgccca tcaggctttg ctattctgcc agatggcgct 2040
tcaaacaacg gtgatggcag tgatggtggt ggcagctgcc tgcttacagt tgggttacaa 2100
atgttgccaa atggagacca atcaaccaag ttcacaatgg agtcagttgt tactgtcaat 2160
agcctcatct caaacaccat tcagaaggtc aaagatgcac ttggagttgc gtga 2214
<210> 451
<211> 737
<212> PRT
<213> Glycine max
<400> 451
Met Gly Gln Ile Gly Glu Ser Phe Asp Thr Ser Asn Leu Leu Gly Arg
1 5 10 15
Leu Arg Asp Asp Glu Tyr Glu Ser Arg Ser Gly Ser Asp Asn Phe Asp
20 25 30
Gly Gly Ser Gly Asp Asp Gln Asp Ala Gly Asp Asp Gln Pro His Lys
35 40 45
Lys Lys Lys Lys Tyr His Arg His Thr Pro Gln Gln Ile Gln Glu Leu
50 55 60
Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp Glu Lys Gln Arg Thr
65 70 75 80
Asp Leu Ser Lys Arg Leu Gly Leu Glu Asn Lys Gln Val Lys Phe Trp
85 90 95
Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu Arg His Glu
100 105 110
Asn Met Ile Leu Arg Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn Ser
115 120 125
Val Met Lys Asp Ala Leu Ala Asn Pro Thr Cys Asn Asn Cys Gly Gly
130 135 140
Pro Ala Ile Pro Gly Gln Ile Ser Leu Glu Glu His Gln Thr Arg Met
145 150 155 160
Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg Ile Cys Ala Leu Ala
165 170 175
Asn Lys Phe Leu Gly Arg Pro Leu Ser Pro Leu Ala Ser Pro Met Ala
180 185 190
Leu Pro Pro Ser Asn Ser Gly Leu Glu Leu Ala Ile Gly Arg Asn Gly
195 200 205
Ile Gly Gly Pro Ser Asn Phe Gly Met Ser Leu Pro Met Gly Phe Asp
210 215 220
Val Gly Asp Gly Val Met Gly Ser Ser Pro Gly Met Ser Ser Met Gly
225 230 235 240
Ala Arg Ser Pro Met Gly Met Met Gly Asn Glu Ile Gln Leu Glu Arg
245 250 255
Ser Met Leu Leu Asp Leu Ala Leu Asn Ala Met Asn Glu Leu Ile Lys
260 265 270
Met Ala Gln Pro Asp Thr Ser Leu Trp Ile Lys Ser Ser Asp Gly Arg
275 280 285
Asn Glu Val Leu Asn His Asp Glu Tyr Ala Arg Leu Phe Ser Pro Tyr
290 295 300
Val Gly Ser Lys Pro Ala Gly Tyr Val Thr Glu Ala Thr Arg Gly Thr
305 310 315 320
Gly Val Val Pro Ala Ser Ser Leu Gly Ile Val Glu Thr Leu Met Asp
325 330 335
Val Asp Arg Trp Ala Glu Met Phe Ser Ser Met Ile Ala Ser Ala Ala
340 345 350
Thr Leu Glu Val Leu Ser Ser Gly Met Gly Glu Ser Arg Ser Gly Ala
355 360 365
Leu Gln Val Met Leu Ala Glu Val Gln Leu Leu Ser Pro Leu Val Pro
370 375 380
Ala Arg Ser Leu Ser Phe Leu Arg Tyr Ser Lys Gln His Gly Glu Gly
385 390 395 400
Val Trp Ala Val Val Asp Val Ser Val Asp Ile Gly Arg Asn Val Thr
405 410 415
Asn Ser His Pro Leu Met Ser Cys Arg Arg Leu Pro Ser Gly Cys Val
420 425 430
Ile Gln Asp Met Pro Asn Gly Phe Ser Lys Ile Thr Trp Val Glu His
435 440 445
Ser Gln Tyr Asp Glu Ser Val Val His Gln Leu Tyr Arg Pro Leu Val
450 455 460
Ser Ser Gly Ile Gly Phe Gly Ala Gln Arg Trp Ile Ala Thr Leu Leu
465 470 475 480
Arg Gln Cys Asp Cys Leu Ala Ile Leu Met Ser Gln Ile Pro Ser Glu
485 490 495
Asp Pro Thr Val Ile Ser Leu Glu Gly Lys Lys Asn Met Leu Lys Leu
500 505 510
Ala Gln Arg Met Thr Glu Tyr Phe Cys Ser Gly Ile Cys Ala Ser Ser
515 520 525
Val Arg Lys Trp Glu Ile Leu Asn Ile Gly Asn Leu Ala Asp Asp Met
530 535 540
Arg Ile Met Ala Arg Lys Ile Asn Met Asp Asp Pro Thr Glu Ala Pro
545 550 555 560
Gly Ile Val Leu Ser Ala Ser Thr Ser Val Trp Met Pro Val Ser Arg
565 570 575
Gln Arg Val Phe Asp Phe Leu Arg Asp Glu Asn Leu Arg Gly Glu Trp
580 585 590
Asp Met Leu Ser Lys Asp Gly Pro Met Lys Glu Met Leu His Ile Ala
595 600 605
Lys Gly Gln Asp Arg Gly Asn Cys Val Ser Ile Leu His Ser Ala Asn
610 615 620
Ser Glu Cys Asn Val Leu Tyr Leu Gln Glu Ser Trp Thr Asp Ala Ser
625 630 635 640
Gly Ser Leu Val Val Tyr Ser Pro Ile Asn Met Gln Ala Leu Asn Met
645 650 655
Val Met Asn Cys Gly Asp Ser Ser Phe Val Ala Leu Arg Pro Ser Gly
660 665 670
Phe Ala Ile Leu Pro Asp Gly Ala Ser Asn Asn Gly Asp Gly Ser Asp
675 680 685
Gly Gly Gly Ser Cys Leu Leu Thr Val Gly Leu Gln Met Leu Pro Asn
690 695 700
Gly Asp Gln Ser Thr Lys Phe Thr Met Glu Ser Val Val Thr Val Asn
705 710 715 720
Ser Leu Ile Ser Asn Thr Ile Gln Lys Val Lys Asp Ala Leu Gly Val
725 730 735
Ala
<210> 452
<211> 2223
<212> DNA
<213> Glycine max
<400> 452
atgtataaca aaagtcagaa cacaaaattc gattctcaac aacaacagca gcagcaacaa 60
ccgcagcagc aacaaccgca gaatttgatg gagatgtcaa cacagaggac atcctcggaa 120
ggaaggaacc gagacgatca ggaacctgct gcgggaaacg aagtcaccat ggaagctcct 180
ccttcgggtg acgaggacca agatcccgat gaggggttca aaaggaggcg ccacacccgc 240
cacacactgc accaaatttc agagatggaa gctttcttca aggagtgccc tcaccctgat 300
gagaagcaaa ggaaagcgct tggccgcgag ctcgggttgg tgcctttgca aatcaagttt 360
tggtttcaaa acaagcgcac tcaagtgaag tctcaacaag agagatacga aaacaacctt 420
ctgagggttg agaatgacaa gcttcgagca gagaacagta ggtacaggaa tgcactatcg 480
aatacttcat gccctaactg tggagcccct actactcttg gagaaatgtc ctttgacgag 540
cagcagttga ggatggagaa tgcgcgacaa aaagaggaga ttgatagcat gtcaggactt 600
gcagccaagt atgcagctgg aaaatctgcg agcaattcgt actataacat gccatctaat 660
caaaaccaga tgccttcgcg ctcgcttgac ctgggagttc agcatcaaca acagcaacaa 720
caagaacaac aacaacaaca actatattgt acaagcgcaa cctatttaat ttcggagatt 780
ggtctcgtgg cagtagagga aatcaatcag ttgactctgt ctgcagatcc tttgtgggtc 840
ccaggcaatt acggaagtga agttataaat gaagatgaat acctgaggca tttccctagg 900
ggaataggtc caacactctt gggcgcaaga accgaatcat ctcggcaaac cgctatagta 960
atgatgcatc atatgaaact cgttgagatg cttatggatg tgaatcaatg gtcaaatatg 1020
ttttgcggca tcgtttcaag ggcagtgaca cacgaagtgc tgtcaattgg agaccatgca 1080
agatacgatg gagcctacca agtgatgtca gctgagtttc aggttccttc accccttgtt 1140
cctactcgcg acaactattt catcaggttc agtaagaagc acgcaggaca atcatgggcg 1200
gtggttgata tttcaatgga tcatctgcga cctggtgcag tcacaagaac ccgaagacga 1260
ccctctggtt gcataattca agaattgcca aatggttact caaaggtcat atgggttgaa 1320
catgtcgaag ttgacgacat cgaggtgcat aatctttaca aaaatttggt taactctacc 1380
cttgcgtttg gagctaaacg ttggattgca gcaatagaaa gaacatgcga acatcttgct 1440
agggcaatgg ccaccaacat accccaaggg gcactttgtg tgataacaag tcacgagggt 1500
cggaaaagta tgatgaagct ggccgaaaga atggtattga gcttttctac tggtgtgggt 1560
gcttccactg caaacgcttg gacaccacta ccacttgatc ttgaaaatgt tagggtcatg 1620
accagaaaga gcgtggatga tccaggcaga ccttccggta tagtgctcag tgctgcaact 1680
tctctctggc tcccagttcc tgcaaggaga gtttttgact ttctcagatc cgaaaacact 1740
agaaatcagt gggatattct gtcgagcggg gctcaagtga acgagcttgc acatattgct 1800
aaagggagag accatggaaa ttctgtctct cttcttcgag tgaatactca gaatgtggcc 1860
cagaacaata tgctgatact tcaagagagt tgcattgatg ctacaggctc atttgtggtt 1920
tatgctccta ttgatttagc ttccatgaat cttgtgttgg gtggtggtaa tccggattac 1980
gtggccctgc tcccttcggg ctttgctgtt cttcctgatg ggcctgcatt gaacgtagtg 2040
cccgggcccg tatgtgaggt tgttggatct ggacgaggtt gtcttcttac ggttgcattt 2100
cagatactgg tggattctac accaacggca aaactctctg ttggttcagt gacaaccgtt 2160
aacaatttga taaagagaac cgtggaaagg atcaaagatt cagtcacgct tgacggcgcc 2220
taa 2223
<210> 453
<211> 740
<212> PRT
<213> Glycine max
<400> 453
Met Tyr Asn Lys Ser Gln Asn Thr Lys Phe Asp Ser Gln Gln Gln Gln
1 5 10 15
Gln Gln Gln Gln Pro Gln Gln Gln Gln Pro Gln Asn Leu Met Glu Met
20 25 30
Ser Thr Gln Arg Thr Ser Ser Glu Gly Arg Asn Arg Asp Asp Gln Glu
35 40 45
Pro Ala Ala Gly Asn Glu Val Thr Met Glu Ala Pro Pro Ser Gly Asp
50 55 60
Glu Asp Gln Asp Pro Asp Glu Gly Phe Lys Arg Arg Arg His Thr Arg
65 70 75 80
His Thr Leu His Gln Ile Ser Glu Met Glu Ala Phe Phe Lys Glu Cys
85 90 95
Pro His Pro Asp Glu Lys Gln Arg Lys Ala Leu Gly Arg Glu Leu Gly
100 105 110
Leu Val Pro Leu Gln Ile Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln
115 120 125
Val Lys Ser Gln Gln Glu Arg Tyr Glu Asn Asn Leu Leu Arg Val Glu
130 135 140
Asn Asp Lys Leu Arg Ala Glu Asn Ser Arg Tyr Arg Asn Ala Leu Ser
145 150 155 160
Asn Thr Ser Cys Pro Asn Cys Gly Ala Pro Thr Thr Leu Gly Glu Met
165 170 175
Ser Phe Asp Glu Gln Gln Leu Arg Met Glu Asn Ala Arg Gln Lys Glu
180 185 190
Glu Ile Asp Ser Met Ser Gly Leu Ala Ala Lys Tyr Ala Ala Gly Lys
195 200 205
Ser Ala Ser Asn Ser Tyr Tyr Asn Met Pro Ser Asn Gln Asn Gln Met
210 215 220
Pro Ser Arg Ser Leu Asp Leu Gly Val Gln His Gln Gln Gln Gln Gln
225 230 235 240
Gln Glu Gln Gln Gln Gln Gln Leu Tyr Cys Thr Ser Ala Thr Tyr Leu
245 250 255
Ile Ser Glu Ile Gly Leu Val Ala Val Glu Glu Ile Asn Gln Leu Thr
260 265 270
Leu Ser Ala Asp Pro Leu Trp Val Pro Gly Asn Tyr Gly Ser Glu Val
275 280 285
Ile Asn Glu Asp Glu Tyr Leu Arg His Phe Pro Arg Gly Ile Gly Pro
290 295 300
Thr Leu Leu Gly Ala Arg Thr Glu Ser Ser Arg Gln Thr Ala Ile Val
305 310 315 320
Met Met His His Met Lys Leu Val Glu Met Leu Met Asp Val Asn Gln
325 330 335
Trp Ser Asn Met Phe Cys Gly Ile Val Ser Arg Ala Val Thr His Glu
340 345 350
Val Leu Ser Ile Gly Asp His Ala Arg Tyr Asp Gly Ala Tyr Gln Val
355 360 365
Met Ser Ala Glu Phe Gln Val Pro Ser Pro Leu Val Pro Thr Arg Asp
370 375 380
Asn Tyr Phe Ile Arg Phe Ser Lys Lys His Ala Gly Gln Ser Trp Ala
385 390 395 400
Val Val Asp Ile Ser Met Asp His Leu Arg Pro Gly Ala Val Thr Arg
405 410 415
Thr Arg Arg Arg Pro Ser Gly Cys Ile Ile Gln Glu Leu Pro Asn Gly
420 425 430
Tyr Ser Lys Val Ile Trp Val Glu His Val Glu Val Asp Asp Ile Glu
435 440 445
Val His Asn Leu Tyr Lys Asn Leu Val Asn Ser Thr Leu Ala Phe Gly
450 455 460
Ala Lys Arg Trp Ile Ala Ala Ile Glu Arg Thr Cys Glu His Leu Ala
465 470 475 480
Arg Ala Met Ala Thr Asn Ile Pro Gln Gly Ala Leu Cys Val Ile Thr
485 490 495
Ser His Glu Gly Arg Lys Ser Met Met Lys Leu Ala Glu Arg Met Val
500 505 510
Leu Ser Phe Ser Thr Gly Val Gly Ala Ser Thr Ala Asn Ala Trp Thr
515 520 525
Pro Leu Pro Leu Asp Leu Glu Asn Val Arg Val Met Thr Arg Lys Ser
530 535 540
Val Asp Asp Pro Gly Arg Pro Ser Gly Ile Val Leu Ser Ala Ala Thr
545 550 555 560
Ser Leu Trp Leu Pro Val Pro Ala Arg Arg Val Phe Asp Phe Leu Arg
565 570 575
Ser Glu Asn Thr Arg Asn Gln Trp Asp Ile Leu Ser Ser Gly Ala Gln
580 585 590
Val Asn Glu Leu Ala His Ile Ala Lys Gly Arg Asp His Gly Asn Ser
595 600 605
Val Ser Leu Leu Arg Val Asn Thr Gln Asn Val Ala Gln Asn Asn Met
610 615 620
Leu Ile Leu Gln Glu Ser Cys Ile Asp Ala Thr Gly Ser Phe Val Val
625 630 635 640
Tyr Ala Pro Ile Asp Leu Ala Ser Met Asn Leu Val Leu Gly Gly Gly
645 650 655
Asn Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Val Leu Pro
660 665 670
Asp Gly Pro Ala Leu Asn Val Val Pro Gly Pro Val Cys Glu Val Val
675 680 685
Gly Ser Gly Arg Gly Cys Leu Leu Thr Val Ala Phe Gln Ile Leu Val
690 695 700
Asp Ser Thr Pro Thr Ala Lys Leu Ser Val Gly Ser Val Thr Thr Val
705 710 715 720
Asn Asn Leu Ile Lys Arg Thr Val Glu Arg Ile Lys Asp Ser Val Thr
725 730 735
Leu Asp Gly Ala
740
<210> 454
<211> 2289
<212> DNA
<213> Glycine max
<400> 454
atgggcgccg acatgtccaa caataataat cctcctccca cttctcacgc caaagacttg 60
tttgcttctc cagctctctc tctcagcctc gctggcattt ttcgccatgc tggggtggcc 120
gcggctgatg aggctgccac ttctgtggag gagggcgaag aagggagtgg aggagctgct 180
gagaggttag aggagattag cagcgagaac tccggcccca cgagatccag atcagaggat 240
gacttcgaag gaggagaagc tgaacctgaa gatgatgacg atgcccatgg agacaacaag 300
aacaagaaga cgaagaagaa gaggaagaaa tatcacaggc acactgctga ccagatcaga 360
gaaatggaag cgcttttcaa agagtcacca catcctgatg aaaagcagag gcaacaacta 420
agcaagcaat taggccttgc cccaaggcaa gtcaagtttt ggttccaaaa tcgtcgaacc 480
caaatcaagg caatacaaga gcgtcatgaa aattctttgt tgaagtcaga aatagagaaa 540
ctaaaggaga aaaataagag cttacgagag accataaaca aagcttgttg ccccaactgt 600
ggcgtgccca ccacaagcag agatggtgtc atgccaactg aagaacaaca actacgtatt 660
gaaaatgcca aactcaaagc tgaggtagag aaactccgag cagctttagg gaaatacgca 720
ccagggtcaa cgtccccttc atgttcttct ggccatgacc aagagaatag aagctctttg 780
gatttttaca ctggaatttt tggacttgat aagtcaagga taatggacat agtaaaccaa 840
gcaatggagg agctcattaa gatggctacc gtgggggaac cattatggct tcgtagcttc 900
gagactggtc gcgaaattct taactatgat gaatatgtta aggagtttgc agttgaaaat 960
tcaagcagta gtggaaagcc aaagagatcc attgaagcct caagagacac tgcagttgtt 1020
tttgtggatc tccctagtct tgtccaaagt tttctagacg tgaatcagtg gaaggaaatg 1080
tttccgtgtt tgatatctaa ggcggcaact gttgatgtta tatgcaatgg agagggtctt 1140
agcaggaatg gtgcagtgca actgatgttt gctgagcttc aaatgctgac tcctatggtt 1200
cccacaagag aagtctattt tgttcgtttc tgcaagcagt tgagtgctga acagtgggca 1260
atcgttgatg tatccataga caaagtagaa gacaacattg acgcgtccct cgtgaaatgc 1320
agaaaacgcc cttctggttg cattattgag gacaagtcca atggccattg caaagtaata 1380
tgggtggagc actcggaatg ccagaagagt gcagtccatt caatgtatcg caccattgtg 1440
aacagtggcc tagcttttgg ggccaggcat tggattgcga ctcttcaact tcaatgtgaa 1500
cgtctagttt tcttcatggc aacaaatgtt cccatgaagg attcaaccgg tgttgccacc 1560
ttggccggga gaaaaagcat tctgaagttg gcacaaagaa tgacatggag tttctgccat 1620
gcaattggcg cgtcaagcat ccacgcatgg actaaggtta caagtaaaac tggagaagac 1680
ataaggataa gttctagaaa gaacttgaac gatcctggtg aacctcttgg gttgatattg 1740
tgcgctgttt gttctgtatg gttgcctgtc tcacctaatg ttctgtttga tttcttgagg 1800
gatgaaaatc gccgaactga atgggacatc atgtcaagtg gtgggacagt gcagtctatt 1860
gcaaatttag ccaaaggaca agaccgaggc aatgccgtag ccattcaaac aattaaattg 1920
aaagaaaaca gtgtgtggat actgcaagat agctgcacaa acctttatga gtcaatggtg 1980
gcatatgctt gtgtggacat tactggcatt cagtctgtga tgacaggatg tgattctagc 2040
aatcttgcca tactgccctc aggattctcc attattcctg atggtcttga gtcaaggcca 2100
ttggtgatta gttcaaggca ggaagaaaaa aatactgagg gaggatcttt gtttacaatg 2160
gcattccaga ttcttaccaa tgcttctccc acagccaagt taacattgga atctgtggac 2220
tcggtcaaca ctcttgtatc ttgtacattg agaaatatca gaacaagttt acaatgtgaa 2280
gatggttag 2289
<210> 455
<211> 762
<212> PRT
<213> Glycine max
<400> 455
Met Gly Ala Asp Met Ser Asn Asn Asn Asn Pro Pro Pro Thr Ser His
1 5 10 15
Ala Lys Asp Leu Phe Ala Ser Pro Ala Leu Ser Leu Ser Leu Ala Gly
20 25 30
Ile Phe Arg His Ala Gly Val Ala Ala Ala Asp Glu Ala Ala Thr Ser
35 40 45
Val Glu Glu Gly Glu Glu Gly Ser Gly Gly Ala Ala Glu Arg Leu Glu
50 55 60
Glu Ile Ser Ser Glu Asn Ser Gly Pro Thr Arg Ser Arg Ser Glu Asp
65 70 75 80
Asp Phe Glu Gly Gly Glu Ala Glu Pro Glu Asp Asp Asp Asp Ala His
85 90 95
Gly Asp Asn Lys Asn Lys Lys Thr Lys Lys Lys Arg Lys Lys Tyr His
100 105 110
Arg His Thr Ala Asp Gln Ile Arg Glu Met Glu Ala Leu Phe Lys Glu
115 120 125
Ser Pro His Pro Asp Glu Lys Gln Arg Gln Gln Leu Ser Lys Gln Leu
130 135 140
Gly Leu Ala Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr
145 150 155 160
Gln Ile Lys Ala Ile Gln Glu Arg His Glu Asn Ser Leu Leu Lys Ser
165 170 175
Glu Ile Glu Lys Leu Lys Glu Lys Asn Lys Ser Leu Arg Glu Thr Ile
180 185 190
Asn Lys Ala Cys Cys Pro Asn Cys Gly Val Pro Thr Thr Ser Arg Asp
195 200 205
Gly Val Met Pro Thr Glu Glu Gln Gln Leu Arg Ile Glu Asn Ala Lys
210 215 220
Leu Lys Ala Glu Val Glu Lys Leu Arg Ala Ala Leu Gly Lys Tyr Ala
225 230 235 240
Pro Gly Ser Thr Ser Pro Ser Cys Ser Ser Gly His Asp Gln Glu Asn
245 250 255
Arg Ser Ser Leu Asp Phe Tyr Thr Gly Ile Phe Gly Leu Asp Lys Ser
260 265 270
Arg Ile Met Asp Ile Val Asn Gln Ala Met Glu Glu Leu Ile Lys Met
275 280 285
Ala Thr Val Gly Glu Pro Leu Trp Leu Arg Ser Phe Glu Thr Gly Arg
290 295 300
Glu Ile Leu Asn Tyr Asp Glu Tyr Val Lys Glu Phe Ala Val Glu Asn
305 310 315 320
Ser Ser Ser Ser Gly Lys Pro Lys Arg Ser Ile Glu Ala Ser Arg Asp
325 330 335
Thr Ala Val Val Phe Val Asp Leu Pro Ser Leu Val Gln Ser Phe Leu
340 345 350
Asp Val Asn Gln Trp Lys Glu Met Phe Pro Cys Leu Ile Ser Lys Ala
355 360 365
Ala Thr Val Asp Val Ile Cys Asn Gly Glu Gly Leu Ser Arg Asn Gly
370 375 380
Ala Val Gln Leu Met Phe Ala Glu Leu Gln Met Leu Thr Pro Met Val
385 390 395 400
Pro Thr Arg Glu Val Tyr Phe Val Arg Phe Cys Lys Gln Leu Ser Ala
405 410 415
Glu Gln Trp Ala Ile Val Asp Val Ser Ile Asp Lys Val Glu Asp Asn
420 425 430
Ile Asp Ala Ser Leu Val Lys Cys Arg Lys Arg Pro Ser Gly Cys Ile
435 440 445
Ile Glu Asp Lys Ser Asn Gly His Cys Lys Val Ile Trp Val Glu His
450 455 460
Ser Glu Cys Gln Lys Ser Ala Val His Ser Met Tyr Arg Thr Ile Val
465 470 475 480
Asn Ser Gly Leu Ala Phe Gly Ala Arg His Trp Ile Ala Thr Leu Gln
485 490 495
Leu Gln Cys Glu Arg Leu Val Phe Phe Met Ala Thr Asn Val Pro Met
500 505 510
Lys Asp Ser Thr Gly Val Ala Thr Leu Ala Gly Arg Lys Ser Ile Leu
515 520 525
Lys Leu Ala Gln Arg Met Thr Trp Ser Phe Cys His Ala Ile Gly Ala
530 535 540
Ser Ser Ile His Ala Trp Thr Lys Val Thr Ser Lys Thr Gly Glu Asp
545 550 555 560
Ile Arg Ile Ser Ser Arg Lys Asn Leu Asn Asp Pro Gly Glu Pro Leu
565 570 575
Gly Leu Ile Leu Cys Ala Val Cys Ser Val Trp Leu Pro Val Ser Pro
580 585 590
Asn Val Leu Phe Asp Phe Leu Arg Asp Glu Asn Arg Arg Thr Glu Trp
595 600 605
Asp Ile Met Ser Ser Gly Gly Thr Val Gln Ser Ile Ala Asn Leu Ala
610 615 620
Lys Gly Gln Asp Arg Gly Asn Ala Val Ala Ile Gln Thr Ile Lys Leu
625 630 635 640
Lys Glu Asn Ser Val Trp Ile Leu Gln Asp Ser Cys Thr Asn Leu Tyr
645 650 655
Glu Ser Met Val Ala Tyr Ala Cys Val Asp Ile Thr Gly Ile Gln Ser
660 665 670
Val Met Thr Gly Cys Asp Ser Ser Asn Leu Ala Ile Leu Pro Ser Gly
675 680 685
Phe Ser Ile Ile Pro Asp Gly Leu Glu Ser Arg Pro Leu Val Ile Ser
690 695 700
Ser Arg Gln Glu Glu Lys Asn Thr Glu Gly Gly Ser Leu Phe Thr Met
705 710 715 720
Ala Phe Gln Ile Leu Thr Asn Ala Ser Pro Thr Ala Lys Leu Thr Leu
725 730 735
Glu Ser Val Asp Ser Val Asn Thr Leu Val Ser Cys Thr Leu Arg Asn
740 745 750
Ile Arg Thr Ser Leu Gln Cys Glu Asp Gly
755 760
<210> 456
<211> 2322
<212> DNA
<213> Glycine max
<400> 456
atgagttttg gggggtttct tgagaccaaa caaagtgatg gaggtggtgg taggattgta 60
gtttcagata ttccttacaa cagcaacaac ggttcaaacc acagcaacga tataatgccc 120
tctggtgcaa tctcgctgcc tcgtttagcc actcctactt tggccaaatc catgcttttt 180
gttttggttg gttctatttg cttacttttt tttttgaatg gtttgagaag gagccgggaa 240
gaggagcatg aaagcagatc tggcagtgac aacatggatg gtggttctgg tgatgatttt 300
gatgctgccg acaacccacc gaggaaaaaa cgctatcacc gacacactcc tcagcaaatt 360
caagagcttg aatcgctctt caaggagtgt cctcacccgg atgagaagca aaggcttgaa 420
ctcagcagaa ggcttaattt ggaaacgagg caagtaaagt tttggttcca aaatcgaaga 480
acacaaatga agacacaatt ggaacggcac gagaactcgc tgctaaggca agagaatgac 540
aagcttagag ctgaaaacat gtctatgagg gaagccatga gaaatcccat atgctcaaac 600
tgtggaggtc ctgctatgat cggtgaaatt tcactcgaag aacagcacct cagaattgag 660
aatgctagat tgaaagatga actagaccgt gtttgtgcac tcgctggcaa gtttctgggt 720
cgacccgttt cttctctaac aagctcaatt gggcctccaa tgccaaactc aagtttggag 780
cttggtgttg ggagcaatgg ttttggacaa gcattggtga ctccttctgg ctttgacaac 840
agatcaattg agaggtctat tgttcttgaa cttgctttgg ctgcaatgga tgagttggtg 900
aagatggcac aaactggtga gcctctttgg atcagaagct tggaaggggg aagagaaatt 960
ctcaaccatg aggagtacac aaggactatc actccttgca ttggcttgag acccaatggc 1020
tttgtcactg aggcttctag acaaactgga atggtcatca taaacagctt ggcccttgtt 1080
gaaacattaa tggactcaaa tcgttggtca gagatgttcc cttgtatgat tgctagaacc 1140
tcaaccgctg aagttatatc taatggaata aatggaacta gaaatggtgc ccttcagcta 1200
atgcatgctg agcttcaagt tctttctccc ttggttcctg ttcgtgaggt caattttcta 1260
cgcttttgca agcagcacgc agaggggtta tgggcagtgg tagatgtgtc catagatacc 1320
atccgagaaa cttctggagc acccactttt gtgaactgta ggaggcttcc ttctggttgc 1380
gtggtgcaag atatgccaaa tggttactct aaggtgacat gggtggaaca tgcagaatac 1440
gacgaaagcc aaattcacca gctctttaga cccttgttga gctcaggcat ggggtttggt 1500
gcacaacgtt gggttaccac tcttcaacgc caatgcgagt gcctagccat tctaatgtcc 1560
tcagcagctc cctctagaga acattcagca ataagctcag gtggaaggag aagcatgttg 1620
aagctggcac atcgcatgac gaacaatttc tgttcgggtg tgtgtgcctc cacagtgcac 1680
aagtggaaca agctgaacgc aggaaacgtg ggggaggacg tgagggtgat gaccaggaag 1740
agtgtggacg acccgggcga gccgcccggg atcgtcctaa gcgctgccac ctcagtgtgg 1800
cttcccgtct cgtcgcagag gctctttgac ttcctccgcg acgagcggct ccgaagcgag 1860
tgggatatcc tctccaacgg tggacccatg caagagatgg ctcacattgc aaagggacaa 1920
gaccatgcta actgtgtctc cctccttaga gccagtgcta taaatgcgaa ccagagcagc 1980
atgttgattt tgcaggagac gtgcaccgac gcgtcgggct cgcttgtggt gtacgcgccg 2040
gtggacattc cggcgatgca cgtcgtgatg aacggcggcg actctgctta cgtggcgctt 2100
ctcccgtcag ggttcgccat cgtgcccgac gggtccggcg aggagcaagg tggcgcgtcg 2160
cagcagaggg cggcgagtgg gtgtcttctc acggtggcgt ttcagatcct tgtgaacagc 2220
cttccgacgg cgaagctcac ggtggagtcg gtggagacgg tgaacaacct catctcctgc 2280
accgtgcaga agataaaatc agctcttcat tgcgagagct ga 2322
<210> 457
<211> 773
<212> PRT
<213> Glycine max
<400> 457
Met Ser Phe Gly Gly Phe Leu Glu Thr Lys Gln Ser Asp Gly Gly Gly
1 5 10 15
Gly Arg Ile Val Val Ser Asp Ile Pro Tyr Asn Ser Asn Asn Gly Ser
20 25 30
Asn His Ser Asn Asp Ile Met Pro Ser Gly Ala Ile Ser Leu Pro Arg
35 40 45
Leu Ala Thr Pro Thr Leu Ala Lys Ser Met Leu Phe Val Leu Val Gly
50 55 60
Ser Ile Cys Leu Leu Phe Phe Leu Asn Gly Leu Arg Arg Ser Arg Glu
65 70 75 80
Glu Glu His Glu Ser Arg Ser Gly Ser Asp Asn Met Asp Gly Gly Ser
85 90 95
Gly Asp Asp Phe Asp Ala Ala Asp Asn Pro Pro Arg Lys Lys Arg Tyr
100 105 110
His Arg His Thr Pro Gln Gln Ile Gln Glu Leu Glu Ser Leu Phe Lys
115 120 125
Glu Cys Pro His Pro Asp Glu Lys Gln Arg Leu Glu Leu Ser Arg Arg
130 135 140
Leu Asn Leu Glu Thr Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg
145 150 155 160
Thr Gln Met Lys Thr Gln Leu Glu Arg His Glu Asn Ser Leu Leu Arg
165 170 175
Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Ser Met Arg Glu Ala
180 185 190
Met Arg Asn Pro Ile Cys Ser Asn Cys Gly Gly Pro Ala Met Ile Gly
195 200 205
Glu Ile Ser Leu Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu
210 215 220
Lys Asp Glu Leu Asp Arg Val Cys Ala Leu Ala Gly Lys Phe Leu Gly
225 230 235 240
Arg Pro Val Ser Ser Leu Thr Ser Ser Ile Gly Pro Pro Met Pro Asn
245 250 255
Ser Ser Leu Glu Leu Gly Val Gly Ser Asn Gly Phe Gly Gln Ala Leu
260 265 270
Val Thr Pro Ser Gly Phe Asp Asn Arg Ser Ile Glu Arg Ser Ile Val
275 280 285
Leu Glu Leu Ala Leu Ala Ala Met Asp Glu Leu Val Lys Met Ala Gln
290 295 300
Thr Gly Glu Pro Leu Trp Ile Arg Ser Leu Glu Gly Gly Arg Glu Ile
305 310 315 320
Leu Asn His Glu Glu Tyr Thr Arg Thr Ile Thr Pro Cys Ile Gly Leu
325 330 335
Arg Pro Asn Gly Phe Val Thr Glu Ala Ser Arg Gln Thr Gly Met Val
340 345 350
Ile Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg
355 360 365
Trp Ser Glu Met Phe Pro Cys Met Ile Ala Arg Thr Ser Thr Ala Glu
370 375 380
Val Ile Ser Asn Gly Ile Asn Gly Thr Arg Asn Gly Ala Leu Gln Leu
385 390 395 400
Met His Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Glu
405 410 415
Val Asn Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Leu Trp Ala
420 425 430
Val Val Asp Val Ser Ile Asp Thr Ile Arg Glu Thr Ser Gly Ala Pro
435 440 445
Thr Phe Val Asn Cys Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp
450 455 460
Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr
465 470 475 480
Asp Glu Ser Gln Ile His Gln Leu Phe Arg Pro Leu Leu Ser Ser Gly
485 490 495
Met Gly Phe Gly Ala Gln Arg Trp Val Thr Thr Leu Gln Arg Gln Cys
500 505 510
Glu Cys Leu Ala Ile Leu Met Ser Ser Ala Ala Pro Ser Arg Glu His
515 520 525
Ser Ala Ile Ser Ser Gly Gly Arg Arg Ser Met Leu Lys Leu Ala His
530 535 540
Arg Met Thr Asn Asn Phe Cys Ser Gly Val Cys Ala Ser Thr Val His
545 550 555 560
Lys Trp Asn Lys Leu Asn Ala Gly Asn Val Gly Glu Asp Val Arg Val
565 570 575
Met Thr Arg Lys Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val
580 585 590
Leu Ser Ala Ala Thr Ser Val Trp Leu Pro Val Ser Ser Gln Arg Leu
595 600 605
Phe Asp Phe Leu Arg Asp Glu Arg Leu Arg Ser Glu Trp Asp Ile Leu
610 615 620
Ser Asn Gly Gly Pro Met Gln Glu Met Ala His Ile Ala Lys Gly Gln
625 630 635 640
Asp His Ala Asn Cys Val Ser Leu Leu Arg Ala Ser Ala Ile Asn Ala
645 650 655
Asn Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Cys Thr Asp Ala Ser
660 665 670
Gly Ser Leu Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Val
675 680 685
Val Met Asn Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly
690 695 700
Phe Ala Ile Val Pro Asp Gly Ser Gly Glu Glu Gln Gly Gly Ala Ser
705 710 715 720
Gln Gln Arg Ala Ala Ser Gly Cys Leu Leu Thr Val Ala Phe Gln Ile
725 730 735
Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu
740 745 750
Thr Val Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ser Ala
755 760 765
Leu His Cys Glu Ser
770
<210> 458
<211> 2412
<212> DNA
<213> Glycine max
<400> 458
atgagttttg ggggtctttt agacaacaaa tcaggtagtg gcggtgccag aaacaacgtt 60
tcagatattc cttacaacaa caacaacgtt accaatacca ccaccaccaa caacgataga 120
atgccctttg gtgcaatctc tcagccacgc ctcgtgacca ccactcccac tttggccaaa 180
tccataattg atgatggaca agaagatgtg aatagaatgg ccgagaatac ctccgaaccg 240
aacggtttga gaagaagccg agaagatgaa catgaaagca gatctggcag tgacaacatg 300
gacggcgctt ccggcgacga acacgacgcc gccgacaacc ctccgaggaa aaaacgctat 360
caccgacaca cccctcagca gatacaagaa cttgaagcgt tgttcaagga gtgtcctcat 420
ccagatgaaa agcaaaggct tgaactgagt agaaggctgt gtttggaaac tcgtcaaacc 480
cagttggagc gacacgagaa tacgttgctg aggcaagaga acgacaagct tcgagcggag 540
aacatgtcca taagggacgc aatgaggaac cccatgtgct ccaattgcgg tggcccagcc 600
atcatcggcg agatttctct ggaagagcag cacctccgca tcgagaacgc gcgcctcaag 660
gatgaactcg accgcgtgtg tgtactcgcg ggcaagttct tggggcgccc cgtttcctca 720
ttaccgagtt ccagtttgga gctcggcatg agaggaaacg ggttcgcagg aatacctgcg 780
gcaacaacgt tgccgctggg acaggatttt gacatgggta tgtctgtgtc aatgaataat 840
aatgcgttgg ctatggtgtc tccaccgacg agtgctaggg cggccgcggc cggattcgat 900
aggtcggtgg agaggtcgat gtttcttgag cttgccttgg ctgctatgga tgagttggtg 960
aagatagcgc agactgggga gcctctttgg atgaggaatg ttgaaggagg gagggaaatt 1020
ttgaacaatg aggagtacgt gaggaccttc actccttgca ttggtttaag acccaatggg 1080
tttgtgtctg aggcctctag ggaaaatgga atggtcatca ttaacagctt ggcacttgtt 1140
gagactctta tggactcgaa tcgatgggca gagatgtttc cttgtatcat tgcaagaacc 1200
tccaccacgg aagtgatatc tagtggaata aacggaacaa gaaatggggc acttcaatta 1260
atgcatgctg aacttcaagt tctttcccct ttggtgccgg ttcgtgaggt gaatttcctg 1320
cggttttgca agcaacacgc agaaggggtg tgggctgtgg tggatgtgtc catagatagc 1380
atccgagaaa gttcgggagc acccactttt gtgaactgta ggaggcttcc ttctggttgc 1440
gtggtgcaag atatgcccaa tggttactcc aaggtgacat gggtggagca tgcagaatac 1500
gatgaaagtc aagttcacca gctctataga cctttgttga gctcaggcat ggggtttggt 1560
gcccaacgtt gggtcgctac ccttcaacgc caatgcgagt gccttgccat tctaatgtcc 1620
tcagcagcac cctctcgaga tcattccgca ataacagcag ggggaaggcg gagcatgatg 1680
aagctggcgc agcggatgac gaacaacttc tgcgcggggg tgtgcgcgtc aacggtgcac 1740
aagtggaaca agctcaacgc cggcaacgtc gacgaggacg tcagggtcat gactcgcaag 1800
agcgtcgacg atcccgggga gccaccgggg atcgtcctca gcgccgccac ctccgtctgg 1860
ctacccgtct ccccccaccg cctcttcgat ttcctccgcg acgagcgcct ccgcagcgag 1920
tgggacatcc tctccaacgg tggccccatg caggagatgg cccacatcgc caagggccaa 1980
gaccacggca acgcagtctc tctccttaga gccagtgcga taaattccaa ccagagtagc 2040
atgctgatac tgcaggagac atgcatagac gcggcggggt cgcttgtggt gtacgcgccg 2100
gtggatatcc cagcaatgca cgttgtaatg aacggtggcg attctgctta cgtggcgttg 2160
ttaccttcag ggttcgctat cgtccccgat gggcccgggt ctcgtgggcc accgaacggg 2220
cccacttcca caacaaacgg cggcgataac ggcgtgacgc gcgtgagtgg gtcccttctg 2280
acggtggcgt ttcagatcct tgtgaatagt ctccctacgg cgaagctcac ggtagagtcg 2340
gtggaaaccg tgaacaacct catctcgtgc acggttcaga agatcaaagc cgcgctccac 2400
tgcgaaagtt aa 2412
<210> 459
<211> 803
<212> PRT
<213> Glycine max
<400> 459
Met Ser Phe Gly Gly Leu Leu Asp Asn Lys Ser Gly Ser Gly Gly Ala
1 5 10 15
Arg Asn Asn Val Ser Asp Ile Pro Tyr Asn Asn Asn Asn Val Thr Asn
20 25 30
Thr Thr Thr Thr Asn Asn Asp Arg Met Pro Phe Gly Ala Ile Ser Gln
35 40 45
Pro Arg Leu Val Thr Thr Thr Pro Thr Leu Ala Lys Ser Ile Ile Asp
50 55 60
Asp Gly Gln Glu Asp Val Asn Arg Met Ala Glu Asn Thr Ser Glu Pro
65 70 75 80
Asn Gly Leu Arg Arg Ser Arg Glu Asp Glu His Glu Ser Arg Ser Gly
85 90 95
Ser Asp Asn Met Asp Gly Ala Ser Gly Asp Glu His Asp Ala Ala Asp
100 105 110
Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln Gln Ile
115 120 125
Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp Glu Lys
130 135 140
Gln Arg Leu Glu Leu Ser Arg Arg Leu Cys Leu Glu Thr Arg Gln Thr
145 150 155 160
Gln Leu Glu Arg His Glu Asn Thr Leu Leu Arg Gln Glu Asn Asp Lys
165 170 175
Leu Arg Ala Glu Asn Met Ser Ile Arg Asp Ala Met Arg Asn Pro Met
180 185 190
Cys Ser Asn Cys Gly Gly Pro Ala Ile Ile Gly Glu Ile Ser Leu Glu
195 200 205
Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp
210 215 220
Arg Val Cys Val Leu Ala Gly Lys Phe Leu Gly Arg Pro Val Ser Ser
225 230 235 240
Leu Pro Ser Ser Ser Leu Glu Leu Gly Met Arg Gly Asn Gly Phe Ala
245 250 255
Gly Ile Pro Ala Ala Thr Thr Leu Pro Leu Gly Gln Asp Phe Asp Met
260 265 270
Gly Met Ser Val Ser Met Asn Asn Asn Ala Leu Ala Met Val Ser Pro
275 280 285
Pro Thr Ser Ala Arg Ala Ala Ala Ala Gly Phe Asp Arg Ser Val Glu
290 295 300
Arg Ser Met Phe Leu Glu Leu Ala Leu Ala Ala Met Asp Glu Leu Val
305 310 315 320
Lys Ile Ala Gln Thr Gly Glu Pro Leu Trp Met Arg Asn Val Glu Gly
325 330 335
Gly Arg Glu Ile Leu Asn Asn Glu Glu Tyr Val Arg Thr Phe Thr Pro
340 345 350
Cys Ile Gly Leu Arg Pro Asn Gly Phe Val Ser Glu Ala Ser Arg Glu
355 360 365
Asn Gly Met Val Ile Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met
370 375 380
Asp Ser Asn Arg Trp Ala Glu Met Phe Pro Cys Ile Ile Ala Arg Thr
385 390 395 400
Ser Thr Thr Glu Val Ile Ser Ser Gly Ile Asn Gly Thr Arg Asn Gly
405 410 415
Ala Leu Gln Leu Met His Ala Glu Leu Gln Val Leu Ser Pro Leu Val
420 425 430
Pro Val Arg Glu Val Asn Phe Leu Arg Phe Cys Lys Gln His Ala Glu
435 440 445
Gly Val Trp Ala Val Val Asp Val Ser Ile Asp Ser Ile Arg Glu Ser
450 455 460
Ser Gly Ala Pro Thr Phe Val Asn Cys Arg Arg Leu Pro Ser Gly Cys
465 470 475 480
Val Val Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu
485 490 495
His Ala Glu Tyr Asp Glu Ser Gln Val His Gln Leu Tyr Arg Pro Leu
500 505 510
Leu Ser Ser Gly Met Gly Phe Gly Ala Gln Arg Trp Val Ala Thr Leu
515 520 525
Gln Arg Gln Cys Glu Cys Leu Ala Ile Leu Met Ser Ser Ala Ala Pro
530 535 540
Ser Arg Asp His Ser Ala Ile Thr Ala Gly Gly Arg Arg Ser Met Met
545 550 555 560
Lys Leu Ala Gln Arg Met Thr Asn Asn Phe Cys Ala Gly Val Cys Ala
565 570 575
Ser Thr Val His Lys Trp Asn Lys Leu Asn Ala Gly Asn Val Asp Glu
580 585 590
Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Glu Pro
595 600 605
Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Val Trp Leu Pro Val Ser
610 615 620
Pro His Arg Leu Phe Asp Phe Leu Arg Asp Glu Arg Leu Arg Ser Glu
625 630 635 640
Trp Asp Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Ala His Ile
645 650 655
Ala Lys Gly Gln Asp His Gly Asn Ala Val Ser Leu Leu Arg Ala Ser
660 665 670
Ala Ile Asn Ser Asn Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Cys
675 680 685
Ile Asp Ala Ala Gly Ser Leu Val Val Tyr Ala Pro Val Asp Ile Pro
690 695 700
Ala Met His Val Val Met Asn Gly Gly Asp Ser Ala Tyr Val Ala Leu
705 710 715 720
Leu Pro Ser Gly Phe Ala Ile Val Pro Asp Gly Pro Gly Ser Arg Gly
725 730 735
Pro Pro Asn Gly Pro Thr Ser Thr Thr Asn Gly Gly Asp Asn Gly Val
740 745 750
Thr Arg Val Ser Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val
755 760 765
Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr Val
770 775 780
Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ala Ala Leu His
785 790 795 800
Cys Glu Ser
<210> 460
<211> 2244
<212> DNA
<213> Glycine max
<400> 460
atgtcaagta tgggagggaa cgtagtagta aacccagaca ccctcttctc ttcctcgatc 60
cagaactcta gcttcaactt catccccacc atgccctttc aaccttttcc ttccatgaaa 120
gaagaagatg ggatcttgcg agggaaggaa gaggttgaga gtggatcagg gagtgaacaa 180
ttagttgaag acaagtcagg gaatgaacaa gagagtcatg aacaacccac aaagaagaaa 240
cgttatcaca ggcacactgc tcgccagatc caagaaatgg aagctttgtt caaggaatgt 300
ccacacccgg atgataagca gagactgaaa ctgagccatg aattgggtct taaaccgcgc 360
caggtcaagt tctggttcca gaaccgtcga acccagatga aggcacaaca agaccgtgca 420
gataatgtga tacttagagc tgagaatgag tctcttaaga gtgagaatta tcggttacaa 480
gctgcactgc gtaacgtaat ttgtcccaac tgtggtggcc catgcataat gggtgctgat 540
atgggcttgg atgaacacca agttcgcatt gaaaatgccc gtttaagaga agagttagaa 600
cgcgtgtgtt gtctcacaac aagatacact gggcgtccaa tacaaacaat ggcaacaggt 660
cctactctaa tggccccttc attggatttg gacatgagca tatacccaag gcactttgcg 720
gataccattg ctccttgcac tgaaatgatt cctgtgccaa tgttgcctcc cgaagcttca 780
cctttttctg agggtggtat cctaatggaa gaagagaagt ctctgacctt ggagcttgcc 840
gcttcctcca tggctgaact tgtgaagatg tgtcagacaa acgagccact ttggattcga 900
agcactgaga gtgaaaggga agtgctcaat tttgaagagc atgcaaggat gtttgcttgg 960
cctcagaatc tcaagcatcg aagtgagcta aggactgaag ctagccgtga cacttctgtg 1020
gttataatga atagtgtaac tcttgttgat gctttccttg atgctcaaaa atggatggaa 1080
ttgtttccta caatcgtttc aagagcaaaa actgtccaaa tcatatcttc tggtgcttcc 1140
ggtcttgcaa gcgggactct tcagctgatg tacgcagaat tccaagttct ttctcctttg 1200
gtgtccactc gtgagactca ttttcttcgg tattgtcaac aaaatgctga ggagggaacc 1260
tgggccattg ttgattttcc tgttgatagc tttcaccaaa attttcaccc ttcttatcct 1320
agatactgca ggaggtcctc tggctgcgtg attcaagata tgccaaatgg gtattcaagg 1380
gtaacatggg ttgagcatgc aaaagtagaa gagaagcctg tgcatcagat attctgcaac 1440
tatgtgtaca gtggaatggc atttggagca cagcgttggt taggagtttt gcagagacaa 1500
tgtgagaggg tcgcaagcct catggccaga aacatatcag atcttggagc gataccttcg 1560
ccagaagcgc gaaagaactt gatgaagcta gctcaaagaa tgataaaaac gtttagcctt 1620
aacatgagta cctctggtgg tcaatcatgg acagccatat cagattcccc tgaagacact 1680
gttagaatca caactaggaa aatcacagag cctggacaac ctaatggcgt gattctaagt 1740
gcagtttcaa ctacttggtt gccctattct cacaccaagg tctttgatct cctcagggat 1800
gaacgccgca gatctcagat ggatgctctt tccaatggga actcattgaa tgaagtggct 1860
catattgcaa atggctcaca tccaggaaac tgcatttctc ttcttcgcat aaatgtagcg 1920
agcaactcat cccagaacgt agagctaatg ctgcaagaga attgcaccga ccaatctgga 1980
agcatagtag tgtacacaac catcgacgtg gattcgatcc agctagccat gagtggtgag 2040
gacccttctt gcattgcact tcttccccaa ggcttcaaga tagtgccaat agcctcctcc 2100
atctctcaac aacaacaact caggtggttg cctcctgaca atggggctgc aggttctcgc 2160
gagcacgatc ccttctgcaa agctcaacct ctcgagcgtc accgctatca acaatcacct 2220
ttgcaacacc ttgcaccaga ttga 2244
<210> 461
<211> 747
<212> PRT
<213> Glycine max
<400> 461
Met Ser Ser Met Gly Gly Asn Val Val Val Asn Pro Asp Thr Leu Phe
1 5 10 15
Ser Ser Ser Ile Gln Asn Ser Ser Phe Asn Phe Ile Pro Thr Met Pro
20 25 30
Phe Gln Pro Phe Pro Ser Met Lys Glu Glu Asp Gly Ile Leu Arg Gly
35 40 45
Lys Glu Glu Val Glu Ser Gly Ser Gly Ser Glu Gln Leu Val Glu Asp
50 55 60
Lys Ser Gly Asn Glu Gln Glu Ser His Glu Gln Pro Thr Lys Lys Lys
65 70 75 80
Arg Tyr His Arg His Thr Ala Arg Gln Ile Gln Glu Met Glu Ala Leu
85 90 95
Phe Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Leu Lys Leu Ser
100 105 110
His Glu Leu Gly Leu Lys Pro Arg Gln Val Lys Phe Trp Phe Gln Asn
115 120 125
Arg Arg Thr Gln Met Lys Ala Gln Gln Asp Arg Ala Asp Asn Val Ile
130 135 140
Leu Arg Ala Glu Asn Glu Ser Leu Lys Ser Glu Asn Tyr Arg Leu Gln
145 150 155 160
Ala Ala Leu Arg Asn Val Ile Cys Pro Asn Cys Gly Gly Pro Cys Ile
165 170 175
Met Gly Ala Asp Met Gly Leu Asp Glu His Gln Val Arg Ile Glu Asn
180 185 190
Ala Arg Leu Arg Glu Glu Leu Glu Arg Val Cys Cys Leu Thr Thr Arg
195 200 205
Tyr Thr Gly Arg Pro Ile Gln Thr Met Ala Thr Gly Pro Thr Leu Met
210 215 220
Ala Pro Ser Leu Asp Leu Asp Met Ser Ile Tyr Pro Arg His Phe Ala
225 230 235 240
Asp Thr Ile Ala Pro Cys Thr Glu Met Ile Pro Val Pro Met Leu Pro
245 250 255
Pro Glu Ala Ser Pro Phe Ser Glu Gly Gly Ile Leu Met Glu Glu Glu
260 265 270
Lys Ser Leu Thr Leu Glu Leu Ala Ala Ser Ser Met Ala Glu Leu Val
275 280 285
Lys Met Cys Gln Thr Asn Glu Pro Leu Trp Ile Arg Ser Thr Glu Ser
290 295 300
Glu Arg Glu Val Leu Asn Phe Glu Glu His Ala Arg Met Phe Ala Trp
305 310 315 320
Pro Gln Asn Leu Lys His Arg Ser Glu Leu Arg Thr Glu Ala Ser Arg
325 330 335
Asp Thr Ser Val Val Ile Met Asn Ser Val Thr Leu Val Asp Ala Phe
340 345 350
Leu Asp Ala Gln Lys Trp Met Glu Leu Phe Pro Thr Ile Val Ser Arg
355 360 365
Ala Lys Thr Val Gln Ile Ile Ser Ser Gly Ala Ser Gly Leu Ala Ser
370 375 380
Gly Thr Leu Gln Leu Met Tyr Ala Glu Phe Gln Val Leu Ser Pro Leu
385 390 395 400
Val Ser Thr Arg Glu Thr His Phe Leu Arg Tyr Cys Gln Gln Asn Ala
405 410 415
Glu Glu Gly Thr Trp Ala Ile Val Asp Phe Pro Val Asp Ser Phe His
420 425 430
Gln Asn Phe His Pro Ser Tyr Pro Arg Tyr Cys Arg Arg Ser Ser Gly
435 440 445
Cys Val Ile Gln Asp Met Pro Asn Gly Tyr Ser Arg Val Thr Trp Val
450 455 460
Glu His Ala Lys Val Glu Glu Lys Pro Val His Gln Ile Phe Cys Asn
465 470 475 480
Tyr Val Tyr Ser Gly Met Ala Phe Gly Ala Gln Arg Trp Leu Gly Val
485 490 495
Leu Gln Arg Gln Cys Glu Arg Val Ala Ser Leu Met Ala Arg Asn Ile
500 505 510
Ser Asp Leu Gly Ala Ile Pro Ser Pro Glu Ala Arg Lys Asn Leu Met
515 520 525
Lys Leu Ala Gln Arg Met Ile Lys Thr Phe Ser Leu Asn Met Ser Thr
530 535 540
Ser Gly Gly Gln Ser Trp Thr Ala Ile Ser Asp Ser Pro Glu Asp Thr
545 550 555 560
Val Arg Ile Thr Thr Arg Lys Ile Thr Glu Pro Gly Gln Pro Asn Gly
565 570 575
Val Ile Leu Ser Ala Val Ser Thr Thr Trp Leu Pro Tyr Ser His Thr
580 585 590
Lys Val Phe Asp Leu Leu Arg Asp Glu Arg Arg Arg Ser Gln Met Asp
595 600 605
Ala Leu Ser Asn Gly Asn Ser Leu Asn Glu Val Ala His Ile Ala Asn
610 615 620
Gly Ser His Pro Gly Asn Cys Ile Ser Leu Leu Arg Ile Asn Val Ala
625 630 635 640
Ser Asn Ser Ser Gln Asn Val Glu Leu Met Leu Gln Glu Asn Cys Thr
645 650 655
Asp Gln Ser Gly Ser Ile Val Val Tyr Thr Thr Ile Asp Val Asp Ser
660 665 670
Ile Gln Leu Ala Met Ser Gly Glu Asp Pro Ser Cys Ile Ala Leu Leu
675 680 685
Pro Gln Gly Phe Lys Ile Val Pro Ile Ala Ser Ser Ile Ser Gln Gln
690 695 700
Gln Gln Leu Arg Trp Leu Pro Pro Asp Asn Gly Ala Ala Gly Ser Arg
705 710 715 720
Glu His Asp Pro Phe Cys Lys Ala Gln Pro Leu Glu Arg His Arg Tyr
725 730 735
Gln Gln Ser Pro Leu Gln His Leu Ala Pro Asp
740 745
<210> 462
<211> 2391
<212> DNA
<213> Hordeum vulgare
<400> 462
atgcccggtg ggatgatgat cccaggacgc aacatgatcg gccggagtaa cggcgccggc 60
gtcgcctacg cctcctcctc ctcctccgcg ctctccctcg gccagaactt gatggatggg 120
atgcaccacc accagctccc agcaatgctg cagcaccaga tggttgatca ccatcttctt 180
cttccccagc atcatcacca tcctcaccag caggcagcca cgagcgacag cgatgcccgg 240
ggcccccacg gagggggcaa caacaacagt agcaacaaca atgaagagct cgagatgagc 300
aagtcgggta ccggcagcga taacaacctc gacggcgaag gcggtggggg cggcggggag 360
gacgacgagc aagaggaccc ggccgggcag catcccagga agaagaagcg ttaccaccgt 420
cacacccagc accagatcca ggagcttgag gccttcttca aggagtgccc ccaccccgac 480
gacaagcagc gcaaggagct tagccgccag ctctccctcg agcccctcca ggtcaagttc 540
tggttccaga acaagcgcac ccagatcaag acgcagcacg agaggcagga gaacacggca 600
ctcaggacgg agaacgacaa gctgagggca gagaacatga ggtacaagga agcgctggcc 660
aacgcgtcgt gcccaaactg cggcgggccc gcggccatcg gggagatgtc cttcgatgag 720
caccatctgc gcatagagaa cgcgcgcctc cgcgacgaga ttgacaggat ctccgccatc 780
gccgccaagt acgtaggtgg caagcctggc tccggggtgg ctgtggcctc cgccgcctac 840
ccgccactgc caccgcagtc ttccggccgc tctgcgctcg accacctagg catgcccggc 900
atgtttggcg gtgctgagtt cgataagccg atggtgatcg agctggccgt ggcggccatg 960
gaggagctgg tccgaatggc gcagctcggg gagcctctct gggtgccatc cctcgacagt 1020
gaggcgctca gcgaggagga gtatgctcgc gccttcccac ggggtgcact cggccccaag 1080
tcgccggagc tccggtccga ggcgtcgagg gagacagacg ttgtcatcat gaaccacgtc 1140
agcctcgttg agatgctcat ggacgtgcgt cagtggtcgg cgctcttctc gagcatcgtg 1200
tcccgggcgg ccacgcttga cgttctgtcc accggcgtcg ccggcaatca cgacggcgcc 1260
ctgcagctca tgtcggctga atttcagatg ccgtcgcccc tggtgccaac gcgagacacc 1320
cagttcctgc gctactgcaa gcagcatcct ggcggtgcat gggccgtcgt cgacgtctcc 1380
ctcgacggtc tccgttccgc tgcacgggtg ggcgggcact ttcgccgccg cgcctccggc 1440
tgcctcatcc aggagatgcc gaacggctac tctaaggtga cgtgggtgga gcacgtcgag 1500
gcaggtgacg atgcaatgat gcacgatctg tacagacccc tggtgaactc tgggctggca 1560
ttcggcgcgc ggcggtggac gtcgacattg aagcgtcagt gcgagcgtct ggcgagcgcc 1620
atggcaactg tgccctcctc aggcggtgac gtgattacga cggcggaggg acgaaggagc 1680
atgctgaagc tggcggagag gatgacggcg agcttctgtg gcggggtgac tgcgtcgacg 1740
acacaccagt ggacgacgct ctctggtagc ggggcggagg acgtgcgtgt gatgacccgc 1800
aagagcgtcg acgaccccgg ccgcccaccg ggtatcatcc tcaacgctgc cacctccttc 1860
tggctccccg tccctccctc ccgcgtcttc ggcttcctgc gcgacgattc cacccgcagc 1920
gaatgggaca tcctctccaa cggcggcgtc gtccaggaga tggcccacat cgccaacggc 1980
agccaccacg gcaacgctgt ctccctcctc cgcgtcaaca acgcgaactc gaaccagagc 2040
aacatgctga tcctgcagga atgctgcacg gacgcgacgg ggtcgtatgt ggtgtacgcg 2100
ccggtggacg tggtggccat gaacgtggtg ctcaacggcg gggacccgga ctacgtggcg 2160
ctgctgccgt ccgggttcgc catccttcct gacgggccgg ccgggtcccc ggatgctggc 2220
gggtcgctcc tcaccgtcgc cttccagatc ctcgtcgact ccgtgcctac agccaagctc 2280
tcgctgggat ccgtcgccac cgtcaacagt ctcatcgcat gcaccgtcga ccgcatcaag 2340
gctgcagttg tcgtcagcgc cggtgacaac gctggcgtcg ccgcccggtg a 2391
<210> 463
<211> 796
<212> PRT
<213> Hordeum vulgare
<400> 463
Met Pro Gly Gly Met Met Ile Pro Gly Arg Asn Met Ile Gly Arg Ser
1 5 10 15
Asn Gly Ala Gly Val Ala Tyr Ala Ser Ser Ser Ser Ser Ala Leu Ser
20 25 30
Leu Gly Gln Asn Leu Met Asp Gly Met His His His Gln Leu Pro Ala
35 40 45
Met Leu Gln His Gln Met Val Asp His His Leu Leu Leu Pro Gln His
50 55 60
His His His Pro His Gln Gln Ala Ala Thr Ser Asp Ser Asp Ala Arg
65 70 75 80
Gly Pro His Gly Gly Gly Asn Asn Asn Ser Ser Asn Asn Asn Glu Glu
85 90 95
Leu Glu Met Ser Lys Ser Gly Thr Gly Ser Asp Asn Asn Leu Asp Gly
100 105 110
Glu Gly Gly Gly Gly Gly Gly Glu Asp Asp Glu Gln Glu Asp Pro Ala
115 120 125
Gly Gln His Pro Arg Lys Lys Lys Arg Tyr His Arg His Thr Gln His
130 135 140
Gln Ile Gln Glu Leu Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp
145 150 155 160
Asp Lys Gln Arg Lys Glu Leu Ser Arg Gln Leu Ser Leu Glu Pro Leu
165 170 175
Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Ile Lys Thr Gln
180 185 190
His Glu Arg Gln Glu Asn Thr Ala Leu Arg Thr Glu Asn Asp Lys Leu
195 200 205
Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Ala Asn Ala Ser Cys
210 215 220
Pro Asn Cys Gly Gly Pro Ala Ala Ile Gly Glu Met Ser Phe Asp Glu
225 230 235 240
His His Leu Arg Ile Glu Asn Ala Arg Leu Arg Asp Glu Ile Asp Arg
245 250 255
Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Gly Lys Pro Gly Ser Gly
260 265 270
Val Ala Val Ala Ser Ala Ala Tyr Pro Pro Leu Pro Pro Gln Ser Ser
275 280 285
Gly Arg Ser Ala Leu Asp His Leu Gly Met Pro Gly Met Phe Gly Gly
290 295 300
Ala Glu Phe Asp Lys Pro Met Val Ile Glu Leu Ala Val Ala Ala Met
305 310 315 320
Glu Glu Leu Val Arg Met Ala Gln Leu Gly Glu Pro Leu Trp Val Pro
325 330 335
Ser Leu Asp Ser Glu Ala Leu Ser Glu Glu Glu Tyr Ala Arg Ala Phe
340 345 350
Pro Arg Gly Ala Leu Gly Pro Lys Ser Pro Glu Leu Arg Ser Glu Ala
355 360 365
Ser Arg Glu Thr Asp Val Val Ile Met Asn His Val Ser Leu Val Glu
370 375 380
Met Leu Met Asp Val Arg Gln Trp Ser Ala Leu Phe Ser Ser Ile Val
385 390 395 400
Ser Arg Ala Ala Thr Leu Asp Val Leu Ser Thr Gly Val Ala Gly Asn
405 410 415
His Asp Gly Ala Leu Gln Leu Met Ser Ala Glu Phe Gln Met Pro Ser
420 425 430
Pro Leu Val Pro Thr Arg Asp Thr Gln Phe Leu Arg Tyr Cys Lys Gln
435 440 445
His Pro Gly Gly Ala Trp Ala Val Val Asp Val Ser Leu Asp Gly Leu
450 455 460
Arg Ser Ala Ala Arg Val Gly Gly His Phe Arg Arg Arg Ala Ser Gly
465 470 475 480
Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val
485 490 495
Glu His Val Glu Ala Gly Asp Asp Ala Met Met His Asp Leu Tyr Arg
500 505 510
Pro Leu Val Asn Ser Gly Leu Ala Phe Gly Ala Arg Arg Trp Thr Ser
515 520 525
Thr Leu Lys Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Thr Val
530 535 540
Pro Ser Ser Gly Gly Asp Val Ile Thr Thr Ala Glu Gly Arg Arg Ser
545 550 555 560
Met Leu Lys Leu Ala Glu Arg Met Thr Ala Ser Phe Cys Gly Gly Val
565 570 575
Thr Ala Ser Thr Thr His Gln Trp Thr Thr Leu Ser Gly Ser Gly Ala
580 585 590
Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg
595 600 605
Pro Pro Gly Ile Ile Leu Asn Ala Ala Thr Ser Phe Trp Leu Pro Val
610 615 620
Pro Pro Ser Arg Val Phe Gly Phe Leu Arg Asp Asp Ser Thr Arg Ser
625 630 635 640
Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu Met Ala His
645 650 655
Ile Ala Asn Gly Ser His His Gly Asn Ala Val Ser Leu Leu Arg Val
660 665 670
Asn Asn Ala Asn Ser Asn Gln Ser Asn Met Leu Ile Leu Gln Glu Cys
675 680 685
Cys Thr Asp Ala Thr Gly Ser Tyr Val Val Tyr Ala Pro Val Asp Val
690 695 700
Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala
705 710 715 720
Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ala Gly Ser
725 730 735
Pro Asp Ala Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val
740 745 750
Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val
755 760 765
Asn Ser Leu Ile Ala Cys Thr Val Asp Arg Ile Lys Ala Ala Val Val
770 775 780
Val Ser Ala Gly Asp Asn Ala Gly Val Ala Ala Arg
785 790 795
<210> 464
<211> 1881
<212> DNA
<213> Medicago truncatula
<400> 464
atgaagttgg tgttttgttt gcagacacaa catgaacgtt cggagaattc tcagttaaga 60
gcagataatg aaaagcttag agctgataac atgaggtata gagaagctct tagcaatgct 120
tcatgtccta attgtggtgg tccaacagct ataggtgaaa tgtcatttga tgaacatcat 180
ttgaggcttg aaaatgcaag gctaagagaa gagattgata gaatttcaac aatggcagcg 240
aagtacgttg ggaagccagt ggtgaactac tcaaacattt caccatctct cccaccacgt 300
acggaaattg gtttcggcaa cccacaaggg attggtacta tggacatgta tggagccagt 360
ggagatattc taaggtcaat tagtgggccg accgaagctg acaaaccaat tataatagaa 420
ttagctgttg cagctatgga agagcttatt gggatggctc aaatgggtga tcctctttgg 480
ctaagaacta cacctgaagg agctgctacc gtgcttaatg aagatgaata tgttaggtcg 540
tttcctcgtg ggattggacc taaacctaat ggtttcaaat gtgaagcttc gagggaatct 600
agcgttgtta tcatgaatca tgtcaacctt gttgagattc tcatggatgt gaaccaatgg 660
tcaacagtgt ttgctggaat tgtttcaaga gctgtgactg tggaggtgtt gtcaactgga 720
gtggcaggaa actacaatgg tgctttacaa gtgatgacag cagagtttca agtaccttca 780
ccccttgtgc cgactcgtga gagttacttt gtaaggtatt gtaaacaaca tcctgacggg 840
acatgggcag ttgtggatgt gtctttggat aatctgcgcc cgagtccttc atctagatgt 900
agaagaaggc cttctggttg cttaattcaa gagatgccaa atggttactc aaaggtgaca 960
tgggttgagc atgtagaagt ggatgagagg ggtgttcata atctatacaa gcaacttgtt 1020
aacactggag atgcatttgg tgcaaaacgt tgggttgcga ctttagatcg acaatgtgaa 1080
agacttgcta gctccatggc aacaaacatt cccaccgttg atgttggggt gataacaaac 1140
caagaaggga ggaagagtat gttgaaactg gcagagagaa tggtgataag tttctgtggt 1200
ggagtgagtg cttcaacagc acacacatgg acaacactgt ctggaacagg agccgatgat 1260
gtgagagtga tgactcgtaa gagtgtcgat gatcctggaa gacctcctgg tattgttctt 1320
agtgctgcta cttctttttg gcttcctgtt ccaccaacac aagtttttga atttcttcgt 1380
aacgagaact ccagaactga gtgggatatt ctttctaatg gtggagttgt ccaagaaatg 1440
gcgcacattg caaatggacg agatactgga aattgtgtgt ctctccttag agtaaatagt 1500
ccaaattcga gccagagcaa catgttaata ctacaagaga gtgtaacaga tgcaacaggc 1560
tcatttgtta tctatgcgcc agtagatatg gttgctatga atgtagttct aaatggagga 1620
gatccagatt atgttgcact tcttccatca ggatttgcta tcctctctga tggaaatgga 1680
aatggagtcg gcggtgaaac tggaggagga gtaggagctg gtgctggtgg tggtggatcc 1740
cttctgaccg tcgcttttca aatcttggtt gattctactc caactgctaa actctctctt 1800
ggatcagttg ctactgttaa tagtcttatc gcttgtactg ttgagagaat caaagcttct 1860
ttatctggtg aaagtgctta g 1881
<210> 465
<211> 626
<212> PRT
<213> Medicago truncatula
<400> 465
Met Lys Leu Val Phe Cys Leu Gln Thr Gln His Glu Arg Ser Glu Asn
1 5 10 15
Ser Gln Leu Arg Ala Asp Asn Glu Lys Leu Arg Ala Asp Asn Met Arg
20 25 30
Tyr Arg Glu Ala Leu Ser Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro
35 40 45
Thr Ala Ile Gly Glu Met Ser Phe Asp Glu His His Leu Arg Leu Glu
50 55 60
Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser Thr Met Ala Ala
65 70 75 80
Lys Tyr Val Gly Lys Pro Val Val Asn Tyr Ser Asn Ile Ser Pro Ser
85 90 95
Leu Pro Pro Arg Thr Glu Ile Gly Phe Gly Asn Pro Gln Gly Ile Gly
100 105 110
Thr Met Asp Met Tyr Gly Ala Ser Gly Asp Ile Leu Arg Ser Ile Ser
115 120 125
Gly Pro Thr Glu Ala Asp Lys Pro Ile Ile Ile Glu Leu Ala Val Ala
130 135 140
Ala Met Glu Glu Leu Ile Gly Met Ala Gln Met Gly Asp Pro Leu Trp
145 150 155 160
Leu Arg Thr Thr Pro Glu Gly Ala Ala Thr Val Leu Asn Glu Asp Glu
165 170 175
Tyr Val Arg Ser Phe Pro Arg Gly Ile Gly Pro Lys Pro Asn Gly Phe
180 185 190
Lys Cys Glu Ala Ser Arg Glu Ser Ser Val Val Ile Met Asn His Val
195 200 205
Asn Leu Val Glu Ile Leu Met Asp Val Asn Gln Trp Ser Thr Val Phe
210 215 220
Ala Gly Ile Val Ser Arg Ala Val Thr Val Glu Val Leu Ser Thr Gly
225 230 235 240
Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Thr Ala Glu Phe
245 250 255
Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg
260 265 270
Tyr Cys Lys Gln His Pro Asp Gly Thr Trp Ala Val Val Asp Val Ser
275 280 285
Leu Asp Asn Leu Arg Pro Ser Pro Ser Ser Arg Cys Arg Arg Arg Pro
290 295 300
Ser Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr
305 310 315 320
Trp Val Glu His Val Glu Val Asp Glu Arg Gly Val His Asn Leu Tyr
325 330 335
Lys Gln Leu Val Asn Thr Gly Asp Ala Phe Gly Ala Lys Arg Trp Val
340 345 350
Ala Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Ser Met Ala Thr
355 360 365
Asn Ile Pro Thr Val Asp Val Gly Val Ile Thr Asn Gln Glu Gly Arg
370 375 380
Lys Ser Met Leu Lys Leu Ala Glu Arg Met Val Ile Ser Phe Cys Gly
385 390 395 400
Gly Val Ser Ala Ser Thr Ala His Thr Trp Thr Thr Leu Ser Gly Thr
405 410 415
Gly Ala Asp Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro
420 425 430
Gly Arg Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Leu
435 440 445
Pro Val Pro Pro Thr Gln Val Phe Glu Phe Leu Arg Asn Glu Asn Ser
450 455 460
Arg Thr Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu Met
465 470 475 480
Ala His Ile Ala Asn Gly Arg Asp Thr Gly Asn Cys Val Ser Leu Leu
485 490 495
Arg Val Asn Ser Pro Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln
500 505 510
Glu Ser Val Thr Asp Ala Thr Gly Ser Phe Val Ile Tyr Ala Pro Val
515 520 525
Asp Met Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr
530 535 540
Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Ser Asp Gly Asn Gly
545 550 555 560
Asn Gly Val Gly Gly Glu Thr Gly Gly Gly Val Gly Ala Gly Ala Gly
565 570 575
Gly Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser
580 585 590
Thr Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser
595 600 605
Leu Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ser Leu Ser Gly Glu
610 615 620
Ser Ala
625
<210> 466
<211> 2280
<212> DNA
<213> Medicago truncatula
<400> 466
atgttcaact catctggtct atctttagca cttcaaacaa atttagaagc acaaggtggt 60
gatatgaaga gattaatggc tgagaatttt catcaaacaa ataatggttt gagaaggaat 120
agagaagaag aagaacatga aagctgcaga tctggtagtg ataacatgga tggtatttct 180
ggtgatgatt ttgatgctgc cgacaatccg ccaagaaaaa agcgttatca ccgacatact 240
cctcaacaaa ttcaagaact tgaatcgatg tttaaagagt gtcctcatcc tgatgaaaaa 300
caaagacttg aacttagcaa aaggctttgt ttggaaacaa gacaagtcaa gttttggttc 360
caaaatagaa gaacacaaat gaagactcaa ttggaacgtc acgagaattc gctacttagg 420
caagcaaatg ataaactaag agctgagaac atgtcaataa gagaagcaat gaggaatccc 480
atgtgttcaa attgtggagg accagcaatt attagtgaaa tttcacttga agaacaacat 540
ctaagaattg agaatgcaag actaaaagat gaattagacc gagtttgtac actcgccggc 600
aagtttttag gccgtccaat tacgtcgtta ccaaactcga gtttagaaat tggttttgtt 660
ggtttgaaca atactttgcc ttcaacaatg cctttaggtc aagattttgg tatggtgtca 720
atgtcaccac cttcaattac aagaggaaca agtatggtaa caaatactaa tagtaatggt 780
tttgatagat caatggagag gtctatgttc cttgaacttg ctttggctgc aatggatgag 840
ttggtgaaga tggcacaaac aaatgaacct ctttggatta gaagtgttga aagtggaaaa 900
gaaattttta atcatgagga atatacaagg attattagta ctccttgtat tggtttgaaa 960
ccaaatggtt ttgtttctga ggcttctaga gaaagtggtg ttgttatcat aaacagcttg 1020
gctcttgttg aaactttaat ggattcaaat cgatggtcag agatgttccc ttgtgtgatt 1080
gcaagaagct ccacaactga agtgatatct agtggaataa atggaaccag aaatggtgct 1140
ctacaactga tgcaagctga acttcaagtg ctttctccat tggttcctgt tcgtgaggtg 1200
agttttctaa ggttttgcaa gcaacatgca gaaggggtat gggcagtggt tgatgtgtcc 1260
atagatacca tcagagaaac ttcagctggt gcacccactt ttcttacctg taggaggctt 1320
ccttctggtt gtgtggttca agatatgcca aatggttact ctaaggtgac atgggtggag 1380
catgcagaat atgaagaaag ccaagttcac cagctctata gacccttgct aagcttaggc 1440
atgggttttg gcgcacaacg ttgggttgca accctacaac gccaatgcga atgtctagca 1500
attttaatgt catcatcact cccctctaga gaacactcag caataagtgc gggaggaagg 1560
cgtagcatgc taaagctagc gcaccgaatg acaaacaatt tttgtgccgg agtgtgtgca 1620
tcgacggtgc acaaatggaa caaattgaat gcagggaacg tgggcgagga cgttagggta 1680
atgacaagga aaagtgtgga tgatccgggt gagccaccag ggattgtgct tagtgcagca 1740
acctcagttt ggctacccgc ttcaccacaa aaagtatttg atttcctccg caacgagaag 1800
cttagaagtg aatgggacat actctccaac ggtggtccaa tgcaagagat ggctcacatt 1860
gccaaaggac atgaccatgg caactgtgtc tccctcctac gagctagtgc tattaattca 1920
agtcaaagta gcatgttgat tttacaagaa acaagcacag acgcatcggg gtcgcttgtt 1980
gtgtacgctc cggtggatat tcctgcaatg catgtagtaa tgaacggtgg cgattcagct 2040
tatgttgcgc ttcttccgtc gggttttgcc gtgttaccag atggacatag caatgggagc 2100
ggtaatcacg aagacgcatc acagccgaga gtgagtggat cacttttgac ggtagcattt 2160
cagatacttg tgaatagcct tccgacggca aagctcacgg tggaatcagt tgaaacggtt 2220
aacaatctca tttcatgtac tattcaaaag ataaaagtag cacttcaatg tgagagttaa 2280
<210> 467
<211> 759
<212> PRT
<213> Medicago truncatula
<400> 467
Met Phe Asn Ser Ser Gly Leu Ser Leu Ala Leu Gln Thr Asn Leu Glu
1 5 10 15
Ala Gln Gly Gly Asp Met Lys Arg Leu Met Ala Glu Asn Phe His Gln
20 25 30
Thr Asn Asn Gly Leu Arg Arg Asn Arg Glu Glu Glu Glu His Glu Ser
35 40 45
Cys Arg Ser Gly Ser Asp Asn Met Asp Gly Ile Ser Gly Asp Asp Phe
50 55 60
Asp Ala Ala Asp Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr
65 70 75 80
Pro Gln Gln Ile Gln Glu Leu Glu Ser Met Phe Lys Glu Cys Pro His
85 90 95
Pro Asp Glu Lys Gln Arg Leu Glu Leu Ser Lys Arg Leu Cys Leu Glu
100 105 110
Thr Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
115 120 125
Thr Gln Leu Glu Arg His Glu Asn Ser Leu Leu Arg Gln Ala Asn Asp
130 135 140
Lys Leu Arg Ala Glu Asn Met Ser Ile Arg Glu Ala Met Arg Asn Pro
145 150 155 160
Met Cys Ser Asn Cys Gly Gly Pro Ala Ile Ile Ser Glu Ile Ser Leu
165 170 175
Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu
180 185 190
Asp Arg Val Cys Thr Leu Ala Gly Lys Phe Leu Gly Arg Pro Ile Thr
195 200 205
Ser Leu Pro Asn Ser Ser Leu Glu Ile Gly Phe Val Gly Leu Asn Asn
210 215 220
Thr Leu Pro Ser Thr Met Pro Leu Gly Gln Asp Phe Gly Met Val Ser
225 230 235 240
Met Ser Pro Pro Ser Ile Thr Arg Gly Thr Ser Met Val Thr Asn Thr
245 250 255
Asn Ser Asn Gly Phe Asp Arg Ser Met Glu Arg Ser Met Phe Leu Glu
260 265 270
Leu Ala Leu Ala Ala Met Asp Glu Leu Val Lys Met Ala Gln Thr Asn
275 280 285
Glu Pro Leu Trp Ile Arg Ser Val Glu Ser Gly Lys Glu Ile Phe Asn
290 295 300
His Glu Glu Tyr Thr Arg Ile Ile Ser Thr Pro Cys Ile Gly Leu Lys
305 310 315 320
Pro Asn Gly Phe Val Ser Glu Ala Ser Arg Glu Ser Gly Val Val Ile
325 330 335
Ile Asn Ser Leu Ala Leu Val Glu Thr Leu Met Asp Ser Asn Arg Trp
340 345 350
Ser Glu Met Phe Pro Cys Val Ile Ala Arg Ser Ser Thr Thr Glu Val
355 360 365
Ile Ser Ser Gly Ile Asn Gly Thr Arg Asn Gly Ala Leu Gln Leu Met
370 375 380
Gln Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Val Arg Glu Val
385 390 395 400
Ser Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Val Trp Ala Val
405 410 415
Val Asp Val Ser Ile Asp Thr Ile Arg Glu Thr Ser Ala Gly Ala Pro
420 425 430
Thr Phe Leu Thr Cys Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp
435 440 445
Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr
450 455 460
Glu Glu Ser Gln Val His Gln Leu Tyr Arg Pro Leu Leu Ser Leu Gly
465 470 475 480
Met Gly Phe Gly Ala Gln Arg Trp Val Ala Thr Leu Gln Arg Gln Cys
485 490 495
Glu Cys Leu Ala Ile Leu Met Ser Ser Ser Leu Pro Ser Arg Glu His
500 505 510
Ser Ala Ile Ser Ala Gly Gly Arg Arg Ser Met Leu Lys Leu Ala His
515 520 525
Arg Met Thr Asn Asn Phe Cys Ala Gly Val Cys Ala Ser Thr Val His
530 535 540
Lys Trp Asn Lys Leu Asn Ala Gly Asn Val Gly Glu Asp Val Arg Val
545 550 555 560
Met Thr Arg Lys Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val
565 570 575
Leu Ser Ala Ala Thr Ser Val Trp Leu Pro Ala Ser Pro Gln Lys Val
580 585 590
Phe Asp Phe Leu Arg Asn Glu Lys Leu Arg Ser Glu Trp Asp Ile Leu
595 600 605
Ser Asn Gly Gly Pro Met Gln Glu Met Ala His Ile Ala Lys Gly His
610 615 620
Asp His Gly Asn Cys Val Ser Leu Leu Arg Ala Ser Ala Ile Asn Ser
625 630 635 640
Ser Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Ser Thr Asp Ala Ser
645 650 655
Gly Ser Leu Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Val
660 665 670
Val Met Asn Gly Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly
675 680 685
Phe Ala Val Leu Pro Asp Gly His Ser Asn Gly Ser Gly Asn His Glu
690 695 700
Asp Ala Ser Gln Pro Arg Val Ser Gly Ser Leu Leu Thr Val Ala Phe
705 710 715 720
Gln Ile Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser
725 730 735
Val Glu Thr Val Asn Asn Leu Ile Ser Cys Thr Ile Gln Lys Ile Lys
740 745 750
Val Ala Leu Gln Cys Glu Ser
755
<210> 468
<211> 2166
<212> DNA
<213> Medicago truncatula
<400> 468
atgtttaata ctccacatca aaaacacagc aagaacatgt atcagaatag gtcaacaagg 60
acaagagaag aagcaaacca aatgaacatg gaggctcctt caagtgatga ccaagaatcc 120
aaccaacgtc gcagaaaaag gacatatcgc cgccacacac agcaacaaat tgatgaaatg 180
gataccttct tcaagcagtg tcctaatcct aatgatgctc agagaagaga gctgagcctt 240
cggactgggt tagacccaac gcaaatcaag ttttggtttc agaacaggcg cacttcactg 300
aaggttcaaa ccgatagaga tgagaatgag ctattaaaga ttgagaatga aaaacttcga 360
gatgaacttg atagatacaa gggggcaatt agtaccacat gcaaagtatg tggaagttcc 420
tctaacgctg gggaaatgtc acatgaggag cagcagctaa gactggagaa tgctctcctt 480
aggaaagagc ttgaaaggtt tgtgggcgag acgccgacag actctcgtgc caatataaca 540
tcatccaaca atagcactca tgttgcttca cactctacgg attttggagt tgccggtggt 600
aacaatggag caagccaccg catggtagga gagggtttaa gcgttggtgg ctcctcagtg 660
cagattaagg gtcttaatga gaagcaaaag attgtagagc ttgctgttgt tggaatggat 720
gaactgacca aattggctag gacatatgga ccccctcttt ggatccccac caactatgtg 780
actgagattc tcaatggaga ggaatacatg aagtatttcc caaggggtaa tggtcccaac 840
acatgtggat taaggcttga gggttcaaaa gaatccgtgg tggtcatgat taatgctcct 900
gatcttgtag atatcctcat ggatgtgaat caatggtcaa atatgttttg cggcattgtt 960
tctagagcag caacacttga agtcctttca actggagtgg gaggtaacta cgatggagcc 1020
ttgcaagtga tgacagctga gtttcaagtc ccctccccac atgttcctac tcgtcaaaac 1080
cattttgtga gatactgtaa actgcaccca gatggaatat gggtagtggc tgatgtgtcc 1140
ttgcatcttt taaatgcagc atctgctagt agtagtagta gcagtactgc ttcaagaacc 1200
aacagaagac cctctggttg tttgattgag accctcccaa atggtctcac taaggttaca 1260
tggattgaaa atgtagaagt tgatgatcag gtggtgcaaa atatatataa acctctagtt 1320
aattctggac ttgcatttgg agctaaacgc tgggtagcta cattacatcg acaaagcgat 1380
cgtctttttt ttagaacagc caccaacgtt ccacgggaac atcatgtgag attgactcct 1440
gagggaaaga aaagtatatt gaatcttgcg gaaaggttgg tagctagctt tagtacaagt 1500
attggttctt ctacaacaca tgcttggaca aaggtacctg gaaacggacc ggaggttgta 1560
atggtcatga caaaaagata tatcgatgaa tcgagcattg acaaacccgt cagtgtagtg 1620
ctaagtgctg ctacttcttt ttggcttcca gttcctccaa ggagggtgtt tgattttctt 1680
cgagatcaaa acacaagaaa acattgggat attctctccg ccggcggtat agttcatgaa 1740
ttggctcaca tttcaaatgg gcgtgattct ggcaactatg tctccttatt tcgtatcact 1800
agtgaaaatt cagagcagag tgatgtggta gtactgcaag agaattgcac tgatgtaact 1860
ggctcatatg tagtatatgc gcctgtgcaa atacctacaa tgcatgaaat cctgaatggc 1920
ggcgactcaa gtcgtctcac tctgcttcct tccggattcg ctatttttcc agatgggtgt 1980
ataacaaatg gaggaccaat tatgaatgtt ggatctggag ggtctcttgt cacagttgca 2040
tttcaaatta tagttgattc tattccacat gcaaggctag ctctgggttc aatcaccacc 2100
gttaacactt tgatcaagaa cactgtggaa aggattagaa ctgcagtgat gcctaatggc 2160
atctaa 2166
<210> 469
<211> 721
<212> PRT
<213> Medicago truncatula
<400> 469
Met Phe Asn Thr Pro His Gln Lys His Ser Lys Asn Met Tyr Gln Asn
1 5 10 15
Arg Ser Thr Arg Thr Arg Glu Glu Ala Asn Gln Met Asn Met Glu Ala
20 25 30
Pro Ser Ser Asp Asp Gln Glu Ser Asn Gln Arg Arg Arg Lys Arg Thr
35 40 45
Tyr Arg Arg His Thr Gln Gln Gln Ile Asp Glu Met Asp Thr Phe Phe
50 55 60
Lys Gln Cys Pro Asn Pro Asn Asp Ala Gln Arg Arg Glu Leu Ser Leu
65 70 75 80
Arg Thr Gly Leu Asp Pro Thr Gln Ile Lys Phe Trp Phe Gln Asn Arg
85 90 95
Arg Thr Ser Leu Lys Val Gln Thr Asp Arg Asp Glu Asn Glu Leu Leu
100 105 110
Lys Ile Glu Asn Glu Lys Leu Arg Asp Glu Leu Asp Arg Tyr Lys Gly
115 120 125
Ala Ile Ser Thr Thr Cys Lys Val Cys Gly Ser Ser Ser Asn Ala Gly
130 135 140
Glu Met Ser His Glu Glu Gln Gln Leu Arg Leu Glu Asn Ala Leu Leu
145 150 155 160
Arg Lys Glu Leu Glu Arg Phe Val Gly Glu Thr Pro Thr Asp Ser Arg
165 170 175
Ala Asn Ile Thr Ser Ser Asn Asn Ser Thr His Val Ala Ser His Ser
180 185 190
Thr Asp Phe Gly Val Ala Gly Gly Asn Asn Gly Ala Ser His Arg Met
195 200 205
Val Gly Glu Gly Leu Ser Val Gly Gly Ser Ser Val Gln Ile Lys Gly
210 215 220
Leu Asn Glu Lys Gln Lys Ile Val Glu Leu Ala Val Val Gly Met Asp
225 230 235 240
Glu Leu Thr Lys Leu Ala Arg Thr Tyr Gly Pro Pro Leu Trp Ile Pro
245 250 255
Thr Asn Tyr Val Thr Glu Ile Leu Asn Gly Glu Glu Tyr Met Lys Tyr
260 265 270
Phe Pro Arg Gly Asn Gly Pro Asn Thr Cys Gly Leu Arg Leu Glu Gly
275 280 285
Ser Lys Glu Ser Val Val Val Met Ile Asn Ala Pro Asp Leu Val Asp
290 295 300
Ile Leu Met Asp Val Asn Gln Trp Ser Asn Met Phe Cys Gly Ile Val
305 310 315 320
Ser Arg Ala Ala Thr Leu Glu Val Leu Ser Thr Gly Val Gly Gly Asn
325 330 335
Tyr Asp Gly Ala Leu Gln Val Met Thr Ala Glu Phe Gln Val Pro Ser
340 345 350
Pro His Val Pro Thr Arg Gln Asn His Phe Val Arg Tyr Cys Lys Leu
355 360 365
His Pro Asp Gly Ile Trp Val Val Ala Asp Val Ser Leu His Leu Leu
370 375 380
Asn Ala Ala Ser Ala Ser Ser Ser Ser Ser Ser Thr Ala Ser Arg Thr
385 390 395 400
Asn Arg Arg Pro Ser Gly Cys Leu Ile Glu Thr Leu Pro Asn Gly Leu
405 410 415
Thr Lys Val Thr Trp Ile Glu Asn Val Glu Val Asp Asp Gln Val Val
420 425 430
Gln Asn Ile Tyr Lys Pro Leu Val Asn Ser Gly Leu Ala Phe Gly Ala
435 440 445
Lys Arg Trp Val Ala Thr Leu His Arg Gln Ser Asp Arg Leu Phe Phe
450 455 460
Arg Thr Ala Thr Asn Val Pro Arg Glu His His Val Arg Leu Thr Pro
465 470 475 480
Glu Gly Lys Lys Ser Ile Leu Asn Leu Ala Glu Arg Leu Val Ala Ser
485 490 495
Phe Ser Thr Ser Ile Gly Ser Ser Thr Thr His Ala Trp Thr Lys Val
500 505 510
Pro Gly Asn Gly Pro Glu Val Val Met Val Met Thr Lys Arg Tyr Ile
515 520 525
Asp Glu Ser Ser Ile Asp Lys Pro Val Ser Val Val Leu Ser Ala Ala
530 535 540
Thr Ser Phe Trp Leu Pro Val Pro Pro Arg Arg Val Phe Asp Phe Leu
545 550 555 560
Arg Asp Gln Asn Thr Arg Lys His Trp Asp Ile Leu Ser Ala Gly Gly
565 570 575
Ile Val His Glu Leu Ala His Ile Ser Asn Gly Arg Asp Ser Gly Asn
580 585 590
Tyr Val Ser Leu Phe Arg Ile Thr Ser Glu Asn Ser Glu Gln Ser Asp
595 600 605
Val Val Val Leu Gln Glu Asn Cys Thr Asp Val Thr Gly Ser Tyr Val
610 615 620
Val Tyr Ala Pro Val Gln Ile Pro Thr Met His Glu Ile Leu Asn Gly
625 630 635 640
Gly Asp Ser Ser Arg Leu Thr Leu Leu Pro Ser Gly Phe Ala Ile Phe
645 650 655
Pro Asp Gly Cys Ile Thr Asn Gly Gly Pro Ile Met Asn Val Gly Ser
660 665 670
Gly Gly Ser Leu Val Thr Val Ala Phe Gln Ile Ile Val Asp Ser Ile
675 680 685
Pro His Ala Arg Leu Ala Leu Gly Ser Ile Thr Thr Val Asn Thr Leu
690 695 700
Ile Lys Asn Thr Val Glu Arg Ile Arg Thr Ala Val Met Pro Asn Gly
705 710 715 720
Ile
<210> 470
<211> 2307
<212> DNA
<213> Medicago truncatula
<400> 470
atgtctaata ataatcctcc ttctacttct aaagccaaag acttctttcc ctctccagct 60
ctctctctta gcctagcggg gatatttcgg catggtggcg gtgcggcggc ggagggtgaa 120
ggagggagta ttagtaacat ggaggtggaa gaaggggagg aagggagtac aataggaggt 180
gagcgtgtgg aggaaattag cagtgagtat tcaggtccag ctaaatccaa atcaatagat 240
gaatatgaag gagatgaact tgaagatgat gaaggtgaag atgatgaagg tgatggtgat 300
ggtgatggtg atggtgttaa taagaacaag aagaagaaaa ggaagaaata tcacaggcac 360
acttctgaac agatcagagt catggaagcg cttttcaaag agtcaccaca tcctgatgaa 420
aagcaaaggc aacaacttag caagcaatta ggacttgctc ctaggcaagt caaattttgg 480
ttccaaaatc gtcgtaccca aatcaaggca atacaagagc gacatgaaaa ttcattgttg 540
aaatcagaaa tagagaaact aagggagaaa aataagaccc tacgagagac cataaataag 600
gcttgttgcc ccaattgtgg ggtccccacc acaaatagag atggtaccat ggcaactgaa 660
gaacaacaac tacgtattga aaatgccaaa ctcaaagctg aggtagagag gctgagagca 720
gctttaggga aatatgcatc agggacaatg tcaccttcat gttccactag ccatgaccaa 780
gagaatatta aaagctcttt ggatttttat actggaattt tttgtcttga tgagtcaaga 840
ataatggatg tagtaaacca agcaatggag gagcttatca agatggctac aatgggtgaa 900
ccaatgtggt tacgtagctt agagaccggt cgcgaaatac ttaactatga tgaatatatg 960
aaggagtttg cagatgaaaa ttcagaccat ggaagaccaa agagatccat tgaagcttca 1020
agagatacag gagttgtttt tgcagatctt cctcggattg tccaatgctt tcttgatgct 1080
aatcaatgga aggaaatgtt tccatgttta atatctaagg cagcaacagt tgacactata 1140
tgcaaaggag aaggttctaa caagaatggt gcagtgcaac tgatgtttgc tgagttgcaa 1200
atgttaacac caatggttcc aactagagaa gtgtattttg tcagatactg caaacggttg 1260
agtggtgaaa aatgggctat tgttgatgtg tccatagaca aagtagaaga caacattgac 1320
aagtccttag tgaaatgcag aaaacgccca tctggttgca ttattgagga taagtcaaat 1380
ggacattgca aagtagtatg ggtggagcat ttggagtgcc aaaagagtat agttcattca 1440
atgtatcgca ccattgtcaa cagcggccta gcttttgggg caaggcattg gattgcgacc 1500
cttcaacttc aatgcgaacg tctagttttc ttcatggcaa caaacgttcc catgaaggat 1560
tcaaccggag ttgccacatt ggccggaaga aaaagcattt tgaagttggc acaaagaatg 1620
acatggagtt tctgtcaagc aattagtgct tcaagcttcc atacatggac taaggttaca 1680
agtaaaactg gagaagacat aaggattagc tctagaaaga acttgaatga tcctagtgaa 1740
cctcttggat tgatagtttg tgcagtttct tctatatggt tgcctatatc tcctaatgtt 1800
ttgtttgatt tcttgaggga cgaaactcgt cgaactgagt gggatataat gtctaatggt 1860
gggacagtgc aatccattgc aaatttagcc aaaggacaag acagaggcaa tgcagtaact 1920
atccaaacaa ttaaatcaaa agaaaacaat atgtggatac tgcaagatag ctgcacaaat 1980
tcttacgagt caatggtggt atatgcacct gcggatatta ctggtattca atctgtgatg 2040
accggatgcg actcgagcaa tcttgccata ctaccctcag gattttcaat tgtttctgat 2100
ggtttggagt caaggcaaat ggtaattact tcgaggcggg aagagaaaaa tacagaaggt 2160
ggatctttgt ttacaatagc attccaaatc cttacaaatg cttctcctac agccaaatta 2220
actatggagt ctgtggactc tatgaactct cttgtatcat gtacattgag acacatcaaa 2280
acaagtctaa attgcgaaga tggttag 2307
<210> 471
<211> 768
<212> PRT
<213> Medicago truncatula
<400> 471
Met Ser Asn Asn Asn Pro Pro Ser Thr Ser Lys Ala Lys Asp Phe Phe
1 5 10 15
Pro Ser Pro Ala Leu Ser Leu Ser Leu Ala Gly Ile Phe Arg His Gly
20 25 30
Gly Gly Ala Ala Ala Glu Gly Glu Gly Gly Ser Ile Ser Asn Met Glu
35 40 45
Val Glu Glu Gly Glu Glu Gly Ser Thr Ile Gly Gly Glu Arg Val Glu
50 55 60
Glu Ile Ser Ser Glu Tyr Ser Gly Pro Ala Lys Ser Lys Ser Ile Asp
65 70 75 80
Glu Tyr Glu Gly Asp Glu Leu Glu Asp Asp Glu Gly Glu Asp Asp Glu
85 90 95
Gly Asp Gly Asp Gly Asp Gly Asp Gly Val Asn Lys Asn Lys Lys Lys
100 105 110
Lys Arg Lys Lys Tyr His Arg His Thr Ser Glu Gln Ile Arg Val Met
115 120 125
Glu Ala Leu Phe Lys Glu Ser Pro His Pro Asp Glu Lys Gln Arg Gln
130 135 140
Gln Leu Ser Lys Gln Leu Gly Leu Ala Pro Arg Gln Val Lys Phe Trp
145 150 155 160
Phe Gln Asn Arg Arg Thr Gln Ile Lys Ala Ile Gln Glu Arg His Glu
165 170 175
Asn Ser Leu Leu Lys Ser Glu Ile Glu Lys Leu Arg Glu Lys Asn Lys
180 185 190
Thr Leu Arg Glu Thr Ile Asn Lys Ala Cys Cys Pro Asn Cys Gly Val
195 200 205
Pro Thr Thr Asn Arg Asp Gly Thr Met Ala Thr Glu Glu Gln Gln Leu
210 215 220
Arg Ile Glu Asn Ala Lys Leu Lys Ala Glu Val Glu Arg Leu Arg Ala
225 230 235 240
Ala Leu Gly Lys Tyr Ala Ser Gly Thr Met Ser Pro Ser Cys Ser Thr
245 250 255
Ser His Asp Gln Glu Asn Ile Lys Ser Ser Leu Asp Phe Tyr Thr Gly
260 265 270
Ile Phe Cys Leu Asp Glu Ser Arg Ile Met Asp Val Val Asn Gln Ala
275 280 285
Met Glu Glu Leu Ile Lys Met Ala Thr Met Gly Glu Pro Met Trp Leu
290 295 300
Arg Ser Leu Glu Thr Gly Arg Glu Ile Leu Asn Tyr Asp Glu Tyr Met
305 310 315 320
Lys Glu Phe Ala Asp Glu Asn Ser Asp His Gly Arg Pro Lys Arg Ser
325 330 335
Ile Glu Ala Ser Arg Asp Thr Gly Val Val Phe Ala Asp Leu Pro Arg
340 345 350
Ile Val Gln Cys Phe Leu Asp Ala Asn Gln Trp Lys Glu Met Phe Pro
355 360 365
Cys Leu Ile Ser Lys Ala Ala Thr Val Asp Thr Ile Cys Lys Gly Glu
370 375 380
Gly Ser Asn Lys Asn Gly Ala Val Gln Leu Met Phe Ala Glu Leu Gln
385 390 395 400
Met Leu Thr Pro Met Val Pro Thr Arg Glu Val Tyr Phe Val Arg Tyr
405 410 415
Cys Lys Arg Leu Ser Gly Glu Lys Trp Ala Ile Val Asp Val Ser Ile
420 425 430
Asp Lys Val Glu Asp Asn Ile Asp Lys Ser Leu Val Lys Cys Arg Lys
435 440 445
Arg Pro Ser Gly Cys Ile Ile Glu Asp Lys Ser Asn Gly His Cys Lys
450 455 460
Val Val Trp Val Glu His Leu Glu Cys Gln Lys Ser Ile Val His Ser
465 470 475 480
Met Tyr Arg Thr Ile Val Asn Ser Gly Leu Ala Phe Gly Ala Arg His
485 490 495
Trp Ile Ala Thr Leu Gln Leu Gln Cys Glu Arg Leu Val Phe Phe Met
500 505 510
Ala Thr Asn Val Pro Met Lys Asp Ser Thr Gly Val Ala Thr Leu Ala
515 520 525
Gly Arg Lys Ser Ile Leu Lys Leu Ala Gln Arg Met Thr Trp Ser Phe
530 535 540
Cys Gln Ala Ile Ser Ala Ser Ser Phe His Thr Trp Thr Lys Val Thr
545 550 555 560
Ser Lys Thr Gly Glu Asp Ile Arg Ile Ser Ser Arg Lys Asn Leu Asn
565 570 575
Asp Pro Ser Glu Pro Leu Gly Leu Ile Val Cys Ala Val Ser Ser Ile
580 585 590
Trp Leu Pro Ile Ser Pro Asn Val Leu Phe Asp Phe Leu Arg Asp Glu
595 600 605
Thr Arg Arg Thr Glu Trp Asp Ile Met Ser Asn Gly Gly Thr Val Gln
610 615 620
Ser Ile Ala Asn Leu Ala Lys Gly Gln Asp Arg Gly Asn Ala Val Thr
625 630 635 640
Ile Gln Thr Ile Lys Ser Lys Glu Asn Asn Met Trp Ile Leu Gln Asp
645 650 655
Ser Cys Thr Asn Ser Tyr Glu Ser Met Val Val Tyr Ala Pro Ala Asp
660 665 670
Ile Thr Gly Ile Gln Ser Val Met Thr Gly Cys Asp Ser Ser Asn Leu
675 680 685
Ala Ile Leu Pro Ser Gly Phe Ser Ile Val Ser Asp Gly Leu Glu Ser
690 695 700
Arg Gln Met Val Ile Thr Ser Arg Arg Glu Glu Lys Asn Thr Glu Gly
705 710 715 720
Gly Ser Leu Phe Thr Ile Ala Phe Gln Ile Leu Thr Asn Ala Ser Pro
725 730 735
Thr Ala Lys Leu Thr Met Glu Ser Val Asp Ser Met Asn Ser Leu Val
740 745 750
Ser Cys Thr Leu Arg His Ile Lys Thr Ser Leu Asn Cys Glu Asp Gly
755 760 765
<210> 472
<211> 2406
<212> DNA
<213> Medicago truncatula
<400> 472
atgtatggtg attgtcaagt tatgtcaaca atgggaggga atgtagtagt aaactcagaa 60
tctctcttct cttctccgat ccataactct aacttcaact tcatgtcaac catgcctttt 120
caaccatttt cttcttccat gaaagaagaa gaaggaattt tgagaggtaa agaagagata 180
atggatcaaa gtggttcagg tagtgaacaa gttgaagata aatcaggaaa tgaacaagag 240
attaataatg aacaacaagc tacaaagaag aaacgttatc atcgacacac tgctcgtcag 300
atccaagaaa tggaagcttt gttcaaggaa tgtccacacc cagatgataa acaaagactg 360
aaactaagcc atgatttggg actgaaacca cgccaggtta agttctggtt tcagaatcgt 420
cgaactcaga tgaaggcaca acaagatcgt tctgataatg tgatacttag agcagagaat 480
gagagtttga agaatgagaa ctataggcta caatcggcgt tacgtaatat tttatgtcct 540
aattgtggtg ggccatgtat aatgggacct gatatgggtt ttgatgatca ccaacttcga 600
tttgaaaatg cccggttaaa agaggagcta gaacgtgtgt gctgtataac atcaagatac 660
actggtcgtc cactccaaac aatggcacca ccttcatctc ttatgccacc atcactggac 720
ttagacatga acatttatcc aaggcacttt gatccaatgc caccatgcac tgaaatgatt 780
cctgtcccta tgttaccacc tgaaccttca caatttcaag agggaggtct cttattaatg 840
gaagatgaaa aatcacttgc tatggaactt gcagcttctt ctatggctga gcttgttaag 900
atgtgtcaaa tgaatgaacc actttggatt cgtagcgaga atgatagaga agttcttaat 960
tttgatgagc atgctagggt ttttcaatgg cctttgaatc ttaagcaaag gaatgagtta 1020
aggaatgaag ctacgcgtga ttctgctgtt gtaatcatga atagtgttac tcttgttgat 1080
gcttttcttg atgctcaaaa atggatggaa ttgtttccaa caattgttgc tagagcaaga 1140
actgttcaaa ttatagcttc aggtgcttct ggccatgcaa gtgggactct tcagctgatg 1200
cacgcagaat tccaagttct ttctccgttg gtgtccacca gagagactca ttttcttcga 1260
tattgtcagc aaaatgccga ggaaggaacc tgggccattg ttgattttcc tgttgatagc 1320
ttccaacaaa actttcacaa ttcttgtccc aaatactgca gaaggtcctc tggctgtgtg 1380
attcaagaca tgccaaatgg ctattcgagg gtaacatggg ttgagcatgc aaaagttgta 1440
gagaaacctg tccatcaaat atttagtaac tatgtgtata gtggtatggc atttggtgca 1500
caacgttggt taggagtttt gcagaggcaa tgtgaaaggg ttgcaagcct tatggctaga 1560
aacatatcag atcttggagt gataccttct ccggaagcgc gaaagagctt gatgaaatta 1620
gcaaaccgga tgataaaaac ttttagcctt aatatgacca cttgtggtgg acaatcatgg 1680
actgctatat cggattcacc agaagacact gttagaatca caactaggaa aatcactgag 1740
cctggccaac ctagtggagt gattctcgcc gcagtttcaa ccacttggct tccttatact 1800
cataccaaag tctttgatct ccttcgtgac gaacgccaca gatctcagat ggatgcactt 1860
tctaatggga actcattaaa tgaagtggct catattgcta acggttcaca tccgggaaac 1920
tgcatttccc ttcttcgcat aaatgtagca agtaactcat ctcaaaatgt agagctaatg 1980
ctgcaagaga gttgcacaga tcaatcagga agcttagtag tctacacaac agtcgatgtt 2040
gattcggtcc aactagctat gagtggacaa gacccttcat gcattgcact tcttccacaa 2100
gggttcatga tagtgccaat ggtttcatca aatgctgata catcatctga acaaggtgtc 2160
acaggaacac catcatctac tgctagtgcc aatgctgcta actcaggttg tcttcttatc 2220
atgggaatgc aagttctagc aagcacaatt ccttctgcaa agcttaacct ttcaagtgtc 2280
acagcaatca ataaccacct ctgcaatacc cttcatcaaa ttgaaagtgc tctttgtagc 2340
agcagtaaca acaattgctt tgttggttct tgcaatgaac caaccactag tgcaccttcc 2400
aagtag 2406
<210> 473
<211> 801
<212> PRT
<213> Medicago truncatula
<400> 473
Met Tyr Gly Asp Cys Gln Val Met Ser Thr Met Gly Gly Asn Val Val
1 5 10 15
Val Asn Ser Glu Ser Leu Phe Ser Ser Pro Ile His Asn Ser Asn Phe
20 25 30
Asn Phe Met Ser Thr Met Pro Phe Gln Pro Phe Ser Ser Ser Met Lys
35 40 45
Glu Glu Glu Gly Ile Leu Arg Gly Lys Glu Glu Ile Met Asp Gln Ser
50 55 60
Gly Ser Gly Ser Glu Gln Val Glu Asp Lys Ser Gly Asn Glu Gln Glu
65 70 75 80
Ile Asn Asn Glu Gln Gln Ala Thr Lys Lys Lys Arg Tyr His Arg His
85 90 95
Thr Ala Arg Gln Ile Gln Glu Met Glu Ala Leu Phe Lys Glu Cys Pro
100 105 110
His Pro Asp Asp Lys Gln Arg Leu Lys Leu Ser His Asp Leu Gly Leu
115 120 125
Lys Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met
130 135 140
Lys Ala Gln Gln Asp Arg Ser Asp Asn Val Ile Leu Arg Ala Glu Asn
145 150 155 160
Glu Ser Leu Lys Asn Glu Asn Tyr Arg Leu Gln Ser Ala Leu Arg Asn
165 170 175
Ile Leu Cys Pro Asn Cys Gly Gly Pro Cys Ile Met Gly Pro Asp Met
180 185 190
Gly Phe Asp Asp His Gln Leu Arg Phe Glu Asn Ala Arg Leu Lys Glu
195 200 205
Glu Leu Glu Arg Val Cys Cys Ile Thr Ser Arg Tyr Thr Gly Arg Pro
210 215 220
Leu Gln Thr Met Ala Pro Pro Ser Ser Leu Met Pro Pro Ser Leu Asp
225 230 235 240
Leu Asp Met Asn Ile Tyr Pro Arg His Phe Asp Pro Met Pro Pro Cys
245 250 255
Thr Glu Met Ile Pro Val Pro Met Leu Pro Pro Glu Pro Ser Gln Phe
260 265 270
Gln Glu Gly Gly Leu Leu Leu Met Glu Asp Glu Lys Ser Leu Ala Met
275 280 285
Glu Leu Ala Ala Ser Ser Met Ala Glu Leu Val Lys Met Cys Gln Met
290 295 300
Asn Glu Pro Leu Trp Ile Arg Ser Glu Asn Asp Arg Glu Val Leu Asn
305 310 315 320
Phe Asp Glu His Ala Arg Val Phe Gln Trp Pro Leu Asn Leu Lys Gln
325 330 335
Arg Asn Glu Leu Arg Asn Glu Ala Thr Arg Asp Ser Ala Val Val Ile
340 345 350
Met Asn Ser Val Thr Leu Val Asp Ala Phe Leu Asp Ala Gln Lys Trp
355 360 365
Met Glu Leu Phe Pro Thr Ile Val Ala Arg Ala Arg Thr Val Gln Ile
370 375 380
Ile Ala Ser Gly Ala Ser Gly His Ala Ser Gly Thr Leu Gln Leu Met
385 390 395 400
His Ala Glu Phe Gln Val Leu Ser Pro Leu Val Ser Thr Arg Glu Thr
405 410 415
His Phe Leu Arg Tyr Cys Gln Gln Asn Ala Glu Glu Gly Thr Trp Ala
420 425 430
Ile Val Asp Phe Pro Val Asp Ser Phe Gln Gln Asn Phe His Asn Ser
435 440 445
Cys Pro Lys Tyr Cys Arg Arg Ser Ser Gly Cys Val Ile Gln Asp Met
450 455 460
Pro Asn Gly Tyr Ser Arg Val Thr Trp Val Glu His Ala Lys Val Val
465 470 475 480
Glu Lys Pro Val His Gln Ile Phe Ser Asn Tyr Val Tyr Ser Gly Met
485 490 495
Ala Phe Gly Ala Gln Arg Trp Leu Gly Val Leu Gln Arg Gln Cys Glu
500 505 510
Arg Val Ala Ser Leu Met Ala Arg Asn Ile Ser Asp Leu Gly Val Ile
515 520 525
Pro Ser Pro Glu Ala Arg Lys Ser Leu Met Lys Leu Ala Asn Arg Met
530 535 540
Ile Lys Thr Phe Ser Leu Asn Met Thr Thr Cys Gly Gly Gln Ser Trp
545 550 555 560
Thr Ala Ile Ser Asp Ser Pro Glu Asp Thr Val Arg Ile Thr Thr Arg
565 570 575
Lys Ile Thr Glu Pro Gly Gln Pro Ser Gly Val Ile Leu Ala Ala Val
580 585 590
Ser Thr Thr Trp Leu Pro Tyr Thr His Thr Lys Val Phe Asp Leu Leu
595 600 605
Arg Asp Glu Arg His Arg Ser Gln Met Asp Ala Leu Ser Asn Gly Asn
610 615 620
Ser Leu Asn Glu Val Ala His Ile Ala Asn Gly Ser His Pro Gly Asn
625 630 635 640
Cys Ile Ser Leu Leu Arg Ile Asn Val Ala Ser Asn Ser Ser Gln Asn
645 650 655
Val Glu Leu Met Leu Gln Glu Ser Cys Thr Asp Gln Ser Gly Ser Leu
660 665 670
Val Val Tyr Thr Thr Val Asp Val Asp Ser Val Gln Leu Ala Met Ser
675 680 685
Gly Gln Asp Pro Ser Cys Ile Ala Leu Leu Pro Gln Gly Phe Met Ile
690 695 700
Val Pro Met Val Ser Ser Asn Ala Asp Thr Ser Ser Glu Gln Gly Val
705 710 715 720
Thr Gly Thr Pro Ser Ser Thr Ala Ser Ala Asn Ala Ala Asn Ser Gly
725 730 735
Cys Leu Leu Ile Met Gly Met Gln Val Leu Ala Ser Thr Ile Pro Ser
740 745 750
Ala Lys Leu Asn Leu Ser Ser Val Thr Ala Ile Asn Asn His Leu Cys
755 760 765
Asn Thr Leu His Gln Ile Glu Ser Ala Leu Cys Ser Ser Ser Asn Asn
770 775 780
Asn Cys Phe Val Gly Ser Cys Asn Glu Pro Thr Thr Ser Ala Pro Ser
785 790 795 800
Lys
<210> 474
<211> 2355
<212> DNA
<213> Oryza sativa
<400> 474
atgacgccgg cgaggcgcat gccgccggtg atcggccgga acggcgtggc gtacgaatcg 60
ccgtcggcgc agctgcccct cacccaggct gatatgctgg acagccatca tctgcagcaa 120
gcactccagc agcaatactt cgatcagatc ccggtgacga cgacggcggc ggcggacagc 180
ggcgacaaca tgctgcacgg ccgcgccgac gccggcgggc tggttgacga gttcgagagc 240
aagtcgtgca gcgagaacgt cgacggcgcc ggcgacggcc tctccggcga cgaccaggac 300
cccaaccagc ggccgcgcaa gaagcgttac caccgccata cccagcacca gatccaagag 360
atggaagctt tcttcaagga gtgcccgcac ccagacgaca agcagcgcaa ggagctgagc 420
agggagctgg gtcttgaacc tctgcaggtt aaattctggt ttcagaacaa gcgcacacag 480
atgaagaacc agcacgagag gcacgagaac gcgcagctgc gggcggagaa cgacaagctg 540
cgcgcggaga acatgcgata caaggaggcc ctgagcagcg cgtcgtgccc caactgcggc 600
ggccccgccg ccctcggcga gatgtccttc gacgagcacc acctccgcgt cgagaacgcc 660
cgcctccgcg acgagatcga ccgcatctcc ggcatcgccg ccaagcacgt cggcaagccc 720
cccatcgtct ccttccccgt cctctcctcc ccgctcgccg tcgccgccgc ccgctcccct 780
ctcgacctcg ccggcgccta cggcgtcgtc acccccggcc tcgacatgtt cggcggcgcc 840
ggcgacctcc tccgcggcgt gcacccgctc gacgccgaca agcccatgat cgtggagctc 900
gccgtcgccg ccatggacga gctcgtccag atggcccagc tcgacgagcc gctctggtcg 960
tcgtcgtcgg agccggcggc ggcgttgctc gatgaggagg agtacgcgcg catgttcccg 1020
cgcggcctcg gccccaagca gtacggcctc aagtcggagg cgtcccgcca tggcgccgtc 1080
gtcatcatga cgcacagcaa cctcgtcgag atcctcatgg atgtgaatca attcgcgacg 1140
gtgttctcga gcatcgtgtc gagagcgtcc acgcacgagg tgttgtccac aggcgtggca 1200
ggcaactaca atggtgcact gcaagtgatg tcaatggagt ttcaagtgcc gtcgccgctg 1260
gtgccgacga gggagagcta tttcgtcagg tactgcaaga acaactccga cgggacatgg 1320
gccgtcgtcg atgtctctct cgacagcctc cgccccagcc ctgtccagaa atgccggcgc 1380
aggccgtctg gctgcctcat ccaagaaatg cccaatggct actccaaggt gacatgggtg 1440
gagcatgtgg aggtggacga cagctcggtg cacaacatct acaagccatt ggtgaactcc 1500
ggcctcgcat tcggcgcgaa acggtgggtc ggcacgctgg accggcaatg cgagcgcctc 1560
gccagcgcca tggccagcaa catccccaat ggcgaccttg gagtgattac aagcgtggag 1620
gggaggaaga gcatgttgaa gctggcggag aggatggtgg cgagcttctg cggcggcgtg 1680
acggcgtcgg tggcgcacca gtggacgacg ctgtcgggca gcggggcgga ggacgtgcgc 1740
gtcatgacga ggaagagcgt cgacgacccc ggcaggccac cgggcatcgt gctcaacgcc 1800
gccacctcct tctggctccc cgtccctccc gccgccgtct tcgacttcct ccgcgacgag 1860
acctctcgca gcgagtggga cattctgtcc aacggcggcg ccgtccaaga aatggctcac 1920
attgccaacg gccgtgacca tggcaactct gtctcgcttc ttcgtgtcaa tagtgcaaat 1980
tcaaaccaga gcaacatgct gatcctgcaa gagagctgca cggacgcgtc gggctcctac 2040
gtggtgtacg cgccggtgga catcgtggcg atgaacgtgg tgctcaacgg cggcgacccg 2100
gactacgtgg cgctgctgcc gtcggggttc gccatccttc ccgacgggcc gtcggggaac 2160
gcgcaggccg ccgtcgggga gaacggctcc ggctccggcg gggggtccct cctgacggtg 2220
gcgttccaga tcctcgtcga ctccgtgccg acggcgaagc tctcgctggg ctccgtcgcg 2280
acggtgaaca gcctcatcgc ctgcacggtg gagcgcatca aggccgccgt ctgcagggac 2340
agcaaccctc agtag 2355
<210> 475
<211> 784
<212> PRT
<213> Oryza sativa
<400> 475
Met Thr Pro Ala Arg Arg Met Pro Pro Val Ile Gly Arg Asn Gly Val
1 5 10 15
Ala Tyr Glu Ser Pro Ser Ala Gln Leu Pro Leu Thr Gln Ala Asp Met
20 25 30
Leu Asp Ser His His Leu Gln Gln Ala Leu Gln Gln Gln Tyr Phe Asp
35 40 45
Gln Ile Pro Val Thr Thr Thr Ala Ala Ala Asp Ser Gly Asp Asn Met
50 55 60
Leu His Gly Arg Ala Asp Ala Gly Gly Leu Val Asp Glu Phe Glu Ser
65 70 75 80
Lys Ser Cys Ser Glu Asn Val Asp Gly Ala Gly Asp Gly Leu Ser Gly
85 90 95
Asp Asp Gln Asp Pro Asn Gln Arg Pro Arg Lys Lys Arg Tyr His Arg
100 105 110
His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys
115 120 125
Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly
130 135 140
Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln
145 150 155 160
Met Lys Asn Gln His Glu Arg His Glu Asn Ala Gln Leu Arg Ala Glu
165 170 175
Asn Asp Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Ser
180 185 190
Ser Ala Ser Cys Pro Asn Cys Gly Gly Pro Ala Ala Leu Gly Glu Met
195 200 205
Ser Phe Asp Glu His His Leu Arg Val Glu Asn Ala Arg Leu Arg Asp
210 215 220
Glu Ile Asp Arg Ile Ser Gly Ile Ala Ala Lys His Val Gly Lys Pro
225 230 235 240
Pro Ile Val Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Val Ala Ala
245 250 255
Ala Arg Ser Pro Leu Asp Leu Ala Gly Ala Tyr Gly Val Val Thr Pro
260 265 270
Gly Leu Asp Met Phe Gly Gly Ala Gly Asp Leu Leu Arg Gly Val His
275 280 285
Pro Leu Asp Ala Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala
290 295 300
Met Asp Glu Leu Val Gln Met Ala Gln Leu Asp Glu Pro Leu Trp Ser
305 310 315 320
Ser Ser Ser Glu Pro Ala Ala Ala Leu Leu Asp Glu Glu Glu Tyr Ala
325 330 335
Arg Met Phe Pro Arg Gly Leu Gly Pro Lys Gln Tyr Gly Leu Lys Ser
340 345 350
Glu Ala Ser Arg His Gly Ala Val Val Ile Met Thr His Ser Asn Leu
355 360 365
Val Glu Ile Leu Met Asp Val Asn Gln Phe Ala Thr Val Phe Ser Ser
370 375 380
Ile Val Ser Arg Ala Ser Thr His Glu Val Leu Ser Thr Gly Val Ala
385 390 395 400
Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Ser Met Glu Phe Gln Val
405 410 415
Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys
420 425 430
Lys Asn Asn Ser Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp
435 440 445
Ser Leu Arg Pro Ser Pro Val Gln Lys Cys Arg Arg Arg Pro Ser Gly
450 455 460
Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val
465 470 475 480
Glu His Val Glu Val Asp Asp Ser Ser Val His Asn Ile Tyr Lys Pro
485 490 495
Leu Val Asn Ser Gly Leu Ala Phe Gly Ala Lys Arg Trp Val Gly Thr
500 505 510
Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Ser Asn Ile
515 520 525
Pro Asn Gly Asp Leu Gly Val Ile Thr Ser Val Glu Gly Arg Lys Ser
530 535 540
Met Leu Lys Leu Ala Glu Arg Met Val Ala Ser Phe Cys Gly Gly Val
545 550 555 560
Thr Ala Ser Val Ala His Gln Trp Thr Thr Leu Ser Gly Ser Gly Ala
565 570 575
Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg
580 585 590
Pro Pro Gly Ile Val Leu Asn Ala Ala Thr Ser Phe Trp Leu Pro Val
595 600 605
Pro Pro Ala Ala Val Phe Asp Phe Leu Arg Asp Glu Thr Ser Arg Ser
610 615 620
Glu Trp Asp Ile Leu Ser Asn Gly Gly Ala Val Gln Glu Met Ala His
625 630 635 640
Ile Ala Asn Gly Arg Asp His Gly Asn Ser Val Ser Leu Leu Arg Val
645 650 655
Asn Ser Ala Asn Ser Asn Gln Ser Asn Met Leu Ile Leu Gln Glu Ser
660 665 670
Cys Thr Asp Ala Ser Gly Ser Tyr Val Val Tyr Ala Pro Val Asp Ile
675 680 685
Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala
690 695 700
Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ser Gly Asn
705 710 715 720
Ala Gln Ala Ala Val Gly Glu Asn Gly Ser Gly Ser Gly Gly Gly Ser
725 730 735
Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala
740 745 750
Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys
755 760 765
Thr Val Glu Arg Ile Lys Ala Ala Val Cys Arg Asp Ser Asn Pro Gln
770 775 780
<210> 476
<211> 2415
<212> DNA
<213> Oryza sativa
<400> 476
atgagctttg ggggcctctt tgacggcggc ggcgggggag gcatgcagtt ccctttcgcc 60
agtggcttcg cgtcctcgcc ggcgctctcc ctcgcgctgg acaacgccgg cggtggcatc 120
ggcgggcgga tgctcggcgg cggcgctggc gctggttcta gcgcgggcgg cgcgatgacg 180
agggacactg aggcggagaa cgacagccgg tcgggaagcg accatctcga cgccatctcg 240
gccgccggcg aggacgacgt cgaggacgcc gagcccagca actcccgcaa gaggaagaag 300
cgataccacc gccacacgcc gcagcagatc caagagctcg aagcgctgtt caaggagtgc 360
ccccatccgg acgagaagca gcgcgccgag ctcagcagga ggctctccct cgatgcgcgg 420
caggtcaagt tctggttcca gaatcgccgc acgcagatga agacgcaact ggagcggcac 480
gagaacgcgc ttctcaagca ggagaacgac aagctgcgcg ccgagaacat gacgatccgg 540
gaggcgatgc gcagcccaat gtgcggcagc tgcgggagcc ccgccatgct cggggaggtg 600
tccctagagg agcagcacct gcgcatcgag aatgcgcgcc tcaaggacga gctcaaccgc 660
gtgtgcgccc tcgccaccaa gttcctaggc aagcccatct ccctcctgtc gccgccgccc 720
ttgctgcagc cgcacctctc gctgcctatg cctaactcgt cgctggagct agcgatcgga 780
ggcatcggtg gcttagggtc tctcggtaca ctacccggct gtatgaatga gttcgccgga 840
ggcgtgtcga gcccgatggg cacggtgatc acgcctgcgc gcgcaaccgg ggctgctata 900
ccatcgctgg tgggtaacat cgacaggtcc gtgttcttag agcttgcaat cagcgcgatg 960
gacgaacttg tcaagatggc acagatggac gatccattgt gggttccggc actgcctggt 1020
tctcccagca aggaggtgct caactttgag gagtatcttc actccttcct accgtgcatt 1080
ggcatgaagc ctgccggcta cgtctctgag gcctcgaggg aatccggtct agtcatcatc 1140
gacaacagcc ttgcccttgt agagaccctc atggatgaga gacggtggtc tgacatgttc 1200
tcgtgcatga ttgctaaggc aacagtgctt gaggaggtgt ctaccggcat tgcaggaagc 1260
agaaatggcg cgttgctgct gatgaaggct gagctacagg tgctctcacc tctagtacca 1320
attagggagg ttacatttct ccggttttgt aagcagctgg ctgagggtgc atgggcagta 1380
gttgatgtgt ccattgatgg tttagtgaga gatcataatt ctggaacggc acccacaggt 1440
ggaaatgtga agtgtaggag ggtaccttcc ggctgtgtga tgcaagacac tcccaatggg 1500
tattgcaagg tcacatgggt tgagcatacg gaatacgatg aggcatcagt gcaccagctc 1560
taccgtccac tccttcggtc tggtctcgcc tttggcgcca ggcgttggct tgcgacgctg 1620
cagcgccaat gcgaatgcct tgccatcctc atgtcctctg ctacagtgac agcaaatgac 1680
tcgactgcta tatcgcaaga gggcaagcga agcatgctga agctggcacg ccggatgacg 1740
gagaacttct gtgctggggt gagcgcatcg tctgcacgtg aatggagcaa gctggatggt 1800
gcgaccggta gcatcgggga ggacgtgcgc gtgatggcac ggaagagcgt gagcgagcct 1860
ggagagccac cgggcgtggt gctgagcgcg gccacctcgg tgtgggtgcc cgtggctccg 1920
gagaagctct tcaacttcct gcgcgatgag cagctgcgtg cggagtggga catcctcagc 1980
aatggaggcc ccatgcagga gatgacccag atcgccaagg ggcagcggga tgggaactcg 2040
gtttcactcc tcagggccag tgctgtgagt gccaaccaga gcagcatgct gatacttcag 2100
gagacgtgca ccgacgcttc tggctccatt gttgtgtacg ctccggtaga catcccggca 2160
atgcagcttg tcatgaatgg tggcgactcc acctatgttg ctctgcttcc atccggattc 2220
gccatcctgc ccgatgggcc tcgcatcggc gccaccgggt acgagacggg cggctctctg 2280
ctcaccgtgg cgttccagat tcttgtcaac aaccagccca ccgccaagct caccgtggaa 2340
tcggtcgaga ccgtgaacaa tctcatctcc tgcaccatca agaagatcaa gacggcgctg 2400
cagtgcgacg cctga 2415
<210> 477
<211> 804
<212> PRT
<213> Oryza sativa
<400> 477
Met Ser Phe Gly Gly Leu Phe Asp Gly Gly Gly Gly Gly Gly Met Gln
1 5 10 15
Phe Pro Phe Ala Ser Gly Phe Ala Ser Ser Pro Ala Leu Ser Leu Ala
20 25 30
Leu Asp Asn Ala Gly Gly Gly Ile Gly Gly Arg Met Leu Gly Gly Gly
35 40 45
Ala Gly Ala Gly Ser Ser Ala Gly Gly Ala Met Thr Arg Asp Thr Glu
50 55 60
Ala Glu Asn Asp Ser Arg Ser Gly Ser Asp His Leu Asp Ala Ile Ser
65 70 75 80
Ala Ala Gly Glu Asp Asp Val Glu Asp Ala Glu Pro Ser Asn Ser Arg
85 90 95
Lys Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln Gln Ile Gln Glu
100 105 110
Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp Glu Lys Gln Arg
115 120 125
Ala Glu Leu Ser Arg Arg Leu Ser Leu Asp Ala Arg Gln Val Lys Phe
130 135 140
Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu Arg His
145 150 155 160
Glu Asn Ala Leu Leu Lys Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn
165 170 175
Met Thr Ile Arg Glu Ala Met Arg Ser Pro Met Cys Gly Ser Cys Gly
180 185 190
Ser Pro Ala Met Leu Gly Glu Val Ser Leu Glu Glu Gln His Leu Arg
195 200 205
Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg Val Cys Ala Leu
210 215 220
Ala Thr Lys Phe Leu Gly Lys Pro Ile Ser Leu Leu Ser Pro Pro Pro
225 230 235 240
Leu Leu Gln Pro His Leu Ser Leu Pro Met Pro Asn Ser Ser Leu Glu
245 250 255
Leu Ala Ile Gly Gly Ile Gly Gly Leu Gly Ser Leu Gly Thr Leu Pro
260 265 270
Gly Cys Met Asn Glu Phe Ala Gly Gly Val Ser Ser Pro Met Gly Thr
275 280 285
Val Ile Thr Pro Ala Arg Ala Thr Gly Ala Ala Ile Pro Ser Leu Val
290 295 300
Gly Asn Ile Asp Arg Ser Val Phe Leu Glu Leu Ala Ile Ser Ala Met
305 310 315 320
Asp Glu Leu Val Lys Met Ala Gln Met Asp Asp Pro Leu Trp Val Pro
325 330 335
Ala Leu Pro Gly Ser Pro Ser Lys Glu Val Leu Asn Phe Glu Glu Tyr
340 345 350
Leu His Ser Phe Leu Pro Cys Ile Gly Met Lys Pro Ala Gly Tyr Val
355 360 365
Ser Glu Ala Ser Arg Glu Ser Gly Leu Val Ile Ile Asp Asn Ser Leu
370 375 380
Ala Leu Val Glu Thr Leu Met Asp Glu Arg Arg Trp Ser Asp Met Phe
385 390 395 400
Ser Cys Met Ile Ala Lys Ala Thr Val Leu Glu Glu Val Ser Thr Gly
405 410 415
Ile Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Met Lys Ala Glu Leu
420 425 430
Gln Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Thr Phe Leu Arg
435 440 445
Phe Cys Lys Gln Leu Ala Glu Gly Ala Trp Ala Val Val Asp Val Ser
450 455 460
Ile Asp Gly Leu Val Arg Asp His Asn Ser Gly Thr Ala Pro Thr Gly
465 470 475 480
Gly Asn Val Lys Cys Arg Arg Val Pro Ser Gly Cys Val Met Gln Asp
485 490 495
Thr Pro Asn Gly Tyr Cys Lys Val Thr Trp Val Glu His Thr Glu Tyr
500 505 510
Asp Glu Ala Ser Val His Gln Leu Tyr Arg Pro Leu Leu Arg Ser Gly
515 520 525
Leu Ala Phe Gly Ala Arg Arg Trp Leu Ala Thr Leu Gln Arg Gln Cys
530 535 540
Glu Cys Leu Ala Ile Leu Met Ser Ser Ala Thr Val Thr Ala Asn Asp
545 550 555 560
Ser Thr Ala Ile Ser Gln Glu Gly Lys Arg Ser Met Leu Lys Leu Ala
565 570 575
Arg Arg Met Thr Glu Asn Phe Cys Ala Gly Val Ser Ala Ser Ser Ala
580 585 590
Arg Glu Trp Ser Lys Leu Asp Gly Ala Thr Gly Ser Ile Gly Glu Asp
595 600 605
Val Arg Val Met Ala Arg Lys Ser Val Ser Glu Pro Gly Glu Pro Pro
610 615 620
Gly Val Val Leu Ser Ala Ala Thr Ser Val Trp Val Pro Val Ala Pro
625 630 635 640
Glu Lys Leu Phe Asn Phe Leu Arg Asp Glu Gln Leu Arg Ala Glu Trp
645 650 655
Asp Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Thr Gln Ile Ala
660 665 670
Lys Gly Gln Arg Asp Gly Asn Ser Val Ser Leu Leu Arg Ala Ser Ala
675 680 685
Val Ser Ala Asn Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Cys Thr
690 695 700
Asp Ala Ser Gly Ser Ile Val Val Tyr Ala Pro Val Asp Ile Pro Ala
705 710 715 720
Met Gln Leu Val Met Asn Gly Gly Asp Ser Thr Tyr Val Ala Leu Leu
725 730 735
Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Arg Ile Gly Ala Thr
740 745 750
Gly Tyr Glu Thr Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu
755 760 765
Val Asn Asn Gln Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr
770 775 780
Val Asn Asn Leu Ile Ser Cys Thr Ile Lys Lys Ile Lys Thr Ala Leu
785 790 795 800
Gln Cys Asp Ala
<210> 478
<211> 2106
<212> DNA
<213> Oryza sativa
<400> 478
atgcagttcc cgttctccgg cgctggcccg ggcgtcttca cgtcatcgcc ggcgctctcc 60
ctcgcgctgg cggacgcggt ggcaggccgg aacagcggcg gcggtgggaa gatggttacc 120
gcggcccatg gcggcgtcgg cggaggagga ggaggaggac gcgcgaaggc gagggacgcg 180
ttggaggtgg agaacgagat gagccggtcc gggagcgacc acctcgacgt cgtctcttgc 240
ggcgacgcgg gcggcggcgg cggcgacgac gacgatgacg aggacgccga gcacggcaac 300
ccgcccaagc gcaagaagcg gtaccaccgc cacacgccgc agcagatcca agagctggaa 360
gcgatgttca aggaatgccc ccacccagac gagaagcagc gcgccgagct gagcaagcgg 420
ctcggcctcg aaccccggca ggtcaagttc tggttccaga atcggcgaac gcagatgaag 480
atgcaactgg agcgacacga gaactcgctg ctgaagcagg agaacgataa gctgcggtcc 540
gagaacctgt caatccggga ggccacgagc aacgcggtgt gcgttggctg cggcggcccg 600
gcgatgctcg gggaggtgtc cctggaggag caccaccttc gcgtcgagaa cgcgaggctc 660
aaggacgagc tcagccgagt gtgcgcgctc gccgccaagt tccttggcaa gtccatctct 720
gtcatggcgc caccgcagat gcatcagcct catcctgtgc caggctcgtc gctggagctt 780
gcggttgggg gtatcggttc gatgccatca gccacgatgc ccatctcgac gatcactgat 840
tttgctggcg ccatgtccag ttcaatgggc acggtgatca cgcccatgaa gtctgaggct 900
gaaccatcgg caatggctgg cattgacaag tccttgttct tggagctagc aatgagtgca 960
atggatgagc tagtcaagat ggctcagatg ggggatccgc tatggattcc aggtgcctcc 1020
gtaccttcct cgccggcaaa ggagagtcta aacttcgagg agtacctaaa caccttccca 1080
ccttgcatcg gggtgaagcc tgaagggtat gtatcagagg catctagaga atctggcatt 1140
gtcatcattg acgatggcgc cgcgcttgtg gagaccctca tggatgagcg acggtggtcc 1200
gatatgttct catgcatgat tgccaaggca tcaaccactg aggagatttc tactggtgtt 1260
gctgggagta gaaatggtgc attgcttctt gtgagtgatg aacattctgt tatgcaggca 1320
gagctacagg tgctttctcc tcttgtgcct attagagagg tgaagtttct caggttctcc 1380
aaacagctgg ctgatggtgt atgggctgta gtggacgttt cggctgatga attgatgagg 1440
gatcagggca ttacttctgc atcctcgact gcaaacatga actgccgaag gctgccttct 1500
ggttgtgtgc tgcaggacac tccaaatggg tttgttaagg tcacatgggt tgaacataca 1560
gaatatgatg aggcatctgt gcacccgctc taccggcctc ttctccggtc tggtcttgcc 1620
cttggtgcag ggcgatggat cgcgacatta cagcggcagt gcgaatgctt ggcccttctc 1680
atgtcttcta ttgcattgcc agagaacgac tcatcagcta tccatcctga aggtaaacgg 1740
agcatgttga agttggcaag gaggatgacg gacaacttct gtgcaggggt gagcacatca 1800
tctacccgtg aatggagcaa actggttgga ttgacaggca acattgggga ggatgtgcat 1860
gtaatggcgc ggaagagtgt ggatgaacct ggaacgccgc caggtgtggt gcttagtgct 1920
gctacatctg tgtggatgcc tgtgatgcct gaacggctct tcaacttctt gcacaacaag 1980
gggctgcgtg ctgaatggga tatcctcagc aatggtggcc ctatgcagga ggtgacaagc 2040
attgccaagg ggcaacagaa tggcaatacc gtatgtctac tgaaggctag tgtgagtatt 2100
agctaa 2106
<210> 479
<211> 701
<212> PRT
<213> Oryza sativa
<400> 479
Met Gln Phe Pro Phe Ser Gly Ala Gly Pro Gly Val Phe Thr Ser Ser
1 5 10 15
Pro Ala Leu Ser Leu Ala Leu Ala Asp Ala Val Ala Gly Arg Asn Ser
20 25 30
Gly Gly Gly Gly Lys Met Val Thr Ala Ala His Gly Gly Val Gly Gly
35 40 45
Gly Gly Gly Gly Gly Arg Ala Lys Ala Arg Asp Ala Leu Glu Val Glu
50 55 60
Asn Glu Met Ser Arg Ser Gly Ser Asp His Leu Asp Val Val Ser Cys
65 70 75 80
Gly Asp Ala Gly Gly Gly Gly Gly Asp Asp Asp Asp Asp Glu Asp Ala
85 90 95
Glu His Gly Asn Pro Pro Lys Arg Lys Lys Arg Tyr His Arg His Thr
100 105 110
Pro Gln Gln Ile Gln Glu Leu Glu Ala Met Phe Lys Glu Cys Pro His
115 120 125
Pro Asp Glu Lys Gln Arg Ala Glu Leu Ser Lys Arg Leu Gly Leu Glu
130 135 140
Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
145 150 155 160
Met Gln Leu Glu Arg His Glu Asn Ser Leu Leu Lys Gln Glu Asn Asp
165 170 175
Lys Leu Arg Ser Glu Asn Leu Ser Ile Arg Glu Ala Thr Ser Asn Ala
180 185 190
Val Cys Val Gly Cys Gly Gly Pro Ala Met Leu Gly Glu Val Ser Leu
195 200 205
Glu Glu His His Leu Arg Val Glu Asn Ala Arg Leu Lys Asp Glu Leu
210 215 220
Ser Arg Val Cys Ala Leu Ala Ala Lys Phe Leu Gly Lys Ser Ile Ser
225 230 235 240
Val Met Ala Pro Pro Gln Met His Gln Pro His Pro Val Pro Gly Ser
245 250 255
Ser Leu Glu Leu Ala Val Gly Gly Ile Gly Ser Met Pro Ser Ala Thr
260 265 270
Met Pro Ile Ser Thr Ile Thr Asp Phe Ala Gly Ala Met Ser Ser Ser
275 280 285
Met Gly Thr Val Ile Thr Pro Met Lys Ser Glu Ala Glu Pro Ser Ala
290 295 300
Met Ala Gly Ile Asp Lys Ser Leu Phe Leu Glu Leu Ala Met Ser Ala
305 310 315 320
Met Asp Glu Leu Val Lys Met Ala Gln Met Gly Asp Pro Leu Trp Ile
325 330 335
Pro Gly Ala Ser Val Pro Ser Ser Pro Ala Lys Glu Ser Leu Asn Phe
340 345 350
Glu Glu Tyr Leu Asn Thr Phe Pro Pro Cys Ile Gly Val Lys Pro Glu
355 360 365
Gly Tyr Val Ser Glu Ala Ser Arg Glu Ser Gly Ile Val Ile Ile Asp
370 375 380
Asp Gly Ala Ala Leu Val Glu Thr Leu Met Asp Glu Arg Arg Trp Ser
385 390 395 400
Asp Met Phe Ser Cys Met Ile Ala Lys Ala Ser Thr Thr Glu Glu Ile
405 410 415
Ser Thr Gly Val Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Val Ser
420 425 430
Asp Glu His Ser Val Met Gln Ala Glu Leu Gln Val Leu Ser Pro Leu
435 440 445
Val Pro Ile Arg Glu Val Lys Phe Leu Arg Phe Ser Lys Gln Leu Ala
450 455 460
Asp Gly Val Trp Ala Val Val Asp Val Ser Ala Asp Glu Leu Met Arg
465 470 475 480
Asp Gln Gly Ile Thr Ser Ala Ser Ser Thr Ala Asn Met Asn Cys Arg
485 490 495
Arg Leu Pro Ser Gly Cys Val Leu Gln Asp Thr Pro Asn Gly Phe Val
500 505 510
Lys Val Thr Trp Val Glu His Thr Glu Tyr Asp Glu Ala Ser Val His
515 520 525
Pro Leu Tyr Arg Pro Leu Leu Arg Ser Gly Leu Ala Leu Gly Ala Gly
530 535 540
Arg Trp Ile Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu Ala Leu Leu
545 550 555 560
Met Ser Ser Ile Ala Leu Pro Glu Asn Asp Ser Ser Ala Ile His Pro
565 570 575
Glu Gly Lys Arg Ser Met Leu Lys Leu Ala Arg Arg Met Thr Asp Asn
580 585 590
Phe Cys Ala Gly Val Ser Thr Ser Ser Thr Arg Glu Trp Ser Lys Leu
595 600 605
Val Gly Leu Thr Gly Asn Ile Gly Glu Asp Val His Val Met Ala Arg
610 615 620
Lys Ser Val Asp Glu Pro Gly Thr Pro Pro Gly Val Val Leu Ser Ala
625 630 635 640
Ala Thr Ser Val Trp Met Pro Val Met Pro Glu Arg Leu Phe Asn Phe
645 650 655
Leu His Asn Lys Gly Leu Arg Ala Glu Trp Asp Ile Leu Ser Asn Gly
660 665 670
Gly Pro Met Gln Glu Val Thr Ser Ile Ala Lys Gly Gln Gln Asn Gly
675 680 685
Asn Thr Val Cys Leu Leu Lys Ala Ser Val Ser Ile Ser
690 695 700
<210> 480
<211> 2616
<212> DNA
<213> Oryza sativa
<400> 480
atgagcttcg gtggcatgtt cgatggcgcc ggctccggcg tcttctccta cgacgccggc 60
ggcggcggcg gcggcggcgg agtacacaac tcccgcctcc tccctacgcc gcccgtcccc 120
aagcccggcg gcgggttcgc cgctcccggc ctctctctcg gcctgcaaac tatggacggt 180
agccagctcg gcgacgtgaa ccggtcgctt gccatgatgg gcaacggcgg gagcggcagc 240
ggcggcgacg gcgactcgct gggacgcggc cgggaggaag agaacgacag ccgctccggc 300
agcgacaacc tggacggcgc ctccggcgac gaactcgacc cggacaacag caacccgcgc 360
aagaagaaga agcgttatca ccgccacacc ccgcagcaaa tccaagaact cgaagccgtg 420
ttcaaggagt gtccacatcc tgacgagaag caacggatgg agctcagccg gcggctcaac 480
ctcgagagcc gccaggtcaa gttctggttc cagaatcgcc gcacccagat gaagacgcag 540
atcgagcggc atgagaacgc gctgctgcgg caggagaacg acaagctgag ggcggagaac 600
atgacgatcc gggaggcgat gaggaacccg atgtgcgcga gctgcggcgg cgcggcggtg 660
ctcggcgagg tgtcgctgga ggagcagcac ctgcgcatcg agaacgcgcg gctcaaggac 720
gagctcgacc gcgtctgcgc gctcgccggc aagttcctcg gccggccaat ctcgagcatc 780
tcctccccgg gcccgccgtc gctgcaggcg tgctccggcc tcgagctcgg cgtcggcagc 840
aacggcgggt tcgggctcgg cgcgctcggg gcctcggcgg cgatgcagtc catccccgac 900
ctgatgggcg gctcctccgg cctgacgggg gggcccgtgg gctccgccgc catgcgccta 960
cccgcgggca ttggcggcct cgacggcgcc atgcacgccg cggcggccga cggcggcgcc 1020
atcgaccgcg ccgtgctcct ggagctcgcc ctcgcggcca tggacgagct cgtcaaggtg 1080
gcgcagatgg acgagccgct ctggctcccc agcctcgacg gcgggttcga gacgctcaac 1140
tacgacgagt accaccgcgc gttcgccagg gtggtcggcc agtgccccgc cggctacgtc 1200
tccgaggcga cgcgcgagtc cggcatcgcc atcatcagca gcgtcgacct cgtcgacagc 1260
ctcatggacg cgccacggtg gtcggagatg ttcccgtgcg tggtggcgag agcgagcacc 1320
acggacatca tctccagcgg catgggcggc acgcgcagcg ggtcaattca actgatgcac 1380
gcggagctgc aggtgctgtc gccgctggtg ccgatacggg aggtggtgtt cctgcgtttc 1440
tgcaagcagc acgccgaggg cctctgggcg gtggtcgacg tctcggtcga cgccgtcctc 1500
cgccccgacc agaacggcgg cggcgggtcg tcgtcgtcgt cgtacatggg ctgccgcctc 1560
ctccccaccg gctgcatcgt gcaggacatg aacaatggct actccaaggt cacgtgggtg 1620
gttcacgcgg agtacgacga gacggcggcg caccagctct accggccgct gctccgctcc 1680
ggccaggccc tcggcgcccg ccgctggctc gcctcgctcc agcgacagtg ccagtatctc 1740
gccatcctct gctccaactc cctccccgcc cgcgaccacg ctgcgataac gccggtgggg 1800
aggaggagca tgctgaagct ggcgcagcgg atgacggaca acttctgcgc gggggtgtgc 1860
gcgtcggcgg cgcagaagtg gcggcgcctg gacgagtggc gcggcgaggg tgggggcggc 1920
ggcggtggcg gcggcgggga cggggaggac aaggtgcgga tgatggcgcg gcacagcgtg 1980
ggcgcgccgg gggagccgcc gggcgtcgtg ctgagcgcca ccacgtcggt gcggctcccc 2040
ggcacgctgc cgcagcgcgt gttcgactac ctccgcgacg agcagcggcg cggcgactgg 2100
gacatccttg ccaacggcga ggccatgcag gagatggacc acatcgccaa gggccagcac 2160
cacggcaatg ccgtctccct cctccgtcca aatgccacaa gcgggaacca gaacaacatg 2220
ctgatcctcc aggagacgtg caccgactca tcgggctccc tcgtcgtcta cgctccggtg 2280
gacgtgcagt cgatgcacgt cgtcatgaac ggcggcgact ccgcctacgt ctccctcctc 2340
ccctccggct tcgccatcct ccccgacggc cacaacaatg gcgcctcgcc gtctccggca 2400
gaggtcggca gcggcgcctc gccgaactcc gccgccggtg gcggtggcgg tagcaacaac 2460
accgggtcgc tggtgacggt ggcgttccag atactcgtca acaacctgcc gacggcgaag 2520
ctcaccgtgg agtccgtcga caccgtcagc aacctcctct cctgcaccat ccagaagatc 2580
aagtcggcac tgcaggccag catcatctca ccatag 2616
<210> 481
<211> 871
<212> PRT
<213> Oryza sativa
<400> 481
Met Ser Phe Gly Gly Met Phe Asp Gly Ala Gly Ser Gly Val Phe Ser
1 5 10 15
Tyr Asp Ala Gly Gly Gly Gly Gly Gly Gly Gly Val His Asn Ser Arg
20 25 30
Leu Leu Pro Thr Pro Pro Val Pro Lys Pro Gly Gly Gly Phe Ala Ala
35 40 45
Pro Gly Leu Ser Leu Gly Leu Gln Thr Met Asp Gly Ser Gln Leu Gly
50 55 60
Asp Val Asn Arg Ser Leu Ala Met Met Gly Asn Gly Gly Ser Gly Ser
65 70 75 80
Gly Gly Asp Gly Asp Ser Leu Gly Arg Gly Arg Glu Glu Glu Asn Asp
85 90 95
Ser Arg Ser Gly Ser Asp Asn Leu Asp Gly Ala Ser Gly Asp Glu Leu
100 105 110
Asp Pro Asp Asn Ser Asn Pro Arg Lys Lys Lys Lys Arg Tyr His Arg
115 120 125
His Thr Pro Gln Gln Ile Gln Glu Leu Glu Ala Val Phe Lys Glu Cys
130 135 140
Pro His Pro Asp Glu Lys Gln Arg Met Glu Leu Ser Arg Arg Leu Asn
145 150 155 160
Leu Glu Ser Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln
165 170 175
Met Lys Thr Gln Ile Glu Arg His Glu Asn Ala Leu Leu Arg Gln Glu
180 185 190
Asn Asp Lys Leu Arg Ala Glu Asn Met Thr Ile Arg Glu Ala Met Arg
195 200 205
Asn Pro Met Cys Ala Ser Cys Gly Gly Ala Ala Val Leu Gly Glu Val
210 215 220
Ser Leu Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp
225 230 235 240
Glu Leu Asp Arg Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro
245 250 255
Ile Ser Ser Ile Ser Ser Pro Gly Pro Pro Ser Leu Gln Ala Cys Ser
260 265 270
Gly Leu Glu Leu Gly Val Gly Ser Asn Gly Gly Phe Gly Leu Gly Ala
275 280 285
Leu Gly Ala Ser Ala Ala Met Gln Ser Ile Pro Asp Leu Met Gly Gly
290 295 300
Ser Ser Gly Leu Thr Gly Gly Pro Val Gly Ser Ala Ala Met Arg Leu
305 310 315 320
Pro Ala Gly Ile Gly Gly Leu Asp Gly Ala Met His Ala Ala Ala Ala
325 330 335
Asp Gly Gly Ala Ile Asp Arg Ala Val Leu Leu Glu Leu Ala Leu Ala
340 345 350
Ala Met Asp Glu Leu Val Lys Val Ala Gln Met Asp Glu Pro Leu Trp
355 360 365
Leu Pro Ser Leu Asp Gly Gly Phe Glu Thr Leu Asn Tyr Asp Glu Tyr
370 375 380
His Arg Ala Phe Ala Arg Val Val Gly Gln Cys Pro Ala Gly Tyr Val
385 390 395 400
Ser Glu Ala Thr Arg Glu Ser Gly Ile Ala Ile Ile Ser Ser Val Asp
405 410 415
Leu Val Asp Ser Leu Met Asp Ala Pro Arg Trp Ser Glu Met Phe Pro
420 425 430
Cys Val Val Ala Arg Ala Ser Thr Thr Asp Ile Ile Ser Ser Gly Met
435 440 445
Gly Gly Thr Arg Ser Gly Ser Ile Gln Leu Met His Ala Glu Leu Gln
450 455 460
Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Val Phe Leu Arg Phe
465 470 475 480
Cys Lys Gln His Ala Glu Gly Leu Trp Ala Val Val Asp Val Ser Val
485 490 495
Asp Ala Val Leu Arg Pro Asp Gln Asn Gly Gly Gly Gly Ser Ser Ser
500 505 510
Ser Ser Tyr Met Gly Cys Arg Leu Leu Pro Thr Gly Cys Ile Val Gln
515 520 525
Asp Met Asn Asn Gly Tyr Ser Lys Val Thr Trp Val Val His Ala Glu
530 535 540
Tyr Asp Glu Thr Ala Ala His Gln Leu Tyr Arg Pro Leu Leu Arg Ser
545 550 555 560
Gly Gln Ala Leu Gly Ala Arg Arg Trp Leu Ala Ser Leu Gln Arg Gln
565 570 575
Cys Gln Tyr Leu Ala Ile Leu Cys Ser Asn Ser Leu Pro Ala Arg Asp
580 585 590
His Ala Ala Ile Thr Pro Val Gly Arg Arg Ser Met Leu Lys Leu Ala
595 600 605
Gln Arg Met Thr Asp Asn Phe Cys Ala Gly Val Cys Ala Ser Ala Ala
610 615 620
Gln Lys Trp Arg Arg Leu Asp Glu Trp Arg Gly Glu Gly Gly Gly Gly
625 630 635 640
Gly Gly Gly Gly Gly Gly Asp Gly Glu Asp Lys Val Arg Met Met Ala
645 650 655
Arg His Ser Val Gly Ala Pro Gly Glu Pro Pro Gly Val Val Leu Ser
660 665 670
Ala Thr Thr Ser Val Arg Leu Pro Gly Thr Leu Pro Gln Arg Val Phe
675 680 685
Asp Tyr Leu Arg Asp Glu Gln Arg Arg Gly Asp Trp Asp Ile Leu Ala
690 695 700
Asn Gly Glu Ala Met Gln Glu Met Asp His Ile Ala Lys Gly Gln His
705 710 715 720
His Gly Asn Ala Val Ser Leu Leu Arg Pro Asn Ala Thr Ser Gly Asn
725 730 735
Gln Asn Asn Met Leu Ile Leu Gln Glu Thr Cys Thr Asp Ser Ser Gly
740 745 750
Ser Leu Val Val Tyr Ala Pro Val Asp Val Gln Ser Met His Val Val
755 760 765
Met Asn Gly Gly Asp Ser Ala Tyr Val Ser Leu Leu Pro Ser Gly Phe
770 775 780
Ala Ile Leu Pro Asp Gly His Asn Asn Gly Ala Ser Pro Ser Pro Ala
785 790 795 800
Glu Val Gly Ser Gly Ala Ser Pro Asn Ser Ala Ala Gly Gly Gly Gly
805 810 815
Gly Ser Asn Asn Thr Gly Ser Leu Val Thr Val Ala Phe Gln Ile Leu
820 825 830
Val Asn Asn Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Asp Thr
835 840 845
Val Ser Asn Leu Leu Ser Cys Thr Ile Gln Lys Ile Lys Ser Ala Leu
850 855 860
Gln Ala Ser Ile Ile Ser Pro
865 870
<210> 482
<211> 2649
<212> DNA
<213> Oryza sativa
<400> 482
atgcgcagga tgttcgggga ctgccaggtc ctgtcgtcca tggccgccat ggccggggcc 60
gcctcctccg ccgacgcgct cttcgcctcg ccgctcatcc ccaaccccgc tctcgccggc 120
ttcatgtcct cctccgccgc catgcccttc caccacttct ccaacgccgc cgccacctta 180
atacctaagg aggaggggtt gatgggcggc ctccatgtgg ccaaggacga ggggatggac 240
ctcgagatgg acatggagct cagtggcggc tccggcagcg cccacctcga cggcctcctc 300
agcttcgccg acgtcgacga cgaccacaag ccgcagcaca gcggccatga ccagccgccc 360
gacgccgccc agcccagcgg cgccgcgggg ggcaacgcca agaagaagcg ctaccaccgc 420
cacacggcgc accagatcca gcagatggag gcgctgttca aggagtgccc gcatccggac 480
gacaagcagc ggctgaagct gagccaggaa ctgggcctca aacctcgcca ggtcaagttc 540
tggttccaga atcgccggac ccagatgaag gcgcagcagg acagggcgga caacgtgatt 600
ctgcgcgcgg agaacgagaa cctcaagagc gacaacttcc gcctccaggc cgccatccgc 660
aacgtcgtct gccccaactg cggccacgcc gccgtcctcg ccgacatgtc ctacgaggag 720
cagcagctcc gcatcgagaa cgccaggctc aaagacgagc ttgaccgctt ggcctgcatc 780
gccacccgct acggcggcgg cggcggacgg cagccggtgc tgtcgacgtc ggccctgagc 840
tgcatctcgg cgccgccgcc ggtcctcatg ccaccgctcg acctcgacat gaacgtctac 900
tcgcggcact tcgccgagca ggcgccggtc atgggctgcg gcgacctcat cccgccaccc 960
gtcgtgccgc agcacgatgg cgcggcggcg tacatgggcg ccatgatggc gcccgtgcag 1020
gagcaggaca agcagctggt ggtcgacctc gccgccacgg cggcggacca gctcgccagg 1080
atgtgccgcg ccggcgagcc gctgtgggtg cggcagcgtg gcgcggaggt gatggccgtg 1140
gaggagcacg cgcggatgtt cagctggccg gtggacggcg cgaagcaggg agacggcggc 1200
gcggtggcga gggcggaggg gacgcgtgac aacgcggtgg tcatcatgaa cagcatcaac 1260
ttggtggacg ccttcctcga tgcgaacaaa tggatggagc tgttcccgtc gattgtttgc 1320
aaggcaagaa caatccagat cataaaccac ggagctgcgt ctggtcacct cggcagtgga 1380
actctcctct tgatgcaagc agaggtgcag ttcttgtcgc ctctggtggc ggcgcgcgag 1440
gtggtgttct tccgttactg cgtgcacaac gccgacgagg ggagctgggc gatcgtggat 1500
ttcccggcgg aagggtttga ggaggggctc ctccaagcct cggtggtcag gtgccggcgg 1560
cggccgtccg gctgcatcat ccaggacatg cccaatggat actccagggt ggtgtgggtg 1620
gagcacatgg agatggtcgg ggaggagaag ccgctgcagc cggtgttcag ggactacgtc 1680
gccagcggcg ccgccttcgg ggccacgcgc tggctctcca tcctccagcg ccagtgcgag 1740
cgcctcgcca gtgagctcgc ccgtaacatc gccgacctcg gagtgatccg cacccctgag 1800
gcaagaacaa atatgatgaa gctgtcgcag cggatgatca ccactttctg tgctaacatc 1860
agtgcttctg gaacccaatc ttggacggcc ctctcggatt caacccagga cactatcagg 1920
gttacaactc ggaagaacac tgagcccgga cagcccagcg gtgtcatcct caccgctgtc 1980
tccacaagct ggcttccttt tacccatcag caggtgtttg agcttcttgc agatgaacaa 2040
cagcgctgcc agcttgagat tttgtcaaac ggcggctccc ttcatgaggt ggcacatatt 2100
gcaaatggat cacatccaag gaattgcatc tctcttcttc gcattaacgc tgcaagcaac 2160
tcgtcacaga atgtggagct cctgctgcag gagagcagca cccaccctga tggtgggagc 2220
ctggtggtgt tcgcgacggt ggacgtggac gcaattcagg tgacgatgag cggcgaggat 2280
ccttcctaca tccctctcct ccccctgggc ttcgccatct tccctgccac cagcccatca 2340
cctgctgctg cacccaccat cagctcaagc accaccacca ccactggcaa tggcaatggc 2400
gaaaccagta gcactcctcc aagaaacagc agcagcaaca acaacaatgc agatgagctg 2460
ctgcctccca atggctgcct cctcaccgtc ggcatgcagg tgctggccag cgccgtacct 2520
tctgccaagc tcaacctctc gagtgtcact gcgatcaaca gccatgtctg caacgccatt 2580
caccagatca cagctgcact caaaagttca gcaggtggtg ctgggggtga gccggcgtcc 2640
gatcagtag 2649
<210> 483
<211> 882
<212> PRT
<213> Oryza sativa
<400> 483
Met Arg Arg Met Phe Gly Asp Cys Gln Val Leu Ser Ser Met Ala Ala
1 5 10 15
Met Ala Gly Ala Ala Ser Ser Ala Asp Ala Leu Phe Ala Ser Pro Leu
20 25 30
Ile Pro Asn Pro Ala Leu Ala Gly Phe Met Ser Ser Ser Ala Ala Met
35 40 45
Pro Phe His His Phe Ser Asn Ala Ala Ala Thr Leu Ile Pro Lys Glu
50 55 60
Glu Gly Leu Met Gly Gly Leu His Val Ala Lys Asp Glu Gly Met Asp
65 70 75 80
Leu Glu Met Asp Met Glu Leu Ser Gly Gly Ser Gly Ser Ala His Leu
85 90 95
Asp Gly Leu Leu Ser Phe Ala Asp Val Asp Asp Asp His Lys Pro Gln
100 105 110
His Ser Gly His Asp Gln Pro Pro Asp Ala Ala Gln Pro Ser Gly Ala
115 120 125
Ala Gly Gly Asn Ala Lys Lys Lys Arg Tyr His Arg His Thr Ala His
130 135 140
Gln Ile Gln Gln Met Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp
145 150 155 160
Asp Lys Gln Arg Leu Lys Leu Ser Gln Glu Leu Gly Leu Lys Pro Arg
165 170 175
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Ala Gln
180 185 190
Gln Asp Arg Ala Asp Asn Val Ile Leu Arg Ala Glu Asn Glu Asn Leu
195 200 205
Lys Ser Asp Asn Phe Arg Leu Gln Ala Ala Ile Arg Asn Val Val Cys
210 215 220
Pro Asn Cys Gly His Ala Ala Val Leu Ala Asp Met Ser Tyr Glu Glu
225 230 235 240
Gln Gln Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
245 250 255
Leu Ala Cys Ile Ala Thr Arg Tyr Gly Gly Gly Gly Gly Arg Gln Pro
260 265 270
Val Leu Ser Thr Ser Ala Leu Ser Cys Ile Ser Ala Pro Pro Pro Val
275 280 285
Leu Met Pro Pro Leu Asp Leu Asp Met Asn Val Tyr Ser Arg His Phe
290 295 300
Ala Glu Gln Ala Pro Val Met Gly Cys Gly Asp Leu Ile Pro Pro Pro
305 310 315 320
Val Val Pro Gln His Asp Gly Ala Ala Ala Tyr Met Gly Ala Met Met
325 330 335
Ala Pro Val Gln Glu Gln Asp Lys Gln Leu Val Val Asp Leu Ala Ala
340 345 350
Thr Ala Ala Asp Gln Leu Ala Arg Met Cys Arg Ala Gly Glu Pro Leu
355 360 365
Trp Val Arg Gln Arg Gly Ala Glu Val Met Ala Val Glu Glu His Ala
370 375 380
Arg Met Phe Ser Trp Pro Val Asp Gly Ala Lys Gln Gly Asp Gly Gly
385 390 395 400
Ala Val Ala Arg Ala Glu Gly Thr Arg Asp Asn Ala Val Val Ile Met
405 410 415
Asn Ser Ile Asn Leu Val Asp Ala Phe Leu Asp Ala Asn Lys Trp Met
420 425 430
Glu Leu Phe Pro Ser Ile Val Cys Lys Ala Arg Thr Ile Gln Ile Ile
435 440 445
Asn His Gly Ala Ala Ser Gly His Leu Gly Ser Gly Thr Leu Leu Leu
450 455 460
Met Gln Ala Glu Val Gln Phe Leu Ser Pro Leu Val Ala Ala Arg Glu
465 470 475 480
Val Val Phe Phe Arg Tyr Cys Val His Asn Ala Asp Glu Gly Ser Trp
485 490 495
Ala Ile Val Asp Phe Pro Ala Glu Gly Phe Glu Glu Gly Leu Leu Gln
500 505 510
Ala Ser Val Val Arg Cys Arg Arg Arg Pro Ser Gly Cys Ile Ile Gln
515 520 525
Asp Met Pro Asn Gly Tyr Ser Arg Val Val Trp Val Glu His Met Glu
530 535 540
Met Val Gly Glu Glu Lys Pro Leu Gln Pro Val Phe Arg Asp Tyr Val
545 550 555 560
Ala Ser Gly Ala Ala Phe Gly Ala Thr Arg Trp Leu Ser Ile Leu Gln
565 570 575
Arg Gln Cys Glu Arg Leu Ala Ser Glu Leu Ala Arg Asn Ile Ala Asp
580 585 590
Leu Gly Val Ile Arg Thr Pro Glu Ala Arg Thr Asn Met Met Lys Leu
595 600 605
Ser Gln Arg Met Ile Thr Thr Phe Cys Ala Asn Ile Ser Ala Ser Gly
610 615 620
Thr Gln Ser Trp Thr Ala Leu Ser Asp Ser Thr Gln Asp Thr Ile Arg
625 630 635 640
Val Thr Thr Arg Lys Asn Thr Glu Pro Gly Gln Pro Ser Gly Val Ile
645 650 655
Leu Thr Ala Val Ser Thr Ser Trp Leu Pro Phe Thr His Gln Gln Val
660 665 670
Phe Glu Leu Leu Ala Asp Glu Gln Gln Arg Cys Gln Leu Glu Ile Leu
675 680 685
Ser Asn Gly Gly Ser Leu His Glu Val Ala His Ile Ala Asn Gly Ser
690 695 700
His Pro Arg Asn Cys Ile Ser Leu Leu Arg Ile Asn Ala Ala Ser Asn
705 710 715 720
Ser Ser Gln Asn Val Glu Leu Leu Leu Gln Glu Ser Ser Thr His Pro
725 730 735
Asp Gly Gly Ser Leu Val Val Phe Ala Thr Val Asp Val Asp Ala Ile
740 745 750
Gln Val Thr Met Ser Gly Glu Asp Pro Ser Tyr Ile Pro Leu Leu Pro
755 760 765
Leu Gly Phe Ala Ile Phe Pro Ala Thr Ser Pro Ser Pro Ala Ala Ala
770 775 780
Pro Thr Ile Ser Ser Ser Thr Thr Thr Thr Thr Gly Asn Gly Asn Gly
785 790 795 800
Glu Thr Ser Ser Thr Pro Pro Arg Asn Ser Ser Ser Asn Asn Asn Asn
805 810 815
Ala Asp Glu Leu Leu Pro Pro Asn Gly Cys Leu Leu Thr Val Gly Met
820 825 830
Gln Val Leu Ala Ser Ala Val Pro Ser Ala Lys Leu Asn Leu Ser Ser
835 840 845
Val Thr Ala Ile Asn Ser His Val Cys Asn Ala Ile His Gln Ile Thr
850 855 860
Ala Ala Leu Lys Ser Ser Ala Gly Gly Ala Gly Gly Glu Pro Ala Ser
865 870 875 880
Asp Gln
<210> 484
<211> 2355
<212> DNA
<213> Oryza sativa
<400> 484
atgatgatcc cggcgaggca tatgccgtcg atgatcggcc ggaacggcgc agcgtacgga 60
tcctcatcgg cactgtcact cagccagcca aacttgctgg ataatcacca gttccagcaa 120
gcgttccagc atcagcagca gcagcatcat ctccttgacc agatcccggc gacgacggcg 180
gagagcggcg acaacatgat ccgcagccgt gcgtccgacc ctctcggcgg cgacgagttc 240
gagagcaagt ccggcagcga gaacgtcgac ggcgtctccg tcgacgacca ggaccccaac 300
cagcggccgc gcaagaagcg ctaccaccgc cacacccagc atcagatcca ggagatggaa 360
gcattcttca aggaatgtcc acacccagat gataagcagc gcaaggagct gagccgggag 420
ctcggcctgg agcctctcca agtgaagttc tggttccaga acaagcgcac ccaaatgaag 480
aaccagcatg agaggcacga gaactcgcag ctgcggtcgg ataacgagaa gctccgggcc 540
gagaacatgc ggtacaagga ggccctgagc agcgcctcct gccccaattg cggcggcccc 600
gccgccctcg gcgagatgtc cttcgacgag caccacctcc gcatcgagaa cgcccgcctc 660
cgcgaagaga tcgataggat atcggcgatc gcggcgaagt acgtggggaa gccaatggtg 720
ccgttcccgg tgctgtcgaa cccgatggcg gcggcggcgt cgcgggcgcc gctggacctc 780
cccgtggcgc cgtacggcgt gccgggcgac atgttcggcg gcggtggcgc cggggagctg 840
ctgcgcgggg tgcagtcgga ggtcgacaag ccgatgatcg tggagctcgc cgtggcggcg 900
atggaggagc tggtccgcat ggcgcagctg gacgagccgc tctggagcgt cgcgccgccg 960
ctcgacgcca cggcggcggc gatggagacg ctcagcgagg aggagtacgc gcgcatgttc 1020
ccccgagggc tcggccccaa gcagtacggg ctcaggtcgg aggcgtcccg cgacagcgcc 1080
gtcgtcatca tgacgcacgc caacctcgtc gagatcctca tggacgcgaa tcagtacgcg 1140
gcagtgttct cgaacatcgt gtcgagggcc atcacgctgg aggtgctgtc caccggcgtc 1200
gcggggaact acaacggtgc attgcaagtg atgtcagtgg agtttcaggt gccatcgcca 1260
ctggtgccaa cgagagagag ctacttcgtg agatactgca agcagaacgc agacgggaca 1320
tgggccgtcg tcgacgtctc gctggacagc ctccgcccta gccccgtcct caaatgtcgc 1380
cgccgtccgt caggctgcct catccaagaa atgcccaatg gctactccaa ggtgacgtgg 1440
gtggagcatg tggaggtgga cgacaggtcg gtgcacaaca tctacaagct gctggtgaac 1500
tccgggctgg cgttcggcgc gcggcggtgg gtcggcacgc tggaccgcca gtgcgagcgc 1560
ctcgccagcg tcatggccag caacatcccc accagcgaca tcggcgtgat tacgagctcg 1620
gaggggagga agagcatgct gaagctggcg gagaggatgg tggtgagctt ctgcggcggc 1680
gtgacggcgt cggtggcgca tcagtggacg acgctgtccg gcagcggcgc cgaggacgtc 1740
cgcgtcatga cgaggaagag cgtcgacgac cccgggaggc cccccggcat cgtcctcaac 1800
gccgccacct ccttctggct ccccgtccct cccaagcgcg tcttcgactt cctccgcgac 1860
gaatcctctc gcagtgagtg ggacatcctc tccaatggcg gtatcgttca agaaatggcc 1920
cacatcgcca atggccggga tcagggcaac tgcgtctcac ttcttcgcgt caacagctcg 1980
aactcgaacc agagcaacat gctgatcctg caggagagct gcacggacgc gtcggggtcg 2040
tacgtcatct acgcgccggt ggacgtggtt gcgatgaacg tcgtgctaaa cggcggcgac 2100
ccggactacg tcgcgctgct gccatcgggc ttcgccatcc tgcccgatgg gccggcgcac 2160
gacggtggcg acggcgacgg cggcgtcggc gtcggctccg gcgggtcgct gctgacggtg 2220
gcgttccaga tactggtgga ctccgtcccg acggcgaagc tctcgctggg gtcggtggcg 2280
acggtgaaca gcctcatcgc ctgcacggtg gagcgcatca aggcggccgt ctccggcgag 2340
agcaatccgc agtag 2355
<210> 485
<211> 784
<212> PRT
<213> Oryza sativa
<400> 485
Met Met Ile Pro Ala Arg His Met Pro Ser Met Ile Gly Arg Asn Gly
1 5 10 15
Ala Ala Tyr Gly Ser Ser Ser Ala Leu Ser Leu Ser Gln Pro Asn Leu
20 25 30
Leu Asp Asn His Gln Phe Gln Gln Ala Phe Gln His Gln Gln Gln Gln
35 40 45
His His Leu Leu Asp Gln Ile Pro Ala Thr Thr Ala Glu Ser Gly Asp
50 55 60
Asn Met Ile Arg Ser Arg Ala Ser Asp Pro Leu Gly Gly Asp Glu Phe
65 70 75 80
Glu Ser Lys Ser Gly Ser Glu Asn Val Asp Gly Val Ser Val Asp Asp
85 90 95
Gln Asp Pro Asn Gln Arg Pro Arg Lys Lys Arg Tyr His Arg His Thr
100 105 110
Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His
115 120 125
Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu
130 135 140
Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys
145 150 155 160
Asn Gln His Glu Arg His Glu Asn Ser Gln Leu Arg Ser Asp Asn Glu
165 170 175
Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Ser Ser Ala
180 185 190
Ser Cys Pro Asn Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe
195 200 205
Asp Glu His His Leu Arg Ile Glu Asn Ala Arg Leu Arg Glu Glu Ile
210 215 220
Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro Met Val
225 230 235 240
Pro Phe Pro Val Leu Ser Asn Pro Met Ala Ala Ala Ala Ser Arg Ala
245 250 255
Pro Leu Asp Leu Pro Val Ala Pro Tyr Gly Val Pro Gly Asp Met Phe
260 265 270
Gly Gly Gly Gly Ala Gly Glu Leu Leu Arg Gly Val Gln Ser Glu Val
275 280 285
Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met Glu Glu Leu
290 295 300
Val Arg Met Ala Gln Leu Asp Glu Pro Leu Trp Ser Val Ala Pro Pro
305 310 315 320
Leu Asp Ala Thr Ala Ala Ala Met Glu Thr Leu Ser Glu Glu Glu Tyr
325 330 335
Ala Arg Met Phe Pro Arg Gly Leu Gly Pro Lys Gln Tyr Gly Leu Arg
340 345 350
Ser Glu Ala Ser Arg Asp Ser Ala Val Val Ile Met Thr His Ala Asn
355 360 365
Leu Val Glu Ile Leu Met Asp Ala Asn Gln Tyr Ala Ala Val Phe Ser
370 375 380
Asn Ile Val Ser Arg Ala Ile Thr Leu Glu Val Leu Ser Thr Gly Val
385 390 395 400
Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Ser Val Glu Phe Gln
405 410 415
Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr
420 425 430
Cys Lys Gln Asn Ala Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu
435 440 445
Asp Ser Leu Arg Pro Ser Pro Val Leu Lys Cys Arg Arg Arg Pro Ser
450 455 460
Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp
465 470 475 480
Val Glu His Val Glu Val Asp Asp Arg Ser Val His Asn Ile Tyr Lys
485 490 495
Leu Leu Val Asn Ser Gly Leu Ala Phe Gly Ala Arg Arg Trp Val Gly
500 505 510
Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Val Met Ala Ser Asn
515 520 525
Ile Pro Thr Ser Asp Ile Gly Val Ile Thr Ser Ser Glu Gly Arg Lys
530 535 540
Ser Met Leu Lys Leu Ala Glu Arg Met Val Val Ser Phe Cys Gly Gly
545 550 555 560
Val Thr Ala Ser Val Ala His Gln Trp Thr Thr Leu Ser Gly Ser Gly
565 570 575
Ala Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly
580 585 590
Arg Pro Pro Gly Ile Val Leu Asn Ala Ala Thr Ser Phe Trp Leu Pro
595 600 605
Val Pro Pro Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Ser Ser Arg
610 615 620
Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Ile Val Gln Glu Met Ala
625 630 635 640
His Ile Ala Asn Gly Arg Asp Gln Gly Asn Cys Val Ser Leu Leu Arg
645 650 655
Val Asn Ser Ser Asn Ser Asn Gln Ser Asn Met Leu Ile Leu Gln Glu
660 665 670
Ser Cys Thr Asp Ala Ser Gly Ser Tyr Val Ile Tyr Ala Pro Val Asp
675 680 685
Val Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val
690 695 700
Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ala His
705 710 715 720
Asp Gly Gly Asp Gly Asp Gly Gly Val Gly Val Gly Ser Gly Gly Ser
725 730 735
Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala
740 745 750
Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys
755 760 765
Thr Val Glu Arg Ile Lys Ala Ala Val Ser Gly Glu Ser Asn Pro Gln
770 775 780
<210> 486
<211> 2094
<212> DNA
<213> Oryza sativa
<400> 486
atggatttcg gcgacgaacc cgagggctcc gacagccagc gccgccgcaa gcgctaccac 60
cgccacacgc ctcgccagat tcagcagctc gaggcgatgt tcaaggagtg cccccacccg 120
gacgagaacc agcgggcgca gcttagccgg gagctcgggt tggagccgag gcagatcaag 180
ttctggttcc agaatcgccg gacccagatg aaggcgcagc acgagcgggc ggacaactgc 240
ttcctccgcg ccgagaacga caagatccgg tgcgagaaca tcgccatccg cgaggccctc 300
aagaacgtca tctgccccac ctgcggcggc cctcccgtcg gcgaggacta cttcgacgag 360
cagaagcttc gcatggagaa cgcccgcctc aaggaagagc tggaccgcgt gtcgaacctg 420
acgtcgaagt atctcggccg gccgttcacg cagctgccgc cggcgacgcc gccgatgacg 480
gtgtcgtcgc tggacctgtc cgtgggcggg atgggcgggc cgtcgctgga cctggacctc 540
ctcagcggtg gctcgtcggg gatcccgttc cagctgccgg cgcccgtgtc cgacatggag 600
cggcccatga tggccgagat ggccacgcgc gccatggacg agctgatccg cctcgcgcag 660
gccggcgacc acatctggtc caagagcccc ggcggcggcg tgtccggcgg cgacgcccgc 720
gagaccctca acgtcgacac ctacgacagc atcttctcca agcccggcgg ctcgtaccgc 780
gcccccagca tcaacgtcga ggggtcccgc gagtccggcc tcgtgctcat gagcgccgtc 840
gccctcgccg acgtgttcat ggacacgaac aagtggatgg agttcttccc aagcatcgtg 900
tccaaagctc acaccattga tgtgctcgtg aatggcatgg gagggagaag cgagtccttg 960
attctgatgt acgaggagct gcacatcatg acgccggccg tcccgacccg ggaggtgaac 1020
ttcgtccgct actgccggca gatcgagcag gggctatggg ccatcgccga cgtctccgtc 1080
gacctgcagc gcgacgccca cttcggcgcg ccgccgccgc gctcccgccg gctcccttcg 1140
gggtgcctca tcgctgacat ggccaatggc tactccaagg tatacgcgat ggacaatgtg 1200
ccgcacgcaa tggtgttttg gtttcggctc gctgacgacg tcgcgcacgc tcgcgtggag 1260
gagaagagcc cgatcaacgt gctgtaccgt gacctcgtgc tgagcggcgc cgcgttcggg 1320
gcgcaccgct ggctcgccgc gctccagcgc gcgtgcgagc gctacgcctc cctcgtcgcg 1380
ctcggcgtcc cgcaccacat cgccggtgtg acgccggagg ggaagaggag catgatgaag 1440
ctgtcgcagc ggatggtgaa cagcttctgc tcgagcctgg gggcgtcgca gatgcaccag 1500
tggacgacgc tgtcgggctc caacgaggtg agcgtccgcg tcaccatgca ccggagcacg 1560
gaccccggcc agcccaacgg cgtcgtcctc agcgccgcca cctccatctg gctccccgtc 1620
ccctgcgacc acgtcttcgc cttcgtccgc gacgagaaca cccgctccca gggcttgaat 1680
gcgagccaga acagcatgct gatactgcag gagagctgca cggacgcgtc ggggtcgctg 1740
gtggtgtact cgccgatcga catcccggcg gcgaacgtcg tgatgagcgg tgaggacccg 1800
tcgagcatcc cgctgctgcc gtcggggttc accatcctcc ccgatggccg cccgggctcg 1860
gcggcggggg cgtcgaccag cagcgcgggg ccgctcgccg ccgcgcgcgg cgggggcggc 1920
gggggcgctg gcggcgggtc cgtcgtcacc gtcgcgttcc agatcctcgt cagcagcctg 1980
ccgtcgtcga agctcaacgc cgagtctgtc gccaccgtca acgggctgat caccaccacc 2040
gtcgagcaga tcaaggccgc gctcaactgc tccgcccatg gccaccaccc ctga 2094
<210> 487
<211> 697
<212> PRT
<213> Oryza sativa
<400> 487
Met Asp Phe Gly Asp Glu Pro Glu Gly Ser Asp Ser Gln Arg Arg Arg
1 5 10 15
Lys Arg Tyr His Arg His Thr Pro Arg Gln Ile Gln Gln Leu Glu Ala
20 25 30
Met Phe Lys Glu Cys Pro His Pro Asp Glu Asn Gln Arg Ala Gln Leu
35 40 45
Ser Arg Glu Leu Gly Leu Glu Pro Arg Gln Ile Lys Phe Trp Phe Gln
50 55 60
Asn Arg Arg Thr Gln Met Lys Ala Gln His Glu Arg Ala Asp Asn Cys
65 70 75 80
Phe Leu Arg Ala Glu Asn Asp Lys Ile Arg Cys Glu Asn Ile Ala Ile
85 90 95
Arg Glu Ala Leu Lys Asn Val Ile Cys Pro Thr Cys Gly Gly Pro Pro
100 105 110
Val Gly Glu Asp Tyr Phe Asp Glu Gln Lys Leu Arg Met Glu Asn Ala
115 120 125
Arg Leu Lys Glu Glu Leu Asp Arg Val Ser Asn Leu Thr Ser Lys Tyr
130 135 140
Leu Gly Arg Pro Phe Thr Gln Leu Pro Pro Ala Thr Pro Pro Met Thr
145 150 155 160
Val Ser Ser Leu Asp Leu Ser Val Gly Gly Met Gly Gly Pro Ser Leu
165 170 175
Asp Leu Asp Leu Leu Ser Gly Gly Ser Ser Gly Ile Pro Phe Gln Leu
180 185 190
Pro Ala Pro Val Ser Asp Met Glu Arg Pro Met Met Ala Glu Met Ala
195 200 205
Thr Arg Ala Met Asp Glu Leu Ile Arg Leu Ala Gln Ala Gly Asp His
210 215 220
Ile Trp Ser Lys Ser Pro Gly Gly Gly Val Ser Gly Gly Asp Ala Arg
225 230 235 240
Glu Thr Leu Asn Val Asp Thr Tyr Asp Ser Ile Phe Ser Lys Pro Gly
245 250 255
Gly Ser Tyr Arg Ala Pro Ser Ile Asn Val Glu Gly Ser Arg Glu Ser
260 265 270
Gly Leu Val Leu Met Ser Ala Val Ala Leu Ala Asp Val Phe Met Asp
275 280 285
Thr Asn Lys Trp Met Glu Phe Phe Pro Ser Ile Val Ser Lys Ala His
290 295 300
Thr Ile Asp Val Leu Val Asn Gly Met Gly Gly Arg Ser Glu Ser Leu
305 310 315 320
Ile Leu Met Tyr Glu Glu Leu His Ile Met Thr Pro Ala Val Pro Thr
325 330 335
Arg Glu Val Asn Phe Val Arg Tyr Cys Arg Gln Ile Glu Gln Gly Leu
340 345 350
Trp Ala Ile Ala Asp Val Ser Val Asp Leu Gln Arg Asp Ala His Phe
355 360 365
Gly Ala Pro Pro Pro Arg Ser Arg Arg Leu Pro Ser Gly Cys Leu Ile
370 375 380
Ala Asp Met Ala Asn Gly Tyr Ser Lys Val Tyr Ala Met Asp Asn Val
385 390 395 400
Pro His Ala Met Val Phe Trp Phe Arg Leu Ala Asp Asp Val Ala His
405 410 415
Ala Arg Val Glu Glu Lys Ser Pro Ile Asn Val Leu Tyr Arg Asp Leu
420 425 430
Val Leu Ser Gly Ala Ala Phe Gly Ala His Arg Trp Leu Ala Ala Leu
435 440 445
Gln Arg Ala Cys Glu Arg Tyr Ala Ser Leu Val Ala Leu Gly Val Pro
450 455 460
His His Ile Ala Gly Val Thr Pro Glu Gly Lys Arg Ser Met Met Lys
465 470 475 480
Leu Ser Gln Arg Met Val Asn Ser Phe Cys Ser Ser Leu Gly Ala Ser
485 490 495
Gln Met His Gln Trp Thr Thr Leu Ser Gly Ser Asn Glu Val Ser Val
500 505 510
Arg Val Thr Met His Arg Ser Thr Asp Pro Gly Gln Pro Asn Gly Val
515 520 525
Val Leu Ser Ala Ala Thr Ser Ile Trp Leu Pro Val Pro Cys Asp His
530 535 540
Val Phe Ala Phe Val Arg Asp Glu Asn Thr Arg Ser Gln Gly Leu Asn
545 550 555 560
Ala Ser Gln Asn Ser Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ala
565 570 575
Ser Gly Ser Leu Val Val Tyr Ser Pro Ile Asp Ile Pro Ala Ala Asn
580 585 590
Val Val Met Ser Gly Glu Asp Pro Ser Ser Ile Pro Leu Leu Pro Ser
595 600 605
Gly Phe Thr Ile Leu Pro Asp Gly Arg Pro Gly Ser Ala Ala Gly Ala
610 615 620
Ser Thr Ser Ser Ala Gly Pro Leu Ala Ala Ala Arg Gly Gly Gly Gly
625 630 635 640
Gly Gly Ala Gly Gly Gly Ser Val Val Thr Val Ala Phe Gln Ile Leu
645 650 655
Val Ser Ser Leu Pro Ser Ser Lys Leu Asn Ala Glu Ser Val Ala Thr
660 665 670
Val Asn Gly Leu Ile Thr Thr Thr Val Glu Gln Ile Lys Ala Ala Leu
675 680 685
Asn Cys Ser Ala His Gly His His Pro
690 695
<210> 488
<211> 2451
<212> DNA
<213> Oryza sativa
<400> 488
atggggacca accggccgcg gccacgaacc aaggacttct tcgcagctcc ggcgctctcc 60
ctcacactgg caggcgtgtt cggccggaaa aatggacctg cggcgtcggg tggagacggg 120
gtggaggaag gcgacgagga ggtgcaggct gcaggcgagg cggcggtgga gatcagcagc 180
gagaacgcgg ggccggggtg tagacagtcc cagtccggcg gtggctccgg ggaagacggc 240
ggccatgacg acgacgacgg agagggtagt aataagaaga ggaggaggaa gaactaccac 300
aggcacaccg ccgaacaaat caggatcatg gaagcgctat tcaaagagtc cccacatccg 360
gatgagaggc agcggcagca ggtcagtaag cagctcggcc tctctgcacg ccaggtcaag 420
ttctggtttc agaaccgacg aactcagatc aaggcggttc aggagcgaca cgagaactcg 480
ctgctcaagt ccgagctgga gaagctccag gacgagcacc gcgcgatgag agagctcgcc 540
aagaagccat ctcgctgcct aaactgcggc gtcgtggcaa cctccagcga cgccgccgcc 600
gccgccacgg cggcggacac ccgtgaacag cggctgcgac tcgagaaagc caagctcaaa 660
gctgaggttt gtatgccgcc gccgcgaagc cgcgcccgtc ctttccggtg cgctacactg 720
caagacactg actccggcga actggcgatg ttgaacttgt ttcagataga gaggctgcga 780
gggacgccag gaaagtccgc cgccgatgga atcgcctcgc cgccgtgctc cgcgtccgcg 840
ggcgccatgc agacgaacag caggagcccg ccgttgcacg accacgacgg cggcttctta 900
cgccacgacg acgacaagcc gaggatcttg gagctggcca cccgtgcgct ggacgagctg 960
gttgggatgt gctcctccgg cgagcctgtg tgggtgcggg gcgtcgagac cggcagggac 1020
attctgaact acgacgagta cgtgcgcttg ttccgccgcg accacggtgg ttccggcgat 1080
cagatggccg gctggacggt tgaggcttcc agggaatgtg gactagttta ccttgacacg 1140
atgcatcttg tgcacacttt catggacgtg gacaagtgga aggacctatt ccctaccatg 1200
atctcaaagg cagcgacgct ggaaatgatc agcaaccgcg aagacgatgg ccgagacggc 1260
gtcctgcaac tgatgtatgc agagcttcag acactgacac caatggtgcc cacgagggag 1320
ttatacttcg cccgctactg caagaagctg gccgcggaga gatgggcgat cgtcgacgtg 1380
tccttcgacg agtctgagac tggcgtccac gcgtcgtcgg cggtcaggtg ctggaagaac 1440
ccatccggct gcctcatcga agagcagaac aacggccggt gcaagatgac ctgggtggag 1500
cacaccagat gccgccggtg cacggtcgcg ccgttgtacc gggcggtcac cgcgagcggc 1560
gtggcgttcg gcgcgagacg ctgggtggcc gcgctccagc tccagtgcga gaggatggtc 1620
ttcgccgtgg cgaccaacgt tccaacgagg gactcgaccg gggtctccac gctcgcgggc 1680
aggaggagcg ttctgaaact ggcgcaccgg atgacgtcga gcctctgccg caccaccggt 1740
ggatcgtgtg acatggcgtg gcgcagggcg ccgaaaggag gcagcggcgg cggtggcgac 1800
gacgacatct ggctgacgtc ccgggagaac gccggcgacg accctggcga gccgcagggg 1860
ctgatcgcgt gcgccgcggc gtcgacgtgg ctgccggtga atccgacggc tctcctcgac 1920
ttactgaggg atgaatcacg gcgaccagag tgggacgtga tgctacccgg aaaatctgtt 1980
cagagccgcg tgaatcttgc aaaggggaag gaccgtacca actgcgtcac cgcctacgcc 2040
gctcgaccgg aagaagaaga agagagaggc ggcaagtggg tcctccagga cgtctgcacc 2100
aacccctgcg agtcgacgat cgcgtacgcg gcgatcgacg ccgccgcgct gcagccggtc 2160
atcgccgggc acgactcgag cggcgtgcac ctcctgccgt gcggattcat ctcggtgatg 2220
ccggacgggc tcgagtccaa gccggcggtg atcacggcgt cgaggagggg aggcgaggct 2280
tcgggggccg gatcgctggt taccgtggcg ttccaggtcc cggccagccc gtcggcggcg 2340
gcggccacgc tctcgccgga ctcggtggag gccgtgacgg tcctggtctc ctccactctg 2400
cgtaacatca ggaaagcctt ggggtgcgac tcgtgcgagg aggaattcta g 2451
<210> 489
<211> 816
<212> PRT
<213> Oryza sativa
<400> 489
Met Gly Thr Asn Arg Pro Arg Pro Arg Thr Lys Asp Phe Phe Ala Ala
1 5 10 15
Pro Ala Leu Ser Leu Thr Leu Ala Gly Val Phe Gly Arg Lys Asn Gly
20 25 30
Pro Ala Ala Ser Gly Gly Asp Gly Val Glu Glu Gly Asp Glu Glu Val
35 40 45
Gln Ala Ala Gly Glu Ala Ala Val Glu Ile Ser Ser Glu Asn Ala Gly
50 55 60
Pro Gly Cys Arg Gln Ser Gln Ser Gly Gly Gly Ser Gly Glu Asp Gly
65 70 75 80
Gly His Asp Asp Asp Asp Gly Glu Gly Ser Asn Lys Lys Arg Arg Arg
85 90 95
Lys Asn Tyr His Arg His Thr Ala Glu Gln Ile Arg Ile Met Glu Ala
100 105 110
Leu Phe Lys Glu Ser Pro His Pro Asp Glu Arg Gln Arg Gln Gln Val
115 120 125
Ser Lys Gln Leu Gly Leu Ser Ala Arg Gln Val Lys Phe Trp Phe Gln
130 135 140
Asn Arg Arg Thr Gln Ile Lys Ala Val Gln Glu Arg His Glu Asn Ser
145 150 155 160
Leu Leu Lys Ser Glu Leu Glu Lys Leu Gln Asp Glu His Arg Ala Met
165 170 175
Arg Glu Leu Ala Lys Lys Pro Ser Arg Cys Leu Asn Cys Gly Val Val
180 185 190
Ala Thr Ser Ser Asp Ala Ala Ala Ala Ala Thr Ala Ala Asp Thr Arg
195 200 205
Glu Gln Arg Leu Arg Leu Glu Lys Ala Lys Leu Lys Ala Glu Val Cys
210 215 220
Met Pro Pro Pro Arg Ser Arg Ala Arg Pro Phe Arg Cys Ala Thr Leu
225 230 235 240
Gln Asp Thr Asp Ser Gly Glu Leu Ala Met Leu Asn Leu Phe Gln Ile
245 250 255
Glu Arg Leu Arg Gly Thr Pro Gly Lys Ser Ala Ala Asp Gly Ile Ala
260 265 270
Ser Pro Pro Cys Ser Ala Ser Ala Gly Ala Met Gln Thr Asn Ser Arg
275 280 285
Ser Pro Pro Leu His Asp His Asp Gly Gly Phe Leu Arg His Asp Asp
290 295 300
Asp Lys Pro Arg Ile Leu Glu Leu Ala Thr Arg Ala Leu Asp Glu Leu
305 310 315 320
Val Gly Met Cys Ser Ser Gly Glu Pro Val Trp Val Arg Gly Val Glu
325 330 335
Thr Gly Arg Asp Ile Leu Asn Tyr Asp Glu Tyr Val Arg Leu Phe Arg
340 345 350
Arg Asp His Gly Gly Ser Gly Asp Gln Met Ala Gly Trp Thr Val Glu
355 360 365
Ala Ser Arg Glu Cys Gly Leu Val Tyr Leu Asp Thr Met His Leu Val
370 375 380
His Thr Phe Met Asp Val Asp Lys Trp Lys Asp Leu Phe Pro Thr Met
385 390 395 400
Ile Ser Lys Ala Ala Thr Leu Glu Met Ile Ser Asn Arg Glu Asp Asp
405 410 415
Gly Arg Asp Gly Val Leu Gln Leu Met Tyr Ala Glu Leu Gln Thr Leu
420 425 430
Thr Pro Met Val Pro Thr Arg Glu Leu Tyr Phe Ala Arg Tyr Cys Lys
435 440 445
Lys Leu Ala Ala Glu Arg Trp Ala Ile Val Asp Val Ser Phe Asp Glu
450 455 460
Ser Glu Thr Gly Val His Ala Ser Ser Ala Val Arg Cys Trp Lys Asn
465 470 475 480
Pro Ser Gly Cys Leu Ile Glu Glu Gln Asn Asn Gly Arg Cys Lys Met
485 490 495
Thr Trp Val Glu His Thr Arg Cys Arg Arg Cys Thr Val Ala Pro Leu
500 505 510
Tyr Arg Ala Val Thr Ala Ser Gly Val Ala Phe Gly Ala Arg Arg Trp
515 520 525
Val Ala Ala Leu Gln Leu Gln Cys Glu Arg Met Val Phe Ala Val Ala
530 535 540
Thr Asn Val Pro Thr Arg Asp Ser Thr Gly Val Ser Thr Leu Ala Gly
545 550 555 560
Arg Arg Ser Val Leu Lys Leu Ala His Arg Met Thr Ser Ser Leu Cys
565 570 575
Arg Thr Thr Gly Gly Ser Cys Asp Met Ala Trp Arg Arg Ala Pro Lys
580 585 590
Gly Gly Ser Gly Gly Gly Gly Asp Asp Asp Ile Trp Leu Thr Ser Arg
595 600 605
Glu Asn Ala Gly Asp Asp Pro Gly Glu Pro Gln Gly Leu Ile Ala Cys
610 615 620
Ala Ala Ala Ser Thr Trp Leu Pro Val Asn Pro Thr Ala Leu Leu Asp
625 630 635 640
Leu Leu Arg Asp Glu Ser Arg Arg Pro Glu Trp Asp Val Met Leu Pro
645 650 655
Gly Lys Ser Val Gln Ser Arg Val Asn Leu Ala Lys Gly Lys Asp Arg
660 665 670
Thr Asn Cys Val Thr Ala Tyr Ala Ala Arg Pro Glu Glu Glu Glu Glu
675 680 685
Arg Gly Gly Lys Trp Val Leu Gln Asp Val Cys Thr Asn Pro Cys Glu
690 695 700
Ser Thr Ile Ala Tyr Ala Ala Ile Asp Ala Ala Ala Leu Gln Pro Val
705 710 715 720
Ile Ala Gly His Asp Ser Ser Gly Val His Leu Leu Pro Cys Gly Phe
725 730 735
Ile Ser Val Met Pro Asp Gly Leu Glu Ser Lys Pro Ala Val Ile Thr
740 745 750
Ala Ser Arg Arg Gly Gly Glu Ala Ser Gly Ala Gly Ser Leu Val Thr
755 760 765
Val Ala Phe Gln Val Pro Ala Ser Pro Ser Ala Ala Ala Ala Thr Leu
770 775 780
Ser Pro Asp Ser Val Glu Ala Val Thr Val Leu Val Ser Ser Thr Leu
785 790 795 800
Arg Asn Ile Arg Lys Ala Leu Gly Cys Asp Ser Cys Glu Glu Glu Phe
805 810 815
<210> 490
<211> 2346
<212> DNA
<213> Oryza sativa
<400> 490
atggagagga gggagatttt ccaagttgct gatcttgcac acatattgag agggaaacct 60
gtagatcatc ttcaacagcc aaacttgctg gataatcacc agttccagca agcgttccag 120
catcagcagc agcagcatca tctccttgac cagatcccgg cgacgacggc ggagagcggc 180
gacaacatga tccgcagccg tgcgtccgac cctctcggcg gcgacgagtt cgagagcaag 240
tccggcagcg agaacgtcga cggcgtctcc gtcgacgacc aggaccccaa ccagcggccg 300
cgcaagaagc gctaccaccg ccacacccag catcagatcc aggagatgga agcattcttc 360
aaggaatgtc cacacccaga tgataagcag cgcaaggagc tgagccggga gctcggcctg 420
gagcctctcc aagtgaagtt ctggttccag aacaagcgca cccaaatgaa gaaccagcat 480
gagaggcacg agaactcgca gctgcggtcg gataacgaga agctccgggc cgagaacatg 540
cggtacaagg aggccctgag cagcgcctcc tgccccaatt gcggcggccc cgccgccctc 600
ggcgagatgt ccttcgacga gcaccacctc cgcatcgaga acgcccgcct ccgcgaagag 660
atcgatagga tatcggcgat cgcggcgaag tacgtgggga agccaatggt gccgttcccg 720
gtgctgtcga acccgatggc ggcggcggcg tcgcgggcgc cgctggacct ccccgtggcg 780
ccgtacggcg tgccgggcga catgttcggc ggcggtggcg ccggggagct gctgcgcggg 840
gtgcagtcgg aggtcgacaa gccgatgatc gtggagctcg ccgtggcggc gatggaggag 900
ctggtccgca tggcgcagct ggacgagccg ctctggagcg tcgcgccgcc gctcgacgcc 960
acggcggcgg cgatggagac gctcagcgag gaggagtacg cgcgcatgtt cccccgaggg 1020
ctcggcccca agcagtacgg gctcaggtcg gaggcgtccc gcgacagcgc cgtcgtcatc 1080
atgacgcacg ccaacctcgt cgagatcctc atggacgcga atcagtacgc ggcagtgttc 1140
tcgaacatcg tgtcgagggc catcacgctg gaggtgctgt ccaccggcgt cgcggggaac 1200
tacaacggtg cattgcaagt gatgtcagtg gagtttcagg tgccatcgcc actggtgcca 1260
acgagagaga gctacttcgt gagatactgc aagcagaacg cagacgggac atgggccgtc 1320
gtcgacgtct cgctggacag cctccgccct agccccgtcc tcaaatgtcg ccgccgtccg 1380
tcaggctgcc tcatccaaga aatgcccaat ggctactcca aggtgacgtg ggtggagcat 1440
gtggaggtgg acgacaggtc ggtgcacaac atctacaagc tgctggtgaa ctccgggctg 1500
gcgttcggcg cgcggcggtg ggtcggcacg ctggaccgcc agtgcgagcg cctcgccagc 1560
gtcatggcca gcaacatccc caccagcgac atcggcgtga ttacgagctc ggaggggagg 1620
aagagcatgc tgaagctggc ggagaggatg gtggtgagct tctgcggcgg cgtgacggcg 1680
tcggtggcgc atcagtggac gacgctgtcc ggcagcggcg ccgaggacgt ccgcgtcatg 1740
acgaggaaga gcgtcgacga ccccgggagg ccccccggca tcgtcctcaa cgccgccacc 1800
tccttctggc tccccgtccc tcccaagcgc gtcttcgact tcctccgcga cgaatcctct 1860
cgcagtgagt gggacatcct ctccaatggc ggtatcgttc aagaaatggc ccacatcgcc 1920
aatggccggg atcagggcaa ctgcgtctca cttcttcgcg tcaacagctc gaactcgaac 1980
cagagcaaca tgctgatcct gcaggagagc tgcacggacg cgtcggggtc gtacgtcatc 2040
tacgcgccgg tggacgtggt tgcgatgaac gtcgtgctaa acggcggcga cccggactac 2100
gtcgcgctgc tgccatcggg cttcgccatc ctgcccgatg ggccggcgca cgacggtggc 2160
gacggcgacg gcggcgtcgg cgtcggctcc ggcgggtcgc tgctgacggt ggcgttccag 2220
atactggtgg actccgtccc gacggcgaag ctctcgctgg ggtcggtggc gacggtgaac 2280
agcctcatcg cctgcacggt ggagcgcatc aaggcggccg tctccggcga gagcaatccg 2340
cagtag 2346
<210> 491
<211> 781
<212> PRT
<213> Oryza sativa
<400> 491
Met Glu Arg Arg Glu Ile Phe Gln Val Ala Asp Leu Ala His Ile Leu
1 5 10 15
Arg Gly Lys Pro Val Asp His Leu Gln Gln Pro Asn Leu Leu Asp Asn
20 25 30
His Gln Phe Gln Gln Ala Phe Gln His Gln Gln Gln Gln His His Leu
35 40 45
Leu Asp Gln Ile Pro Ala Thr Thr Ala Glu Ser Gly Asp Asn Met Ile
50 55 60
Arg Ser Arg Ala Ser Asp Pro Leu Gly Gly Asp Glu Phe Glu Ser Lys
65 70 75 80
Ser Gly Ser Glu Asn Val Asp Gly Val Ser Val Asp Asp Gln Asp Pro
85 90 95
Asn Gln Arg Pro Arg Lys Lys Arg Tyr His Arg His Thr Gln His Gln
100 105 110
Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His Pro Asp Asp
115 120 125
Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu Pro Leu Gln
130 135 140
Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Asn Gln His
145 150 155 160
Glu Arg His Glu Asn Ser Gln Leu Arg Ser Asp Asn Glu Lys Leu Arg
165 170 175
Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Ser Ser Ala Ser Cys Pro
180 185 190
Asn Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe Asp Glu His
195 200 205
His Leu Arg Ile Glu Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg Ile
210 215 220
Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro Met Val Pro Phe Pro
225 230 235 240
Val Leu Ser Asn Pro Met Ala Ala Ala Ala Ser Arg Ala Pro Leu Asp
245 250 255
Leu Pro Val Ala Pro Tyr Gly Val Pro Gly Asp Met Phe Gly Gly Gly
260 265 270
Gly Ala Gly Glu Leu Leu Arg Gly Val Gln Ser Glu Val Asp Lys Pro
275 280 285
Met Ile Val Glu Leu Ala Val Ala Ala Met Glu Glu Leu Val Arg Met
290 295 300
Ala Gln Leu Asp Glu Pro Leu Trp Ser Val Ala Pro Pro Leu Asp Ala
305 310 315 320
Thr Ala Ala Ala Met Glu Thr Leu Ser Glu Glu Glu Tyr Ala Arg Met
325 330 335
Phe Pro Arg Gly Leu Gly Pro Lys Gln Tyr Gly Leu Arg Ser Glu Ala
340 345 350
Ser Arg Asp Ser Ala Val Val Ile Met Thr His Ala Asn Leu Val Glu
355 360 365
Ile Leu Met Asp Ala Asn Gln Tyr Ala Ala Val Phe Ser Asn Ile Val
370 375 380
Ser Arg Ala Ile Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn
385 390 395 400
Tyr Asn Gly Ala Leu Gln Val Met Ser Val Glu Phe Gln Val Pro Ser
405 410 415
Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys Gln
420 425 430
Asn Ala Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Ser Leu
435 440 445
Arg Pro Ser Pro Val Leu Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu
450 455 460
Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His
465 470 475 480
Val Glu Val Asp Asp Arg Ser Val His Asn Ile Tyr Lys Leu Leu Val
485 490 495
Asn Ser Gly Leu Ala Phe Gly Ala Arg Arg Trp Val Gly Thr Leu Asp
500 505 510
Arg Gln Cys Glu Arg Leu Ala Ser Val Met Ala Ser Asn Ile Pro Thr
515 520 525
Ser Asp Ile Gly Val Ile Thr Ser Ser Glu Gly Arg Lys Ser Met Leu
530 535 540
Lys Leu Ala Glu Arg Met Val Val Ser Phe Cys Gly Gly Val Thr Ala
545 550 555 560
Ser Val Ala His Gln Trp Thr Thr Leu Ser Gly Ser Gly Ala Glu Asp
565 570 575
Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro
580 585 590
Gly Ile Val Leu Asn Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro
595 600 605
Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Ser Ser Arg Ser Glu Trp
610 615 620
Asp Ile Leu Ser Asn Gly Gly Ile Val Gln Glu Met Ala His Ile Ala
625 630 635 640
Asn Gly Arg Asp Gln Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser
645 650 655
Ser Asn Ser Asn Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr
660 665 670
Asp Ala Ser Gly Ser Tyr Val Ile Tyr Ala Pro Val Asp Val Val Ala
675 680 685
Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu
690 695 700
Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ala His Asp Gly Gly
705 710 715 720
Asp Gly Asp Gly Gly Val Gly Val Gly Ser Gly Gly Ser Leu Leu Thr
725 730 735
Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser
740 745 750
Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys Thr Val Glu
755 760 765
Arg Ile Lys Ala Ala Val Ser Gly Glu Ser Asn Pro Gln
770 775 780
<210> 492
<211> 2421
<212> DNA
<213> Oryza sativa
<400> 492
atgcagttcc cgttctccgg cgctggcccg ggcgtcttca cgtcatcgcc ggcgctctcc 60
ctcgcgctgg cggacgcggt ggcaggccgg aacagcggcg gcggtgggaa gatggttacc 120
gcggcccatg gcggcgtcgg cggaggagga ggaggaggac gcgcgaaggc gagggacgcg 180
ttggaggtgg agaacgagat gagccggtcc gggagcgacc acctcgacgt cgtctcttgc 240
ggcgacgcgg gcggcggcgg cggcgacgac gacgatgacg aggacgccga gcacggcaac 300
ccgcccaagc gcaagaagcg gtaccaccgc cacacgccgc agcagatcca agagctggaa 360
gcgatgttca aggaatgccc ccacccagac gagaagcagc gcgccgagct gagcaagcgg 420
ctcggcctcg aaccccggca ggtcaagttc tggttccaga atcggcgaac gcagatgaag 480
atgcaactgg agcgacacga gaactcgctg ctgaagcagg agaacgataa gctgcggtcc 540
gagaacctgt caatccggga ggccacgagc aacgcggtgt gcgttggctg cggcggcccg 600
gcgatgctcg gggaggtgtc cctggaggag caccaccttc gcgtcgagaa cgcgaggctc 660
aaggacgagc tcagccgagt gtgcgcgctc gccgccaagt tccttggcaa gtccatctct 720
gtcatggcgc caccgcagat gcatcagcct catcctgtgc caggctcgtc gctggagctt 780
gcggttgggg gtatcggttc gatgccatca gccacgatgc ccatctcgac gatcactgat 840
tttgctggcg ccatgtccag ttcaatgggc acggtgatca cgcccatgaa gtctgaggct 900
gaaccatcgg caatggctgg cattgacaag tccttgttct tggagctagc aatgagtgca 960
atggatgagc tagtcaagat ggctcagatg ggggatccgc tatggattcc aggtgcctcc 1020
gtaccttcct cgccggcaaa ggagagtcta aacttcgagg agtacctaaa caccttccca 1080
ccttgcatcg gggtgaagcc tgaagggtat gtatcagagg catctagaga atctggcatt 1140
gtcatcattg acgatggcgc cgcgcttgtg gagaccctca tggatgagcg acggtggtcc 1200
gatatgttct catgcatgat tgccaaggca tcaaccactg aggagatttc tactggtgtt 1260
gctgggagta gaaatggtgc attgcttctt atgcaggcag agctacaggt gctttctcct 1320
cttgtgccta ttagagaggt gaagtttctc aggttctcca aacagctggc tgatggtgta 1380
tgggctgtag tggacgtttc ggctgatgaa ttgatgaggg atcagggcat tacttctgca 1440
tcctcgactg caaacatgaa ctgccgaagg ctgccttctg gttgtgtgct gcaggacact 1500
ccaaatgggt ttgttaaggt cacatgggtt gaacatacag aatatgatga ggcatctgtg 1560
cacccgctct accggcctct tctccggtct ggtcttgccc ttggtgcagg gcgatggatc 1620
gcgacattac agcggcagtg cgaatgcttg gcccttctca tgtcttctat tgcattgcca 1680
gagaacgact catcagctat ccatcctgaa ggtaaacgga gcatgttgaa gttggcaagg 1740
aggatgacgg acaacttctg tgcaggggtg agcacatcat ctacccgtga atggagcaaa 1800
ctggttggat tgacaggcaa cattggggag gatgtgcatg taatggcgcg gaagagtgtg 1860
gatgaacctg gaacgccgcc aggtgtggtg cttagtgctg ctacatctgt gtggatgcct 1920
gtgatgcctg aacggctctt caacttcttg cacaacaagg ggctgcgtgc tgaatgggat 1980
atcctcagca atggtggccc tatgcaggag gtgacaagca ttgccaaggg gcaacagaat 2040
ggcaataccg tatgtctact gaaggctagt cccaccaaag acaagcagaa cagcatgctg 2100
atcctacagg agacgtgtgc agacgcatcc ggttcaatgg ttgtgtatgc tcctgtagac 2160
atcccagcaa tgcaccttgt catgagtggt ggggattcgt catgcgtcgc ccttcttcca 2220
tcaggttttg ccatcctgcc tgctgggcct agcatcggcg cagatcacaa gatgggcggt 2280
tcattgctca ccgttgcatt ccagatactt gccaacagcc agcccagtgc taagctcacg 2340
gtggagtcag tcgagaccgt gagcaacctt atctcctgca ccatcaagaa gatcaagacg 2400
gcgctgcatt gcgacgtgtg a 2421
<210> 493
<211> 806
<212> PRT
<213> Oryza sativa
<400> 493
Met Gln Phe Pro Phe Ser Gly Ala Gly Pro Gly Val Phe Thr Ser Ser
1 5 10 15
Pro Ala Leu Ser Leu Ala Leu Ala Asp Ala Val Ala Gly Arg Asn Ser
20 25 30
Gly Gly Gly Gly Lys Met Val Thr Ala Ala His Gly Gly Val Gly Gly
35 40 45
Gly Gly Gly Gly Gly Arg Ala Lys Ala Arg Asp Ala Leu Glu Val Glu
50 55 60
Asn Glu Met Ser Arg Ser Gly Ser Asp His Leu Asp Val Val Ser Cys
65 70 75 80
Gly Asp Ala Gly Gly Gly Gly Gly Asp Asp Asp Asp Asp Glu Asp Ala
85 90 95
Glu His Gly Asn Pro Pro Lys Arg Lys Lys Arg Tyr His Arg His Thr
100 105 110
Pro Gln Gln Ile Gln Glu Leu Glu Ala Met Phe Lys Glu Cys Pro His
115 120 125
Pro Asp Glu Lys Gln Arg Ala Glu Leu Ser Lys Arg Leu Gly Leu Glu
130 135 140
Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
145 150 155 160
Met Gln Leu Glu Arg His Glu Asn Ser Leu Leu Lys Gln Glu Asn Asp
165 170 175
Lys Leu Arg Ser Glu Asn Leu Ser Ile Arg Glu Ala Thr Ser Asn Ala
180 185 190
Val Cys Val Gly Cys Gly Gly Pro Ala Met Leu Gly Glu Val Ser Leu
195 200 205
Glu Glu His His Leu Arg Val Glu Asn Ala Arg Leu Lys Asp Glu Leu
210 215 220
Ser Arg Val Cys Ala Leu Ala Ala Lys Phe Leu Gly Lys Ser Ile Ser
225 230 235 240
Val Met Ala Pro Pro Gln Met His Gln Pro His Pro Val Pro Gly Ser
245 250 255
Ser Leu Glu Leu Ala Val Gly Gly Ile Gly Ser Met Pro Ser Ala Thr
260 265 270
Met Pro Ile Ser Thr Ile Thr Asp Phe Ala Gly Ala Met Ser Ser Ser
275 280 285
Met Gly Thr Val Ile Thr Pro Met Lys Ser Glu Ala Glu Pro Ser Ala
290 295 300
Met Ala Gly Ile Asp Lys Ser Leu Phe Leu Glu Leu Ala Met Ser Ala
305 310 315 320
Met Asp Glu Leu Val Lys Met Ala Gln Met Gly Asp Pro Leu Trp Ile
325 330 335
Pro Gly Ala Ser Val Pro Ser Ser Pro Ala Lys Glu Ser Leu Asn Phe
340 345 350
Glu Glu Tyr Leu Asn Thr Phe Pro Pro Cys Ile Gly Val Lys Pro Glu
355 360 365
Gly Tyr Val Ser Glu Ala Ser Arg Glu Ser Gly Ile Val Ile Ile Asp
370 375 380
Asp Gly Ala Ala Leu Val Glu Thr Leu Met Asp Glu Arg Arg Trp Ser
385 390 395 400
Asp Met Phe Ser Cys Met Ile Ala Lys Ala Ser Thr Thr Glu Glu Ile
405 410 415
Ser Thr Gly Val Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Met Gln
420 425 430
Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Lys
435 440 445
Phe Leu Arg Phe Ser Lys Gln Leu Ala Asp Gly Val Trp Ala Val Val
450 455 460
Asp Val Ser Ala Asp Glu Leu Met Arg Asp Gln Gly Ile Thr Ser Ala
465 470 475 480
Ser Ser Thr Ala Asn Met Asn Cys Arg Arg Leu Pro Ser Gly Cys Val
485 490 495
Leu Gln Asp Thr Pro Asn Gly Phe Val Lys Val Thr Trp Val Glu His
500 505 510
Thr Glu Tyr Asp Glu Ala Ser Val His Pro Leu Tyr Arg Pro Leu Leu
515 520 525
Arg Ser Gly Leu Ala Leu Gly Ala Gly Arg Trp Ile Ala Thr Leu Gln
530 535 540
Arg Gln Cys Glu Cys Leu Ala Leu Leu Met Ser Ser Ile Ala Leu Pro
545 550 555 560
Glu Asn Asp Ser Ser Ala Ile His Pro Glu Gly Lys Arg Ser Met Leu
565 570 575
Lys Leu Ala Arg Arg Met Thr Asp Asn Phe Cys Ala Gly Val Ser Thr
580 585 590
Ser Ser Thr Arg Glu Trp Ser Lys Leu Val Gly Leu Thr Gly Asn Ile
595 600 605
Gly Glu Asp Val His Val Met Ala Arg Lys Ser Val Asp Glu Pro Gly
610 615 620
Thr Pro Pro Gly Val Val Leu Ser Ala Ala Thr Ser Val Trp Met Pro
625 630 635 640
Val Met Pro Glu Arg Leu Phe Asn Phe Leu His Asn Lys Gly Leu Arg
645 650 655
Ala Glu Trp Asp Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Val Thr
660 665 670
Ser Ile Ala Lys Gly Gln Gln Asn Gly Asn Thr Val Cys Leu Leu Lys
675 680 685
Ala Ser Pro Thr Lys Asp Lys Gln Asn Ser Met Leu Ile Leu Gln Glu
690 695 700
Thr Cys Ala Asp Ala Ser Gly Ser Met Val Val Tyr Ala Pro Val Asp
705 710 715 720
Ile Pro Ala Met His Leu Val Met Ser Gly Gly Asp Ser Ser Cys Val
725 730 735
Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Ala Gly Pro Ser Ile
740 745 750
Gly Ala Asp His Lys Met Gly Gly Ser Leu Leu Thr Val Ala Phe Gln
755 760 765
Ile Leu Ala Asn Ser Gln Pro Ser Ala Lys Leu Thr Val Glu Ser Val
770 775 780
Glu Thr Val Ser Asn Leu Ile Ser Cys Thr Ile Lys Lys Ile Lys Thr
785 790 795 800
Ala Leu His Cys Asp Val
805
<210> 494
<211> 2355
<212> DNA
<213> Oryza sativa
<400> 494
atgaacggcg agcttaaact tatggcttcc tatgtgagca agcttaagtt catcttgcaa 60
aaagatcagc agcaggagcc ccatactgcg aaccttctag tcctacttgg gagtagcaat 120
caggacaaaa gaaatggcct ctcacaggga gaaaacagaa tggacacttg taccagaaag 180
aagccaagaa gataccaact cctcaccatg caacaaaaag aaacgcttaa tcgtgcattt 240
caatcatgtc cgaaccctga tagaaatgac ttgaagaagt tggccaagga actaaacatg 300
actgagaccc aaatcaaata ttggttccag aactgcagga caaagatgaa gaaattcaag 360
aacaatgagg agcgcaaact actgcagaag gagaatgagg agctaaagaa ggagaatgca 420
gagttgagaa ataggatgaa gaactcaaca tgccgcgctt gtgacctccc tttgttccat 480
atagattgcc gtcattggga gaatccaatg ctcaacaagg gtaatcatgg cgttacaagt 540
aatctcattc ctcaggcagt gtcatccttg ctccccagct caagtggttt tgtagcttca 600
ggctccaatc ttagtagcaa tgctgtgctc atgcccgtat ctgccatgcc atcatcagtt 660
ttgcagcctg ctccagccgt ctctggtgcc aattttccca tcttgcacaa tctatctgcc 720
aatgcaaatg atggctatac ggaaaaaaac gtacttcttg atctggcgaa ccgtgcaatg 780
gaagagttct ttagtctaat gaaggagaat gagtctcttc ttgtcaaaaa aaaggagaat 840
gggcctctct ggctcccaca catggatatt ctgggagtcg aatcacttaa ctaccaggaa 900
taccttgcaa aatccaggac gattggacaa aaacctgttg acttcaaagt ggtcgtcacc 960
agggacactg ccattgtcaa tggtagctgt gttgacctcg tcaaaagcct tttggatgct 1020
aaccgctgga gagagttgtt tccaggcatc gtggcaagtg caaacaccac caagatcatc 1080
tctactgggc cctctaactt gcacgacggg ttgcttcaat tgatgcgtgc agagctccag 1140
gtaatgtcac ctgaagtccc agtttgcgat gtgacattct tgaggcagag tgtgcagttt 1200
ggaagtggac tgtggtgtgt ggttgatgtg tctattgata ccatccttcc tggagagagt 1260
aaaacagctc agtccagtgt gcagaccagc agtacagctg ccagacgcat ggaagtcagg 1320
ctgttgccat caggctgtgt tattgaagaa atggagaatg gctattccaa ggtgacctgg 1380
atggtgcatg cagcttatga tgagagagca gtgccagtgc tttatcattc acttctccgc 1440
tctgcaaaag cccttggtgc gtgccgctgg gtagcatcac tccagagaca cagccagttc 1500
ctttccggcc tgcacaaata catcttttgt cctgacagca caaaagtggt gatgcgaaga 1560
aaagtcctgt acctggtgaa gcagatgacg agcagcttca caggcctatt tgcgtcgatg 1620
tctaaggcca cgctgcaaga tggtgatgat actcacttcg cgcatcagat agttggtggt 1680
gcaacaggtg aacctgccgg actgctgctg agcgccacca caaccatatg gctccccggc 1740
gtgaacccga ggcacgtgta tgaccacctg cgtgatgagc agtgccatgg tgaatggcgc 1800
tgcctcctcg gtgagcagct gcatcagggc aatgccttgc cgtatggtgc ccccctgaat 1860
ggtgagaccg tgccagagtt ctatcgcatg gtgaacgggc tgcatgaagg gcatgctatc 1920
tccctgatca gccccagaga aatgggtggt aacataagca acactctgct cctgcaagag 1980
gcaagaactg atctttctgg ctccctcata gtttacgcca ggacagatgt gaacaccgtg 2040
cattccatca tgaacagtgg cctcaaccct gccaccgtct tcctcgtatc ctctggatgt 2100
gccattcttc ctgattgcct ggaatcattc cctctacacc cagctgcaac tgcagatcag 2160
gccggcacct ccagtgccgc tatcgctagc aggagcgaaa ccggtgggtc attcgtcacc 2220
gtcacttacc agatgttttt cagcagccaa ggtggcgcag cacctgccag ctcatcaatt 2280
catcaaggcc gtgatgcgct caagaaagcc accgacattt tcaaggtggt cctcgacact 2340
ctcaccgtgg catag 2355
<210> 495
<211> 784
<212> PRT
<213> Oryza sativa
<400> 495
Met Asn Gly Glu Leu Lys Leu Met Ala Ser Tyr Val Ser Lys Leu Lys
1 5 10 15
Phe Ile Leu Gln Lys Asp Gln Gln Gln Glu Pro His Thr Ala Asn Leu
20 25 30
Leu Val Leu Leu Gly Ser Ser Asn Gln Asp Lys Arg Asn Gly Leu Ser
35 40 45
Gln Gly Glu Asn Arg Met Asp Thr Cys Thr Arg Lys Lys Pro Arg Arg
50 55 60
Tyr Gln Leu Leu Thr Met Gln Gln Lys Glu Thr Leu Asn Arg Ala Phe
65 70 75 80
Gln Ser Cys Pro Asn Pro Asp Arg Asn Asp Leu Lys Lys Leu Ala Lys
85 90 95
Glu Leu Asn Met Thr Glu Thr Gln Ile Lys Tyr Trp Phe Gln Asn Cys
100 105 110
Arg Thr Lys Met Lys Lys Phe Lys Asn Asn Glu Glu Arg Lys Leu Leu
115 120 125
Gln Lys Glu Asn Glu Glu Leu Lys Lys Glu Asn Ala Glu Leu Arg Asn
130 135 140
Arg Met Lys Asn Ser Thr Cys Arg Ala Cys Asp Leu Pro Leu Phe His
145 150 155 160
Ile Asp Cys Arg His Trp Glu Asn Pro Met Leu Asn Lys Gly Asn His
165 170 175
Gly Val Thr Ser Asn Leu Ile Pro Gln Ala Val Ser Ser Leu Leu Pro
180 185 190
Ser Ser Ser Gly Phe Val Ala Ser Gly Ser Asn Leu Ser Ser Asn Ala
195 200 205
Val Leu Met Pro Val Ser Ala Met Pro Ser Ser Val Leu Gln Pro Ala
210 215 220
Pro Ala Val Ser Gly Ala Asn Phe Pro Ile Leu His Asn Leu Ser Ala
225 230 235 240
Asn Ala Asn Asp Gly Tyr Thr Glu Lys Asn Val Leu Leu Asp Leu Ala
245 250 255
Asn Arg Ala Met Glu Glu Phe Phe Ser Leu Met Lys Glu Asn Glu Ser
260 265 270
Leu Leu Val Lys Lys Lys Glu Asn Gly Pro Leu Trp Leu Pro His Met
275 280 285
Asp Ile Leu Gly Val Glu Ser Leu Asn Tyr Gln Glu Tyr Leu Ala Lys
290 295 300
Ser Arg Thr Ile Gly Gln Lys Pro Val Asp Phe Lys Val Val Val Thr
305 310 315 320
Arg Asp Thr Ala Ile Val Asn Gly Ser Cys Val Asp Leu Val Lys Ser
325 330 335
Leu Leu Asp Ala Asn Arg Trp Arg Glu Leu Phe Pro Gly Ile Val Ala
340 345 350
Ser Ala Asn Thr Thr Lys Ile Ile Ser Thr Gly Pro Ser Asn Leu His
355 360 365
Asp Gly Leu Leu Gln Leu Met Arg Ala Glu Leu Gln Val Met Ser Pro
370 375 380
Glu Val Pro Val Cys Asp Val Thr Phe Leu Arg Gln Ser Val Gln Phe
385 390 395 400
Gly Ser Gly Leu Trp Cys Val Val Asp Val Ser Ile Asp Thr Ile Leu
405 410 415
Pro Gly Glu Ser Lys Thr Ala Gln Ser Ser Val Gln Thr Ser Ser Thr
420 425 430
Ala Ala Arg Arg Met Glu Val Arg Leu Leu Pro Ser Gly Cys Val Ile
435 440 445
Glu Glu Met Glu Asn Gly Tyr Ser Lys Val Thr Trp Met Val His Ala
450 455 460
Ala Tyr Asp Glu Arg Ala Val Pro Val Leu Tyr His Ser Leu Leu Arg
465 470 475 480
Ser Ala Lys Ala Leu Gly Ala Cys Arg Trp Val Ala Ser Leu Gln Arg
485 490 495
His Ser Gln Phe Leu Ser Gly Leu His Lys Tyr Ile Phe Cys Pro Asp
500 505 510
Ser Thr Lys Val Val Met Arg Arg Lys Val Leu Tyr Leu Val Lys Gln
515 520 525
Met Thr Ser Ser Phe Thr Gly Leu Phe Ala Ser Met Ser Lys Ala Thr
530 535 540
Leu Gln Asp Gly Asp Asp Thr His Phe Ala His Gln Ile Val Gly Gly
545 550 555 560
Ala Thr Gly Glu Pro Ala Gly Leu Leu Leu Ser Ala Thr Thr Thr Ile
565 570 575
Trp Leu Pro Gly Val Asn Pro Arg His Val Tyr Asp His Leu Arg Asp
580 585 590
Glu Gln Cys His Gly Glu Trp Arg Cys Leu Leu Gly Glu Gln Leu His
595 600 605
Gln Gly Asn Ala Leu Pro Tyr Gly Ala Pro Leu Asn Gly Glu Thr Val
610 615 620
Pro Glu Phe Tyr Arg Met Val Asn Gly Leu His Glu Gly His Ala Ile
625 630 635 640
Ser Leu Ile Ser Pro Arg Glu Met Gly Gly Asn Ile Ser Asn Thr Leu
645 650 655
Leu Leu Gln Glu Ala Arg Thr Asp Leu Ser Gly Ser Leu Ile Val Tyr
660 665 670
Ala Arg Thr Asp Val Asn Thr Val His Ser Ile Met Asn Ser Gly Leu
675 680 685
Asn Pro Ala Thr Val Phe Leu Val Ser Ser Gly Cys Ala Ile Leu Pro
690 695 700
Asp Cys Leu Glu Ser Phe Pro Leu His Pro Ala Ala Thr Ala Asp Gln
705 710 715 720
Ala Gly Thr Ser Ser Ala Ala Ile Ala Ser Arg Ser Glu Thr Gly Gly
725 730 735
Ser Phe Val Thr Val Thr Tyr Gln Met Phe Phe Ser Ser Gln Gly Gly
740 745 750
Ala Ala Pro Ala Ser Ser Ser Ile His Gln Gly Arg Asp Ala Leu Lys
755 760 765
Lys Ala Thr Asp Ile Phe Lys Val Val Leu Asp Thr Leu Thr Val Ala
770 775 780
<210> 496
<211> 2619
<212> DNA
<213> Oryza sativa
<400> 496
atgagcttcg gtggcatgtt cgatggcgcc ggctccggcg tcttctccta cgacgccggc 60
ggcggcggcg gcggcggcgg agtacacaac tcccgcctcc tccctacgcc gcccgtcccc 120
aagcccggcg gcgggttcgc cgctcccggc ctctctctcg gcctgcaaac tatggacggt 180
agccagctcg gcgacgtgaa ccggtcgctt gccatgatgg gcaacggcgg gagcggcagc 240
ggcggcgacg gcgactcgct gggacgcggc cgggaggaag agaacgacag ccgctccggc 300
agcgacaacc tggacggcgc ctccggcgac gaactcgacc cggacaacag caacccgcgc 360
aagaagaaga agcgttatca ccgccacacc ccgcagcaaa tccaagaact cgaagccgtg 420
ttcaaggagt gtccacatcc tgacgagaag caacggatgg agctcagccg gcggctcaac 480
ctcgagagcc gccaggtcaa gttctggttc cagaatcgcc gcacccagat gaagcagacg 540
cagatcgagc ggcatgagaa cgcgctgctg cggcaggaga acgacaagct gagggcggag 600
aacatgacga tccgggaggc gatgaggaac ccgatgtgcg cgagctgcgg cggcgcggcg 660
gtgctcggcg aggtgtcgct ggaggagcag cacctgcgca tcgagaacgc gcggctcaag 720
gacgagctcg accgcgtctg cgcgctcgcc ggcaagttcc tcggccggcc aatctcgagc 780
atctcctccc cgggcccgcc gtcgctgcag gcgtgctccg gcctcgagct cggcgtcggc 840
agcaacggcg ggttcgggct cggcgcgctc ggggcctcgg cggcgatgca gtccatcccc 900
gacctgatgg gcggctcctc cggcctgacg ggggggcccg tgggctccgc cgccatgcgc 960
ctacccgcgg gcattggcgg cctcgacggc gccatgcacg ccgcggcggc cgacggcggc 1020
gccatcgacc gcgccgtgct cctggagctc gccctcgcgg ccatggacga gctcgtcaag 1080
gtggcgcaga tggacgagcc gctctggctc cccagcctcg acggcgggtt cgagacgctc 1140
aactacgacg agtaccaccg cgcgttcgcc agggtggtcg gccagtgccc cgccggctac 1200
gtctccgagg cgacgcgcga gtccggcatc gccatcatca gcagcgtcga cctcgtcgac 1260
agcctcatgg acgcgccacg gtggtcggag atgttcccgt gcgtggtggc gagagcgagc 1320
accacggaca tcatctccag cggcatgggc ggcacgcgca gcgggtcaat tcaactgatg 1380
cacgcggagc tgcaggtgct gtcgccgctg gtgccgatac gggaggtggt gttcctgcgt 1440
ttctgcaagc agcacgccga gggcctctgg gcggtggtcg acgtctcggt cgacgccgtc 1500
ctccgccccg accagaacgg cggcggcggg tcgtcgtcgt cgtcgtacat gggctgccgc 1560
ctcctcccca ccggctgcat cgtgcaggac atgaacaatg gctactccaa ggtcacgtgg 1620
gtggttcacg cggagtacga cgagacggcg gcgcaccagc tctaccggcc gctgctccgc 1680
tccggccagg ccctcggcgc ccgccgctgg ctcgcctcgc tccagcgaca gtgccagtat 1740
ctcgccatcc tctgctccaa ctccctcccc gcccgcgacc acgctgcgat aacgccggtg 1800
gggaggagga gcatgctgaa gctggcgcag cggatgacgg acaacttctg cgcgggggtg 1860
tgcgcgtcgg cggcgcagaa gtggcggcgc ctggacgagt ggcgcggcga gggtgggggc 1920
ggcggcggtg gcggcggcgg ggacggggag gacaaggtgc ggatgatggc gcggcacagc 1980
gtgggcgcgc cgggggagcc gccgggcgtc gtgctgagcg ccaccacgtc ggtgcggctc 2040
cccggcacgc tgccgcagcg cgtgttcgac tacctccgcg acgagcagcg gcgcggcgac 2100
tgggacatcc ttgccaacgg cgaggccatg caggagatgg accacatcgc caagggccag 2160
caccacggca atgccgtctc cctcctccgt ccaaatgcca caagcgggaa ccagaacaac 2220
atgctgatcc tccaggagac gtgcaccgac tcatcgggct ccctcgtcgt ctacgctccg 2280
gtggacgtgc agtcgatgca cgtcgtcatg aacggcggcg actccgccta cgtctccctc 2340
ctcccctccg gcttcgccat cctccccgac ggccacaaca atggcgcctc gccgtctccg 2400
gcagaggtcg gcagcggcgc ctcgccgaac tccgccgccg gtggcggtgg cggtagcaac 2460
aacaccgggt cgctggtgac ggtggcgttc cagatactcg tcaacaacct gccgacggcg 2520
aagctcaccg tggagtccgt cgacaccgtc agcaacctcc tctcctgcac catccagaag 2580
atcaagtcgg cactgcaggc cagcatcatc tcaccatag 2619
<210> 497
<211> 872
<212> PRT
<213> Oryza sativa
<400> 497
Met Ser Phe Gly Gly Met Phe Asp Gly Ala Gly Ser Gly Val Phe Ser
1 5 10 15
Tyr Asp Ala Gly Gly Gly Gly Gly Gly Gly Gly Val His Asn Ser Arg
20 25 30
Leu Leu Pro Thr Pro Pro Val Pro Lys Pro Gly Gly Gly Phe Ala Ala
35 40 45
Pro Gly Leu Ser Leu Gly Leu Gln Thr Met Asp Gly Ser Gln Leu Gly
50 55 60
Asp Val Asn Arg Ser Leu Ala Met Met Gly Asn Gly Gly Ser Gly Ser
65 70 75 80
Gly Gly Asp Gly Asp Ser Leu Gly Arg Gly Arg Glu Glu Glu Asn Asp
85 90 95
Ser Arg Ser Gly Ser Asp Asn Leu Asp Gly Ala Ser Gly Asp Glu Leu
100 105 110
Asp Pro Asp Asn Ser Asn Pro Arg Lys Lys Lys Lys Arg Tyr His Arg
115 120 125
His Thr Pro Gln Gln Ile Gln Glu Leu Glu Ala Val Phe Lys Glu Cys
130 135 140
Pro His Pro Asp Glu Lys Gln Arg Met Glu Leu Ser Arg Arg Leu Asn
145 150 155 160
Leu Glu Ser Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln
165 170 175
Met Lys Gln Thr Gln Ile Glu Arg His Glu Asn Ala Leu Leu Arg Gln
180 185 190
Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Thr Ile Arg Glu Ala Met
195 200 205
Arg Asn Pro Met Cys Ala Ser Cys Gly Gly Ala Ala Val Leu Gly Glu
210 215 220
Val Ser Leu Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys
225 230 235 240
Asp Glu Leu Asp Arg Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg
245 250 255
Pro Ile Ser Ser Ile Ser Ser Pro Gly Pro Pro Ser Leu Gln Ala Cys
260 265 270
Ser Gly Leu Glu Leu Gly Val Gly Ser Asn Gly Gly Phe Gly Leu Gly
275 280 285
Ala Leu Gly Ala Ser Ala Ala Met Gln Ser Ile Pro Asp Leu Met Gly
290 295 300
Gly Ser Ser Gly Leu Thr Gly Gly Pro Val Gly Ser Ala Ala Met Arg
305 310 315 320
Leu Pro Ala Gly Ile Gly Gly Leu Asp Gly Ala Met His Ala Ala Ala
325 330 335
Ala Asp Gly Gly Ala Ile Asp Arg Ala Val Leu Leu Glu Leu Ala Leu
340 345 350
Ala Ala Met Asp Glu Leu Val Lys Val Ala Gln Met Asp Glu Pro Leu
355 360 365
Trp Leu Pro Ser Leu Asp Gly Gly Phe Glu Thr Leu Asn Tyr Asp Glu
370 375 380
Tyr His Arg Ala Phe Ala Arg Val Val Gly Gln Cys Pro Ala Gly Tyr
385 390 395 400
Val Ser Glu Ala Thr Arg Glu Ser Gly Ile Ala Ile Ile Ser Ser Val
405 410 415
Asp Leu Val Asp Ser Leu Met Asp Ala Pro Arg Trp Ser Glu Met Phe
420 425 430
Pro Cys Val Val Ala Arg Ala Ser Thr Thr Asp Ile Ile Ser Ser Gly
435 440 445
Met Gly Gly Thr Arg Ser Gly Ser Ile Gln Leu Met His Ala Glu Leu
450 455 460
Gln Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Val Phe Leu Arg
465 470 475 480
Phe Cys Lys Gln His Ala Glu Gly Leu Trp Ala Val Val Asp Val Ser
485 490 495
Val Asp Ala Val Leu Arg Pro Asp Gln Asn Gly Gly Gly Gly Ser Ser
500 505 510
Ser Ser Ser Tyr Met Gly Cys Arg Leu Leu Pro Thr Gly Cys Ile Val
515 520 525
Gln Asp Met Asn Asn Gly Tyr Ser Lys Val Thr Trp Val Val His Ala
530 535 540
Glu Tyr Asp Glu Thr Ala Ala His Gln Leu Tyr Arg Pro Leu Leu Arg
545 550 555 560
Ser Gly Gln Ala Leu Gly Ala Arg Arg Trp Leu Ala Ser Leu Gln Arg
565 570 575
Gln Cys Gln Tyr Leu Ala Ile Leu Cys Ser Asn Ser Leu Pro Ala Arg
580 585 590
Asp His Ala Ala Ile Thr Pro Val Gly Arg Arg Ser Met Leu Lys Leu
595 600 605
Ala Gln Arg Met Thr Asp Asn Phe Cys Ala Gly Val Cys Ala Ser Ala
610 615 620
Ala Gln Lys Trp Arg Arg Leu Asp Glu Trp Arg Gly Glu Gly Gly Gly
625 630 635 640
Gly Gly Gly Gly Gly Gly Gly Asp Gly Glu Asp Lys Val Arg Met Met
645 650 655
Ala Arg His Ser Val Gly Ala Pro Gly Glu Pro Pro Gly Val Val Leu
660 665 670
Ser Ala Thr Thr Ser Val Arg Leu Pro Gly Thr Leu Pro Gln Arg Val
675 680 685
Phe Asp Tyr Leu Arg Asp Glu Gln Arg Arg Gly Asp Trp Asp Ile Leu
690 695 700
Ala Asn Gly Glu Ala Met Gln Glu Met Asp His Ile Ala Lys Gly Gln
705 710 715 720
His His Gly Asn Ala Val Ser Leu Leu Arg Pro Asn Ala Thr Ser Gly
725 730 735
Asn Gln Asn Asn Met Leu Ile Leu Gln Glu Thr Cys Thr Asp Ser Ser
740 745 750
Gly Ser Leu Val Val Tyr Ala Pro Val Asp Val Gln Ser Met His Val
755 760 765
Val Met Asn Gly Gly Asp Ser Ala Tyr Val Ser Leu Leu Pro Ser Gly
770 775 780
Phe Ala Ile Leu Pro Asp Gly His Asn Asn Gly Ala Ser Pro Ser Pro
785 790 795 800
Ala Glu Val Gly Ser Gly Ala Ser Pro Asn Ser Ala Ala Gly Gly Gly
805 810 815
Gly Gly Ser Asn Asn Thr Gly Ser Leu Val Thr Val Ala Phe Gln Ile
820 825 830
Leu Val Asn Asn Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Asp
835 840 845
Thr Val Ser Asn Leu Leu Ser Cys Thr Ile Gln Lys Ile Lys Ser Ala
850 855 860
Leu Gln Ala Ser Ile Ile Ser Pro
865 870
<210> 498
<211> 2250
<212> DNA
<213> Oryza sativa
<400> 498
atgcagagct tgttggatgg acaccaccat cagctgccat cactgctgca gcagcaccac 60
aatggacacc atctgcttga tcagcaccag cagcatcagc atcagcttcc cccacaggcg 120
acgacgacga gcgagagcga cggccgtgcc cctcgcgacg agctggagat gagcaagtcc 180
ggtggcagcg acaacctgga gagcggcggt ggcggtggcg gaggtggctc cggtggtgat 240
caggacccca accagcgccc ccgcaagaag cgctaccacc gccacaccca gcaccagatc 300
caggagctcg aggccttctt caaggagtgc ccccaccctg atgacaagca gcgcaaggag 360
ctcagccgcg agctcggcct cgagcccctc caggtcaagt tctggttcca gaacaagcgc 420
acccagatga agacgcagca tgagagacac gagaacaatg cgctgcgcgc agagaacgag 480
aagctgcggg cagagaacat gaggtacaag gaggcgcttg ccaacgcgtc ctgccccaac 540
tgcggcggtc cggccgccat cggcgagatg tccttcgacg agcaccacct ccgcctcgag 600
aacgcgcgcc tccgcgacga gattgacagg atctccgcca tcgccgccaa gtacgtcggc 660
aagcccgccg cggccgtctc ggccgcgtac ccgccgctgc cgccgtcgaa caggtcgccg 720
ctcgatcata tgggcattcc cggcgctggc gccgacgtgt tcggcgccga cttcgacaag 780
ccgctcgtca tcgagctcgc cgtggccgcc atggaggagc tcgtcaggat ggcgcagctc 840
ggcgagccgc tctgggcgcc ggcgctcggc ggcgaggcgc tcggcgagga ggagtacgcg 900
cgcacgttcc cgcgcgggct agggcccaag tcgccggagc tccggtcgga ggcgtcgagg 960
gagacggcgg tggtgatcat gaaccacgtc agcctcgtgg agatgctcat ggacgtcggg 1020
cagtggacgg cgctcttctc gagcatcgtg tcgcgcgcgg cgacgctgga ggtgctctcg 1080
acgggcgtcg ccggcaacca caacggcgcg ctgcagctca tgtccgccga gttccagatg 1140
ccgtcgccgc tggtgccgac gagggagacc cagttcctgc gctactgcaa gcagcacccc 1200
gacggcacgt gggccgtcgt cgacgtctcc ctcgacgggc tccgcgccgg cgccgggggc 1260
ggatgccagc cggcggcggc gcgcggccac cggcgccgcc cctccggctg cctcatccag 1320
gagatgccga acggctactc caaggtgacg tgggtggagc acgtggaggc cgacgaccag 1380
atggtgcaca acctgtacaa gccggtggtg aactccggca tggcgttcgg cgctcgccgg 1440
tgggtggcga cgctggagcg gcagtgcgag cgcctggcta gcgccatggc gagcaacgtg 1500
gcgtcctcgg gcgacgccgg cgtgatcacg acgtcggagg ggaggcggag catgctgaag 1560
ctggcggagc ggatggtggc gagcttctgc ggcggcgtga cggcgtcgac gacgcaccag 1620
tggacgacgc tctccggcag cggcgccgag gacgtccgcg tcatgacgcg caagagcgtc 1680
gacgaccccg gccgccctcc cggcatcatc ctcaacgccg ccacctcctt ctggctcccc 1740
gtcccgcctt cccgcgtctt cgacttcctc cgcgacgact ccacccgcag cgagtgggac 1800
atcctctcca atggcggcgt cgtccaagaa atggctcaca tcgccaatgg ccgcgaccac 1860
ggcaacgccg tctccctcct ccgcgtcaac aacgcgaact cgaaccagag caacatgctg 1920
atactgcagg agtgctgcac ggacgcgacg gggtcgtacg tgatatacgc gccggtggac 1980
gtggtggcga tgaacgtggt gctcaacggc ggcgacccgg actacgtggc gctgctgccg 2040
tcggggttcg ccatcctccc cgacgggccg gacggcggcg gcgggtcgct gctgacggtg 2100
gcgttccaga tactggtcga ctccgtgccc accgccaagc tgtcgctcgg ctccgtcgcc 2160
accgtcaaca gcctcatcgc ctgcaccgtc gagcgcatca aggccgccat caccggcgac 2220
aacggcgtcg cgccgccatg cccacggtga 2250
<210> 499
<211> 749
<212> PRT
<213> Oryza sativa
<400> 499
Met Gln Ser Leu Leu Asp Gly His His His Gln Leu Pro Ser Leu Leu
1 5 10 15
Gln Gln His His Asn Gly His His Leu Leu Asp Gln His Gln Gln His
20 25 30
Gln His Gln Leu Pro Pro Gln Ala Thr Thr Thr Ser Glu Ser Asp Gly
35 40 45
Arg Ala Pro Arg Asp Glu Leu Glu Met Ser Lys Ser Gly Gly Ser Asp
50 55 60
Asn Leu Glu Ser Gly Gly Gly Gly Gly Gly Gly Gly Ser Gly Gly Asp
65 70 75 80
Gln Asp Pro Asn Gln Arg Pro Arg Lys Lys Arg Tyr His Arg His Thr
85 90 95
Gln His Gln Ile Gln Glu Leu Glu Ala Phe Phe Lys Glu Cys Pro His
100 105 110
Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu
115 120 125
Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys
130 135 140
Thr Gln His Glu Arg His Glu Asn Asn Ala Leu Arg Ala Glu Asn Glu
145 150 155 160
Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Ala Asn Ala
165 170 175
Ser Cys Pro Asn Cys Gly Gly Pro Ala Ala Ile Gly Glu Met Ser Phe
180 185 190
Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Asp Glu Ile
195 200 205
Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro Ala Ala
210 215 220
Ala Val Ser Ala Ala Tyr Pro Pro Leu Pro Pro Ser Asn Arg Ser Pro
225 230 235 240
Leu Asp His Met Gly Ile Pro Gly Ala Gly Ala Asp Val Phe Gly Ala
245 250 255
Asp Phe Asp Lys Pro Leu Val Ile Glu Leu Ala Val Ala Ala Met Glu
260 265 270
Glu Leu Val Arg Met Ala Gln Leu Gly Glu Pro Leu Trp Ala Pro Ala
275 280 285
Leu Gly Gly Glu Ala Leu Gly Glu Glu Glu Tyr Ala Arg Thr Phe Pro
290 295 300
Arg Gly Leu Gly Pro Lys Ser Pro Glu Leu Arg Ser Glu Ala Ser Arg
305 310 315 320
Glu Thr Ala Val Val Ile Met Asn His Val Ser Leu Val Glu Met Leu
325 330 335
Met Asp Val Gly Gln Trp Thr Ala Leu Phe Ser Ser Ile Val Ser Arg
340 345 350
Ala Ala Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn His Asn
355 360 365
Gly Ala Leu Gln Leu Met Ser Ala Glu Phe Gln Met Pro Ser Pro Leu
370 375 380
Val Pro Thr Arg Glu Thr Gln Phe Leu Arg Tyr Cys Lys Gln His Pro
385 390 395 400
Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Gly Leu Arg Ala
405 410 415
Gly Ala Gly Gly Gly Cys Gln Pro Ala Ala Ala Arg Gly His Arg Arg
420 425 430
Arg Pro Ser Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys
435 440 445
Val Thr Trp Val Glu His Val Glu Ala Asp Asp Gln Met Val His Asn
450 455 460
Leu Tyr Lys Pro Val Val Asn Ser Gly Met Ala Phe Gly Ala Arg Arg
465 470 475 480
Trp Val Ala Thr Leu Glu Arg Gln Cys Glu Arg Leu Ala Ser Ala Met
485 490 495
Ala Ser Asn Val Ala Ser Ser Gly Asp Ala Gly Val Ile Thr Thr Ser
500 505 510
Glu Gly Arg Arg Ser Met Leu Lys Leu Ala Glu Arg Met Val Ala Ser
515 520 525
Phe Cys Gly Gly Val Thr Ala Ser Thr Thr His Gln Trp Thr Thr Leu
530 535 540
Ser Gly Ser Gly Ala Glu Asp Val Arg Val Met Thr Arg Lys Ser Val
545 550 555 560
Asp Asp Pro Gly Arg Pro Pro Gly Ile Ile Leu Asn Ala Ala Thr Ser
565 570 575
Phe Trp Leu Pro Val Pro Pro Ser Arg Val Phe Asp Phe Leu Arg Asp
580 585 590
Asp Ser Thr Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val
595 600 605
Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp His Gly Asn Ala Val
610 615 620
Ser Leu Leu Arg Val Asn Asn Ala Asn Ser Asn Gln Ser Asn Met Leu
625 630 635 640
Ile Leu Gln Glu Cys Cys Thr Asp Ala Thr Gly Ser Tyr Val Ile Tyr
645 650 655
Ala Pro Val Asp Val Val Ala Met Asn Val Val Leu Asn Gly Gly Asp
660 665 670
Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp
675 680 685
Gly Pro Asp Gly Gly Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile
690 695 700
Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala
705 710 715 720
Thr Val Asn Ser Leu Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ala
725 730 735
Ile Thr Gly Asp Asn Gly Val Ala Pro Pro Cys Pro Arg
740 745
<210> 500
<211> 2442
<212> DNA
<213> Oryza sativa
<400> 500
atgcagttcc cgttctccgg cgctggcccg ggcgtcttca cgtcatcgcc ggcgctctcc 60
ctcgcgctgg cggacgcggt ggcaggccgg aacagcggcg gcggtgggaa gatggttacc 120
gcggcccatg gcggcgtcgg cggaggagga ggaggaggac gcgcgaaggc gagggacgcg 180
ttggaggtgg agaacgagat gagccggtcc gggagcgacc acctcgacgt cgtctcttgc 240
ggcgacgcgg gcggcggcgg cggcgacgac gacgatgacg aggacgccga gcacggcaac 300
ccgcccaagc gcaagaagcg gtaccaccgc cacacgccgc agcagatcca agagctggaa 360
gcgatgttca aggaatgccc ccacccagac gagaagcagc gcgccgagct gagcaagcgg 420
ctcggcctcg aaccccggca ggtcaagttc tggttccaga atcggcgaac gcagatgaag 480
atgcaactgg agcgacacga gaactcgctg ctgaagcagg agaacgataa gctgcggtcc 540
gagaacctgt caatccggga ggccacgagc aacgcggtgt gcgttggctg cggcggcccg 600
gcgatgctcg gggaggtgtc cctggaggag caccaccttc gcgtcgagaa cgcgaggctc 660
aaggacgagc tcagccgagt gtgcgcgctc gccgccaagt tccttggcaa gtccatctct 720
gtcatggcgc caccgcagat gcatcagcct catcctgtgc caggctcgtc gctggagctt 780
gcggttgggg gtatcggttc gatgccatca gccacgatgc ccatctcgac gatcactgat 840
tttgctggcg ccatgtccag ttcaatgggc acggtgatca cgcccatgaa gtctgaggct 900
gaaccatcgg caatggctgg cattgacaag tccttgttct tggagctagc aatgagtgca 960
atggatgagc tagtcaagat ggctcagatg ggggatccgc tatggattcc aggtgcctcc 1020
gtaccttcct cgccggcaaa ggagagtcta aacttcgagg agtacctaaa caccttccca 1080
ccttgcatcg gggtgaagcc tgaagggtat gtatcagagg catctagaga atctggcatt 1140
gtcatcattg acgatggcgc cgcgcttgtg gagaccctca tggatgagcg acggtggtcc 1200
gatatgttct catgcatgat tgccaaggca tcaaccactg aggagatttc tactggtgtt 1260
gctgggagta gaaatggtgc attgcttctt gtgagtgatg aacattctgt tatgcaggca 1320
gagctacagg tgctttctcc tcttgtgcct attagagagg tgaagtttct caggttctcc 1380
aaacagctgg ctgatggtgt atgggctgta gtggacgttt cggctgatga attgatgagg 1440
gatcagggca ttacttctgc atcctcgact gcaaacatga actgccgaag gctgccttct 1500
ggttgtgtgc tgcaggacac tccaaatggg tttgttaagg tcacatgggt tgaacataca 1560
gaatatgatg aggcatctgt gcacccgctc taccggcctc ttctccggtc tggtcttgcc 1620
cttggtgcag ggcgatggat cgcgacatta cagcggcagt gcgaatgctt ggcccttctc 1680
atgtcttcta ttgcattgcc agagaacgac tcatcagcta tccatcctga aggtaaacgg 1740
agcatgttga agttggcaag gaggatgacg gacaacttct gtgcaggggt gagcacatca 1800
tctacccgtg aatggagcaa actggttgga ttgacaggca acattgggga ggatgtgcat 1860
gtaatggcgc ggaagagtgt ggatgaacct ggaacgccgc caggtgtggt gcttagtgct 1920
gctacatctg tgtggatgcc tgtgatgcct gaacggctct tcaacttctt gcacaacaag 1980
gggctgcgtg ctgaatggga tatcctcagc aatggtggcc ctatgcagga ggtgacaagc 2040
attgccaagg ggcaacagaa tggcaatacc gtatgtctac tgaaggctag tcccaccaaa 2100
gacaagcaga acagcatgct gatcctacag gagacgtgtg cagacgcatc cggttcaatg 2160
gttgtgtatg ctcctgtaga catcccagca atgcaccttg tcatgagtgg tggggattcg 2220
tcatgcgtcg cccttcttcc atcaggtttt gccatcctgc ctgctgggcc tagcatcggc 2280
gcagatcaca agatgggcgg ttcattgctc accgttgcat tccagatact tgccaacagc 2340
cagcccagtg ctaagctcac ggtggagtca gtcgagaccg tgagcaacct tatctcctgc 2400
accatcaaga agatcaagac ggcgctgcat tgcgacgtgt ga 2442
<210> 501
<211> 813
<212> PRT
<213> Oryza sativa
<400> 501
Met Gln Phe Pro Phe Ser Gly Ala Gly Pro Gly Val Phe Thr Ser Ser
1 5 10 15
Pro Ala Leu Ser Leu Ala Leu Ala Asp Ala Val Ala Gly Arg Asn Ser
20 25 30
Gly Gly Gly Gly Lys Met Val Thr Ala Ala His Gly Gly Val Gly Gly
35 40 45
Gly Gly Gly Gly Gly Arg Ala Lys Ala Arg Asp Ala Leu Glu Val Glu
50 55 60
Asn Glu Met Ser Arg Ser Gly Ser Asp His Leu Asp Val Val Ser Cys
65 70 75 80
Gly Asp Ala Gly Gly Gly Gly Gly Asp Asp Asp Asp Asp Glu Asp Ala
85 90 95
Glu His Gly Asn Pro Pro Lys Arg Lys Lys Arg Tyr His Arg His Thr
100 105 110
Pro Gln Gln Ile Gln Glu Leu Glu Ala Met Phe Lys Glu Cys Pro His
115 120 125
Pro Asp Glu Lys Gln Arg Ala Glu Leu Ser Lys Arg Leu Gly Leu Glu
130 135 140
Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
145 150 155 160
Met Gln Leu Glu Arg His Glu Asn Ser Leu Leu Lys Gln Glu Asn Asp
165 170 175
Lys Leu Arg Ser Glu Asn Leu Ser Ile Arg Glu Ala Thr Ser Asn Ala
180 185 190
Val Cys Val Gly Cys Gly Gly Pro Ala Met Leu Gly Glu Val Ser Leu
195 200 205
Glu Glu His His Leu Arg Val Glu Asn Ala Arg Leu Lys Asp Glu Leu
210 215 220
Ser Arg Val Cys Ala Leu Ala Ala Lys Phe Leu Gly Lys Ser Ile Ser
225 230 235 240
Val Met Ala Pro Pro Gln Met His Gln Pro His Pro Val Pro Gly Ser
245 250 255
Ser Leu Glu Leu Ala Val Gly Gly Ile Gly Ser Met Pro Ser Ala Thr
260 265 270
Met Pro Ile Ser Thr Ile Thr Asp Phe Ala Gly Ala Met Ser Ser Ser
275 280 285
Met Gly Thr Val Ile Thr Pro Met Lys Ser Glu Ala Glu Pro Ser Ala
290 295 300
Met Ala Gly Ile Asp Lys Ser Leu Phe Leu Glu Leu Ala Met Ser Ala
305 310 315 320
Met Asp Glu Leu Val Lys Met Ala Gln Met Gly Asp Pro Leu Trp Ile
325 330 335
Pro Gly Ala Ser Val Pro Ser Ser Pro Ala Lys Glu Ser Leu Asn Phe
340 345 350
Glu Glu Tyr Leu Asn Thr Phe Pro Pro Cys Ile Gly Val Lys Pro Glu
355 360 365
Gly Tyr Val Ser Glu Ala Ser Arg Glu Ser Gly Ile Val Ile Ile Asp
370 375 380
Asp Gly Ala Ala Leu Val Glu Thr Leu Met Asp Glu Arg Arg Trp Ser
385 390 395 400
Asp Met Phe Ser Cys Met Ile Ala Lys Ala Ser Thr Thr Glu Glu Ile
405 410 415
Ser Thr Gly Val Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Val Ser
420 425 430
Asp Glu His Ser Val Met Gln Ala Glu Leu Gln Val Leu Ser Pro Leu
435 440 445
Val Pro Ile Arg Glu Val Lys Phe Leu Arg Phe Ser Lys Gln Leu Ala
450 455 460
Asp Gly Val Trp Ala Val Val Asp Val Ser Ala Asp Glu Leu Met Arg
465 470 475 480
Asp Gln Gly Ile Thr Ser Ala Ser Ser Thr Ala Asn Met Asn Cys Arg
485 490 495
Arg Leu Pro Ser Gly Cys Val Leu Gln Asp Thr Pro Asn Gly Phe Val
500 505 510
Lys Val Thr Trp Val Glu His Thr Glu Tyr Asp Glu Ala Ser Val His
515 520 525
Pro Leu Tyr Arg Pro Leu Leu Arg Ser Gly Leu Ala Leu Gly Ala Gly
530 535 540
Arg Trp Ile Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu Ala Leu Leu
545 550 555 560
Met Ser Ser Ile Ala Leu Pro Glu Asn Asp Ser Ser Ala Ile His Pro
565 570 575
Glu Gly Lys Arg Ser Met Leu Lys Leu Ala Arg Arg Met Thr Asp Asn
580 585 590
Phe Cys Ala Gly Val Ser Thr Ser Ser Thr Arg Glu Trp Ser Lys Leu
595 600 605
Val Gly Leu Thr Gly Asn Ile Gly Glu Asp Val His Val Met Ala Arg
610 615 620
Lys Ser Val Asp Glu Pro Gly Thr Pro Pro Gly Val Val Leu Ser Ala
625 630 635 640
Ala Thr Ser Val Trp Met Pro Val Met Pro Glu Arg Leu Phe Asn Phe
645 650 655
Leu His Asn Lys Gly Leu Arg Ala Glu Trp Asp Ile Leu Ser Asn Gly
660 665 670
Gly Pro Met Gln Glu Val Thr Ser Ile Ala Lys Gly Gln Gln Asn Gly
675 680 685
Asn Thr Val Cys Leu Leu Lys Ala Ser Pro Thr Lys Asp Lys Gln Asn
690 695 700
Ser Met Leu Ile Leu Gln Glu Thr Cys Ala Asp Ala Ser Gly Ser Met
705 710 715 720
Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Leu Val Met Ser
725 730 735
Gly Gly Asp Ser Ser Cys Val Ala Leu Leu Pro Ser Gly Phe Ala Ile
740 745 750
Leu Pro Ala Gly Pro Ser Ile Gly Ala Asp His Lys Met Gly Gly Ser
755 760 765
Leu Leu Thr Val Ala Phe Gln Ile Leu Ala Asn Ser Gln Pro Ser Ala
770 775 780
Lys Leu Thr Val Glu Ser Val Glu Thr Val Ser Asn Leu Ile Ser Cys
785 790 795 800
Thr Ile Lys Lys Ile Lys Thr Ala Leu His Cys Asp Val
805 810
<210> 502
<211> 2430
<212> DNA
<213> Populus trichocarpa
<400> 502
atgtttggtg attgccaagt tatgtcaaac atgggaggga atgtagtctc gtctgataac 60
ctctactcat cgccgatcgg aaaccctaac ttcagcttca tgtcaagcat gcccttccac 120
actttctcac ccatcatccc taaagaagaa aatgggttag tcatgcgagg gaaggaggaa 180
atggaaagtg gttctggcag tgaacaactt gaagacaggt cagggaacga gcaagaaagc 240
agcgagcaac ctccaaagaa gaaacgttac cataggcaca ctgcagctca gatccaagaa 300
atggaagcca tgtttaaaga atgtccacac ccagatgaca aacaaagaat gagacttagc 360
caagaacttg gtctaaaacc acgccaagtt aagttttggt tccaaaaccg ccgtacccaa 420
atgaaggcac agcaagaccg gtcggataat cttatactca gggcagaaaa tgagagcttg 480
aagaatgaca attacaggct acaagcggag ttacgcaatc ttatttgtcc caattgtggg 540
ggccaagcca tgcttggagc aattcctttt gaggaacttc gacttgaaaa tgcaagactt 600
agagatgagt tggagcgtgt ttgctgtatt acttcacggt atggcggccg gcaaatccac 660
tcaatggtac cggttccttc attcgttccc ccttccttgg atttggatat gaacatgtat 720
tcaaggccgt ttccagagta tttgggcact tgcaccgata tgatgccggt gcctgtgcct 780
gtgctggaag aaccatcttc atttcctgag gctggtgtgg tattaatgga ggagggaaaa 840
ggtcttgcga tggaacttgc attgtcgtcc atggatgaac ttgtgaagat gtgtcatgca 900
aatgagcctc tttggatcag aaacattgaa aatgggaagg aagtgcttaa tcttgaagag 960
cacgggagaa tgtttccatg gccttccaat ctcaagcaga attcaagtga gacgaggact 1020
gaagctactc gtgattgtgc tgtggttata atgaatagca taaccttggt tgacgctttc 1080
ctggatgcaa ataaatggat ggagctgttt ccctccattg ttgctagagc aaaaactgtt 1140
caagttataa caccaggcat ttccggtgca agtggttctc ttcacctgca gatgtatgct 1200
gaattgcaag ttctttcccc attggtgcca actcgggaga cgtattttct tcgcttttgc 1260
catcaaaatg tagaggaggg cacttgggcc attgtcgatt tccctcttga tagactccac 1320
gacaacatcc agccgtcctt tcccctgtat aagagacatc cgtccggttg tgttattcaa 1380
gacatgccca atgggtactc aagggtgaca tggatagaac atgcagagat agaggagaag 1440
cctgtccatc agatatttag ccagtatgtc tatagtggga tggcattcgg agcacatcgc 1500
tggttaacag tcttacagag acaatgcgag agggttgcta gcctcatggc tagaaatatc 1560
tctgacctag gagtaatacc ctctcctgaa gcacggaaga atatgatgag actggctcaa 1620
agaatgatca gaatatttag cctgaatatc agctcttcta gtggccaatc atggaccggt 1680
ttatcggatt catatgatga cactgttaga attaccacaa ggaaaatcac tgagcctggg 1740
cagcctaatg gggttattct ctctgcagta tccacaactt ggctgcccta tcctcactac 1800
caagtctttg acctcttgag ggatgaacat cgcagatctc agctggaact tctttccaat 1860
gggaatgcct tgcatgaggt tgctcacatt gccaatggct ctcatccagg aaactgcatt 1920
tctcttctgc gcatcaacgt tgcaagcaac tcatcacagc atgtagagct catgctacaa 1980
gagtgttgca ctgatcaatc cggcagcctt gttgtctaca ccaccgttga tgttgagtca 2040
attcagctgg caatgagtgg cgaggatcca tcctgcattc ctctacttcc actaggtttt 2100
gtcatagttc cagtagaatc cagcagtgct gttagtgaag gcaactcaat gccatctaat 2160
tccgaggatg gaaacggtca taacaactca ggctgtctac tcactgtggg gctccaagtc 2220
cttgcaagca ctattccatc tgcaaagctc aacctctcca gcgttactgc aataaacaac 2280
catctgtgca acacagtgaa ccaaatcacc gctgctctta gcagcaccac cacaaccacc 2340
accatcacca ccactagcag ctgccttgac aacggcaatg ctgtaggctc ttgcaatatc 2400
gagcctacag ctgcatcgaa acaggtttag 2430
<210> 503
<211> 809
<212> PRT
<213> Populus trichocarpa
<400> 503
Met Phe Gly Asp Cys Gln Val Met Ser Asn Met Gly Gly Asn Val Val
1 5 10 15
Ser Ser Asp Asn Leu Tyr Ser Ser Pro Ile Gly Asn Pro Asn Phe Ser
20 25 30
Phe Met Ser Ser Met Pro Phe His Thr Phe Ser Pro Ile Ile Pro Lys
35 40 45
Glu Glu Asn Gly Leu Val Met Arg Gly Lys Glu Glu Met Glu Ser Gly
50 55 60
Ser Gly Ser Glu Gln Leu Glu Asp Arg Ser Gly Asn Glu Gln Glu Ser
65 70 75 80
Ser Glu Gln Pro Pro Lys Lys Lys Arg Tyr His Arg His Thr Ala Ala
85 90 95
Gln Ile Gln Glu Met Glu Ala Met Phe Lys Glu Cys Pro His Pro Asp
100 105 110
Asp Lys Gln Arg Met Arg Leu Ser Gln Glu Leu Gly Leu Lys Pro Arg
115 120 125
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Ala Gln
130 135 140
Gln Asp Arg Ser Asp Asn Leu Ile Leu Arg Ala Glu Asn Glu Ser Leu
145 150 155 160
Lys Asn Asp Asn Tyr Arg Leu Gln Ala Glu Leu Arg Asn Leu Ile Cys
165 170 175
Pro Asn Cys Gly Gly Gln Ala Met Leu Gly Ala Ile Pro Phe Glu Glu
180 185 190
Leu Arg Leu Glu Asn Ala Arg Leu Arg Asp Glu Leu Glu Arg Val Cys
195 200 205
Cys Ile Thr Ser Arg Tyr Gly Gly Arg Gln Ile His Ser Met Val Pro
210 215 220
Val Pro Ser Phe Val Pro Pro Ser Leu Asp Leu Asp Met Asn Met Tyr
225 230 235 240
Ser Arg Pro Phe Pro Glu Tyr Leu Gly Thr Cys Thr Asp Met Met Pro
245 250 255
Val Pro Val Pro Val Leu Glu Glu Pro Ser Ser Phe Pro Glu Ala Gly
260 265 270
Val Val Leu Met Glu Glu Gly Lys Gly Leu Ala Met Glu Leu Ala Leu
275 280 285
Ser Ser Met Asp Glu Leu Val Lys Met Cys His Ala Asn Glu Pro Leu
290 295 300
Trp Ile Arg Asn Ile Glu Asn Gly Lys Glu Val Leu Asn Leu Glu Glu
305 310 315 320
His Gly Arg Met Phe Pro Trp Pro Ser Asn Leu Lys Gln Asn Ser Ser
325 330 335
Glu Thr Arg Thr Glu Ala Thr Arg Asp Cys Ala Val Val Ile Met Asn
340 345 350
Ser Ile Thr Leu Val Asp Ala Phe Leu Asp Ala Asn Lys Trp Met Glu
355 360 365
Leu Phe Pro Ser Ile Val Ala Arg Ala Lys Thr Val Gln Val Ile Thr
370 375 380
Pro Gly Ile Ser Gly Ala Ser Gly Ser Leu His Leu Gln Met Tyr Ala
385 390 395 400
Glu Leu Gln Val Leu Ser Pro Leu Val Pro Thr Arg Glu Thr Tyr Phe
405 410 415
Leu Arg Phe Cys His Gln Asn Val Glu Glu Gly Thr Trp Ala Ile Val
420 425 430
Asp Phe Pro Leu Asp Arg Leu His Asp Asn Ile Gln Pro Ser Phe Pro
435 440 445
Leu Tyr Lys Arg His Pro Ser Gly Cys Val Ile Gln Asp Met Pro Asn
450 455 460
Gly Tyr Ser Arg Val Thr Trp Ile Glu His Ala Glu Ile Glu Glu Lys
465 470 475 480
Pro Val His Gln Ile Phe Ser Gln Tyr Val Tyr Ser Gly Met Ala Phe
485 490 495
Gly Ala His Arg Trp Leu Thr Val Leu Gln Arg Gln Cys Glu Arg Val
500 505 510
Ala Ser Leu Met Ala Arg Asn Ile Ser Asp Leu Gly Val Ile Pro Ser
515 520 525
Pro Glu Ala Arg Lys Asn Met Met Arg Leu Ala Gln Arg Met Ile Arg
530 535 540
Ile Phe Ser Leu Asn Ile Ser Ser Ser Ser Gly Gln Ser Trp Thr Gly
545 550 555 560
Leu Ser Asp Ser Tyr Asp Asp Thr Val Arg Ile Thr Thr Arg Lys Ile
565 570 575
Thr Glu Pro Gly Gln Pro Asn Gly Val Ile Leu Ser Ala Val Ser Thr
580 585 590
Thr Trp Leu Pro Tyr Pro His Tyr Gln Val Phe Asp Leu Leu Arg Asp
595 600 605
Glu His Arg Arg Ser Gln Leu Glu Leu Leu Ser Asn Gly Asn Ala Leu
610 615 620
His Glu Val Ala His Ile Ala Asn Gly Ser His Pro Gly Asn Cys Ile
625 630 635 640
Ser Leu Leu Arg Ile Asn Val Ala Ser Asn Ser Ser Gln His Val Glu
645 650 655
Leu Met Leu Gln Glu Cys Cys Thr Asp Gln Ser Gly Ser Leu Val Val
660 665 670
Tyr Thr Thr Val Asp Val Glu Ser Ile Gln Leu Ala Met Ser Gly Glu
675 680 685
Asp Pro Ser Cys Ile Pro Leu Leu Pro Leu Gly Phe Val Ile Val Pro
690 695 700
Val Glu Ser Ser Ser Ala Val Ser Glu Gly Asn Ser Met Pro Ser Asn
705 710 715 720
Ser Glu Asp Gly Asn Gly His Asn Asn Ser Gly Cys Leu Leu Thr Val
725 730 735
Gly Leu Gln Val Leu Ala Ser Thr Ile Pro Ser Ala Lys Leu Asn Leu
740 745 750
Ser Ser Val Thr Ala Ile Asn Asn His Leu Cys Asn Thr Val Asn Gln
755 760 765
Ile Thr Ala Ala Leu Ser Ser Thr Thr Thr Thr Thr Thr Ile Thr Thr
770 775 780
Thr Ser Ser Cys Leu Asp Asn Gly Asn Ala Val Gly Ser Cys Asn Ile
785 790 795 800
Glu Pro Thr Ala Ala Ser Lys Gln Val
805
<210> 504
<211> 2415
<212> DNA
<213> Populus trichocarpa
<400> 504
atgtttggtg atcgccaagt tatgtcaaac atgggaggga atgtagtctc ctccgatacc 60
atctattcgt tgccgatcga aaaccctagc ttcaacttca tgtcaagcat gcctttccac 120
actctctccc ccattatctc taaagaagga aacgggctag ttatgccagg taaggaggaa 180
gtggaaagtg ggtctggctg tgaacaactt gaagagaagt cagggaatga ggaagagagc 240
agcgagcaac ctccaaagaa gaaacgttac cacaggcaca ctgcacgcca gatccaagaa 300
atggaagcca tgtttaagga atgcccacac ccagatgaca aacaaagaat gagactcagc 360
catgaacttg gtctaaaacc acgccaagtc aagttttggt tccaaaaccg ccgtacccaa 420
atgaaggcac aacaagaccg atcggataat aatatactca gggcagaaaa tgagagcttg 480
cagaatgata attacaggct acaagcggag ttacgaaatc ttatttgtcc cgattgtgga 540
ggtcaagcca tgcttggaga aattcccttt gaggatcttc gacttgaaca tgcaagactt 600
agagaagagt tggagcgcgt ttgttgtatt gcttcaagat atggcggccg gccaatccac 660
tcaatggtac cggctcctgc ttttgttccc ccttccttgg atttggatat gagcatatat 720
tcaaggccgt ttccggagtc tttgggcact tgcattgata tgatgcctat gcctatgttg 780
ccagaaccat cttcctttcc tgaggctggt atagtattaa tggaggaggg agaaggtctt 840
gcaatggggc ttgcattgtc gtccatggat gaacttgtga agatgtgtaa tgcaaatgag 900
cctctttgga tcacaaacaa tgagaatgga aaggaagtgc ttaatcttga agagcatgcg 960
agaatgtttc catggccttc caatctcaaa cagaactcta gtgacatgag gactgaagct 1020
actcgtgatt gtgctgtggt tataatgaat agcattaact tggttgatgc tttcctggat 1080
gctaataaat ggatggagct gtttccctcc attgttgcta gagcaaaaac tgttcaagtt 1140
ataaaaacag gcgtttgcgg tgcaagcggt tcccttcacc tgatgtatgc agaattgcaa 1200
gttctttccc cattggtgcc aactcgagaa acacattttc ttcgcttttg ccaacaaaat 1260
gtagaggagg gcacttgggc tattgtcgat tttcccctcg atagcttcca cgacaacatc 1320
cgaccttcct ttcccctgta caggagacgt ccgtccggct gtgtaattca agacttgccc 1380
aatgggtact caaagttgac atggatagaa catgcagaga tagaggataa gcctgtccat 1440
cagatattta gccagtatat ctatagtggg atggcatttg gagcacatcg ctggttagca 1500
gtcttacaga gacaatgcga gagagttgca agcctcatgg ctagaaatat ctctgaccta 1560
ggagtaatac cctctcctga agcacggaag aacatgatga gactggctca aagaatgatc 1620
agaactttta gcctgaatat cagcacttct agtggccaat catggacagc tttacccgat 1680
tcccatgatg gcactgttag aattatctca agggaaatca cggagcctgg ccagcctaat 1740
ggggtcattc tctctgcagt atccacaact tggctgccct atcctcactt cctagtcttt 1800
gatctgttga gggatgaaca tcgcagatct cagctggaag ttctttccaa tgggaatgcc 1860
ttgcatgagg ttgctcacat tgccaacggc tctcatccag gaaactgcat ctctcttctt 1920
cgcatcaacg tcgccagcaa ctcatcacag catgtagatc tcatgctaca agagagttgc 1980
actgatcaat caggcagcct tgtcgtgttc accaccgtgg acgttgagtc aattcagctg 2040
gcaatgagcg gcgaggatcc atcatgcatt cctctacttc cactaggttt tgtcatagtc 2100
ccagtagaat ccagcagtag cactgtcagt gaaggcaatt caatgcaatc taattctgag 2160
gatggaaatg gaaatggaca taacaactca ggctgcctac tgactgtggg tctccaagcc 2220
cttgcaagca ctattccatc tgcaaagctc aatttctcca gtgtcactgc gataaacaac 2280
catttgtgca acacagtgaa ccaaatcact gttgctctta gcaacaacac caccaccact 2340
agcagctgcc ttgataacag caatgctgta gggtcttgca atgagcctac agctgcaccc 2400
aaacaacaag tttag 2415
<210> 505
<211> 804
<212> PRT
<213> Populus trichocarpa
<400> 505
Met Phe Gly Asp Arg Gln Val Met Ser Asn Met Gly Gly Asn Val Val
1 5 10 15
Ser Ser Asp Thr Ile Tyr Ser Leu Pro Ile Glu Asn Pro Ser Phe Asn
20 25 30
Phe Met Ser Ser Met Pro Phe His Thr Leu Ser Pro Ile Ile Ser Lys
35 40 45
Glu Gly Asn Gly Leu Val Met Pro Gly Lys Glu Glu Val Glu Ser Gly
50 55 60
Ser Gly Cys Glu Gln Leu Glu Glu Lys Ser Gly Asn Glu Glu Glu Ser
65 70 75 80
Ser Glu Gln Pro Pro Lys Lys Lys Arg Tyr His Arg His Thr Ala Arg
85 90 95
Gln Ile Gln Glu Met Glu Ala Met Phe Lys Glu Cys Pro His Pro Asp
100 105 110
Asp Lys Gln Arg Met Arg Leu Ser His Glu Leu Gly Leu Lys Pro Arg
115 120 125
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Ala Gln
130 135 140
Gln Asp Arg Ser Asp Asn Asn Ile Leu Arg Ala Glu Asn Glu Ser Leu
145 150 155 160
Gln Asn Asp Asn Tyr Arg Leu Gln Ala Glu Leu Arg Asn Leu Ile Cys
165 170 175
Pro Asp Cys Gly Gly Gln Ala Met Leu Gly Glu Ile Pro Phe Glu Asp
180 185 190
Leu Arg Leu Glu His Ala Arg Leu Arg Glu Glu Leu Glu Arg Val Cys
195 200 205
Cys Ile Ala Ser Arg Tyr Gly Gly Arg Pro Ile His Ser Met Val Pro
210 215 220
Ala Pro Ala Phe Val Pro Pro Ser Leu Asp Leu Asp Met Ser Ile Tyr
225 230 235 240
Ser Arg Pro Phe Pro Glu Ser Leu Gly Thr Cys Ile Asp Met Met Pro
245 250 255
Met Pro Met Leu Pro Glu Pro Ser Ser Phe Pro Glu Ala Gly Ile Val
260 265 270
Leu Met Glu Glu Gly Glu Gly Leu Ala Met Gly Leu Ala Leu Ser Ser
275 280 285
Met Asp Glu Leu Val Lys Met Cys Asn Ala Asn Glu Pro Leu Trp Ile
290 295 300
Thr Asn Asn Glu Asn Gly Lys Glu Val Leu Asn Leu Glu Glu His Ala
305 310 315 320
Arg Met Phe Pro Trp Pro Ser Asn Leu Lys Gln Asn Ser Ser Asp Met
325 330 335
Arg Thr Glu Ala Thr Arg Asp Cys Ala Val Val Ile Met Asn Ser Ile
340 345 350
Asn Leu Val Asp Ala Phe Leu Asp Ala Asn Lys Trp Met Glu Leu Phe
355 360 365
Pro Ser Ile Val Ala Arg Ala Lys Thr Val Gln Val Ile Lys Thr Gly
370 375 380
Val Cys Gly Ala Ser Gly Ser Leu His Leu Met Tyr Ala Glu Leu Gln
385 390 395 400
Val Leu Ser Pro Leu Val Pro Thr Arg Glu Thr His Phe Leu Arg Phe
405 410 415
Cys Gln Gln Asn Val Glu Glu Gly Thr Trp Ala Ile Val Asp Phe Pro
420 425 430
Leu Asp Ser Phe His Asp Asn Ile Arg Pro Ser Phe Pro Leu Tyr Arg
435 440 445
Arg Arg Pro Ser Gly Cys Val Ile Gln Asp Leu Pro Asn Gly Tyr Ser
450 455 460
Lys Leu Thr Trp Ile Glu His Ala Glu Ile Glu Asp Lys Pro Val His
465 470 475 480
Gln Ile Phe Ser Gln Tyr Ile Tyr Ser Gly Met Ala Phe Gly Ala His
485 490 495
Arg Trp Leu Ala Val Leu Gln Arg Gln Cys Glu Arg Val Ala Ser Leu
500 505 510
Met Ala Arg Asn Ile Ser Asp Leu Gly Val Ile Pro Ser Pro Glu Ala
515 520 525
Arg Lys Asn Met Met Arg Leu Ala Gln Arg Met Ile Arg Thr Phe Ser
530 535 540
Leu Asn Ile Ser Thr Ser Ser Gly Gln Ser Trp Thr Ala Leu Pro Asp
545 550 555 560
Ser His Asp Gly Thr Val Arg Ile Ile Ser Arg Glu Ile Thr Glu Pro
565 570 575
Gly Gln Pro Asn Gly Val Ile Leu Ser Ala Val Ser Thr Thr Trp Leu
580 585 590
Pro Tyr Pro His Phe Leu Val Phe Asp Leu Leu Arg Asp Glu His Arg
595 600 605
Arg Ser Gln Leu Glu Val Leu Ser Asn Gly Asn Ala Leu His Glu Val
610 615 620
Ala His Ile Ala Asn Gly Ser His Pro Gly Asn Cys Ile Ser Leu Leu
625 630 635 640
Arg Ile Asn Val Ala Ser Asn Ser Ser Gln His Val Asp Leu Met Leu
645 650 655
Gln Glu Ser Cys Thr Asp Gln Ser Gly Ser Leu Val Val Phe Thr Thr
660 665 670
Val Asp Val Glu Ser Ile Gln Leu Ala Met Ser Gly Glu Asp Pro Ser
675 680 685
Cys Ile Pro Leu Leu Pro Leu Gly Phe Val Ile Val Pro Val Glu Ser
690 695 700
Ser Ser Ser Thr Val Ser Glu Gly Asn Ser Met Gln Ser Asn Ser Glu
705 710 715 720
Asp Gly Asn Gly Asn Gly His Asn Asn Ser Gly Cys Leu Leu Thr Val
725 730 735
Gly Leu Gln Ala Leu Ala Ser Thr Ile Pro Ser Ala Lys Leu Asn Phe
740 745 750
Ser Ser Val Thr Ala Ile Asn Asn His Leu Cys Asn Thr Val Asn Gln
755 760 765
Ile Thr Val Ala Leu Ser Asn Asn Thr Thr Thr Thr Ser Ser Cys Leu
770 775 780
Asp Asn Ser Asn Ala Val Gly Ser Cys Asn Glu Pro Thr Ala Ala Pro
785 790 795 800
Lys Gln Gln Val
<210> 506
<211> 2373
<212> DNA
<213> Populus trichocarpa
<400> 506
atgcccactg gtgcaatagc tcagactcgc cttgtctctc cttctatcac taaatccatg 60
ttcaactctc ctggactctc tctagccctt caacagccaa acatagatgg tcaaggagat 120
ataactagaa tggctgagaa ctttgagaca agtgtgggta ggagaagcag agaagaggaa 180
catgagagca gatctggtag tgataacatg gatggtgcgt ctggtgacga tcaagatgca 240
gctgataatc ctccaagaaa aaagagatac caccgacaca ctccacaaca aatccaagaa 300
cttgaagctt tgtttaagga atgtcctcat cctgacgaga aacaaagatt ggagcttagt 360
agaaggctgt gcttggagac taggcaagtc aagttctggt ttcaaaatcg tagaacccaa 420
atgaagactc aactggagcg ccatgagaac tcattactca ggcaagataa cgacaagctt 480
cgagcagaaa acatgtccat aagagatgcc atgagaaatc catcgtgctc aaactgtggt 540
ggtcctgcga taattggtga tatgtcactt gaagaacagc atttgaggat tgagaatgct 600
agattaaaag atgaactaga tcgagtttgt gcacttgcgg gcaagttctt gggtcgcccc 660
atatcttcgt tagcttcttc acttagccct ccgacgaatt caagcctgga acttgcagtt 720
ggtagtaatg gttttgctgg tttaagcacc attgctacaa cattgccttt gggacctcat 780
tttgaaggtg ggatttctgg tgctttgtct atggtaactc aaactagact agcaacagct 840
ggtgttactg gtattgatag atcagtagag agatccatgt tcttggagtt ggctttagct 900
gccatggatg aattggtgaa aatggttcag acggatgagc ctctttggat cgggagcttt 960
gagggtggta gagaaatatt gaaccatgag gggtacttga gaaccttcac tccttgcatt 1020
ggaatgaagc ctagtggctt tgttagtgag gcttctagag agactggtat ggtaatcata 1080
aacagtttgg ccttagttga gacactgatg gattcgaacc gatgggcaga aatgtttcct 1140
tgtatgattg caaggacctc taccactgat gtgatagcca gtggaatggg gggaactaga 1200
aatggttcac ttcagttgat gcaagccgag ctccatgttt tatccccatt ggttccggtg 1260
cgtgaggtca attttctccg attttgcaag cagcacgcag agggggtttg ggctgttgtt 1320
gatgtatcca ttgataccat ccgagatact tccggtgcac caccgacatt tgtgaactgc 1380
aggaggcttc cttctggttg tgtggtgcaa gatatgccca atgggtactc caaggttaca 1440
tgggttgagc atgcacaata tgatgaaagg caaatacacc agctctatcg gccggtgata 1500
agctccggca tgggcttcgg tgcccaacga tggatagcta cccttcaacg tcaatgcgag 1560
tgtttggcca tcctcttgtc ctccaatgta cctagtagag accacacagc gataactaca 1620
agtggtcgcc gaagcatgtt gaagctggcg caaagaatga ccgataactt ctgtgctggg 1680
gtttgtgcct ccacagtgca caaatggaac aagctgaatg ccggaaatgt tgatgaagat 1740
gttagggtta tgacccgaaa gagtgtcgat gatcctggtg agccaccagg catagttttg 1800
agcgctgcga cctctgtttg gctacctgtt tctccacaaa ggctctttga tttcctacgc 1860
aatgaacgac tcagaagcga gtgggacata ctctccaacg gtggaccaat gcaggaaatg 1920
gcccacattg ctaaaggcca ggatcacggc aactgtgtct ctctcctacg tgctagcgcc 1980
atgaatgcta accagagtag catgctaata ctgcaagaga catgcataga tgcagcaggc 2040
tctcttgtag tgtacgctcc cgttgacact ccggccatgc acgtagtgat gaacggtggt 2100
gattcggctt acgtggcgct tcttccgtca gggtttgcta tcgtaccgga tgggcctggt 2160
tcacgtgacc ccccatcgac taatggcggc ccgactgcta ataatgtcgg tggccaagag 2220
agggtgagtg ggtccctttt gacggtggcc ttccaaatat tggtgaatag tctacctacg 2280
gcgaagctta cagtagaatc tgtggagaca gtcaacaacc ttatttcatg cactgtccaa 2340
aagatcaagg ctgctctcca atgtgaaagc tga 2373
<210> 507
<211> 790
<212> PRT
<213> Populus trichocarpa
<400> 507
Met Pro Thr Gly Ala Ile Ala Gln Thr Arg Leu Val Ser Pro Ser Ile
1 5 10 15
Thr Lys Ser Met Phe Asn Ser Pro Gly Leu Ser Leu Ala Leu Gln Gln
20 25 30
Pro Asn Ile Asp Gly Gln Gly Asp Ile Thr Arg Met Ala Glu Asn Phe
35 40 45
Glu Thr Ser Val Gly Arg Arg Ser Arg Glu Glu Glu His Glu Ser Arg
50 55 60
Ser Gly Ser Asp Asn Met Asp Gly Ala Ser Gly Asp Asp Gln Asp Ala
65 70 75 80
Ala Asp Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
85 90 95
Gln Ile Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp
100 105 110
Glu Lys Gln Arg Leu Glu Leu Ser Arg Arg Leu Cys Leu Glu Thr Arg
115 120 125
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
130 135 140
Leu Glu Arg His Glu Asn Ser Leu Leu Arg Gln Asp Asn Asp Lys Leu
145 150 155 160
Arg Ala Glu Asn Met Ser Ile Arg Asp Ala Met Arg Asn Pro Ser Cys
165 170 175
Ser Asn Cys Gly Gly Pro Ala Ile Ile Gly Asp Met Ser Leu Glu Glu
180 185 190
Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
195 200 205
Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro Ile Ser Ser Leu
210 215 220
Ala Ser Ser Leu Ser Pro Pro Thr Asn Ser Ser Leu Glu Leu Ala Val
225 230 235 240
Gly Ser Asn Gly Phe Ala Gly Leu Ser Thr Ile Ala Thr Thr Leu Pro
245 250 255
Leu Gly Pro His Phe Glu Gly Gly Ile Ser Gly Ala Leu Ser Met Val
260 265 270
Thr Gln Thr Arg Leu Ala Thr Ala Gly Val Thr Gly Ile Asp Arg Ser
275 280 285
Val Glu Arg Ser Met Phe Leu Glu Leu Ala Leu Ala Ala Met Asp Glu
290 295 300
Leu Val Lys Met Val Gln Thr Asp Glu Pro Leu Trp Ile Gly Ser Phe
305 310 315 320
Glu Gly Gly Arg Glu Ile Leu Asn His Glu Gly Tyr Leu Arg Thr Phe
325 330 335
Thr Pro Cys Ile Gly Met Lys Pro Ser Gly Phe Val Ser Glu Ala Ser
340 345 350
Arg Glu Thr Gly Met Val Ile Ile Asn Ser Leu Ala Leu Val Glu Thr
355 360 365
Leu Met Asp Ser Asn Arg Trp Ala Glu Met Phe Pro Cys Met Ile Ala
370 375 380
Arg Thr Ser Thr Thr Asp Val Ile Ala Ser Gly Met Gly Gly Thr Arg
385 390 395 400
Asn Gly Ser Leu Gln Leu Met Gln Ala Glu Leu His Val Leu Ser Pro
405 410 415
Leu Val Pro Val Arg Glu Val Asn Phe Leu Arg Phe Cys Lys Gln His
420 425 430
Ala Glu Gly Val Trp Ala Val Val Asp Val Ser Ile Asp Thr Ile Arg
435 440 445
Asp Thr Ser Gly Ala Pro Pro Thr Phe Val Asn Cys Arg Arg Leu Pro
450 455 460
Ser Gly Cys Val Val Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr
465 470 475 480
Trp Val Glu His Ala Gln Tyr Asp Glu Arg Gln Ile His Gln Leu Tyr
485 490 495
Arg Pro Val Ile Ser Ser Gly Met Gly Phe Gly Ala Gln Arg Trp Ile
500 505 510
Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile Leu Leu Ser Ser
515 520 525
Asn Val Pro Ser Arg Asp His Thr Ala Ile Thr Thr Ser Gly Arg Arg
530 535 540
Ser Met Leu Lys Leu Ala Gln Arg Met Thr Asp Asn Phe Cys Ala Gly
545 550 555 560
Val Cys Ala Ser Thr Val His Lys Trp Asn Lys Leu Asn Ala Gly Asn
565 570 575
Val Asp Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro
580 585 590
Gly Glu Pro Pro Gly Ile Val Leu Ser Ala Ala Thr Ser Val Trp Leu
595 600 605
Pro Val Ser Pro Gln Arg Leu Phe Asp Phe Leu Arg Asn Glu Arg Leu
610 615 620
Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met
625 630 635 640
Ala His Ile Ala Lys Gly Gln Asp His Gly Asn Cys Val Ser Leu Leu
645 650 655
Arg Ala Ser Ala Met Asn Ala Asn Gln Ser Ser Met Leu Ile Leu Gln
660 665 670
Glu Thr Cys Ile Asp Ala Ala Gly Ser Leu Val Val Tyr Ala Pro Val
675 680 685
Asp Thr Pro Ala Met His Val Val Met Asn Gly Gly Asp Ser Ala Tyr
690 695 700
Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Val Pro Asp Gly Pro Gly
705 710 715 720
Ser Arg Asp Pro Pro Ser Thr Asn Gly Gly Pro Thr Ala Asn Asn Val
725 730 735
Gly Gly Gln Glu Arg Val Ser Gly Ser Leu Leu Thr Val Ala Phe Gln
740 745 750
Ile Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val
755 760 765
Glu Thr Val Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ala
770 775 780
Ala Leu Gln Cys Glu Ser
785 790
<210> 508
<211> 2124
<212> DNA
<213> Populus trichocarpa
<400> 508
atggagtatg gcagtgttgg aggaggaact agtggcggtg gtggtggaga ccatgactcc 60
tctgatcctc aaaggaggaa gaagcgttat caccgccaca ctgctctcca gattcagaag 120
ttggagtcaa tgtttaagga gtgtccacac ccagatgaga aacaaaggtt acagttaagt 180
agagagttgg gtttggcacc aagacagatc aagttttggt ttcaaaacag gaggacccag 240
atgaaggctc aacatgaaag agcagataac tcttctctta gagctgagaa tgataagatc 300
cgatgtgaga atatagccat tagagaggca ctcaagaatg taatatgccc ctcttgtggg 360
ggtcctcctg ttacggagga ttcctatttt gatgaacaca aactaagaat ggagaatgtt 420
caattgaaag aagagcttga tagagtttct agcattgctg ctaaatacat agggaggcca 480
atttcccaac tccctccagt gcaacctttt cacatttctt ccttggattt atcaatgggg 540
aattttgggg cccaagggat tggtggccct tcacttgatc ttgatcttat cccaactagt 600
tcaaatttgg ctttccaacc tccagtcatt tcggatatgg acaagtccct tatgactgat 660
gttgctgcaa atgctatgga ggaattgtta aggcttttgc aaaccaacga acctttgtgg 720
atgaaatcgt ccgctgatgg gagagatgtt cttaatctcg atagctacca gaggatcttt 780
ccaagggcta tgagtcactt aaagaatccc aatgttcgaa tagaagcatc ccgagattca 840
ggtgttgtta tcatgaatgg tgtagctttg gttgacatgt ttatggattc aaacaagtgg 900
gtcgaatcat ttcccacgat ggtgtctgtg gcaaagacca ttgaagtaat ttcatctgga 960
atgttgggta gtcacagtgg ttctttgcaa ctgatgtatg aagagttgca ggtgctttca 1020
cccctggttc cgactcggga attctgtatc ctccggtatt gtcagcaaat tgagcaaggc 1080
ttatgggcaa ttgttagtgt ttcatatgat attccacagt ttgcctccca atttcgatgt 1140
cataggcttc cctctggatg cttgattcag gatatgccaa atggatactc aaaggttact 1200
tgggtggaac atgtagagat cgaagacaaa accacaactc atcagcttta tagggatctc 1260
attcacagtg gtatggcttt tggagctgaa cgatggcttg ctacacttca aaggatgtgc 1320
gaaagagtgg catgtcaaat ggtgtccggc aattcgaccc gggatcttgg aggagtaatt 1380
ccatcaccag aaggtaagag aagcatgatg aaacttgccc aacgaatggt cagcagtttc 1440
tgttctagca taagcacatc taacagccac cgatggagca cactatctgg gttgcatgat 1500
gttggagttc gagttacact ccataagagc acggatcctg gccaacctaa tggtgtagtt 1560
ctaagtgcag ctaccacatt ttcacttcca gtttctcctc aaaatgtctt cagtttcttc 1620
aaggatgaaa gaacccgacc acagtgggat gtactctcta gcggcaatgc agtccaagaa 1680
gttgcccata tcacaaatgg ttcacatccc gggaactgca tatctgttct tcgagcctac 1740
aacactagtc agaacaatat gttaatactg caagagagct gtgtcgactc atcaggttca 1800
cttgtagtct attgtcccgt cgatctacca gccatcaaca tagcaatgag cggtgaggac 1860
ccttcttata tacctctgct gccatcagga ttcgccattt ctcctgatgg ccgtcctgac 1920
caaggagatg gtgcatcaac aagctctaat acacaaggaa gcacggccag gttgagcggt 1980
tcactaatta cagtagcatt tcaaatacta gtcagcagct tgccatctgc taaactgaac 2040
ctggagtcag tgaatactgt taataacctt attggcacca ctgtccagca aattaaggct 2100
gccatgaatt gtcctagttc ctga 2124
<210> 509
<211> 707
<212> PRT
<213> Populus trichocarpa
<400> 509
Met Glu Tyr Gly Ser Val Gly Gly Gly Thr Ser Gly Gly Gly Gly Gly
1 5 10 15
Asp His Asp Ser Ser Asp Pro Gln Arg Arg Lys Lys Arg Tyr His Arg
20 25 30
His Thr Ala Leu Gln Ile Gln Lys Leu Glu Ser Met Phe Lys Glu Cys
35 40 45
Pro His Pro Asp Glu Lys Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly
50 55 60
Leu Ala Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln
65 70 75 80
Met Lys Ala Gln His Glu Arg Ala Asp Asn Ser Ser Leu Arg Ala Glu
85 90 95
Asn Asp Lys Ile Arg Cys Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys
100 105 110
Asn Val Ile Cys Pro Ser Cys Gly Gly Pro Pro Val Thr Glu Asp Ser
115 120 125
Tyr Phe Asp Glu His Lys Leu Arg Met Glu Asn Val Gln Leu Lys Glu
130 135 140
Glu Leu Asp Arg Val Ser Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro
145 150 155 160
Ile Ser Gln Leu Pro Pro Val Gln Pro Phe His Ile Ser Ser Leu Asp
165 170 175
Leu Ser Met Gly Asn Phe Gly Ala Gln Gly Ile Gly Gly Pro Ser Leu
180 185 190
Asp Leu Asp Leu Ile Pro Thr Ser Ser Asn Leu Ala Phe Gln Pro Pro
195 200 205
Val Ile Ser Asp Met Asp Lys Ser Leu Met Thr Asp Val Ala Ala Asn
210 215 220
Ala Met Glu Glu Leu Leu Arg Leu Leu Gln Thr Asn Glu Pro Leu Trp
225 230 235 240
Met Lys Ser Ser Ala Asp Gly Arg Asp Val Leu Asn Leu Asp Ser Tyr
245 250 255
Gln Arg Ile Phe Pro Arg Ala Met Ser His Leu Lys Asn Pro Asn Val
260 265 270
Arg Ile Glu Ala Ser Arg Asp Ser Gly Val Val Ile Met Asn Gly Val
275 280 285
Ala Leu Val Asp Met Phe Met Asp Ser Asn Lys Trp Val Glu Ser Phe
290 295 300
Pro Thr Met Val Ser Val Ala Lys Thr Ile Glu Val Ile Ser Ser Gly
305 310 315 320
Met Leu Gly Ser His Ser Gly Ser Leu Gln Leu Met Tyr Glu Glu Leu
325 330 335
Gln Val Leu Ser Pro Leu Val Pro Thr Arg Glu Phe Cys Ile Leu Arg
340 345 350
Tyr Cys Gln Gln Ile Glu Gln Gly Leu Trp Ala Ile Val Ser Val Ser
355 360 365
Tyr Asp Ile Pro Gln Phe Ala Ser Gln Phe Arg Cys His Arg Leu Pro
370 375 380
Ser Gly Cys Leu Ile Gln Asp Met Pro Asn Gly Tyr Ser Lys Val Thr
385 390 395 400
Trp Val Glu His Val Glu Ile Glu Asp Lys Thr Thr Thr His Gln Leu
405 410 415
Tyr Arg Asp Leu Ile His Ser Gly Met Ala Phe Gly Ala Glu Arg Trp
420 425 430
Leu Ala Thr Leu Gln Arg Met Cys Glu Arg Val Ala Cys Gln Met Val
435 440 445
Ser Gly Asn Ser Thr Arg Asp Leu Gly Gly Val Ile Pro Ser Pro Glu
450 455 460
Gly Lys Arg Ser Met Met Lys Leu Ala Gln Arg Met Val Ser Ser Phe
465 470 475 480
Cys Ser Ser Ile Ser Thr Ser Asn Ser His Arg Trp Ser Thr Leu Ser
485 490 495
Gly Leu His Asp Val Gly Val Arg Val Thr Leu His Lys Ser Thr Asp
500 505 510
Pro Gly Gln Pro Asn Gly Val Val Leu Ser Ala Ala Thr Thr Phe Ser
515 520 525
Leu Pro Val Ser Pro Gln Asn Val Phe Ser Phe Phe Lys Asp Glu Arg
530 535 540
Thr Arg Pro Gln Trp Asp Val Leu Ser Ser Gly Asn Ala Val Gln Glu
545 550 555 560
Val Ala His Ile Thr Asn Gly Ser His Pro Gly Asn Cys Ile Ser Val
565 570 575
Leu Arg Ala Tyr Asn Thr Ser Gln Asn Asn Met Leu Ile Leu Gln Glu
580 585 590
Ser Cys Val Asp Ser Ser Gly Ser Leu Val Val Tyr Cys Pro Val Asp
595 600 605
Leu Pro Ala Ile Asn Ile Ala Met Ser Gly Glu Asp Pro Ser Tyr Ile
610 615 620
Pro Leu Leu Pro Ser Gly Phe Ala Ile Ser Pro Asp Gly Arg Pro Asp
625 630 635 640
Gln Gly Asp Gly Ala Ser Thr Ser Ser Asn Thr Gln Gly Ser Thr Ala
645 650 655
Arg Leu Ser Gly Ser Leu Ile Thr Val Ala Phe Gln Ile Leu Val Ser
660 665 670
Ser Leu Pro Ser Ala Lys Leu Asn Leu Glu Ser Val Asn Thr Val Asn
675 680 685
Asn Leu Ile Gly Thr Thr Val Gln Gln Ile Lys Ala Ala Met Asn Cys
690 695 700
Pro Ser Ser
705
<210> 510
<211> 2247
<212> DNA
<213> Populus trichocarpa
<400> 510
atggatagtc atggtgacat gggcctactt ggggaacatt ttgatcctag tttggtaggg 60
aggatgaggg aggatggtta tgagagcagg tctggaagtg ataacattga aggtgcatct 120
ggggaagatc aggatgctgg agattatcaa aggcctagga agaagtacaa tagacacact 180
gctaatcaaa tacaagagct tgaatctttc tttaaggaat gtcctcatcc tgatgaaaaa 240
caaagatcag agcttagcag gaggcttggc ttggaaagca agcaaatcaa gttttggttt 300
caaaatagga gaactcaaat gaagacccag ttggaacggc atgagaatgc aatcctcagg 360
caagaaaatg ataaactccg agctgagaat gagttgttga aacaaaacat gagtgatcca 420
atttgcaaca attgtggtgg tcctgtggtg cctgttccag tgtcttatga gcagcagcag 480
ttaagaattg aaaatgctcg attgaaggat gaattaggcc gtgtttgtgc cctagccaat 540
aagtttttag gcagacctct cacatcctcg gccagtcctg tccctccctt tggctcaaac 600
accaagttcg accttgcagt tgggagaaat ggttatggca atttaggcca tacagacaac 660
acgttgccaa tggggcttga caataatgga ggggttatga tgcctctgat gaaaccaata 720
ggcaatgctg ttggcaatga agtaccattt gatagatcaa tgtttgtaga tcttgcactg 780
gctgctatgg atgaattgat taagattgct caggttgaaa gtcccatttg gatcaaaagc 840
ttggatggag ggaaggaagt cctgaaccat gaagagtata tgaggacttt tcctccttgt 900
attggcatga aacccagcaa ttttgttatc gaggcaactc gggagagtgg tgtagtactc 960
gccaacagct tggatctggt tgagacattg atggacgtga atggatgggt ggaaatgttt 1020
cccagcttga ttgctagagc tgcgaccatt gatatcgtat caagtggcat gggcggaaca 1080
aaaagtggag ctttgcaaat gatacatgct gaatttcaag tgatttctcc ttttgtccct 1140
gtgcgtcaag tgaagttcct tcggttatgc aagcaactag cagagggtgt gtgggctgtg 1200
gctgatgttt ctgttgatgg aaaccaggaa aatctaaatg cacaaacccc tgtaacctgc 1260
agaaggcttc cttctggctg cataatacaa gacatgaaca atggttgctg caaggttaca 1320
tgggtggaac attctgaata tgatgagagt gcagtccatc gactctaccg acacatacta 1380
aattctggca tgggctttgg tgcacagagg tggattgccg cccttcaacg gcactacgag 1440
tgcatggcaa tgctcttgtc ccctaccatt ttgggtgaag atcagacagt gataaatctg 1500
ggaggtaaga aaagcatgtt aaagttggca cgacgaatgg tggatagctt ctgttctggg 1560
gtctgtgctt ctactttgca taactggggc aaccttgtgg ttgaaagtgt gagtgaagat 1620
gtgaggattt tgacccgaaa gattatcaat gaacctggtg agccagatgg tattgtgctg 1680
agtgtttcaa cttctgtttg gctgccggtt tcacaacaaa ggttatttga ctttttgagg 1740
gatgaacaat caaggagcca atgggacatt ttatccaatg gtggaatatt gcaggagatg 1800
gtccaaatcc ccaagggcca gggacattgg aacactgtct ctgtcttgcg ttcaactgct 1860
gttgatgcta acgcgagtga caacatgttg atattgcaag aaacctggaa tgatgtctcg 1920
ggttcgttag tagtgtacgc accagtcgac gtacaatcag tgagtgtagt gatgaatggt 1980
ggagactcta cctatgtggc tctcttgcca tcaggatttg tgattcttcc aggcaattca 2040
ttcagtaatg gtgagccaaa caactgcaat gggaatccag ctaagagaga ctgtgatggc 2100
aacagtggag gcggatcttt tttgactgtt ggattccaaa ttttggcgag caaccttcct 2160
tcagccaaac tcacagtcga gtcagtcaag acagttcaca atcttatctc ctgcaccatg 2220
cagaggatca aaacagcctt caactaa 2247
<210> 511
<211> 748
<212> PRT
<213> Populus trichocarpa
<400> 511
Met Asp Ser His Gly Asp Met Gly Leu Leu Gly Glu His Phe Asp Pro
1 5 10 15
Ser Leu Val Gly Arg Met Arg Glu Asp Gly Tyr Glu Ser Arg Ser Gly
20 25 30
Ser Asp Asn Ile Glu Gly Ala Ser Gly Glu Asp Gln Asp Ala Gly Asp
35 40 45
Tyr Gln Arg Pro Arg Lys Lys Tyr Asn Arg His Thr Ala Asn Gln Ile
50 55 60
Gln Glu Leu Glu Ser Phe Phe Lys Glu Cys Pro His Pro Asp Glu Lys
65 70 75 80
Gln Arg Ser Glu Leu Ser Arg Arg Leu Gly Leu Glu Ser Lys Gln Ile
85 90 95
Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu
100 105 110
Arg His Glu Asn Ala Ile Leu Arg Gln Glu Asn Asp Lys Leu Arg Ala
115 120 125
Glu Asn Glu Leu Leu Lys Gln Asn Met Ser Asp Pro Ile Cys Asn Asn
130 135 140
Cys Gly Gly Pro Val Val Pro Val Pro Val Ser Tyr Glu Gln Gln Gln
145 150 155 160
Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Gly Arg Val Cys
165 170 175
Ala Leu Ala Asn Lys Phe Leu Gly Arg Pro Leu Thr Ser Ser Ala Ser
180 185 190
Pro Val Pro Pro Phe Gly Ser Asn Thr Lys Phe Asp Leu Ala Val Gly
195 200 205
Arg Asn Gly Tyr Gly Asn Leu Gly His Thr Asp Asn Thr Leu Pro Met
210 215 220
Gly Leu Asp Asn Asn Gly Gly Val Met Met Pro Leu Met Lys Pro Ile
225 230 235 240
Gly Asn Ala Val Gly Asn Glu Val Pro Phe Asp Arg Ser Met Phe Val
245 250 255
Asp Leu Ala Leu Ala Ala Met Asp Glu Leu Ile Lys Ile Ala Gln Val
260 265 270
Glu Ser Pro Ile Trp Ile Lys Ser Leu Asp Gly Gly Lys Glu Val Leu
275 280 285
Asn His Glu Glu Tyr Met Arg Thr Phe Pro Pro Cys Ile Gly Met Lys
290 295 300
Pro Ser Asn Phe Val Ile Glu Ala Thr Arg Glu Ser Gly Val Val Leu
305 310 315 320
Ala Asn Ser Leu Asp Leu Val Glu Thr Leu Met Asp Val Asn Gly Trp
325 330 335
Val Glu Met Phe Pro Ser Leu Ile Ala Arg Ala Ala Thr Ile Asp Ile
340 345 350
Val Ser Ser Gly Met Gly Gly Thr Lys Ser Gly Ala Leu Gln Met Ile
355 360 365
His Ala Glu Phe Gln Val Ile Ser Pro Phe Val Pro Val Arg Gln Val
370 375 380
Lys Phe Leu Arg Leu Cys Lys Gln Leu Ala Glu Gly Val Trp Ala Val
385 390 395 400
Ala Asp Val Ser Val Asp Gly Asn Gln Glu Asn Leu Asn Ala Gln Thr
405 410 415
Pro Val Thr Cys Arg Arg Leu Pro Ser Gly Cys Ile Ile Gln Asp Met
420 425 430
Asn Asn Gly Cys Cys Lys Val Thr Trp Val Glu His Ser Glu Tyr Asp
435 440 445
Glu Ser Ala Val His Arg Leu Tyr Arg His Ile Leu Asn Ser Gly Met
450 455 460
Gly Phe Gly Ala Gln Arg Trp Ile Ala Ala Leu Gln Arg His Tyr Glu
465 470 475 480
Cys Met Ala Met Leu Leu Ser Pro Thr Ile Leu Gly Glu Asp Gln Thr
485 490 495
Val Ile Asn Leu Gly Gly Lys Lys Ser Met Leu Lys Leu Ala Arg Arg
500 505 510
Met Val Asp Ser Phe Cys Ser Gly Val Cys Ala Ser Thr Leu His Asn
515 520 525
Trp Gly Asn Leu Val Val Glu Ser Val Ser Glu Asp Val Arg Ile Leu
530 535 540
Thr Arg Lys Ile Ile Asn Glu Pro Gly Glu Pro Asp Gly Ile Val Leu
545 550 555 560
Ser Val Ser Thr Ser Val Trp Leu Pro Val Ser Gln Gln Arg Leu Phe
565 570 575
Asp Phe Leu Arg Asp Glu Gln Ser Arg Ser Gln Trp Asp Ile Leu Ser
580 585 590
Asn Gly Gly Ile Leu Gln Glu Met Val Gln Ile Pro Lys Gly Gln Gly
595 600 605
His Trp Asn Thr Val Ser Val Leu Arg Ser Thr Ala Val Asp Ala Asn
610 615 620
Ala Ser Asp Asn Met Leu Ile Leu Gln Glu Thr Trp Asn Asp Val Ser
625 630 635 640
Gly Ser Leu Val Val Tyr Ala Pro Val Asp Val Gln Ser Val Ser Val
645 650 655
Val Met Asn Gly Gly Asp Ser Thr Tyr Val Ala Leu Leu Pro Ser Gly
660 665 670
Phe Val Ile Leu Pro Gly Asn Ser Phe Ser Asn Gly Glu Pro Asn Asn
675 680 685
Cys Asn Gly Asn Pro Ala Lys Arg Asp Cys Asp Gly Asn Ser Gly Gly
690 695 700
Gly Ser Phe Leu Thr Val Gly Phe Gln Ile Leu Ala Ser Asn Leu Pro
705 710 715 720
Ser Ala Lys Leu Thr Val Glu Ser Val Lys Thr Val His Asn Leu Ile
725 730 735
Ser Cys Thr Met Gln Arg Ile Lys Thr Ala Phe Asn
740 745
<210> 512
<211> 2286
<212> DNA
<213> Populus trichocarpa
<400> 512
atgccagccg gagtaatgat tccggcaaga aacatgccat caatgatcgg ggttaatggt 60
aatgttggtg ggtttggatc atcctccgga cttgctcttg gtcagccaaa catgatggaa 120
ggtcacgagt ttcatcatct agacatgaca cacaacacat ctgaaggcga catgactcga 180
attagagatg aggaatttga tagtaccaac acaaaatcag gcagtgagaa tcaagaaggc 240
gcttcaggtg atgatcaaga cccacgcccc aaaaagaagc gctaccatcg ccatacccag 300
catcagatcc aagaaatgga agctttcttc aaagagtgtc cacacccaga tgacaagcaa 360
aggaaggagt taagccgaga attagggtta gagcctttgc aagtcaagtt ttggttccaa 420
aataagcgta cccaaatgaa gacccagcat gagcgccatg aaaacacaca gcttcgaaat 480
gagaatgaaa agcttagggc tgacaacatg cggtacaggg aagctcttag caatgcctcg 540
tgtcctaatt gcggagggcc tactgccata ggagagatgt cctttgatga acatcatttg 600
agacttgaaa atactagatt gagagaagag attgaccgta tttcagcaat tgctgctagg 660
tatgttggca agcctgtggt gaactatcct gttctatcgc ctccaatgcc tccacgtcca 720
gttgaccttg gtgttgggaa ttttggtgga caaccaggct taggagggga tatttatgaa 780
gctggagacc tactaaggtc tattagtgca cctactgagg ctgataagcc catgataatt 840
gagcttgcag tggcagccat ggaggaacta attagaatgg ctcaaatgga tgaaccttta 900
tggatgaaca gccttgatgg aattgatgca gtgttgaatg aagatgaata cataaggata 960
ttccctcatg gtattggtcc taaacctact ggttttaaat gtgaggcttc aagagagtct 1020
gctgttgtta tcatgaacca catcaacctt gtcgagtatc tgatggatgt gaatcagtgg 1080
tctacattgt tttctggcat tgtctcaaga gctttgactt tagaagtgct atctacagga 1140
gttgcaggga actacaatgg agccttgcaa gtgatgacag ctgaatttca acttccaact 1200
ccacttgttc ctactcgtga aagttactat gtcaggtact gtaaacaaca tgctgatggg 1260
acttgggctg tggttgatgt ttcattggac agtatacgcc ctggtccagc agcaagatgt 1320
cgaagaaggc catctggatg tttaattcaa gaaatgccca atggttactc gaaggttaca 1380
tgggttgaac atgtagaagt ggatgataga ggtgttcata atctatacaa gcatctagtt 1440
agctcaggac atgcattcgg ggcaaaacgt tgggtcgcaa ccctaaaccg gcaatgcgag 1500
cgccttgcca gtgccatggc aacaaacatt cctgctggtg atgctggtgt tattactaat 1560
caagaaggaa gaaagagtat gatgaagctg gcagagagaa tggtgataag cttctgtgct 1620
ggcgtgagcg cctctaccgc ccacacatgg actacactat ctgggactgg agctgatgat 1680
gtcagggtca tgacaaggaa gagtgtagat gatccaggga ggcctcctgg gattgtgctt 1740
agtgcagcaa cttccttctg gcttccagtt ccaccaaaga gggtttttga ttttctacgt 1800
gatgagaaca cccgtaatga gtgggatatt ctatcaaatg gtggggttgt ccaagaaatg 1860
gcacacattg ctaatggccg ggatacaggc aactgtgtat ctctaatccg agttaatagc 1920
gcgaattcga gccagagcaa catgctgatt ttgcaagaga gttgcactga tcaaacggcc 1980
tctttcgtaa tctatgctcc tgttgatatt gttgcaatga acgtggtgct taacggcggg 2040
gatccagatt atgtggcact tcttccatca gggtttgcta tttttcctga tggaaccgca 2100
gcgcatggag taggcatgga tgaatctggg tctacaggag gatctcttct aactgtcgcg 2160
ttccagattc tggttgattc agttcctaca gcaaaactgt ctcttggctc agttgcaact 2220
gttaacaact tgattgcatg cactgtggag aggattaagg cttccttatc atgcgaatct 2280
gcatga 2286
<210> 513
<211> 761
<212> PRT
<213> Populus trichocarpa
<400> 513
Met Pro Ala Gly Val Met Ile Pro Ala Arg Asn Met Pro Ser Met Ile
1 5 10 15
Gly Val Asn Gly Asn Val Gly Gly Phe Gly Ser Ser Ser Gly Leu Ala
20 25 30
Leu Gly Gln Pro Asn Met Met Glu Gly His Glu Phe His His Leu Asp
35 40 45
Met Thr His Asn Thr Ser Glu Gly Asp Met Thr Arg Ile Arg Asp Glu
50 55 60
Glu Phe Asp Ser Thr Asn Thr Lys Ser Gly Ser Glu Asn Gln Glu Gly
65 70 75 80
Ala Ser Gly Asp Asp Gln Asp Pro Arg Pro Lys Lys Lys Arg Tyr His
85 90 95
Arg His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu
100 105 110
Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu
115 120 125
Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr
130 135 140
Gln Met Lys Thr Gln His Glu Arg His Glu Asn Thr Gln Leu Arg Asn
145 150 155 160
Glu Asn Glu Lys Leu Arg Ala Asp Asn Met Arg Tyr Arg Glu Ala Leu
165 170 175
Ser Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly Glu
180 185 190
Met Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Thr Arg Leu Arg
195 200 205
Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Arg Tyr Val Gly Lys
210 215 220
Pro Val Val Asn Tyr Pro Val Leu Ser Pro Pro Met Pro Pro Arg Pro
225 230 235 240
Val Asp Leu Gly Val Gly Asn Phe Gly Gly Gln Pro Gly Leu Gly Gly
245 250 255
Asp Ile Tyr Glu Ala Gly Asp Leu Leu Arg Ser Ile Ser Ala Pro Thr
260 265 270
Glu Ala Asp Lys Pro Met Ile Ile Glu Leu Ala Val Ala Ala Met Glu
275 280 285
Glu Leu Ile Arg Met Ala Gln Met Asp Glu Pro Leu Trp Met Asn Ser
290 295 300
Leu Asp Gly Ile Asp Ala Val Leu Asn Glu Asp Glu Tyr Ile Arg Ile
305 310 315 320
Phe Pro His Gly Ile Gly Pro Lys Pro Thr Gly Phe Lys Cys Glu Ala
325 330 335
Ser Arg Glu Ser Ala Val Val Ile Met Asn His Ile Asn Leu Val Glu
340 345 350
Tyr Leu Met Asp Val Asn Gln Trp Ser Thr Leu Phe Ser Gly Ile Val
355 360 365
Ser Arg Ala Leu Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn
370 375 380
Tyr Asn Gly Ala Leu Gln Val Met Thr Ala Glu Phe Gln Leu Pro Thr
385 390 395 400
Pro Leu Val Pro Thr Arg Glu Ser Tyr Tyr Val Arg Tyr Cys Lys Gln
405 410 415
His Ala Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Ser Ile
420 425 430
Arg Pro Gly Pro Ala Ala Arg Cys Arg Arg Arg Pro Ser Gly Cys Leu
435 440 445
Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His
450 455 460
Val Glu Val Asp Asp Arg Gly Val His Asn Leu Tyr Lys His Leu Val
465 470 475 480
Ser Ser Gly His Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu Asn
485 490 495
Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Thr Asn Ile Pro Ala
500 505 510
Gly Asp Ala Gly Val Ile Thr Asn Gln Glu Gly Arg Lys Ser Met Met
515 520 525
Lys Leu Ala Glu Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala
530 535 540
Ser Thr Ala His Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Asp Asp
545 550 555 560
Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro
565 570 575
Gly Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro
580 585 590
Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Asn Thr Arg Asn Glu Trp
595 600 605
Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala
610 615 620
Asn Gly Arg Asp Thr Gly Asn Cys Val Ser Leu Ile Arg Val Asn Ser
625 630 635 640
Ala Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr
645 650 655
Asp Gln Thr Ala Ser Phe Val Ile Tyr Ala Pro Val Asp Ile Val Ala
660 665 670
Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu
675 680 685
Pro Ser Gly Phe Ala Ile Phe Pro Asp Gly Thr Ala Ala His Gly Val
690 695 700
Gly Met Asp Glu Ser Gly Ser Thr Gly Gly Ser Leu Leu Thr Val Ala
705 710 715 720
Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly
725 730 735
Ser Val Ala Thr Val Asn Asn Leu Ile Ala Cys Thr Val Glu Arg Ile
740 745 750
Lys Ala Ser Leu Ser Cys Glu Ser Ala
755 760
<210> 514
<211> 2136
<212> DNA
<213> Populus trichocarpa
<400> 514
atggagtatg gcagtgctgg aggaggaagt ggtggtggtg gtggcgggga ccatgattcc 60
tctgaccctc aaaggaggaa gaagcgttat caccgccaca ctgctcacca gattcagaag 120
ttggaatcaa tgtttaagga gtttccacac ccagatgaga aacaaaggtt acagttaagt 180
agagagttgg gtttggcacc aagacagatc aagttttggt tccaaaacag gaggacccag 240
atgaaggctc aacatgaaag agcagataac agctctctta gagctgagaa tgataagatc 300
cggtgtgaga atatagccat tagagaggcg ctcaagaatg ttatttgccc ctcttgtggg 360
gcgcctcctg ttacggagga ttcctatttt gatgaacaga aattaagaat cgagaatgct 420
caattgaaag aagagcttga tagagtttct agcattgctg ctaaatacat agggagacca 480
atttcccaac tccctccggt gcaacctgtt cacatttctt cattggattt atcaatgggg 540
aattttggtg gccaaggtct tggtggtcct gcacttgatc ttgatcttga tcttgatctt 600
ataccgacta attcaaattt ggcttttcaa ccgcctggca tttcggacat ggacaagtct 660
ctcatgactg atgttgctac aaacgcaatg gaggaactgt tgaggctttt gcaagctaat 720
gaatctttat ggatgaaatc gtccactgat gggagagatg ttcttaatct cgatagctac 780
caaaggatct ttccaagggc tatgagtcac ttaaagaatc ccaatgttcg aattgaatca 840
tcccgagatt caggtgttgt tatcatgaat ggtgtagcct tggttgacat gtttatggat 900
tcaaacaagt gggtcgaatc atttcccacc atcgtgtctg tggcaaagac cattgaagtc 960
atttcatctg gaatgttggg taatcacagc ggttccttgc aactgatgta tgaagagttg 1020
caggtgcttt cacccctggt tccaactcgg gaattctgta tcctccggta ttgtcagcaa 1080
attgagcaag gcttgtgggc aattgttagt gtttcatatg atattccaca gtttgcttcc 1140
caatttcaat gtcacaggct tccctctgga tgcttgattc aggatatgcc taatggatac 1200
tcaaaggtta tttgggtgga acatgtagag atagaagaca aagccccaac ccaccagctt 1260
tatagggatc tcattcacag cggtttggcc tttggagcag aacggtggct tgctacactg 1320
caaaggatgt gtgaaagggt ggcatgtcaa atggtgtcag gaagttcaac tcgagatctt 1380
ggaggagtaa ttccatcacc agaaggtaag agaagtatga tgaaacttgg ccagcgaatg 1440
gtcagcagtt tctgttctag cataagcaca tctaacagcc accgatggag cacactatcc 1500
gggttgcatg acgttggagt tcgaattaca ctccataaga acacggatcc tggccaacct 1560
aatggtgtag ttctaagtgc ggcgactaca ttttcgcttc cagtatctcc tcaaaatgtc 1620
ttcaatttct tcaaggatga aaagactcga ccacagtggg atgttctctc tagtggcaat 1680
gcagtccaag aagttgccca tattgcaaat gggtcccatc ctgggaactg catatctgtt 1740
cttcgagcct acaacactag ccagaacaat atgttaatac ttcaagagag ctgcatggac 1800
tcatcaggtt cacttgtagt ctattgccct gtcgatctac cagccatcaa catagcaatg 1860
agtggggagg acccttccta tatacctctt ctgccatcag gattcaccat ttcacctgat 1920
ggttatcctg accaaggaga tggtgcatcc acaagctcta atacacaagg acgcatggct 1980
aggtcgagtg gttcactaat cacagtagct tttcaaatat tagttagcag cttgccatct 2040
gctagactga acctggagtc agtgaatacc gttaatagcc ttattggaac caccatccag 2100
caaattaagg ctgccttgag ttgtcctggt tcctga 2136
<210> 515
<211> 711
<212> PRT
<213> Populus trichocarpa
<400> 515
Met Glu Tyr Gly Ser Ala Gly Gly Gly Ser Gly Gly Gly Gly Gly Gly
1 5 10 15
Asp His Asp Ser Ser Asp Pro Gln Arg Arg Lys Lys Arg Tyr His Arg
20 25 30
His Thr Ala His Gln Ile Gln Lys Leu Glu Ser Met Phe Lys Glu Phe
35 40 45
Pro His Pro Asp Glu Lys Gln Arg Leu Gln Leu Ser Arg Glu Leu Gly
50 55 60
Leu Ala Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln
65 70 75 80
Met Lys Ala Gln His Glu Arg Ala Asp Asn Ser Ser Leu Arg Ala Glu
85 90 95
Asn Asp Lys Ile Arg Cys Glu Asn Ile Ala Ile Arg Glu Ala Leu Lys
100 105 110
Asn Val Ile Cys Pro Ser Cys Gly Ala Pro Pro Val Thr Glu Asp Ser
115 120 125
Tyr Phe Asp Glu Gln Lys Leu Arg Ile Glu Asn Ala Gln Leu Lys Glu
130 135 140
Glu Leu Asp Arg Val Ser Ser Ile Ala Ala Lys Tyr Ile Gly Arg Pro
145 150 155 160
Ile Ser Gln Leu Pro Pro Val Gln Pro Val His Ile Ser Ser Leu Asp
165 170 175
Leu Ser Met Gly Asn Phe Gly Gly Gln Gly Leu Gly Gly Pro Ala Leu
180 185 190
Asp Leu Asp Leu Asp Leu Asp Leu Ile Pro Thr Asn Ser Asn Leu Ala
195 200 205
Phe Gln Pro Pro Gly Ile Ser Asp Met Asp Lys Ser Leu Met Thr Asp
210 215 220
Val Ala Thr Asn Ala Met Glu Glu Leu Leu Arg Leu Leu Gln Ala Asn
225 230 235 240
Glu Ser Leu Trp Met Lys Ser Ser Thr Asp Gly Arg Asp Val Leu Asn
245 250 255
Leu Asp Ser Tyr Gln Arg Ile Phe Pro Arg Ala Met Ser His Leu Lys
260 265 270
Asn Pro Asn Val Arg Ile Glu Ser Ser Arg Asp Ser Gly Val Val Ile
275 280 285
Met Asn Gly Val Ala Leu Val Asp Met Phe Met Asp Ser Asn Lys Trp
290 295 300
Val Glu Ser Phe Pro Thr Ile Val Ser Val Ala Lys Thr Ile Glu Val
305 310 315 320
Ile Ser Ser Gly Met Leu Gly Asn His Ser Gly Ser Leu Gln Leu Met
325 330 335
Tyr Glu Glu Leu Gln Val Leu Ser Pro Leu Val Pro Thr Arg Glu Phe
340 345 350
Cys Ile Leu Arg Tyr Cys Gln Gln Ile Glu Gln Gly Leu Trp Ala Ile
355 360 365
Val Ser Val Ser Tyr Asp Ile Pro Gln Phe Ala Ser Gln Phe Gln Cys
370 375 380
His Arg Leu Pro Ser Gly Cys Leu Ile Gln Asp Met Pro Asn Gly Tyr
385 390 395 400
Ser Lys Val Ile Trp Val Glu His Val Glu Ile Glu Asp Lys Ala Pro
405 410 415
Thr His Gln Leu Tyr Arg Asp Leu Ile His Ser Gly Leu Ala Phe Gly
420 425 430
Ala Glu Arg Trp Leu Ala Thr Leu Gln Arg Met Cys Glu Arg Val Ala
435 440 445
Cys Gln Met Val Ser Gly Ser Ser Thr Arg Asp Leu Gly Gly Val Ile
450 455 460
Pro Ser Pro Glu Gly Lys Arg Ser Met Met Lys Leu Gly Gln Arg Met
465 470 475 480
Val Ser Ser Phe Cys Ser Ser Ile Ser Thr Ser Asn Ser His Arg Trp
485 490 495
Ser Thr Leu Ser Gly Leu His Asp Val Gly Val Arg Ile Thr Leu His
500 505 510
Lys Asn Thr Asp Pro Gly Gln Pro Asn Gly Val Val Leu Ser Ala Ala
515 520 525
Thr Thr Phe Ser Leu Pro Val Ser Pro Gln Asn Val Phe Asn Phe Phe
530 535 540
Lys Asp Glu Lys Thr Arg Pro Gln Trp Asp Val Leu Ser Ser Gly Asn
545 550 555 560
Ala Val Gln Glu Val Ala His Ile Ala Asn Gly Ser His Pro Gly Asn
565 570 575
Cys Ile Ser Val Leu Arg Ala Tyr Asn Thr Ser Gln Asn Asn Met Leu
580 585 590
Ile Leu Gln Glu Ser Cys Met Asp Ser Ser Gly Ser Leu Val Val Tyr
595 600 605
Cys Pro Val Asp Leu Pro Ala Ile Asn Ile Ala Met Ser Gly Glu Asp
610 615 620
Pro Ser Tyr Ile Pro Leu Leu Pro Ser Gly Phe Thr Ile Ser Pro Asp
625 630 635 640
Gly Tyr Pro Asp Gln Gly Asp Gly Ala Ser Thr Ser Ser Asn Thr Gln
645 650 655
Gly Arg Met Ala Arg Ser Ser Gly Ser Leu Ile Thr Val Ala Phe Gln
660 665 670
Ile Leu Val Ser Ser Leu Pro Ser Ala Arg Leu Asn Leu Glu Ser Val
675 680 685
Asn Thr Val Asn Ser Leu Ile Gly Thr Thr Ile Gln Gln Ile Lys Ala
690 695 700
Ala Leu Ser Cys Pro Gly Ser
705 710
<210> 516
<211> 2121
<212> DNA
<213> Populus trichocarpa
<400> 516
atgactcgag caagctcaaa gatgatgact atgagaccaa atcgggcacc gaaactatgg 60
aagctcagtc cggtgatgac caagatccca gtgaacaaca ccccaaaaag aagcgttatc 120
atcgccatac acagcgtcaa atccaggaca tggaagcgta agcatttctt caaggaatgc 180
cctcatcctg acgacaaaca acggaaggag ctcagccgtg agctaggttt agagccattg 240
caagtcaaat tttggttcca aaacaagcgc actcaaatga aggctcaaca tgaacgcagt 300
gagaattcaa ttcttaaggc tgagaatgaa agacttcgtg tggagaacaa tagatacaag 360
gaagccctac gtaatgcttc atgccctaac tgtgggggtc cagctgctct tggtgagatg 420
tcttttgatg agcagcattt gaggattgag aatgttcgtc taagagaaga gattgacagg 480
atttctggaa ttgctgccaa gtatgttggc aagcctttgt cttctctttc caacctttct 540
cctcatttac cgtcccggtc tcttgatctc ggagttagca attttggggc acagtcgggt 600
ttcgtagggg agatgtttgg agctactgat cttcttagat cagtcactgg acctactgag 660
gcagacaaat caatgatagt tgaaatcgcg gttgcagcaa tggaggaact aatgagaata 720
gctcaggctg gagaaccctt gtggattcaa ggagagaaca atactgagat gctcaatgaa 780
gaggaatatt tgagaacttt cactagggga attggaccaa aacctttagg aatgagatct 840
gaagcttcaa gggaatccgc agttgttatc atgaatcatg ttaatcttgt tgagattctt 900
atggacgcga atcaatggtc aactattttc tgtggtattg tatcaagagc aatgaccctg 960
gaagtcctat caacaggagt ggcagggaac tataatggag cattacaagt gatgacagct 1020
gagtttcaag taccttcccc aattgttcct acacgagaaa attactttgt gaggtactgc 1080
aaacagcata ccgatgggac ttgggcagtg gtagatgttt ccttggacag tttacgccct 1140
agtctgctgt cgaaatgtag aagaaggcca tcaggttgct tgatccaaga attgccaaat 1200
ggttattcaa aggtcgtctg ggttgaacac attgaagtgg atgatagatc tgttcaaaat 1260
atatacagac cactagtcaa ctctggtctt gcttttggag caaaacgttg ggtgggaaca 1320
cttgatcgac aatgcgaacg tcttgcaagc tccatggcca ttaacattcc atctggagat 1380
ctctgtgtga taacaaccgc tgaagggagg aaaagtatgc tgaagctggc cgagagaatg 1440
gtgatgagtt tttgcactgg agttggtgct tctactgcac atgcatggac gacattgtcc 1500
gcaactggtt ctgatgatgt gagagtaatg accagaaaga gtatggatga tccaggcagg 1560
cctcctggta ttgtgcttag tgctgccact tccttctgga ttccagttca atccaagagg 1620
atgtttgatt tccttaggga tgagaatcat cgaagtgagt gggatatcct ttcgaacggc 1680
ggcgaagttc aagaaatggc tcatatagct aatggacgtg atcctggaaa ttgcgtctct 1740
ttactccgtg tcaatagcgc aaattcaagc cagagcaaca tgctgatatt gcaagagagc 1800
tgcactgatt ctacaggctc atatgttatt tatgcaccag tggacatttc ggccatgaac 1860
atagtcctaa gcggtggaga cccagattat gttgccctgc ttccatcagg ttttgctata 1920
ctccctgatg gaccaggata tggctctgca ggaattcttg atgttgggtc cggtggctct 1980
ctactgactg ttgcatttca gatattagtt gattcagtcc caacagcaaa actttcgctc 2040
ggatcagtag caactgtaaa cagtctaatt aagtgcacag ttgaaaggat taaggctgca 2100
gtaatgtgtg acaatgcctg a 2121
<210> 517
<211> 706
<212> PRT
<213> Populus trichocarpa
<400> 517
Met Thr Arg Ala Ser Ser Lys Met Met Thr Met Arg Pro Asn Arg Ala
1 5 10 15
Pro Lys Leu Trp Lys Leu Ser Pro Val Met Thr Lys Ile Pro Val Asn
20 25 30
Asn Thr Pro Lys Arg Ser Val Ile Ile Ala Ile His Ser Val Lys Ser
35 40 45
Arg Thr Trp Lys Arg Lys His Phe Phe Lys Glu Cys Pro His Pro Asp
50 55 60
Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu Pro Leu
65 70 75 80
Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Ala Gln
85 90 95
His Glu Arg Ser Glu Asn Ser Ile Leu Lys Ala Glu Asn Glu Arg Leu
100 105 110
Arg Val Glu Asn Asn Arg Tyr Lys Glu Ala Leu Arg Asn Ala Ser Cys
115 120 125
Pro Asn Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe Asp Glu
130 135 140
Gln His Leu Arg Ile Glu Asn Val Arg Leu Arg Glu Glu Ile Asp Arg
145 150 155 160
Ile Ser Gly Ile Ala Ala Lys Tyr Val Gly Lys Pro Leu Ser Ser Leu
165 170 175
Ser Asn Leu Ser Pro His Leu Pro Ser Arg Ser Leu Asp Leu Gly Val
180 185 190
Ser Asn Phe Gly Ala Gln Ser Gly Phe Val Gly Glu Met Phe Gly Ala
195 200 205
Thr Asp Leu Leu Arg Ser Val Thr Gly Pro Thr Glu Ala Asp Lys Ser
210 215 220
Met Ile Val Glu Ile Ala Val Ala Ala Met Glu Glu Leu Met Arg Ile
225 230 235 240
Ala Gln Ala Gly Glu Pro Leu Trp Ile Gln Gly Glu Asn Asn Thr Glu
245 250 255
Met Leu Asn Glu Glu Glu Tyr Leu Arg Thr Phe Thr Arg Gly Ile Gly
260 265 270
Pro Lys Pro Leu Gly Met Arg Ser Glu Ala Ser Arg Glu Ser Ala Val
275 280 285
Val Ile Met Asn His Val Asn Leu Val Glu Ile Leu Met Asp Ala Asn
290 295 300
Gln Trp Ser Thr Ile Phe Cys Gly Ile Val Ser Arg Ala Met Thr Leu
305 310 315 320
Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln
325 330 335
Val Met Thr Ala Glu Phe Gln Val Pro Ser Pro Ile Val Pro Thr Arg
340 345 350
Glu Asn Tyr Phe Val Arg Tyr Cys Lys Gln His Thr Asp Gly Thr Trp
355 360 365
Ala Val Val Asp Val Ser Leu Asp Ser Leu Arg Pro Ser Leu Leu Ser
370 375 380
Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu Leu Pro Asn
385 390 395 400
Gly Tyr Ser Lys Val Val Trp Val Glu His Ile Glu Val Asp Asp Arg
405 410 415
Ser Val Gln Asn Ile Tyr Arg Pro Leu Val Asn Ser Gly Leu Ala Phe
420 425 430
Gly Ala Lys Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg Leu
435 440 445
Ala Ser Ser Met Ala Ile Asn Ile Pro Ser Gly Asp Leu Cys Val Ile
450 455 460
Thr Thr Ala Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met
465 470 475 480
Val Met Ser Phe Cys Thr Gly Val Gly Ala Ser Thr Ala His Ala Trp
485 490 495
Thr Thr Leu Ser Ala Thr Gly Ser Asp Asp Val Arg Val Met Thr Arg
500 505 510
Lys Ser Met Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Ser Ala
515 520 525
Ala Thr Ser Phe Trp Ile Pro Val Gln Ser Lys Arg Met Phe Asp Phe
530 535 540
Leu Arg Asp Glu Asn His Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly
545 550 555 560
Gly Glu Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp Pro Gly
565 570 575
Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser Ser Gln Ser
580 585 590
Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ser Thr Gly Ser Tyr
595 600 605
Val Ile Tyr Ala Pro Val Asp Ile Ser Ala Met Asn Ile Val Leu Ser
610 615 620
Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile
625 630 635 640
Leu Pro Asp Gly Pro Gly Tyr Gly Ser Ala Gly Ile Leu Asp Val Gly
645 650 655
Ser Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser
660 665 670
Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser
675 680 685
Leu Ile Lys Cys Thr Val Glu Arg Ile Lys Ala Ala Val Met Cys Asp
690 695 700
Asn Ala
705
<210> 518
<211> 2274
<212> DNA
<213> Populus trichocarpa
<400> 518
atggatggtc gtggtgatat gggtctgttt ggggaacatt ttgatccttg tttggtaggg 60
aggatcaagg aggatggtta tgagagcagg tctggtagtg ataacattga aggagcatct 120
ggtgaagatc aggatgttgg agacgatcaa aggcctagga agaagtacaa cagacacact 180
gctaatcaaa tacaagagct tgaatctttc ttcaaggagt gtcctcatcc tgatgagaaa 240
caaagatcag agcttagcag gaggcttggc ttggaaagca agcaaatcaa gttttggttt 300
caaaatagga gaactcaaat gaagacccaa ttggaacggc atgagaatgt aatcctcagg 360
caagataatg ataaactccg acttgagaat gagttgttga aacaaaacat gagtgatcca 420
atttgcaaca attgtggtgg tcctgtggtg cctggtccag tgtctgatga gcaacagcag 480
ttaaggatcg aaaatgctcg attgacggat gaattaggtc gtgtttgtgc cttggccaat 540
aagtttttag gcagacccct cacatcctca gccaatccta tccctccgtt tagcacaaac 600
tccaagttgg accttgcagt tgggataaat ggatatggca atttaggcca tacagacaac 660
atgttgccaa tggggcttga taataataga gggattatga tgcctctgat gaaaccaata 720
ggcaatgctg ttggcaagga agtaccacat gatagatcaa tatttgtaga tcttgcactt 780
gctgctatgg atgaattgat aaagatggct cagattgaaa gtcccatttg gatcaaaagc 840
ttagatggag gaaaggaagt cctgaaccat gaggagtata cgaggacttt tcctcgcatt 900
ggcatgaaac ccagcaattt tgttactgag gctacacggg tgagtggtgt agtactcgtc 960
aacatctcgg ctctagttga gacattgatg gacgtgaatg gatgggtgga gatgtttccc 1020
agcttgattg ctagagctgc caccactgat atcatatcaa gtggcatggg tggaacaaaa 1080
agtggagctt tgcaaatgat acacgccgag tttcaattga tttcgccttt tgtccctgtg 1140
cgtcaagtga agttccttcg gttatgcaag caactcacgg agggtgtgtg ggctgtagtt 1200
gatgtttcca ttgatgcaaa ccaggaaaat ctaaatgcac aagcccctgt aacctgcaag 1260
aggcttcctt ctggctgcat tatacaagat atgaacaatg gttgctctaa gctgtttact 1320
cttgttgtcc gtgaggttac atgggtggaa cattccgaat atgatgagag tgcagtccat 1380
caactctacc gacccatact tagttctggc aggggctttg gtgcacagag gtggcttgct 1440
gcccttcaac ggtattacga gggcatggca atgattatgt ctcctagcat tttgggtgaa 1500
gatcagacag tgataaatct gggaggtaag aaaagcatgt taaagttagc acgacgaatg 1560
gtggataact tctgttctgg ggtttgtgct tcttctttgc acaattgggg caaccttgtg 1620
gctggaaatg tgagtgaaga tgtgaggatt ttgacccgaa agagtattaa tgaacctggt 1680
gagccagatg gtattgtgtt gagtgctgcg acttctgttt ggctgccagt ttcacgacaa 1740
aggttatttg acttcttgag ggatgaacaa tcaaggagcc attgggacat tttatccaat 1800
ggtggaatgt tgcaggagat tatccaaatc cccaagggac agggacaatg caaccgtgtc 1860
tctctcctgc gttcaactgt ggctgttgat gctgatgcgg gtgagaacaa catgttaata 1920
ttacaagaaa ccaggaatga tgtctcaggt tcgcaagtag tgtatgcacc agtcgacata 1980
caatcgatga gtgtagtgac gtctggtgga gactctacct atgtggctct cctgccatca 2040
gggtttgtga ttcttccaga taattcattt agtaatggtg agcccagcaa cagcgatggg 2100
aatccagtca aaagagatag cgatagcaac aatggaggtg gatcgttttt tactgtcgga 2160
ttccaaattt tggcgagcaa ccttccttca gccaaactta cagtcgagtc agtcgagacg 2220
attcataatc tcatctcctg cacaatgcag aggatcagaa cagccttcaa ctaa 2274
<210> 519
<211> 757
<212> PRT
<213> Populus trichocarpa
<400> 519
Met Asp Gly Arg Gly Asp Met Gly Leu Phe Gly Glu His Phe Asp Pro
1 5 10 15
Cys Leu Val Gly Arg Ile Lys Glu Asp Gly Tyr Glu Ser Arg Ser Gly
20 25 30
Ser Asp Asn Ile Glu Gly Ala Ser Gly Glu Asp Gln Asp Val Gly Asp
35 40 45
Asp Gln Arg Pro Arg Lys Lys Tyr Asn Arg His Thr Ala Asn Gln Ile
50 55 60
Gln Glu Leu Glu Ser Phe Phe Lys Glu Cys Pro His Pro Asp Glu Lys
65 70 75 80
Gln Arg Ser Glu Leu Ser Arg Arg Leu Gly Leu Glu Ser Lys Gln Ile
85 90 95
Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln Leu Glu
100 105 110
Arg His Glu Asn Val Ile Leu Arg Gln Asp Asn Asp Lys Leu Arg Leu
115 120 125
Glu Asn Glu Leu Leu Lys Gln Asn Met Ser Asp Pro Ile Cys Asn Asn
130 135 140
Cys Gly Gly Pro Val Val Pro Gly Pro Val Ser Asp Glu Gln Gln Gln
145 150 155 160
Leu Arg Ile Glu Asn Ala Arg Leu Thr Asp Glu Leu Gly Arg Val Cys
165 170 175
Ala Leu Ala Asn Lys Phe Leu Gly Arg Pro Leu Thr Ser Ser Ala Asn
180 185 190
Pro Ile Pro Pro Phe Ser Thr Asn Ser Lys Leu Asp Leu Ala Val Gly
195 200 205
Ile Asn Gly Tyr Gly Asn Leu Gly His Thr Asp Asn Met Leu Pro Met
210 215 220
Gly Leu Asp Asn Asn Arg Gly Ile Met Met Pro Leu Met Lys Pro Ile
225 230 235 240
Gly Asn Ala Val Gly Lys Glu Val Pro His Asp Arg Ser Ile Phe Val
245 250 255
Asp Leu Ala Leu Ala Ala Met Asp Glu Leu Ile Lys Met Ala Gln Ile
260 265 270
Glu Ser Pro Ile Trp Ile Lys Ser Leu Asp Gly Gly Lys Glu Val Leu
275 280 285
Asn His Glu Glu Tyr Thr Arg Thr Phe Pro Arg Ile Gly Met Lys Pro
290 295 300
Ser Asn Phe Val Thr Glu Ala Thr Arg Val Ser Gly Val Val Leu Val
305 310 315 320
Asn Ile Ser Ala Leu Val Glu Thr Leu Met Asp Val Asn Gly Trp Val
325 330 335
Glu Met Phe Pro Ser Leu Ile Ala Arg Ala Ala Thr Thr Asp Ile Ile
340 345 350
Ser Ser Gly Met Gly Gly Thr Lys Ser Gly Ala Leu Gln Met Ile His
355 360 365
Ala Glu Phe Gln Leu Ile Ser Pro Phe Val Pro Val Arg Gln Val Lys
370 375 380
Phe Leu Arg Leu Cys Lys Gln Leu Thr Glu Gly Val Trp Ala Val Val
385 390 395 400
Asp Val Ser Ile Asp Ala Asn Gln Glu Asn Leu Asn Ala Gln Ala Pro
405 410 415
Val Thr Cys Lys Arg Leu Pro Ser Gly Cys Ile Ile Gln Asp Met Asn
420 425 430
Asn Gly Cys Ser Lys Leu Phe Thr Leu Val Val Arg Glu Val Thr Trp
435 440 445
Val Glu His Ser Glu Tyr Asp Glu Ser Ala Val His Gln Leu Tyr Arg
450 455 460
Pro Ile Leu Ser Ser Gly Arg Gly Phe Gly Ala Gln Arg Trp Leu Ala
465 470 475 480
Ala Leu Gln Arg Tyr Tyr Glu Gly Met Ala Met Ile Met Ser Pro Ser
485 490 495
Ile Leu Gly Glu Asp Gln Thr Val Ile Asn Leu Gly Gly Lys Lys Ser
500 505 510
Met Leu Lys Leu Ala Arg Arg Met Val Asp Asn Phe Cys Ser Gly Val
515 520 525
Cys Ala Ser Ser Leu His Asn Trp Gly Asn Leu Val Ala Gly Asn Val
530 535 540
Ser Glu Asp Val Arg Ile Leu Thr Arg Lys Ser Ile Asn Glu Pro Gly
545 550 555 560
Glu Pro Asp Gly Ile Val Leu Ser Ala Ala Thr Ser Val Trp Leu Pro
565 570 575
Val Ser Arg Gln Arg Leu Phe Asp Phe Leu Arg Asp Glu Gln Ser Arg
580 585 590
Ser His Trp Asp Ile Leu Ser Asn Gly Gly Met Leu Gln Glu Ile Ile
595 600 605
Gln Ile Pro Lys Gly Gln Gly Gln Cys Asn Arg Val Ser Leu Leu Arg
610 615 620
Ser Thr Val Ala Val Asp Ala Asp Ala Gly Glu Asn Asn Met Leu Ile
625 630 635 640
Leu Gln Glu Thr Arg Asn Asp Val Ser Gly Ser Gln Val Val Tyr Ala
645 650 655
Pro Val Asp Ile Gln Ser Met Ser Val Val Thr Ser Gly Gly Asp Ser
660 665 670
Thr Tyr Val Ala Leu Leu Pro Ser Gly Phe Val Ile Leu Pro Asp Asn
675 680 685
Ser Phe Ser Asn Gly Glu Pro Ser Asn Ser Asp Gly Asn Pro Val Lys
690 695 700
Arg Asp Ser Asp Ser Asn Asn Gly Gly Gly Ser Phe Phe Thr Val Gly
705 710 715 720
Phe Gln Ile Leu Ala Ser Asn Leu Pro Ser Ala Lys Leu Thr Val Glu
725 730 735
Ser Val Glu Thr Ile His Asn Leu Ile Ser Cys Thr Met Gln Arg Ile
740 745 750
Arg Thr Ala Phe Asn
755
<210> 520
<211> 2397
<212> DNA
<213> Populus trichocarpa
<400> 520
atgcccactg gtgcaatagt tcagcctcgc cttgtctctc cttctatcac taaatccatg 60
ttcaactctc ctggactctc actggctctt caacaaccaa acatagatgg tcaaggagat 120
ataactagaa tgtctgagaa ctttgagaca agtgtgggta ggagaagccg agaagaagaa 180
catgagagca gatctggtag tgataacatg gatggtgctt ctggtgatga ccaagatgca 240
gctgataatc ctccaagaaa aaagagatac caccgacaca ccccacaaca aatccaagaa 300
cttgaagctt tgtttaagga gtgtcctcat cctgatgaga aacaaagatt ggagcttagt 360
agaaggctgt gcttggagac caggcaagtg aagttctggt ttcaaaatcg tcgaacccaa 420
atgaagactc aattggagcg ccatgagaac tcattactca ggcaagagaa cgacaagctt 480
cgagcggaaa acatgtccat aagagatgct atgagaaatc caatgtgctc aaactgtggt 540
ggtcctgcaa taattggtga tatttcactt gaagaacagc atctgaggat tgagaatgct 600
aggttaaaag atgaactaga tcgagtttgt gcgcttgctg gcaagttctt aggtcgcccc 660
atatcttcgt tggcttcttc acttggccct ccgatgccaa attcaagctt ggagcttggt 720
gttggtagta atggttttgc tggtttaagc actgtagcta caacattgcc tttgggacct 780
gattttgtag gtgggatttc tggtgctttg cctgtactaa ctcaaactag accagcgaca 840
actggtgtta ctgggattgg tagatcactg gagagatcca tgttcttgga gttggctttg 900
gctgccatgg atgaattggt taagatggct cagactgatg agcctctttg gatcaggagc 960
ttcgatggtg gtagggaaat attgaaccat gaggagtact tgagaactat cactccttgc 1020
attggaatga agcctagtgg ctttgttagt gaggcttcga gagagactgg gatggtaatc 1080
atcaacagtt tggccctagt tgagacactg atggattcaa accgatgggc agaaatgttt 1140
ccttgcgtga ttgccaggac ctctacaact gatgtgatag ccaatggaat ggggggaact 1200
agaaatggtt cacttcaatt gatgcacgcg gagctccaag tcttatcccc tttggttcct 1260
gttcgtgagg tcaattttct ccgattttgc aagcagcacg ccgagggggt ttgggctgtt 1320
gttgatgtgt ccgtcgatac catcagagaa acttctggtg cgtcaccgac attcgtgaac 1380
tgtaggaggc ttccttctgg ctgtgtggtg caagatatgc ccaatgggta ctctaaggtt 1440
acatggattg agcatgcaga atatgatgaa agccaaacac accagctcta tcggccgttg 1500
ataagttccg gcatgggctt tggggcccaa cgatggatag ccactctcca acgccaaagc 1560
gagtgcctag ccattctcat gtcctctaat gtacccagtc gagaccacac aggtgttgat 1620
gtagctataa ctgcaagtgg tcgccgaagc atgctgaagc tggcgcaaag aatgacggct 1680
aacttctgtg ccggggtttg tgcctcaaca gtgcacaaat ggaacaagct aaatgcagga 1740
aatgtcgatg aagatgttag ggttatgacc agaaagagcg ttgatgatcc tggtgagcca 1800
ccaggcattg ttttgagcgc tgccacctct gtctggctac ctgtttctcc acagagactc 1860
tttgatttcc tccgcgatga acggctcaga agcgaatggg acatcctctc caacggcgga 1920
ccaatgcagg aaatggccca cattgccaaa ggccaagatc atggcaactg tgtctccctc 1980
ctacgggcta gcgccatgaa tgctaaccag agtagcatgt tgatactgca agagacttgc 2040
atagatgcag cagggtcact tgtagtgtac gctcccgttg acattccggc catgcacgtg 2100
gtgatgaatg gtggcgattc agcctacgta gcgcttcttc cgtcaggttt cgctatcgta 2160
ccagatgggc ccggttcacg tgggccccca acaacaaacg gtggcccaac tgctaataat 2220
aatagcaatg gtggtggccc agagagggtg agtgggtccc tcttgacggt ggcgttccaa 2280
atattggtga atagtcttcc tacagccaag ctcacggtag aatcggtgga gacagtcaac 2340
aacctcattt catgcactgt ccagaagatc aaggcagctc tgcagtgtga aagctga 2397
<210> 521
<211> 798
<212> PRT
<213> Populus trichocarpa
<400> 521
Met Pro Thr Gly Ala Ile Val Gln Pro Arg Leu Val Ser Pro Ser Ile
1 5 10 15
Thr Lys Ser Met Phe Asn Ser Pro Gly Leu Ser Leu Ala Leu Gln Gln
20 25 30
Pro Asn Ile Asp Gly Gln Gly Asp Ile Thr Arg Met Ser Glu Asn Phe
35 40 45
Glu Thr Ser Val Gly Arg Arg Ser Arg Glu Glu Glu His Glu Ser Arg
50 55 60
Ser Gly Ser Asp Asn Met Asp Gly Ala Ser Gly Asp Asp Gln Asp Ala
65 70 75 80
Ala Asp Asn Pro Pro Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
85 90 95
Gln Ile Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp
100 105 110
Glu Lys Gln Arg Leu Glu Leu Ser Arg Arg Leu Cys Leu Glu Thr Arg
115 120 125
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
130 135 140
Leu Glu Arg His Glu Asn Ser Leu Leu Arg Gln Glu Asn Asp Lys Leu
145 150 155 160
Arg Ala Glu Asn Met Ser Ile Arg Asp Ala Met Arg Asn Pro Met Cys
165 170 175
Ser Asn Cys Gly Gly Pro Ala Ile Ile Gly Asp Ile Ser Leu Glu Glu
180 185 190
Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asp Arg
195 200 205
Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro Ile Ser Ser Leu
210 215 220
Ala Ser Ser Leu Gly Pro Pro Met Pro Asn Ser Ser Leu Glu Leu Gly
225 230 235 240
Val Gly Ser Asn Gly Phe Ala Gly Leu Ser Thr Val Ala Thr Thr Leu
245 250 255
Pro Leu Gly Pro Asp Phe Val Gly Gly Ile Ser Gly Ala Leu Pro Val
260 265 270
Leu Thr Gln Thr Arg Pro Ala Thr Thr Gly Val Thr Gly Ile Gly Arg
275 280 285
Ser Leu Glu Arg Ser Met Phe Leu Glu Leu Ala Leu Ala Ala Met Asp
290 295 300
Glu Leu Val Lys Met Ala Gln Thr Asp Glu Pro Leu Trp Ile Arg Ser
305 310 315 320
Phe Asp Gly Gly Arg Glu Ile Leu Asn His Glu Glu Tyr Leu Arg Thr
325 330 335
Ile Thr Pro Cys Ile Gly Met Lys Pro Ser Gly Phe Val Ser Glu Ala
340 345 350
Ser Arg Glu Thr Gly Met Val Ile Ile Asn Ser Leu Ala Leu Val Glu
355 360 365
Thr Leu Met Asp Ser Asn Arg Trp Ala Glu Met Phe Pro Cys Val Ile
370 375 380
Ala Arg Thr Ser Thr Thr Asp Val Ile Ala Asn Gly Met Gly Gly Thr
385 390 395 400
Arg Asn Gly Ser Leu Gln Leu Met His Ala Glu Leu Gln Val Leu Ser
405 410 415
Pro Leu Val Pro Val Arg Glu Val Asn Phe Leu Arg Phe Cys Lys Gln
420 425 430
His Ala Glu Gly Val Trp Ala Val Val Asp Val Ser Val Asp Thr Ile
435 440 445
Arg Glu Thr Ser Gly Ala Ser Pro Thr Phe Val Asn Cys Arg Arg Leu
450 455 460
Pro Ser Gly Cys Val Val Gln Asp Met Pro Asn Gly Tyr Ser Lys Val
465 470 475 480
Thr Trp Ile Glu His Ala Glu Tyr Asp Glu Ser Gln Thr His Gln Leu
485 490 495
Tyr Arg Pro Leu Ile Ser Ser Gly Met Gly Phe Gly Ala Gln Arg Trp
500 505 510
Ile Ala Thr Leu Gln Arg Gln Ser Glu Cys Leu Ala Ile Leu Met Ser
515 520 525
Ser Asn Val Pro Ser Arg Asp His Thr Gly Val Asp Val Ala Ile Thr
530 535 540
Ala Ser Gly Arg Arg Ser Met Leu Lys Leu Ala Gln Arg Met Thr Ala
545 550 555 560
Asn Phe Cys Ala Gly Val Cys Ala Ser Thr Val His Lys Trp Asn Lys
565 570 575
Leu Asn Ala Gly Asn Val Asp Glu Asp Val Arg Val Met Thr Arg Lys
580 585 590
Ser Val Asp Asp Pro Gly Glu Pro Pro Gly Ile Val Leu Ser Ala Ala
595 600 605
Thr Ser Val Trp Leu Pro Val Ser Pro Gln Arg Leu Phe Asp Phe Leu
610 615 620
Arg Asp Glu Arg Leu Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly
625 630 635 640
Pro Met Gln Glu Met Ala His Ile Ala Lys Gly Gln Asp His Gly Asn
645 650 655
Cys Val Ser Leu Leu Arg Ala Ser Ala Met Asn Ala Asn Gln Ser Ser
660 665 670
Met Leu Ile Leu Gln Glu Thr Cys Ile Asp Ala Ala Gly Ser Leu Val
675 680 685
Val Tyr Ala Pro Val Asp Ile Pro Ala Met His Val Val Met Asn Gly
690 695 700
Gly Asp Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Val
705 710 715 720
Pro Asp Gly Pro Gly Ser Arg Gly Pro Pro Thr Thr Asn Gly Gly Pro
725 730 735
Thr Ala Asn Asn Asn Ser Asn Gly Gly Gly Pro Glu Arg Val Ser Gly
740 745 750
Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asn Ser Leu Pro Thr
755 760 765
Ala Lys Leu Thr Val Glu Ser Val Glu Thr Val Asn Asn Leu Ile Ser
770 775 780
Cys Thr Val Gln Lys Ile Lys Ala Ala Leu Gln Cys Glu Ser
785 790 795
<210> 522
<211> 2124
<212> DNA
<213> Populus trichocarpa
<400> 522
atggagcttc aattgggaaa caatggaggt gtttctggtg atgaacatga agcttttaac 60
tctggaaata agggaaagaa ggcttaccat cgccatactt gtcaacagat tctgcagctt 120
gaaaaatttt tcaaggaatg tccacatccg aatgaaaaac agcggcgtca gttgagcagg 180
gaactaggcc ttgaggctaa acagatcaag ttctggtttc aaaacagaag gacgcaggaa 240
aaggcgcaaa gtgagcgatc agataattca gttcttcgga cagaaaatga gaggattcat 300
tgtgaaaatc tttctatcag agaggcaatg aaaaacgtga tttgcccagc ttgtggagga 360
caccctttcg gagaagaaga acgccaactt aatttgcaga aactgaggca ggaaaatgct 420
agattgagag aagaggctat atccagcctt cttgccaagt atattggaaa accaaagtca 480
cagattgatt tgttgacgtc tgacactgga tcttcacaag aagaactgcc aacatttgtc 540
cagaatcaaa ggatgggaaa ccctggtatt gattggggac ggaatccagg atcggacatt 600
agtcatttcg catatagact tgaaggaatt ccagatatgg aaaatgcact catggctgag 660
actgctgccg gcgcaatgga tgagttgatc agacttttgc gagtaaatga gcctttttgg 720
atcaagtctc catctgacgg aagactcatc cttgatcggc tcagttatga gagaatttac 780
cccagggccg ctcatttcat aagtcgcaat gctcgtgtcg aatcatccaa ggattcggca 840
acagtgacca tgcctggaat ggacttggtt gacatgtttt tggatcctaa taaatgggtg 900
gatctttttc cgacaattgt taccgaagca agaacaattc acgtacttga agctggaaca 960
gtagggaacc gtcatggttc gttgcagatg atgtatgaac aaatgcacat actatcaccc 1020
ttggttccgc ctagggaatt ttacttcctt cgcctttgtc tgcaacttga acctgggcaa 1080
tgggtgatag cagatgtatc ttatgactac ttgaaagaaa gcggatcccc tccctgcgct 1140
tggcggcttc cttctggatg catgatccaa gacatgccta atggatgttc caagataata 1200
tgggtagaac atgtggaagc gaatgatagg attcaaactc actgcctgta ccgagatctc 1260
atatgtggta gttatgctta tggggcagaa agatggattg ctagtctcca gaggatttgt 1320
gagaggctcg ctttctctac agctgtgcct ccacgagaac tcggaggagt ggtcacttcc 1380
cctgagggta gaaagagcat agtaaaccta gcccacagga tggtgaagat tttctgttca 1440
agtttgggta tgtcaggaaa actggatttc cgtcaattgt ctgaagggaa caatagtgga 1500
gttcgggtgg ctatttgtaa gaatgcagaa caaggccagc cgattggcac agttgccagt 1560
gctgctactt ctttttggct tccactctca cctcagaacg tgtttaactt cttcaaagcc 1620
gagaaatcgc gaactcagtg ggatattctg tcgaatggca atcctgtgct tgagatttca 1680
cacatttcta atggggctga tccagggaac tgcatctcca ttattcgacc tttcattcct 1740
gctgagaaca acatgctgat actgcaagag agctgcacag actcctcggt atcaatggta 1800
gtatacgctc cagtaggcat tccagccatg aacgtggcga taagcggtga tgactcatca 1860
atcattccca tacttccatc aggttttgta atatctggcg acggccgtat ggacacaaga 1920
gggaccagtt ctagttccac cagttctact gggtcaaact caggaggttc actccttaca 1980
atagccttcc aaattctggt ctctggctct aattcctcat cctccacaga attcaacatg 2040
gaatctgtgg caacagtgaa taccctcatc agcaccactg ttctgaaaat taaatctgct 2100
tttaattgct cagatttgga ttaa 2124
<210> 523
<211> 707
<212> PRT
<213> Populus trichocarpa
<400> 523
Met Glu Leu Gln Leu Gly Asn Asn Gly Gly Val Ser Gly Asp Glu His
1 5 10 15
Glu Ala Phe Asn Ser Gly Asn Lys Gly Lys Lys Ala Tyr His Arg His
20 25 30
Thr Cys Gln Gln Ile Leu Gln Leu Glu Lys Phe Phe Lys Glu Cys Pro
35 40 45
His Pro Asn Glu Lys Gln Arg Arg Gln Leu Ser Arg Glu Leu Gly Leu
50 55 60
Glu Ala Lys Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Glu
65 70 75 80
Lys Ala Gln Ser Glu Arg Ser Asp Asn Ser Val Leu Arg Thr Glu Asn
85 90 95
Glu Arg Ile His Cys Glu Asn Leu Ser Ile Arg Glu Ala Met Lys Asn
100 105 110
Val Ile Cys Pro Ala Cys Gly Gly His Pro Phe Gly Glu Glu Glu Arg
115 120 125
Gln Leu Asn Leu Gln Lys Leu Arg Gln Glu Asn Ala Arg Leu Arg Glu
130 135 140
Glu Ala Ile Ser Ser Leu Leu Ala Lys Tyr Ile Gly Lys Pro Lys Ser
145 150 155 160
Gln Ile Asp Leu Leu Thr Ser Asp Thr Gly Ser Ser Gln Glu Glu Leu
165 170 175
Pro Thr Phe Val Gln Asn Gln Arg Met Gly Asn Pro Gly Ile Asp Trp
180 185 190
Gly Arg Asn Pro Gly Ser Asp Ile Ser His Phe Ala Tyr Arg Leu Glu
195 200 205
Gly Ile Pro Asp Met Glu Asn Ala Leu Met Ala Glu Thr Ala Ala Gly
210 215 220
Ala Met Asp Glu Leu Ile Arg Leu Leu Arg Val Asn Glu Pro Phe Trp
225 230 235 240
Ile Lys Ser Pro Ser Asp Gly Arg Leu Ile Leu Asp Arg Leu Ser Tyr
245 250 255
Glu Arg Ile Tyr Pro Arg Ala Ala His Phe Ile Ser Arg Asn Ala Arg
260 265 270
Val Glu Ser Ser Lys Asp Ser Ala Thr Val Thr Met Pro Gly Met Asp
275 280 285
Leu Val Asp Met Phe Leu Asp Pro Asn Lys Trp Val Asp Leu Phe Pro
290 295 300
Thr Ile Val Thr Glu Ala Arg Thr Ile His Val Leu Glu Ala Gly Thr
305 310 315 320
Val Gly Asn Arg His Gly Ser Leu Gln Met Met Tyr Glu Gln Met His
325 330 335
Ile Leu Ser Pro Leu Val Pro Pro Arg Glu Phe Tyr Phe Leu Arg Leu
340 345 350
Cys Leu Gln Leu Glu Pro Gly Gln Trp Val Ile Ala Asp Val Ser Tyr
355 360 365
Asp Tyr Leu Lys Glu Ser Gly Ser Pro Pro Cys Ala Trp Arg Leu Pro
370 375 380
Ser Gly Cys Met Ile Gln Asp Met Pro Asn Gly Cys Ser Lys Ile Ile
385 390 395 400
Trp Val Glu His Val Glu Ala Asn Asp Arg Ile Gln Thr His Cys Leu
405 410 415
Tyr Arg Asp Leu Ile Cys Gly Ser Tyr Ala Tyr Gly Ala Glu Arg Trp
420 425 430
Ile Ala Ser Leu Gln Arg Ile Cys Glu Arg Leu Ala Phe Ser Thr Ala
435 440 445
Val Pro Pro Arg Glu Leu Gly Gly Val Val Thr Ser Pro Glu Gly Arg
450 455 460
Lys Ser Ile Val Asn Leu Ala His Arg Met Val Lys Ile Phe Cys Ser
465 470 475 480
Ser Leu Gly Met Ser Gly Lys Leu Asp Phe Arg Gln Leu Ser Glu Gly
485 490 495
Asn Asn Ser Gly Val Arg Val Ala Ile Cys Lys Asn Ala Glu Gln Gly
500 505 510
Gln Pro Ile Gly Thr Val Ala Ser Ala Ala Thr Ser Phe Trp Leu Pro
515 520 525
Leu Ser Pro Gln Asn Val Phe Asn Phe Phe Lys Ala Glu Lys Ser Arg
530 535 540
Thr Gln Trp Asp Ile Leu Ser Asn Gly Asn Pro Val Leu Glu Ile Ser
545 550 555 560
His Ile Ser Asn Gly Ala Asp Pro Gly Asn Cys Ile Ser Ile Ile Arg
565 570 575
Pro Phe Ile Pro Ala Glu Asn Asn Met Leu Ile Leu Gln Glu Ser Cys
580 585 590
Thr Asp Ser Ser Val Ser Met Val Val Tyr Ala Pro Val Gly Ile Pro
595 600 605
Ala Met Asn Val Ala Ile Ser Gly Asp Asp Ser Ser Ile Ile Pro Ile
610 615 620
Leu Pro Ser Gly Phe Val Ile Ser Gly Asp Gly Arg Met Asp Thr Arg
625 630 635 640
Gly Thr Ser Ser Ser Ser Thr Ser Ser Thr Gly Ser Asn Ser Gly Gly
645 650 655
Ser Leu Leu Thr Ile Ala Phe Gln Ile Leu Val Ser Gly Ser Asn Ser
660 665 670
Ser Ser Ser Thr Glu Phe Asn Met Glu Ser Val Ala Thr Val Asn Thr
675 680 685
Leu Ile Ser Thr Thr Val Leu Lys Ile Lys Ser Ala Phe Asn Cys Ser
690 695 700
Asp Leu Asp
705
<210> 524
<211> 2277
<212> DNA
<213> Populus trichocarpa
<400> 524
atgccagcgg gaatgatgat tccggcaaga aacatgccat ctatgattgg ggttaatgga 60
aatgctggtg ggtttggatc gtcttcagga cttgctcttg gtcagccaaa catgatggaa 120
ggtcagcttc accgtctaga catgacacaa aacacacctg aaggcgacat ggctcggatc 180
agagatgatg aatttgatag taccaacact aaatcaggca gtgagaacca agatggtgca 240
tccggtgatg atcaagatcc acgccccaaa aagaagcgtt atcatcgcca cactcagcat 300
cagatccaag aaatggaagc tttcttcaaa gagtgtccac acccagatga caagcaaagg 360
aaggagttaa gccgagaatt agggttagag ccattgcaag tcaaattttg gttccaaaat 420
aagcgcaccc aaatgaagac ccagcatgag cgccatgaaa acacacagct tcgaaatgag 480
aatgaaaagc ttagggctga caacatgcgg tacagagaag ctcttagcaa tgcctcgtgt 540
cctaattgtg gagggcctac tgccattgga gaaatgtcct ttgatgaaca tcatttgaga 600
ctggaaaatg ccagattaag agaagagatt gaccgtattt cagcaatcgc tgctaagtat 660
gttggcaagc ctgtggtgaa ctatccactt atatcggctc cgatgcctcc acgtccactt 720
gaccttggtg ttgggaattt tggtggacag ccaggcattg gaggggagat ttatggagct 780
ggagacctac ttaggtcgat aactgctcct actgaggctg ataagcccat gataattgag 840
cttgcagttg cagccatgga ggagctagtt agaatggccc aaatggatga acccttatgg 900
atgggtagcc ttgatggaac aaatgcagta ttagatgaag atgaatacgt aaggatattt 960
cctcgtggta ttgggcctaa acctactggt tttaaatgtg aggcttcaag agagtctgct 1020
gttgttatca tgaaccacat caaccttgtt gagtatctca tggatgtgaa tcagtggtct 1080
acattgtttt ccggcatagt ctcaagggct ttgactttgg aagtgttatc aacaggagtt 1140
gcagggaact ataatggtgc cttgcaagtg atgacggctg aatttcaact tccaactcca 1200
cttgttccta cccgagaaag ttactttgtg aggtactgta aacaacatgc cgatggtact 1260
tgggcagtgg ttgatgtttc attggacaat ttacgcccta gtccgggagc taggtgtcga 1320
aggaggccat ctggatgttt gattcaagaa atgcttaatg gatactccaa ggttacatgg 1380
gttgaacatg tagaggtgga tgatagaggt gttcataatc tatacaagca acttgttagc 1440
tcaggacatg cattcggggc aaaacgatgg gtggcaaccc tagatcggca atgcgagcgc 1500
cttgccagtg ccatggcaac aaatattcct gctggcgatg ttggtgtgat tactaatcaa 1560
gaagggagaa agagtatgat gaagctggca gagagaatgg tgataagctt ctgtgctgga 1620
gtgagcgcct ctactgctca tacttggact acactatctg gaactggagc tgatgatgtt 1680
agggtcatga caaggaagag tgtagatgat ccagggaggc ctcctgggat tgtgcttagt 1740
gctgcaactt ccttctggct tccagttcct ccaaaaaggg tttttgattt tcttcgtgac 1800
gagagcactc gaaatgagtg ggatattcta tcaaatggtg gagttgtcca agaaatggca 1860
cacattgcta atggccggga tacaggcaat tgtgtatctc tacttcgagt taatagcgcg 1920
aattcgagcc agagcaacat gctgatttta caagagagtt gcgctgatca aacagcctct 1980
ttcgtaatct atgcaccggt tgatattgtt gcaatgaacg tcgtacttaa tggaggcgat 2040
ccagactatg tagcacttct tccttcaggg tttgctgttc ttcccgatgg aactggagcg 2100
catgtaggag gcatggagga ggctgcaggt ggatctcttc taactgttgc attccagatt 2160
ttggttgatt cagttcctac agcaaaacta tctctcggct cagtggcaac tgttaacaac 2220
ttgattgcct gcaccgtgga gaggattaag gcttctttat catgcgaatc tgcatga 2277
<210> 525
<211> 758
<212> PRT
<213> Populus trichocarpa
<400> 525
Met Pro Ala Gly Met Met Ile Pro Ala Arg Asn Met Pro Ser Met Ile
1 5 10 15
Gly Val Asn Gly Asn Ala Gly Gly Phe Gly Ser Ser Ser Gly Leu Ala
20 25 30
Leu Gly Gln Pro Asn Met Met Glu Gly Gln Leu His Arg Leu Asp Met
35 40 45
Thr Gln Asn Thr Pro Glu Gly Asp Met Ala Arg Ile Arg Asp Asp Glu
50 55 60
Phe Asp Ser Thr Asn Thr Lys Ser Gly Ser Glu Asn Gln Asp Gly Ala
65 70 75 80
Ser Gly Asp Asp Gln Asp Pro Arg Pro Lys Lys Lys Arg Tyr His Arg
85 90 95
His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys
100 105 110
Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly
115 120 125
Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln
130 135 140
Met Lys Thr Gln His Glu Arg His Glu Asn Thr Gln Leu Arg Asn Glu
145 150 155 160
Asn Glu Lys Leu Arg Ala Asp Asn Met Arg Tyr Arg Glu Ala Leu Ser
165 170 175
Asn Ala Ser Cys Pro Asn Cys Gly Gly Pro Thr Ala Ile Gly Glu Met
180 185 190
Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Glu
195 200 205
Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val Gly Lys Pro
210 215 220
Val Val Asn Tyr Pro Leu Ile Ser Ala Pro Met Pro Pro Arg Pro Leu
225 230 235 240
Asp Leu Gly Val Gly Asn Phe Gly Gly Gln Pro Gly Ile Gly Gly Glu
245 250 255
Ile Tyr Gly Ala Gly Asp Leu Leu Arg Ser Ile Thr Ala Pro Thr Glu
260 265 270
Ala Asp Lys Pro Met Ile Ile Glu Leu Ala Val Ala Ala Met Glu Glu
275 280 285
Leu Val Arg Met Ala Gln Met Asp Glu Pro Leu Trp Met Gly Ser Leu
290 295 300
Asp Gly Thr Asn Ala Val Leu Asp Glu Asp Glu Tyr Val Arg Ile Phe
305 310 315 320
Pro Arg Gly Ile Gly Pro Lys Pro Thr Gly Phe Lys Cys Glu Ala Ser
325 330 335
Arg Glu Ser Ala Val Val Ile Met Asn His Ile Asn Leu Val Glu Tyr
340 345 350
Leu Met Asp Val Asn Gln Trp Ser Thr Leu Phe Ser Gly Ile Val Ser
355 360 365
Arg Ala Leu Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr
370 375 380
Asn Gly Ala Leu Gln Val Met Thr Ala Glu Phe Gln Leu Pro Thr Pro
385 390 395 400
Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys Gln His
405 410 415
Ala Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Asn Leu Arg
420 425 430
Pro Ser Pro Gly Ala Arg Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile
435 440 445
Gln Glu Met Leu Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val
450 455 460
Glu Val Asp Asp Arg Gly Val His Asn Leu Tyr Lys Gln Leu Val Ser
465 470 475 480
Ser Gly His Ala Phe Gly Ala Lys Arg Trp Val Ala Thr Leu Asp Arg
485 490 495
Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Thr Asn Ile Pro Ala Gly
500 505 510
Asp Val Gly Val Ile Thr Asn Gln Glu Gly Arg Lys Ser Met Met Lys
515 520 525
Leu Ala Glu Arg Met Val Ile Ser Phe Cys Ala Gly Val Ser Ala Ser
530 535 540
Thr Ala His Thr Trp Thr Thr Leu Ser Gly Thr Gly Ala Asp Asp Val
545 550 555 560
Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly
565 570 575
Ile Val Leu Ser Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro Lys
580 585 590
Arg Val Phe Asp Phe Leu Arg Asp Glu Ser Thr Arg Asn Glu Trp Asp
595 600 605
Ile Leu Ser Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn
610 615 620
Gly Arg Asp Thr Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala
625 630 635 640
Asn Ser Ser Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Ala Asp
645 650 655
Gln Thr Ala Ser Phe Val Ile Tyr Ala Pro Val Asp Ile Val Ala Met
660 665 670
Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro
675 680 685
Ser Gly Phe Ala Val Leu Pro Asp Gly Thr Gly Ala His Val Gly Gly
690 695 700
Met Glu Glu Ala Ala Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile
705 710 715 720
Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala
725 730 735
Thr Val Asn Asn Leu Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ser
740 745 750
Leu Ser Cys Glu Ser Ala
755
<210> 526
<211> 2163
<212> DNA
<213> Populus trichocarpa
<400> 526
atgttcgata gccaccatat gcttgatatg actcccaaaa gctctgaaaa tgacttgagc 60
aagctcaaag atgatgacta tgagaccaaa tccggcaccg aaactatgga agctccctcc 120
ggtgatgatc aggatcccag cggccaacgc cccaaaaaga agcgttatca tcgccatacg 180
cagcgtcaaa tccaagaaat ggaagctttc ttccaggaat gccctcatcc ggacgacaag 240
cagcggaagg agctcagccg cgagctaggg ctggatccat tgcaagtaaa attttggttc 300
caaaacaagc gtactcaaat gaaggcgcaa catgaacgca gtgagaattc aattctcaag 360
gctgagaatg aaaagcttcg tatggagaac aataggtaca aggaagccct aagcagtgcc 420
tcatgcccta actgtggtgg tccagctgct cttggtgaga tgtcttttga tgagcagcat 480
ttgaggattg agaatgctcg tcttagagaa gagattgaca ggatatctgg aattgctgcc 540
aagtatgttg gcaagccttt gtcttctctt tccaaccttt ctcatcattt accatcccga 600
tctcttgatc tcggagttag caattatggg gcacattcgg gcttcgtagg ggagatgttt 660
ggagctactg ctctccttgg agcagttact ggacctactg aggcagataa accaatgata 720
gttgaagtcg cggttgcggc aatggaggaa ctaatgagaa tggctcaggc tggagaaccc 780
ttgtggattc aaggagagaa caataccgag gttctcaatg aagaggaata tttgagaact 840
ttcactaggg gaattggacc aagaccttta ggaatgagat ctgaagcttc aagggaatcc 900
gcagttgtta tcatgagtca tgttaatctt gttgaaattc tcatggatgc gaatcaatgg 960
tcaactattt tctgtggtat tgtatcaaga gcaatgaccc tggaagtcct atcaacagga 1020
gtggcaggga actataatgg agcattgcaa gtgatgacag ctgagttcca ggtcccttcc 1080
ccacttgttc ctactagaga aaattacttt gtgaggtact gtaaacagca taccgatgcg 1140
acttgggcag tggtagacgt ttctttggac agtttatgcc ctagtctgat gtctaaatgt 1200
agaagaaggt catcaggttg cttgatccaa gaattgccaa atggttattc caatgtcgtt 1260
tgggttgagc acactgaagt ggacgacagg tctgttcaca atatatacag acccctggtt 1320
aattctggtc ttgcttttgg agcaaagcgt tgggtgggaa cattagatcg acaatgcgaa 1380
cgtcttgcaa gttcaatggc cattaacatt ccaactggag atctatgtgt gataacaacc 1440
cctgaaggga ggaaaagtat tctgaagctg gctgagagaa tggtgatgag cttttgcact 1500
ggagttggtg cttctactgc acatacttgg acaacattgt ctgcaactgg ttctgatgat 1560
gtgagagtaa tgactcgaaa gagtatggat gatccaggca ggcctccagg tattgtgctc 1620
agcgcagcga cttccttctg gattcctgtt ccatccaaga aggtgtttga tttccttaag 1680
gatgagaacc atcgaagtga gtgggatatc ctttcaaatg gtggccaggt tcaagaaatg 1740
gctcatattg ctaatggacg tgatcccggg aactgtgtct cattgctccg tgtcaatagt 1800
acaaattcaa gccagagcaa catgctgatc ttacaagaga gctgcactga ttctacaggc 1860
tcatatgtga tttatgcacc agtggacatt tcggccatga atatagtcct aagtggtgga 1920
gacccagatt atgttgctct gcttccatca ggttttgcta ttctccctga tggaccagga 1980
tatggccctg caggaattct tgatgtcggg tctggcggct ctctgttgac tgttgcattt 2040
cagatattag tggattcagt cccatcagtg aaactttcgc ttggatcagt agcaactgta 2100
aacagtctaa ttaagtgcac agttgaaagg attaaggctg cagtaatgtg tgacaatcct 2160
tga 2163
<210> 527
<211> 720
<212> PRT
<213> Populus trichocarpa
<400> 527
Met Phe Asp Ser His His Met Leu Asp Met Thr Pro Lys Ser Ser Glu
1 5 10 15
Asn Asp Leu Ser Lys Leu Lys Asp Asp Asp Tyr Glu Thr Lys Ser Gly
20 25 30
Thr Glu Thr Met Glu Ala Pro Ser Gly Asp Asp Gln Asp Pro Ser Gly
35 40 45
Gln Arg Pro Lys Lys Lys Arg Tyr His Arg His Thr Gln Arg Gln Ile
50 55 60
Gln Glu Met Glu Ala Phe Phe Gln Glu Cys Pro His Pro Asp Asp Lys
65 70 75 80
Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Asp Pro Leu Gln Val
85 90 95
Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Ala Gln His Glu
100 105 110
Arg Ser Glu Asn Ser Ile Leu Lys Ala Glu Asn Glu Lys Leu Arg Met
115 120 125
Glu Asn Asn Arg Tyr Lys Glu Ala Leu Ser Ser Ala Ser Cys Pro Asn
130 135 140
Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe Asp Glu Gln His
145 150 155 160
Leu Arg Ile Glu Asn Ala Arg Leu Arg Glu Glu Ile Asp Arg Ile Ser
165 170 175
Gly Ile Ala Ala Lys Tyr Val Gly Lys Pro Leu Ser Ser Leu Ser Asn
180 185 190
Leu Ser His His Leu Pro Ser Arg Ser Leu Asp Leu Gly Val Ser Asn
195 200 205
Tyr Gly Ala His Ser Gly Phe Val Gly Glu Met Phe Gly Ala Thr Ala
210 215 220
Leu Leu Gly Ala Val Thr Gly Pro Thr Glu Ala Asp Lys Pro Met Ile
225 230 235 240
Val Glu Val Ala Val Ala Ala Met Glu Glu Leu Met Arg Met Ala Gln
245 250 255
Ala Gly Glu Pro Leu Trp Ile Gln Gly Glu Asn Asn Thr Glu Val Leu
260 265 270
Asn Glu Glu Glu Tyr Leu Arg Thr Phe Thr Arg Gly Ile Gly Pro Arg
275 280 285
Pro Leu Gly Met Arg Ser Glu Ala Ser Arg Glu Ser Ala Val Val Ile
290 295 300
Met Ser His Val Asn Leu Val Glu Ile Leu Met Asp Ala Asn Gln Trp
305 310 315 320
Ser Thr Ile Phe Cys Gly Ile Val Ser Arg Ala Met Thr Leu Glu Val
325 330 335
Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met
340 345 350
Thr Ala Glu Phe Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Asn
355 360 365
Tyr Phe Val Arg Tyr Cys Lys Gln His Thr Asp Ala Thr Trp Ala Val
370 375 380
Val Asp Val Ser Leu Asp Ser Leu Cys Pro Ser Leu Met Ser Lys Cys
385 390 395 400
Arg Arg Arg Ser Ser Gly Cys Leu Ile Gln Glu Leu Pro Asn Gly Tyr
405 410 415
Ser Asn Val Val Trp Val Glu His Thr Glu Val Asp Asp Arg Ser Val
420 425 430
His Asn Ile Tyr Arg Pro Leu Val Asn Ser Gly Leu Ala Phe Gly Ala
435 440 445
Lys Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser
450 455 460
Ser Met Ala Ile Asn Ile Pro Thr Gly Asp Leu Cys Val Ile Thr Thr
465 470 475 480
Pro Glu Gly Arg Lys Ser Ile Leu Lys Leu Ala Glu Arg Met Val Met
485 490 495
Ser Phe Cys Thr Gly Val Gly Ala Ser Thr Ala His Thr Trp Thr Thr
500 505 510
Leu Ser Ala Thr Gly Ser Asp Asp Val Arg Val Met Thr Arg Lys Ser
515 520 525
Met Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Ser Ala Ala Thr
530 535 540
Ser Phe Trp Ile Pro Val Pro Ser Lys Lys Val Phe Asp Phe Leu Lys
545 550 555 560
Asp Glu Asn His Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Gln
565 570 575
Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp Pro Gly Asn Cys
580 585 590
Val Ser Leu Leu Arg Val Asn Ser Thr Asn Ser Ser Gln Ser Asn Met
595 600 605
Leu Ile Leu Gln Glu Ser Cys Thr Asp Ser Thr Gly Ser Tyr Val Ile
610 615 620
Tyr Ala Pro Val Asp Ile Ser Ala Met Asn Ile Val Leu Ser Gly Gly
625 630 635 640
Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro
645 650 655
Asp Gly Pro Gly Tyr Gly Pro Ala Gly Ile Leu Asp Val Gly Ser Gly
660 665 670
Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro
675 680 685
Ser Val Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile
690 695 700
Lys Cys Thr Val Glu Arg Ile Lys Ala Ala Val Met Cys Asp Asn Pro
705 710 715 720
<210> 528
<211> 2466
<212> DNA
<213> Solanum lycopersicum
<400> 528
atgaattttg ggggttttct tgataataat tctggtggtg gcggtgcaag aattgttgct 60
gatataccat ttaatcacaa caacagcagc agcaacaacg acaataaaaa caatatgccc 120
actggtgcaa tttctcagcc aagacttctt cctcaatctc ttgccaagaa catgttcaac 180
tccccaggac tttctcttgc tcttcaaaca ggtatggaag ggcaaagtga ggtaacaaga 240
atggctgaaa actacgaggg aaataacagt gttggtagaa ggagtagaga agaagaacca 300
gacagcagat ctggaagtga taacttggaa ggtgcatcgg gtgatgaaca agatgctacc 360
gacaaaccac caaggaagaa aagataccac cgacacactc ctcagcaaat ccaagaactt 420
gaatctcttt tcaaggagtg tcctcatcct gatgagaaac aaaggttgga gttaagcaaa 480
aggctttctt tggagactag acaagtcaag ttttggttcc aaaatcgtag aactcagatg 540
aagactcaac tggaacgcca tgagaattcg atactaaggc aagagaatga taagcttcgt 600
gcagaaaaca tgtctataag agaggcaatg agaaatccaa tttgtactaa ttgtggtggt 660
ccagcaatga ttggtgagat ctctcttgag gagcaacatc ttaggattga aaatgctagg 720
ctgaaagatg aattagatcg agtttgtgca cttgctggca agtttttggg gcgacccatt 780
tcatctttag taacctctat gcctccccca atgcctaatt caagtttgga acttggagtt 840
ggaagtaatg gatttggtgg tatgagtaat gtaccaacaa cactcccctt agcacctcct 900
gatttcggtg ttgggatttc aaattcttta ccagttgtgc cttcaactag acagtcaact 960
ggaattgaga gatcacttga aagatccatg tatcttgaac ttgctttggc tgccatggag 1020
gaattggtaa aaatggcaca aactgatgaa cctctttggt tcaggagcat tgaaggtggt 1080
agagaaatac ttaaccatga agagtacata aggacattta ctccttgcat tggtatgaga 1140
ccaaacagtt ttatttcaga ggcttccagg gagacaggca tggttataat caatagttta 1200
gctcttgttg agacattaat ggactctaac aaatgggcag aaatgtttcc atgtttgatt 1260
gctagaacct caacaacaga tgttatatca agtggtatgg gtggaaccag aaatggtgca 1320
cttcagctga tgcatgctga actccaagtg ctttcaccat tagtaccaat tagagaggtc 1380
aatttcctgc gtttctgcaa acaacatgct gaaggtgtct gggctgtcgt tgatgtatcg 1440
attgatacca tccgtgaaac ttctggtgca ccaacgtttc caaatagcag aaggcttcct 1500
tctggctgtg ttgttcaaga tatgcccaat ggctacagca aagttacatg ggtagaacat 1560
gccgaatatg aagagggtgc aaatcaccat ctttaccggc agttaattag cgcgggtatg 1620
gggtttggcg cacaaagatg ggttgcaacc ctccaacgcc agtgtgagtg tcttgcaatt 1680
ctcatgtcat ccaccgtgtc tgccagggat catacagcaa taactccaag tgggaggcgt 1740
agcatgttga agctagcaca acgcatgaca aacaactttt gtgctggtgt ttgtgcttca 1800
acggtacaca agtggaacaa actttgtgca ggtaatgttg atgaagatgt acgtgtcatg 1860
actcgaaaga gcgtcgatga ccctggtgaa ccagcaggga tcgtcttaag cgctgctact 1920
tccgtttggt tgcccgtttc ccctcaaaga ctctttgatt tcctccgtga cgaacgcctc 1980
cgtagcgaat gggatatcct atccaacggt ggccctatgc aagaaatggc tcatattgcc 2040
aaaggccaag atcatggcaa ctgcgtctct ctccttcgtg ctagtgctat gaacgcgaat 2100
cagagcagca tgttgatact tcatgagact tgcatagacg cggctggggc gcttgttgta 2160
tacgcgccag ttgatattcc ggcaatgcac gtggtgatga acggtggaaa ttcggcttac 2220
gtggctttgc ttccttcggg attctcaatt gtacccgacg gcccaggatc tcgtgggtcc 2280
aatgggcctt catgtaatgg gggcccagat caaagaatta gcgggtcact cttgacggta 2340
gcctttcaga tattggtgaa tagtcttcct acagccaagc ttactgtgga atcagtggaa 2400
acagtcaata atcttatatc atgcactgtt cagaagatta aagctgcact tcaatgcgaa 2460
agctaa 2466
<210> 529
<211> 821
<212> PRT
<213> Solanum lycopersicum
<400> 529
Met Asn Phe Gly Gly Phe Leu Asp Asn Asn Ser Gly Gly Gly Gly Ala
1 5 10 15
Arg Ile Val Ala Asp Ile Pro Phe Asn His Asn Asn Ser Ser Ser Asn
20 25 30
Asn Asp Asn Lys Asn Asn Met Pro Thr Gly Ala Ile Ser Gln Pro Arg
35 40 45
Leu Leu Pro Gln Ser Leu Ala Lys Asn Met Phe Asn Ser Pro Gly Leu
50 55 60
Ser Leu Ala Leu Gln Thr Gly Met Glu Gly Gln Ser Glu Val Thr Arg
65 70 75 80
Met Ala Glu Asn Tyr Glu Gly Asn Asn Ser Val Gly Arg Arg Ser Arg
85 90 95
Glu Glu Glu Pro Asp Ser Arg Ser Gly Ser Asp Asn Leu Glu Gly Ala
100 105 110
Ser Gly Asp Glu Gln Asp Ala Thr Asp Lys Pro Pro Arg Lys Lys Arg
115 120 125
Tyr His Arg His Thr Pro Gln Gln Ile Gln Glu Leu Glu Ser Leu Phe
130 135 140
Lys Glu Cys Pro His Pro Asp Glu Lys Gln Arg Leu Glu Leu Ser Lys
145 150 155 160
Arg Leu Ser Leu Glu Thr Arg Gln Val Lys Phe Trp Phe Gln Asn Arg
165 170 175
Arg Thr Gln Met Lys Thr Gln Leu Glu Arg His Glu Asn Ser Ile Leu
180 185 190
Arg Gln Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Ser Ile Arg Glu
195 200 205
Ala Met Arg Asn Pro Ile Cys Thr Asn Cys Gly Gly Pro Ala Met Ile
210 215 220
Gly Glu Ile Ser Leu Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg
225 230 235 240
Leu Lys Asp Glu Leu Asp Arg Val Cys Ala Leu Ala Gly Lys Phe Leu
245 250 255
Gly Arg Pro Ile Ser Ser Leu Val Thr Ser Met Pro Pro Pro Met Pro
260 265 270
Asn Ser Ser Leu Glu Leu Gly Val Gly Ser Asn Gly Phe Gly Gly Met
275 280 285
Ser Asn Val Pro Thr Thr Leu Pro Leu Ala Pro Pro Asp Phe Gly Val
290 295 300
Gly Ile Ser Asn Ser Leu Pro Val Val Pro Ser Thr Arg Gln Ser Thr
305 310 315 320
Gly Ile Glu Arg Ser Leu Glu Arg Ser Met Tyr Leu Glu Leu Ala Leu
325 330 335
Ala Ala Met Glu Glu Leu Val Lys Met Ala Gln Thr Asp Glu Pro Leu
340 345 350
Trp Phe Arg Ser Ile Glu Gly Gly Arg Glu Ile Leu Asn His Glu Glu
355 360 365
Tyr Ile Arg Thr Phe Thr Pro Cys Ile Gly Met Arg Pro Asn Ser Phe
370 375 380
Ile Ser Glu Ala Ser Arg Glu Thr Gly Met Val Ile Ile Asn Ser Leu
385 390 395 400
Ala Leu Val Glu Thr Leu Met Asp Ser Asn Lys Trp Ala Glu Met Phe
405 410 415
Pro Cys Leu Ile Ala Arg Thr Ser Thr Thr Asp Val Ile Ser Ser Gly
420 425 430
Met Gly Gly Thr Arg Asn Gly Ala Leu Gln Leu Met His Ala Glu Leu
435 440 445
Gln Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Asn Phe Leu Arg
450 455 460
Phe Cys Lys Gln His Ala Glu Gly Val Trp Ala Val Val Asp Val Ser
465 470 475 480
Ile Asp Thr Ile Arg Glu Thr Ser Gly Ala Pro Thr Phe Pro Asn Ser
485 490 495
Arg Arg Leu Pro Ser Gly Cys Val Val Gln Asp Met Pro Asn Gly Tyr
500 505 510
Ser Lys Val Thr Trp Val Glu His Ala Glu Tyr Glu Glu Gly Ala Asn
515 520 525
His His Leu Tyr Arg Gln Leu Ile Ser Ala Gly Met Gly Phe Gly Ala
530 535 540
Gln Arg Trp Val Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile
545 550 555 560
Leu Met Ser Ser Thr Val Ser Ala Arg Asp His Thr Ala Ile Thr Pro
565 570 575
Ser Gly Arg Arg Ser Met Leu Lys Leu Ala Gln Arg Met Thr Asn Asn
580 585 590
Phe Cys Ala Gly Val Cys Ala Ser Thr Val His Lys Trp Asn Lys Leu
595 600 605
Cys Ala Gly Asn Val Asp Glu Asp Val Arg Val Met Thr Arg Lys Ser
610 615 620
Val Asp Asp Pro Gly Glu Pro Ala Gly Ile Val Leu Ser Ala Ala Thr
625 630 635 640
Ser Val Trp Leu Pro Val Ser Pro Gln Arg Leu Phe Asp Phe Leu Arg
645 650 655
Asp Glu Arg Leu Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Pro
660 665 670
Met Gln Glu Met Ala His Ile Ala Lys Gly Gln Asp His Gly Asn Cys
675 680 685
Val Ser Leu Leu Arg Ala Ser Ala Met Asn Ala Asn Gln Ser Ser Met
690 695 700
Leu Ile Leu His Glu Thr Cys Ile Asp Ala Ala Gly Ala Leu Val Val
705 710 715 720
Tyr Ala Pro Val Asp Ile Pro Ala Met His Val Val Met Asn Gly Gly
725 730 735
Asn Ser Ala Tyr Val Ala Leu Leu Pro Ser Gly Phe Ser Ile Val Pro
740 745 750
Asp Gly Pro Gly Ser Arg Gly Ser Asn Gly Pro Ser Cys Asn Gly Gly
755 760 765
Pro Asp Gln Arg Ile Ser Gly Ser Leu Leu Thr Val Ala Phe Gln Ile
770 775 780
Leu Val Asn Ser Leu Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu
785 790 795 800
Thr Val Asn Asn Leu Ile Ser Cys Thr Val Gln Lys Ile Lys Ala Ala
805 810 815
Leu Gln Cys Glu Ser
820
<210> 530
<211> 945
<212> DNA
<213> Populus trichocarpa
<400> 530
atggcgggtg gtaccggtgg ttctaattcc aatttgtctg ttttgcttca aagccaaaga 60
ggcccttgtg ctgcttcaca acctcttgaa tcttttttcc tttctggctc ttctccttct 120
tttcttggtt caagatccat gatgagtttt gaagatgttc atcaagcaaa cggatcaacc 180
aggccttttt tccgctcgtt tgatcacgaa gacaatggag acgatgatct ggatgaatat 240
tttcatcaac ctgaaaagaa gaggagactt actgttgatc aagttcagtt tcttgaaaag 300
agttttgagc ttgagaacaa gcttgaacct gaaaggaaaa tccagcttgc aaaggatctt 360
ggccttcagc cgcgtcaggt tgctatatgg tttcaaaacc gccgagcaag atggaagact 420
aaacagctgg aaaaggatta tgacgttctg caatctagct acaatagcct taaggctgac 480
tatgacaacc tcctcaagga gaaggagaaa ctaaaagctg aggttaatct tctcaccgac 540
aagttgctcc tcaaagagaa agagaaggga agctcagaat tgtctgataa agatgcatta 600
tcgcaagagc cacctaaaag ggctatagct gattcagctt ccgagggtga agtgtcgaaa 660
atctcaacag tggcctgtaa gcagggagat atcagctcag ccaaaagcga catatttgat 720
tcagacagcc cacattacgc tgatggggtg cattcctcac tcttagaggc aggagattct 780
tcatatgttt tcgaacccga tcaatcagat ttgtcacaag atgaagaaga taactttagc 840
aagagcttat tgcctccata cgtctttccg aagcttgaag atgacgatta ctctgacccg 900
cctgcaagtt ttgaaggtca tgccttttgg tcctggtcat actaa 945
<210> 531
<211> 314
<212> PRT
<213> Populus trichocarpa
<400> 531
Met Ala Gly Gly Thr Gly Gly Ser Asn Ser Asn Leu Ser Val Leu Leu
1 5 10 15
Gln Ser Gln Arg Gly Pro Cys Ala Ala Ser Gln Pro Leu Glu Ser Phe
20 25 30
Phe Leu Ser Gly Ser Ser Pro Ser Phe Leu Gly Ser Arg Ser Met Met
35 40 45
Ser Phe Glu Asp Val His Gln Ala Asn Gly Ser Thr Arg Pro Phe Phe
50 55 60
Arg Ser Phe Asp His Glu Asp Asn Gly Asp Asp Asp Leu Asp Glu Tyr
65 70 75 80
Phe His Gln Pro Glu Lys Lys Arg Arg Leu Thr Val Asp Gln Val Gln
85 90 95
Phe Leu Glu Lys Ser Phe Glu Leu Glu Asn Lys Leu Glu Pro Glu Arg
100 105 110
Lys Ile Gln Leu Ala Lys Asp Leu Gly Leu Gln Pro Arg Gln Val Ala
115 120 125
Ile Trp Phe Gln Asn Arg Arg Ala Arg Trp Lys Thr Lys Gln Leu Glu
130 135 140
Lys Asp Tyr Asp Val Leu Gln Ser Ser Tyr Asn Ser Leu Lys Ala Asp
145 150 155 160
Tyr Asp Asn Leu Leu Lys Glu Lys Glu Lys Leu Lys Ala Glu Val Asn
165 170 175
Leu Leu Thr Asp Lys Leu Leu Leu Lys Glu Lys Glu Lys Gly Ser Ser
180 185 190
Glu Leu Ser Asp Lys Asp Ala Leu Ser Gln Glu Pro Pro Lys Arg Ala
195 200 205
Ile Ala Asp Ser Ala Ser Glu Gly Glu Val Ser Lys Ile Ser Thr Val
210 215 220
Ala Cys Lys Gln Gly Asp Ile Ser Ser Ala Lys Ser Asp Ile Phe Asp
225 230 235 240
Ser Asp Ser Pro His Tyr Ala Asp Gly Val His Ser Ser Leu Leu Glu
245 250 255
Ala Gly Asp Ser Ser Tyr Val Phe Glu Pro Asp Gln Ser Asp Leu Ser
260 265 270
Gln Asp Glu Glu Asp Asn Phe Ser Lys Ser Leu Leu Pro Pro Tyr Val
275 280 285
Phe Pro Lys Leu Glu Asp Asp Asp Tyr Ser Asp Pro Pro Ala Ser Phe
290 295 300
Glu Gly His Ala Phe Trp Ser Trp Ser Tyr
305 310
<210> 532
<211> 1137
<212> DNA
<213> Triticum aestivum
<220>
<221> misc_feature
<222> (9)..(9)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or t
<400> 532
atgtacggng ttactncgac ccacgcgtcc gtccaactga tgcgcgcgga gctgcaggtg 60
ctgtcgccgc tggtaccgat cagggaggtg acgttcctgc gcttctgcaa gcagcacgcc 120
gacgggctgt gggccatcgt ggacgtgtcg gtggacggcg tcctccgccc cgactccggc 180
accggcgccg gcccggcagg gtacatgggc tgccgcctcc tcccctccgg ctgcatcgtc 240
gaggacatgc agaacggcta cgccaaggtc acgtgggtgg ttcacgccga gtacgacgag 300
gcggcggtgc acgagctgta ccgcccgctg ctccgctccg gccaggccct gggcgcgcgc 360
cgctggctcg cctcgctgca gcgccagtgc gagtaccacg ccatcctctg ctccaacccg 420
caccccaacc acggcgaccg ccacgaggcc atctcgccgg cgggccgccg gtgcatgctc 480
aggctggcgc agcggatggc cgacaacttc tgcgccggcg tctgcgccac ggccgcccag 540
aagtggcgcc gcctcgacga gtggcgcgtc gagggcgctg gcggacggga cccggccggc 600
ggggaggaca aggtgcgcat gatggccagg cagagcgtgg gcgcgcctgg cgagcccccc 660
ggcgtcgtgc tcagcgctac cacttccgtg cggctccccg gcacgctgcc gcagcgcgtc 720
ttcgactacc tccgcgacga gcagcgccgc ggagagtggg acatcctcgc caacggcgag 780
gccatgcagg agatggacca catcgccaag ggccagcacc acgggcaacg ccgtctccct 840
cctccgtcca aacgcgacga gcgggaacca gaaacacatg ctcatcctgc aggagacgtg 900
caccgacgcg tccggctcgc tggtggtgta cgcgccggtg gacgtgcagt caatgcacgt 960
cgtcatgggc ggcggggact cggcctacgt ctcactgctg ccctcggggt tcgcatcctc 1020
ccgagggcaa caacagccgg ccacgggaat gaccttctcc cagggtcgtg cccatggcca 1080
tgcgggagga gaacaaaacc ccggtctgcc cgtaccgggg cctcaaatat ctggtaa 1137
<210> 533
<211> 378
<212> PRT
<213> Triticum aestivum
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa can be any naturally occurring amino acid
<400> 533
Met Tyr Gly Val Thr Xaa Thr His Ala Ser Val Gln Leu Met Arg Ala
1 5 10 15
Glu Leu Gln Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Thr Phe
20 25 30
Leu Arg Phe Cys Lys Gln His Ala Asp Gly Leu Trp Ala Ile Val Asp
35 40 45
Val Ser Val Asp Gly Val Leu Arg Pro Asp Ser Gly Thr Gly Ala Gly
50 55 60
Pro Ala Gly Tyr Met Gly Cys Arg Leu Leu Pro Ser Gly Cys Ile Val
65 70 75 80
Glu Asp Met Gln Asn Gly Tyr Ala Lys Val Thr Trp Val Val His Ala
85 90 95
Glu Tyr Asp Glu Ala Ala Val His Glu Leu Tyr Arg Pro Leu Leu Arg
100 105 110
Ser Gly Gln Ala Leu Gly Ala Arg Arg Trp Leu Ala Ser Leu Gln Arg
115 120 125
Gln Cys Glu Tyr His Ala Ile Leu Cys Ser Asn Pro His Pro Asn His
130 135 140
Gly Asp Arg His Glu Ala Ile Ser Pro Ala Gly Arg Arg Cys Met Leu
145 150 155 160
Arg Leu Ala Gln Arg Met Ala Asp Asn Phe Cys Ala Gly Val Cys Ala
165 170 175
Thr Ala Ala Gln Lys Trp Arg Arg Leu Asp Glu Trp Arg Val Glu Gly
180 185 190
Ala Gly Gly Arg Asp Pro Ala Gly Gly Glu Asp Lys Val Arg Met Met
195 200 205
Ala Arg Gln Ser Val Gly Ala Pro Gly Glu Pro Pro Gly Val Val Leu
210 215 220
Ser Ala Thr Thr Ser Val Arg Leu Pro Gly Thr Leu Pro Gln Arg Val
225 230 235 240
Phe Asp Tyr Leu Arg Asp Glu Gln Arg Arg Gly Glu Trp Asp Ile Leu
245 250 255
Ala Asn Gly Glu Ala Met Gln Glu Met Asp His Ile Ala Lys Gly Gln
260 265 270
His His Gly Gln Arg Arg Leu Pro Pro Pro Ser Lys Arg Asp Glu Arg
275 280 285
Glu Pro Glu Thr His Ala His Pro Ala Gly Asp Val His Arg Arg Val
290 295 300
Arg Leu Ala Gly Gly Val Arg Ala Gly Gly Arg Ala Val Asn Ala Arg
305 310 315 320
Arg His Gly Arg Arg Gly Leu Gly Leu Arg Leu Thr Ala Ala Leu Gly
325 330 335
Val Arg Ile Leu Pro Arg Ala Thr Thr Ala Gly His Gly Asn Asp Leu
340 345 350
Leu Pro Gly Ser Cys Pro Trp Pro Cys Gly Arg Arg Thr Lys Pro Arg
355 360 365
Ser Ala Arg Thr Gly Ala Ser Asn Ile Trp
370 375
<210> 534
<211> 2229
<212> DNA
<213> Zea mays
<400> 534
atggggcgcg gcggcggcgg ggtgtccgac ccgctgctgg gcgacgagtt cgagagcaag 60
tccggcagcg agaacgtgga cggcggcgtc tccgtggacg agctgcagga ccccaaccag 120
cggcccagca agaagaagcg ctaccaccgc cacacccagc accagatcca ggagttggaa 180
gctttcttca aggagtgccc gcacccggac gacaagcagc gcaaggagct gagccgggag 240
ctggggctgg agcccctcca ggtcaagttc tggttccaga acaagcgcac gcaaatgaag 300
aaccatcacg agcggcagga gaactcgcag ctgaggtccg agaacgagaa gctgcgcgcc 360
gagaacatgc ggtacaagga ggccctgagc agcgcgtcgt gccccagctg cggcgggccg 420
gccgcgctcg gcgagatgtc cttcgacgag caccacctcc gcgtggagaa cgcgcggctg 480
cgggaggagg tcgacaggat ctcctccatc gccgccaagt acgtgggcag gcccatggtg 540
cccttccccg tgctgtccag cccgctggcc ggggccgggg cacgcgcccc cgcgttgccg 600
ccgctggaca tggcgccgcc gtatggcgct gccgctgaca tgttcggcgg cggcggtgtc 660
gtcgctgctg ctggtgctgc cggtgccggg gacctgctgc tgaggggcgc cgccgtgcag 720
tcggacgccg acaagcctat gatcgtggag ctggccgtgg cggccatgga ggagctggtt 780
cggatggcgc agctggacga gccgctgtgg aacgcgcccg cggggctcga tgggtccgct 840
gaggaggaga cgcttaacga ggaggagtac gcgcgcttgt tccccggcgg gctcgggccc 900
aagccgtacg ggctcaactc ggaggcgtcg cgtgacagcg ccgtcgtcat catgacccat 960
gccaacctcg tcgaaatcct catggacgtg aaccagtatg cggccgtgtt ctcgagtatc 1020
gtgtcgagag ccgcgacgct ggaggtgcta tcaaccggcg tggctgggaa ctacaatggt 1080
gcattgcaag tgatgtcggt ggagtttcag gtgccttccc cactggtgcc gaccagggaa 1140
agctacttcg tgaggtactg caagcagaac gccgacggaa catgggccgt cgtcgacgtc 1200
tcgctggacg gcctgcgccc cggcgcagtc ctcaagtgcc ggcgccggcc gtcgggatgc 1260
ctgatccagg aaatgcccaa tggctactcg aaggtgacct gggtggagca cgtcgaggtg 1320
gacgacaggt cggtgcacag catctacaag ctgctggtga gctcggggct ggccttcggt 1380
gcacgccgat gggttgggac gctggaccgc cagtgcgagc gccttgccag tgtcatggcc 1440
agcaacatcc cgaccagcga catcggtgtg atcactagcg cggaggggag gaagagcatg 1500
ctgaagctgg cggagaggat ggtgatgagc ttctgcggcg gcgtgacggc ctctgcggcg 1560
caccagtgga caacgctgtc cggcagcggc gctgaggacg tccgcgtcat gaccaggaag 1620
agcgtcgacg accctggcag gccgcccggc atagtcctca acgctgccac ctcgttctgg 1680
ctccccgtcc cgcccaagcg tgtcttcgac ttcctccgtg acgaaagctc tcgcagcgag 1740
tgggacatcc tctccaatgg cggcgttgtt caagagatgg ctcacatcgc caacggccgc 1800
gaccatggaa actgcgtctc gcttcttcgt gtcaatagca cgaactcgaa ccaaagcagc 1860
atgctgatcc tccaggagag ctgcaccgac atgtcgggct cgtacgtcat ctacgccccg 1920
gtggatgtgg tcgccatgaa cgtggtcctc aacggcggcg accctgacta cgtggcgctc 1980
ctgccctctg gcttcgcgat cctgcccgac ggcccatcgt cagggagcag cagcatgctg 2040
caaggcgacg gcggcgtcgg ctcaggtggg tcgctcctga cggtggcctt ccagatactc 2100
gtcgactctg tccccaccgc caagatctcg ctggggtcgg tggccacggt gaacagcctc 2160
atcgcctgca ccgtggagcg catcaaggcg gcggtgatct ccggccagag caatccccag 2220
cagcagtag 2229
<210> 535
<211> 742
<212> PRT
<213> Zea mays
<400> 535
Met Gly Arg Gly Gly Gly Gly Val Ser Asp Pro Leu Leu Gly Asp Glu
1 5 10 15
Phe Glu Ser Lys Ser Gly Ser Glu Asn Val Asp Gly Gly Val Ser Val
20 25 30
Asp Glu Leu Gln Asp Pro Asn Gln Arg Pro Ser Lys Lys Lys Arg Tyr
35 40 45
His Arg His Thr Gln His Gln Ile Gln Glu Leu Glu Ala Phe Phe Lys
50 55 60
Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu
65 70 75 80
Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg
85 90 95
Thr Gln Met Lys Asn His His Glu Arg Gln Glu Asn Ser Gln Leu Arg
100 105 110
Ser Glu Asn Glu Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala
115 120 125
Leu Ser Ser Ala Ser Cys Pro Ser Cys Gly Gly Pro Ala Ala Leu Gly
130 135 140
Glu Met Ser Phe Asp Glu His His Leu Arg Val Glu Asn Ala Arg Leu
145 150 155 160
Arg Glu Glu Val Asp Arg Ile Ser Ser Ile Ala Ala Lys Tyr Val Gly
165 170 175
Arg Pro Met Val Pro Phe Pro Val Leu Ser Ser Pro Leu Ala Gly Ala
180 185 190
Gly Ala Arg Ala Pro Ala Leu Pro Pro Leu Asp Met Ala Pro Pro Tyr
195 200 205
Gly Ala Ala Ala Asp Met Phe Gly Gly Gly Gly Val Val Ala Ala Ala
210 215 220
Gly Ala Ala Gly Ala Gly Asp Leu Leu Leu Arg Gly Ala Ala Val Gln
225 230 235 240
Ser Asp Ala Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met
245 250 255
Glu Glu Leu Val Arg Met Ala Gln Leu Asp Glu Pro Leu Trp Asn Ala
260 265 270
Pro Ala Gly Leu Asp Gly Ser Ala Glu Glu Glu Thr Leu Asn Glu Glu
275 280 285
Glu Tyr Ala Arg Leu Phe Pro Gly Gly Leu Gly Pro Lys Pro Tyr Gly
290 295 300
Leu Asn Ser Glu Ala Ser Arg Asp Ser Ala Val Val Ile Met Thr His
305 310 315 320
Ala Asn Leu Val Glu Ile Leu Met Asp Val Asn Gln Tyr Ala Ala Val
325 330 335
Phe Ser Ser Ile Val Ser Arg Ala Ala Thr Leu Glu Val Leu Ser Thr
340 345 350
Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln Val Met Ser Val Glu
355 360 365
Phe Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val
370 375 380
Arg Tyr Cys Lys Gln Asn Ala Asp Gly Thr Trp Ala Val Val Asp Val
385 390 395 400
Ser Leu Asp Gly Leu Arg Pro Gly Ala Val Leu Lys Cys Arg Arg Arg
405 410 415
Pro Ser Gly Cys Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val
420 425 430
Thr Trp Val Glu His Val Glu Val Asp Asp Arg Ser Val His Ser Ile
435 440 445
Tyr Lys Leu Leu Val Ser Ser Gly Leu Ala Phe Gly Ala Arg Arg Trp
450 455 460
Val Gly Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Val Met Ala
465 470 475 480
Ser Asn Ile Pro Thr Ser Asp Ile Gly Val Ile Thr Ser Ala Glu Gly
485 490 495
Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met Val Met Ser Phe Cys
500 505 510
Gly Gly Val Thr Ala Ser Ala Ala His Gln Trp Thr Thr Leu Ser Gly
515 520 525
Ser Gly Ala Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp
530 535 540
Pro Gly Arg Pro Pro Gly Ile Val Leu Asn Ala Ala Thr Ser Phe Trp
545 550 555 560
Leu Pro Val Pro Pro Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Ser
565 570 575
Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Val Val Gln Glu
580 585 590
Met Ala His Ile Ala Asn Gly Arg Asp His Gly Asn Cys Val Ser Leu
595 600 605
Leu Arg Val Asn Ser Thr Asn Ser Asn Gln Ser Ser Met Leu Ile Leu
610 615 620
Gln Glu Ser Cys Thr Asp Met Ser Gly Ser Tyr Val Ile Tyr Ala Pro
625 630 635 640
Val Asp Val Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp
645 650 655
Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro
660 665 670
Ser Ser Gly Ser Ser Ser Met Leu Gln Gly Asp Gly Gly Val Gly Ser
675 680 685
Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val
690 695 700
Pro Thr Ala Lys Ile Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu
705 710 715 720
Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ala Val Ile Ser Gly Gln
725 730 735
Ser Asn Pro Gln Gln Gln
740
<210> 536
<211> 2592
<212> DNA
<213> Zea mays
<400> 536
atggcaaatg ccgcttgtgt gggcggaagc tttttgggag tagaaaaggg aaagcctgcc 60
actgtcagca acctaggcgc tcctgcagtc ctgctgctgg ttcttgcctg tctcccgctt 120
gttctcccta gttccgaccc gaagcaggga atgagcttcg gcgatctcga cggcggcggg 180
tccgcggccg gcttgcagta cccgtacggc gccttcgcgt catcgccggt cctctcgctc 240
accgtggtgg acgccaggcg ccgccgcggc ggcggcggga acgcgaagga cgcgtcggag 300
gcggagaacg agggacagtc gatgatgagc ggacacctcg acgtcgtcct gtctggcggc 360
ggcgatggcg aggacggcga ggccgcgaac cagcgcaagc ccaagcgcaa gaagccgtac 420
aaccgccaca cgccgcggca gatcgaacag ctcgaagcga tgttcaagga attccaccac 480
ccggacgaga agcagcgcgc gcagctgagc aggcagctgg gcctggaccc gcggcaggtc 540
aagttctggt tccagaaccg gcgcacgcat ttgaagtgct tgacatggct ttcgcttttg 600
catggtcctg aacttggcaa gaaccaactg gagcggcagg agaacgcgag gctgaaacac 660
gagaacgaca aactgcgcgt cgagaacctg tccatccggg aggccataag ggacctggtg 720
tgcagctgct gtggcggtcc agcggtgctc ggggagctgt cgcccgaaga gcaccagctg 780
cgcctcgaga atgcgaggct cagggacgag ctcgctcgag tctgcaccgt cacttccaag 840
ttcattggca agcccatgtc tcacatggaa ctgctgctcg cgaaggagcc gcatcctatg 900
acaggctcgt cactggaact tgcagttgct gttggtgttg gttccagcgt gccatcgagc 960
aaaatgcctg tctcgacgat ctccgagttg gccggcagca catccagctc aacgggaaca 1020
gtgaccacgc ccatggtgac tgcatccttg ccgatggtta gcattgacaa gtccaagttc 1080
gcccagcttg cagtgagtgc gatgaatgag cttgtcaaga tggcgcggat gaatgaaccg 1140
ctgtggattc caaccattcc ctcacctggc tcaccaatca tggagactct aaactttaaa 1200
gagtacttga aggcattctc accatgtgtt ggagtgaagc ctactgggtt tgtgtctgag 1260
gcctctaggg aatccggcat tgtcaccatt gacagtagcg ctgctcttat ggaggtcttc 1320
atggatgagg ttcttcttgt gcctccttgc tcgttgtttt tgctattgcc tagacgatgg 1380
tcagacatat tctactgcat tgttgccaag gcatcaatcg ttgaggagat cttacctggt 1440
gttgcaggaa gcagaaatgg tgcattgctg cttatgcagg cagaactaca aatgctttca 1500
cctcttgtcc ctataaggga ggttacattt ctcaggttct gcaaacagct tgctgagggt 1560
gcatgggctg tagtggatgt ttccattgat ggactgcaga cggatcagtg cctagctaca 1620
aacacgaaat gccggaggct gccttcaggt tgcgtgttgc aagatacccc caatggctgc 1680
aaggtcacat gggttgagca tgcagaatat cctgaggcgt ccgtgcacca gctctaccag 1740
cctcttatgc gctctggcct cgcccttggc gcagggcggt ggcttgcaac actgcaacgc 1800
cagtgtgagt gcttggccat cctcatgtca tcgcttgcag cgccagagca tgactcagca 1860
gcggtttctc tggaaggaaa atggagcctg ttgaagttgg cacggaggat gatggagaac 1920
ttctgcgcag ggatgggcgc gtcatcttcc cgcgaatgga gtatgctgga tggctttaca 1980
ggtagcacgg ggaaagacgt gcgggtcatg gtgcagaaca gtgtggatga acctggggtg 2040
ccaccgggtg tggtgcttag cgtcgccaca gcagtatggc tacctgtgac ccctgagcgg 2100
ctcttcaact tccttcgcga cgaggagctc cgtgctgagt gggacatcct cagcaatggt 2160
ggccctatgc agcaggtgct acgcatttcc aagggccaac tggacggcaa ctctgtcgct 2220
ctgctgagag ctgatcatac agactcccac ctgaacagca tcttgattct acaagagacg 2280
tgcactgaca gatctggcgc aatggtcgtg tacaccccgg tggacttccc ggcaatgcag 2340
cttgtgcttg gtggagggga ctcgaagaac gtggcgctct taccatctgg tttcgtcatt 2400
ctgcctgctg ggtctaccgc cagtgggctc gggcacaagg cacgcggatc gctgctcaca 2460
gttgcattcc agatcctcgt gaacagccag cccacagcaa agctgacggt ggagtcagtg 2520
gacaccgtgt acagcctcat ctcctgtacc atcgagaaga tcaaggcggc acttcactgt 2580
gacgtctgtt aa 2592
<210> 537
<211> 863
<212> PRT
<213> Zea mays
<400> 537
Met Ala Asn Ala Ala Cys Val Gly Gly Ser Phe Leu Gly Val Glu Lys
1 5 10 15
Gly Lys Pro Ala Thr Val Ser Asn Leu Gly Ala Pro Ala Val Leu Leu
20 25 30
Leu Val Leu Ala Cys Leu Pro Leu Val Leu Pro Ser Ser Asp Pro Lys
35 40 45
Gln Gly Met Ser Phe Gly Asp Leu Asp Gly Gly Gly Ser Ala Ala Gly
50 55 60
Leu Gln Tyr Pro Tyr Gly Ala Phe Ala Ser Ser Pro Val Leu Ser Leu
65 70 75 80
Thr Val Val Asp Ala Arg Arg Arg Arg Gly Gly Gly Gly Asn Ala Lys
85 90 95
Asp Ala Ser Glu Ala Glu Asn Glu Gly Gln Ser Met Met Ser Gly His
100 105 110
Leu Asp Val Val Leu Ser Gly Gly Gly Asp Gly Glu Asp Gly Glu Ala
115 120 125
Ala Asn Gln Arg Lys Pro Lys Arg Lys Lys Pro Tyr Asn Arg His Thr
130 135 140
Pro Arg Gln Ile Glu Gln Leu Glu Ala Met Phe Lys Glu Phe His His
145 150 155 160
Pro Asp Glu Lys Gln Arg Ala Gln Leu Ser Arg Gln Leu Gly Leu Asp
165 170 175
Pro Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr His Leu Lys
180 185 190
Cys Leu Thr Trp Leu Ser Leu Leu His Gly Pro Glu Leu Gly Lys Asn
195 200 205
Gln Leu Glu Arg Gln Glu Asn Ala Arg Leu Lys His Glu Asn Asp Lys
210 215 220
Leu Arg Val Glu Asn Leu Ser Ile Arg Glu Ala Ile Arg Asp Leu Val
225 230 235 240
Cys Ser Cys Cys Gly Gly Pro Ala Val Leu Gly Glu Leu Ser Pro Glu
245 250 255
Glu His Gln Leu Arg Leu Glu Asn Ala Arg Leu Arg Asp Glu Leu Ala
260 265 270
Arg Val Cys Thr Val Thr Ser Lys Phe Ile Gly Lys Pro Met Ser His
275 280 285
Met Glu Leu Leu Leu Ala Lys Glu Pro His Pro Met Thr Gly Ser Ser
290 295 300
Leu Glu Leu Ala Val Ala Val Gly Val Gly Ser Ser Val Pro Ser Ser
305 310 315 320
Lys Met Pro Val Ser Thr Ile Ser Glu Leu Ala Gly Ser Thr Ser Ser
325 330 335
Ser Thr Gly Thr Val Thr Thr Pro Met Val Thr Ala Ser Leu Pro Met
340 345 350
Val Ser Ile Asp Lys Ser Lys Phe Ala Gln Leu Ala Val Ser Ala Met
355 360 365
Asn Glu Leu Val Lys Met Ala Arg Met Asn Glu Pro Leu Trp Ile Pro
370 375 380
Thr Ile Pro Ser Pro Gly Ser Pro Ile Met Glu Thr Leu Asn Phe Lys
385 390 395 400
Glu Tyr Leu Lys Ala Phe Ser Pro Cys Val Gly Val Lys Pro Thr Gly
405 410 415
Phe Val Ser Glu Ala Ser Arg Glu Ser Gly Ile Val Thr Ile Asp Ser
420 425 430
Ser Ala Ala Leu Met Glu Val Phe Met Asp Glu Val Leu Leu Val Pro
435 440 445
Pro Cys Ser Leu Phe Leu Leu Leu Pro Arg Arg Trp Ser Asp Ile Phe
450 455 460
Tyr Cys Ile Val Ala Lys Ala Ser Ile Val Glu Glu Ile Leu Pro Gly
465 470 475 480
Val Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Met Gln Ala Glu Leu
485 490 495
Gln Met Leu Ser Pro Leu Val Pro Ile Arg Glu Val Thr Phe Leu Arg
500 505 510
Phe Cys Lys Gln Leu Ala Glu Gly Ala Trp Ala Val Val Asp Val Ser
515 520 525
Ile Asp Gly Leu Gln Thr Asp Gln Cys Leu Ala Thr Asn Thr Lys Cys
530 535 540
Arg Arg Leu Pro Ser Gly Cys Val Leu Gln Asp Thr Pro Asn Gly Cys
545 550 555 560
Lys Val Thr Trp Val Glu His Ala Glu Tyr Pro Glu Ala Ser Val His
565 570 575
Gln Leu Tyr Gln Pro Leu Met Arg Ser Gly Leu Ala Leu Gly Ala Gly
580 585 590
Arg Trp Leu Ala Thr Leu Gln Arg Gln Cys Glu Cys Leu Ala Ile Leu
595 600 605
Met Ser Ser Leu Ala Ala Pro Glu His Asp Ser Ala Ala Val Ser Leu
610 615 620
Glu Gly Lys Trp Ser Leu Leu Lys Leu Ala Arg Arg Met Met Glu Asn
625 630 635 640
Phe Cys Ala Gly Met Gly Ala Ser Ser Ser Arg Glu Trp Ser Met Leu
645 650 655
Asp Gly Phe Thr Gly Ser Thr Gly Lys Asp Val Arg Val Met Val Gln
660 665 670
Asn Ser Val Asp Glu Pro Gly Val Pro Pro Gly Val Val Leu Ser Val
675 680 685
Ala Thr Ala Val Trp Leu Pro Val Thr Pro Glu Arg Leu Phe Asn Phe
690 695 700
Leu Arg Asp Glu Glu Leu Arg Ala Glu Trp Asp Ile Leu Ser Asn Gly
705 710 715 720
Gly Pro Met Gln Gln Val Leu Arg Ile Ser Lys Gly Gln Leu Asp Gly
725 730 735
Asn Ser Val Ala Leu Leu Arg Ala Asp His Thr Asp Ser His Leu Asn
740 745 750
Ser Ile Leu Ile Leu Gln Glu Thr Cys Thr Asp Arg Ser Gly Ala Met
755 760 765
Val Val Tyr Thr Pro Val Asp Phe Pro Ala Met Gln Leu Val Leu Gly
770 775 780
Gly Gly Asp Ser Lys Asn Val Ala Leu Leu Pro Ser Gly Phe Val Ile
785 790 795 800
Leu Pro Ala Gly Ser Thr Ala Ser Gly Leu Gly His Lys Ala Arg Gly
805 810 815
Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asn Ser Gln Pro Thr
820 825 830
Ala Lys Leu Thr Val Glu Ser Val Asp Thr Val Tyr Ser Leu Ile Ser
835 840 845
Cys Thr Ile Glu Lys Ile Lys Ala Ala Leu His Cys Asp Val Cys
850 855 860
<210> 538
<211> 2592
<212> DNA
<213> Zea mays
<400> 538
atgagcttcg gcggcatgtt cgacggcgcc ggctccggcg tcttctccta cgacgctacc 60
ggcggcggca cgggcatgca caaccccggc cgcctcgtcc cggccccgcc cctgccgaaa 120
cctggcggat tcggcgccac gggtctctcc ctcgggctgc aaacgaacat ggaaggggct 180
cagctgggcg acttgggtcg tatgggcctg attggcggcg gcgggagcgg gagcggaggc 240
gacggggact cgctgggccg cggccgtgag gacgagatcg acagccggtc aggcagcgac 300
aacgtcgacg gcgcctccgg tgacgagatc gacccggaca acagtaaccc tcgcaggaag 360
aagaagcgat accaccgcca cacaccgcag caaatccaag aactcgaagc tgtgttcaag 420
gagtgccccc accccgacga gaagcaaagg atggagctca gcaagcggct caacctagag 480
agccgccagg tcaagttctg gttccagaac cgccgcacgc agatgaagac gcagatcgag 540
cggcacgaga acgcgctgct gaggcaggag aacgacaagc tgagggcgga gaacatgacg 600
atccgggagg cgatgcgcaa ccccatctgc gccaactgtg gcggcgcggc cgtgctcggg 660
gaggtgtcgc tggaggagca gcacctccgc atagagaacg cgcggctcaa ggacgagctg 720
gaccgcgtct gcgccctcgc cggcaagttc ctcggccgcc caatctcctc tggcagctcc 780
atgtcgtcgt ccctgcaagg ctgctccggc ctcgagctcg ccgtcggctc caacaacggc 840
tacgggcccg gtcccctcgg cgcgtcagcg ctgcagcccc tccccgacct actcggcgcc 900
ggccttccgg gccccgtggg ctcggccgcc atgcgcttgc ccatgggcat tggcgccctc 960
gacgttgcgc tgcacggggc ggccgccgac ggcatcgacc gcaccgtcct cctcgagctg 1020
gcgctcgccg cgatggagga gctcatgaaa gtggcgcaga tggacgagcc gctctggctc 1080
cgcagtcccg acggcagcgg cttggaggcg ctcaacctcg acgagtacca ccgagcgttc 1140
gccagggtgt tcgggccgag ccccgcgggc tacgtcaccg aggctacccg cgaggccggc 1200
gtcgccataa ccagcagcgt agacctcgta gacagcctca tggacgcggc tcggtggtcg 1260
gagatgttcc cgtgcatcgt ggcgagggcg agcacgacgg acatcatctc gagcggcatg 1320
ggcggcacgc gcagcgggtc aatccagctg atgcacgcgg agctgcaggt gctgtcgccg 1380
ctggtgccga tccgtgaggt ggtgttcctt cggttctgca agcagcacgc cgaggggctg 1440
tgggccgtgg tcgacgtctc ggtggacgcc atcctccggc ccgacggcgg ccaccaccac 1500
gcgcagaacg gcggcggcgc cgggtacatg ggctgccgcc tgctccccac cggctgcatc 1560
gtgcaagaca tgaacaacgg ctactccaag gtcacgtggg ttgtccacgc ggagtacgac 1620
gaggcggtgg tgcaccaact ctaccgcccg ctgctccagt ccggccaggc ccttggcgcg 1680
cgccgctggc tcgcctcgct ccagcgccag tgccagtacc tcgccatcct ctgctccaac 1740
tctctccctg cccgcgacca cgccgcgatc acgccggtgg ggcggaggag catgctgaag 1800
ctggcgcagc ggatgacgga caacttctgc gccggtgtgt gtgcgtcggc ggcgcagaag 1860
tggcggcgcc tggacgagtg gcgcagcggc gagggaggag acgctgctgg gaacggcgga 1920
tcagcagccg cgggcgaggg cgaggagaag gtgcggatga tggcgcggca cagcgtgggg 1980
gcgcccgggg atccccccgg cgtggtgctc agcgccacca cgtcggtgcg gctgcccgcc 2040
acgtccccgc agcgcgtgtt cgactacctc cgcgacgagc agcgccgcgg cgagtgggac 2100
atcctggcca acggtgaggc aatgcaggag atggaccaca tcgccaaggg ccagcaccac 2160
ggcaacgccg tctccctcct ccgcccaaat gcaactagtg gcaaccaaaa caacatgctc 2220
atcctgcaag agacctgcac cgacccgtca ggctctctgg tggtgtacgc cccggtggac 2280
gtgcagtcca tgcacgtcgt catgaacggt ggcgactccg cctacgtctc tctcctcccc 2340
tctgggttcg ccatcctccc ggacggccac tgccagtcac caaacactgc acatcagggt 2400
tcaccaagct gcggcggtag cagcagcagc agcagcacgg ggtctctagt cacggtggca 2460
ttccagatcc tggtgaacaa cctgcccacc gcgaagctca ccgtggagtc ggtggagacc 2520
gtcagcaacc tgctctcctg caccatccag aagatcaagt ctgcgctcca ggccagcatc 2580
gtcacgccct ag 2592
<210> 539
<211> 863
<212> PRT
<213> Zea mays
<400> 539
Met Ser Phe Gly Gly Met Phe Asp Gly Ala Gly Ser Gly Val Phe Ser
1 5 10 15
Tyr Asp Ala Thr Gly Gly Gly Thr Gly Met His Asn Pro Gly Arg Leu
20 25 30
Val Pro Ala Pro Pro Leu Pro Lys Pro Gly Gly Phe Gly Ala Thr Gly
35 40 45
Leu Ser Leu Gly Leu Gln Thr Asn Met Glu Gly Ala Gln Leu Gly Asp
50 55 60
Leu Gly Arg Met Gly Leu Ile Gly Gly Gly Gly Ser Gly Ser Gly Gly
65 70 75 80
Asp Gly Asp Ser Leu Gly Arg Gly Arg Glu Asp Glu Ile Asp Ser Arg
85 90 95
Ser Gly Ser Asp Asn Val Asp Gly Ala Ser Gly Asp Glu Ile Asp Pro
100 105 110
Asp Asn Ser Asn Pro Arg Arg Lys Lys Lys Arg Tyr His Arg His Thr
115 120 125
Pro Gln Gln Ile Gln Glu Leu Glu Ala Val Phe Lys Glu Cys Pro His
130 135 140
Pro Asp Glu Lys Gln Arg Met Glu Leu Ser Lys Arg Leu Asn Leu Glu
145 150 155 160
Ser Arg Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys
165 170 175
Thr Gln Ile Glu Arg His Glu Asn Ala Leu Leu Arg Gln Glu Asn Asp
180 185 190
Lys Leu Arg Ala Glu Asn Met Thr Ile Arg Glu Ala Met Arg Asn Pro
195 200 205
Ile Cys Ala Asn Cys Gly Gly Ala Ala Val Leu Gly Glu Val Ser Leu
210 215 220
Glu Glu Gln His Leu Arg Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu
225 230 235 240
Asp Arg Val Cys Ala Leu Ala Gly Lys Phe Leu Gly Arg Pro Ile Ser
245 250 255
Ser Gly Ser Ser Met Ser Ser Ser Leu Gln Gly Cys Ser Gly Leu Glu
260 265 270
Leu Ala Val Gly Ser Asn Asn Gly Tyr Gly Pro Gly Pro Leu Gly Ala
275 280 285
Ser Ala Leu Gln Pro Leu Pro Asp Leu Leu Gly Ala Gly Leu Pro Gly
290 295 300
Pro Val Gly Ser Ala Ala Met Arg Leu Pro Met Gly Ile Gly Ala Leu
305 310 315 320
Asp Val Ala Leu His Gly Ala Ala Ala Asp Gly Ile Asp Arg Thr Val
325 330 335
Leu Leu Glu Leu Ala Leu Ala Ala Met Glu Glu Leu Met Lys Val Ala
340 345 350
Gln Met Asp Glu Pro Leu Trp Leu Arg Ser Pro Asp Gly Ser Gly Leu
355 360 365
Glu Ala Leu Asn Leu Asp Glu Tyr His Arg Ala Phe Ala Arg Val Phe
370 375 380
Gly Pro Ser Pro Ala Gly Tyr Val Thr Glu Ala Thr Arg Glu Ala Gly
385 390 395 400
Val Ala Ile Thr Ser Ser Val Asp Leu Val Asp Ser Leu Met Asp Ala
405 410 415
Ala Arg Trp Ser Glu Met Phe Pro Cys Ile Val Ala Arg Ala Ser Thr
420 425 430
Thr Asp Ile Ile Ser Ser Gly Met Gly Gly Thr Arg Ser Gly Ser Ile
435 440 445
Gln Leu Met His Ala Glu Leu Gln Val Leu Ser Pro Leu Val Pro Ile
450 455 460
Arg Glu Val Val Phe Leu Arg Phe Cys Lys Gln His Ala Glu Gly Leu
465 470 475 480
Trp Ala Val Val Asp Val Ser Val Asp Ala Ile Leu Arg Pro Asp Gly
485 490 495
Gly His His His Ala Gln Asn Gly Gly Gly Ala Gly Tyr Met Gly Cys
500 505 510
Arg Leu Leu Pro Thr Gly Cys Ile Val Gln Asp Met Asn Asn Gly Tyr
515 520 525
Ser Lys Val Thr Trp Val Val His Ala Glu Tyr Asp Glu Ala Val Val
530 535 540
His Gln Leu Tyr Arg Pro Leu Leu Gln Ser Gly Gln Ala Leu Gly Ala
545 550 555 560
Arg Arg Trp Leu Ala Ser Leu Gln Arg Gln Cys Gln Tyr Leu Ala Ile
565 570 575
Leu Cys Ser Asn Ser Leu Pro Ala Arg Asp His Ala Ala Ile Thr Pro
580 585 590
Val Gly Arg Arg Ser Met Leu Lys Leu Ala Gln Arg Met Thr Asp Asn
595 600 605
Phe Cys Ala Gly Val Cys Ala Ser Ala Ala Gln Lys Trp Arg Arg Leu
610 615 620
Asp Glu Trp Arg Ser Gly Glu Gly Gly Asp Ala Ala Gly Asn Gly Gly
625 630 635 640
Ser Ala Ala Ala Gly Glu Gly Glu Glu Lys Val Arg Met Met Ala Arg
645 650 655
His Ser Val Gly Ala Pro Gly Asp Pro Pro Gly Val Val Leu Ser Ala
660 665 670
Thr Thr Ser Val Arg Leu Pro Ala Thr Ser Pro Gln Arg Val Phe Asp
675 680 685
Tyr Leu Arg Asp Glu Gln Arg Arg Gly Glu Trp Asp Ile Leu Ala Asn
690 695 700
Gly Glu Ala Met Gln Glu Met Asp His Ile Ala Lys Gly Gln His His
705 710 715 720
Gly Asn Ala Val Ser Leu Leu Arg Pro Asn Ala Thr Ser Gly Asn Gln
725 730 735
Asn Asn Met Leu Ile Leu Gln Glu Thr Cys Thr Asp Pro Ser Gly Ser
740 745 750
Leu Val Val Tyr Ala Pro Val Asp Val Gln Ser Met His Val Val Met
755 760 765
Asn Gly Gly Asp Ser Ala Tyr Val Ser Leu Leu Pro Ser Gly Phe Ala
770 775 780
Ile Leu Pro Asp Gly His Cys Gln Ser Pro Asn Thr Ala His Gln Gly
785 790 795 800
Ser Pro Ser Cys Gly Gly Ser Ser Ser Ser Ser Ser Thr Gly Ser Leu
805 810 815
Val Thr Val Ala Phe Gln Ile Leu Val Asn Asn Leu Pro Thr Ala Lys
820 825 830
Leu Thr Val Glu Ser Val Glu Thr Val Ser Asn Leu Leu Ser Cys Thr
835 840 845
Ile Gln Lys Ile Lys Ser Ala Leu Gln Ala Ser Ile Val Thr Pro
850 855 860
<210> 540
<211> 2310
<212> DNA
<213> Zea mays
<400> 540
atgctgcaga acatgatgga tgggcaccat cagctcgcta tgatgcagca gcagcatcag 60
aaccacggcc agcagcaggc agccacgagc gagagcgacg cgcgaggccc gcgccacgac 120
gagctgctga tggagagcaa gtccggcagc gacaacatgg agggaggcgc ccggtcaggc 180
ggctccggcg gtgaggagct gcaggaggag gatctcggcc tgcggcagcc ggcccgcaag 240
aagcgctacc accgccacac ccagcaccag atccaggagc tcgaagcgtt cttcaaggag 300
tacccgcacc ctgacgacaa gcagaggaag gagctgagcc gggagctggg cctggagcct 360
ctccaggtca agttctggtt ccagaacaag cgtacccaga tgaagacgca gcaggaacgg 420
cacgagaaca tgcagctgcg ggcggagaac gagaagctgc gcgccgagaa cgcgcggtac 480
aaggacgcgc tcgccaacgc ctcgtgcccg agctgcggcg gcccggcggc cacggccgtc 540
atcggcgaga tgtccttcga cgagcaccac ctccgcgtcg agaacgcgcg cctccgcgac 600
gaggtcgacc gcatctccac catcgccgcc aagtacgtcg gcaagcccgc tggcagcctg 660
ctgctgctgc cccccaacaa cctgtcaaac aacgtctccg gcccggcgct ttcctcccac 720
caccacctcc tgcccggcgg aacagacgtg ttcggtggcc tccaccgtca tgctggcggt 780
gggtttgact ttgacaaggg gttggttgtc gagctcgccg tcgccgccat ggaggagctg 840
gtgcggatgg ctctgctcgg cgagccgctc tggatccctg cccttgccgt agacggggct 900
accaccgaga ctctcaacga ggaagagtac gcccgcgggt tcttccccag gggcgttggt 960
cccaagctgc cggagctccg gtcggaagcg tcgcgggagg ccgtcgtggt catcatgaac 1020
cacgtcagcc tcatcgagat gctcatggac gtgaaccagt ggtcgacgct gttctcaagc 1080
atcgtgtcac gggctgccac cctcgaggtg ctctccaccg gcgtcgccgg caactacaat 1140
ggcgcgctgc agctgatgac ggcggagttc cagatgccgt cgccgctggt gccgacacgt 1200
gagtgccagt tcctgcgcta ctgcaagcag cacacggacg gcagctgggc ggtggtggac 1260
gtgtccgtcg agggccagct gctacgtacc ggcagcagac aggggcgcgg gcgcggtcga 1320
cgccggccct caggctgcct gatccaggag atgccgaacg gctactcgag ggtgacgtgg 1380
gtggagcacg cggaggcgga cgacatgatg gtgcacgacc tgtaccgccc cctagtctgc 1440
tccggcctgg cgttcggcgc gcggcggtgg gcatcgacgc tggagcggca gtgcgagcgg 1500
ctcgccagcg ccatggccag cggcgtcgtc gtgccggcgg cagcagcagg gccagccgcg 1560
ggcgtggtga cgtcgccgga ggggcgccgc agcatgatgc ggctggcgga gcgcatggtg 1620
gcgagcttct gcggcggcgt gacggcgtcg acgacgcacc agtggaccac gctgtcgggc 1680
agcggcgcgg aggacgtgcg cgtgatgacg cgcaagagcg tggacgaccc gggccggccg 1740
ccgggcatca tcctcaacgc cgccacctcc ttctggctcc ccgtggcccc cgcgcgcgtc 1800
ttcggcttcc tccgggacga cgccacccgc agcgagtggg acatgctctc caacggcggc 1860
gacgtgcagg agatggccca cattgccaac ggccgcgacc acggcaacgc tgtctcgctg 1920
ctccgcgtcg ataacgccaa ctcgaaccag ggcaacatgc tgatcctgca ggagtgctgc 1980
acggacgcga cggggtcgta cgtgatctac gcgccggtgg acgtggtggc catgaacgtg 2040
gtgctcaacg gcggggaccc ggactacgtg gcgctgctgc cgtcagggtt cgccatcctc 2100
cccgacggcg gtggcggtgg cggtggcggg tcgctcctca ccgtggcgtt ccagatcctg 2160
gtcgactcgg tgcccaccgc caagctgtcc ctgggctccg tcgccaccgt caacagcctc 2220
atcgcctgca ccgtcgagcg catcaaggct gccgtcgccg ccgacaacgc cggtgtggcg 2280
gcggcggcgg cggcgacgtc ccaccattga 2310
<210> 541
<211> 769
<212> PRT
<213> Zea mays
<400> 541
Met Leu Gln Asn Met Met Asp Gly His His Gln Leu Ala Met Met Gln
1 5 10 15
Gln Gln His Gln Asn His Gly Gln Gln Gln Ala Ala Thr Ser Glu Ser
20 25 30
Asp Ala Arg Gly Pro Arg His Asp Glu Leu Leu Met Glu Ser Lys Ser
35 40 45
Gly Ser Asp Asn Met Glu Gly Gly Ala Arg Ser Gly Gly Ser Gly Gly
50 55 60
Glu Glu Leu Gln Glu Glu Asp Leu Gly Leu Arg Gln Pro Ala Arg Lys
65 70 75 80
Lys Arg Tyr His Arg His Thr Gln His Gln Ile Gln Glu Leu Glu Ala
85 90 95
Phe Phe Lys Glu Tyr Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu
100 105 110
Ser Arg Glu Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln
115 120 125
Asn Lys Arg Thr Gln Met Lys Thr Gln Gln Glu Arg His Glu Asn Met
130 135 140
Gln Leu Arg Ala Glu Asn Glu Lys Leu Arg Ala Glu Asn Ala Arg Tyr
145 150 155 160
Lys Asp Ala Leu Ala Asn Ala Ser Cys Pro Ser Cys Gly Gly Pro Ala
165 170 175
Ala Thr Ala Val Ile Gly Glu Met Ser Phe Asp Glu His His Leu Arg
180 185 190
Val Glu Asn Ala Arg Leu Arg Asp Glu Val Asp Arg Ile Ser Thr Ile
195 200 205
Ala Ala Lys Tyr Val Gly Lys Pro Ala Gly Ser Leu Leu Leu Leu Pro
210 215 220
Pro Asn Asn Leu Ser Asn Asn Val Ser Gly Pro Ala Leu Ser Ser His
225 230 235 240
His His Leu Leu Pro Gly Gly Thr Asp Val Phe Gly Gly Leu His Arg
245 250 255
His Ala Gly Gly Gly Phe Asp Phe Asp Lys Gly Leu Val Val Glu Leu
260 265 270
Ala Val Ala Ala Met Glu Glu Leu Val Arg Met Ala Leu Leu Gly Glu
275 280 285
Pro Leu Trp Ile Pro Ala Leu Ala Val Asp Gly Ala Thr Thr Glu Thr
290 295 300
Leu Asn Glu Glu Glu Tyr Ala Arg Gly Phe Phe Pro Arg Gly Val Gly
305 310 315 320
Pro Lys Leu Pro Glu Leu Arg Ser Glu Ala Ser Arg Glu Ala Val Val
325 330 335
Val Ile Met Asn His Val Ser Leu Ile Glu Met Leu Met Asp Val Asn
340 345 350
Gln Trp Ser Thr Leu Phe Ser Ser Ile Val Ser Arg Ala Ala Thr Leu
355 360 365
Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn Gly Ala Leu Gln
370 375 380
Leu Met Thr Ala Glu Phe Gln Met Pro Ser Pro Leu Val Pro Thr Arg
385 390 395 400
Glu Cys Gln Phe Leu Arg Tyr Cys Lys Gln His Thr Asp Gly Ser Trp
405 410 415
Ala Val Val Asp Val Ser Val Glu Gly Gln Leu Leu Arg Thr Gly Ser
420 425 430
Arg Gln Gly Arg Gly Arg Gly Arg Arg Arg Pro Ser Gly Cys Leu Ile
435 440 445
Gln Glu Met Pro Asn Gly Tyr Ser Arg Val Thr Trp Val Glu His Ala
450 455 460
Glu Ala Asp Asp Met Met Val His Asp Leu Tyr Arg Pro Leu Val Cys
465 470 475 480
Ser Gly Leu Ala Phe Gly Ala Arg Arg Trp Ala Ser Thr Leu Glu Arg
485 490 495
Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Ser Gly Val Val Val Pro
500 505 510
Ala Ala Ala Ala Gly Pro Ala Ala Gly Val Val Thr Ser Pro Glu Gly
515 520 525
Arg Arg Ser Met Met Arg Leu Ala Glu Arg Met Val Ala Ser Phe Cys
530 535 540
Gly Gly Val Thr Ala Ser Thr Thr His Gln Trp Thr Thr Leu Ser Gly
545 550 555 560
Ser Gly Ala Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp
565 570 575
Pro Gly Arg Pro Pro Gly Ile Ile Leu Asn Ala Ala Thr Ser Phe Trp
580 585 590
Leu Pro Val Ala Pro Ala Arg Val Phe Gly Phe Leu Arg Asp Asp Ala
595 600 605
Thr Arg Ser Glu Trp Asp Met Leu Ser Asn Gly Gly Asp Val Gln Glu
610 615 620
Met Ala His Ile Ala Asn Gly Arg Asp His Gly Asn Ala Val Ser Leu
625 630 635 640
Leu Arg Val Asp Asn Ala Asn Ser Asn Gln Gly Asn Met Leu Ile Leu
645 650 655
Gln Glu Cys Cys Thr Asp Ala Thr Gly Ser Tyr Val Ile Tyr Ala Pro
660 665 670
Val Asp Val Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp
675 680 685
Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Gly
690 695 700
Gly Gly Gly Gly Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu
705 710 715 720
Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser Val Ala Thr
725 730 735
Val Asn Ser Leu Ile Ala Cys Thr Val Glu Arg Ile Lys Ala Ala Val
740 745 750
Ala Ala Asp Asn Ala Gly Val Ala Ala Ala Ala Ala Ala Thr Ser His
755 760 765
His
<210> 542
<211> 2388
<212> DNA
<213> Zea mays
<400> 542
atgatgatcc cggcgaggca catgccgccg acgatgatcg tccggaacgg cggcgcggcg 60
tacgggtcct cgtcggcact gtcgctcggc cagccgaact tgatggacaa ccagcagctc 120
cagttccagc aagcgttgca gcagcagcac ctgctgctgg accagatccc ggcgacgacg 180
gcggagagct gcgacaacac ggggcgcggc ggtggtggcc gggggtccga cccactggcc 240
gacgagttcg agagcaagtc cggcagcgag aacgtggacg gcgtctccgt ggacgaccag 300
gacgacccca accagcggcc cagcaagaag aagcgctacc accgccacac cctgcatcag 360
atccaggaga tggaagcttt cttcaaggaa tgcccgcacc cggacgacaa gcagcgcaag 420
gagctgagtc gggagctggg tctggtaccc ctccaggtca agttctggtt ccagaacaag 480
cgcacgcaaa tgaagaacca gcacgagcgg caggagaact cgcagctgag ggcggagaac 540
gagaagctgc gcgcggagaa catgcggtac aaggaggccc tcagcagcgc gtcctgcccc 600
aactgcggcg ggccggccgc gctcggcgag atgtccttcg acgagcacca cctccgcgtc 660
gagaacgcgc ggctccggga ggagatcgac aggatctccg ccatcgccgc caagtacgtg 720
ggcaagccca tggtgtcctt ccccgtgctg tccagcccgc tcgctggggc gcgtccgtcg 780
ccgctggaca tcgacagcgg tggcgtactg gggggtgctg ccacttatgg cggcgccgct 840
gacatcttcg gcggcggcgg cggcgtcgct gcttgtggtg cggccaggga ttgtgacaag 900
cctatgattg tggagctggc tgtgacggcc atggaggagc tggttcggat ggcgcagctg 960
gacgagccgc tgtggaacgc gccggcaggc gggcacgacg ggtctgctga gacgctgaac 1020
gaggaggagt acgcgcgcat gttcgtccct gctggagggc tcgggctaaa aaagcagtac 1080
gggttcaagt cggaggcgtc gcgcgacagc tccgtcgtca tcatgaccca tgccagcctc 1140
gtcgagatcc tcatggacgt gaatcagtat gcgacggtgt tctcgagcat cgtgtcgaga 1200
gctgcgacgc tggaggtgct gtccaccggc gtggctggga actacaatgg cgcattgcaa 1260
gtgatgtcgg ttgagtttca ggtgccttcc ccactggtgc cgactaggga tagctatttc 1320
gtgaggtact gcaagcagaa cgcggatgga acatgggccg tcgtcgacgt ctcgctggac 1380
accagctcag tcctcaagtg ccggcgccgg ccgtcgggat gcctgatcca ggaaatgccc 1440
aatggctact caaaggtgac ctgggtggaa cacgtcgagg tggatgacag gtcggtaaac 1500
ggcatctaca aactgctggt ggactcaggg ctcgccttcg gtgcacgccg atgggtcgga 1560
acgctggacc gccagtgcga gcgccttgcc agtgtcatgg ccagcaacat tccgaccagt 1620
gacatcggcg tgatcactag cacggagggg aggaagagca tgctgaagct ggctgagagg 1680
atggtgacga gcttctgcgg tggcgtgacg gcctcagccg cgcaccagtg gacgacgctg 1740
tccggcagtg gtgctgacga cgtccgtgtc atgaccagga agagcgtcga cgaccctggc 1800
aggccgccgg gcatagtcct caatgctgcc acctctttct ggctccctat cacacccaag 1860
cgtgtcttcg acttcctccg tgacgaaagc tctcgcagcg agtgggacat cctctccaat 1920
ggcggcgtcg ttcaagaaat ggctcacatt gccaatggcc gcgaccatgg caactgcgtc 1980
tcgcttcttc gtgtcaatca gagcaccaac tcgacccaaa gcaacatgct gatcctgcaa 2040
gagagctgca cggacgcctc gggctcgtac gtcatctatg cgccggtgga cgtggtggcc 2100
atgaacgtgg tcctcaacgg cggcgacccc gactacgtgg cgctcctgcc ctctggcttc 2160
gccatcctgc ccgacggccc gtcaggcagc agcaacatgc aaggcggtgg cggtggcggc 2220
gtcggctcag gcgggtcgct cctgacggtg gcgttccaga tcttggtcga ctccgtcccc 2280
accgccaagc tctcgctggg gtcggtggcg accgtgaaca gcctcatcgc ccgcaccgtg 2340
gagcgcatca aggcggcggt ctccggcgag agtgttaccc agcagtag 2388
<210> 543
<211> 795
<212> PRT
<213> Zea mays
<400> 543
Met Met Ile Pro Ala Arg His Met Pro Pro Thr Met Ile Val Arg Asn
1 5 10 15
Gly Gly Ala Ala Tyr Gly Ser Ser Ser Ala Leu Ser Leu Gly Gln Pro
20 25 30
Asn Leu Met Asp Asn Gln Gln Leu Gln Phe Gln Gln Ala Leu Gln Gln
35 40 45
Gln His Leu Leu Leu Asp Gln Ile Pro Ala Thr Thr Ala Glu Ser Cys
50 55 60
Asp Asn Thr Gly Arg Gly Gly Gly Gly Arg Gly Ser Asp Pro Leu Ala
65 70 75 80
Asp Glu Phe Glu Ser Lys Ser Gly Ser Glu Asn Val Asp Gly Val Ser
85 90 95
Val Asp Asp Gln Asp Asp Pro Asn Gln Arg Pro Ser Lys Lys Lys Arg
100 105 110
Tyr His Arg His Thr Leu His Gln Ile Gln Glu Met Glu Ala Phe Phe
115 120 125
Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg
130 135 140
Glu Leu Gly Leu Val Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys
145 150 155 160
Arg Thr Gln Met Lys Asn Gln His Glu Arg Gln Glu Asn Ser Gln Leu
165 170 175
Arg Ala Glu Asn Glu Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu
180 185 190
Ala Leu Ser Ser Ala Ser Cys Pro Asn Cys Gly Gly Pro Ala Ala Leu
195 200 205
Gly Glu Met Ser Phe Asp Glu His His Leu Arg Val Glu Asn Ala Arg
210 215 220
Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val
225 230 235 240
Gly Lys Pro Met Val Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Gly
245 250 255
Ala Arg Pro Ser Pro Leu Asp Ile Asp Ser Gly Gly Val Leu Gly Gly
260 265 270
Ala Ala Thr Tyr Gly Gly Ala Ala Asp Ile Phe Gly Gly Gly Gly Gly
275 280 285
Val Ala Ala Cys Gly Ala Ala Arg Asp Cys Asp Lys Pro Met Ile Val
290 295 300
Glu Leu Ala Val Thr Ala Met Glu Glu Leu Val Arg Met Ala Gln Leu
305 310 315 320
Asp Glu Pro Leu Trp Asn Ala Pro Ala Gly Gly His Asp Gly Ser Ala
325 330 335
Glu Thr Leu Asn Glu Glu Glu Tyr Ala Arg Met Phe Val Pro Ala Gly
340 345 350
Gly Leu Gly Leu Lys Lys Gln Tyr Gly Phe Lys Ser Glu Ala Ser Arg
355 360 365
Asp Ser Ser Val Val Ile Met Thr His Ala Ser Leu Val Glu Ile Leu
370 375 380
Met Asp Val Asn Gln Tyr Ala Thr Val Phe Ser Ser Ile Val Ser Arg
385 390 395 400
Ala Ala Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn
405 410 415
Gly Ala Leu Gln Val Met Ser Val Glu Phe Gln Val Pro Ser Pro Leu
420 425 430
Val Pro Thr Arg Asp Ser Tyr Phe Val Arg Tyr Cys Lys Gln Asn Ala
435 440 445
Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Thr Ser Ser Val
450 455 460
Leu Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu Met Pro
465 470 475 480
Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp Asp
485 490 495
Arg Ser Val Asn Gly Ile Tyr Lys Leu Leu Val Asp Ser Gly Leu Ala
500 505 510
Phe Gly Ala Arg Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg
515 520 525
Leu Ala Ser Val Met Ala Ser Asn Ile Pro Thr Ser Asp Ile Gly Val
530 535 540
Ile Thr Ser Thr Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu Arg
545 550 555 560
Met Val Thr Ser Phe Cys Gly Gly Val Thr Ala Ser Ala Ala His Gln
565 570 575
Trp Thr Thr Leu Ser Gly Ser Gly Ala Asp Asp Val Arg Val Met Thr
580 585 590
Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Asn
595 600 605
Ala Ala Thr Ser Phe Trp Leu Pro Ile Thr Pro Lys Arg Val Phe Asp
610 615 620
Phe Leu Arg Asp Glu Ser Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn
625 630 635 640
Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp His
645 650 655
Gly Asn Cys Val Ser Leu Leu Arg Val Asn Gln Ser Thr Asn Ser Thr
660 665 670
Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ala Ser Gly
675 680 685
Ser Tyr Val Ile Tyr Ala Pro Val Asp Val Val Ala Met Asn Val Val
690 695 700
Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe
705 710 715 720
Ala Ile Leu Pro Asp Gly Pro Ser Gly Ser Ser Asn Met Gln Gly Gly
725 730 735
Gly Gly Gly Gly Val Gly Ser Gly Gly Ser Leu Leu Thr Val Ala Phe
740 745 750
Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly Ser
755 760 765
Val Ala Thr Val Asn Ser Leu Ile Ala Arg Thr Val Glu Arg Ile Lys
770 775 780
Ala Ala Val Ser Gly Glu Ser Val Thr Gln Gln
785 790 795
<210> 544
<211> 2409
<212> DNA
<213> Zea mays
<400> 544
atgactccgg caaggcgcat gccggcgatg atcggccgga ataatggcgt cgcgttcggg 60
tcctcgtcag cgctatcttt aagccaggtg attattccgg ctgacttcct agacagccat 120
catctgcagc aagcgttcga gcagcaactc tttgaacaga tcccagccgc cgcagtggat 180
agcagcgaca acatcatcca cggtcgctcc gacgcgctgg tggacgagtt tgagagcaag 240
tcgtgcagcg agaatcccga tggcaccgcc tccggcgatg atggccaggg ggacgaggac 300
cctaaccagc ggccaaacaa gaagaagcgg tatcaccgcc acacccagca ccagatcgaa 360
gagatggagg ccttcttcaa ggagtgtcca cacccggatg acaagcagcg aaaggagctg 420
agccgggagc tcggtctcga gccgctgcag gtcaagttct ggttccagaa caagcgcaca 480
cagatgaaga accagcacga gcggcaggag aacgcgcagc tgcgcgcaga gaacgacaag 540
ctgcgagctg agaacatgcg gtacaaggac gcgctaggca cagcgtcctg ccccagctgt 600
ggcggccctg ccgccctggg tgagatgtcc ttcgacgagc accacctccg gctcgagaac 660
gctcgccttc gcgacgagat cgaccggatc tcgggcatcg ccgccaagca cgtcggcaag 720
cccatggtct ccttcccggt gctctccagc ccgctcgccg cccgttcccc gttcgacctt 780
gctggtgcct acggtgtcca gccgcctggt ggtggtggtg gcctcggcgc cgctgaccac 840
ctattcggcg gtgccgccgg cgacctgctg cgaagcgtgt cggccgggca gctcagcgct 900
gacaagtcca tgatcgttga gctggccgtc gctgccatgg acgagctcct ccggatggcg 960
cgggtcgacg cgccgctgtg gaacgggggc gtggcagggg tgccgcagca gctggatgag 1020
gaggagtacg gccggacgtt cccgggcggg cttgggccca ggcagtacgg gcttcgtccg 1080
gaggcgtctc gagacgacgc cgtcgtgatc atgacacgcg acagccttgt ggagatactc 1140
atggacgcga accgatttgc tgcagtgttc tcaagcatcg tgtcgagggc ttctacgcac 1200
gaggtgttgt caaccggtgt ggcagggagc tacaatggtg cattgcaagt gatgtcaatg 1260
gagttccagg tgccgtcacc gctggtaccg acacgggaga gctactttgc gaggtactgc 1320
aagaacaacc ccgatgggac gtgggcggtc gtcgatgtat cactcgacag cctccgccct 1380
agccccgctc tcaagtgccg gcgcaggcca tcaggatgcc ttgtccaaga aatgcccaat 1440
ggctactcaa aggtgacctg ggttgagcat gttgaggtgg acgacagatc agtgcacaat 1500
ctctacaggc ctttggtgaa ttcaggcctg ggatttggtg cgacaaggtg ggttggcacg 1560
ctggaccgac agtgcgagcg tctcgccagt gccatggcca gcaacatccc caacggcgac 1620
ctcggtgtga tcacgagcat agaggggagg aagagcatgc tgaagctggc agagaggatg 1680
gtggcgagct tctgcggtgg cgtgaccgcg tctgcggcgc atcagtggac gacgctgtcg 1740
gggagcggag cggaggacgt ccgcgttatg accaggaaga gcgtggacga cccaggcagg 1800
ccgccgggca tcgtcctcaa cgctgccacc tccttctggc tgcctgtccc gcccaagagg 1860
gtcttcgact tcctccgcga cgagacctct cgcagcgagt gggacatcct ctccaacggt 1920
ggcgcagtcc aagaaatggc tcatattgca aacggccggg accatggcaa ctgcgtctcc 1980
cttcttcgtg tcaatagcgc aaactccaac cagagcaaca tgctgatcct ccaggagagc 2040
tgcacggacg catcgggctc atacgtggtg tacgcgccgg tggatgtggt ggccatgaac 2100
gtggtgctca acggcggcga cccggactac gtggccctgc tgccgtcagg cttcgccatc 2160
ctccccgacg gaccgccggc gccgggcatg gctccccatc acggaggaga gggtgctgcc 2220
ggcggcggct tggaggagtt ggaggccgcc ggcgggtccc tcttgacggt ggcgttccag 2280
atcctggtgg actccgtccc caccgccaag ctctcgctgg gctctgtagc cacggtgaac 2340
agcctcatcg cctgcaccgt ggagcgcatc aaagctgccg tctgcggcgc tgaaggcaac 2400
ccacagtag 2409
<210> 545
<211> 802
<212> PRT
<213> Zea mays
<400> 545
Met Thr Pro Ala Arg Arg Met Pro Ala Met Ile Gly Arg Asn Asn Gly
1 5 10 15
Val Ala Phe Gly Ser Ser Ser Ala Leu Ser Leu Ser Gln Val Ile Ile
20 25 30
Pro Ala Asp Phe Leu Asp Ser His His Leu Gln Gln Ala Phe Glu Gln
35 40 45
Gln Leu Phe Glu Gln Ile Pro Ala Ala Ala Val Asp Ser Ser Asp Asn
50 55 60
Ile Ile His Gly Arg Ser Asp Ala Leu Val Asp Glu Phe Glu Ser Lys
65 70 75 80
Ser Cys Ser Glu Asn Pro Asp Gly Thr Ala Ser Gly Asp Asp Gly Gln
85 90 95
Gly Asp Glu Asp Pro Asn Gln Arg Pro Asn Lys Lys Lys Arg Tyr His
100 105 110
Arg His Thr Gln His Gln Ile Glu Glu Met Glu Ala Phe Phe Lys Glu
115 120 125
Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu
130 135 140
Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr
145 150 155 160
Gln Met Lys Asn Gln His Glu Arg Gln Glu Asn Ala Gln Leu Arg Ala
165 170 175
Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Asp Ala Leu
180 185 190
Gly Thr Ala Ser Cys Pro Ser Cys Gly Gly Pro Ala Ala Leu Gly Glu
195 200 205
Met Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu Arg
210 215 220
Asp Glu Ile Asp Arg Ile Ser Gly Ile Ala Ala Lys His Val Gly Lys
225 230 235 240
Pro Met Val Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Ala Arg Ser
245 250 255
Pro Phe Asp Leu Ala Gly Ala Tyr Gly Val Gln Pro Pro Gly Gly Gly
260 265 270
Gly Gly Leu Gly Ala Ala Asp His Leu Phe Gly Gly Ala Ala Gly Asp
275 280 285
Leu Leu Arg Ser Val Ser Ala Gly Gln Leu Ser Ala Asp Lys Ser Met
290 295 300
Ile Val Glu Leu Ala Val Ala Ala Met Asp Glu Leu Leu Arg Met Ala
305 310 315 320
Arg Val Asp Ala Pro Leu Trp Asn Gly Gly Val Ala Gly Val Pro Gln
325 330 335
Gln Leu Asp Glu Glu Glu Tyr Gly Arg Thr Phe Pro Gly Gly Leu Gly
340 345 350
Pro Arg Gln Tyr Gly Leu Arg Pro Glu Ala Ser Arg Asp Asp Ala Val
355 360 365
Val Ile Met Thr Arg Asp Ser Leu Val Glu Ile Leu Met Asp Ala Asn
370 375 380
Arg Phe Ala Ala Val Phe Ser Ser Ile Val Ser Arg Ala Ser Thr His
385 390 395 400
Glu Val Leu Ser Thr Gly Val Ala Gly Ser Tyr Asn Gly Ala Leu Gln
405 410 415
Val Met Ser Met Glu Phe Gln Val Pro Ser Pro Leu Val Pro Thr Arg
420 425 430
Glu Ser Tyr Phe Ala Arg Tyr Cys Lys Asn Asn Pro Asp Gly Thr Trp
435 440 445
Ala Val Val Asp Val Ser Leu Asp Ser Leu Arg Pro Ser Pro Ala Leu
450 455 460
Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu Val Gln Glu Met Pro Asn
465 470 475 480
Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp Asp Arg
485 490 495
Ser Val His Asn Leu Tyr Arg Pro Leu Val Asn Ser Gly Leu Gly Phe
500 505 510
Gly Ala Thr Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg Leu
515 520 525
Ala Ser Ala Met Ala Ser Asn Ile Pro Asn Gly Asp Leu Gly Val Ile
530 535 540
Thr Ser Ile Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met
545 550 555 560
Val Ala Ser Phe Cys Gly Gly Val Thr Ala Ser Ala Ala His Gln Trp
565 570 575
Thr Thr Leu Ser Gly Ser Gly Ala Glu Asp Val Arg Val Met Thr Arg
580 585 590
Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Asn Ala
595 600 605
Ala Thr Ser Phe Trp Leu Pro Val Pro Pro Lys Arg Val Phe Asp Phe
610 615 620
Leu Arg Asp Glu Thr Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly
625 630 635 640
Gly Ala Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp His Gly
645 650 655
Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser Asn Gln Ser
660 665 670
Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ala Ser Gly Ser Tyr
675 680 685
Val Val Tyr Ala Pro Val Asp Val Val Ala Met Asn Val Val Leu Asn
690 695 700
Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile
705 710 715 720
Leu Pro Asp Gly Pro Pro Ala Pro Gly Met Ala Pro His His Gly Gly
725 730 735
Glu Gly Ala Ala Gly Gly Gly Leu Glu Glu Leu Glu Ala Ala Gly Gly
740 745 750
Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr
755 760 765
Ala Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala
770 775 780
Cys Thr Val Glu Arg Ile Lys Ala Ala Val Cys Gly Ala Glu Gly Asn
785 790 795 800
Pro Gln
<210> 546
<211> 2109
<212> DNA
<213> Zea mays
<400> 546
atgagcttcg ggagcctatt cgacggcggg tccggcggcg gcggaggagg aggagggatg 60
cagttcccgt tctcgaccgg gttctcgtcc tcgccggccc tctccctcgg tctggagaac 120
cccggcggcg gcatggtcgg ccggatgctc cccgtgggcg gcgcccccgc ggccggcggg 180
atggcgaggg acgccgccga cgccgagaac gacagccgct ccgggagcga ccacctggac 240
gccatgtccg ccggcgccgg cgccgaggac gaggacgacg ctgagccggg caacccgcgc 300
aagcgcaaga agcgctacca ccgccacacg ccgcagcaga tccaggagct cgaagcgctg 360
ttcaaggagt gccctcaccc ggacgagaag cagcgcggcg agctcagcaa gaggctcggc 420
ctcgacccgc gccaggtcaa gttctggttc cagaaccgcc gcacgcagat gaagacgcaa 480
ctggagcggc acgagaacgc gcttctcaag caagagaacg acaagctgcg ggccgagaac 540
atggcgatcc gggaggcgat gcgcagcccg atgtgcggca gctgcgggag ccccgccatg 600
ctcggggagg tgtccctgga ggagcagcac ctgtgcatcg agaatgcgcg gctcaaggac 660
gagctcaacc gcgtctacgc cctcgccacc aagttcctcg gcaagcccat gcccgtcctc 720
tcggggccca tgctgcagcc gaacctgtcg ctgcccatgc cgagctcgtc gctggagctg 780
gcagtaggcg gcctccgtgg cctagggtct atcccttcct tggacgagtt tgctggcggt 840
gtgtctagcc cgttgggcac ggtgatcacg cctgcacggg cgaccggatc tgctccgccg 900
cctatggtgg gcgtcgacag gtccatgctg ctggagcttg cgatcagcgc catggatgaa 960
ctagttaagc tggcacaggt tgacgagccc ttgtggcttc ccagcctcag tggctctccc 1020
gacaagaagc tgctcaactt tgaggagtat gcccactcgt tctctccgtc cgtcggcgcc 1080
gtgaagcctg tgggctatgt atccgaggcc tctagggagt ctggcctcgt catcattgac 1140
aacagccttg ctcttgtaga gacccttatg gacgtgagac ggtggtctga tatgttctcg 1200
tgcatgattg ctaaggccac agtcctagag gaggtgacat ctggcattgc aggaagtagg 1260
aatggtgcgc tgctgctgat gaaggctgag ctacaggtgc tctcacctct agtgcccatc 1320
agggaggtca catttctcag gttttgcaag cagctggctg agggtgcatg ggcagtagtg 1380
gatgtgtcca ttgacggatt ggtgagagat cacaactctg gaacagcatc caacgccgga 1440
aatatacggt gcaggaggtt gccttctggc tgtgtgatgc aggacactcc caatggctac 1500
tgcaaggtca catgggtaga gtatacggaa tacgacgagg cgtcagtaca ccagctctat 1560
agaccactca tccggtccgg gctggccttt ggggccaggc ggtggcttgc aatgctgcag 1620
cgccagtgcg aatgcctggc catactcatg tcccctgata cagtttcagc taatgactcg 1680
tcagtcataa cacaggaggg caagcgaagc atgctgaagc tggcacggcg gatgacggag 1740
aacttctgcg ccggggtcag cgcgtcatct gcacgtgaat ggagtaagct ggacggcgct 1800
gcaggcagca tcggggagga tgtgcgggtc atggcacgga aaagcgtgga cgagcctggg 1860
gagccgccgg gcgtggtcct aagcgcagcc acatcggtgt gggtgcccgt ggctccggag 1920
aagctcttca acttcctccg tgacgagcag ctgcgtgcgg agtgggacat cctcagcaac 1980
ggaggcccga tgcaggagat ggccaacatc gccaaggggc aggagcacgg gaactcggtg 2040
tccctcctca gagccagcca tgagtgccaa ccagagcagc atgctgatcc tccaggagac 2100
ttgcactga 2109
<210> 547
<211> 702
<212> PRT
<213> Zea mays
<400> 547
Met Ser Phe Gly Ser Leu Phe Asp Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Gly Gly Gly Met Gln Phe Pro Phe Ser Thr Gly Phe Ser Ser Ser Pro
20 25 30
Ala Leu Ser Leu Gly Leu Glu Asn Pro Gly Gly Gly Met Val Gly Arg
35 40 45
Met Leu Pro Val Gly Gly Ala Pro Ala Ala Gly Gly Met Ala Arg Asp
50 55 60
Ala Ala Asp Ala Glu Asn Asp Ser Arg Ser Gly Ser Asp His Leu Asp
65 70 75 80
Ala Met Ser Ala Gly Ala Gly Ala Glu Asp Glu Asp Asp Ala Glu Pro
85 90 95
Gly Asn Pro Arg Lys Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
100 105 110
Gln Ile Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp
115 120 125
Glu Lys Gln Arg Gly Glu Leu Ser Lys Arg Leu Gly Leu Asp Pro Arg
130 135 140
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
145 150 155 160
Leu Glu Arg His Glu Asn Ala Leu Leu Lys Gln Glu Asn Asp Lys Leu
165 170 175
Arg Ala Glu Asn Met Ala Ile Arg Glu Ala Met Arg Ser Pro Met Cys
180 185 190
Gly Ser Cys Gly Ser Pro Ala Met Leu Gly Glu Val Ser Leu Glu Glu
195 200 205
Gln His Leu Cys Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg
210 215 220
Val Tyr Ala Leu Ala Thr Lys Phe Leu Gly Lys Pro Met Pro Val Leu
225 230 235 240
Ser Gly Pro Met Leu Gln Pro Asn Leu Ser Leu Pro Met Pro Ser Ser
245 250 255
Ser Leu Glu Leu Ala Val Gly Gly Leu Arg Gly Leu Gly Ser Ile Pro
260 265 270
Ser Leu Asp Glu Phe Ala Gly Gly Val Ser Ser Pro Leu Gly Thr Val
275 280 285
Ile Thr Pro Ala Arg Ala Thr Gly Ser Ala Pro Pro Pro Met Val Gly
290 295 300
Val Asp Arg Ser Met Leu Leu Glu Leu Ala Ile Ser Ala Met Asp Glu
305 310 315 320
Leu Val Lys Leu Ala Gln Val Asp Glu Pro Leu Trp Leu Pro Ser Leu
325 330 335
Ser Gly Ser Pro Asp Lys Lys Leu Leu Asn Phe Glu Glu Tyr Ala His
340 345 350
Ser Phe Ser Pro Ser Val Gly Ala Val Lys Pro Val Gly Tyr Val Ser
355 360 365
Glu Ala Ser Arg Glu Ser Gly Leu Val Ile Ile Asp Asn Ser Leu Ala
370 375 380
Leu Val Glu Thr Leu Met Asp Val Arg Arg Trp Ser Asp Met Phe Ser
385 390 395 400
Cys Met Ile Ala Lys Ala Thr Val Leu Glu Glu Val Thr Ser Gly Ile
405 410 415
Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Met Lys Ala Glu Leu Gln
420 425 430
Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Thr Phe Leu Arg Phe
435 440 445
Cys Lys Gln Leu Ala Glu Gly Ala Trp Ala Val Val Asp Val Ser Ile
450 455 460
Asp Gly Leu Val Arg Asp His Asn Ser Gly Thr Ala Ser Asn Ala Gly
465 470 475 480
Asn Ile Arg Cys Arg Arg Leu Pro Ser Gly Cys Val Met Gln Asp Thr
485 490 495
Pro Asn Gly Tyr Cys Lys Val Thr Trp Val Glu Tyr Thr Glu Tyr Asp
500 505 510
Glu Ala Ser Val His Gln Leu Tyr Arg Pro Leu Ile Arg Ser Gly Leu
515 520 525
Ala Phe Gly Ala Arg Arg Trp Leu Ala Met Leu Gln Arg Gln Cys Glu
530 535 540
Cys Leu Ala Ile Leu Met Ser Pro Asp Thr Val Ser Ala Asn Asp Ser
545 550 555 560
Ser Val Ile Thr Gln Glu Gly Lys Arg Ser Met Leu Lys Leu Ala Arg
565 570 575
Arg Met Thr Glu Asn Phe Cys Ala Gly Val Ser Ala Ser Ser Ala Arg
580 585 590
Glu Trp Ser Lys Leu Asp Gly Ala Ala Gly Ser Ile Gly Glu Asp Val
595 600 605
Arg Val Met Ala Arg Lys Ser Val Asp Glu Pro Gly Glu Pro Pro Gly
610 615 620
Val Val Leu Ser Ala Ala Thr Ser Val Trp Val Pro Val Ala Pro Glu
625 630 635 640
Lys Leu Phe Asn Phe Leu Arg Asp Glu Gln Leu Arg Ala Glu Trp Asp
645 650 655
Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Ala Asn Ile Ala Lys
660 665 670
Gly Gln Glu His Gly Asn Ser Val Ser Leu Leu Arg Ala Ser His Glu
675 680 685
Cys Gln Pro Glu Gln His Ala Asp Pro Pro Gly Asp Leu His
690 695 700
<210> 548
<211> 2493
<212> DNA
<213> Zea mays
<400> 548
atgatgatcc cggcgaggca catgccgccg acgatgatcg tccggaacgg cggcgcggcg 60
tacgggtcct cgtcggcact gtcgctcggc cagccgaact tgatggacaa ccagcagctc 120
cagttccagc aagcgttgca gcagcagcac ctgctgctgg accagatccc ggcgacgacg 180
gcggagagct gcgacaacac ggggcgcggc ggtggtggcc gggggtccga cccactggcc 240
gacgagttcg agagcaagtc cggcagcgag aacgtggacg gcgtctccgt ggacgaccag 300
gacgacccca accagcggcc cagcaagaag aagcgctacc accgccacac cctgcatcag 360
atccaggaga tggaagcttt cttcaaggaa tgcccgcacc cggacgacaa gcagcgcaag 420
gagctgagtc gggagctggg tctggtaccc ctccaggtca agttctggtt ccagaacaag 480
cgcacgcaaa tgaagaacca gcacgagcgg caggagaact cgcagctgag ggcggagaac 540
gagaagctgc gcgcggagaa catgcggtac aaggaggccc tcagcagcgc gtcctgcccc 600
aactgcggcg ggccggccgc gctcggcgag atgtccttcg acgagcacca cctccgcgtc 660
gagaacgcgc ggctccggga ggagatcgac aggatctccg ccatcgccgc caagtacgtg 720
ggcaagccca tggtgtcctt ccccgtgctg tccagcccgc tcgctggggc gcgtccgtcg 780
ccgctggaca tcgacagcgg tggcgtactg gggggtgctg ccacttatgg cggcgccgct 840
gacatcttcg gcggcggcgg cggcgtcgct gcttgtggtg cggccaggga ttgtgacaag 900
cctatgattg tggagctggc tgtgacggcc atggaggagc tggttcggat ggcgcagctg 960
gacgagccgc tgtggaacgc gccggcaggc gggcacgacg ggtctgctga gacgctgaac 1020
gaggaggagt acgcgcgcat gttcgtccct gctggagggc tcgggctaaa aaagcagtac 1080
gggttcaagt cggaggcgtc gcgcgacagc tccgtcgtca tcatgaccca tgccagcctc 1140
gtcgagatcc tcatggacgt gaatcagtat gcgacggtgt tctcgagcat cgtgtcgaga 1200
gctgcgacgc tggaggtgct gtccaccggc gtggctggga actacaatgg cgcattgcaa 1260
gtgatgtcgg ttgagtttca ggtgccttcc ccactggtgc cgactaggga tagctatttc 1320
gtgaggtact gcaagcagaa cgcggatgga acatgggccg tcgtcgacgt ctcgctggac 1380
accagctcag tcctcaagtg ccggcgccgg ccgtcgggat gcctgatcca ggaaatgccc 1440
aatggctact caaaggtgac ctgggtggaa cacgtcgagg tggatgacag gtcggtaaac 1500
ggcatctaca aactgctggt ggactcaggg ctcgccttcg gtgcacgccg atgggtcgga 1560
acgctggacc gccagtgcga gcgccttgcc agtgtcatgg ccagcaacat tccgaccagt 1620
gacatcggcg tgatcactag cacggagggg aggaagagca tgctgaagct ggctgagagg 1680
atggtgacga gcttctgcgg tggcgtgacg gcctcagccg cgcaccagtg gacgacgctg 1740
tccggcagtg gtgctgacga cgtccgtgtc atgaccagga agagcgtcga cgaccctggc 1800
aggccgccgg gcatagtcct caatgctgcc acctctttct ggctccctat cacacccaag 1860
cgtgtcttcg acttcctccg tgacgaaagc tctcgcagcg aggcacgcac ccgcgcgccc 1920
acccataccc agtttttttt taatcgagaa cacgttctac ctagctatga accgcctttt 1980
ctttttttct tttttctttt tttgcagtgg gacatcctct ccaatggcgg cgtcgttcaa 2040
gaaatggctc acattgccaa tggccgcgac catggcaact gcgtctcgct tcttcgtgtc 2100
aatcagagca ccaactcgac ccaaagcaac atgctgatcc tgcaagagag ctgcacggac 2160
gcctcgggct cgtacgtcat ctatgcgccg gtggacgtgg tggccatgaa cgtggtcctc 2220
aacggcggcg accccgacta cgtggcgctc ctgccctctg gcttcgccat cctgcccgac 2280
ggcccgtcag gcagcagcaa catgcaaggc ggtggcggtg gcggcgtcgg ctcaggcggg 2340
tcgctcctga cggtggcgtt ccagatcttg gtcgactccg tccccaccgc caagctctcg 2400
ctggggtcgg tggcgaccgt gaacagcctc atcgcccgca ccgtggagcg catcaaggcg 2460
gcggtctccg gcgagagtgt tacccagcag tag 2493
<210> 549
<211> 830
<212> PRT
<213> Zea mays
<400> 549
Met Met Ile Pro Ala Arg His Met Pro Pro Thr Met Ile Val Arg Asn
1 5 10 15
Gly Gly Ala Ala Tyr Gly Ser Ser Ser Ala Leu Ser Leu Gly Gln Pro
20 25 30
Asn Leu Met Asp Asn Gln Gln Leu Gln Phe Gln Gln Ala Leu Gln Gln
35 40 45
Gln His Leu Leu Leu Asp Gln Ile Pro Ala Thr Thr Ala Glu Ser Cys
50 55 60
Asp Asn Thr Gly Arg Gly Gly Gly Gly Arg Gly Ser Asp Pro Leu Ala
65 70 75 80
Asp Glu Phe Glu Ser Lys Ser Gly Ser Glu Asn Val Asp Gly Val Ser
85 90 95
Val Asp Asp Gln Asp Asp Pro Asn Gln Arg Pro Ser Lys Lys Lys Arg
100 105 110
Tyr His Arg His Thr Leu His Gln Ile Gln Glu Met Glu Ala Phe Phe
115 120 125
Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg
130 135 140
Glu Leu Gly Leu Val Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys
145 150 155 160
Arg Thr Gln Met Lys Asn Gln His Glu Arg Gln Glu Asn Ser Gln Leu
165 170 175
Arg Ala Glu Asn Glu Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu
180 185 190
Ala Leu Ser Ser Ala Ser Cys Pro Asn Cys Gly Gly Pro Ala Ala Leu
195 200 205
Gly Glu Met Ser Phe Asp Glu His His Leu Arg Val Glu Asn Ala Arg
210 215 220
Leu Arg Glu Glu Ile Asp Arg Ile Ser Ala Ile Ala Ala Lys Tyr Val
225 230 235 240
Gly Lys Pro Met Val Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Gly
245 250 255
Ala Arg Pro Ser Pro Leu Asp Ile Asp Ser Gly Gly Val Leu Gly Gly
260 265 270
Ala Ala Thr Tyr Gly Gly Ala Ala Asp Ile Phe Gly Gly Gly Gly Gly
275 280 285
Val Ala Ala Cys Gly Ala Ala Arg Asp Cys Asp Lys Pro Met Ile Val
290 295 300
Glu Leu Ala Val Thr Ala Met Glu Glu Leu Val Arg Met Ala Gln Leu
305 310 315 320
Asp Glu Pro Leu Trp Asn Ala Pro Ala Gly Gly His Asp Gly Ser Ala
325 330 335
Glu Thr Leu Asn Glu Glu Glu Tyr Ala Arg Met Phe Val Pro Ala Gly
340 345 350
Gly Leu Gly Leu Lys Lys Gln Tyr Gly Phe Lys Ser Glu Ala Ser Arg
355 360 365
Asp Ser Ser Val Val Ile Met Thr His Ala Ser Leu Val Glu Ile Leu
370 375 380
Met Asp Val Asn Gln Tyr Ala Thr Val Phe Ser Ser Ile Val Ser Arg
385 390 395 400
Ala Ala Thr Leu Glu Val Leu Ser Thr Gly Val Ala Gly Asn Tyr Asn
405 410 415
Gly Ala Leu Gln Val Met Ser Val Glu Phe Gln Val Pro Ser Pro Leu
420 425 430
Val Pro Thr Arg Asp Ser Tyr Phe Val Arg Tyr Cys Lys Gln Asn Ala
435 440 445
Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Thr Ser Ser Val
450 455 460
Leu Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu Met Pro
465 470 475 480
Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp Asp
485 490 495
Arg Ser Val Asn Gly Ile Tyr Lys Leu Leu Val Asp Ser Gly Leu Ala
500 505 510
Phe Gly Ala Arg Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg
515 520 525
Leu Ala Ser Val Met Ala Ser Asn Ile Pro Thr Ser Asp Ile Gly Val
530 535 540
Ile Thr Ser Thr Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu Arg
545 550 555 560
Met Val Thr Ser Phe Cys Gly Gly Val Thr Ala Ser Ala Ala His Gln
565 570 575
Trp Thr Thr Leu Ser Gly Ser Gly Ala Asp Asp Val Arg Val Met Thr
580 585 590
Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Asn
595 600 605
Ala Ala Thr Ser Phe Trp Leu Pro Ile Thr Pro Lys Arg Val Phe Asp
610 615 620
Phe Leu Arg Asp Glu Ser Ser Arg Ser Glu Ala Arg Thr Arg Ala Pro
625 630 635 640
Thr His Thr Gln Phe Phe Phe Asn Arg Glu His Val Leu Pro Ser Tyr
645 650 655
Glu Pro Pro Phe Leu Phe Phe Phe Phe Leu Phe Leu Gln Trp Asp Ile
660 665 670
Leu Ser Asn Gly Gly Val Val Gln Glu Met Ala His Ile Ala Asn Gly
675 680 685
Arg Asp His Gly Asn Cys Val Ser Leu Leu Arg Val Asn Gln Ser Thr
690 695 700
Asn Ser Thr Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp
705 710 715 720
Ala Ser Gly Ser Tyr Val Ile Tyr Ala Pro Val Asp Val Val Ala Met
725 730 735
Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro
740 745 750
Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ser Gly Ser Ser Asn Met
755 760 765
Gln Gly Gly Gly Gly Gly Gly Val Gly Ser Gly Gly Ser Leu Leu Thr
770 775 780
Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser
785 790 795 800
Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Arg Thr Val Glu
805 810 815
Arg Ile Lys Ala Ala Val Ser Gly Glu Ser Val Thr Gln Gln
820 825 830
<210> 550
<211> 2358
<212> DNA
<213> Zea mays
<400> 550
atgcgatatc accaacgctt cgctggaaga aggcgtcgtc acagacaggg atcgaaggct 60
gacctcctag acagccatca gctgcagcaa gcgttccagc agcagctctt cgatcagatc 120
ccgaccacca ccacagtgga cgatagcagc gacaacctca tccatggccg ctctgacacg 180
ctggtagatg agttcgagag caagtcctgc agcgagaatc ccgacggaac ctctggtgac 240
gatggcctgg aggaagaccc caatcagcgg ccgaacaaga agaagcgata ccaccgccac 300
acccagcacc agatccaaga gatggaggcg ttcttcaagg agtgcccgca cccggacgac 360
aagcagcgga aggagctgag ccgggagctc ggcctcgagc cgctgcaggt caagttttgg 420
ttccagaaca agcgcacaca gatgaagaac cagcacgagc ggcacgagaa cgcgcagctg 480
cgcgcggaga acgacaagct gcgagccgag aacatgcggt acaaggaggc gctgggcacg 540
gcctcgtgcc ccagctgcgg cggcccggct gccctcggcg agatgtcctt cgacgagcac 600
cacctccgcc tcgagaacgc tcgcctccgt gacgagatcg accggatctc gggcatcgcc 660
gccaagcacg tgggaaagcc catggtgtcc ttccccgtgc tctccagccc gctcgccgcc 720
gccgccgccg ccgcccggtc cccactcgac ctcgccggcg cctacggcgt ccagtcagct 780
gctgcgggcc tcggcgccga ccacgtgctg ttcggcgccg gtgccggcga tctgctgagg 840
agcgtgtcgg ccgggcagct cgacgcggac aagcccatga tcgtggagct ggccgtcgcg 900
gccatggacg agctcctccg gatggcgcgg cctgacgcgc tgctgtgggg tggcggcgcg 960
tcggcagggg cgcagcagca gcagctggac gaggaggagt acgtccggac gttccccgct 1020
gggctcgggc cgaggcagta cgggctccgt ccggaggcgt ctcgggacag cgccgtcgtg 1080
atcatgacct gcgacagcct catcgagata ctcatggacg cgaaccgatt cgcggcagtg 1140
ttctcgagca tcgtgtcgag ggcttccacg cacgaggtgc tgtcaactgg tgtggcaggg 1200
agctacaatg gtgcattaca agtgatgtcg atggagtttc aggtgccgtc gccgctggtg 1260
ccgacgcgcg agagctactt cgtgaggtac tgcaagaaca acccggacgg gacatgggcc 1320
gtcgtcgacg tctcgctcga cagcctccgc cctagcccgg tcatcaaatg ccggcgcagg 1380
ccgtcaggtt gcctcatcca agagatgccc aatggctact caaaggtgac ctgggtggag 1440
catgttgagg tcgacgacag atcagtgcac aacctctaca ggcctttggt caattcaggc 1500
ctcgcgtttg gcgcgaagag gtgggttggc acactggacc ggcagtgcga gcggctcgcc 1560
agcgccatgg ccagcaacat ccccaacggc gacctcggtg tgatcacaag catagagggg 1620
aggaagagca tgctgaagct ggcggagagg atggtggcga gcttctgcgg cggcgtgacg 1680
gcgtctgcgg cgcaccagtg gacgacgctg tcgggaagcg gcgcggagga cgtccgtgtt 1740
atgaccagga agagcgtgga cgacccgggc aggccgccgg gcatcgtcct caatgctgcc 1800
acctccttct ggctgcccgt cccacccaag agggtcttcg atttcctccg cgatgagacc 1860
tctcgcagcg agtgggacat cctctcgaac ggtggtgctg tccaagaaat ggctcacatt 1920
gccaacggcc gggaccatgg caactgtgtc tccctccttc gtgtcaatag tgcaaactcg 1980
aaccagagca acatgctgat cctccaggag agctgcaccg acgcctcggg ctcgtacgtg 2040
gtgtacgcgc cggtggacgt ggtggcgatg aacgtggtgc tcaacggcgg cgacccggac 2100
tacgtggccc tgctgccgtc gggcttcgcc atcctccccg acggaccacc gccggccggt 2160
gcggctccgt cccacggaga gggcttggac actggcggcg gcgggtccct cctgacggtg 2220
gcgttccaga tcttggtgga ctccgtcccc accgccaagc tctccctcgg ctccgtagcc 2280
accgtgaaca gcctcatcgc ctgcaccgtc gagcgcatca aggccgccgt ctgtgcggaa 2340
gccggcaacc cgcagtag 2358
<210> 551
<211> 785
<212> PRT
<213> Zea mays
<400> 551
Met Arg Tyr His Gln Arg Phe Ala Gly Arg Arg Arg Arg His Arg Gln
1 5 10 15
Gly Ser Lys Ala Asp Leu Leu Asp Ser His Gln Leu Gln Gln Ala Phe
20 25 30
Gln Gln Gln Leu Phe Asp Gln Ile Pro Thr Thr Thr Thr Val Asp Asp
35 40 45
Ser Ser Asp Asn Leu Ile His Gly Arg Ser Asp Thr Leu Val Asp Glu
50 55 60
Phe Glu Ser Lys Ser Cys Ser Glu Asn Pro Asp Gly Thr Ser Gly Asp
65 70 75 80
Asp Gly Leu Glu Glu Asp Pro Asn Gln Arg Pro Asn Lys Lys Lys Arg
85 90 95
Tyr His Arg His Thr Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe
100 105 110
Lys Glu Cys Pro His Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg
115 120 125
Glu Leu Gly Leu Glu Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys
130 135 140
Arg Thr Gln Met Lys Asn Gln His Glu Arg His Glu Asn Ala Gln Leu
145 150 155 160
Arg Ala Glu Asn Asp Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu
165 170 175
Ala Leu Gly Thr Ala Ser Cys Pro Ser Cys Gly Gly Pro Ala Ala Leu
180 185 190
Gly Glu Met Ser Phe Asp Glu His His Leu Arg Leu Glu Asn Ala Arg
195 200 205
Leu Arg Asp Glu Ile Asp Arg Ile Ser Gly Ile Ala Ala Lys His Val
210 215 220
Gly Lys Pro Met Val Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Ala
225 230 235 240
Ala Ala Ala Ala Ala Arg Ser Pro Leu Asp Leu Ala Gly Ala Tyr Gly
245 250 255
Val Gln Ser Ala Ala Ala Gly Leu Gly Ala Asp His Val Leu Phe Gly
260 265 270
Ala Gly Ala Gly Asp Leu Leu Arg Ser Val Ser Ala Gly Gln Leu Asp
275 280 285
Ala Asp Lys Pro Met Ile Val Glu Leu Ala Val Ala Ala Met Asp Glu
290 295 300
Leu Leu Arg Met Ala Arg Pro Asp Ala Leu Leu Trp Gly Gly Gly Ala
305 310 315 320
Ser Ala Gly Ala Gln Gln Gln Gln Leu Asp Glu Glu Glu Tyr Val Arg
325 330 335
Thr Phe Pro Ala Gly Leu Gly Pro Arg Gln Tyr Gly Leu Arg Pro Glu
340 345 350
Ala Ser Arg Asp Ser Ala Val Val Ile Met Thr Cys Asp Ser Leu Ile
355 360 365
Glu Ile Leu Met Asp Ala Asn Arg Phe Ala Ala Val Phe Ser Ser Ile
370 375 380
Val Ser Arg Ala Ser Thr His Glu Val Leu Ser Thr Gly Val Ala Gly
385 390 395 400
Ser Tyr Asn Gly Ala Leu Gln Val Met Ser Met Glu Phe Gln Val Pro
405 410 415
Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys
420 425 430
Asn Asn Pro Asp Gly Thr Trp Ala Val Val Asp Val Ser Leu Asp Ser
435 440 445
Leu Arg Pro Ser Pro Val Ile Lys Cys Arg Arg Arg Pro Ser Gly Cys
450 455 460
Leu Ile Gln Glu Met Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu
465 470 475 480
His Val Glu Val Asp Asp Arg Ser Val His Asn Leu Tyr Arg Pro Leu
485 490 495
Val Asn Ser Gly Leu Ala Phe Gly Ala Lys Arg Trp Val Gly Thr Leu
500 505 510
Asp Arg Gln Cys Glu Arg Leu Ala Ser Ala Met Ala Ser Asn Ile Pro
515 520 525
Asn Gly Asp Leu Gly Val Ile Thr Ser Ile Glu Gly Arg Lys Ser Met
530 535 540
Leu Lys Leu Ala Glu Arg Met Val Ala Ser Phe Cys Gly Gly Val Thr
545 550 555 560
Ala Ser Ala Ala His Gln Trp Thr Thr Leu Ser Gly Ser Gly Ala Glu
565 570 575
Asp Val Arg Val Met Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro
580 585 590
Pro Gly Ile Val Leu Asn Ala Ala Thr Ser Phe Trp Leu Pro Val Pro
595 600 605
Pro Lys Arg Val Phe Asp Phe Leu Arg Asp Glu Thr Ser Arg Ser Glu
610 615 620
Trp Asp Ile Leu Ser Asn Gly Gly Ala Val Gln Glu Met Ala His Ile
625 630 635 640
Ala Asn Gly Arg Asp His Gly Asn Cys Val Ser Leu Leu Arg Val Asn
645 650 655
Ser Ala Asn Ser Asn Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys
660 665 670
Thr Asp Ala Ser Gly Ser Tyr Val Val Tyr Ala Pro Val Asp Val Val
675 680 685
Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu
690 695 700
Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Pro Pro Ala Gly
705 710 715 720
Ala Ala Pro Ser His Gly Glu Gly Leu Asp Thr Gly Gly Gly Gly Ser
725 730 735
Leu Leu Thr Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala
740 745 750
Lys Leu Ser Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys
755 760 765
Thr Val Glu Arg Ile Lys Ala Ala Val Cys Ala Glu Ala Gly Asn Pro
770 775 780
Gln
785
<210> 552
<211> 2397
<212> DNA
<213> Zea mays
<400> 552
atgactccgg caaggcgcat gccggcgatg atcggccgga ataatggcgt cgcgttcggg 60
tcctcgtcag cgctatcttt aagccaggct gacttcctag acagccatca tctgcagcaa 120
gcgttcgagc agcaactctt tgaacagatc ccagccgccg cagtggatag cagcgacaac 180
atcatccacg gtcgctccga cgcgctggtg gacgagtttg agagcaagtc gtgcagcgag 240
aatcccgatg gcaccgcctc cggcgatgat ggccaggggg acgaggaccc taaccagcgg 300
ccaaacaaga agaagcggta tcaccgccac acccagcacc agatcgaaga gatggaggcc 360
ttcttcaagg agtgtccaca cccggatgac aagcagcgaa aggagctgag ccgggagctc 420
ggtctcgagc cgctgcaggt caagttctgg ttccagaaca agcgcacaca gatgaagaac 480
cagcacgagc ggcaggagaa cgcgcagctg cgcgcagaga acgacaagct gcgagctgag 540
aacatgcggt acaaggacgc gctaggcaca gcgtcctgcc ccagctgtgg cggccctgcc 600
gccctgggtg agatgtcctt cgacgagcac cacctccggc tcgagaacgc tcgccttcgc 660
gacgagatcg accggatctc gggcatcgcc gccaagcacg tcggcaagcc catggtctcc 720
ttcccggtgc tctccagccc gctcgccgcc cgttccccgt tcgaccttgc tggtgcctac 780
ggtgtccagc cgcctggtgg tggtggtggc ctcggcgccg ctgaccacct attcggcggt 840
gccgccggcg acctgctgcg aagcgtgtcg gccgggcagc tcagcgctga caagtccatg 900
atcgttgagc tggccgtcgc tgccatggac gagctcctcc ggatggcgcg ggtcgacgcg 960
ccgctgtgga acgggggcgt ggcaggggtg ccgcagcagc tggatgagga ggagtacggc 1020
cggacgttcc cgggcgggct tgggcccagg cagtacgggc ttcgtccgga ggcgtctcga 1080
gacgacgccg tcgtgatcat gacacgcgac agccttgtgg agatactcat ggacgcgaac 1140
cgatttgctg cagtgttctc aagcatcgtg tcgagggctt ctacgcacga ggtgttgtca 1200
accggtgtgg cagggagcta caatggtgca ttgcaagtga tgtcaatgga gttccaggtg 1260
ccgtcaccgc tggtaccgac acgggagagc tactttgcga ggtactgcaa gaacaacccc 1320
gatgggacgt gggcggtcgt cgatgtatca ctcgacagcc tccgccctag ccccgctctc 1380
aagtgccggc gcaggccatc aggatgcctt gtccaagaaa tgcccaatgg ctactcaaag 1440
gtgacctggg ttgagcatgt tgaggtggac gacagatcag tgcacaatct ctacaggcct 1500
ttggtgaatt caggcctggg atttggtgcg acaaggtggg ttggcacgct ggaccgacag 1560
tgcgagcgtc tcgccagtgc catggccagc aacatcccca acggcgacct cggtgtgatc 1620
acgagcatag aggggaggaa gagcatgctg aagctggcag agaggatggt ggcgagcttc 1680
tgcggtggcg tgaccgcgtc tgcggcgcat cagtggacga cgctgtcggg gagcggagcg 1740
gaggacgtcc gcgttatgac caggaagagc gtggacgacc caggcaggcc gccgggcatc 1800
gtcctcaacg ctgccacctc cttctggctg cctgtcccgc ccaagagggt cttcgacttc 1860
ctccgcgacg agacctctcg cagcgagtgg gacatcctct ccaacggtgg cgcagtccaa 1920
gaaatggctc atattgcaaa cggccgggac catggcaact gcgtctccct tcttcgtgtc 1980
aatagcgcaa actccaacca gagcaacatg ctgatcctcc aggagagctg cacggacgca 2040
tcgggctcat acgtggtgta cgcgccggtg gatgtggtgg ccatgaacgt ggtgctcaac 2100
ggcggcgacc cggactacgt ggccctgctg ccgtcaggct tcgccatcct ccccgacgga 2160
ccgccggcgc cgggcatggc tccccatcac ggaggagagg gtgctgccgg cggcggcttg 2220
gaggagttgg aggccgccgg cgggtccctc ttgacggtgg cgttccagat cctggtggac 2280
tccgtcccca ccgccaagct ctcgctgggc tctgtagcca cggtgaacag cctcatcgcc 2340
tgcaccgtgg agcgcatcaa agctgccgtc tgcggcgctg aaggcaaccc acagtag 2397
<210> 553
<211> 798
<212> PRT
<213> Zea mays
<400> 553
Met Thr Pro Ala Arg Arg Met Pro Ala Met Ile Gly Arg Asn Asn Gly
1 5 10 15
Val Ala Phe Gly Ser Ser Ser Ala Leu Ser Leu Ser Gln Ala Asp Phe
20 25 30
Leu Asp Ser His His Leu Gln Gln Ala Phe Glu Gln Gln Leu Phe Glu
35 40 45
Gln Ile Pro Ala Ala Ala Val Asp Ser Ser Asp Asn Ile Ile His Gly
50 55 60
Arg Ser Asp Ala Leu Val Asp Glu Phe Glu Ser Lys Ser Cys Ser Glu
65 70 75 80
Asn Pro Asp Gly Thr Ala Ser Gly Asp Asp Gly Gln Gly Asp Glu Asp
85 90 95
Pro Asn Gln Arg Pro Asn Lys Lys Lys Arg Tyr His Arg His Thr Gln
100 105 110
His Gln Ile Glu Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His Pro
115 120 125
Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu Pro
130 135 140
Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys Asn
145 150 155 160
Gln His Glu Arg Gln Glu Asn Ala Gln Leu Arg Ala Glu Asn Asp Lys
165 170 175
Leu Arg Ala Glu Asn Met Arg Tyr Lys Asp Ala Leu Gly Thr Ala Ser
180 185 190
Cys Pro Ser Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe Asp
195 200 205
Glu His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Asp Glu Ile Asp
210 215 220
Arg Ile Ser Gly Ile Ala Ala Lys His Val Gly Lys Pro Met Val Ser
225 230 235 240
Phe Pro Val Leu Ser Ser Pro Leu Ala Ala Arg Ser Pro Phe Asp Leu
245 250 255
Ala Gly Ala Tyr Gly Val Gln Pro Pro Gly Gly Gly Gly Gly Leu Gly
260 265 270
Ala Ala Asp His Leu Phe Gly Gly Ala Ala Gly Asp Leu Leu Arg Ser
275 280 285
Val Ser Ala Gly Gln Leu Ser Ala Asp Lys Ser Met Ile Val Glu Leu
290 295 300
Ala Val Ala Ala Met Asp Glu Leu Leu Arg Met Ala Arg Val Asp Ala
305 310 315 320
Pro Leu Trp Asn Gly Gly Val Ala Gly Val Pro Gln Gln Leu Asp Glu
325 330 335
Glu Glu Tyr Gly Arg Thr Phe Pro Gly Gly Leu Gly Pro Arg Gln Tyr
340 345 350
Gly Leu Arg Pro Glu Ala Ser Arg Asp Asp Ala Val Val Ile Met Thr
355 360 365
Arg Asp Ser Leu Val Glu Ile Leu Met Asp Ala Asn Arg Phe Ala Ala
370 375 380
Val Phe Ser Ser Ile Val Ser Arg Ala Ser Thr His Glu Val Leu Ser
385 390 395 400
Thr Gly Val Ala Gly Ser Tyr Asn Gly Ala Leu Gln Val Met Ser Met
405 410 415
Glu Phe Gln Val Pro Ser Pro Leu Val Pro Thr Arg Glu Ser Tyr Phe
420 425 430
Ala Arg Tyr Cys Lys Asn Asn Pro Asp Gly Thr Trp Ala Val Val Asp
435 440 445
Val Ser Leu Asp Ser Leu Arg Pro Ser Pro Ala Leu Lys Cys Arg Arg
450 455 460
Arg Pro Ser Gly Cys Leu Val Gln Glu Met Pro Asn Gly Tyr Ser Lys
465 470 475 480
Val Thr Trp Val Glu His Val Glu Val Asp Asp Arg Ser Val His Asn
485 490 495
Leu Tyr Arg Pro Leu Val Asn Ser Gly Leu Gly Phe Gly Ala Thr Arg
500 505 510
Trp Val Gly Thr Leu Asp Arg Gln Cys Glu Arg Leu Ala Ser Ala Met
515 520 525
Ala Ser Asn Ile Pro Asn Gly Asp Leu Gly Val Ile Thr Ser Ile Glu
530 535 540
Gly Arg Lys Ser Met Leu Lys Leu Ala Glu Arg Met Val Ala Ser Phe
545 550 555 560
Cys Gly Gly Val Thr Ala Ser Ala Ala His Gln Trp Thr Thr Leu Ser
565 570 575
Gly Ser Gly Ala Glu Asp Val Arg Val Met Thr Arg Lys Ser Val Asp
580 585 590
Asp Pro Gly Arg Pro Pro Gly Ile Val Leu Asn Ala Ala Thr Ser Phe
595 600 605
Trp Leu Pro Val Pro Pro Lys Arg Val Phe Asp Phe Leu Arg Asp Glu
610 615 620
Thr Ser Arg Ser Glu Trp Asp Ile Leu Ser Asn Gly Gly Ala Val Gln
625 630 635 640
Glu Met Ala His Ile Ala Asn Gly Arg Asp His Gly Asn Cys Val Ser
645 650 655
Leu Leu Arg Val Asn Ser Ala Asn Ser Asn Gln Ser Asn Met Leu Ile
660 665 670
Leu Gln Glu Ser Cys Thr Asp Ala Ser Gly Ser Tyr Val Val Tyr Ala
675 680 685
Pro Val Asp Val Val Ala Met Asn Val Val Leu Asn Gly Gly Asp Pro
690 695 700
Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Asp Gly
705 710 715 720
Pro Pro Ala Pro Gly Met Ala Pro His His Gly Gly Glu Gly Ala Ala
725 730 735
Gly Gly Gly Leu Glu Glu Leu Glu Ala Ala Gly Gly Ser Leu Leu Thr
740 745 750
Val Ala Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser
755 760 765
Leu Gly Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys Thr Val Glu
770 775 780
Arg Ile Lys Ala Ala Val Cys Gly Ala Glu Gly Asn Pro Gln
785 790 795
<210> 554
<211> 2253
<212> DNA
<213> Zea mays
<400> 554
atggtgcacg aggggcagct gaagaacact gaaccggata tcggcgtcaa catgggagat 60
gatgagttaa tctatctgcc agacatagaa gaatatgata tggatgctct catgggagac 120
gaggaccagt tgaacactga tcaggctatt ttttgtgagg aacacaacct cgacaaggtg 180
tcatcgtcca agcgtcccaa acgcttcacc gtgcagcagc ttcagcaact tgaatcttcg 240
ttccaaaagt gtagccatcc agatgatgaa atgcgccagg aactggctgc caaggttggt 300
ataagtgcaa ggcaggttaa gttttggttt caaaaccgac gctctcagat taaggtgagg 360
tcctgtggaa ctgagaacaa caaatatcgg cgacaaaacg ctgagctgct cgcaacgaac 420
atggaactca aggagcaact gaaaggaatg acatgcagta gatgcgatgc cccaacaata 480
atgcagaaat ggcagttgat ggatgaaaat gctaagctta gggaaatgta ctcgctcgcc 540
agtgcagaac tgaccaagct catgcaggaa gcaaatctcc ctccctctgt gatactagag 600
gatatggcat tagttacttc catgaaccca ttgtccagca atgctagcag cagtcgtagc 660
accatcaacc aggatgagct tctctcatat gttgagtgtg ctatcaaaga gtttgagatg 720
ctagtaaggg atggtacgcc gttgtggctg ccgaccatcg gtggcgacgt gctcaacagt 780
aaggagtatg cctgccagag attcccaaga ttacatggga cgatccgccc agaagggttt 840
gttgtggagg ccacaaggga cactgccata gtcaagggat cagccccaga cattgttgac 900
atcctcactg atgtgccacg atggtacaag gcgttccctt gcattgtagc agcactaagg 960
gcctaccacg tcatctttag tggacctttt gcatctggca acgtgctaat tcaggagctc 1020
ctgcagataa atgtagatct atctgtggaa tcacctcgcc cgcctcttcg caacatgaaa 1080
tttctaagga ttaccaagca gaatgcaaat ggggactttg ttgtagtgga tgtgtcaatc 1140
aatgatgtcc aaggaattca tgaacaacaa ggcagccaac ataagcatac catgctaccc 1200
tctggttgcc tcattaaaga caagggcgat ggctattgtc aggtcacatg gattgtccat 1260
gcagagtacg aggaggcctc cgtgccaccc ctcttccgac agttctacca gtctgggctg 1320
gcattcggtg caagccgttg gcttgcatca ctccaaaggc actgtgaata catggttgtt 1380
aagcattcca tccaagttcc aactggttgt gtctctggct caggggtgct caccttgtct 1440
gctctgggta gatggaacct cctagagctg gcacagcgga tgatggcgat cttctacaag 1500
actacatctg ggctgcccac cgtggaacca ggcaacattg tcaccaggtg gggtcgtggc 1560
tgcatgggca ctacaggcga gatgcttgag ccagctgtgc gcatggtact agggaattac 1620
tttggcgcca tggatgggca gccatcgccc ctccaagtgc taagcgccac cacaactgtg 1680
tggctgccag gaacgcctcc ggagagtgtt tttaactacc tgtgcaatgg gcaacgccgt 1740
ggcgagtggg atgccttcgt ctgtgccggc gcagtgcagg agttgagctc agttgccacg 1800
tgcccccacc ttcatggcaa tgctgtttct gttctctgcc ctaatgtgac caatgcagct 1860
aacaacgcca tgctgttcct gcaacagaca agcatcgatg tctcgcgcgc gctagttgtg 1920
tacagcgttg ttgaagagac catgcttcgt tccgtcctgg atgttagcga cgacacttca 1980
aacttagtcc tcctgccatc tggattcgcc atcctcccag atggccatgg cagggctcac 2040
catgccgctg cttccaactc ctccagcgct cttgccggac tcaacggaac tgcaggatgt 2100
cttctcaccg cagcctacca ggtaccggtg ccattcaaca atctccgtca tccagatgtg 2160
caagagacct acgagaatgc tggaaagcgg atctgccatg cgataaagaa gatcatggat 2220
gctgttgggg cacctattgt tgtcccaatc taa 2253
<210> 555
<211> 750
<212> PRT
<213> Zea mays
<400> 555
Met Val His Glu Gly Gln Leu Lys Asn Thr Glu Pro Asp Ile Gly Val
1 5 10 15
Asn Met Gly Asp Asp Glu Leu Ile Tyr Leu Pro Asp Ile Glu Glu Tyr
20 25 30
Asp Met Asp Ala Leu Met Gly Asp Glu Asp Gln Leu Asn Thr Asp Gln
35 40 45
Ala Ile Phe Cys Glu Glu His Asn Leu Asp Lys Val Ser Ser Ser Lys
50 55 60
Arg Pro Lys Arg Phe Thr Val Gln Gln Leu Gln Gln Leu Glu Ser Ser
65 70 75 80
Phe Gln Lys Cys Ser His Pro Asp Asp Glu Met Arg Gln Glu Leu Ala
85 90 95
Ala Lys Val Gly Ile Ser Ala Arg Gln Val Lys Phe Trp Phe Gln Asn
100 105 110
Arg Arg Ser Gln Ile Lys Val Arg Ser Cys Gly Thr Glu Asn Asn Lys
115 120 125
Tyr Arg Arg Gln Asn Ala Glu Leu Leu Ala Thr Asn Met Glu Leu Lys
130 135 140
Glu Gln Leu Lys Gly Met Thr Cys Ser Arg Cys Asp Ala Pro Thr Ile
145 150 155 160
Met Gln Lys Trp Gln Leu Met Asp Glu Asn Ala Lys Leu Arg Glu Met
165 170 175
Tyr Ser Leu Ala Ser Ala Glu Leu Thr Lys Leu Met Gln Glu Ala Asn
180 185 190
Leu Pro Pro Ser Val Ile Leu Glu Asp Met Ala Leu Val Thr Ser Met
195 200 205
Asn Pro Leu Ser Ser Asn Ala Ser Ser Ser Arg Ser Thr Ile Asn Gln
210 215 220
Asp Glu Leu Leu Ser Tyr Val Glu Cys Ala Ile Lys Glu Phe Glu Met
225 230 235 240
Leu Val Arg Asp Gly Thr Pro Leu Trp Leu Pro Thr Ile Gly Gly Asp
245 250 255
Val Leu Asn Ser Lys Glu Tyr Ala Cys Gln Arg Phe Pro Arg Leu His
260 265 270
Gly Thr Ile Arg Pro Glu Gly Phe Val Val Glu Ala Thr Arg Asp Thr
275 280 285
Ala Ile Val Lys Gly Ser Ala Pro Asp Ile Val Asp Ile Leu Thr Asp
290 295 300
Val Pro Arg Trp Tyr Lys Ala Phe Pro Cys Ile Val Ala Ala Leu Arg
305 310 315 320
Ala Tyr His Val Ile Phe Ser Gly Pro Phe Ala Ser Gly Asn Val Leu
325 330 335
Ile Gln Glu Leu Leu Gln Ile Asn Val Asp Leu Ser Val Glu Ser Pro
340 345 350
Arg Pro Pro Leu Arg Asn Met Lys Phe Leu Arg Ile Thr Lys Gln Asn
355 360 365
Ala Asn Gly Asp Phe Val Val Val Asp Val Ser Ile Asn Asp Val Gln
370 375 380
Gly Ile His Glu Gln Gln Gly Ser Gln His Lys His Thr Met Leu Pro
385 390 395 400
Ser Gly Cys Leu Ile Lys Asp Lys Gly Asp Gly Tyr Cys Gln Val Thr
405 410 415
Trp Ile Val His Ala Glu Tyr Glu Glu Ala Ser Val Pro Pro Leu Phe
420 425 430
Arg Gln Phe Tyr Gln Ser Gly Leu Ala Phe Gly Ala Ser Arg Trp Leu
435 440 445
Ala Ser Leu Gln Arg His Cys Glu Tyr Met Val Val Lys His Ser Ile
450 455 460
Gln Val Pro Thr Gly Cys Val Ser Gly Ser Gly Val Leu Thr Leu Ser
465 470 475 480
Ala Leu Gly Arg Trp Asn Leu Leu Glu Leu Ala Gln Arg Met Met Ala
485 490 495
Ile Phe Tyr Lys Thr Thr Ser Gly Leu Pro Thr Val Glu Pro Gly Asn
500 505 510
Ile Val Thr Arg Trp Gly Arg Gly Cys Met Gly Thr Thr Gly Glu Met
515 520 525
Leu Glu Pro Ala Val Arg Met Val Leu Gly Asn Tyr Phe Gly Ala Met
530 535 540
Asp Gly Gln Pro Ser Pro Leu Gln Val Leu Ser Ala Thr Thr Thr Val
545 550 555 560
Trp Leu Pro Gly Thr Pro Pro Glu Ser Val Phe Asn Tyr Leu Cys Asn
565 570 575
Gly Gln Arg Arg Gly Glu Trp Asp Ala Phe Val Cys Ala Gly Ala Val
580 585 590
Gln Glu Leu Ser Ser Val Ala Thr Cys Pro His Leu His Gly Asn Ala
595 600 605
Val Ser Val Leu Cys Pro Asn Val Thr Asn Ala Ala Asn Asn Ala Met
610 615 620
Leu Phe Leu Gln Gln Thr Ser Ile Asp Val Ser Arg Ala Leu Val Val
625 630 635 640
Tyr Ser Val Val Glu Glu Thr Met Leu Arg Ser Val Leu Asp Val Ser
645 650 655
Asp Asp Thr Ser Asn Leu Val Leu Leu Pro Ser Gly Phe Ala Ile Leu
660 665 670
Pro Asp Gly His Gly Arg Ala His His Ala Ala Ala Ser Asn Ser Ser
675 680 685
Ser Ala Leu Ala Gly Leu Asn Gly Thr Ala Gly Cys Leu Leu Thr Ala
690 695 700
Ala Tyr Gln Val Pro Val Pro Phe Asn Asn Leu Arg His Pro Asp Val
705 710 715 720
Gln Glu Thr Tyr Glu Asn Ala Gly Lys Arg Ile Cys His Ala Ile Lys
725 730 735
Lys Ile Met Asp Ala Val Gly Ala Pro Ile Val Val Pro Ile
740 745 750
<210> 556
<211> 2391
<212> DNA
<213> Zea mays
<400> 556
atgacgccgg caaggcgcgt gccgccggcg gcgatgatcg gccggaatgg cttcgcgttt 60
gggtcctcgt cggcgctgtc tttaagccag gctgacctcc tagacagcca tcagctgcag 120
caagcgttcc agcagcagct cttcgatcag atcccgacca ccaccacagt ggacgatagc 180
agcgacaacc tcatccatgg ccgctctgac acgctggtag atgagttcga gagcaagtcc 240
tgcagcgaga atcccgacgg aacctctggt gacgatggcc tggaggaaga ccccaatcag 300
cggccgaaca agaagaagcg ataccaccgc cacacccagc accagatcca agagatggag 360
gcgttcttca aggagtgccc gcacccggac gacaagcagc ggaaggagct gagccgggag 420
ctcggcctcg agccgctgca ggtcaagttt tggttccaga acaagcgcac acagatgaag 480
aaccagcacg agcggcacga gaacgcgcag ctgcgcgcgg agaacgacaa gctgcgagcc 540
gagaacatgc ggtacaagga ggcgctgggc acggcctcgt gccccagctg cggcggcccg 600
gctgccctcg gcgagatgtc cttcgacgag caccacctcc gcctcgagaa cgctcgcctc 660
cgtgacgaga tcgaccggat ctcgggcatc gccgccaagc acgtgggaaa gcccatggtg 720
tccttccccg tgctctccag cccgctcgcc gccgccgccg ccgccgcccg gtccccactc 780
gacctcgccg gcgcctacgg cgtccagtca gctgctgcgg gcctcggcgc cgaccacgtg 840
ctgttcggcg ccggtgccgg cgatctgctg aggagcgtgt cggccgggca gctcgacgcg 900
gacaagccca tgatcgtgga gctggccgtc gcggccatgg acgagctcct ccggatggcg 960
cggcctgacg cgctgctgtg gggtggcggc gcgtcggcag gggcgcagca gcagcagctg 1020
gacgaggagg agtacgtccg gacgttcccc gctgggctcg ggccgaggca gtacgggctc 1080
cgtccggagg cgtctcggga cagcgccgtc gtgatcatga cctgcgacag cctcatcgag 1140
atactcatgg acgcgaaccg attcgcggca gtgttctcga gcatcgtgtc gagggcttcc 1200
acgcacgagg tgctgtcaac tggtgtggca gggagctaca atggtgcatt acaagtgatg 1260
tcgatggagt ttcaggtgcc gtcgccgctg gtgccgacgc gcgagagcta cttcgtgagg 1320
tactgcaaga acaacccgga cgggacatgg gccgtcgtcg acgtctcgct cgacagcctc 1380
cgccctagcc cggtcatcaa atgccggcgc aggccgtcag gttgcctcat ccaagagatg 1440
cccaatggct actcaaaggt gacctgggtg gagcatgttg aggtcgacga cagatcagtg 1500
cacaacctct acaggccttt ggtcaattca ggcctcgcgt ttggcgcgaa gaggtgggtt 1560
ggcacactgg accggcagtg cgagcggctc gccagcgcca tggccagcaa catccccaac 1620
ggcgacctcg gtgtgatcac aagcatagag gggaggaaga gcatgctgaa gctggcggag 1680
aggatggtgg cgagcttctg cggcggcgtg acggcgtctg cggcgcacca gtggacgacg 1740
ctgtcgggaa gcggcgcgga ggacgtccgt gttatgacca ggaagagcgt ggacgacccg 1800
ggcaggccgc cgggcatcgt cctcaatgct gccacctcct tctggctgcc cgtcccaccc 1860
aagagggtct tcgatttcct ccgcgatgag acctctcgca gcgagtggga catcctctcg 1920
aacggtggtg ctgtccaaga aatggctcac attgccaacg gccgggacca tggcaactgt 1980
gtctccctcc ttcgtgtcaa tagtgcaaac tcgaaccaga gcaacatgct gatcctccag 2040
gagagctgca ccgacgcctc gggctcgtac gtggtgtacg cgccggtgga cgtggtggcg 2100
atgaacgtgg tgctcaacgg cggcgacccg gactacgtgg ccctgctgcc gtcgggcttc 2160
gccatcctcc ccgacggacc accgccggcc ggtgcggctc cgtcccacgg agagggcttg 2220
gacactggcg gcggcgggtc cctcctgacg gtggcgttcc agatcttggt ggactccgtc 2280
cccaccgcca agctctccct cggctccgta gccaccgtga acagcctcat cgcctgcacc 2340
gtcgagcgca tcaaggccgc cgtctgtgcg gaagccggca acccgcagta g 2391
<210> 557
<211> 796
<212> PRT
<213> Zea mays
<400> 557
Met Thr Pro Ala Arg Arg Val Pro Pro Ala Ala Met Ile Gly Arg Asn
1 5 10 15
Gly Phe Ala Phe Gly Ser Ser Ser Ala Leu Ser Leu Ser Gln Ala Asp
20 25 30
Leu Leu Asp Ser His Gln Leu Gln Gln Ala Phe Gln Gln Gln Leu Phe
35 40 45
Asp Gln Ile Pro Thr Thr Thr Thr Val Asp Asp Ser Ser Asp Asn Leu
50 55 60
Ile His Gly Arg Ser Asp Thr Leu Val Asp Glu Phe Glu Ser Lys Ser
65 70 75 80
Cys Ser Glu Asn Pro Asp Gly Thr Ser Gly Asp Asp Gly Leu Glu Glu
85 90 95
Asp Pro Asn Gln Arg Pro Asn Lys Lys Lys Arg Tyr His Arg His Thr
100 105 110
Gln His Gln Ile Gln Glu Met Glu Ala Phe Phe Lys Glu Cys Pro His
115 120 125
Pro Asp Asp Lys Gln Arg Lys Glu Leu Ser Arg Glu Leu Gly Leu Glu
130 135 140
Pro Leu Gln Val Lys Phe Trp Phe Gln Asn Lys Arg Thr Gln Met Lys
145 150 155 160
Asn Gln His Glu Arg His Glu Asn Ala Gln Leu Arg Ala Glu Asn Asp
165 170 175
Lys Leu Arg Ala Glu Asn Met Arg Tyr Lys Glu Ala Leu Gly Thr Ala
180 185 190
Ser Cys Pro Ser Cys Gly Gly Pro Ala Ala Leu Gly Glu Met Ser Phe
195 200 205
Asp Glu His His Leu Arg Leu Glu Asn Ala Arg Leu Arg Asp Glu Ile
210 215 220
Asp Arg Ile Ser Gly Ile Ala Ala Lys His Val Gly Lys Pro Met Val
225 230 235 240
Ser Phe Pro Val Leu Ser Ser Pro Leu Ala Ala Ala Ala Ala Ala Ala
245 250 255
Arg Ser Pro Leu Asp Leu Ala Gly Ala Tyr Gly Val Gln Ser Ala Ala
260 265 270
Ala Gly Leu Gly Ala Asp His Val Leu Phe Gly Ala Gly Ala Gly Asp
275 280 285
Leu Leu Arg Ser Val Ser Ala Gly Gln Leu Asp Ala Asp Lys Pro Met
290 295 300
Ile Val Glu Leu Ala Val Ala Ala Met Asp Glu Leu Leu Arg Met Ala
305 310 315 320
Arg Pro Asp Ala Leu Leu Trp Gly Gly Gly Ala Ser Ala Gly Ala Gln
325 330 335
Gln Gln Gln Leu Asp Glu Glu Glu Tyr Val Arg Thr Phe Pro Ala Gly
340 345 350
Leu Gly Pro Arg Gln Tyr Gly Leu Arg Pro Glu Ala Ser Arg Asp Ser
355 360 365
Ala Val Val Ile Met Thr Cys Asp Ser Leu Ile Glu Ile Leu Met Asp
370 375 380
Ala Asn Arg Phe Ala Ala Val Phe Ser Ser Ile Val Ser Arg Ala Ser
385 390 395 400
Thr His Glu Val Leu Ser Thr Gly Val Ala Gly Ser Tyr Asn Gly Ala
405 410 415
Leu Gln Val Met Ser Met Glu Phe Gln Val Pro Ser Pro Leu Val Pro
420 425 430
Thr Arg Glu Ser Tyr Phe Val Arg Tyr Cys Lys Asn Asn Pro Asp Gly
435 440 445
Thr Trp Ala Val Val Asp Val Ser Leu Asp Ser Leu Arg Pro Ser Pro
450 455 460
Val Ile Lys Cys Arg Arg Arg Pro Ser Gly Cys Leu Ile Gln Glu Met
465 470 475 480
Pro Asn Gly Tyr Ser Lys Val Thr Trp Val Glu His Val Glu Val Asp
485 490 495
Asp Arg Ser Val His Asn Leu Tyr Arg Pro Leu Val Asn Ser Gly Leu
500 505 510
Ala Phe Gly Ala Lys Arg Trp Val Gly Thr Leu Asp Arg Gln Cys Glu
515 520 525
Arg Leu Ala Ser Ala Met Ala Ser Asn Ile Pro Asn Gly Asp Leu Gly
530 535 540
Val Ile Thr Ser Ile Glu Gly Arg Lys Ser Met Leu Lys Leu Ala Glu
545 550 555 560
Arg Met Val Ala Ser Phe Cys Gly Gly Val Thr Ala Ser Ala Ala His
565 570 575
Gln Trp Thr Thr Leu Ser Gly Ser Gly Ala Glu Asp Val Arg Val Met
580 585 590
Thr Arg Lys Ser Val Asp Asp Pro Gly Arg Pro Pro Gly Ile Val Leu
595 600 605
Asn Ala Ala Thr Ser Phe Trp Leu Pro Val Pro Pro Lys Arg Val Phe
610 615 620
Asp Phe Leu Arg Asp Glu Thr Ser Arg Ser Glu Trp Asp Ile Leu Ser
625 630 635 640
Asn Gly Gly Ala Val Gln Glu Met Ala His Ile Ala Asn Gly Arg Asp
645 650 655
His Gly Asn Cys Val Ser Leu Leu Arg Val Asn Ser Ala Asn Ser Asn
660 665 670
Gln Ser Asn Met Leu Ile Leu Gln Glu Ser Cys Thr Asp Ala Ser Gly
675 680 685
Ser Tyr Val Val Tyr Ala Pro Val Asp Val Val Ala Met Asn Val Val
690 695 700
Leu Asn Gly Gly Asp Pro Asp Tyr Val Ala Leu Leu Pro Ser Gly Phe
705 710 715 720
Ala Ile Leu Pro Asp Gly Pro Pro Pro Ala Gly Ala Ala Pro Ser His
725 730 735
Gly Glu Gly Leu Asp Thr Gly Gly Gly Gly Ser Leu Leu Thr Val Ala
740 745 750
Phe Gln Ile Leu Val Asp Ser Val Pro Thr Ala Lys Leu Ser Leu Gly
755 760 765
Ser Val Ala Thr Val Asn Ser Leu Ile Ala Cys Thr Val Glu Arg Ile
770 775 780
Lys Ala Ala Val Cys Ala Glu Ala Gly Asn Pro Gln
785 790 795
<210> 558
<211> 2199
<212> DNA
<213> Zea mays
<400> 558
atggatttcg gcgacgaacc tgagggctcc gacagccagc gccagcggaa gcggtaccac 60
cggcacacgc cgcgccagat tcagcagctc gaggcgtacg atctcgcttc gtttccattt 120
cttttgctgc ttctttattc tgtccggccg cccttgtggt tgttcgtcgt gagacgtgat 180
ggtttggcgg aaaggaatgt aatggcgtgc gtgctcgccc atgactgcag gatgttcaag 240
gagtgcccgc accccgacga gaaccagcgc gccgcgctca gccgggagct cggcctggag 300
ccgcgccaga tcaagttctg gtttcagaac cgccgcaccc agatgaaggc gcagcacgag 360
cgcgcggaca actgcttcct gcgcgcggag aacgacaaga tccggtgcga gaacatcacc 420
atgcgcgagg cgctcaagaa cgtcatctgc cccagctgcg gcggcccgcc cgtcgacgag 480
gacttcttcg acgagcagaa gctccgcatg gagaatgccc gcctcaagga agagctggat 540
cgggtgtcga gcatcacgtc caagtacctc ggccggccgt tcacgcagat gcctccggtg 600
ccgaccatgt ccgtgtcgtc gctggacctg tccgtgggcg ggatgggctc cctcggcggg 660
ccgtcgctgg acctcgacct cctcagcggc tgctcgtccg ggctgccgta ccaggtgccg 720
gcgcccgtga cggaaatgga gcgccccatg atggtcgata tggcggcgcg cgccatggac 780
gagctcatcc ggctcgccca ggccggcgag caaatctggg tcaagggcgt gcccggggac 840
gcgagggagg tgctcgacgt cggtacttac gacagcctct tcgccaagcc cggcgccgcg 900
ttccgcccgc cggacatcaa cgtcgaggcg tccagggact cgggcctcgt gttcatgagc 960
gccgtcgcgc tcgtcgacgt cttcatggac acgaacaagt ggatggaatt cttccccggc 1020
atcgtgtcca aggcgcaaac cgtcgatgtt ctcgtgaacg gcttgggcgg gaggagcgag 1080
tccttaatca tgatgtatga ggagctgcac atcatgactc cggtcgtgcc gactcgcgag 1140
ctgagcttcc tccgctactg caagcagatc gagcaggggc tgtgggccgt cgcggacgtc 1200
tccctggagg ggcagcgcga cgcccattac ggcgtgccgt cccgctcccg tcgcatgccg 1260
tcggggtgcc tcatcgccga catgtcgaac ggctactcca aggtgacctg ggtcgaacac 1320
atggagatcg agcagatgct cccgatcaac gtcctttacc gcaacctggt gctgagcggc 1380
gccgcgttcg gggcgcaccg ctggctggcc gcgctgcagc gtgcgtgcga gcggttcgcg 1440
tccgtggcca ccctcggcgt gccgcaccac gacgtcgccg gagtgacgcc ggaggggaag 1500
cggagcatga cgaagctgtc gcagcggatg gtgagcagct tctgtgccag cctgagctcg 1560
tcgccgctgc agcggtggac gctgctctct ggcaccacgg acgtgagcgt ccgggtctcc 1620
acgcaccgca gcaccgactc aggccagccc aacggcgtcg tcctcagcgc cgccacctcc 1680
atctggctgc ccgtccccgg cgaccatgtc ttcgccttcg tccgcgacga gaacgcgcgc 1740
tcccagtggg atgtcctgtc gcacggcaat caggttcagg aggtgtcgcg catccccaac 1800
ggctccaacc ccggcaactg catctccctg ctaagaggtc tgaacgcgaa ccagaacagc 1860
atgctgatcc ttcaggagag ctgcacggac gcgtcggggg cgctggtggt gtactcgccg 1920
atcgacatcc cggcggcgaa cgtggtgatg agcggcgagg acccgtcggg catcccgctg 1980
ctgccgtcgg gcttcgccat cctgccgggg tccggcgcgg gcgcgtccag cagcgccgtc 2040
gtcccgccgc cgggctgcgt ggtcaccgtc gcgttccaga tcctcgtcag caacctgccg 2100
tcgtccaggc tgaacgccga gtccgtcgcc accgtcaaca gcctcatcgg caccaccgtg 2160
cagcagatca aggcggcgct caactgtgcc ggccattga 2199
<210> 559
<211> 732
<212> PRT
<213> Zea mays
<400> 559
Met Asp Phe Gly Asp Glu Pro Glu Gly Ser Asp Ser Gln Arg Gln Arg
1 5 10 15
Lys Arg Tyr His Arg His Thr Pro Arg Gln Ile Gln Gln Leu Glu Ala
20 25 30
Tyr Asp Leu Ala Ser Phe Pro Phe Leu Leu Leu Leu Leu Tyr Ser Val
35 40 45
Arg Pro Pro Leu Trp Leu Phe Val Val Arg Arg Asp Gly Leu Ala Glu
50 55 60
Arg Asn Val Met Ala Cys Val Leu Ala His Asp Cys Arg Met Phe Lys
65 70 75 80
Glu Cys Pro His Pro Asp Glu Asn Gln Arg Ala Ala Leu Ser Arg Glu
85 90 95
Leu Gly Leu Glu Pro Arg Gln Ile Lys Phe Trp Phe Gln Asn Arg Arg
100 105 110
Thr Gln Met Lys Ala Gln His Glu Arg Ala Asp Asn Cys Phe Leu Arg
115 120 125
Ala Glu Asn Asp Lys Ile Arg Cys Glu Asn Ile Thr Met Arg Glu Ala
130 135 140
Leu Lys Asn Val Ile Cys Pro Ser Cys Gly Gly Pro Pro Val Asp Glu
145 150 155 160
Asp Phe Phe Asp Glu Gln Lys Leu Arg Met Glu Asn Ala Arg Leu Lys
165 170 175
Glu Glu Leu Asp Arg Val Ser Ser Ile Thr Ser Lys Tyr Leu Gly Arg
180 185 190
Pro Phe Thr Gln Met Pro Pro Val Pro Thr Met Ser Val Ser Ser Leu
195 200 205
Asp Leu Ser Val Gly Gly Met Gly Ser Leu Gly Gly Pro Ser Leu Asp
210 215 220
Leu Asp Leu Leu Ser Gly Cys Ser Ser Gly Leu Pro Tyr Gln Val Pro
225 230 235 240
Ala Pro Val Thr Glu Met Glu Arg Pro Met Met Val Asp Met Ala Ala
245 250 255
Arg Ala Met Asp Glu Leu Ile Arg Leu Ala Gln Ala Gly Glu Gln Ile
260 265 270
Trp Val Lys Gly Val Pro Gly Asp Ala Arg Glu Val Leu Asp Val Gly
275 280 285
Thr Tyr Asp Ser Leu Phe Ala Lys Pro Gly Ala Ala Phe Arg Pro Pro
290 295 300
Asp Ile Asn Val Glu Ala Ser Arg Asp Ser Gly Leu Val Phe Met Ser
305 310 315 320
Ala Val Ala Leu Val Asp Val Phe Met Asp Thr Asn Lys Trp Met Glu
325 330 335
Phe Phe Pro Gly Ile Val Ser Lys Ala Gln Thr Val Asp Val Leu Val
340 345 350
Asn Gly Leu Gly Gly Arg Ser Glu Ser Leu Ile Met Met Tyr Glu Glu
355 360 365
Leu His Ile Met Thr Pro Val Val Pro Thr Arg Glu Leu Ser Phe Leu
370 375 380
Arg Tyr Cys Lys Gln Ile Glu Gln Gly Leu Trp Ala Val Ala Asp Val
385 390 395 400
Ser Leu Glu Gly Gln Arg Asp Ala His Tyr Gly Val Pro Ser Arg Ser
405 410 415
Arg Arg Met Pro Ser Gly Cys Leu Ile Ala Asp Met Ser Asn Gly Tyr
420 425 430
Ser Lys Val Thr Trp Val Glu His Met Glu Ile Glu Gln Met Leu Pro
435 440 445
Ile Asn Val Leu Tyr Arg Asn Leu Val Leu Ser Gly Ala Ala Phe Gly
450 455 460
Ala His Arg Trp Leu Ala Ala Leu Gln Arg Ala Cys Glu Arg Phe Ala
465 470 475 480
Ser Val Ala Thr Leu Gly Val Pro His His Asp Val Ala Gly Val Thr
485 490 495
Pro Glu Gly Lys Arg Ser Met Thr Lys Leu Ser Gln Arg Met Val Ser
500 505 510
Ser Phe Cys Ala Ser Leu Ser Ser Ser Pro Leu Gln Arg Trp Thr Leu
515 520 525
Leu Ser Gly Thr Thr Asp Val Ser Val Arg Val Ser Thr His Arg Ser
530 535 540
Thr Asp Ser Gly Gln Pro Asn Gly Val Val Leu Ser Ala Ala Thr Ser
545 550 555 560
Ile Trp Leu Pro Val Pro Gly Asp His Val Phe Ala Phe Val Arg Asp
565 570 575
Glu Asn Ala Arg Ser Gln Trp Asp Val Leu Ser His Gly Asn Gln Val
580 585 590
Gln Glu Val Ser Arg Ile Pro Asn Gly Ser Asn Pro Gly Asn Cys Ile
595 600 605
Ser Leu Leu Arg Gly Leu Asn Ala Asn Gln Asn Ser Met Leu Ile Leu
610 615 620
Gln Glu Ser Cys Thr Asp Ala Ser Gly Ala Leu Val Val Tyr Ser Pro
625 630 635 640
Ile Asp Ile Pro Ala Ala Asn Val Val Met Ser Gly Glu Asp Pro Ser
645 650 655
Gly Ile Pro Leu Leu Pro Ser Gly Phe Ala Ile Leu Pro Gly Ser Gly
660 665 670
Ala Gly Ala Ser Ser Ser Ala Val Val Pro Pro Pro Gly Cys Val Val
675 680 685
Thr Val Ala Phe Gln Ile Leu Val Ser Asn Leu Pro Ser Ser Arg Leu
690 695 700
Asn Ala Glu Ser Val Ala Thr Val Asn Ser Leu Ile Gly Thr Thr Val
705 710 715 720
Gln Gln Ile Lys Ala Ala Leu Asn Cys Ala Gly His
725 730
<210> 560
<211> 2412
<212> DNA
<213> Zea mays
<400> 560
atgagcttcg ggagcctatt cgacggcggg tccggcggcg gcggaggagg aggagggatg 60
cagttcccgt tctcgaccgg gttctcgtcc tcgccggccc tctccctcgg tctggagaac 120
cccggcggcg gcatggtcgg ccggatgctc cccgtgggcg gcgcccccgc ggccggcggg 180
atggcgaggg acgccgccga cgccgagaac gacagccgct ccgggagcga ccacctggac 240
gccatgtccg ccggcgccgg cgccgaggac gaggacgacg ctgagccggg caacccgcgc 300
aagcgcaaga agcgctacca ccgccacacg ccgcagcaga tccaggagct cgaagcgctg 360
ttcaaggagt gccctcaccc ggacgagaag cagcgcggcg agctcagcaa gaggctcggc 420
ctcgacccgc gccaggtcaa gttctggttc cagaaccgcc gcacgcagat gaagacgcaa 480
ctggagcggc acgagaacgc gcttctcaag caagagaacg acaagctgcg ggccgagaac 540
atggcgatcc gggaggcgat gcgcagcccg atgtgcggca gctgcgggag ccccgccatg 600
ctcggggagg tgtccctgga ggagcagcac ctgtgcatcg agaatgcgcg gctcaaggac 660
gagctcaacc gcgtctacgc cctcgccacc aagttcctcg gcaagcccat gcccgtcctc 720
tcggggccca tgctgcagcc gaacctgtcg ctgcccatgc cgagctcgtc gctggagctg 780
gcagtaggcg gcctccgtgg cctagggtct atcccttcct tggacgagtt tgctggcggt 840
gtgtctagcc cgttgggcac ggtgatcacg cctgcacggg cgaccggatc tgctccgccg 900
cctatggtgg gcgtcgacag gtccatgctg ctggagcttg cgatcagcgc catggatgaa 960
ctagttaagc tggcacaggt tgacgagccc ttgtggcttc ccagcctcag tggctctccc 1020
gacaagaagc tgctcaactt tgaggagtat gcccactcgt tctctccgtc cgtcggcgcc 1080
gtgaagcctg tgggctatgt atccgaggcc tctagggagt ctggcctcgt catcattgac 1140
aacagccttg ctcttgtaga gacccttatg gacgtgagac ggtggtctga tatgttctcg 1200
tgcatgattg ctaaggccac agtcctagag gaggtgacat ctggcattgc aggaagtagg 1260
aatggtgcgc tgctgctgat gaaggctgag ctacaggtgc tctcacctct agtgcccatc 1320
agggaggtca catttctcag gttttgcaag cagctggctg agggtgcatg ggcagtagtg 1380
gatgtgtcca ttgacggatt ggtgagagat cacaactctg gaacagcatc caacgccgga 1440
aatatacggt gcaggaggtt gccttctggc tgtgtgatgc aggacactcc caatggctac 1500
tgcaaggtca catgggtaga gtatacggaa tacgacgagg cgtcagtaca ccagctctat 1560
agaccactca tccggtccgg gctggccttt ggggccaggc ggtggcttgc aatgctgcag 1620
cgccagtgcg aatgcctggc catactcatg tcccctgata cagtttcagc taatgactcg 1680
tcagtcataa cacaggaggg caagcgaagc atgctgaagc tggcacggcg gatgacggag 1740
aacttctgcg ccggggtcag cgcgtcatct gcacgtgaat ggagtaagct ggacggcgct 1800
gcaggcagca tcggggagga tgtgcgggtc atggcacgga aaagcgtgga cgagcctggg 1860
gagccgccgg gcgtggtcct aagcgcagcc acatcggtgt gggtgcccgt ggctccggag 1920
aagctcttca acttcctccg tgacgagcag ctgcgtgcgg agtgggacat cctcagcaac 1980
ggaggcccga tgcaggagat ggccaacatc gccaaggggc aggagcacgg gaactcggtg 2040
tccctcctca gagccagtgc catgagtgcc aaccagagca gcatgctgat cctccaggag 2100
acttgcactg atgcatcagg ctcgatggtc gtgtatgctc cagtggacat cccggcgatg 2160
cagctcgtca tgaacggcgg ggactccacc tacgttgctc tgctgccgtc tgggttcgcc 2220
atcctgcctg atggcccaag cagtgtcggc gccgagcaca agacaggcgg ctcgctgctc 2280
accgtcgcct tccagatcct cgtcaacagc cagccgaccg ccaaactcac cgtggagtca 2340
gtagagaccg tgaacaacct catattctgc accatcaaga agatcaagac agcgctgcag 2400
tgtgacgctt ga 2412
<210> 561
<211> 803
<212> PRT
<213> Zea mays
<400> 561
Met Ser Phe Gly Ser Leu Phe Asp Gly Gly Ser Gly Gly Gly Gly Gly
1 5 10 15
Gly Gly Gly Met Gln Phe Pro Phe Ser Thr Gly Phe Ser Ser Ser Pro
20 25 30
Ala Leu Ser Leu Gly Leu Glu Asn Pro Gly Gly Gly Met Val Gly Arg
35 40 45
Met Leu Pro Val Gly Gly Ala Pro Ala Ala Gly Gly Met Ala Arg Asp
50 55 60
Ala Ala Asp Ala Glu Asn Asp Ser Arg Ser Gly Ser Asp His Leu Asp
65 70 75 80
Ala Met Ser Ala Gly Ala Gly Ala Glu Asp Glu Asp Asp Ala Glu Pro
85 90 95
Gly Asn Pro Arg Lys Arg Lys Lys Arg Tyr His Arg His Thr Pro Gln
100 105 110
Gln Ile Gln Glu Leu Glu Ala Leu Phe Lys Glu Cys Pro His Pro Asp
115 120 125
Glu Lys Gln Arg Gly Glu Leu Ser Lys Arg Leu Gly Leu Asp Pro Arg
130 135 140
Gln Val Lys Phe Trp Phe Gln Asn Arg Arg Thr Gln Met Lys Thr Gln
145 150 155 160
Leu Glu Arg His Glu Asn Ala Leu Leu Lys Gln Glu Asn Asp Lys Leu
165 170 175
Arg Ala Glu Asn Met Ala Ile Arg Glu Ala Met Arg Ser Pro Met Cys
180 185 190
Gly Ser Cys Gly Ser Pro Ala Met Leu Gly Glu Val Ser Leu Glu Glu
195 200 205
Gln His Leu Cys Ile Glu Asn Ala Arg Leu Lys Asp Glu Leu Asn Arg
210 215 220
Val Tyr Ala Leu Ala Thr Lys Phe Leu Gly Lys Pro Met Pro Val Leu
225 230 235 240
Ser Gly Pro Met Leu Gln Pro Asn Leu Ser Leu Pro Met Pro Ser Ser
245 250 255
Ser Leu Glu Leu Ala Val Gly Gly Leu Arg Gly Leu Gly Ser Ile Pro
260 265 270
Ser Leu Asp Glu Phe Ala Gly Gly Val Ser Ser Pro Leu Gly Thr Val
275 280 285
Ile Thr Pro Ala Arg Ala Thr Gly Ser Ala Pro Pro Pro Met Val Gly
290 295 300
Val Asp Arg Ser Met Leu Leu Glu Leu Ala Ile Ser Ala Met Asp Glu
305 310 315 320
Leu Val Lys Leu Ala Gln Val Asp Glu Pro Leu Trp Leu Pro Ser Leu
325 330 335
Ser Gly Ser Pro Asp Lys Lys Leu Leu Asn Phe Glu Glu Tyr Ala His
340 345 350
Ser Phe Ser Pro Ser Val Gly Ala Val Lys Pro Val Gly Tyr Val Ser
355 360 365
Glu Ala Ser Arg Glu Ser Gly Leu Val Ile Ile Asp Asn Ser Leu Ala
370 375 380
Leu Val Glu Thr Leu Met Asp Val Arg Arg Trp Ser Asp Met Phe Ser
385 390 395 400
Cys Met Ile Ala Lys Ala Thr Val Leu Glu Glu Val Thr Ser Gly Ile
405 410 415
Ala Gly Ser Arg Asn Gly Ala Leu Leu Leu Met Lys Ala Glu Leu Gln
420 425 430
Val Leu Ser Pro Leu Val Pro Ile Arg Glu Val Thr Phe Leu Arg Phe
435 440 445
Cys Lys Gln Leu Ala Glu Gly Ala Trp Ala Val Val Asp Val Ser Ile
450 455 460
Asp Gly Leu Val Arg Asp His Asn Ser Gly Thr Ala Ser Asn Ala Gly
465 470 475 480
Asn Ile Arg Cys Arg Arg Leu Pro Ser Gly Cys Val Met Gln Asp Thr
485 490 495
Pro Asn Gly Tyr Cys Lys Val Thr Trp Val Glu Tyr Thr Glu Tyr Asp
500 505 510
Glu Ala Ser Val His Gln Leu Tyr Arg Pro Leu Ile Arg Ser Gly Leu
515 520 525
Ala Phe Gly Ala Arg Arg Trp Leu Ala Met Leu Gln Arg Gln Cys Glu
530 535 540
Cys Leu Ala Ile Leu Met Ser Pro Asp Thr Val Ser Ala Asn Asp Ser
545 550 555 560
Ser Val Ile Thr Gln Glu Gly Lys Arg Ser Met Leu Lys Leu Ala Arg
565 570 575
Arg Met Thr Glu Asn Phe Cys Ala Gly Val Ser Ala Ser Ser Ala Arg
580 585 590
Glu Trp Ser Lys Leu Asp Gly Ala Ala Gly Ser Ile Gly Glu Asp Val
595 600 605
Arg Val Met Ala Arg Lys Ser Val Asp Glu Pro Gly Glu Pro Pro Gly
610 615 620
Val Val Leu Ser Ala Ala Thr Ser Val Trp Val Pro Val Ala Pro Glu
625 630 635 640
Lys Leu Phe Asn Phe Leu Arg Asp Glu Gln Leu Arg Ala Glu Trp Asp
645 650 655
Ile Leu Ser Asn Gly Gly Pro Met Gln Glu Met Ala Asn Ile Ala Lys
660 665 670
Gly Gln Glu His Gly Asn Ser Val Ser Leu Leu Arg Ala Ser Ala Met
675 680 685
Ser Ala Asn Gln Ser Ser Met Leu Ile Leu Gln Glu Thr Cys Thr Asp
690 695 700
Ala Ser Gly Ser Met Val Val Tyr Ala Pro Val Asp Ile Pro Ala Met
705 710 715 720
Gln Leu Val Met Asn Gly Gly Asp Ser Thr Tyr Val Ala Leu Leu Pro
725 730 735
Ser Gly Phe Ala Ile Leu Pro Asp Gly Pro Ser Ser Val Gly Ala Glu
740 745 750
His Lys Thr Gly Gly Ser Leu Leu Thr Val Ala Phe Gln Ile Leu Val
755 760 765
Asn Ser Gln Pro Thr Ala Lys Leu Thr Val Glu Ser Val Glu Thr Val
770 775 780
Asn Asn Leu Ile Phe Cys Thr Ile Lys Lys Ile Lys Thr Ala Leu Gln
785 790 795 800
Cys Asp Ala
<210> 562
<211> 50
<212> PRT
<213> Artificial sequence
<220>
<223> motif 16
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "Ala" / replace = "Pro"
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (4)..(4)
<223> / replace = "Val"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Phe"
<220>
<221> VARIANT
<222> (11)..(11)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (13)..(13)
<223> / replace = "Thr"
<220>
<221> VARIANT
<222> (14)..(14)
<223> / replace = "Gln"
<220>
<221> VARIANT
<222> (15)..(15)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (17)..(17)
<223> / replace = "Val" / replace = "Ala"
<220>
<221> VARIANT
<222> (18)..(18)
<223> / replace = "Arg" / replace = "Gln"
<220>
<221> VARIANT
<222> (19)..(19)
<223> / replace = "Lys" / replace = "Ser" / replace = "His"
<220>
<221> VARIANT
<222> (20)..(20)
<223> / replace = "Asn" / replace = "Cys" / replace = "Asp"
<220>
<221> VARIANT
<222> (21)..(21)
<223> / replace = "Asn" / replace = "Gly"
<220>
<221> VARIANT
<222> (22)..(22)
<223> / replace = "Glu" / replace = "Thr" / replace = "His"
<220>
<221> VARIANT
<222> (23)..(23)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (24)..(24)
<223> / replace = "Asn"
<220>
<221> VARIANT
<222> (25)..(25)
<223> / replace = "Lys" / replace = "Asn" / replace = "Cys"
<220>
<221> VARIANT
<222> (26)..(26)
<223> / replace = "Ala" / replace = "Lys" / replace = "Ile"
<220>
<221> VARIANT
<222> (27)..(27)
<223> / replace = "Tyr"
<220>
<221> VARIANT
<222> (28)..(28)
<223> / replace = "Gln" / replace = "Lys"
<220>
<221> VARIANT
<222> (29)..(29)
<223> / replace = "Arg" / replace = "Ala"
<220>
<221> VARIANT
<222> (30)..(30)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (32)..(32)
<223> / replace = "Ala" / replace = "Glu"
<220>
<221> VARIANT
<222> (33)..(33)
<223> / replace = "Lys"
<220>
<221> VARIANT
<222> (34)..(34)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (35)..(35)
<223> / replace = "Leu" / replace = "Lys"
<220>
<221> VARIANT
<222> (36)..(36)
<223> / replace = "Ala" / replace = "Cys"
<220>
<221> VARIANT
<222> (37)..(37)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (39)..(39)
<223> / replace = "Met" / replace = "Ile"
<220>
<221> VARIANT
<222> (40)..(40)
<223> / replace = "Glu" / replace = "Arg"
<220>
<221> VARIANT
<222> (41)..(41)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (42)..(42)
<223> / replace = "Lys" / replace = "Gln"
<220>
<221> VARIANT
<222> (43)..(43)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (44)..(44)
<223> / replace = "Gln" / replace = "Ala"
<220>
<221> VARIANT
<222> (45)..(45)
<223> / replace = "Met" / replace = "Ile"
<220>
<221> VARIANT
<222> (46)..(46)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (47)..(47)
<223> / replace = "Gly" / replace = "Lys"
<220>
<221> VARIANT
<222> (48)..(48)
<223> / replace = "Ser" / replace = "Met" / replace = "Ala"
<220>
<221> VARIANT
<222> (49)..(49)
<223> / replace = "Ile"
<400> 562
Glu Thr Gln Ile Lys Tyr Trp Phe Gln Asn Cys Arg Ser Lys Met Lys
1 5 10 15
Lys Phe Gln Glu Arg Ala Asp Arg Ser Leu Leu Arg Lys Gln Asn Glu
20 25 30
Glu Leu Arg Lys Thr Asn Ala Ala Leu Arg Asn Arg Leu Lys Asn Val
35 40 45
Thr Cys
50
<210> 563
<211> 29
<212> PRT
<213> Artificial sequence
<220>
<223> motif 17
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "Pro" / replace = "Arg"
<220>
<221> VARIANT
<222> (2)..(2)
<223> / replace = "Lys"
<220>
<221> VARIANT
<222> (5)..(5)
<223> / replace = "His"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (7)..(7)
<223> / replace = "His"
<220>
<221> VARIANT
<222> (9)..(9)
<223> / replace = "Pro" / replace = "Ala"
<220>
<221> VARIANT
<222> (10)..(10)
<223> / replace = "Arg"
<220>
<221> VARIANT
<222> (12)..(12)
<223> / replace = "Ile"
<220>
<221> VARIANT
<222> (13)..(13)
<223> / replace = "Gln"
<220>
<221> VARIANT
<222> (14)..(14)
<223> / replace = "Thr" / replace = "Gln" / replace = "Arg"
<220>
<221> VARIANT
<222> (15)..(15)
<223> / replace = "Met"
<220>
<221> VARIANT
<222> (16)..(16)
<223> / replace = "Glu"
<220>
<221> VARIANT
<222> (17)..(17)
<223> / replace = "Ala" / replace = "Ser"
<220>
<221> VARIANT
<222> (18)..(18)
<223> / replace = "Ala" / replace = "Tyr" / replace = "Met"
<220>
<221> VARIANT
<222> (19)..(19)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (20)..(20)
<223> / replace = "Leu" / replace = "Lys"
<220>
<221> VARIANT
<222> (21)..(21)
<223> / replace = "Ser" / replace = "Ala"
<220>
<221> VARIANT
<222> (22)..(22)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (23)..(23)
<223> / replace = "Phe"
<220>
<221> VARIANT
<222> (24)..(24)
<223> / replace = "Pro" / replace = "His"
<220>
<221> VARIANT
<222> (25)..(25)
<223> / replace = "Pro"
<220>
<221> VARIANT
<222> (26)..(26)
<223> / replace = "Asp"
<220>
<221> VARIANT
<222> (27)..(27)
<223> / replace = "Arg" / replace = "Leu" / replace = "Asp"
<220>
<221> VARIANT
<222> (28)..(28)
<223> / replace = "Asn" / replace = "Leu"
<220>
<221> VARIANT
<222> (29)..(29)
<223> / replace = "Leu" / replace = "Gln"
<400> 563
Lys Arg Arg Tyr Gln Leu Leu Thr Met Gln Gln Lys Glu Glu Leu Asn
1 5 10 15
Arg Leu Phe Gln Glu Cys Pro Asn Phe Leu Glu Lys Asp
20 25
<210> 564
<211> 10
<212> PRT
<213> Artificial sequence
<220>
<223> motif 18
<220>
<221> VARIANT
<222> (1)..(1)
<223> / replace = "Asn"
<220>
<221> VARIANT
<222> (3)..(3)
<223> / replace = "Arg" / replace = "Asn" / replace = "His" / replace =
"Tyr"
<220>
<221> VARIANT
<222> (4)..(4)
<223> / replace = "Ser"
<220>
<221> VARIANT
<222> (5)..(5)
<223> / replace = "Arg" / replace = "Lys"
<220>
<221> VARIANT
<222> (6)..(6)
<223> / replace = "Leu" / replace = "Met" / replace = "Val"
<220>
<221> VARIANT
<222> (7)..(7)
<223> / replace = "Val" / replace = "Ile" / replace = "Thr"
<220>
<221> VARIANT
<222> (8)..(8)
<223> / replace = "Trp"
<220>
<221> VARIANT
<222> (9)..(9)
<223> / replace = "Leu" / replace = "Ile" / replace = "Met"
<220>
<221> VARIANT
<222> (10)..(10)
<223> / replace = "Glu" / replace = "Val"
<400> 564
Asp Gly Cys Cys Gln Ile Tyr Ala Val Asp
1 5 10
<210> 565
<211> 1264
<212> DNA
<213> Oryza sativa
<400> 565
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatc 1264
<210> 566
<211> 4013
<212> DNA
<213> Artificial sequence
<220>
<223> expression cassette pRCc3::HD8-like::t-zein
<400> 566
tcgacgctac tcaagtggtg ggaggccacc gcatgttcca acgaagcgcc aaagaaagcc 60
ttgcagactc taatgctatt agtcgcctag gatatttgga atgaaaggaa ccgcagagtt 120
tttcagcacc aagagcttcc ggtggctagt ctgatagcca aaattaagga ggatgccaaa 180
acatgggtct tggcgggcgc gaaacacctt gataggtggc ttacctttta acatgttcgg 240
gccaaaggcc ttgagacggt aaagttttct atttgcgctt gcgcatgtac aattttattc 300
ctctattcaa tgaaattggt ggctcactgg ttcattaaaa aaaaaagaat ctagcctgtt 360
cgggaagaag aggattttgt tcgtgagaga gagagagaga gagagagaga gagagagaga 420
gaaggaggag gaggattttc aggcttcgca ttgcccaacc tctgcttctg ttggcccaag 480
aagaatccca ggcgcccatg ggctggcagt ttaccacgga cctacctagc ctaccttagc 540
tatctaagcg ggccgaccta gtagccacgt gcctagtgta gattaaagtt gccgggccag 600
caggaagcca cgctgcaatg gcatcttccc ctgtccttcg cgtacgtgaa aacaaaccca 660
ggtaagctta gaatcttctt gcccgttgga ctgggacacc caccaatccc accatgcccc 720
gatattcctc cggtctcggt tcatgtgatg tcctctcttg tgtgatcacg gagcaagcat 780
tcttaaacgg caaaagaaaa tcaccaactt gctcacgcag tcacgctgca ccgcgcgaag 840
cgacgcccga taggccaaga tcgcgagata aaataacaac caatgatcat aaggaaacaa 900
gcccgcgatg tgtcgtgtgc agcaatcttg gtcatttgcg ggatcgagtg cttcacagct 960
aaccaaatat tcggccgatg atttaacaca ttatcagcgt agatgtacgt acgatttgtt 1020
aattaatcta cgagccttgc tagggcaggt gttctgccag ccaatccaga tcgccctcgt 1080
atgcacgctc acatgatggc agggcagggt tcacatgagc tctaacggtc gattaattaa 1140
tcccggggct cgactataaa tacctcccta atcccatgat caaaaccatc tcaagcagcc 1200
taatcatctc cagctgatca agagctctta attagctagc tagtgattag ctgcgcttgt 1260
gatcatttaa atcaactagg gatatcacaa gtttgtacaa aaaagcaggc ttaaacaatg 1320
aacggcgagc ttaaacttat ggcttcctat gtgagcaagc ttaagttcat cttgcaaaaa 1380
gatcagcagc aggagcccca tactgcgaac cttctagtcc tacttgggag tagcaatcag 1440
gacaaaagaa atggcctctc acagggagaa aacagaatgg acacttgtac cagaaagaag 1500
ccaagaagat accaactcct caccatgcaa caaaaagaaa cgcttaatcg tgcatttcaa 1560
tcatgtccga accctgatag aaatgacttg aagaagttgg ccaaggaact aaacatgact 1620
gagacccaaa tcaaatattg gttccagaac tgcaggacaa agatgaagaa attcaagaac 1680
aatgaggagc gcaaactact gcagaaggag aatgaggagc taaagaagga gaatgcagag 1740
ttgagaaata ggatgaagaa ctcaacatgc cgcgcttgtg acctcccttt gttccatata 1800
gattgccgtc attgggagaa tccaatgctc aacaagggta atcatggcgt tacaagtaat 1860
ctcattcctc aggcagtgtc atccttgctc cccagctcaa gtggttttgt agcttcaggc 1920
tccaatctta gtagcaatgc tgtgctcatg cccgtatctg ccatgccatc atcagttttg 1980
cagcctgctc cagccgtctc tggtgccaat tttcccatct tgcacaatct atctgccaat 2040
gcaaatgatg gctatacgga aaaaaacgta cttcttgatc tggcgaaccg tgcaatggaa 2100
gagttcttta gtctaatgaa ggagaatgag tctcttcttg tcaaaaaaaa ggagaatggg 2160
cctctctggc tcccacacat ggatattctg ggagtcgaat cacttaacta ccaggaatac 2220
cttgcaaaat ccaggacgat tggacaaaaa cctgttgact tcaaagtggt cgtcaccagg 2280
gacactgcca ttgtcaatgg tagctgtgtt gacctcgtca aaagcctttt ggatgctaac 2340
cgctggagag agttgtttcc aggcatcgtg gcaagtgcaa acaccaccaa gatcatctct 2400
actgggccct ctaacttgca cgacgggttg cttcaattga tgcgtgcaga gctccaggta 2460
atgtcacctg aagtcccagt ttgcgatgtg acattcttga ggcagagtgt gcagtttgga 2520
agtggactgt ggtgtgtggt tgatgtgtct attgatacca tccttcctgg agagagtaaa 2580
acagctcagt ccagtgtgca gaccagcagt acagctgcca gacgcatgga agtcaggctg 2640
ttgccatcag gctgtgttat tgaagaaatg gagaatggct attccaaggt gacctggatg 2700
gtgcatgcag cttatgatga gagagcagtg ccagtgcttt atcattcact tctccgctct 2760
gcaaaagccc ttggtgcgtg ccgctgggta gcatcactcc agagacacag ccagttcctt 2820
tccggcctgc acaaatacat cttttgtcct gacagcacaa tgacagaagt ggtgatgcga 2880
agaaaagtcc tgtacctggt gaagcagatg acgagcagct tcacaggcct atttgcgtcg 2940
atgtctaagg ccacgctgca agatggtgat gatactcact tcgcgcatca gatagttggt 3000
ggtgcaacag gtgaacctgc cggactgctg ctgagcgcca ccacaaccat atggctcccc 3060
ggcgtgaacc cgaggcacgt gtatgaccac ctgcgtgatg agcagtgcca tggtgaatgg 3120
cgctgcctcc tcggtgagca gctgcatcag ggcaatgcct tgccgtatgg tgcccccctg 3180
aatggtgaga ccgtgccaga gttctatcgc atggtgaacg ggctgcatga agggcatgct 3240
atctccctga tcagccccag agaaatgggt ggtaacataa gcaacactct gctcctgcaa 3300
gaggcaagaa ctgatctttc tggctccctc atagtttacg ccaggacaga tgtgaacacc 3360
gtgcattcca tcatgaacag tggcctcaac cctgccaccg tcttcctcgt atcctctgga 3420
tgtgccattc ttcctgattg cctggaatca ttccctctac acccagctgc aactgcagat 3480
caggccggca cctccagtgc cgctatcgct agcaggagcg aaaccggtgg gtcattcgtc 3540
accgtcactt accagatgtt tttcagcagc caaggtggcg cagcacctgc cagctcatca 3600
attcatcaag gccgtgatgc gctcaagaaa gccaccgaca ttttcaaggt ggtcctcgac 3660
actctcaccg tggcatagcg caatacccca ggggtagcat ttgcatgcga aagacccagc 3720
tttcttgtac aaagtggtga tatcacaagc ccgggcggtc ttctagggat aacagggtaa 3780
ttatatccct ctagatcaca agcccgggcg gtcttctacg atgattgagt aataatgtgt 3840
cacgcatcac catgggtggc agtgtcagtg tgagcaatga cctgaatgaa caattgaaat 3900
gaaaagaaaa aaagtactcc atctgttcca aattaaaatt cattttaacc ttttaatagg 3960
tttatacaat aattgatata tgttttctgt atatgtctaa tttgttatca tcc 4013
<210> 567
<211> 55
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm15035
<400> 567
ggggacaagt ttgtacaaaa aagcaggctt aaacaatgaa cggcgagctt aaact 55
<210> 568
<211> 49
<212> DNA
<213> Artificial sequence
<220>
<223> primer: prm15036
<400> 568
ggggaccact ttgtacaaga aagctgggtc tttcgcatgc aaatgctac 49
Claims (21)
- 서열번호 385로 표시된 HD8-유사 폴리펩티드를 코딩하는 핵산을 식물에 도입하여 과발현하는 단계를 포함하는 대조구 식물에 비하여 식물의 수확량 관련 형질을 향상시키는 방법.
- 제1항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 수확량을 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 향상된 수확량 관련 형질은 대조구 식물에 비하여 증가된 종자 수확량을 포함하는 것을 특징으로 하는 방법.
- 제1항에 있어서, 상기 향상된 수확량 관련 형질은 스트레스가 없는 조건 하에서 얻어지는 것을 특징으로 하는 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항 내지 제4항 중 어느 한 항에 있어서, 상기 핵산은 뿌리 특이적 프로모터에 작동 가능하게 연결된 것을 특징으로 하는 방법.
- 서열번호 385로 표시된 HD8-유사 폴리펩티드를 코딩하는 재조합 핵산을 포함하는 것을 특징으로 하는, 제1항의 방법에 의해 수득 가능한 종자를 포함하는 대조구 식물에 비하여 수확량 관련 형질이 향상된 식물, 식물체의 일부 또는 식물 세포.
- 삭제
- 삭제
- 삭제
- (i) 서열번호 385로 표시된 HD8-유사 폴리펩티드를 코딩하는 핵산;
(ii) (i)의 핵산 서열의 발현을 유도할 수 있는 하나 이상의 조절 서열; 및 선택적으로
(iii) 전사 종결 서열을 포함하는 유전자 구축물 (construct)로 형질전환되어 대조구 식물에 비하여 수확량 관련 형질이 향상된 식물, 식물의 일부 또는 식물 세포. - 하기 단계를 포함하는, 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 형질전환 식물의 제조 방법:
(i) 서열번호 385로 표시된 HD8-유사 폴리펩티드를 코딩하는 핵산을 식물 세포 또는 식물에 도입하여 과발현하는 단계; 및
(ii) 식물의 생장 및 발달을 촉진하는 조건 하에서 상기 식물 세포 또는 식물을 배양하는 단계. - 서열번호 385로 표시된 HD8-유사 폴리펩티드를 코딩하는 핵산의 과발현으로 인하여, 대조구 식물에 비하여 향상된 수확량 관련 형질을 갖는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
- 제11항, 제15항 또는 제17항 중 어느 한 항에 있어서, 상기 식물은 비트, 사탕무 또는 알팔파와 같은 작물; 또는 사탕수수와 같은 단자엽 식물; 또는 벼, 옥수수, 밀, 보리, 기장, 호맥 (rye), 라이밀 (triticale), 수수 (sorghum), 에머밀 (emmer), 스펠트밀 (spelt), 호밀 (secale), 외알밀 (소맥, einkorn), 테프 (teff), 마일로 (milo) 또는 귀리 같은 곡물인 것을 특징으로 하는 형질전환 식물, 또는 상기 형질전환 식물로부터 유래된 형질전환 식물 세포.
- 수확 가능한 부분이 줄기 생물량 또는 종자인 것을 특징으로 하는, 제18항에 따른 식물의 수확 가능한 부분.
- 제18항에 따른 식물 유래의 산물.
- 삭제
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US35842810P | 2010-06-25 | 2010-06-25 | |
US61/358,428 | 2010-06-25 | ||
US41196710P | 2010-11-10 | 2010-11-10 | |
US61/411,967 | 2010-11-10 | ||
PCT/IB2011/052702 WO2011161620A1 (en) | 2010-06-25 | 2011-06-21 | Plants with enhanced yield-related traits and producing method thereof |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137001897A Division KR101429468B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130028984A KR20130028984A (ko) | 2013-03-20 |
KR101429476B1 true KR101429476B1 (ko) | 2014-08-22 |
Family
ID=45370918
Family Applications (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137005300A KR101429476B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137005298A KR101429473B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137001897A KR101429468B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137005294A KR101429469B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137005299A KR101429475B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
Family Applications After (4)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137005298A KR101429473B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137001897A KR101429468B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137005294A KR101429469B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
KR1020137005299A KR101429475B1 (ko) | 2010-06-25 | 2011-06-21 | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 |
Country Status (10)
Country | Link |
---|---|
US (1) | US20130139280A1 (ko) |
EP (1) | EP2585597A4 (ko) |
KR (5) | KR101429476B1 (ko) |
CN (1) | CN103119167A (ko) |
AU (1) | AU2011268562A1 (ko) |
BR (1) | BR112012032673A2 (ko) |
CA (1) | CA2801688A1 (ko) |
DE (1) | DE112011102151T5 (ko) |
MX (1) | MX2012015038A (ko) |
WO (1) | WO2011161620A1 (ko) |
Families Citing this family (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR101791584B1 (ko) * | 2016-04-22 | 2017-11-01 | 대한민국 | 향상된 수확량과 관련된 형질을 가지는 형질전환 식물체 및 이의 제조방법 |
US10301640B2 (en) | 2016-10-31 | 2019-05-28 | Benson Hill Biosystems, Inc. | Increasing plant growth and yield by using an ERF transcription factor sequence |
WO2019172282A1 (ja) * | 2018-03-05 | 2019-09-12 | 国立研究開発法人産業技術総合研究所 | 受精を介さず種子植物の胚乳発生を誘導する核酸分子及びベクター、並びに受精を介さず胚乳を発生しうる組換え種子植物及びその作製方法 |
CN108588090B (zh) * | 2018-06-19 | 2020-08-28 | 江苏省农业科学院 | 桃转录因子PpERF.A16基因、蛋白、其重组表达载体及应用 |
CN114316004B (zh) * | 2020-09-30 | 2024-03-22 | 中国科学院遗传与发育生物学研究所 | 大豆茸毛稠密相关蛋白及其编码基因和应用 |
CN113150094B (zh) * | 2021-04-14 | 2022-04-12 | 西南大学 | 枇杷花发育相关的EjAP2L基因及其编码蛋白与应用 |
US20230078124A1 (en) * | 2021-08-11 | 2023-03-16 | New York University | Compositions and methods for improving plant nitrogen utilization efficiency (nue) and increasing plant biomass |
WO2023154887A1 (en) | 2022-02-11 | 2023-08-17 | Northeast Agricultural University | Methods and compositions for increasing protein and/or oil content and modifying oil profile in a plant |
CN115820689B (zh) * | 2022-11-30 | 2023-12-05 | 上海市农业科学院 | 一种多基因串联法提高蔬菜中nmn含量的方法及其应用 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060101541A1 (en) | 1999-07-20 | 2006-05-11 | Stanislaw Flasinski | RCc3 regulatory elements for use in plants |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4962028A (en) | 1986-07-09 | 1990-10-09 | Dna Plant Technology Corporation | Plant promotors |
US5116742A (en) | 1986-12-03 | 1992-05-26 | University Patents, Inc. | RNA ribozyme restriction endoribonucleases and methods |
US5004863B2 (en) | 1986-12-03 | 2000-10-17 | Agracetus | Genetic engineering of cotton plants and lines |
US4987071A (en) | 1986-12-03 | 1991-01-22 | University Patents, Inc. | RNA ribozyme polymerases, dephosphorylases, restriction endoribonucleases and methods |
WO1989012102A1 (en) | 1988-06-01 | 1989-12-14 | The Texas A&M University System | Method for transforming plants via the shoot apex |
AU4115693A (en) | 1992-04-24 | 1993-11-29 | Sri International | In vivo homologous sequence targeting in eukaryotic cells |
PT652705E (pt) | 1992-06-29 | 2006-05-31 | Gene Shears Pty Ltd | Acidos nucleicos e metodos para a sua utilizacao para combater patogenios virais |
US5401836A (en) | 1992-07-16 | 1995-03-28 | Pioneer Hi-Bre International, Inc. | Brassica regulatory sequence for root-specific or root-abundant gene expression |
WO1994012015A1 (en) | 1992-11-30 | 1994-06-09 | Chua Nam Hai | Expression motifs that confer tissue- and developmental-specific expression in plants |
WO1995003404A1 (en) | 1993-07-22 | 1995-02-02 | Gene Shears Pty Limited | Dna virus ribozymes |
JP3347736B2 (ja) | 1993-11-19 | 2002-11-20 | バイオテクノロジー・リサーチ・アンド・デイベロツプメント・コーポレイシヨン | 植物中で遺伝子を発現させるためのキメラ調節領域及び遺伝子カセット |
NZ278490A (en) | 1993-12-09 | 1998-03-25 | Univ Jefferson | Chimeric polynucleotide with both ribo- and deoxyribonucleotides in one strand and deoxyribonucleotides in a second strand |
US5605793A (en) | 1994-02-17 | 1997-02-25 | Affymax Technologies N.V. | Methods for in vitro recombination |
US6395547B1 (en) | 1994-02-17 | 2002-05-28 | Maxygen, Inc. | Methods for generating polynucleotides having desired characteristics by iterative selection and recombination |
AU718082B2 (en) | 1995-10-06 | 2000-04-06 | Plant Genetic Systems N.V. | Seed shattering |
US7390937B2 (en) | 1996-02-14 | 2008-06-24 | The Governors Of The University Of Alberta | Plants with enhanced levels of nitrogen utilization proteins in their root epidermis and uses thereof |
GB9607517D0 (en) | 1996-04-11 | 1996-06-12 | Gene Shears Pty Ltd | The use of DNA Sequences |
GB9703146D0 (en) | 1997-02-14 | 1997-04-02 | Innes John Centre Innov Ltd | Methods and means for gene silencing in transgenic plants |
GB9710475D0 (en) | 1997-05-21 | 1997-07-16 | Zeneca Ltd | Gene silencing |
GB9720148D0 (en) | 1997-09-22 | 1997-11-26 | Innes John Centre Innov Ltd | Gene silencing materials and methods |
EP2267139B1 (en) | 1998-04-08 | 2017-03-22 | Commonwealth Scientific and Industrial Research Organisation | Methods and means for obtaining modified phenotypes |
TR200100705T2 (tr) | 1998-06-26 | 2001-10-22 | Iowa State University Research Foundation, Inc. | Bitkilerde enzim ve asetil'in değiştirilmesi için yöntemler. |
US6555732B1 (en) | 1998-09-14 | 2003-04-29 | Pioneer Hi-Bred International, Inc. | Rac-like genes and methods of use |
DE69942750D1 (de) | 1999-07-22 | 2010-10-21 | Nat Inst Agrobio Res | Verfahren zur superschnellen transformation von monokotyledonen |
MXPA02001786A (es) | 1999-08-26 | 2003-07-14 | Basf Plant Science Gmbh | Expresion genica en plantas bajo el control de los promotores u-atpasa de plantas, constitutivos. |
AU2002227263A1 (en) * | 2000-11-10 | 2002-05-21 | Michigan State University | A selectable genetic marker for use in pasteurellaceae species |
CA2442587A1 (en) * | 2001-03-28 | 2002-10-10 | Montserrat Pages | Method for improving plant tolerance to environmental stress |
AU2002341542A1 (en) | 2001-06-22 | 2003-03-03 | Syngenta Participations Ag | Transcription factors of cereals |
DE602004004070T2 (de) | 2003-01-21 | 2007-08-16 | Cropdesign N.V. | Verwendung der regulatorischen sequenz des gos2-gens aus reis für die genexpression in dikotyledonen pflanzen oder pflanzenzellen |
CN102586252B (zh) | 2003-02-04 | 2014-09-24 | 作物培植股份有限公司 | 稻启动子 |
PL2281895T3 (pl) * | 2003-09-29 | 2018-07-31 | Monsanto Technology, Llc | Sposoby zwiększania tolerancji na stres u roślin i kompozycje |
US7569389B2 (en) * | 2004-09-30 | 2009-08-04 | Ceres, Inc. | Nucleotide sequences and polypeptides encoded thereby useful for modifying plant characteristics |
AU2005231933A1 (en) | 2004-04-06 | 2005-10-20 | Metanomics Gmbh | Process for the production of fine chemicals |
AU2005284138B2 (en) | 2004-09-16 | 2012-05-31 | Cropdesign N.V. | Root evaluation |
EP1820391A1 (en) | 2006-02-17 | 2007-08-22 | CropDesign N.V. | Method and apparatus to determine the start of flowering in plants |
AU2008209677B2 (en) * | 2007-01-31 | 2013-05-23 | Basf Plant Science Gmbh | Plants having enhanced yield-related traits and/or increased abiotic stress resistance, and a method for making the same |
MX2010002746A (es) * | 2007-10-02 | 2010-06-01 | Bayer Cropscience Ag | Procedimientos para mejorar el crecimiento de las plantas. |
CN101874116B (zh) * | 2007-11-22 | 2014-02-26 | 克罗普迪塞恩股份有限公司 | 具有增强的产量相关性状的植物及其生产方法 |
CN103951741A (zh) * | 2007-11-26 | 2014-07-30 | 巴斯夫植物科学有限公司 | 具有增强的产量相关性状的植物及其制备方法 |
CN101457234A (zh) * | 2007-12-14 | 2009-06-17 | 中国科学院遗传与发育生物学研究所 | 一种提高植物产量的方法及其表达盒 |
AR074252A1 (es) | 2008-09-16 | 2011-01-05 | Basf Plant Science Gmbh | Metodo para analizar el impacto de las modificaciones geneticas en plantas y seleccionar una planta con una modificacion genetica de interes |
TWI489942B (zh) * | 2008-12-19 | 2015-07-01 | Bayer Cropscience Ag | 活性化合物組合物 |
CN102439032B (zh) * | 2009-05-04 | 2015-07-22 | 先锋国际良种公司 | 通过调节ap2转录因子增加植物中的产量 |
CN101619096B (zh) * | 2009-07-31 | 2012-08-22 | 中国科学院遗传与发育生物学研究所 | 一种植物耐逆性相关蛋白及其编码基因与应用 |
-
2011
- 2011-06-21 KR KR1020137005300A patent/KR101429476B1/ko not_active IP Right Cessation
- 2011-06-21 DE DE112011102151T patent/DE112011102151T5/de not_active Withdrawn
- 2011-06-21 CA CA2801688A patent/CA2801688A1/en not_active Abandoned
- 2011-06-21 BR BR112012032673A patent/BR112012032673A2/pt not_active IP Right Cessation
- 2011-06-21 WO PCT/IB2011/052702 patent/WO2011161620A1/en active Application Filing
- 2011-06-21 KR KR1020137005298A patent/KR101429473B1/ko not_active IP Right Cessation
- 2011-06-21 MX MX2012015038A patent/MX2012015038A/es not_active Application Discontinuation
- 2011-06-21 KR KR1020137001897A patent/KR101429468B1/ko not_active IP Right Cessation
- 2011-06-21 KR KR1020137005294A patent/KR101429469B1/ko not_active IP Right Cessation
- 2011-06-21 EP EP11797710.8A patent/EP2585597A4/en not_active Withdrawn
- 2011-06-21 US US13/806,501 patent/US20130139280A1/en not_active Abandoned
- 2011-06-21 CN CN2011800403149A patent/CN103119167A/zh active Pending
- 2011-06-21 KR KR1020137005299A patent/KR101429475B1/ko not_active IP Right Cessation
- 2011-06-21 AU AU2011268562A patent/AU2011268562A1/en not_active Abandoned
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060101541A1 (en) | 1999-07-20 | 2006-05-11 | Stanislaw Flasinski | RCc3 regulatory elements for use in plants |
Non-Patent Citations (1)
Title |
---|
NCBI의 database accession NM_001068000.1 GI:115475737(2010.06.08.) * |
Also Published As
Publication number | Publication date |
---|---|
AU2011268562A1 (en) | 2013-01-10 |
EP2585597A4 (en) | 2013-12-18 |
KR101429469B1 (ko) | 2014-08-22 |
KR20130039342A (ko) | 2013-04-19 |
KR101429473B1 (ko) | 2014-08-22 |
CN103119167A (zh) | 2013-05-22 |
DE112011102151T5 (de) | 2013-07-11 |
BR112012032673A2 (pt) | 2015-09-08 |
KR101429475B1 (ko) | 2014-08-22 |
KR20130026512A (ko) | 2013-03-13 |
AU2011268562A2 (en) | 2013-03-07 |
KR20130028984A (ko) | 2013-03-20 |
CA2801688A1 (en) | 2011-12-29 |
EP2585597A1 (en) | 2013-05-01 |
KR20130035268A (ko) | 2013-04-08 |
WO2011161620A1 (en) | 2011-12-29 |
KR101429468B1 (ko) | 2014-08-27 |
US20130139280A1 (en) | 2013-05-30 |
KR20130028983A (ko) | 2013-03-20 |
MX2012015038A (es) | 2013-06-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101662483B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101647732B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101842489B (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
CN101495640B (zh) | 具有增强的产量相关性状的伸展蛋白受体样激酶受调节表达的植物和用于产生该植物的方法 | |
KR101255415B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR101429476B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101365786B (zh) | 具有改良的生长特征的植物及其生产方法 | |
KR101754083B1 (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
KR20120126061A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101952441B (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN102027120A (zh) | 具有增强的产量相关性状的植物和用于制备该植物的方法 | |
CN101583720A (zh) | 具有增强的产量相关性状的植物和用于产生该植物的方法 | |
BRPI0718977A2 (pt) | Método para aumentar rendimento de sementes em plantas em relação às plantas de controle, construção, uso da mesma, planta, parte de planta ou célula de planta, método para a produção de uma planta transgênica tendo redimento aumentado de sementes em relação às plantas de controle, planta transgênica, partes colhíveis de uma planta, produtos, e, uso de um ácido nucleico | |
CN101868544A (zh) | 具有提高的产量相关性状的植物和用于制备该植物的方法 | |
CN101883783A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101563461A (zh) | 具有改良特征的植物及其制备方法 | |
CN101605902A (zh) | 具有增强的产量相关性状和/或提高的非生物胁迫抗性的植物和制备该植物的方法 | |
CN101351556B (zh) | 具有改良生长特性的植物及其制备方法 | |
CN101969759A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
KR20090119884A (ko) | 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
CN101778942A (zh) | 产率相关性状增强的植物及制备其的方法 | |
CN101668859A (zh) | 具有增强的产量相关性状的植物及其制备方法 | |
CN101541970A (zh) | 包含作为转基因的a类itcp或clavata1(clv1)或cah3多肽、具有增加的种子产量的转基因植物以及用于制备该植物的方法 | |
KR101261985B1 (ko) | Nac 전사인자의 발현 조절로 향상된 수확량 관련 형질을 갖는 식물 및 이의 제조 방법 | |
BRPI0619242A2 (pt) | proteìna, métodos para aumentar produção de semente e/ou aumentar taxa de crescimento de plantas e taxa de crescimento, célula vegetal, construção, e, métodos para produzir uma planta transgenica, para melhorar caracterìsticas de crescimento de plantas e caracterìsticas de crescimento em relação a correspondentes plantas do tipo selvagem, para aumentar produção vegetal, número de sementes em plantas e produção de semente em plantas |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
LAPS | Lapse due to unpaid annual fee |