KR102574882B1 - 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 - Google Patents
대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR102574882B1 KR102574882B1 KR1020217033419A KR20217033419A KR102574882B1 KR 102574882 B1 KR102574882 B1 KR 102574882B1 KR 1020217033419 A KR1020217033419 A KR 1020217033419A KR 20217033419 A KR20217033419 A KR 20217033419A KR 102574882 B1 KR102574882 B1 KR 102574882B1
- Authority
- KR
- South Korea
- Prior art keywords
- antigen
- coli
- amino acid
- polysaccharide
- seq
- Prior art date
Links
- 150000004676 glycans Chemical class 0.000 title claims abstract description 552
- 229920001282 polysaccharide Polymers 0.000 title claims abstract description 528
- 239000005017 polysaccharide Substances 0.000 title claims abstract description 528
- 239000000427 antigen Substances 0.000 title claims abstract description 502
- 241000588724 Escherichia coli Species 0.000 title claims abstract description 428
- 238000000034 method Methods 0.000 title claims abstract description 102
- 239000000203 mixture Substances 0.000 title abstract description 164
- 102000014914 Carrier Proteins Human genes 0.000 claims abstract description 251
- 108010078791 Carrier Proteins Proteins 0.000 claims abstract description 251
- 108010089072 Dolichyl-diphosphooligosaccharide-protein glycotransferase Proteins 0.000 claims abstract description 77
- 238000004519 manufacturing process Methods 0.000 claims abstract description 72
- 108091007433 antigens Proteins 0.000 claims description 240
- 102000036639 antigens Human genes 0.000 claims description 240
- 101000702917 Salmonella typhimurium (strain LT2 / SGSC1412 / ATCC 700720) CDP-abequose synthase Proteins 0.000 claims description 140
- 150000001413 amino acids Chemical class 0.000 claims description 132
- 230000035772 mutation Effects 0.000 claims description 129
- 108090000623 proteins and genes Proteins 0.000 claims description 122
- 230000013595 glycosylation Effects 0.000 claims description 110
- 238000006206 glycosylation reaction Methods 0.000 claims description 110
- 125000003275 alpha amino acid group Chemical group 0.000 claims description 105
- 230000000890 antigenic effect Effects 0.000 claims description 102
- 102000004169 proteins and genes Human genes 0.000 claims description 86
- 239000002773 nucleotide Substances 0.000 claims description 76
- 125000003729 nucleotide group Chemical group 0.000 claims description 69
- WQZGKKKJIJFFOK-GASJEMHNSA-N Glucose Natural products OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-GASJEMHNSA-N 0.000 claims description 60
- 108091008053 gene clusters Proteins 0.000 claims description 50
- 108010055629 Glucosyltransferases Proteins 0.000 claims description 47
- 102000000340 Glucosyltransferases Human genes 0.000 claims description 47
- 108091035707 Consensus sequence Proteins 0.000 claims description 46
- 239000008103 glucose Substances 0.000 claims description 44
- 102000009016 Cholera Toxin Human genes 0.000 claims description 40
- 108010049048 Cholera Toxin Proteins 0.000 claims description 40
- 102220319964 rs201657576 Human genes 0.000 claims description 36
- 102200067350 rs118203990 Human genes 0.000 claims description 35
- 102000051366 Glycosyltransferases Human genes 0.000 claims description 34
- 108700023372 Glycosyltransferases Proteins 0.000 claims description 34
- FWMNVWWHGCHHJJ-SKKKGAJSSA-N 4-amino-1-[(2r)-6-amino-2-[[(2r)-2-[[(2r)-2-[[(2r)-2-amino-3-phenylpropanoyl]amino]-3-phenylpropanoyl]amino]-4-methylpentanoyl]amino]hexanoyl]piperidine-4-carboxylic acid Chemical compound C([C@H](C(=O)N[C@H](CC(C)C)C(=O)N[C@H](CCCCN)C(=O)N1CCC(N)(CC1)C(O)=O)NC(=O)[C@H](N)CC=1C=CC=CC=1)C1=CC=CC=C1 FWMNVWWHGCHHJJ-SKKKGAJSSA-N 0.000 claims description 27
- 101710175625 Maltose/maltodextrin-binding periplasmic protein Proteins 0.000 claims description 22
- 101710146739 Enterotoxin Proteins 0.000 claims description 21
- 101710082714 Exotoxin A Proteins 0.000 claims description 21
- 239000000147 enterotoxin Substances 0.000 claims description 21
- 231100000655 enterotoxin Toxicity 0.000 claims description 21
- 108010045069 keyhole-limpet hemocyanin Proteins 0.000 claims description 20
- 102200089579 rs786202787 Human genes 0.000 claims description 15
- 241001646716 Escherichia coli K-12 Species 0.000 claims description 14
- BNAIICFZMLQZKW-CYAIWNQHSA-N (6e,10e,14e,18e,22e,26e,30e,34e,38e)-3,7,11,15,19,23,27,31,35,39,43-undecamethyltetratetraconta-6,10,14,18,22,26,30,34,38,42-decaen-1-ol Chemical compound OCCC(C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CC\C=C(/C)CCC=C(C)C BNAIICFZMLQZKW-CYAIWNQHSA-N 0.000 claims description 13
- 108010071134 CRM197 (non-toxic variant of diphtheria toxin) Proteins 0.000 claims description 13
- 108010039209 Blood Coagulation Factors Proteins 0.000 claims description 10
- 102000015081 Blood Coagulation Factors Human genes 0.000 claims description 10
- 101710113946 Clotting factor B Proteins 0.000 claims description 10
- 102100037840 Dehydrogenase/reductase SDR family member 2, mitochondrial Human genes 0.000 claims description 10
- 101000597577 Gluconacetobacter diazotrophicus (strain ATCC 49037 / DSM 5601 / CCUG 37298 / CIP 103539 / LMG 7603 / PAl5) Outer membrane protein Proteins 0.000 claims description 10
- 241000606768 Haemophilus influenzae Species 0.000 claims description 10
- 101710147195 Hemolysin A Proteins 0.000 claims description 10
- 101710116435 Outer membrane protein Proteins 0.000 claims description 10
- 101710188053 Protein D Proteins 0.000 claims description 10
- 101710132893 Resolvase Proteins 0.000 claims description 10
- 239000003114 blood coagulation factor Substances 0.000 claims description 10
- 229960003983 diphtheria toxoid Drugs 0.000 claims description 10
- 229940047650 haemophilus influenzae Drugs 0.000 claims description 10
- 239000000126 substance Substances 0.000 claims description 10
- 101900032831 Streptococcus pneumoniae Pneumolysin Proteins 0.000 claims description 9
- 125000003795 bactoprenol group Chemical group 0.000 claims description 9
- 238000012258 culturing Methods 0.000 claims description 9
- 229960000814 tetanus toxoid Drugs 0.000 claims description 9
- 101900161471 Pseudomonas aeruginosa Exotoxin A Proteins 0.000 claims description 8
- 241000588650 Neisseria meningitidis Species 0.000 claims description 5
- 101900251156 Escherichia coli Flagellin Proteins 0.000 claims description 3
- 241000193998 Streptococcus pneumoniae Species 0.000 claims description 3
- 229940031000 streptococcus pneumoniae Drugs 0.000 claims description 3
- 238000010188 recombinant method Methods 0.000 claims description 2
- 101710183389 Pneumolysin Proteins 0.000 claims 1
- 230000001717 pathogenic effect Effects 0.000 abstract description 11
- 210000004027 cell Anatomy 0.000 description 261
- 102100039364 Metalloproteinase inhibitor 1 Human genes 0.000 description 119
- 235000001014 amino acid Nutrition 0.000 description 114
- 229940024606 amino acid Drugs 0.000 description 110
- 235000018102 proteins Nutrition 0.000 description 81
- 150000007523 nucleic acids Chemical class 0.000 description 66
- 108020004707 nucleic acids Proteins 0.000 description 55
- 102000039446 nucleic acids Human genes 0.000 description 55
- 229960005486 vaccine Drugs 0.000 description 54
- WQZGKKKJIJFFOK-VFUOTHLCSA-N beta-D-glucose Chemical compound OC[C@H]1O[C@@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-VFUOTHLCSA-N 0.000 description 39
- 238000002255 vaccination Methods 0.000 description 39
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 31
- 101100338058 Pseudomonas aeruginosa (strain ATCC 15692 / DSM 22644 / CIP 104116 / JCM 14847 / LMG 12228 / 1C / PRS 101 / PAO1) gtrS gene Proteins 0.000 description 30
- 102000004190 Enzymes Human genes 0.000 description 27
- 108090000790 Enzymes Proteins 0.000 description 27
- 241000283973 Oryctolagus cuniculus Species 0.000 description 26
- 230000002163 immunogen Effects 0.000 description 26
- 101150052803 gtrS gene Proteins 0.000 description 25
- 238000003556 assay Methods 0.000 description 23
- 239000011780 sodium chloride Substances 0.000 description 23
- 239000002671 adjuvant Substances 0.000 description 21
- 238000004458 analytical method Methods 0.000 description 21
- 239000002158 endotoxin Substances 0.000 description 21
- 230000003053 immunization Effects 0.000 description 21
- 208000019206 urinary tract infection Diseases 0.000 description 21
- 238000002965 ELISA Methods 0.000 description 20
- 238000002649 immunization Methods 0.000 description 20
- 230000005847 immunogenicity Effects 0.000 description 20
- 229940027941 immunoglobulin g Drugs 0.000 description 20
- 229920006008 lipopolysaccharide Polymers 0.000 description 20
- 230000005875 antibody response Effects 0.000 description 19
- 230000028993 immune response Effects 0.000 description 18
- 239000013612 plasmid Substances 0.000 description 17
- 101150094414 gtrA gene Proteins 0.000 description 16
- 101150035941 gtrB gene Proteins 0.000 description 16
- 238000003018 immunoassay Methods 0.000 description 15
- 229940124950 Prevnar 13 Drugs 0.000 description 14
- 230000004048 modification Effects 0.000 description 14
- 238000012986 modification Methods 0.000 description 14
- 239000000047 product Substances 0.000 description 14
- 241001465754 Metazoa Species 0.000 description 13
- 108091028043 Nucleic acid sequence Proteins 0.000 description 13
- 210000002966 serum Anatomy 0.000 description 13
- 208000031729 Bacteremia Diseases 0.000 description 12
- 238000013459 approach Methods 0.000 description 12
- 230000000694 effects Effects 0.000 description 12
- 208000015181 infectious disease Diseases 0.000 description 12
- 238000007918 intramuscular administration Methods 0.000 description 12
- 230000002147 killing effect Effects 0.000 description 12
- SHZGCJCMOBCMKK-UHFFFAOYSA-N D-mannomethylose Natural products CC1OC(O)C(O)C(O)C1O SHZGCJCMOBCMKK-UHFFFAOYSA-N 0.000 description 11
- 238000013461 design Methods 0.000 description 11
- 230000036541 health Effects 0.000 description 11
- 241000589875 Campylobacter jejuni Species 0.000 description 10
- 241001302584 Escherichia coli str. K-12 substr. W3110 Species 0.000 description 10
- 108010040721 Flagellin Proteins 0.000 description 10
- 238000002474 experimental method Methods 0.000 description 10
- 241000205834 Escherichia coli O16 Species 0.000 description 9
- PNNNRSAQSRJVSB-UHFFFAOYSA-N L-rhamnose Natural products CC(O)C(O)C(O)C(O)C=O PNNNRSAQSRJVSB-UHFFFAOYSA-N 0.000 description 9
- 241000700159 Rattus Species 0.000 description 9
- 230000015572 biosynthetic process Effects 0.000 description 9
- 201000010099 disease Diseases 0.000 description 9
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 238000001727 in vivo Methods 0.000 description 9
- 235000000346 sugar Nutrition 0.000 description 9
- 238000012546 transfer Methods 0.000 description 9
- 241000282412 Homo Species 0.000 description 8
- 230000003115 biocidal effect Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 8
- 230000002068 genetic effect Effects 0.000 description 8
- 230000001965 increasing effect Effects 0.000 description 8
- 229920001542 oligosaccharide Polymers 0.000 description 8
- 150000002482 oligosaccharides Chemical class 0.000 description 8
- 238000000746 purification Methods 0.000 description 8
- 101150057996 rfaL gene Proteins 0.000 description 8
- 238000012360 testing method Methods 0.000 description 8
- 108010060123 Conjugate Vaccines Proteins 0.000 description 7
- 241001455504 Escherichia coli O2 Species 0.000 description 7
- SHZGCJCMOBCMKK-JFNONXLTSA-N L-rhamnopyranose Chemical group C[C@@H]1OC(O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-JFNONXLTSA-N 0.000 description 7
- OVRNDRQMDRJTHS-UHFFFAOYSA-N N-acelyl-D-glucosamine Natural products CC(=O)NC1C(O)OC(CO)C(O)C1O OVRNDRQMDRJTHS-UHFFFAOYSA-N 0.000 description 7
- MBLBDJOUHNCFQT-LXGUWJNJSA-N N-acetylglucosamine Natural products CC(=O)N[C@@H](C=O)[C@@H](O)[C@H](O)[C@H](O)CO MBLBDJOUHNCFQT-LXGUWJNJSA-N 0.000 description 7
- 230000001580 bacterial effect Effects 0.000 description 7
- 229940031670 conjugate vaccine Drugs 0.000 description 7
- 108700014210 glycosyltransferase activity proteins Proteins 0.000 description 7
- 230000001976 improved effect Effects 0.000 description 7
- 239000007924 injection Substances 0.000 description 7
- 238000002347 injection Methods 0.000 description 7
- 239000007927 intramuscular injection Substances 0.000 description 7
- GZQKNULLWNGMCW-PWQABINMSA-N lipid A (E. coli) Chemical compound O1[C@H](CO)[C@@H](OP(O)(O)=O)[C@H](OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)[C@@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@@H]1OC[C@@H]1[C@@H](O)[C@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OP(O)(O)=O)O1 GZQKNULLWNGMCW-PWQABINMSA-N 0.000 description 7
- 150000002632 lipids Chemical class 0.000 description 7
- 230000000625 opsonophagocytic effect Effects 0.000 description 7
- 239000000902 placebo Substances 0.000 description 7
- 229940068196 placebo Drugs 0.000 description 7
- 150000004804 polysaccharides Polymers 0.000 description 7
- 238000012552 review Methods 0.000 description 7
- 101710199218 Bactoprenol glucosyl transferase Proteins 0.000 description 6
- 101710198694 Bactoprenol-linked glucose translocase Proteins 0.000 description 6
- 241000059478 Escherichia coli O75 Species 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- OVRNDRQMDRJTHS-FMDGEEDCSA-N N-acetyl-beta-D-glucosamine Chemical compound CC(=O)N[C@H]1[C@H](O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-FMDGEEDCSA-N 0.000 description 6
- 230000004988 N-glycosylation Effects 0.000 description 6
- 206010040047 Sepsis Diseases 0.000 description 6
- SRBFZHDQGSBBOR-UHFFFAOYSA-N beta-D-Pyranose-Lyxose Natural products OC1COC(O)C(O)C1O SRBFZHDQGSBBOR-UHFFFAOYSA-N 0.000 description 6
- 210000004369 blood Anatomy 0.000 description 6
- 239000008280 blood Substances 0.000 description 6
- 150000001720 carbohydrates Chemical class 0.000 description 6
- 238000012217 deletion Methods 0.000 description 6
- 230000037430 deletion Effects 0.000 description 6
- 229940088679 drug related substance Drugs 0.000 description 6
- 238000009472 formulation Methods 0.000 description 6
- 229940035032 monophosphoryl lipid a Drugs 0.000 description 6
- 229950006780 n-acetylglucosamine Drugs 0.000 description 6
- 230000002516 postimmunization Effects 0.000 description 6
- 239000002243 precursor Substances 0.000 description 6
- 231100000279 safety data Toxicity 0.000 description 6
- 239000000243 solution Substances 0.000 description 6
- 241000894006 Bacteria Species 0.000 description 5
- 241000282693 Cercopithecidae Species 0.000 description 5
- 241001455523 Escherichia coli O15 Species 0.000 description 5
- 241000205840 Escherichia coli O8 Species 0.000 description 5
- 201000009906 Meningitis Diseases 0.000 description 5
- XOCCAGJZGBCJME-IANFNVNHSA-N N-Acetyl-D-fucosamine Chemical compound C[C@H]1OC(O)[C@H](NC(C)=O)[C@@H](O)[C@H]1O XOCCAGJZGBCJME-IANFNVNHSA-N 0.000 description 5
- 241000588653 Neisseria Species 0.000 description 5
- 108010076504 Protein Sorting Signals Proteins 0.000 description 5
- 241000589517 Pseudomonas aeruginosa Species 0.000 description 5
- 102000008233 Toll-Like Receptor 4 Human genes 0.000 description 5
- 108010060804 Toll-Like Receptor 4 Proteins 0.000 description 5
- 239000008186 active pharmaceutical agent Substances 0.000 description 5
- 125000000539 amino acid group Chemical group 0.000 description 5
- PYMYPHUHKUWMLA-UHFFFAOYSA-N arabinose Natural products OCC(O)C(O)C(O)C=O PYMYPHUHKUWMLA-UHFFFAOYSA-N 0.000 description 5
- 230000001851 biosynthetic effect Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 230000021615 conjugation Effects 0.000 description 5
- 238000012937 correction Methods 0.000 description 5
- 229940126534 drug product Drugs 0.000 description 5
- 239000012537 formulation buffer Substances 0.000 description 5
- 238000010353 genetic engineering Methods 0.000 description 5
- 230000001939 inductive effect Effects 0.000 description 5
- 210000001322 periplasm Anatomy 0.000 description 5
- 239000000825 pharmaceutical preparation Substances 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 238000006467 substitution reaction Methods 0.000 description 5
- 239000000758 substrate Substances 0.000 description 5
- 238000003786 synthesis reaction Methods 0.000 description 5
- 108090000344 1,4-alpha-Glucan Branching Enzyme Proteins 0.000 description 4
- 102000003925 1,4-alpha-Glucan Branching Enzyme Human genes 0.000 description 4
- 108091026890 Coding region Proteins 0.000 description 4
- DCXYFEDJOCDNAF-REOHCLBHSA-N L-asparagine Chemical compound OC(=O)[C@@H](N)CC(N)=O DCXYFEDJOCDNAF-REOHCLBHSA-N 0.000 description 4
- 241000124008 Mammalia Species 0.000 description 4
- 241000699666 Mus <mouse, genus> Species 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 239000000872 buffer Substances 0.000 description 4
- 229910052799 carbon Inorganic materials 0.000 description 4
- 150000001875 compounds Chemical class 0.000 description 4
- 230000000875 corresponding effect Effects 0.000 description 4
- 239000003937 drug carrier Substances 0.000 description 4
- 238000003205 genotyping method Methods 0.000 description 4
- 125000002791 glucosyl group Chemical group C1([C@H](O)[C@@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 4
- XKUKSGPZAADMRA-UHFFFAOYSA-N glycyl-glycyl-glycine Natural products NCC(=O)NCC(=O)NCC(O)=O XKUKSGPZAADMRA-UHFFFAOYSA-N 0.000 description 4
- BPHPUYQFMNQIOC-NXRLNHOXSA-N isopropyl beta-D-thiogalactopyranoside Chemical compound CC(C)S[C@@H]1O[C@H](CO)[C@H](O)[C@H](O)[C@H]1O BPHPUYQFMNQIOC-NXRLNHOXSA-N 0.000 description 4
- 230000000670 limiting effect Effects 0.000 description 4
- 230000007774 longterm Effects 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 150000002772 monosaccharides Chemical class 0.000 description 4
- 230000001662 opsonic effect Effects 0.000 description 4
- 238000005457 optimization Methods 0.000 description 4
- 230000000069 prophylactic effect Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- WQZGKKKJIJFFOK-QTVWNMPRSA-N D-mannopyranose Chemical compound OC[C@H]1OC(O)[C@@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-QTVWNMPRSA-N 0.000 description 3
- LFQSCWFLJHTTHZ-UHFFFAOYSA-N Ethanol Chemical compound CCO LFQSCWFLJHTTHZ-UHFFFAOYSA-N 0.000 description 3
- SRBFZHDQGSBBOR-HWQSCIPKSA-N L-arabinopyranose Chemical compound O[C@H]1COC(O)[C@H](O)[C@H]1O SRBFZHDQGSBBOR-HWQSCIPKSA-N 0.000 description 3
- 238000000585 Mann–Whitney U test Methods 0.000 description 3
- 101710204495 O-antigen ligase Proteins 0.000 description 3
- 229930006000 Sucrose Natural products 0.000 description 3
- CZMRCDWAGMRECN-UGDNZRGBSA-N Sucrose Chemical compound O[C@H]1[C@H](O)[C@@H](CO)O[C@@]1(CO)O[C@@H]1[C@H](O)[C@@H](O)[C@H](O)[C@@H](CO)O1 CZMRCDWAGMRECN-UGDNZRGBSA-N 0.000 description 3
- 230000003187 abdominal effect Effects 0.000 description 3
- 238000006640 acetylation reaction Methods 0.000 description 3
- 239000002253 acid Substances 0.000 description 3
- 230000002776 aggregation Effects 0.000 description 3
- 238000004220 aggregation Methods 0.000 description 3
- 239000000556 agonist Substances 0.000 description 3
- PYMYPHUHKUWMLA-WDCZJNDASA-N arabinose Chemical compound OC[C@@H](O)[C@@H](O)[C@H](O)C=O PYMYPHUHKUWMLA-WDCZJNDASA-N 0.000 description 3
- 208000037815 bloodstream infection Diseases 0.000 description 3
- 238000012512 characterization method Methods 0.000 description 3
- 238000011161 development Methods 0.000 description 3
- 206010013023 diphtheria Diseases 0.000 description 3
- 239000003814 drug Substances 0.000 description 3
- 229930182830 galactose Natural products 0.000 description 3
- 108010006664 gamma-glutamyl-glycyl-glycine Proteins 0.000 description 3
- 108010067216 glycyl-glycyl-glycine Proteins 0.000 description 3
- HNDVDQJCIGZPNO-UHFFFAOYSA-N histidine Natural products OC(=O)C(N)CC1=CN=CN1 HNDVDQJCIGZPNO-UHFFFAOYSA-N 0.000 description 3
- 230000006801 homologous recombination Effects 0.000 description 3
- 238000002744 homologous recombination Methods 0.000 description 3
- 230000001900 immune effect Effects 0.000 description 3
- 210000004201 immune sera Anatomy 0.000 description 3
- 229940042743 immune sera Drugs 0.000 description 3
- 238000010255 intramuscular injection Methods 0.000 description 3
- 238000002955 isolation Methods 0.000 description 3
- 239000012528 membrane Substances 0.000 description 3
- 239000013642 negative control Substances 0.000 description 3
- 238000011587 new zealand white rabbit Methods 0.000 description 3
- 230000037361 pathway Effects 0.000 description 3
- 210000001539 phagocyte Anatomy 0.000 description 3
- 239000000244 polyoxyethylene sorbitan monooleate Substances 0.000 description 3
- 235000010482 polyoxyethylene sorbitan monooleate Nutrition 0.000 description 3
- 229940068968 polysorbate 80 Drugs 0.000 description 3
- 229920000053 polysorbate 80 Polymers 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 102000004196 processed proteins & peptides Human genes 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000012453 sprague-dawley rat model Methods 0.000 description 3
- 239000005720 sucrose Substances 0.000 description 3
- 230000009885 systemic effect Effects 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 238000002560 therapeutic procedure Methods 0.000 description 3
- 239000003053 toxin Substances 0.000 description 3
- 231100000765 toxin Toxicity 0.000 description 3
- RMTFNDVZYPHUEF-DBRKOABJSA-N (2s,3s,4r,5r)-2,4,5,6-tetrahydroxy-3-methoxyhexanal Chemical compound O=C[C@@H](O)[C@@H](OC)[C@H](O)[C@H](O)CO RMTFNDVZYPHUEF-DBRKOABJSA-N 0.000 description 2
- VBICKXHEKHSIBG-UHFFFAOYSA-N 1-monostearoylglycerol Chemical compound CCCCCCCCCCCCCCCCCC(=O)OCC(O)CO VBICKXHEKHSIBG-UHFFFAOYSA-N 0.000 description 2
- HVCOBJNICQPDBP-UHFFFAOYSA-N 3-[3-[3,5-dihydroxy-6-methyl-4-(3,4,5-trihydroxy-6-methyloxan-2-yl)oxyoxan-2-yl]oxydecanoyloxy]decanoic acid;hydrate Chemical compound O.OC1C(OC(CC(=O)OC(CCCCCCC)CC(O)=O)CCCCCCC)OC(C)C(O)C1OC1C(O)C(O)C(O)C(C)O1 HVCOBJNICQPDBP-UHFFFAOYSA-N 0.000 description 2
- WZRJTRPJURQBRM-UHFFFAOYSA-N 4-amino-n-(5-methyl-1,2-oxazol-3-yl)benzenesulfonamide;5-[(3,4,5-trimethoxyphenyl)methyl]pyrimidine-2,4-diamine Chemical compound O1C(C)=CC(NS(=O)(=O)C=2C=CC(N)=CC=2)=N1.COC1=C(OC)C(OC)=CC(CC=2C(=NC(N)=NC=2)N)=C1 WZRJTRPJURQBRM-UHFFFAOYSA-N 0.000 description 2
- MEFILNJXAVSUTO-JXUBOQSCSA-N Ala-Leu-Thr Chemical compound C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MEFILNJXAVSUTO-JXUBOQSCSA-N 0.000 description 2
- DCXYFEDJOCDNAF-UHFFFAOYSA-N Asparagine Natural products OC(=O)C(N)CC(N)=O DCXYFEDJOCDNAF-UHFFFAOYSA-N 0.000 description 2
- 241000193830 Bacillus <bacterium> Species 0.000 description 2
- 208000035143 Bacterial infection Diseases 0.000 description 2
- 239000002028 Biomass Substances 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 2
- 229930186147 Cephalosporin Natural products 0.000 description 2
- FBPFZTCFMRRESA-FSIIMWSLSA-N D-Glucitol Natural products OC[C@H](O)[C@H](O)[C@@H](O)[C@H](O)CO FBPFZTCFMRRESA-FSIIMWSLSA-N 0.000 description 2
- 108020004414 DNA Proteins 0.000 description 2
- 241000588722 Escherichia Species 0.000 description 2
- 241000672609 Escherichia coli BL21 Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- PNNNRSAQSRJVSB-SLPGGIOYSA-N Fucose Natural products C[C@H](O)[C@@H](O)[C@H](O)[C@H](O)C=O PNNNRSAQSRJVSB-SLPGGIOYSA-N 0.000 description 2
- RUFHOVYUYSNDNY-ACZMJKKPSA-N Glu-Ala-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](C)NC(=O)[C@@H](N)CCC(O)=O RUFHOVYUYSNDNY-ACZMJKKPSA-N 0.000 description 2
- KKCUFHUTMKQQCF-SRVKXCTJSA-N Glu-Arg-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O KKCUFHUTMKQQCF-SRVKXCTJSA-N 0.000 description 2
- OAGVHWYIBZMWLA-YFKPBYRVSA-N Glu-Gly-Gly Chemical compound OC(=O)CC[C@H](N)C(=O)NCC(=O)NCC(O)=O OAGVHWYIBZMWLA-YFKPBYRVSA-N 0.000 description 2
- UFPXDFOYHVEIPI-BYPYZUCNSA-N Gly-Gly-Asp Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O UFPXDFOYHVEIPI-BYPYZUCNSA-N 0.000 description 2
- SOEGEPHNZOISMT-BYPYZUCNSA-N Gly-Ser-Gly Chemical compound NCC(=O)N[C@@H](CO)C(=O)NCC(O)=O SOEGEPHNZOISMT-BYPYZUCNSA-N 0.000 description 2
- 229930186217 Glycolipid Natural products 0.000 description 2
- HDXNWVLQSQFJOX-SRVKXCTJSA-N His-Arg-Gln Chemical compound C1=C(NC=N1)C[C@@H](C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(=O)N)C(=O)O)N HDXNWVLQSQFJOX-SRVKXCTJSA-N 0.000 description 2
- 206010061598 Immunodeficiency Diseases 0.000 description 2
- 108060003951 Immunoglobulin Proteins 0.000 description 2
- SHZGCJCMOBCMKK-DHVFOXMCSA-N L-fucopyranose Chemical compound C[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@@H]1O SHZGCJCMOBCMKK-DHVFOXMCSA-N 0.000 description 2
- FFEARJCKVFRZRR-BYPYZUCNSA-N L-methionine Chemical compound CSCC[C@H](N)C(O)=O FFEARJCKVFRZRR-BYPYZUCNSA-N 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- OVRNDRQMDRJTHS-CBQIKETKSA-N N-Acetyl-D-Galactosamine Chemical compound CC(=O)N[C@H]1[C@@H](O)O[C@H](CO)[C@H](O)[C@@H]1O OVRNDRQMDRJTHS-CBQIKETKSA-N 0.000 description 2
- MBLBDJOUHNCFQT-UHFFFAOYSA-N N-acetyl-D-galactosamine Natural products CC(=O)NC(C=O)C(O)C(O)C(O)CO MBLBDJOUHNCFQT-UHFFFAOYSA-N 0.000 description 2
- AJHCSUXXECOXOY-UHFFFAOYSA-N N-glycyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)CN)C(O)=O)=CNC2=C1 AJHCSUXXECOXOY-UHFFFAOYSA-N 0.000 description 2
- 238000012565 NMR experiment Methods 0.000 description 2
- 101710160107 Outer membrane protein A Proteins 0.000 description 2
- 101710167675 Outer membrane protein P5 Proteins 0.000 description 2
- 101710195197 Peptidoglycan-binding protein ArfA Proteins 0.000 description 2
- 206010040070 Septic Shock Diseases 0.000 description 2
- 101000870420 Streptococcus gordonii UDP-N-acetylglucosamine-peptide N-acetylglucosaminyltransferase GtfA subunit Proteins 0.000 description 2
- 206010051379 Systemic Inflammatory Response Syndrome Diseases 0.000 description 2
- 102000004357 Transferases Human genes 0.000 description 2
- 108090000992 Transferases Proteins 0.000 description 2
- GULIUBBXCYPDJU-CQDKDKBSSA-N Tyr-Leu-Ala Chemical compound [O-]C(=O)[C@H](C)NC(=O)[C@H](CC(C)C)NC(=O)[C@@H]([NH3+])CC1=CC=C(O)C=C1 GULIUBBXCYPDJU-CQDKDKBSSA-N 0.000 description 2
- 230000004913 activation Effects 0.000 description 2
- 108010047495 alanylglycine Proteins 0.000 description 2
- PNNNRSAQSRJVSB-BXKVDMCESA-N aldehydo-L-rhamnose Chemical compound C[C@H](O)[C@H](O)[C@@H](O)[C@@H](O)C=O PNNNRSAQSRJVSB-BXKVDMCESA-N 0.000 description 2
- WQZGKKKJIJFFOK-DVKNGEFBSA-N alpha-D-glucose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@@H]1O WQZGKKKJIJFFOK-DVKNGEFBSA-N 0.000 description 2
- KOSRFJWDECSPRO-UHFFFAOYSA-N alpha-L-glutamyl-L-glutamic acid Natural products OC(=O)CCC(N)C(=O)NC(CCC(O)=O)C(O)=O KOSRFJWDECSPRO-UHFFFAOYSA-N 0.000 description 2
- 229940037003 alum Drugs 0.000 description 2
- 239000003242 anti bacterial agent Substances 0.000 description 2
- 230000000844 anti-bacterial effect Effects 0.000 description 2
- 229940088710 antibiotic agent Drugs 0.000 description 2
- 229960001230 asparagine Drugs 0.000 description 2
- 235000009582 asparagine Nutrition 0.000 description 2
- 125000000613 asparagine group Chemical group N[C@@H](CC(N)=O)C(=O)* 0.000 description 2
- 108010093581 aspartyl-proline Proteins 0.000 description 2
- 108010047857 aspartylglycine Proteins 0.000 description 2
- 208000022362 bacterial infectious disease Diseases 0.000 description 2
- 229960000074 biopharmaceutical Drugs 0.000 description 2
- -1 but not limited to Proteins 0.000 description 2
- 239000000969 carrier Substances 0.000 description 2
- 210000002421 cell wall Anatomy 0.000 description 2
- 230000001413 cellular effect Effects 0.000 description 2
- 238000005119 centrifugation Methods 0.000 description 2
- 229940124587 cephalosporin Drugs 0.000 description 2
- 150000001780 cephalosporins Chemical class 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- 229940047766 co-trimoxazole Drugs 0.000 description 2
- 230000000295 complement effect Effects 0.000 description 2
- 230000034994 death Effects 0.000 description 2
- 231100000517 death Toxicity 0.000 description 2
- 238000001514 detection method Methods 0.000 description 2
- 238000001784 detoxification Methods 0.000 description 2
- 238000007865 diluting Methods 0.000 description 2
- 238000010790 dilution Methods 0.000 description 2
- 239000012895 dilution Substances 0.000 description 2
- 239000013024 dilution buffer Substances 0.000 description 2
- 150000002016 disaccharides Chemical class 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- UFPHFKCTOZIAFY-NTDVEAECSA-N ditrans,polycis-undecaprenyl phosphate Chemical compound CC(C)=CCC\C(C)=C\CC\C(C)=C\CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/CC\C(C)=C/COP(O)(O)=O UFPHFKCTOZIAFY-NTDVEAECSA-N 0.000 description 2
- 229940079593 drug Drugs 0.000 description 2
- 238000004520 electroporation Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 229940124307 fluoroquinolone Drugs 0.000 description 2
- 230000005714 functional activity Effects 0.000 description 2
- 210000001035 gastrointestinal tract Anatomy 0.000 description 2
- 108010040856 glutamyl-cysteinyl-alanine Proteins 0.000 description 2
- 108010050848 glycylleucine Proteins 0.000 description 2
- 238000005570 heteronuclear single quantum coherence Methods 0.000 description 2
- 102000018358 immunoglobulin Human genes 0.000 description 2
- 229960001438 immunostimulant agent Drugs 0.000 description 2
- 238000000338 in vitro Methods 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 229930182817 methionine Natural products 0.000 description 2
- 125000002496 methyl group Chemical group [H]C([H])([H])* 0.000 description 2
- 238000011201 multiple comparisons test Methods 0.000 description 2
- 229940031348 multivalent vaccine Drugs 0.000 description 2
- 230000003204 osmotic effect Effects 0.000 description 2
- 244000052769 pathogen Species 0.000 description 2
- 239000000546 pharmaceutical excipient Substances 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 238000009021 pre-vaccination Methods 0.000 description 2
- 238000001556 precipitation Methods 0.000 description 2
- 230000002265 prevention Effects 0.000 description 2
- 108010090894 prolylleucine Proteins 0.000 description 2
- 230000004043 responsiveness Effects 0.000 description 2
- 238000010206 sensitivity analysis Methods 0.000 description 2
- 230000036303 septic shock Effects 0.000 description 2
- 108010048818 seryl-histidine Proteins 0.000 description 2
- 239000000377 silicon dioxide Substances 0.000 description 2
- 239000011734 sodium Substances 0.000 description 2
- 239000000600 sorbitol Substances 0.000 description 2
- 241000894007 species Species 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 230000004936 stimulating effect Effects 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 239000000725 suspension Substances 0.000 description 2
- 230000002194 synthesizing effect Effects 0.000 description 2
- 108010061238 threonyl-glycine Proteins 0.000 description 2
- 231100000419 toxicity Toxicity 0.000 description 2
- 230000001988 toxicity Effects 0.000 description 2
- 231100000041 toxicology testing Toxicity 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 230000001131 transforming effect Effects 0.000 description 2
- 238000012384 transportation and delivery Methods 0.000 description 2
- 239000003656 tris buffered saline Substances 0.000 description 2
- 108010035534 tyrosyl-leucyl-alanine Proteins 0.000 description 2
- 229940125575 vaccine candidate Drugs 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 238000012070 whole genome sequencing analysis Methods 0.000 description 2
- WQZGKKKJIJFFOK-SVZMEOIVSA-N (+)-Galactose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-SVZMEOIVSA-N 0.000 description 1
- YYGNTYWPHWGJRM-UHFFFAOYSA-N (6E,10E,14E,18E)-2,6,10,15,19,23-hexamethyltetracosa-2,6,10,14,18,22-hexaene Chemical compound CC(C)=CCCC(C)=CCCC(C)=CCCC=C(C)CCC=C(C)CCC=C(C)C YYGNTYWPHWGJRM-UHFFFAOYSA-N 0.000 description 1
- IIZPXYDJLKNOIY-JXPKJXOSSA-N 1-palmitoyl-2-arachidonoyl-sn-glycero-3-phosphocholine Chemical compound CCCCCCCCCCCCCCCC(=O)OC[C@H](COP([O-])(=O)OCC[N+](C)(C)C)OC(=O)CCC\C=C/C\C=C/C\C=C/C\C=C/CCCCC IIZPXYDJLKNOIY-JXPKJXOSSA-N 0.000 description 1
- 238000001644 13C nuclear magnetic resonance spectroscopy Methods 0.000 description 1
- RHKWIGHJGOEUSM-UHFFFAOYSA-N 3h-imidazo[4,5-h]quinoline Chemical class C1=CN=C2C(N=CN3)=C3C=CC2=C1 RHKWIGHJGOEUSM-UHFFFAOYSA-N 0.000 description 1
- 206010056519 Abdominal infection Diseases 0.000 description 1
- NIXOWILDQLNWCW-UHFFFAOYSA-N Acrylic acid Chemical compound OC(=O)C=C NIXOWILDQLNWCW-UHFFFAOYSA-N 0.000 description 1
- 208000030090 Acute Disease Diseases 0.000 description 1
- CXRCVCURMBFFOL-FXQIFTODSA-N Ala-Ala-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N1CCC[C@H]1C(O)=O CXRCVCURMBFFOL-FXQIFTODSA-N 0.000 description 1
- YYSWCHMLFJLLBJ-ZLUOBGJFSA-N Ala-Ala-Ser Chemical compound C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CO)C(O)=O YYSWCHMLFJLLBJ-ZLUOBGJFSA-N 0.000 description 1
- IMMKUCQIKKXKNP-DCAQKATOSA-N Ala-Arg-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@@H](NC(=O)[C@H](C)N)CCCN=C(N)N IMMKUCQIKKXKNP-DCAQKATOSA-N 0.000 description 1
- BTYTYHBSJKQBQA-GCJQMDKQSA-N Ala-Asp-Thr Chemical compound C[C@H]([C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@H](C)N)O BTYTYHBSJKQBQA-GCJQMDKQSA-N 0.000 description 1
- IKKVASZHTMKJIR-ZKWXMUAHSA-N Ala-Asp-Val Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O IKKVASZHTMKJIR-ZKWXMUAHSA-N 0.000 description 1
- JPGBXANAQYHTLA-DRZSPHRISA-N Ala-Gln-Phe Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 JPGBXANAQYHTLA-DRZSPHRISA-N 0.000 description 1
- CZPAHAKGPDUIPJ-CIUDSAMLSA-N Ala-Gln-Pro Chemical compound C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N1CCC[C@H]1C(O)=O CZPAHAKGPDUIPJ-CIUDSAMLSA-N 0.000 description 1
- NWVVKQZOVSTDBQ-CIUDSAMLSA-N Ala-Glu-Arg Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NWVVKQZOVSTDBQ-CIUDSAMLSA-N 0.000 description 1
- FBHOPGDGELNWRH-DRZSPHRISA-N Ala-Glu-Phe Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O FBHOPGDGELNWRH-DRZSPHRISA-N 0.000 description 1
- LTSBJNNXPBBNDT-HGNGGELXSA-N Ala-His-Gln Chemical compound N[C@@H](C)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(N)=O)C(=O)O LTSBJNNXPBBNDT-HGNGGELXSA-N 0.000 description 1
- VNYMOTCMNHJGTG-JBDRJPRFSA-N Ala-Ile-Ser Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CO)C(O)=O VNYMOTCMNHJGTG-JBDRJPRFSA-N 0.000 description 1
- LXAARTARZJJCMB-CIQUZCHMSA-N Ala-Ile-Thr Chemical compound [H]N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LXAARTARZJJCMB-CIQUZCHMSA-N 0.000 description 1
- QUIGLPSHIFPEOV-CIUDSAMLSA-N Ala-Lys-Ala Chemical compound [H]N[C@@H](C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](C)C(O)=O QUIGLPSHIFPEOV-CIUDSAMLSA-N 0.000 description 1
- NZGRHTKZFSVPAN-BIIVOSGPSA-N Ala-Ser-Pro Chemical compound C[C@@H](C(=O)N[C@@H](CO)C(=O)N1CCC[C@@H]1C(=O)O)N NZGRHTKZFSVPAN-BIIVOSGPSA-N 0.000 description 1
- PGNNQOJOEGFAOR-KWQFWETISA-N Ala-Tyr-Gly Chemical compound OC(=O)CNC(=O)[C@@H](NC(=O)[C@@H](N)C)CC1=CC=C(O)C=C1 PGNNQOJOEGFAOR-KWQFWETISA-N 0.000 description 1
- GUBGYTABKSRVRQ-XLOQQCSPSA-N Alpha-Lactose Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)O[C@H](O)[C@H](O)[C@H]1O GUBGYTABKSRVRQ-XLOQQCSPSA-N 0.000 description 1
- 208000031295 Animal disease Diseases 0.000 description 1
- 241000203069 Archaea Species 0.000 description 1
- SGYSTDWPNPKJPP-GUBZILKMSA-N Arg-Ala-Arg Chemical compound NC(=N)NCCC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O SGYSTDWPNPKJPP-GUBZILKMSA-N 0.000 description 1
- YFWTXMRJJDNTLM-LSJOCFKGSA-N Arg-Ala-His Chemical compound C[C@@H](C(=O)N[C@@H](CC1=CN=CN1)C(=O)O)NC(=O)[C@H](CCCN=C(N)N)N YFWTXMRJJDNTLM-LSJOCFKGSA-N 0.000 description 1
- UXJCMQFPDWCHKX-DCAQKATOSA-N Arg-Arg-Glu Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CCC(O)=O)C(O)=O UXJCMQFPDWCHKX-DCAQKATOSA-N 0.000 description 1
- OTUQSEPIIVBYEM-IHRRRGAJSA-N Arg-Asn-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O OTUQSEPIIVBYEM-IHRRRGAJSA-N 0.000 description 1
- RWCLSUOSKWTXLA-FXQIFTODSA-N Arg-Asp-Ala Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O RWCLSUOSKWTXLA-FXQIFTODSA-N 0.000 description 1
- JUWQNWXEGDYCIE-YUMQZZPRSA-N Arg-Gln-Gly Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)NCC(O)=O JUWQNWXEGDYCIE-YUMQZZPRSA-N 0.000 description 1
- MZRBYBIQTIKERR-GUBZILKMSA-N Arg-Glu-Gln Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(O)=O MZRBYBIQTIKERR-GUBZILKMSA-N 0.000 description 1
- HQIZDMIGUJOSNI-IUCAKERBSA-N Arg-Gly-Arg Chemical compound N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CCCNC(N)=N)C(O)=O HQIZDMIGUJOSNI-IUCAKERBSA-N 0.000 description 1
- ZZZWQALDSQQBEW-STQMWFEESA-N Arg-Gly-Tyr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O ZZZWQALDSQQBEW-STQMWFEESA-N 0.000 description 1
- YKZJPIPFKGYHKY-DCAQKATOSA-N Arg-Leu-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O YKZJPIPFKGYHKY-DCAQKATOSA-N 0.000 description 1
- JCROZIFVIYMXHM-GUBZILKMSA-N Arg-Met-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](CCSC)NC(=O)[C@@H](N)CCCN=C(N)N JCROZIFVIYMXHM-GUBZILKMSA-N 0.000 description 1
- SLQQPJBDBVPVQV-JYJNAYRXSA-N Arg-Phe-Val Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](C(C)C)C(O)=O SLQQPJBDBVPVQV-JYJNAYRXSA-N 0.000 description 1
- OVQJAKFLFTZDNC-GUBZILKMSA-N Arg-Pro-Asp Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(O)=O)C(O)=O OVQJAKFLFTZDNC-GUBZILKMSA-N 0.000 description 1
- QHUOOCKNNURZSL-IHRRRGAJSA-N Arg-Tyr-Ser Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O QHUOOCKNNURZSL-IHRRRGAJSA-N 0.000 description 1
- QLSRIZIDQXDQHK-RCWTZXSCSA-N Arg-Val-Thr Chemical compound [H]N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O QLSRIZIDQXDQHK-RCWTZXSCSA-N 0.000 description 1
- WHLDJYNHXOMGMU-JYJNAYRXSA-N Arg-Val-Tyr Chemical compound NC(N)=NCCC[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)N[C@H](C(O)=O)CC1=CC=C(O)C=C1 WHLDJYNHXOMGMU-JYJNAYRXSA-N 0.000 description 1
- ANAHQDPQQBDOBM-UHFFFAOYSA-N Arg-Val-Tyr Natural products CC(C)C(NC(=O)C(N)CCNC(=N)N)C(=O)NC(Cc1ccc(O)cc1)C(=O)O ANAHQDPQQBDOBM-UHFFFAOYSA-N 0.000 description 1
- HZPSDHRYYIORKR-WHFBIAKZSA-N Asn-Ala-Gly Chemical compound OC(=O)CNC(=O)[C@H](C)NC(=O)[C@@H](N)CC(N)=O HZPSDHRYYIORKR-WHFBIAKZSA-N 0.000 description 1
- XYOVHPDDWCEUDY-CIUDSAMLSA-N Asn-Ala-Leu Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O XYOVHPDDWCEUDY-CIUDSAMLSA-N 0.000 description 1
- IARGXWMWRFOQPG-GCJQMDKQSA-N Asn-Ala-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O IARGXWMWRFOQPG-GCJQMDKQSA-N 0.000 description 1
- KXFCBAHYSLJCCY-ZLUOBGJFSA-N Asn-Asn-Ser Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CO)C(O)=O KXFCBAHYSLJCCY-ZLUOBGJFSA-N 0.000 description 1
- JRVABKHPWDRUJF-UBHSHLNASA-N Asn-Asn-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)N)NC(=O)[C@H](CC(=O)N)N JRVABKHPWDRUJF-UBHSHLNASA-N 0.000 description 1
- WPOLSNAQGVHROR-GUBZILKMSA-N Asn-Gln-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)N)NC(=O)[C@H](CC(=O)N)N WPOLSNAQGVHROR-GUBZILKMSA-N 0.000 description 1
- MECFLTFREHAZLH-ACZMJKKPSA-N Asn-Glu-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](CC(=O)N)N MECFLTFREHAZLH-ACZMJKKPSA-N 0.000 description 1
- WONGRTVAMHFGBE-WDSKDSINSA-N Asn-Gly-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CC(=O)N)N WONGRTVAMHFGBE-WDSKDSINSA-N 0.000 description 1
- UDSVWSUXKYXSTR-QWRGUYRKSA-N Asn-Gly-Tyr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)NCC(=O)N[C@@H](CC1=CC=C(O)C=C1)C(O)=O UDSVWSUXKYXSTR-QWRGUYRKSA-N 0.000 description 1
- ACKNRKFVYUVWAC-ZPFDUUQYSA-N Asn-Ile-Lys Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCCCN)C(=O)O)NC(=O)[C@H](CC(=O)N)N ACKNRKFVYUVWAC-ZPFDUUQYSA-N 0.000 description 1
- PLTGTJAZQRGMPP-FXQIFTODSA-N Asn-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(N)=O PLTGTJAZQRGMPP-FXQIFTODSA-N 0.000 description 1
- ULZOQOKFYMXHPZ-AQZXSJQPSA-N Asn-Trp-Thr Chemical compound [H]N[C@@H](CC(N)=O)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H]([C@@H](C)O)C(O)=O ULZOQOKFYMXHPZ-AQZXSJQPSA-N 0.000 description 1
- PBVLJOIPOGUQQP-CIUDSAMLSA-N Asp-Ala-Leu Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC(C)C)C(O)=O PBVLJOIPOGUQQP-CIUDSAMLSA-N 0.000 description 1
- BFOYULZBKYOKAN-OLHMAJIHSA-N Asp-Asp-Thr Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)O)C(O)=O BFOYULZBKYOKAN-OLHMAJIHSA-N 0.000 description 1
- RYKWOUUZJFSJOH-FXQIFTODSA-N Asp-Gln-Glu Chemical compound C(CC(=O)N)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](CC(=O)O)N RYKWOUUZJFSJOH-FXQIFTODSA-N 0.000 description 1
- VAWNQIGQPUOPQW-ACZMJKKPSA-N Asp-Glu-Ala Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O VAWNQIGQPUOPQW-ACZMJKKPSA-N 0.000 description 1
- PAYPSKIBMDHZPI-CIUDSAMLSA-N Asp-Leu-Asp Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O PAYPSKIBMDHZPI-CIUDSAMLSA-N 0.000 description 1
- WNGZKSVJFDZICU-XIRDDKMYSA-N Asp-Leu-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)NC(=O)[C@H](CC(=O)O)N WNGZKSVJFDZICU-XIRDDKMYSA-N 0.000 description 1
- KPSHWSWFPUDEGF-FXQIFTODSA-N Asp-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CC(O)=O KPSHWSWFPUDEGF-FXQIFTODSA-N 0.000 description 1
- KGHLGJAXYSVNJP-WHFBIAKZSA-N Asp-Ser-Gly Chemical compound OC(=O)C[C@H](N)C(=O)N[C@@H](CO)C(=O)NCC(O)=O KGHLGJAXYSVNJP-WHFBIAKZSA-N 0.000 description 1
- JSHWXQIZOCVWIA-ZKWXMUAHSA-N Asp-Ser-Val Chemical compound [H]N[C@@H](CC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O JSHWXQIZOCVWIA-ZKWXMUAHSA-N 0.000 description 1
- 241000194110 Bacillus sp. (in: Bacteria) Species 0.000 description 1
- 108020004256 Beta-lactamase Proteins 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101100512078 Caenorhabditis elegans lys-1 gene Proteins 0.000 description 1
- 241000589876 Campylobacter Species 0.000 description 1
- 241000589986 Campylobacter lari Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000700198 Cavia Species 0.000 description 1
- 206010007882 Cellulitis Diseases 0.000 description 1
- 241000193163 Clostridioides difficile Species 0.000 description 1
- 241000193403 Clostridium Species 0.000 description 1
- 108700010070 Codon Usage Proteins 0.000 description 1
- 241000186216 Corynebacterium Species 0.000 description 1
- UPJGYXRAPJWIHD-CIUDSAMLSA-N Cys-Asn-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CC(C)C)C(O)=O UPJGYXRAPJWIHD-CIUDSAMLSA-N 0.000 description 1
- IDFVDSBJNMPBSX-SRVKXCTJSA-N Cys-Lys-Leu Chemical compound [H]N[C@@H](CS)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(O)=O IDFVDSBJNMPBSX-SRVKXCTJSA-N 0.000 description 1
- SRBFZHDQGSBBOR-SOOFDHNKSA-N D-ribopyranose Chemical compound O[C@@H]1COC(O)[C@H](O)[C@@H]1O SRBFZHDQGSBBOR-SOOFDHNKSA-N 0.000 description 1
- 206010061818 Disease progression Diseases 0.000 description 1
- 206010059866 Drug resistance Diseases 0.000 description 1
- KCXVZYZYPLLWCC-UHFFFAOYSA-N EDTA Chemical compound OC(=O)CN(CC(O)=O)CCN(CC(O)=O)CC(O)=O KCXVZYZYPLLWCC-UHFFFAOYSA-N 0.000 description 1
- 108010001817 Endo-1,4-beta Xylanases Proteins 0.000 description 1
- 241000588914 Enterobacter Species 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 241000588698 Erwinia Species 0.000 description 1
- 101100155531 Escherichia coli (strain K12) ispU gene Proteins 0.000 description 1
- 101100069728 Escherichia coli (strain K12) yfdG gene Proteins 0.000 description 1
- 101100338056 Escherichia coli (strain K12) yfdH gene Proteins 0.000 description 1
- 241001522878 Escherichia coli B Species 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 108010010803 Gelatin Proteins 0.000 description 1
- INKFLNZBTSNFON-CIUDSAMLSA-N Gln-Ala-Arg Chemical compound NC(=O)CC[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O INKFLNZBTSNFON-CIUDSAMLSA-N 0.000 description 1
- INFBPLSHYFALDE-ACZMJKKPSA-N Gln-Asn-Ala Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](C)C(O)=O INFBPLSHYFALDE-ACZMJKKPSA-N 0.000 description 1
- OETQLUYCMBARHJ-CIUDSAMLSA-N Gln-Asn-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O OETQLUYCMBARHJ-CIUDSAMLSA-N 0.000 description 1
- NKCZYEDZTKOFBG-GUBZILKMSA-N Gln-Gln-Arg Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O NKCZYEDZTKOFBG-GUBZILKMSA-N 0.000 description 1
- FQCILXROGNOZON-YUMQZZPRSA-N Gln-Pro-Gly Chemical compound NC(=O)CC[C@H](N)C(=O)N1CCC[C@H]1C(=O)NCC(O)=O FQCILXROGNOZON-YUMQZZPRSA-N 0.000 description 1
- SXFPZRRVWSUYII-KBIXCLLPSA-N Gln-Ser-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](CCC(=O)N)N SXFPZRRVWSUYII-KBIXCLLPSA-N 0.000 description 1
- HLRLXVPRJJITSK-IFFSRLJSSA-N Gln-Thr-Val Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C(C)C)C(O)=O HLRLXVPRJJITSK-IFFSRLJSSA-N 0.000 description 1
- VDMABHYXBULDGN-LAEOZQHASA-N Gln-Val-Asp Chemical compound [H]N[C@@H](CCC(N)=O)C(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CC(O)=O)C(O)=O VDMABHYXBULDGN-LAEOZQHASA-N 0.000 description 1
- SDSMVVSHLAAOJL-UKJIMTQDSA-N Gln-Val-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](C(C)C)NC(=O)[C@H](CCC(=O)N)N SDSMVVSHLAAOJL-UKJIMTQDSA-N 0.000 description 1
- ATRHMOJQJWPVBQ-DRZSPHRISA-N Glu-Ala-Phe Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O ATRHMOJQJWPVBQ-DRZSPHRISA-N 0.000 description 1
- CKRUHITYRFNUKW-WDSKDSINSA-N Glu-Asn-Gly Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(N)=O)C(=O)NCC(O)=O CKRUHITYRFNUKW-WDSKDSINSA-N 0.000 description 1
- JVSBYEDSSRZQGV-GUBZILKMSA-N Glu-Asp-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CC(O)=O)NC(=O)[C@@H](N)CCC(O)=O JVSBYEDSSRZQGV-GUBZILKMSA-N 0.000 description 1
- SAEBUDRWKUXLOM-ACZMJKKPSA-N Glu-Cys-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@H](CS)NC(=O)[C@@H](N)CCC(O)=O SAEBUDRWKUXLOM-ACZMJKKPSA-N 0.000 description 1
- OXEMJGCAJFFREE-FXQIFTODSA-N Glu-Gln-Ala Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O OXEMJGCAJFFREE-FXQIFTODSA-N 0.000 description 1
- XMVLTPMCUJTJQP-FXQIFTODSA-N Glu-Gln-Cys Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CS)C(=O)O)N XMVLTPMCUJTJQP-FXQIFTODSA-N 0.000 description 1
- PVBBEKPHARMPHX-DCAQKATOSA-N Glu-Gln-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](CCC(N)=O)NC(=O)[C@@H](N)CCC(O)=O PVBBEKPHARMPHX-DCAQKATOSA-N 0.000 description 1
- MWMJCGBSIORNCD-AVGNSLFASA-N Glu-Leu-Leu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O MWMJCGBSIORNCD-AVGNSLFASA-N 0.000 description 1
- FMBWLLMUPXTXFC-SDDRHHMPSA-N Glu-Lys-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CCCCN)NC(=O)[C@H](CCC(=O)O)N)C(=O)O FMBWLLMUPXTXFC-SDDRHHMPSA-N 0.000 description 1
- XNOWYPDMSLSRKP-GUBZILKMSA-N Glu-Met-Gln Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCSC)C(=O)N[C@@H](CCC(N)=O)C(O)=O XNOWYPDMSLSRKP-GUBZILKMSA-N 0.000 description 1
- CBOVGULVQSVMPT-CIUDSAMLSA-N Glu-Pro-Asn Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(N)=O)C(O)=O CBOVGULVQSVMPT-CIUDSAMLSA-N 0.000 description 1
- ALMBZBOCGSVSAI-ACZMJKKPSA-N Glu-Ser-Asn Chemical compound C(CC(=O)O)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(=O)N)C(=O)O)N ALMBZBOCGSVSAI-ACZMJKKPSA-N 0.000 description 1
- GMVCSRBOSIUTFC-FXQIFTODSA-N Glu-Ser-Glu Chemical compound [H]N[C@@H](CCC(O)=O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CCC(O)=O)C(O)=O GMVCSRBOSIUTFC-FXQIFTODSA-N 0.000 description 1
- VSVZIEVNUYDAFR-YUMQZZPRSA-N Gly-Ala-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)CN VSVZIEVNUYDAFR-YUMQZZPRSA-N 0.000 description 1
- XEJTYSCIXKYSHR-WDSKDSINSA-N Gly-Asp-Gln Chemical compound C(CC(=O)N)[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)CN XEJTYSCIXKYSHR-WDSKDSINSA-N 0.000 description 1
- FZQLXNIMCPJVJE-YUMQZZPRSA-N Gly-Asp-Leu Chemical compound [H]NCC(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FZQLXNIMCPJVJE-YUMQZZPRSA-N 0.000 description 1
- MOJKRXIRAZPZLW-WDSKDSINSA-N Gly-Glu-Ala Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O MOJKRXIRAZPZLW-WDSKDSINSA-N 0.000 description 1
- JSNNHGHYGYMVCK-XVKPBYJWSA-N Gly-Glu-Val Chemical compound [H]NCC(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C(C)C)C(O)=O JSNNHGHYGYMVCK-XVKPBYJWSA-N 0.000 description 1
- KMSGYZQRXPUKGI-BYPYZUCNSA-N Gly-Gly-Asn Chemical compound NCC(=O)NCC(=O)N[C@H](C(O)=O)CC(N)=O KMSGYZQRXPUKGI-BYPYZUCNSA-N 0.000 description 1
- YWAQATDNEKZFFK-BYPYZUCNSA-N Gly-Gly-Ser Chemical compound NCC(=O)NCC(=O)N[C@@H](CO)C(O)=O YWAQATDNEKZFFK-BYPYZUCNSA-N 0.000 description 1
- YFGONBOFGGWKKY-VHSXEESVSA-N Gly-His-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CN=CN2)NC(=O)CN)C(=O)O YFGONBOFGGWKKY-VHSXEESVSA-N 0.000 description 1
- LHYJCVCQPWRMKZ-WEDXCCLWSA-N Gly-Leu-Thr Chemical compound [H]NCC(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O LHYJCVCQPWRMKZ-WEDXCCLWSA-N 0.000 description 1
- QAMMIGULQSIRCD-IRXDYDNUSA-N Gly-Phe-Tyr Chemical compound C([C@H](NC(=O)C[NH3+])C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C([O-])=O)C1=CC=CC=C1 QAMMIGULQSIRCD-IRXDYDNUSA-N 0.000 description 1
- GGLIDLCEPDHEJO-BQBZGAKWSA-N Gly-Pro-Ala Chemical compound OC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1C(=O)CN GGLIDLCEPDHEJO-BQBZGAKWSA-N 0.000 description 1
- JJGBXTYGTKWGAT-YUMQZZPRSA-N Gly-Pro-Glu Chemical compound NCC(=O)N1CCC[C@H]1C(=O)N[C@@H](CCC(O)=O)C(O)=O JJGBXTYGTKWGAT-YUMQZZPRSA-N 0.000 description 1
- CQMFNTVQVLQRLT-JHEQGTHGSA-N Gly-Thr-Gln Chemical compound [H]NCC(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCC(N)=O)C(O)=O CQMFNTVQVLQRLT-JHEQGTHGSA-N 0.000 description 1
- LYZYGGWCBLBDMC-QWHCGFSZSA-N Gly-Tyr-Pro Chemical compound C1C[C@@H](N(C1)C(=O)[C@H](CC2=CC=C(C=C2)O)NC(=O)CN)C(=O)O LYZYGGWCBLBDMC-QWHCGFSZSA-N 0.000 description 1
- GJHWILMUOANXTG-WPRPVWTQSA-N Gly-Val-Arg Chemical compound [H]NCC(=O)N[C@@H](C(C)C)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O GJHWILMUOANXTG-WPRPVWTQSA-N 0.000 description 1
- BAYQNCWLXIDLHX-ONGXEEELSA-N Gly-Val-Leu Chemical compound CC(C)C[C@@H](C(O)=O)NC(=O)[C@H](C(C)C)NC(=O)CN BAYQNCWLXIDLHX-ONGXEEELSA-N 0.000 description 1
- JBCLFWXMTIKCCB-UHFFFAOYSA-N H-Gly-Phe-OH Natural products NCC(=O)NC(C(O)=O)CC1=CC=CC=C1 JBCLFWXMTIKCCB-UHFFFAOYSA-N 0.000 description 1
- HVLSXIKZNLPZJJ-TXZCQADKSA-N HA peptide Chemical compound C([C@@H](C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C(C)C)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(=O)N[C@@H](C)C(O)=O)NC(=O)[C@H]1N(CCC1)C(=O)[C@@H](N)CC=1C=CC(O)=CC=1)C1=CC=C(O)C=C1 HVLSXIKZNLPZJJ-TXZCQADKSA-N 0.000 description 1
- 208000008745 Healthcare-Associated Pneumonia Diseases 0.000 description 1
- DCRODRAURLJOFY-XPUUQOCRSA-N His-Ala-Gly Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](C)C(=O)NCC(O)=O DCRODRAURLJOFY-XPUUQOCRSA-N 0.000 description 1
- SYMSVYVUSPSAAO-IHRRRGAJSA-N His-Arg-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(C)C)C(O)=O SYMSVYVUSPSAAO-IHRRRGAJSA-N 0.000 description 1
- FIMNVXRZGUAGBI-AVGNSLFASA-N His-Glu-Leu Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CC(C)C)C(O)=O FIMNVXRZGUAGBI-AVGNSLFASA-N 0.000 description 1
- SKOKHBGDXGTDDP-MELADBBJSA-N His-Leu-Pro Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](CC2=CN=CN2)N SKOKHBGDXGTDDP-MELADBBJSA-N 0.000 description 1
- FJCGVRRVBKYYOU-DCAQKATOSA-N His-Met-Ser Chemical compound CSCC[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](CC1=CN=CN1)N FJCGVRRVBKYYOU-DCAQKATOSA-N 0.000 description 1
- JATYGDHMDRAISQ-KKUMJFAQSA-N His-Tyr-Ser Chemical compound [H]N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CO)C(O)=O JATYGDHMDRAISQ-KKUMJFAQSA-N 0.000 description 1
- 241001272567 Hominoidea Species 0.000 description 1
- AQCUAZTZSPQJFF-ZKWXMUAHSA-N Ile-Ala-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O AQCUAZTZSPQJFF-ZKWXMUAHSA-N 0.000 description 1
- DPTBVFUDCPINIP-JURCDPSOSA-N Ile-Ala-Phe Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 DPTBVFUDCPINIP-JURCDPSOSA-N 0.000 description 1
- BOTVMTSMOUSDRW-GMOBBJLQSA-N Ile-Arg-Asn Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(N)=O)C(O)=O BOTVMTSMOUSDRW-GMOBBJLQSA-N 0.000 description 1
- WECYRWOMWSCWNX-XUXIUFHCSA-N Ile-Arg-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)N[C@@H](CC(C)C)C(O)=O WECYRWOMWSCWNX-XUXIUFHCSA-N 0.000 description 1
- NBJAAWYRLGCJOF-UGYAYLCHSA-N Ile-Asp-Asn Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N NBJAAWYRLGCJOF-UGYAYLCHSA-N 0.000 description 1
- KIAOPHMUNPPGEN-PEXQALLHSA-N Ile-Gly-His Chemical compound CC[C@H](C)[C@@H](C(=O)NCC(=O)N[C@@H](CC1=CN=CN1)C(=O)O)N KIAOPHMUNPPGEN-PEXQALLHSA-N 0.000 description 1
- FZWVCYCYWCLQDH-NHCYSSNCSA-N Ile-Leu-Gly Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)NCC(=O)O)N FZWVCYCYWCLQDH-NHCYSSNCSA-N 0.000 description 1
- HPCFRQWLTRDGHT-AJNGGQMLSA-N Ile-Leu-Leu Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(C)C)C(O)=O HPCFRQWLTRDGHT-AJNGGQMLSA-N 0.000 description 1
- PHRWFSFCNJPWRO-PPCPHDFISA-N Ile-Leu-Thr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(=O)O)N PHRWFSFCNJPWRO-PPCPHDFISA-N 0.000 description 1
- YKZAMJXNJUWFIK-JBDRJPRFSA-N Ile-Ser-Ala Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)N[C@@H](C)C(=O)O)N YKZAMJXNJUWFIK-JBDRJPRFSA-N 0.000 description 1
- BLFXHAFTNYZEQE-VKOGCVSHSA-N Ile-Trp-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N BLFXHAFTNYZEQE-VKOGCVSHSA-N 0.000 description 1
- HQLSBZFLOUHQJK-STECZYCISA-N Ile-Tyr-Arg Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N HQLSBZFLOUHQJK-STECZYCISA-N 0.000 description 1
- KXUKTDGKLAOCQK-LSJOCFKGSA-N Ile-Val-Gly Chemical compound CC[C@H](C)[C@H](N)C(=O)N[C@@H](C(C)C)C(=O)NCC(O)=O KXUKTDGKLAOCQK-LSJOCFKGSA-N 0.000 description 1
- DGAQECJNVWCQMB-PUAWFVPOSA-M Ilexoside XXIX Chemical compound C[C@@H]1CC[C@@]2(CC[C@@]3(C(=CC[C@H]4[C@]3(CC[C@@H]5[C@@]4(CC[C@@H](C5(C)C)OS(=O)(=O)[O-])C)C)[C@@H]2[C@]1(C)O)C)C(=O)O[C@H]6[C@@H]([C@H]([C@@H]([C@H](O6)CO)O)O)O.[Na+] DGAQECJNVWCQMB-PUAWFVPOSA-M 0.000 description 1
- 229920001202 Inulin Polymers 0.000 description 1
- 241000588748 Klebsiella Species 0.000 description 1
- PMGDADKJMCOXHX-UHFFFAOYSA-N L-Arginyl-L-glutamin-acetat Natural products NC(=N)NCCCC(N)C(=O)NC(CCC(N)=O)C(O)=O PMGDADKJMCOXHX-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-ZZWDRFIYSA-N L-glucose Chemical compound OC[C@@H]1OC(O)[C@@H](O)[C@H](O)[C@H]1O WQZGKKKJIJFFOK-ZZWDRFIYSA-N 0.000 description 1
- RCFDOSNHHZGBOY-UHFFFAOYSA-N L-isoleucyl-L-alanine Natural products CCC(C)C(N)C(=O)NC(C)C(O)=O RCFDOSNHHZGBOY-UHFFFAOYSA-N 0.000 description 1
- AAXCQFOXUJMCCW-PETQGJDISA-N LPS core Chemical group O([C@H]1[C@H](NC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCC)[C@H]([C@@H]([C@@H](CO[C@]2(O[C@@H]([C@@H](OC3[C@H]([C@@H](OC4[C@H]([C@@H](OC5[C@@H]([C@@H](O[C@@H]6[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O6)OC6[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O6)O[C@H]6[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O6)NC(C)=O)[C@H](O)[C@@H](CO[C@@H]6[C@@H]([C@@H](O)[C@@H](O)[C@@H](CO)O6)O)O5)O)[C@H](O)[C@@H]([C@@H](O)COC5[C@H]([C@@H](O)[C@H](OP(O)(O)=O)[C@@H]([C@@H](O)CO)O5)O)O4)O)[C@H](OP(O)(=O)OP(O)(=O)OCCN)[C@@H]([C@@H](O)CO)O3)O)[C@H](O[C@]3(O[C@@H]([C@@H](O)[C@H](O[C@]4(O[C@@H]([C@@H](O)[C@H](OP(O)(=O)OCCN)C4)[C@@H](O)CO)C(O)=O)C3)[C@@H](O)CO)C(O)=O)C2)[C@@H](O)CO)C(O)=O)O1)OP(O)(O)=O)OC(=O)C[C@@H](CCCCCCCCCCC)OC(=O)CCCCCCCCCCCCC)C[C@H]1O[C@H](OP(O)(O)=O)[C@H](NC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H](OC(=O)C[C@H](O)CCCCCCCCCCC)[C@@H]1O AAXCQFOXUJMCCW-PETQGJDISA-N 0.000 description 1
- 241000186660 Lactobacillus Species 0.000 description 1
- 241000194036 Lactococcus Species 0.000 description 1
- GUBGYTABKSRVRQ-QKKXKWKRSA-N Lactose Natural products OC[C@H]1O[C@@H](O[C@H]2[C@H](O)[C@@H](O)C(O)O[C@@H]2CO)[C@H](O)[C@@H](O)[C@H]1O GUBGYTABKSRVRQ-QKKXKWKRSA-N 0.000 description 1
- 241000880493 Leptailurus serval Species 0.000 description 1
- CQQGCWPXDHTTNF-GUBZILKMSA-N Leu-Ala-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCC(O)=O CQQGCWPXDHTTNF-GUBZILKMSA-N 0.000 description 1
- WNGVUZWBXZKQES-YUMQZZPRSA-N Leu-Ala-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](C)C(=O)NCC(O)=O WNGVUZWBXZKQES-YUMQZZPRSA-N 0.000 description 1
- WGNOPSQMIQERPK-UHFFFAOYSA-N Leu-Asn-Pro Natural products CC(C)CC(N)C(=O)NC(CC(=O)N)C(=O)N1CCCC1C(=O)O WGNOPSQMIQERPK-UHFFFAOYSA-N 0.000 description 1
- USTCFDAQCLDPBD-XIRDDKMYSA-N Leu-Asn-Trp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC1=CNC2=CC=CC=C21)C(=O)O)N USTCFDAQCLDPBD-XIRDDKMYSA-N 0.000 description 1
- BPANDPNDMJHFEV-CIUDSAMLSA-N Leu-Asp-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O BPANDPNDMJHFEV-CIUDSAMLSA-N 0.000 description 1
- ULXYQAJWJGLCNR-YUMQZZPRSA-N Leu-Asp-Gly Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(O)=O)C(=O)NCC(O)=O ULXYQAJWJGLCNR-YUMQZZPRSA-N 0.000 description 1
- KTFHTMHHKXUYPW-ZPFDUUQYSA-N Leu-Asp-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O KTFHTMHHKXUYPW-ZPFDUUQYSA-N 0.000 description 1
- MMEDVBWCMGRKKC-GARJFASQSA-N Leu-Asp-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N1CCC[C@@H]1C(=O)O)N MMEDVBWCMGRKKC-GARJFASQSA-N 0.000 description 1
- VQPPIMUZCZCOIL-GUBZILKMSA-N Leu-Gln-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](C)C(O)=O VQPPIMUZCZCOIL-GUBZILKMSA-N 0.000 description 1
- DZQMXBALGUHGJT-GUBZILKMSA-N Leu-Glu-Ala Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](C)C(O)=O DZQMXBALGUHGJT-GUBZILKMSA-N 0.000 description 1
- WIDZHJTYKYBLSR-DCAQKATOSA-N Leu-Glu-Glu Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCC(O)=O)C(=O)N[C@@H](CCC(O)=O)C(O)=O WIDZHJTYKYBLSR-DCAQKATOSA-N 0.000 description 1
- LAPSXOAUPNOINL-YUMQZZPRSA-N Leu-Gly-Asp Chemical compound CC(C)C[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O LAPSXOAUPNOINL-YUMQZZPRSA-N 0.000 description 1
- ZALAVHVPPOHAOL-XUXIUFHCSA-N Leu-Ile-Met Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCSC)C(=O)O)NC(=O)[C@H](CC(C)C)N ZALAVHVPPOHAOL-XUXIUFHCSA-N 0.000 description 1
- IAJFFZORSWOZPQ-SRVKXCTJSA-N Leu-Leu-Asn Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CC(N)=O)C(O)=O IAJFFZORSWOZPQ-SRVKXCTJSA-N 0.000 description 1
- QNBVTHNJGCOVFA-AVGNSLFASA-N Leu-Leu-Glu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@H](C(O)=O)CCC(O)=O QNBVTHNJGCOVFA-AVGNSLFASA-N 0.000 description 1
- RZXLZBIUTDQHJQ-SRVKXCTJSA-N Leu-Lys-Asp Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(O)=O RZXLZBIUTDQHJQ-SRVKXCTJSA-N 0.000 description 1
- BMVFXOQHDQZAQU-DCAQKATOSA-N Leu-Pro-Asp Chemical compound CC(C)C[C@@H](C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(=O)O)C(=O)O)N BMVFXOQHDQZAQU-DCAQKATOSA-N 0.000 description 1
- KWLWZYMNUZJKMZ-IHRRRGAJSA-N Leu-Pro-Leu Chemical compound CC(C)C[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O KWLWZYMNUZJKMZ-IHRRRGAJSA-N 0.000 description 1
- MVHXGBZUJLWZOH-BJDJZHNGSA-N Leu-Ser-Ile Chemical compound [H]N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O MVHXGBZUJLWZOH-BJDJZHNGSA-N 0.000 description 1
- ZJZNLRVCZWUONM-JXUBOQSCSA-N Leu-Thr-Ala Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](C)C(O)=O ZJZNLRVCZWUONM-JXUBOQSCSA-N 0.000 description 1
- QWWPYKKLXWOITQ-VOAKCMCISA-N Leu-Thr-Leu Chemical compound CC(C)C[C@H](N)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@H](C(O)=O)CC(C)C QWWPYKKLXWOITQ-VOAKCMCISA-N 0.000 description 1
- FDBTVENULFNTAL-XQQFMLRXSA-N Leu-Val-Pro Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](C(C)C)C(=O)N1CCC[C@@H]1C(=O)O)N FDBTVENULFNTAL-XQQFMLRXSA-N 0.000 description 1
- 238000003657 Likelihood-ratio test Methods 0.000 description 1
- NLOZZWJNIKKYSC-WDSOQIARSA-N Lys-Arg-Trp Chemical compound C1=CC=C2C(C[C@H](NC(=O)[C@H](CCCN=C(N)N)NC(=O)[C@@H](N)CCCCN)C(O)=O)=CNC2=C1 NLOZZWJNIKKYSC-WDSOQIARSA-N 0.000 description 1
- HKCCVDWHHTVVPN-CIUDSAMLSA-N Lys-Asp-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(O)=O)C(=O)N[C@@H](C)C(O)=O HKCCVDWHHTVVPN-CIUDSAMLSA-N 0.000 description 1
- KPJJOZUXFOLGMQ-CIUDSAMLSA-N Lys-Asp-Asn Chemical compound C(CCN)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N KPJJOZUXFOLGMQ-CIUDSAMLSA-N 0.000 description 1
- DAOSYIZXRCOKII-SRVKXCTJSA-N Lys-His-Asp Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC1=CNC=N1)C(=O)N[C@@H](CC(O)=O)C(O)=O DAOSYIZXRCOKII-SRVKXCTJSA-N 0.000 description 1
- MYZMQWHPDAYKIE-SRVKXCTJSA-N Lys-Leu-Ala Chemical compound [H]N[C@@H](CCCCN)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](C)C(O)=O MYZMQWHPDAYKIE-SRVKXCTJSA-N 0.000 description 1
- VMTYLUGCXIEDMV-QWRGUYRKSA-N Lys-Leu-Gly Chemical compound OC(=O)CNC(=O)[C@H](CC(C)C)NC(=O)[C@@H](N)CCCCN VMTYLUGCXIEDMV-QWRGUYRKSA-N 0.000 description 1
- YSPZCHGIWAQVKQ-AVGNSLFASA-N Lys-Pro-Val Chemical compound CC(C)[C@@H](C(O)=O)NC(=O)[C@@H]1CCCN1C(=O)[C@@H](N)CCCCN YSPZCHGIWAQVKQ-AVGNSLFASA-N 0.000 description 1
- 206010058780 Meningitis neonatal Diseases 0.000 description 1
- KUQWVNFMZLHAPA-CIUDSAMLSA-N Met-Ala-Gln Chemical compound [H]N[C@@H](CCSC)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(N)=O)C(O)=O KUQWVNFMZLHAPA-CIUDSAMLSA-N 0.000 description 1
- FRWZTWWOORIIBA-FXQIFTODSA-N Met-Asn-Asn Chemical compound CSCC[C@@H](C(=O)N[C@@H](CC(=O)N)C(=O)N[C@@H](CC(=O)N)C(=O)O)N FRWZTWWOORIIBA-FXQIFTODSA-N 0.000 description 1
- DGNZGCQSVGGYJS-BQBZGAKWSA-N Met-Gly-Asp Chemical compound CSCC[C@H](N)C(=O)NCC(=O)N[C@H](C(O)=O)CC(O)=O DGNZGCQSVGGYJS-BQBZGAKWSA-N 0.000 description 1
- 241000582786 Monoplex Species 0.000 description 1
- 206010048723 Multiple-drug resistance Diseases 0.000 description 1
- XOCCAGJZGBCJME-VAYLDTTESA-N N-Acetyl-L-Fucosamine Chemical compound C[C@@H]1OC(O)[C@@H](NC(C)=O)[C@H](O)[C@@H]1O XOCCAGJZGBCJME-VAYLDTTESA-N 0.000 description 1
- GXCLVBGFBYZDAG-UHFFFAOYSA-N N-[2-(1H-indol-3-yl)ethyl]-N-methylprop-2-en-1-amine Chemical compound CN(CCC1=CNC2=C1C=CC=C2)CC=C GXCLVBGFBYZDAG-UHFFFAOYSA-N 0.000 description 1
- 125000003047 N-acetyl group Chemical group 0.000 description 1
- OVRNDRQMDRJTHS-RTRLPJTCSA-N N-acetyl-D-glucosamine Chemical compound CC(=O)N[C@H]1C(O)O[C@H](CO)[C@@H](O)[C@@H]1O OVRNDRQMDRJTHS-RTRLPJTCSA-N 0.000 description 1
- 238000005481 NMR spectroscopy Methods 0.000 description 1
- BQVUABVGYYSDCJ-UHFFFAOYSA-N Nalpha-L-Leucyl-L-tryptophan Natural products C1=CC=C2C(CC(NC(=O)C(N)CC(C)C)C(O)=O)=CNC2=C1 BQVUABVGYYSDCJ-UHFFFAOYSA-N 0.000 description 1
- 241001644525 Nastus productus Species 0.000 description 1
- 238000011887 Necropsy Methods 0.000 description 1
- 108010044522 Nocardia aerocolonigenes N-glycosyltransferase Proteins 0.000 description 1
- 101100261281 Oncorhynchus nerka trha gene Proteins 0.000 description 1
- 108700026244 Open Reading Frames Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 206010031252 Osteomyelitis Diseases 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 239000002033 PVDF binder Substances 0.000 description 1
- 235000019483 Peanut oil Nutrition 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 206010058674 Pelvic Infection Diseases 0.000 description 1
- NAXPHWZXEXNDIW-JTQLQIEISA-N Phe-Gly-Gly Chemical compound OC(=O)CNC(=O)CNC(=O)[C@@H](N)CC1=CC=CC=C1 NAXPHWZXEXNDIW-JTQLQIEISA-N 0.000 description 1
- YCCUXNNKXDGMAM-KKUMJFAQSA-N Phe-Leu-Ser Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CO)C(O)=O YCCUXNNKXDGMAM-KKUMJFAQSA-N 0.000 description 1
- QARPMYDMYVLFMW-KKUMJFAQSA-N Phe-Pro-Glu Chemical compound C([C@H](N)C(=O)N1[C@@H](CCC1)C(=O)N[C@@H](CCC(O)=O)C(O)=O)C1=CC=CC=C1 QARPMYDMYVLFMW-KKUMJFAQSA-N 0.000 description 1
- LTAWNJXSRUCFAN-UNQGMJICSA-N Phe-Thr-Arg Chemical compound [H]N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCNC(N)=N)C(O)=O LTAWNJXSRUCFAN-UNQGMJICSA-N 0.000 description 1
- APECKGGXAXNFLL-RNXOBYDBSA-N Phe-Trp-Tyr Chemical compound C([C@H](N)C(=O)N[C@@H](CC=1C2=CC=CC=C2NC=1)C(=O)N[C@@H](CC=1C=CC(O)=CC=1)C(O)=O)C1=CC=CC=C1 APECKGGXAXNFLL-RNXOBYDBSA-N 0.000 description 1
- XALFIVXGQUEGKV-JSGCOSHPSA-N Phe-Val-Gly Chemical compound OC(=O)CNC(=O)[C@H](C(C)C)NC(=O)[C@@H](N)CC1=CC=CC=C1 XALFIVXGQUEGKV-JSGCOSHPSA-N 0.000 description 1
- OAICVXFJPJFONN-UHFFFAOYSA-N Phosphorus Chemical compound [P] OAICVXFJPJFONN-UHFFFAOYSA-N 0.000 description 1
- 206010035664 Pneumonia Diseases 0.000 description 1
- WUUNPBLZLWVARQ-QAETUUGQSA-N Postin Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H](CCCCN)NC(=O)[C@@H]1CCCN1C(=O)[C@H]1NCCC1 WUUNPBLZLWVARQ-QAETUUGQSA-N 0.000 description 1
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 1
- FZHBZMDRDASUHN-NAKRPEOUSA-N Pro-Ala-Ile Chemical compound CC[C@H](C)[C@H](NC(=O)[C@H](C)NC(=O)[C@@H]1CCCN1)C(O)=O FZHBZMDRDASUHN-NAKRPEOUSA-N 0.000 description 1
- OCSACVPBMIYNJE-GUBZILKMSA-N Pro-Arg-Asn Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H](CC(N)=O)C(O)=O OCSACVPBMIYNJE-GUBZILKMSA-N 0.000 description 1
- BNBBNGZZKQUWCD-IUCAKERBSA-N Pro-Arg-Gly Chemical compound NC(N)=NCCC[C@@H](C(=O)NCC(O)=O)NC(=O)[C@@H]1CCCN1 BNBBNGZZKQUWCD-IUCAKERBSA-N 0.000 description 1
- UTAUEDINXUMHLG-FXQIFTODSA-N Pro-Asp-Ala Chemical compound C[C@@H](C(=O)O)NC(=O)[C@H](CC(=O)O)NC(=O)[C@@H]1CCCN1 UTAUEDINXUMHLG-FXQIFTODSA-N 0.000 description 1
- XKHCJJPNXFBADI-DCAQKATOSA-N Pro-Asp-Lys Chemical compound C1C[C@H](NC1)C(=O)N[C@@H](CC(=O)O)C(=O)N[C@@H](CCCCN)C(=O)O XKHCJJPNXFBADI-DCAQKATOSA-N 0.000 description 1
- VDGTVWFMRXVQCT-GUBZILKMSA-N Pro-Glu-Gln Chemical compound NC(=O)CC[C@@H](C(O)=O)NC(=O)[C@H](CCC(O)=O)NC(=O)[C@@H]1CCCN1 VDGTVWFMRXVQCT-GUBZILKMSA-N 0.000 description 1
- XQSREVQDGCPFRJ-STQMWFEESA-N Pro-Gly-Phe Chemical compound [H]N1CCC[C@H]1C(=O)NCC(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O XQSREVQDGCPFRJ-STQMWFEESA-N 0.000 description 1
- RYJRPPUATSKNAY-STECZYCISA-N Pro-Ile-Tyr Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)O)NC(=O)[C@@H]2CCCN2 RYJRPPUATSKNAY-STECZYCISA-N 0.000 description 1
- QUBVFEANYYWBTM-VEVYYDQMSA-N Pro-Thr-Asp Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(O)=O)C(O)=O QUBVFEANYYWBTM-VEVYYDQMSA-N 0.000 description 1
- DCHQYSOGURGJST-FJXKBIBVSA-N Pro-Thr-Gly Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)NCC(O)=O DCHQYSOGURGJST-FJXKBIBVSA-N 0.000 description 1
- FDMCIBSQRKFSTJ-RHYQMDGZSA-N Pro-Thr-Leu Chemical compound [H]N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC(C)C)C(O)=O FDMCIBSQRKFSTJ-RHYQMDGZSA-N 0.000 description 1
- 241000589516 Pseudomonas Species 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 241000607142 Salmonella Species 0.000 description 1
- WTWGOQRNRFHFQD-JBDRJPRFSA-N Ser-Ala-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](C)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O WTWGOQRNRFHFQD-JBDRJPRFSA-N 0.000 description 1
- ULVMNZOKDBHKKI-ACZMJKKPSA-N Ser-Gln-Asp Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CCC(N)=O)C(=O)N[C@@H](CC(O)=O)C(O)=O ULVMNZOKDBHKKI-ACZMJKKPSA-N 0.000 description 1
- BRIZMMZEYSAKJX-QEJZJMRPSA-N Ser-Glu-Trp Chemical compound C1=CC=C2C(=C1)C(=CN2)C[C@@H](C(=O)O)NC(=O)[C@H](CCC(=O)O)NC(=O)[C@H](CO)N BRIZMMZEYSAKJX-QEJZJMRPSA-N 0.000 description 1
- YMTLKLXDFCSCNX-BYPYZUCNSA-N Ser-Gly-Gly Chemical compound OC[C@H](N)C(=O)NCC(=O)NCC(O)=O YMTLKLXDFCSCNX-BYPYZUCNSA-N 0.000 description 1
- WSTIOCFMWXNOCX-YUMQZZPRSA-N Ser-Gly-Lys Chemical compound C(CCN)C[C@@H](C(=O)O)NC(=O)CNC(=O)[C@H](CO)N WSTIOCFMWXNOCX-YUMQZZPRSA-N 0.000 description 1
- LWMQRHDTXHQQOV-MXAVVETBSA-N Ser-Ile-Phe Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(=O)N[C@@H](CC1=CC=CC=C1)C(O)=O LWMQRHDTXHQQOV-MXAVVETBSA-N 0.000 description 1
- MUJQWSAWLLRJCE-KATARQTJSA-N Ser-Leu-Thr Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H]([C@@H](C)O)C(O)=O MUJQWSAWLLRJCE-KATARQTJSA-N 0.000 description 1
- JCLAFVNDBJMLBC-JBDRJPRFSA-N Ser-Ser-Ile Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CO)C(=O)N[C@@H]([C@@H](C)CC)C(O)=O JCLAFVNDBJMLBC-JBDRJPRFSA-N 0.000 description 1
- RXUOAOOZIWABBW-XGEHTFHBSA-N Ser-Thr-Arg Chemical compound OC[C@H](N)C(=O)N[C@@H]([C@H](O)C)C(=O)N[C@H](C(O)=O)CCCN=C(N)N RXUOAOOZIWABBW-XGEHTFHBSA-N 0.000 description 1
- DYEGLQRVMBWQLD-IXOXFDKPSA-N Ser-Thr-Phe Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)O)NC(=O)[C@H](CO)N)O DYEGLQRVMBWQLD-IXOXFDKPSA-N 0.000 description 1
- AXKJPUBALUNJEO-UBHSHLNASA-N Ser-Trp-Asn Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CC(N)=O)C(O)=O AXKJPUBALUNJEO-UBHSHLNASA-N 0.000 description 1
- ZWSZBWAFDZRBNM-UBHSHLNASA-N Ser-Trp-Ser Chemical compound [H]N[C@@H](CO)C(=O)N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CO)C(O)=O ZWSZBWAFDZRBNM-UBHSHLNASA-N 0.000 description 1
- 241000607768 Shigella Species 0.000 description 1
- 241000607762 Shigella flexneri Species 0.000 description 1
- VYPSYNLAJGMNEJ-UHFFFAOYSA-N Silicium dioxide Chemical compound O=[Si]=O VYPSYNLAJGMNEJ-UHFFFAOYSA-N 0.000 description 1
- BQCADISMDOOEFD-UHFFFAOYSA-N Silver Chemical compound [Ag] BQCADISMDOOEFD-UHFFFAOYSA-N 0.000 description 1
- 229920002125 Sokalan® Polymers 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 229920002472 Starch Polymers 0.000 description 1
- 101710196623 Stimulator of interferon genes protein Proteins 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 241000187747 Streptomyces Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 208000031650 Surgical Wound Infection Diseases 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- BHEOSNUKNHRBNM-UHFFFAOYSA-N Tetramethylsqualene Natural products CC(=C)C(C)CCC(=C)C(C)CCC(C)=CCCC=C(C)CCC(C)C(=C)CCC(C)C(C)=C BHEOSNUKNHRBNM-UHFFFAOYSA-N 0.000 description 1
- KWQBJOUOSNJDRR-XAVMHZPKSA-N Thr-Cys-Pro Chemical compound C[C@H]([C@@H](C(=O)N[C@@H](CS)C(=O)N1CCC[C@@H]1C(=O)O)N)O KWQBJOUOSNJDRR-XAVMHZPKSA-N 0.000 description 1
- XFTYVCHLARBHBQ-FOHZUACHSA-N Thr-Gly-Asn Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)NCC(=O)N[C@@H](CC(N)=O)C(O)=O XFTYVCHLARBHBQ-FOHZUACHSA-N 0.000 description 1
- DJDSEDOKJTZBAR-ZDLURKLDSA-N Thr-Gly-Ser Chemical compound C[C@@H](O)[C@H](N)C(=O)NCC(=O)N[C@@H](CO)C(O)=O DJDSEDOKJTZBAR-ZDLURKLDSA-N 0.000 description 1
- XTCNBOBTROGWMW-RWRJDSDZSA-N Thr-Ile-Glu Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H]([C@@H](C)O)N XTCNBOBTROGWMW-RWRJDSDZSA-N 0.000 description 1
- JLNMFGCJODTXDH-WEDXCCLWSA-N Thr-Lys-Gly Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CCCCN)C(=O)NCC(O)=O JLNMFGCJODTXDH-WEDXCCLWSA-N 0.000 description 1
- WNQJTLATMXYSEL-OEAJRASXSA-N Thr-Phe-Leu Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CC1=CC=CC=C1)C(=O)N[C@@H](CC(C)C)C(O)=O WNQJTLATMXYSEL-OEAJRASXSA-N 0.000 description 1
- VEIKMWOMUYMMMK-FCLVOEFKSA-N Thr-Phe-Phe Chemical compound C([C@H](NC(=O)[C@@H](N)[C@H](O)C)C(=O)N[C@@H](CC=1C=CC=CC=1)C(O)=O)C1=CC=CC=C1 VEIKMWOMUYMMMK-FCLVOEFKSA-N 0.000 description 1
- MUAFDCVOHYAFNG-RCWTZXSCSA-N Thr-Pro-Arg Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCNC(N)=N)C(O)=O MUAFDCVOHYAFNG-RCWTZXSCSA-N 0.000 description 1
- GVMXJJAJLIEASL-ZJDVBMNYSA-N Thr-Pro-Thr Chemical compound C[C@@H](O)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H]([C@@H](C)O)C(O)=O GVMXJJAJLIEASL-ZJDVBMNYSA-N 0.000 description 1
- IVDFVBVIVLJJHR-LKXGYXEUSA-N Thr-Ser-Asp Chemical compound [H]N[C@@H]([C@@H](C)O)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(O)=O)C(O)=O IVDFVBVIVLJJHR-LKXGYXEUSA-N 0.000 description 1
- 101000980463 Treponema pallidum (strain Nichols) Chaperonin GroEL Proteins 0.000 description 1
- 239000007983 Tris buffer Substances 0.000 description 1
- MQVGIFJSFFVGFW-XEGUGMAKSA-N Trp-Ala-Glu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](C)C(=O)N[C@@H](CCC(O)=O)C(O)=O MQVGIFJSFFVGFW-XEGUGMAKSA-N 0.000 description 1
- VMBBTANKMSRJSS-JSGCOSHPSA-N Trp-Glu-Gly Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N[C@@H](CCC(O)=O)C(=O)NCC(O)=O VMBBTANKMSRJSS-JSGCOSHPSA-N 0.000 description 1
- AIISTODACBDQLW-WDSOQIARSA-N Trp-Leu-Arg Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CC(C)C)C(=O)N[C@@H](CCCN=C(N)N)C(O)=O)=CNC2=C1 AIISTODACBDQLW-WDSOQIARSA-N 0.000 description 1
- XOLLWQIBBLBAHQ-WDSOQIARSA-N Trp-Pro-Leu Chemical compound [H]N[C@@H](CC1=CNC2=C1C=CC=C2)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CC(C)C)C(O)=O XOLLWQIBBLBAHQ-WDSOQIARSA-N 0.000 description 1
- BOBZBMOTRORUPT-XIRDDKMYSA-N Trp-Ser-Leu Chemical compound C1=CC=C2C(C[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](CC(C)C)C(O)=O)=CNC2=C1 BOBZBMOTRORUPT-XIRDDKMYSA-N 0.000 description 1
- XLMDWQNAOKLKCP-XDTLVQLUSA-N Tyr-Ala-Gln Chemical compound C[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)O)NC(=O)[C@H](CC1=CC=C(C=C1)O)N XLMDWQNAOKLKCP-XDTLVQLUSA-N 0.000 description 1
- LGEYOIQBBIPHQN-UWJYBYFXSA-N Tyr-Ala-Ser Chemical compound OC[C@@H](C(O)=O)NC(=O)[C@H](C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 LGEYOIQBBIPHQN-UWJYBYFXSA-N 0.000 description 1
- SGFIXFAHVWJKTD-KJEVXHAQSA-N Tyr-Arg-Thr Chemical compound [H]N[C@@H](CC1=CC=C(O)C=C1)C(=O)N[C@@H](CCCNC(N)=N)C(=O)N[C@@H]([C@@H](C)O)C(O)=O SGFIXFAHVWJKTD-KJEVXHAQSA-N 0.000 description 1
- MVYRJYISVJWKSX-KBPBESRZSA-N Tyr-His-Gly Chemical compound C1=CC(=CC=C1C[C@@H](C(=O)N[C@@H](CC2=CN=CN2)C(=O)NCC(=O)O)N)O MVYRJYISVJWKSX-KBPBESRZSA-N 0.000 description 1
- ITDWWLTTWRRLCC-KJEVXHAQSA-N Tyr-Thr-Arg Chemical compound NC(N)=NCCC[C@@H](C(O)=O)NC(=O)[C@H]([C@H](O)C)NC(=O)[C@@H](N)CC1=CC=C(O)C=C1 ITDWWLTTWRRLCC-KJEVXHAQSA-N 0.000 description 1
- RUCNAYOMFXRIKJ-DCAQKATOSA-N Val-Ala-Lys Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](C)C(=O)N[C@H](C(O)=O)CCCCN RUCNAYOMFXRIKJ-DCAQKATOSA-N 0.000 description 1
- XTAUQCGQFJQGEJ-NHCYSSNCSA-N Val-Gln-Arg Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CCC(=O)N)C(=O)N[C@@H](CCCN=C(N)N)C(=O)O)N XTAUQCGQFJQGEJ-NHCYSSNCSA-N 0.000 description 1
- PIFJAFRUVWZRKR-QMMMGPOBSA-N Val-Gly-Gly Chemical compound CC(C)[C@H]([NH3+])C(=O)NCC(=O)NCC([O-])=O PIFJAFRUVWZRKR-QMMMGPOBSA-N 0.000 description 1
- JZWZACGUZVCQPS-RNJOBUHISA-N Val-Ile-Pro Chemical compound CC[C@H](C)[C@@H](C(=O)N1CCC[C@@H]1C(=O)O)NC(=O)[C@H](C(C)C)N JZWZACGUZVCQPS-RNJOBUHISA-N 0.000 description 1
- OVBMCNDKCWAXMZ-NAKRPEOUSA-N Val-Ile-Ser Chemical compound CC[C@H](C)[C@@H](C(=O)N[C@@H](CO)C(=O)O)NC(=O)[C@H](C(C)C)N OVBMCNDKCWAXMZ-NAKRPEOUSA-N 0.000 description 1
- AGXGCFSECFQMKB-NHCYSSNCSA-N Val-Leu-Asp Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N AGXGCFSECFQMKB-NHCYSSNCSA-N 0.000 description 1
- BMOFUVHDBROBSE-DCAQKATOSA-N Val-Leu-Cys Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CS)C(=O)O)NC(=O)[C@H](C(C)C)N BMOFUVHDBROBSE-DCAQKATOSA-N 0.000 description 1
- LYERIXUFCYVFFX-GVXVVHGQSA-N Val-Leu-Glu Chemical compound CC(C)C[C@@H](C(=O)N[C@@H](CCC(=O)O)C(=O)O)NC(=O)[C@H](C(C)C)N LYERIXUFCYVFFX-GVXVVHGQSA-N 0.000 description 1
- FMQGYTMERWBMSI-HJWJTTGWSA-N Val-Phe-Ile Chemical compound CC[C@H](C)[C@@H](C(=O)O)NC(=O)[C@H](CC1=CC=CC=C1)NC(=O)[C@H](C(C)C)N FMQGYTMERWBMSI-HJWJTTGWSA-N 0.000 description 1
- YTNGABPUXFEOGU-SRVKXCTJSA-N Val-Pro-Arg Chemical compound CC(C)[C@H](N)C(=O)N1CCC[C@H]1C(=O)N[C@@H](CCCN=C(N)N)C(O)=O YTNGABPUXFEOGU-SRVKXCTJSA-N 0.000 description 1
- VHIZXDZMTDVFGX-DCAQKATOSA-N Val-Ser-Leu Chemical compound CC(C)C[C@@H](C(=O)O)NC(=O)[C@H](CO)NC(=O)[C@H](C(C)C)N VHIZXDZMTDVFGX-DCAQKATOSA-N 0.000 description 1
- QZKVWWIUSQGWMY-IHRRRGAJSA-N Val-Ser-Phe Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@H](C(O)=O)CC1=CC=CC=C1 QZKVWWIUSQGWMY-IHRRRGAJSA-N 0.000 description 1
- NZYNRRGJJVSSTJ-GUBZILKMSA-N Val-Ser-Val Chemical compound CC(C)[C@H](N)C(=O)N[C@@H](CO)C(=O)N[C@@H](C(C)C)C(O)=O NZYNRRGJJVSSTJ-GUBZILKMSA-N 0.000 description 1
- MIAZWUMFUURQNP-YDHLFZDLSA-N Val-Tyr-Asn Chemical compound CC(C)[C@@H](C(=O)N[C@@H](CC1=CC=C(C=C1)O)C(=O)N[C@@H](CC(=O)N)C(=O)O)N MIAZWUMFUURQNP-YDHLFZDLSA-N 0.000 description 1
- 238000001793 Wilcoxon signed-rank test Methods 0.000 description 1
- 206010048038 Wound infection Diseases 0.000 description 1
- 241000607734 Yersinia <bacteria> Species 0.000 description 1
- 238000002835 absorbance Methods 0.000 description 1
- 125000000218 acetic acid group Chemical group C(C)(=O)* 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 150000007513 acids Chemical class 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 239000004480 active ingredient Substances 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000004520 agglutination Effects 0.000 description 1
- 238000007818 agglutination assay Methods 0.000 description 1
- 108010008685 alanyl-glutamyl-aspartic acid Proteins 0.000 description 1
- 108010044940 alanylglutamine Proteins 0.000 description 1
- 108010070944 alanylhistidine Proteins 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- WQZGKKKJIJFFOK-PHYPRBDBSA-N alpha-D-galactose Chemical compound OC[C@H]1O[C@H](O)[C@H](O)[C@@H](O)[C@H]1O WQZGKKKJIJFFOK-PHYPRBDBSA-N 0.000 description 1
- SHZGCJCMOBCMKK-HGVZOGFYSA-N alpha-L-rhamnopyranose Chemical compound C[C@@H]1O[C@@H](O)[C@H](O)[C@H](O)[C@H]1O SHZGCJCMOBCMKK-HGVZOGFYSA-N 0.000 description 1
- AZDRQVAHHNSJOQ-UHFFFAOYSA-N alumane Chemical class [AlH3] AZDRQVAHHNSJOQ-UHFFFAOYSA-N 0.000 description 1
- WNROFYMDJYEPJX-UHFFFAOYSA-K aluminium hydroxide Chemical compound [OH-].[OH-].[OH-].[Al+3] WNROFYMDJYEPJX-UHFFFAOYSA-K 0.000 description 1
- ILRRQNADMUWWFW-UHFFFAOYSA-K aluminium phosphate Chemical compound O1[Al]2OP1(=O)O2 ILRRQNADMUWWFW-UHFFFAOYSA-K 0.000 description 1
- DIZPMCHEQGEION-UHFFFAOYSA-H aluminium sulfate (anhydrous) Chemical compound [Al+3].[Al+3].[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O.[O-]S([O-])(=O)=O DIZPMCHEQGEION-UHFFFAOYSA-H 0.000 description 1
- 229960000723 ampicillin Drugs 0.000 description 1
- AVKUERGKIZMTKX-NJBDSQKTSA-N ampicillin Chemical compound C1([C@@H](N)C(=O)N[C@H]2[C@H]3SC([C@@H](N3C2=O)C(O)=O)(C)C)=CC=CC=C1 AVKUERGKIZMTKX-NJBDSQKTSA-N 0.000 description 1
- 238000005349 anion exchange Methods 0.000 description 1
- 230000000845 anti-microbial effect Effects 0.000 description 1
- 230000008262 antibiotic resistance mechanism Effects 0.000 description 1
- 239000004599 antimicrobial Substances 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 108010008355 arginyl-glutamine Proteins 0.000 description 1
- 108010010430 asparagine-proline-alanine Proteins 0.000 description 1
- 108010038633 aspartylglutamate Proteins 0.000 description 1
- 108010068265 aspartyltyrosine Proteins 0.000 description 1
- 208000010668 atopic eczema Diseases 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 238000007630 basic procedure Methods 0.000 description 1
- 102000006635 beta-lactamase Human genes 0.000 description 1
- 230000008436 biogenesis Effects 0.000 description 1
- 238000009640 blood culture Methods 0.000 description 1
- 230000036760 body temperature Effects 0.000 description 1
- 230000037396 body weight Effects 0.000 description 1
- 239000008366 buffered solution Substances 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000005251 capillar electrophoresis Methods 0.000 description 1
- 239000002775 capsule Substances 0.000 description 1
- 229960001631 carbomer Drugs 0.000 description 1
- 230000003197 catalytic effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 239000013626 chemical specie Substances 0.000 description 1
- 238000011097 chromatography purification Methods 0.000 description 1
- 210000000349 chromosome Anatomy 0.000 description 1
- 208000020832 chronic kidney disease Diseases 0.000 description 1
- 239000011248 coating agent Substances 0.000 description 1
- 238000000576 coating method Methods 0.000 description 1
- 230000000112 colonic effect Effects 0.000 description 1
- 230000001332 colony forming effect Effects 0.000 description 1
- 238000004440 column chromatography Methods 0.000 description 1
- 238000012875 competitive assay Methods 0.000 description 1
- 230000002860 competitive effect Effects 0.000 description 1
- 238000012790 confirmation Methods 0.000 description 1
- 230000001268 conjugating effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 108010016616 cysteinylglycine Proteins 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 239000008121 dextrose Substances 0.000 description 1
- 239000003085 diluting agent Substances 0.000 description 1
- 230000005750 disease progression Effects 0.000 description 1
- PRAKJMSDJKAYCZ-UHFFFAOYSA-N dodecahydrosqualene Natural products CC(C)CCCC(C)CCCC(C)CCCCC(C)CCCC(C)CCCC(C)C PRAKJMSDJKAYCZ-UHFFFAOYSA-N 0.000 description 1
- 231100000673 dose–response relationship Toxicity 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 208000028208 end stage renal disease Diseases 0.000 description 1
- 201000000523 end stage renal failure Diseases 0.000 description 1
- 238000006911 enzymatic reaction Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000000763 evoking effect Effects 0.000 description 1
- 239000013613 expression plasmid Substances 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 238000000855 fermentation Methods 0.000 description 1
- 230000004151 fermentation Effects 0.000 description 1
- 235000013312 flour Nutrition 0.000 description 1
- 230000037406 food intake Effects 0.000 description 1
- 235000012631 food intake Nutrition 0.000 description 1
- 150000002243 furanoses Chemical class 0.000 description 1
- 101150060566 galF gene Proteins 0.000 description 1
- 239000000499 gel Substances 0.000 description 1
- 238000012817 gel-diffusion technique Methods 0.000 description 1
- 239000008273 gelatin Substances 0.000 description 1
- 229920000159 gelatin Polymers 0.000 description 1
- 235000019322 gelatine Nutrition 0.000 description 1
- 235000011852 gelatine desserts Nutrition 0.000 description 1
- 230000012178 germinal center formation Effects 0.000 description 1
- 108010057083 glutamyl-aspartyl-leucine Proteins 0.000 description 1
- 108010079547 glutamylmethionine Proteins 0.000 description 1
- YQEMORVAKMFKLG-UHFFFAOYSA-N glycerine monostearate Natural products CCCCCCCCCCCCCCCCCC(=O)OC(CO)CO YQEMORVAKMFKLG-UHFFFAOYSA-N 0.000 description 1
- SVUQHVRAGMNPLW-UHFFFAOYSA-N glycerol monostearate Natural products CCCCCCCCCCCCCCCCC(=O)OCC(O)CO SVUQHVRAGMNPLW-UHFFFAOYSA-N 0.000 description 1
- VPZXBVLAVMBEQI-UHFFFAOYSA-N glycyl-DL-alpha-alanine Natural products OC(=O)C(C)NC(=O)CN VPZXBVLAVMBEQI-UHFFFAOYSA-N 0.000 description 1
- XBGGUPMXALFZOT-UHFFFAOYSA-N glycyl-L-tyrosine hemihydrate Natural products NCC(=O)NC(C(O)=O)CC1=CC=C(O)C=C1 XBGGUPMXALFZOT-UHFFFAOYSA-N 0.000 description 1
- 108010000434 glycyl-alanyl-leucine Proteins 0.000 description 1
- 108010089804 glycyl-threonine Proteins 0.000 description 1
- 108010048994 glycyl-tyrosyl-alanine Proteins 0.000 description 1
- 108010015792 glycyllysine Proteins 0.000 description 1
- 108010081551 glycylphenylalanine Proteins 0.000 description 1
- 108010084389 glycyltryptophan Proteins 0.000 description 1
- 108010087823 glycyltyrosine Proteins 0.000 description 1
- 238000004128 high performance liquid chromatography Methods 0.000 description 1
- 229920001519 homopolymer Polymers 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 229960002751 imiquimod Drugs 0.000 description 1
- DOUYETYNHWVLEO-UHFFFAOYSA-N imiquimod Chemical compound C1=CC=CC2=C3N(CC(C)C)C=NC3=C(N)N=C21 DOUYETYNHWVLEO-UHFFFAOYSA-N 0.000 description 1
- 230000036039 immunity Effects 0.000 description 1
- 230000000951 immunodiffusion Effects 0.000 description 1
- 238000000760 immunoelectrophoresis Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000011534 incubation Methods 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 239000012678 infectious agent Substances 0.000 description 1
- 239000004615 ingredient Substances 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000000968 intestinal effect Effects 0.000 description 1
- 238000001990 intravenous administration Methods 0.000 description 1
- 229940029339 inulin Drugs 0.000 description 1
- 238000005342 ion exchange Methods 0.000 description 1
- 238000004255 ion exchange chromatography Methods 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 239000008101 lactose Substances 0.000 description 1
- 239000000787 lecithin Substances 0.000 description 1
- 235000010445 lecithin Nutrition 0.000 description 1
- 229940067606 lecithin Drugs 0.000 description 1
- 231100001231 less toxic Toxicity 0.000 description 1
- 231100000225 lethality Toxicity 0.000 description 1
- 108010034529 leucyl-lysine Proteins 0.000 description 1
- 108010057821 leucylproline Proteins 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 239000002502 liposome Substances 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000004698 lymphocyte Anatomy 0.000 description 1
- 125000003588 lysine group Chemical group [H]N([H])C([H])([H])C([H])([H])C([H])([H])C([H])([H])C([H])(N([H])[H])C(*)=O 0.000 description 1
- 230000001320 lysogenic effect Effects 0.000 description 1
- 108010003700 lysyl aspartic acid Proteins 0.000 description 1
- 108010072591 lysyl-leucyl-alanyl-arginine Proteins 0.000 description 1
- 108010017391 lysylvaline Proteins 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000001840 matrix-assisted laser desorption--ionisation time-of-flight mass spectrometry Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000010534 mechanism of action Effects 0.000 description 1
- 230000002503 metabolic effect Effects 0.000 description 1
- VNWKTOKETHGBQD-UHFFFAOYSA-N methane Chemical compound C VNWKTOKETHGBQD-UHFFFAOYSA-N 0.000 description 1
- 244000005700 microbiome Species 0.000 description 1
- 238000007837 multiplex assay Methods 0.000 description 1
- 239000002105 nanoparticle Substances 0.000 description 1
- 239000006225 natural substrate Substances 0.000 description 1
- 238000013188 needle biopsy Methods 0.000 description 1
- 230000007935 neutral effect Effects 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 230000036963 noncompetitive effect Effects 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 239000007764 o/w emulsion Substances 0.000 description 1
- 230000004817 opsonic phagocytosis Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- TWNQGVIAIRXVLR-UHFFFAOYSA-N oxo(oxoalumanyloxy)alumane Chemical compound O=[Al]O[Al]=O TWNQGVIAIRXVLR-UHFFFAOYSA-N 0.000 description 1
- 230000000242 pagocytic effect Effects 0.000 description 1
- 239000000312 peanut oil Substances 0.000 description 1
- 108010087558 pectate lyase Proteins 0.000 description 1
- 230000002688 persistence Effects 0.000 description 1
- 101150068826 pglB gene Proteins 0.000 description 1
- 239000008194 pharmaceutical composition Substances 0.000 description 1
- 108010070409 phenylalanyl-glycyl-glycine Proteins 0.000 description 1
- 108010051242 phenylalanylserine Proteins 0.000 description 1
- 108010083476 phenylalanyltryptophan Proteins 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 229910052698 phosphorus Inorganic materials 0.000 description 1
- 239000011574 phosphorus Substances 0.000 description 1
- 229940031999 pneumococcal conjugate vaccine Drugs 0.000 description 1
- 229920002401 polyacrylamide Polymers 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 238000006116 polymerization reaction Methods 0.000 description 1
- 102000054765 polymorphisms of proteins Human genes 0.000 description 1
- 229920002981 polyvinylidene fluoride Polymers 0.000 description 1
- 239000001103 potassium chloride Substances 0.000 description 1
- 239000008057 potassium phosphate buffer Substances 0.000 description 1
- 229940071643 prefilled syringe Drugs 0.000 description 1
- 238000002203 pretreatment Methods 0.000 description 1
- 108010025826 prolyl-leucyl-arginine Proteins 0.000 description 1
- 108010031719 prolyl-serine Proteins 0.000 description 1
- 108010004914 prolylarginine Proteins 0.000 description 1
- 108010015796 prolylisoleucine Proteins 0.000 description 1
- QQONPFPTGQHPMA-UHFFFAOYSA-N propylene Natural products CC=C QQONPFPTGQHPMA-UHFFFAOYSA-N 0.000 description 1
- 125000004805 propylene group Chemical group [H]C([H])([H])C([H])([*:1])C([H])([H])[*:2] 0.000 description 1
- 210000002307 prostate Anatomy 0.000 description 1
- 238000001742 protein purification Methods 0.000 description 1
- 150000003214 pyranose derivatives Chemical class 0.000 description 1
- 238000003127 radioimmunoassay Methods 0.000 description 1
- 239000011541 reaction mixture Substances 0.000 description 1
- 230000006798 recombination Effects 0.000 description 1
- 238000005215 recombination Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000004064 recycling Methods 0.000 description 1
- 230000002829 reductive effect Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 229930182490 saponin Natural products 0.000 description 1
- 150000007949 saponins Chemical class 0.000 description 1
- 235000017709 saponins Nutrition 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 108010026333 seryl-proline Proteins 0.000 description 1
- 108010007375 seryl-seryl-seryl-arginine Proteins 0.000 description 1
- 108010071207 serylmethionine Proteins 0.000 description 1
- 239000000741 silica gel Substances 0.000 description 1
- 229910002027 silica gel Inorganic materials 0.000 description 1
- 229910052709 silver Inorganic materials 0.000 description 1
- 239000004332 silver Substances 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 235000020183 skimmed milk Nutrition 0.000 description 1
- 238000002415 sodium dodecyl sulfate polyacrylamide gel electrophoresis Methods 0.000 description 1
- RYYKJJJTJZKILX-UHFFFAOYSA-M sodium octadecanoate Chemical compound [Na+].CCCCCCCCCCCCCCCCCC([O-])=O RYYKJJJTJZKILX-UHFFFAOYSA-M 0.000 description 1
- 239000012064 sodium phosphate buffer Substances 0.000 description 1
- 229960000268 spectinomycin Drugs 0.000 description 1
- UNFWWIHTNXNPBV-WXKVUWSESA-N spectinomycin Chemical compound O([C@@H]1[C@@H](NC)[C@@H](O)[C@H]([C@@H]([C@H]1O1)O)NC)[C@]2(O)[C@H]1O[C@H](C)CC2=O UNFWWIHTNXNPBV-WXKVUWSESA-N 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 229940031439 squalene Drugs 0.000 description 1
- TUHBEKDERLKLEC-UHFFFAOYSA-N squalene Natural products CC(=CCCC(=CCCC(=CCCC=C(/C)CCC=C(/C)CC=C(C)C)C)C)C TUHBEKDERLKLEC-UHFFFAOYSA-N 0.000 description 1
- 238000010561 standard procedure Methods 0.000 description 1
- 239000008107 starch Substances 0.000 description 1
- 235000019698 starch Nutrition 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 238000013517 stratification Methods 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 230000002459 sustained effect Effects 0.000 description 1
- 208000024891 symptom Diseases 0.000 description 1
- 208000011580 syndromic disease Diseases 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 239000000454 talc Substances 0.000 description 1
- 229910052623 talc Inorganic materials 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 238000000954 titration curve Methods 0.000 description 1
- 230000000699 topical effect Effects 0.000 description 1
- 238000001551 total correlation spectroscopy Methods 0.000 description 1
- 231100000027 toxicology Toxicity 0.000 description 1
- 238000010361 transduction Methods 0.000 description 1
- 230000026683 transduction Effects 0.000 description 1
- 230000005945 translocation Effects 0.000 description 1
- 238000011282 treatment Methods 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 1
- 108010080629 tryptophan-leucine Proteins 0.000 description 1
- 238000004104 two-dimensional total correlation spectroscopy Methods 0.000 description 1
- 108010051110 tyrosyl-lysine Proteins 0.000 description 1
- 108010020532 tyrosyl-proline Proteins 0.000 description 1
- 241001515965 unidentified phage Species 0.000 description 1
- 101150103517 uppS gene Proteins 0.000 description 1
- 210000000626 ureter Anatomy 0.000 description 1
- 210000003708 urethra Anatomy 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 230000005924 vaccine-induced immune response Effects 0.000 description 1
- 239000003981 vehicle Substances 0.000 description 1
- 239000000304 virulence factor Substances 0.000 description 1
- 230000007923 virulence factor Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/04—Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/385—Haptens or antigens, bound to carriers
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y204/00—Glycosyltransferases (2.4)
- C12Y204/99—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
- C12Y204/99018—Dolichyl-diphosphooligosaccharide—protein glycotransferase (2.4.99.18)
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/025—Enterobacteriales, e.g. Enterobacter
- A61K39/0258—Escherichia
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/085—Staphylococcus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/09—Lactobacillales, e.g. aerococcus, enterococcus, lactobacillus, lactococcus, streptococcus
- A61K39/092—Streptococcus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/095—Neisseria
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/102—Pasteurellales, e.g. Actinobacillus, Pasteurella; Haemophilus
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/104—Pseudomonadales, e.g. Pseudomonas
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K39/02—Bacterial antigens
- A61K39/107—Vibrio
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K47/00—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
- A61K47/50—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
- A61K47/51—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
- A61K47/62—Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
- A61K47/64—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
- A61K47/646—Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent the entire peptide or protein drug conjugate elicits an immune response, e.g. conjugate vaccines
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1048—Glycosyltransferases (2.4)
- C12N9/1081—Glycosyltransferases (2.4) transferring other glycosyl groups (2.4.99)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/60—Medicinal preparations containing antigens or antibodies characteristics by the carrier linked to the antigen
- A61K2039/6031—Proteins
- A61K2039/6037—Bacterial toxins, e.g. diphteria toxoid [DT], tetanus toxoid [TT]
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K39/00—Medicinal preparations containing antigens or antibodies
- A61K2039/62—Medicinal preparations containing antigens or antibodies characterised by the link between antigen and carrier
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/24—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Enterobacteriaceae (F), e.g. Citrobacter, Serratia, Proteus, Providencia, Morganella, Yersinia
- C07K14/245—Escherichia (G)
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A50/00—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
- Y02A50/30—Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Medicinal Chemistry (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Epidemiology (AREA)
- Animal Behavior & Ethology (AREA)
- Immunology (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Pharmacology & Pharmacy (AREA)
- Genetics & Genomics (AREA)
- Mycology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Molecular Biology (AREA)
- Biotechnology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Virology (AREA)
- Biophysics (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Peptides Or Proteins (AREA)
- Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
- Gastroenterology & Hepatology (AREA)
- Medicinal Preparation (AREA)
- Polysaccharides And Polysaccharide Derivatives (AREA)
- Enzymes And Modification Thereof (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
재조합 숙주 세포를 사용하여 담체 단백질에 공유 결합된 O-항원 다당류의 바이오컨쥬게이트를 생성하는 방법이 제공된다. 본원에 기술된 방법에 사용되는 재조합 숙주 세포는 생성하고자 하는 O-항원 다당류 바이오컨쥬게이트에 따라 특정 올리고사카릴 트랜스퍼라제 효소를 인코딩한다. 올리고사카릴 트랜스퍼라제 효소는 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체일 수 있다. 또한, 바이오컨쥬게이트를 함유하는 조성물, 및 장외 병원성 대장균(ExPEC)에 대하여 대상체를 백신화시키기 위해 본원에 기술된 조성물을 사용하는 방법이 제공된다.
Description
관련 출원에 대한 교차 참조
본 출원은 2019년 3월 18일에 출원된 미국 가출원 번호 62/819,762에 대한 우선권을 주장하며, 그 개시 내용은 전체가 참조로 본원에 포함된다.
전자적으로 제출된 서열 목록 참조
본 출원은 생성 날짜가 2020년 3월 11일이며, 199 KB의 크기를 갖는 파일명 "004852_11612 Sequence_Listing"을 갖는 ASCII 형식의 서열 목록으로서 EFS-Web를 통해 전자적으로 제출된 서열 목록을 갖는다. EFS-Web을 통해 제출된 서열 목록은 사양의 일부이며, 전체가 참조로서 본원에 통합된다.
발명의 배경
장외 병원성 대장균(ExPEC) 균주는 일반적으로 공생 대장균 균주와 함께 인간의 위장관에 무해한 점유균이다. O-항원, 캡슐 및 편모 항원 혈청형(O:K:H로 약칭됨, 예를 들어 O25:K1:H4)에 의해 정의된 바와 같이 ExPEC가 많은 클론 계통에서 우세하지만, ExPEC 분리주는 혈청형으로 공생 분리주와 쉽게 구별할 수 없다. 공생 대장균과 달리, ExPEC 균주는 광범위한 독성 인자를 발현하여, 이들이 위장관을 점령하게 할 뿐만 아니라, 광범위한 장외 감염을 유발하며, 이는 입원 및 사망으로 인한 상당한 의료 비용 부담과 관련이 있다. 신생아, 노인 및 면역 저하 환자는 침습성 ExPEC 질병(IED)을 포함하는 ExPEC 감염에 특히 취약하다.
ExPEC 균주는 요로 감염(UTI)의 가장 흔한 원인이며, 수술 부위 감염 및 신생아 수막염의 중요한 원인이다. 균주는 또한 복부 및 골반 감염 및 병원내 폐렴과 관련이 있으며, 골수염, 연조직염 및 상처 감염과 같은 다른 장외 감염과 종종 관련된다. 이러한 모든 주요 감염 부위는 ExPEC 균혈증을 유발할 수 있다. ExPEC는 지역사회 발병 균혈증의 가장 흔한 원인이자 병원 균혈증의 주요 원인 병원체이며, 임상적으로 유의한 혈액 분리물의 약 17% 내지 37%에서 발견된다. ExPEC-양성 혈액 배양물을 갖는 환자는 일반적으로 패혈증 증후군, 중증 패혈증 또는 패혈성 쇼크를 겪는다. 세팔로스포린, 플루오로퀴놀론 및 트리메토프림/설파메톡사졸을 포함한 1차 항생제에 대한 ExPEC의 내성 증가가 관찰되었다. ExPEC 서열 유형 131(ST131)의 출현 및 급속한 글로벌 전파는 다중 약물 내성을 포함하는 약물 내성 증가의 주요 동인으로 간주된다. 이 클론은 모든 ExPEC 임상 분리주의 12.5% 내지 30%에서 발견되며, 대부분 혈청형 O25b:H4를 나타내며, 플루오로퀴놀론에 대한 높은 수준의 내성을 보여주며, 이는 종종 트리메토프림/설파메톡사졸 내성, 및 세팔로스포린에 대한 내성을 부여하는 광범위 베타-락타마제를 동반한다.
O-항원은 대장균을 포함하는 그람-음성 박테리아에서 세포벽 지질다당류(LPS)의 면역우세 구성요소를 포함한다. 현재 180개가 넘는 혈청학적으로 고유한 대장균 O-항원이 확인되었으며, 대부분의 ExPEC 분리주는 20개 미만의 O-항원 혈청형 내에 분류되었다. 전장 대장균 O-항원은 전형적으로 고도로 보존된 LPS 코어 구조에 부착된 약 10 내지 25개의 반복 당 단위를 포함하며, 각각의 구성요소는 각각 rfb 및 rfa 유전자 클러스터에서 주로 인코딩되는 효소에 의해 별도로 합성되었다. O-항원의 중합 후, O-항원 다당류 백본은 전형적으로 아세틸 또는 글루코스 잔기의 첨가를 통해 변형될 수 있다. 이러한 변형은 공통 다당류 백본을 공유하지만 측 분지가 상이한 항원적으로 구별되는 혈청형을 생성함으로써 혈청형 다양성을 효과적으로 증가시킨다. O-항원 변형 효소를 인코딩하는 유전자는 전형적으로 염색체의 rfb 클러스터 외부에 있으며, 어떤 경우에는 이러한 유전자는 용원성 박테리오파지 내에서 발견된다.
O4 혈청군에 속하는 ExPEC 분리주는 미국 및 EU 혈액 분리주의 현대 감시 연구에서 일반적으로 확인되었다. O4 다당류의 구조는 대장균 O4:K52 균주로부터 -->2) α-L-Rha (1->6) α-D-Glc (1->3) α-L-FucNAc (1->3) β-D-GlcNAc (1->로서 결정되었다(Jann et al., Carbohydr. Res. (1993) v. 248, pp.241-250). 구별되는 형태의 O4 다당류 구조는 O4:K3, O4:K6 및 O4:K12 균주에 대해 결정되었으며, 여기서 위의 구조는 다당류의 람노스 잔기에 연결된 α-D-Glc(1->3)의 첨가에 의해 변형되며(Jann et al., 1993, 상기 참조), 이러한 형태의 다당류는 이하에서 '글루코실화된 O4'로 지칭된다. 대장균 O4 균주 내의 O-항원 변형을 담당하는 효소는 확인되지 않았다.
ExPEC 감염을 예방하기 위한 백신 개발을 위한 노력은 O-항원 다당류 컨쥬게이트에 집중되었다. 12가 O-항원 컨쥬게이트 백신은 O-항원 다당류의 추출과 정제 및 탈독소화된 슈도모나스 애루기노사(Pseudomonas aeruginosa) 외독소 A에 대한 화학적 컨쥬게이션을 통해 합성되고, 1상 임상 연구에서 안전성 및 면역원성에 대해 테스트되었다(Cross et al., J. Infect Dis.(1994) v.170, pp.834-40). 이 후보 백신은 임상 용도로 허가된 적이 없다. 대장균의 바이오컨쥬게이션 시스템은 최근에 개발되었는데, 다당류 항원과 담체 단백질이 모두 생체 내에서 합성된 후 대장균에서 발현되는 캄필로박터 제주니(Campylobacter jejuni) 효소인 올리고사카릴 전이효소 PglB의 활성을 통해 생체 내에서 컨쥬게이션된다 (Wacker et al., Proc. Nat. Acad. Sci. (2006) v. 103, pp. 7088-93). 이 N-결합된 단백질 글리코실화 시스템은 담체 단백질에 다양한 다당류를 전달할 수 있어, 컨쥬게이트를 정제하는 간단한 방법을 허용한다.
바이오컨쥬게이션은 대장균 4가 O-항원 후보 백신을 위한 컨쥬게이트 다당류를 생산하는데 성공적으로 사용되었다(Poolman and Wacker, J. Infect. Dis. (2016) v.213(1), pp. 6-13). 그러나, 성공적인 ExPEC 백신의 개발은 우세한 혈청형의 보급을 필요로 하며, ExPEC 분리주의 서브세트에서 추가 O-항원 변형의 존재는 비변형 및 변형 LPS를 나타내는 분리주를 커버하는 데 있어서 추가 과제를 제시한다. 더욱이, 다중 혈청형을 커버하는 보다 복잡한 백신 조성물을 위한 다중 구성요소의 생산 효율이 점점 더 중요해지고 있으며, 따라서 특정 O-항원의 개별 바이오컨쥬게이트 생산의 개선이 여전히 필요하다.
발명의 개요
ExPEC 분리주 중 항생제 내성 증가 및 우세한 O-혈청형 중 추가 O-항원 변형의 존재의 관점에서, 이러한 감염에 대한 개선된 예방학적 및 치료학적 치료가 필요하다. 본 발명은 O-항원 변형 효소를 인코딩하는 유전자를 확인하여, 선택된 O-항원 변형을 포함하는 바이오컨쥬게이트를 비롯한 O-항원의 바이오컨쥬게이트를 합성할 수 있는 재조합 숙주 세포의 조작을 허용하는 것을 포함하는, 현대 임상 분리주의 유전자 조성물을 규정함으로써 이러한 요구를 충족시킨다. 또한, 본 발명의 한 양태에서, 올리고사카릴트랜스퍼라제(OST)의 변이체를 사용함으로써 특정 O-항원의 바이오컨쥬게이트의 개선된 생산을 위한 숙주 세포 및 방법이 예측할 수 없는 혈청형 의존적 방식으로 특정 대장균 O-항원의 바이오컨쥬게이트의 특정 OST 변이체의 사용 이점에 근거하여 제공된다. 이러한 OST 변이체의 사용은 또한 특정 경우에, 예를 들어 OST의 야생형 또는 다른 변이체를 사용하여 생성된 바이오컨쥬게이트와 비교하여 담체 단백질에 결합된 글리칸의 상대적 수를 증가시킴으로써 바이오컨쥬게이트의 글리코실화 패턴에 영향을 미칠 수 있으며, 따라서 이러한 방법에 의해 생성된 신규한 바이오컨쥬게이트는 또한 본 발명의 한 양태로서 제공된다.
일 양태에서, 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이 제공되며, 상기 방법은
(i) a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 숙주 세포를 배양하는 단계를 포함하며,
여기에서,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O8 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O18A 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하며,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
한 구체예에서, Ox-항원은 O1A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
한 구체예에서, Ox-항원은 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함한다. 한 구체예에서, Ox-항원은 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 Y77H 및 N311V를 포함한다. Ox-항원이 글루코실화된 O4 항원 다당류인 구체예에서, 재조합 숙주 세포는 바람직하게는, SEQ ID NO: 4에 대해 적어도 80% 동일성을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
한 구체예에서, Ox-항원은 O6A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
한 구체예에서, Ox-항원은 O8 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
한 구체예에서, Ox-항원은 O15 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
한 구체예에서, Ox-항원은 O16 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.
한 구체예에서, Ox-항원은 O18A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며, 바람직하게는 SEQ ID NO: 6의 아미노산 서열을 포함한다.
한 구체예에서, Ox-항원은 O75 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.
특정 양태에서, 담체 단백질에 공유 결합된 대장균 Ox-항원 다당류의 바이오컨쥬게이트를 제조하는 방법이 제공되며, 상기 방법은
(i) a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 숙주 세포를 배양하는 단계를 포함하며,
여기에서 PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하고,
여기에서, Ox-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고, Ox-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 표 1에 제시된 바와 같은 각각 화학식 (O1A), (O4-Glc+), (O6A), (O15), (O16) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구체예에서, 방법은 재조합 숙주 세포로부터 바이오컨쥬게이트를 분리하는 것을 추가로 포함한다.
특정 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사(P. aeruginosa)의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스(S. aureus)의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 선택된다.
특정 구체예에서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다. 바람직하게는, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 특정 구체예에서, 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.
특정 구체예에서, 재조합 숙주 세포는 대장균 세포, 예를 들어 대장균 K-12 균주, 예컨대 균주 W3110이다.
또 다른 양태에서, 본원에 기재된 담체 단백질에 공유 결합된 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법에 의해 생성된 바이오컨쥬게이트가 제공된다.
또 다른 양태에서, 이러한 바이오컨쥬게이트를 포함하는 조성물이 제공된다. 일부 구체예에서, 조성물은 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 이러한 바이오컨쥬게이트를 포함한다.
특정 구체예에서, 본 발명에 따른 조성물은 담체 단백질에 공유 결힙된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 글루코실화된 O4 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명에 따른 조성물은 적어도 담체 단백질에 공유 결힙된 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기서 O25B 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O25B)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명에 따른 조성물은 적어도 담체 단백질에 공유 결힙된 대장균 O2 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기에서 O2 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O2)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구체예에서, 본 발명의 조성물은 (i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트, (ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트, (iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, (iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트, (v) 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트, (vi) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트, (vii) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트, (viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트 및 (ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O8), (O15), (O16), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 이러한 조성물은 (x) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트를 추가로 포함하며, 여기에서 O18A 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O18A)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다. 특정 구체예에서, 본 발명의 조성물은 면역원성 조성물이다.
다른 양태에서, 본원에 기재된 바와 같은 바이오컨쥬게이트 또는 조성물을 대상체에게 투여하는 것을 포함하는, 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신화하는 방법이 제공된다. 또 다른 양태에서, 장외 병원성 대장균(ExPEC)에 대한 백신화에 사용하기 위한 본원에 기재된 바와 같은 그러한 바이오컨쥬게이트 또는 조성물이 제공된다.
다른 양태에서, 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 숙주 세포가 제공되며, 상기 재조합 숙주 세포는
(a) Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
(c) 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하며,
여기에서,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O18A 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하고,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
특정 구체예에서, Ox-항원은 O1A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 이러한 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다. 특정 구체예에서, Ox-항원은 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 Y77H 및 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다. Ox-항원이 글루코실화된 O4 항원 다당류인 특정 구체예에서, 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구체예에서, Ox-항원은 O6A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 O8 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 O15 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 O16 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 O18A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, Ox-항원은 O75 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, 담체 단백질이 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택되는 본 발명의 재조합 숙주 세포가 제공된다.
특정 구체예에서, 담체 단백질이 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인 본 발명의 재조합 숙주 세포가 제공된다. 이의 특정 구체예에서, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 특정 구체예에서, 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.
특정 구체예에서, 재조합 숙주 세포가 대장균 세포, 예를 들어 대장균 K-12 균주, 예를 들어 균주 W3110인 본 발명의 재조합 숙주 세포가 제공된다.
본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터는 대장균 O4 항원 다당류(표 1의 화학식 (O4-Glc-))를 생성하는 효소를 인코딩하며, SEQ ID NO: 9와 적어도 80%, 예를 들어, 적어도 90%, 예를 들어, 적어도 95%, 예를 들어, 적어도 98% 동일한 서열을 포함한다. 특정 구체예에서, rfb 유전자 클러스터는 SEQ ID NO: 9를 포함한다.
본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성시킬 수 있는 글루코실 트랜스퍼라제는 SEQ ID NO: 4에 대한 적어도 90%, 바람직하게는, 적어도 95%, 바람직하게는, 적어도 98% 서열 동일성을 갖는 아미노산을 갖는다. 특정 구체예에서, 글루코실 트랜스퍼라제는 SEQ ID NO: 4를 포함한다.
본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 트랜스로카제는 박토프레놀-연결된 글루코스를 전위시킬 수 있으며, SEQ ID NO: 7에 대해 적어도 90%, 바람직하게는 적어도 95%, 바람직하게는 적어도 98%의 서열 동일성을 갖는다. 특정 구체예에서, 트랜스로카제는 SEQ ID NO: 7을 포함한다.
본 발명에 따른 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 숙주 세포 및 방법에 대한 특정 구체예에서, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며, SEQ ID NO: 8에 대해 적어도 90%, 바람직하게는 적어도 95%, 바람직하게는 적어도 98%의 서열 동일성을 갖는다. 특정 구체예에서, 글리코실트랜스퍼라제는 SEQ ID NO: 8을 포함한다.
본 발명의 다음의 상세한 설명뿐만 아니라 전술한 요약은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명이 도면에 도시된 정확한 구체예로 제한되지 않음을 이해해야 한다.
도면에서:
도 1은 실시예 4에 기재된 바와 같이 Glc-변형된 O4 다당류 바이오컨쥬게이트로 면역화된 2마리의 토끼의 혈청에서 비변형된(GLC-) 또는 글루코스-변형된(GLC+) O4 LPS에 대한 ELISA IgG 역가를 보여주며; ELISA 역가는 4회 반복으로 결정되었다.
도 2는 실시예 4에 기술된 바와 같이 특성화된 gtrS 상태가 특성 규명된 대장균 O4 분리주에 대해 Glc-변형된 O4 바이오컨쥬게이트로 면역화된 토끼의 풀링된 혈청을 사용한 전체 세포 ELISA에서 IgG 역가를 보여준다; 다음 분리주는 gtrS-음성이었다: A2625, stGVXN4988, OC24784, OC24787 및 OC24788; 다음 분리주는 gtrS-양성이었다: Y1382, E551, OC24334, stGVXN4983, stGVXN4994 및 OC24794; 음성 대조군 균주 OC9487(ATCC 35383; 혈청형 O75)도 포함되었다.
도 3은 변형된 O4 다당류로 면역된 토끼의 풀링된 혈청으로 조사된 gtrS-양성 및 -음성 O4 분리주에서 추출한 LPS의 웨스턴 블롯을 보여준다.
도 4a 및 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체 반응을 보여준다; 도 4a는 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정된 혈청 항체 수준을 보여주고; 개별 역가(log10 EC50 역가) 및 GMT ± 95% CI를 보여주고; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다. 도 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트(4.0 μg)로 면역화 후 42일째에 수득된 혈청 샘플에서 항체의 기능성을 결정하기 위한 옵소닌식세포(OPK) 검정의 결과를 보여준다; Wilcoxon 순위 합 테스트 및 Bonferroni 보정; *P≤0.05, ***P≤0.0001.
도 5는 실시예 4에 기술된 바와 같은 3개의 다른 용량으로 면역화된 Sprague Dawley 래트에서 글루코실화된 O4(O4 Glc+)-EPA 바이오컨쥬게이트의 부스트 효과를 보여준다; 혈청 항체 수준은 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정되었다; 개별 역가(log10 EC50 역가)는 각 동물에 대해 제시된다; 데이터 포인트 사이의 선은 시간에 따라 각 동물에 대한 IgG 역가를 연결한다; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다; 다중 비교를 위한 Wilcoxon 부호 순위 테스트 및 Bonferroni 보정으로 통계 분석을 수행하였다 (14일 vs 0일, 4.0 μg/용량의 경우 P = 0.012; 42일 vs 0일, 모든 용량에 있어서 P = 0.006; 42일 vs 14일, 모든 용량에 있어서 P = 0.006);
도 6은 O4-Glc+-EPA 바이오컨쥬게이트에 의해 유도된 항체의 기능성을 보여준다; Sprague Dawley 래트를 4.00 μg/용량의 제형 완충액 또는 O4(Glc+)-EPA 바이오컨쥬게이트로 근육내 3회 면역화시켰다; 항체의 기능성은 O4(Glc+) 및 O4(Glc-) 대장균 균주를 사용하여 옵소닌식세포 치사 검정(OPKA)에 의해 결정되었다; 개별 옵소닉 역가(OI) 및 GMT ± 95% CI가 제시된다.
도 7은 주변세포질 분획에서 O4-Glc+ 바이오컨쥬게이트를 검출하기 위해 모노클로날 항체를 사용하는, 블롯-유사 이미지로 각 시험된 균주에 대한 O4-Glc+ 바이오컨쥬게이트 생성을 가시화하는 PglB 스크린의 모세관 전기영동 판독을 보여준다. 모노-글리코실화된 생성물 약 180 kDa, 디-글리코실화된 생성물 약 320 kDa 및 트리-글리코실화된 생성물 약 450 kDa. A) 1차 스크리닝 라운드. 레인 3의 Wt PglB, 레인 2 및 4의 N311V-PglB, 레인 1의 빈 대조군 균주 및 레인 5 및 6의 기타 PglB 변이체. B) 2차 스크리닝 라운드. 레인 3의 N311V PglB, 레인 9의 N311V+Y77H PglB, 레인 1 및 2의 빈 대조군 균주, 나머지 레인의 기타 PglB 변이체.
도 8은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 보여준다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회 근육내 면역화 처리되었다. ExPEC10V 백신은 3개의 상이한 농도(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11)로 투여되었고, 대조군에는 식염수만 제공되었다(군 4, 0.9% (w/v) 염화나트륨 용액). 항체 수준은 0일(백신화 전) 및 14, 27 및 42일째(백신화 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI이 제시된다. 다중 비교를 위한 Bonferroni 보정과 Wilcoxon 순위 합계 테스트. ExPEC10V 백신화된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4) 비교. *p ≤ 0.05, **p ≤ 0.01; ***p ≤ 0.001; ****p ≤ 0.0001. LOD: 검출 한계.
도 9는 ExPEC10V에 의해 유도된 항체 반응을 보여준다. 뉴질랜드 백색 토끼는 ExPEC10V(105.6 μg 총 다당류) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회 근육내 면역화 처리되었다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가와 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 테스트를 이용한 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. *P ≤0.05, ****P ≤ 0.0001.
도 10은 인간에서 ExPEC10V 백신을 사용한 1/2a 상 임상 시험에 대한 전체 연구 설계를 보여준다. 도 10a는 코호트 1에 대한 전체 연구 설계를 보여주며, 도 10b는 코호트 2에 대한 전체 연구 설계를 보여준다. 자세한 내용은 실시예 11을 참조한다.
도면에서:
도 1은 실시예 4에 기재된 바와 같이 Glc-변형된 O4 다당류 바이오컨쥬게이트로 면역화된 2마리의 토끼의 혈청에서 비변형된(GLC-) 또는 글루코스-변형된(GLC+) O4 LPS에 대한 ELISA IgG 역가를 보여주며; ELISA 역가는 4회 반복으로 결정되었다.
도 2는 실시예 4에 기술된 바와 같이 특성화된 gtrS 상태가 특성 규명된 대장균 O4 분리주에 대해 Glc-변형된 O4 바이오컨쥬게이트로 면역화된 토끼의 풀링된 혈청을 사용한 전체 세포 ELISA에서 IgG 역가를 보여준다; 다음 분리주는 gtrS-음성이었다: A2625, stGVXN4988, OC24784, OC24787 및 OC24788; 다음 분리주는 gtrS-양성이었다: Y1382, E551, OC24334, stGVXN4983, stGVXN4994 및 OC24794; 음성 대조군 균주 OC9487(ATCC 35383; 혈청형 O75)도 포함되었다.
도 3은 변형된 O4 다당류로 면역된 토끼의 풀링된 혈청으로 조사된 gtrS-양성 및 -음성 O4 분리주에서 추출한 LPS의 웨스턴 블롯을 보여준다.
도 4a 및 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체 반응을 보여준다; 도 4a는 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정된 혈청 항체 수준을 보여주고; 개별 역가(log10 EC50 역가) 및 GMT ± 95% CI를 보여주고; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다. 도 4b는 글루코실화된 O4(O4-Glc+)-EPA 바이오컨쥬게이트(4.0 μg)로 면역화 후 42일째에 수득된 혈청 샘플에서 항체의 기능성을 결정하기 위한 옵소닌식세포(OPK) 검정의 결과를 보여준다; Wilcoxon 순위 합 테스트 및 Bonferroni 보정; *P≤0.05, ***P≤0.0001.
도 5는 실시예 4에 기술된 바와 같은 3개의 다른 용량으로 면역화된 Sprague Dawley 래트에서 글루코실화된 O4(O4 Glc+)-EPA 바이오컨쥬게이트의 부스트 효과를 보여준다; 혈청 항체 수준은 면역화 후 0, 14 및 42일째에 ELISA에 의해 측정되었다; 개별 역가(log10 EC50 역가)는 각 동물에 대해 제시된다; 데이터 포인트 사이의 선은 시간에 따라 각 동물에 대한 IgG 역가를 연결한다; 회색 점선은 임계값을 나타내며, 이를 넘는 샘플의 희석 곡선은 4PL 피팅을 갖는다; 다중 비교를 위한 Wilcoxon 부호 순위 테스트 및 Bonferroni 보정으로 통계 분석을 수행하였다 (14일 vs 0일, 4.0 μg/용량의 경우 P = 0.012; 42일 vs 0일, 모든 용량에 있어서 P = 0.006; 42일 vs 14일, 모든 용량에 있어서 P = 0.006);
도 6은 O4-Glc+-EPA 바이오컨쥬게이트에 의해 유도된 항체의 기능성을 보여준다; Sprague Dawley 래트를 4.00 μg/용량의 제형 완충액 또는 O4(Glc+)-EPA 바이오컨쥬게이트로 근육내 3회 면역화시켰다; 항체의 기능성은 O4(Glc+) 및 O4(Glc-) 대장균 균주를 사용하여 옵소닌식세포 치사 검정(OPKA)에 의해 결정되었다; 개별 옵소닉 역가(OI) 및 GMT ± 95% CI가 제시된다.
도 7은 주변세포질 분획에서 O4-Glc+ 바이오컨쥬게이트를 검출하기 위해 모노클로날 항체를 사용하는, 블롯-유사 이미지로 각 시험된 균주에 대한 O4-Glc+ 바이오컨쥬게이트 생성을 가시화하는 PglB 스크린의 모세관 전기영동 판독을 보여준다. 모노-글리코실화된 생성물 약 180 kDa, 디-글리코실화된 생성물 약 320 kDa 및 트리-글리코실화된 생성물 약 450 kDa. A) 1차 스크리닝 라운드. 레인 3의 Wt PglB, 레인 2 및 4의 N311V-PglB, 레인 1의 빈 대조군 균주 및 레인 5 및 6의 기타 PglB 변이체. B) 2차 스크리닝 라운드. 레인 3의 N311V PglB, 레인 9의 N311V+Y77H PglB, 레인 1 및 2의 빈 대조군 균주, 나머지 레인의 기타 PglB 변이체.
도 8은 뉴질랜드 백색 토끼에서 ExPEC10V 백신에 의해 유도된 항체 반응을 보여준다. 동물은 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회 근육내 면역화 처리되었다. ExPEC10V 백신은 3개의 상이한 농도(군 1: 고용량, 군 2: 중간 용량 및 군 3: 저용량, 표 11)로 투여되었고, 대조군에는 식염수만 제공되었다(군 4, 0.9% (w/v) 염화나트륨 용액). 항체 수준은 0일(백신화 전) 및 14, 27 및 42일째(백신화 후)에 ELISA에 의해 측정되었다. 개별 역가(EC50 역가) 및 기하 평균 역가(GMT) ± 95% CI이 제시된다. 다중 비교를 위한 Bonferroni 보정과 Wilcoxon 순위 합계 테스트. ExPEC10V 백신화된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4) 비교. *p ≤ 0.05, **p ≤ 0.01; ***p ≤ 0.001; ****p ≤ 0.0001. LOD: 검출 한계.
도 9는 ExPEC10V에 의해 유도된 항체 반응을 보여준다. 뉴질랜드 백색 토끼는 ExPEC10V(105.6 μg 총 다당류) 또는 0.9% w/v 염화나트륨 용액(대조군)으로 3회 근육내 면역화 처리되었다. IgG 역가는 1일(면역화 전, n = 20/군), 31일(면역화 후, n = 20/군) 및 50일(면역화 후, n = 10/군)에 ELISA에 의해 결정되었다. 플롯은 각 군에 대한 개별 역가와 기하 평균 ± 95% 신뢰 구간을 보여준다. ExPEC10V와 대조군 사이의 IgG 역가의 차이는 우도비 테스트를 이용한 Tobit 모델을 사용하여 분석되었다. P-값 ≤ 0.05는 유의한 것으로 간주되었다. *P ≤0.05, ****P ≤ 0.0001.
도 10은 인간에서 ExPEC10V 백신을 사용한 1/2a 상 임상 시험에 대한 전체 연구 설계를 보여준다. 도 10a는 코호트 1에 대한 전체 연구 설계를 보여주며, 도 10b는 코호트 2에 대한 전체 연구 설계를 보여준다. 자세한 내용은 실시예 11을 참조한다.
발명의 상세한 설명
다양한 간행물, 기사 및 특허가 배경 및 명세서 전반에 걸쳐 인용되거나 설명된다; 이들 참고 문헌 각각은 그 전체가 참고로 본원에 포함된다. 본 명세서에 포함된 문서, 행위, 재료, 장치, 물품 등에 대한 논의는 본 발명의 내용을 제공하기 위한 것이다. 이러한 논의는 이러한 내용 중 일부 또는 전부가 개시된 또는 청구된 임의의 발명과 관련하여 종래 기술의 일부를 형성한다는 것을 인정하는 것이 아니다.
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 본 발명이 속하는 분야의 당업자에게 일반적으로 이해되는 것과 동일한 의미를 갖는다. 그렇지 않으면, 본원에 사용된 특정 용어는 명세서에 제시된 의미를 갖는다.
본 명세서 및 첨부된 청구범위에서 사용된 바와 같이, 단수 형태("a", "an" 및 "the")는 문맥이 달리 명백하게 지시하지 않는 한 복수의 대상을 포함한다는 점에 유의해야한다.
달리 나타내지 않는 한, 일련의 요소 앞에 오는 용어 "적어도"는 일련의 모든 요소를 나타내는 것으로 이해되어야 한다.
당업자는 단지 관례적인 실험을 사용하여 본원에 설명된 본 발명의 특정 구체예에 대한 많은 등가물을 인식하거나 확인할 수 있을 것이다. 이러한 등가물은 본 발명에 포함되는 것으로 의도된다.
문맥상 달리 요구되지 않는 한, 본 명세서 및 이어지는 청구 범위 전반에서, 용어 "포함하다" 및 "포함한다" 및 "포함하는"과 같은 변형은 언급된 정수 또는 단계 또는 정수의 군의 포함하나, 임의의 다른 정수 또는 단계 또는 정수 또는 단계의 군을 배제하지 않는 것으로 이해될 것이다. 본원에서 사용되는 경우, 용어 "포함하는(comprising)"은 용어 "함유하는" 또는 "포함하는"이라는 용어로 대체될 수 있거나, 때때로 본 명세서에서 사용될 때 "갖는"이라는 용어로 대체될 수 있다.
본원에 사용되는 경우, "구성되는"은 청구항 요소에 명시되지 않은 임의의 요소, 단계 또는 성분을 배제한다. 본원에 사용되는 경우, "필수적 요소로 하여 구성되는"은 청구범위의 기본적이고 신규한 특성에 실질적으로 영향을 미치지 않는 재료 또는 단계를 배제하지 않는다. 본 발명의 양태 또는 구체예의 맥락에서 본원에 사용될 때마다 "포함하는", "함유하는", "포함하는" 및 "갖는"의 전술된 임의의 용어는 용어 "로 구성된" 또는 "필수적 요소로 하여 구성되는"으로 대체되어 개시내용의 범위를 변경시킬 수 있다.
본원에 사용된 바와 같이, 다수의 인용된 요소들 사이의 접속어 "및/또는"은 개별 및 조합된 옵션 모두를 포괄하는 것으로 이해된다. 예를 들어, 두 요소가 "및/또는"으로 연결되는 경우, 첫 번째 옵션은 두 번째 요소 없이 첫 번째 요소의 적용 가능성을 나타낸다. 두 번째 옵션은 첫 번째 요소가 없는 두 번째 요소의 적용 가능성을 나타낸다. 세 번째 옵션은 첫 번째 요소와 두 번째 요소의 함께 적용할 수 있는 가능성을 나타낸다. 이들 옵션 중 어느 하나는 그 의미 내에 속하는 것으로 이해되며, 따라서 본 원에 사용되는 용어 "및/또는"의 요건을 충족시킨다. 하나 초과의 옵션의 동시 적용 가능성도 그 의미에 속하는 것으로 이해되므로, 용어 "및/또는"의 요건을 충족한다.
대장균 O4 혈청형(Jann et al., 1993) 내에서 O-항원 구조적 변형, 즉 글루코스 분지의 확인은 이 혈청형 내에서 박테이라 분리주를 표적으로 하는 글리코컨쥬게이트 백신의 발견 및 개발에 대한 도전을 제시한다. O4 O-항원의 변형되지 않은(글루코스 측-분지를 갖지 않음) 형태와 변형된(글루코스 측-분지를 가짐) 형태를 발현하는 임상적 현대 O4 분리주의 비율은 알려져 있지 않다. 이 특성에 대한 정보를 얻는 것은 관련 항원 구조를 선택하는 데 중요하다. 또한, 한 형태의 O4 다당류에 대해 유도된 항체를 유발하는 백신이 다른 형태와 교차 반응하는 정도는 결정되지 않았다. 지질 A가 없는 O-항원의 정제 및 담체 단백질에 대한 후속 화학적 컨쥬게이션은 길고 힘든 공정이다. 추가로, 정제, 지질 A 탈독소화 및 화학적 컨쥬게이션 공정은 에피토프의 손실, 항원 이질성 및 컨쥬게이션된 다당류의 감소된 면역원성을 발생시킬 수 있다. 바이오컨쥬게이션에 의한 글리코컨쥬게이트의 합성은 이러한 고전적 정제 및 화학적 컨쥬게이션의 한계를 극복할 수 있지만, 글루코스-분지된 O4 O-항원의 생체내 합성은 rfb 유전자 클러스터의 외부에 있는 다당류 분지 효소의 활성을 필요로 한다. 현재까지 O4 대장균 균주에서 글루코스-분지를 담당하는 O-항원 변형 효소는 확인되지 않았다. PglB를 발현하는 바이오컨쥬게이션 대장균 균주 내로의 O4 rfb 유전자 클러스터 클로닝은 글루코스-분지된 O4 글리코컨쥬게이트를 합성하는데 충분하지 않을 것이며, 그보다는 단지 비-글루코스-분지된 O4 바이오컨쥬게이트(이의 글리칸의 구조는 표 1의 화학식 (O4)에 제시됨)를 생성할 것이다. 본원에 사용된 바와 같은 용어 "글루코실화된 O4", "글루코스-분지된 O4", "O4 Glc+" 및 "Glc+ O4" O-항원은 글루코스 측-분지를 갖는 O4 O-항원을 나타내며, 이의 구조는 표 1의 화학식 (O4-Glc+)에 제시된다.
대장균 O4 항원 다당류의 글루코스 분지를 담당하는 O-항원 변형 효소를 인코딩하는 유전자가 본원에 개시된다. 또한, 생체내 담체 단백질에 공유 결합된 글루코실화된 O4 항원 다당류를 포함하는 바이오컨쥬게이트를 생성할 수 있는 효소를 인코딩하는 핵산을 포함하는 숙주 세포, 예를 들어 재조합으로 조작된 숙주 세포가 본원에 개시된다. 이러한 숙주 세포는 담체 단백질에 연결된 글루코실화된 O4 항원을 포함하는 바이오컨쥬게이트를 생성하는데 사용될 수 있으며, 이는 예를 들어, 치료학적 및/또는 예방학적 조성물(예를 들어, 백신)의 제형에 사용될 수 있다. 다른 대장균 항원(예를 들어, O1, O2, O6, O8, O15, O16, O18, O25, 및/또는 O75 항원 다당류 및 이의 하위혈청형)과 조합된 또는 단독의 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 조성물이 본원에 추가로 제공된다. 조성물은 예방학적 및/또는 치료학적 방법, 예를 들어 대장균으로의 감염에 대한 숙주의 백신화에 사용될 수 있으며, 항체의 발생에 유용하며, 이는 예를 들어, 치료학적 방법, 예컨대 대상체의 면역화에 사용될 수 있다.
본원에 사용된 바와 같이, 용어 "O-항원", "O-항원 다당류", "O-항원 당류" 및 "OPS"는 그램-음성 박테리아의 O-항원을 나타낸다. 전형적으로, O-항원은 면역원성 반복 다당류 단위의 폴리머이다. 특정 구체예에서, 용어 "O-항원", "O-항원 다당류" 및 "OPS"는 대장균의 O-항원을 나타낸다. 대장균의 다른 혈청형은 다른 O-항원을 발현한다. 대장균에서, O-항원 생물발생과 관련된 유전자 생성물은 rfb 유전자 클러스터에 의해 인코딩된다.
본원에 사용된 바와 같은, "rfb 클러스터" 및 "rfb 유전자 클러스터"는 O-항원 백본 구조를 합성할 수 있는 효소 기구를 인코딩하는 유전자 클러스터를 나타낸다. 용어 rfb 클러스터는 임의의 O-항원 생합성 클러스터에 적용할 수 있으며, 바람직하게는 에스체리치아 속, 특히 대장균으로부터의 유전자 클러스터를 나타낸다.
본원에 사용된 바와 같은 용어 "O1A"는 대장균의 O1A 항원(대장균 혈청형 O1의 하위혈청형)을 나타낸다. 용어 "O2"는 대장균의 O2 항원을 나타낸다(대장균 혈청형 O2). 용어 "O6A"는 대장균의 O6A 항원을 나타낸다(대장균 혈청형 O6의 하위혈청형). 용어 "O8"은 대장균의 O8 항원을 나타낸다(대장균 혈청형 O8). 용어 "O15"는 대장균의 O15 항원을 나타낸다(대장균 혈청형 O15). 용어 "O16"은 대장균의 O16 항원을 나타낸다(대장균 혈청형 O16). 용어 "O18A"는 대장균의 O18A 항원을 나타낸다(대장균 혈청형 O18의 하위혈청형). 용어 "O25B"는 대장균의 O25B 항원(대장균 혈청형 O25의 하위혈청형)을 나타낸다. 용어 "O75"는 대장균의 O75 항원을 나타낸다(대장균 혈청형 O75).
본 출원 전반에 걸쳐 언급된 대장균 O-항원 다당류의 구조는 하기 표 1에 제시되어 있다. 각 대장균 O-항원 다당류에 대한 단일 반복 단위가 제시된다.
표 1: 대장균 O-항원 다당류의 구조
1 각각의 n은 독립적으로 1 내지 100, 예컨대 1-50, 1-40, 1-30, 1-20, 및 1-10, 3-50, 3-40, 예컨대 적어도 5, 예컨대 5-40, 예를 들어 7-30, 예를 들어 7-25, 예를 들어 10-20의 정수이지만, 일부 경우에는 1 내지 2일 수 있다.
본원에 기재된 모든 단당류는 당업계에 공지된 이들의 공통의 의미를 갖는다. 단당류는 D 또는 L 배열을 가질 수 있다. D 또는 L이 지정되지 않은 경우, 당은 D 배열을 갖는 것으로 이해된다. 전형적으로 단당류는 당업계에 일반적으로 알려져 있고 사용되는 약어로 언급된다. 예를 들어, Glc는 글루코스를 나타내며; D-Glc는 D-글루코스를 나타내며; L-Glc는 L-글루코스를 나타낸다. 단당류에 대한 다른 일반적인 약어는 다음을 포함한다: Rha, 람노스; GlcNAc, N-아세틸글루코사민; GalNAc, N-아세틸갈락토사민; Fuc, 푸코스; Man, 만노스; Man3Me, 3-O-메틸-만노스; Gal, 갈락토스; FucNAc, N-아세틸푸코사민; 및 Rib, 리보스. 접미사 "f"는 푸라노스를 나타내고, 접미사 "p"는 피라노스를 나타낸다.
O-항원과 관련하여 사용된 용어 "RU", "반복 단위" 및 "반복하는 단위"는 생체내에서 세포 기구(예를 들어, 글리코실트랜스퍼라제)에 의해 합성되는 것으로서 O-항원의 생물학적 반복 단위(BRU)를 나타낸다. O-항원의 RU의 수는 혈청형에 따라 다를 수 있으며, 본 발명의 구체예에서, 일반적으로 약 1-100 RU, 바람직하게는 약 1 내지 50 RU, 예컨대 1-50 RU, 1-40 RU, 1-30 RU, 1-20 RU 및 1-10 RU, 및 더욱 바람직하게는 적어도 3 RU, 적어도 4 RU, 적어도 5 RU, 예컨대 3-50 RU, 바람직하게는 5-40 RU, 예를 들어 7-25 RU , 예를 들어 10-20 RU로 다양하다. 그러나, 어떤 경우에는 O-항원의 RU 수는 1-2일 수 있다. 본원에 구체적으로 기술된 각 O-항원의 구조는 RU의 수를 지정하는 변수 "n"을 갖는 하나의 RU를 함유하는 것으로 나타난다. 본 발명의 바이오컨쥬게이트의 각각의 O-항원 다당류에서, n은 독립적으로 1-100의 정수, 예컨대 1-50, 1-40, 1-30, 1-20, 1-10, 바람직하게는 적어도 3, 더욱 바람직하게는 적어도 5, 예컨대 3-50, 바람직하게는 5-40(예를 들어, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 또는 40)이며, 어떤 경우에는 1-2일 수 있다. 일부 구체예에서, n은 독립적으로 약 7-25, 예를 들어 약 10-20의 정수이다. 값은 조성물 중 개별 O-항원 다당류 마다 다를 수 있으며, 평균값으로서 제공되며, 즉, 바이오컨쥬게이트가 독립적으로 5-40의 정수인 n을 갖는 것으로 본원에 기재된 경우, 조성물은 5-40개 반복 단위를 갖는 O-항원 다당류를 대부분 함유하나, 또한 5개 미만의 반복 단위 또는 40개 초과의 반복 단위를 갖는 일부 O-항원 다당류를 함유할 수 있다.
용어 "글리코컨쥬게이트"는 단백질, 펩티드, 지질 등을 포함하지만 이에 제한되지 않는 다른 화학종에 연결된 당 또는 당류 항원(예를 들어, 올리고당류 및 다당류)-단백질 컨쥬게이트를 나타낸다. 글리코컨쥬게이트는 화학적으로, 예를 들어 단백질과 당 또는 당류 항원의 화학적(합성) 결합에 의해 제조될 수 있다. 용어 글리코컨쥬게이트는 또한 바이오컨쥬게이트를 포함한다.
용어 "바이오컨쥬게이트"는 숙주 세포 배경, 바람직하게는 박테리아 숙주 세포, 예를 들어 대장균 숙주 세포에서 제조된 단백질(예를 들어, 담체 단백질) 및 당 또는 당류 항원(예를 들어, 올리고당류 및 다당류) 사이의 컨쥬게이트를 나타내며, 여기서 숙주 세포 기구는 항원을 단백질(예를 들어, N-결합)에 연결한다. 바람직하게는, 용어 "바이오컨쥬게이트"는 숙주 세포 배경에서 제조된 단백질(예를 들어, 담체 단백질)과 O-항원, 바람직하게는 대장균 O-항원(예를 들어, O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B, O75 등) 사이의 컨쥬게이트를 나타내며, 여기에서 숙주 세포 기구는 항원을 단백질(예를 들어, N-결합)에 연결한다. 바이오컨쥬게이트는 숙주 세포 기구에 의해 숙주 세포에서 제조되기 때문에, 항원과 단백질은 바이오컨쥬게이트에서 글리코시드 연결 또는 결합을 통해 공유 결합된다. 바이오컨쥬게이트는 O-항원을 합성하고/하거나 O-항원을 표적 단백질에 연결하는 데 필요한 세포 기구를 발현하도록 조작된 재조합 숙주 세포에서 제조될 수 있다. 본원에 기술된 바와 같은 바이오컨쥬게이트는 글리칸이 박테리아 세포벽으로부터 정제된 후 담체 단백질에 화학적으로 커플링되는, 화학적으로 제조된 글리코컨쥬게이트와 비교해 유리한 특성을 갖는데, 예를 들어, 바이오컨쥬게이트는 제조시 더 적은 화학물질을 필요로 하며, 생성된 최종 생성물에 있어서 더욱 일관되며, 자유(즉, 담체 단백질에 결합되지 않은) 글리칸을 덜 함유하거나 함유하지 않는다. 따라서, 전형적인 구체예에서, 바이오컨쥬게이트는 화학적으로 생성된 글리코컨쥬게이트보다 선호된다.
용어 "약"은 숫자와 함께 사용되는 경우 언급된 숫자의 ±1, ±5 또는 ±10% 이내의 임의의 수를 나타낸다.
용어 "퍼센트(%) 서열 동일성" 또는 "% 동일성"은 아미노선 서열의 전체 길이를 구성하는 아미노산 잔기의 수와 비교할때 2개 이상의 정렬된 아미노산 서열의 동일한 아미노산의 일치("히트")의 수를 설명한다. 다시 말해서, 2개 이상의 서열에 있어서, 당업계에 공지된 바와 같은 서열 비교 알고리즘을 사용하여 측정할 때 최대 상응성에 대해 비교하고 정렬될 경우 또는 수동으로 정렬되거나 시각적으로 검사할 경우, 정렬을 사용하여 동일한 (예를 들어, 90%, 95%, 97% 또는 98% 동일성) 아미노산 잔기의 백분율이 결정될 수 있다. 따라서, 서열 동일성을 결정하기 위해 비교되는 서열은 아미노산의 치환(들), 부가(들) 또는 결실(들)에 의해 상이할 수 있다. 단백질 서열을 정렬하는데 적절한 프로그램은 당업자에게 알려져 있다. 예를 들어, 단백질 서열의 서열 동일성 백분율은 예를 들어, NCBI BLAST 알고리즘을 사용하는 CLUSTALW, Clustal Omega, FASTA 또는 BLAST와 같은 프로그램으로 결정될 수 있다(Altschul SF, et al (1997), Nucleic Acids Res. 25:3389-3402).
예를 들어, 아미노산 서열에 있어서, 서열 동일성 및/또는 유사성은 비제한적으로 문헌 [Smith and Waterman, 1981, Adv. Appl. Math. 2:482]의 국소 서열 동일성 알고리즘, 문헌[Needleman and Wunsch, 1970, J. Mol. Biol. 48:443]의 서열 동일성 정렬 알고리즘, 문헌 [Pearson and Lipman, 1988, Proc. Nat. Acad. Sci. U.S.A. 85:2444]의 유사성 방법에 대한 조사, 이들 알고리즘의 컴퓨터 구현(GAP, BESTFIT, FASTA, and TFASTA in the Wisconsin Genetics Software Package, Genetics Computer Group, 575 Science Drive, Madison, Wis.), 문헌 [Devereux et al, 1984, Nucl. Acid Res. 12:387-395]에 기술된 Best Fit 서열 프로그램을 포함하는 당업계 공지된 표준 기술을 이용하여, 바람직하게는 디폴트 세팅을 사용하여 또는 검사에 의해 결정될 수 있다. 특정 구체예에서, 퍼센트 동일성은 다음 파라미터에 기초하여 FastDB에 의해 계산된다: 1의 불일치 페널티; 1의 갭 페널티; 0.33의 갭 크기 패널티; 및 30의 합류 페널티("Current Methods in Sequence Comparison and Analysis," Macromolecule Sequencing and Synthesis, Selected Methods and Applications, pp 127-149(1988), Alan R. Liss, Inc.).
유용한 알고리즘의 또 다른 예는 하기 문헌에 기술된 BLAST 알고리즘이다: [Altschul et al, 1990, J. Mol. Biol. 215:403-410; Altschul et al, 1997, Nucleic Acids Res. 25:3389-3402; and Karin et al, 1993, Proc. Natl. Acad. Sci. U.S.A. 90:5873-5787]. 특히 유용한 BLAST 프로그램은 문헌 [Altschul et al, 1996, Methods in Enzymology 266:460-480]에서 얻은 WU-BLAST-2 프로그램이다. WU-BLAST-2는 대부분 기본값으로 설정되는 여러 검색 파라미터를 사용한다.
추가적인 유용한 알고리즘은 문헌[Altschul et al,1993, Nucl. Acids Res. 25:3389-3402]에 의해 보고된 바와 같은 갭핑된 BLAST이다.
용어 "침습성 장외 병원성 대장균(ExPEC) 질환(IED)"은 본원에서 전신 박테리아 감염과 일치하는 급성 질환으로 정의되며, 이는 혈액 또는 기타 정상적으로 멸균된 신체 부위로부터의 대장균의 분리 및 식별에 의해, 또는 침습성 질환(전신염증반응증후군(SIRS), 패혈증 또는 패혈성 쇼크)의 징후 및 증상이 있고 식별 가능한 다른 감염원이 없는 환자의 소변으로부터의 대장균의 분리 및 식별에 의해 미생물학적으로 확인된다.
대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트
일 양태에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트가 본원에 제공된다. 본원에 사용된 바와 같은 용어 "O4"는 대장균으로부터의 O4 항원(대장균 혈청형 O4)을 지칭한다. O-항원 구조적 변형은 대장균 O4 혈청형 내에 존재하는 것으로 알려져 있다. 특히, 일부 O4 혈청형은 분지된 글루코스 단위를 갖는 변형된 O-항원을 발현한다. 본원에 사용된 "글루코실화된 O4 항원", "글루코실화된 O4 항원 다당류", "O4-Glc+ 항원 다당류" 및 "O4-Glc+ 항원"은 글루코스 분지를 갖는 O4 항원(예를 들어, 대장균 O4 항원)을 나타내며, 여기서 D-글루코스는 반복 단위 L-Rha→D-Glc→L-FucNAc→D-GlcNAc에서 L-람노스에 연결된다. 특정 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O4-Glc+)의 구조를 포함하며, 여기서 n은 1 내지 100의 정수이다. 바람직한 구체예에서, n은 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
글루코스 분지 상태와 무관하게 대장균 O4 균주는 O4 항원 다당류의 생성을 담당하는 유전자를 인코딩하는 실질적으로 동일한 rfb 유전자 클러스터를 수반한다. 그러나, 글루코스 분지를 갖는 변형된 O4 항원의 생체내 합성은 rfb 유전자 클러스터의 외부에 있는 다당류 분지 효소의 활성을 필요로 한다. 본 발명자들이 아는 한, O4 항원의 글루코스 변형을 담당하는 다당류 분지 효소의 정체는 현재까지 알려지지 않은 채로 남아 있다. 여기서, 본 발명자들은 O4 항원의 글루코스 변형을 담당하는 다당류 분지 효소의 서열을 발견하였다. 이 효소의 확인은 글루코스 분지를 갖는 변형된 O4 항원 다당류의 바이오컨쥬게이트의 생성을 가능하게 한다. O4 항원 다당류의 글루코스 변형된 형태는 우세한 혈청형에 존재하며, 따라서 예를 들어 예방학적 또는 치료학적 용도를 위해 개선된 면역 반응을 제공하는 데 사용될 수 있다.
특히, O4 항원을 글루코실화하는 대장균 혈청형 O4에 특이적인 글루코실트랜스퍼라제 효소를 인코딩하는 gtrS 유전자의 서열이 본원에서 제공된다. 일반적으로, gtrA, gtrB 및 gtrS 유전자는 O-항원 글루코실화를 담당하는 효소를 인코딩한다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형 특이적 O-항원 글루코실 트랜스퍼라제를 인코딩한다. 대장균 혈청형 O4의 gtrS 유전자는 글루코스 분지를 도입함으로써 O4 항원을 변형하는 GtrS 효소를 인코딩한다. O4 혈청형의 현대 임상 대장균 분리주의 특성 규명으로 테스트된 시험된 분리주의 78%에서 gtrS의 존재가 드러났으며, 이는 글루코스 잔기의 추가로 변형된 대장균 O4 항원 다당류가 현재 감염 분리주에서 우세함을 나타낸다.
한 구체예에서, SEQ ID NO: 4의 아미노산 서열을 포함하는 GtrS 글루코실트랜스퍼라제를 인코딩하는 대장균 혈청형 O4로부터의 gtrS 유전자의 핵산이 본원에 제공된다. 또 다른 구체예에서, gtrS 핵산은 SEQ ID NO: 4의 아미노산 서열과 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한, 바람직하게는 SEQ ID NO: 4의 아미노산 서열과 98%, 99% 또는 100% 동일한 대장균 혈청형 O4로부터의 GtrS 단백질을 인코딩한다. SEQ ID NO: 4의 아미노산 서열과 적어도 80% 동일한 GtrS 단백질은 대장균 O4 항원 다당류를 특정적으로 글루코실화하여 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 갖는 글루코실화된 O4 항원을 얻을 수 있다. 당업자는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 SEQ ID NO: 4의 GtrS 단백질의 변이된 형태를 만들고, 이러한 서열을 본 개시 내용에 비추어 볼 때 대장균 O4 항원의 글루코실화 활성에 대해 테스트할 수 있을 것이다. 대장균 혈청형 O4의 글루코실 트랜스퍼라제 gtrS 유전자를 인코딩하는 핵산을 포함하는 재조합 숙주 세포, 및 글루코스 변형된 O4 항원 다당류 및 이의 바이오컨쥬게이트의 생성에서 상기 재조합 숙주 세포의 사용은 하기 더욱 상세히 기재되어 있다.
각각 박토프레놀-연결된 글루코스 트랜스로카제(GtrA, 내부 막 위의 박토프레놀-연결된 글루코스를 주변 세포질로 뒤집음) 및 박토프레놀 글루코실 트랜스퍼라제(GtrB, 글루코스를 박토프레놀에 연결)로 기능하는 gtrA 및 gtrB 인코딩된 단백질에 대한 서열은 각각 SEQ ID NO: 7 및 8과 적어도 약 80% 동일한 아미노산 서열을 포함할 수 있다. 특정 구체예에서, SEQ ID NO: 7 및 8과 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 각각 GtrA 및 GtrB 단백질을 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제 활성을 갖는 핵산 서열이 또한 본 발명의 숙주 세포에 존재하며, 이는 추가로 O4-특이적 rfb 유전자좌, 상기 기술된 O4-특이적 GtrS 인코딩 서열, 본원에 기술된 바와 같은 올리고사카릴 트랜스퍼라제 및 본원에 기술된 바와 같은 하나 이상의 글리코실화 컨센서스 서열을 갖는 담체 단백질을 인코딩하는 서열을 추가로 포함하여 대장균 글루코실화된 O4 혈청형(표 1의 화학식 (O4-Glc+)의 글리칸 구조를 포함)의 바이오컨쥬게이트를 생성한다.
본원에 제공된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트는 바람직하게는, 글리코시드 연결에 의해 담체 단백질에 공유 결합된다. 본 개시 내용의 관점에서 당업자에게 공지된 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함한다. 요구되는 컨센서스 글리코실화 서열을 함유하는 다양한 상이한 담체 단백질과의 바이오컨쥬게이션이 기술되었으며, 이는 이 기술을 사용하여 광범위한 단백질이 글리코실화될 수 있음을 보여준다(예를 들어, WO 06/119987, WO 2015/124769, WO 2015/158403, WO 2015/82571, WO 2017/216286 및 WO 2017/67964 참조, 바이오컨쥬게이션에 성공적으로 사용된 광범위한 담체 단백질을 함께 보여줌).
특정 구체예에서, 담체 단백질이 변형되는데, 예를 들어 단백질이 덜 독성이고/거나 글리코실화에 더 민감하게 되는 방식으로 변형된다. 특정 구체예에서, 본원에 사용된 담체 단백질은, 더 낮은 농도의 단백질이 예를 들어, 면역원성 조성물 중에서 특히, 이의 바이오컨쥬게이트 형태로 투여되는 방식으로 담체 단백질의 글리코실화 부위의 수가 최대화되도록 변형된다.
따라서, 특정 구체예에서, 본원에 기술된 담체 단백질은 (예를 들어, 담체 단백질이 이의 천연/자연 즉, "야생형" 상태에서 관련된 글리코실화 부위의 수와 비교하여) 담체 단백질과 일반적으로 관련되는 것보다 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 글리코실화 부위를 포함하도록 변형된다. 담체 단백질 내로의 글리코실화 부위의 도입은, 예를 들어 글리코실화 부위가 완전히 또는 부분적으로 추가되도록 단백질의 일차 구조에 새로운 아미노산을 추가하여, 단백질의 일차 구조 임의의 곳에서 글리코실화 컨센서스 서열을 삽입함으로써 또는 글리코실화 부위를 생성하기 위해 단백질에 존재하는 아미노산을 돌연변이시킴으로써 달성될 수 있다. 당업자는 당업계에 공지된 접근법, 예를 들어 단백질을 인코딩하는 핵산 서열의 변형을 포함하는 재조합 접근법을 이용하여 단백질의 아미노산 서열이 용이하게 변형될 수 있음을 인식할 것이다. 특정 구체예에서, 글리코실화 컨센서스 서열은 담체 단백질의 특정 영역, 예를 들어 단백질의 표면 구조 내에 단백질의 N 또는 C 말단에서 및/또는 단백질 염기의 이황화 브릿지에 의해 안정화되는 루프에 도입된다. 일부 구체예에서, 글리코실화 컨센서스 서열은 더욱 효율적인 글리코실화를 위해 리신 잔기의 첨가에 의해 연장될 수 있다.
특정 단백질에 삽입되거나 생성될 수 있는 글리코실화 컨센서스 서열의 예시적인 예는 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산일 수 있음)(SEQ ID NO: 1) 및 Asp(Glu)-X-Asn-Z-Ser(Thr)(여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨)(SEQ ID NO: 2)를 포함한다.
일부 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 담체 단백질의 아스파라긴(Asn) 잔기에 공유 결합되며(예를 들어, N-결합됨), 여기에서 Asn 잔기는 SEQ ID NO: 1, 더욱 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에 존재한다. 전형적으로, 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열, 및 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다.
특정 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A이다. EPA에 있어서, 다양한 탈독소화된 단백질 변이체가 문헌에 기술되어 있으며, 담체 단백질로 사용될 수 있다. 예를 들어, 탈독소화는 문헌 [Lukac et al., 1988, Infect Immun, 56: 3095-3098 and Ho et al., 2006, Hum Vaccin, 2:89 -98]에 따라 촉매적으로 필수적인 잔기 L552V 및 ΔE553을 돌연변이시키고 결실시킴으로써 달성될 수 있다. 본원에 사용된 바와 같은 "EPA"는 탈독소화된 P. 애루기노사의 외독소 A를 나타낸다. 담체 단백질이 EPA인 이들 구체예에서, 대장균 글루코실화된 O4 항원 다당류는 SEQ ID NO: 1을 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에서 Asn 잔기에 공유 결합될 수 있으며, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위에서 Asn 잔기에 공유 결합될 수 있다. 바람직하게는, EPA 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열, 및 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다.
일부 구체예에서, EPA 담체 단백질은 각각 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위, 예를 들어 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 글리코실화 부위를 포함한다. 본원에 사용된 바와 같은 "EPA-4 담체 단백질" 및 "EPA-4"는 각각 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위를 포함하는 탈독소화된 P. 애루기노사 외독소 A 담체 단백질을 나타낸다. EPA-4 담체 단백질의 예시적인 바람직한 예는 SEQ ID NO: 3의 아미노산 서열을 포함하는 EPA 담체 단백질이다.
조성물
또 다른 양태에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 조성물이 본원에 제공된다. 본원에 제공된 조성물은 본원에 기재된 담체 단백질(예를 들어, EPA)에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 임의의 바이오컨쥬게이트를 포함할 수 있다.
일부 구체예에서, 조성물은 면역원성 조성물이다. 본원에 사용된 바와 같은 "면역원성 조성물"은 조성물이 투여되는 숙주 또는 대상체에서 면역 반응을 유발할 수 있는 조성물을 나타낸다. 면역원성 조성물은 약학적으로 허용되는 담체를 추가로 포함할 수 있다. 일부 구체예에서, 조성물은 약학적으로 허용되는 담체를 추가로 포함하는 약학적 조성물이다. 본원에 사용된 바와 같은 "약학적으로 허용되는 담체"는 조성물과 함께 투여되는 희석제, 애쥬번트, 부형제 또는 비히클을 나타내며, 이는 무독성이며, 활성 성분의 효능을 방해해서는 안된다. 예를 들어, 식염수 용액 및 덱스트로스 및 글리세롤 수용액은 특히 주사용 용액의 경우 액체 담체로 또한 사용될 수 있다. 적합한 부형제는 전분, 글루코스, 락토스, 수크로스, 젤라틴, 맥아, 쌀, 밀가루, 백악, 실리카겔, 소듐 스테아레이트, 글리세롤 모노스테아레이트, 활석, 염화나트륨, 건조 탈지유, 글리세롤, 프로필렌, 글리콜, 물, 에탄올 등을 포함한다. 적합한 약학적으로 허용되는 담체의 다른 예는 문헌 ["Remington's Pharmaceutical Sciences" by E.W. Martin.]에 기재되어 있다.
한 구체예에서, 본 발명의 조성물은 Tris-완충 염수(TBS) pH 7.4(예를 들어, 각각 25 mM, 137 mM 및 2.7 mM으로 Tris, NaCl 및 KCl 함유) 중 본 발명의 바이오컨쥬게이트를 포함한다. 다른 구체예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH2PO4/Na2HPO4 완충액, 약 5% (w/v) 소르비톨, 약 10 mM 메티오닌 및 약 0.02% (w/v) 폴리소르베이트 80 중의 본 발명의 바이오컨쥬게이트를 포함한다. 다른 구체예에서, 본 발명의 조성물은 약 7.0 pH의 약 10 mM KH2PO4/Na2HPO4 완충액, 약 8%(w/v) 수크로스, 약 1mM EDTA, 및 약 0.02% (w/v) 폴리소르베이트 80(예를 들어, EPA 담체 단백질에 공유 결합된 대장균 O-항원의 바이오컨쥬게이트에 적합한 완충액에 대해서는 WO 2018/077853 참조) 중의 본 발명의 바이오컨쥬게이트를 포함한다.
일부 구체예에서, 본원에 기재된 조성물은 일가 제형이고, 예를 들어 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트, 예컨대 대장균 글루코실화된 O4 항원 다당류의 일부로서 하나의 대장균 O-항원 다당류를 함유한다. 다가 조성물, 예를 들어, 2가, 3가, 4가 등의 조성물인 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)이 또한 본원에 제공된다. 예를 들어, 다가 조성물은 하나 초과의 항원, 예컨대 대장균 O-항원, 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트를 포함한다. 특정 구체예에서, 본원에서 제공되는 다가 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트 및 적어도 하나의 추가 항원을 포함한다.
한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 본원에 기재된 바와 같은 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 일가 조성물이다.
또 다른 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류, 및 적어도 하나의 추가 항원을 포함하는 다가 조성물이다.
일부 구체예에서, 추가 항원은 항원 당류 또는 다당류, 더욱 바람직하게는 대장균 O-항원 다당류, 예컨대 O1, O2, O6, O8, O15, O16, O18, O25 및 O75 혈청형 및 이의 하위혈청 중 하나 이상의 대장균 O-항원이다. 일부 구체예에서, 추가의 대장균 O-항원 다당류 각각은 글리코컨쥬게이트이며, 이는 대장균 O-항원 다당류가 다른 화학종, 예를 들어 단백질, 펩티드, 지질 등, 가장 바람직하게는 담체 단백질에 예컨대, 화학적 또는 효소적 방법에 의해 공유적으로 결합됨을 의미한다. 바람직한 구체예에서, 추가의 대장균 O-항원 다당류 각각은 O-항원 다당류가 숙주 세포 기구에 의해 효소적으로 글리코시드 결합을 통해 예를 들어, 담체 단백질에 공유 결합되는 바이오컨쥬게이트이다. 특정 구체예에서, 본원에 제공된 조성물은 1-20개 추가의 글리코컨쥬게이트, 더욱 바람직하게는 대장균 O-항원 다당류의 바이오컨쥬게이트, 예컨대 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19 또는 20개 추가의 글리코컨쥬게이트 또는 바람직하게는, 대장균 O-항원 다당류의 바이오컨쥬게이트를 포함할 수 있다. 다른 항원, 예컨대 펩티드, 단백질 또는 지질 항원 등이 본원에 제공된 조성물에 포함될 수 있다.
일부 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 대장균 O1A 항원 다당류, 대장균 O2 항원 다당류, 대장균 O6A 항원 다당류, 대장균 O8 항원 다당류, 대장균 O15 항원 다당류, 대장균 O16 항원 다당류, 대장균 O18A 항원 다당류, 대장균 O25B 항원 다당류 및 대장균 O75 항원 다당류로 구성된 군으로부터 선택되는 적어도 하나의 추가 항원 다당류를 포함한다. 바람직하게는, 추가의 O-항원 다당류 각각은 담체 단백질에 공유 결합되고, 더욱 바람직하게는 바이오컨쥬게이트이다.
한 구체예에서, O1A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O1A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O1A)의 구조를 포함하며, 여기서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O1A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O2 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O2 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O2)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O2 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O6A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O6A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O6A)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O6A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O8 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O8 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O8)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O8 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O15 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O15 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O15)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O15 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O16 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O16 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O16)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O16 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O18A 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O18A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O18A 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O25B 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O25B 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O25B)의 구조를 포함하며, 여기에서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O25B 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
한 구체예에서, O75 항원 다당류(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)는 (예를 들어, 글루코실화된 O4 항원 다당류 또는 이의 바이오컨쥬게이트와 조합되어) 본원에 제공된 조성물에 사용된다. 특정 구체예에서, O75 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O75)의 구조를 포함하며, 여기서 n은 1-100, 바람직하게는 3-50, 예를 들어 5-40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다. 바람직하게는, O75 항원 다당류는 바이오컨쥬게이트의 일부이고, 담체 단백질, 예를 들어 EPA에 공유적으로 결합된다.
또 다른 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA(즉, 5가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류의 바이오컨쥬게이트를 포함한다.
바람직한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어, EPA(즉, 9가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함한다.
또 다른 바람직한 구체예에서, 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 적어도 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류, 바람직하게는 담체 단백질, 예를 들어 EPA(즉, 10가 조성물)에 공유 결합된 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함한다.
다른 대장균 혈청형으로부터의 추가 O-항원(예를 들어, 단리된 형태로 또는 글리코컨쥬게이트 또는 바이오컨쥬게이트의 일부로서)을 임의적으로 추가로 포함하는 조성물이 또한 본원에서 고려된다.
일부 구체예에서, 추가의 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및/또는 O75 항원 다당류 각각은 담체 단백질에 공유적으로 결합된다. O-항원 다당류는 화학적 또는 다른 합성 방법에 의해 담체 단백질에 연결될 수 있거나, O-항원 다당류는 바이오컨쥬게이트의 일부일 수 있고, 바람직하게는 바이오컨쥬게이트의 일부이다. 본 개시의 관점에서 당업자에게 공지된 임의의 담체 단백질이 사용될 수 있다. 적합한 담체 단백질은 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함한다. 바람직하게는, 담체 단백질은 EPA이다.
일부 구체예에서, 추가의 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및/또는 O75 항원 다당류 각각은, 특히 바이오컨쥬게이트의 일부인 경우, 담체 단백질의 아스파라긴(Asn) 잔기에 공유적으로 결합되며, 여기에서 Asn 잔기는 글리코실화 컨센서스 서열 Asn-X-Ser(Thr)을 포함하는 글리코실화 부위에 존재하고, 여기에서 X는 Pro을 제외한 임의의 아미노산이며(SEQ ID NO: 1)이며, 바람직하게는 Asn 잔기는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr)을 포함하는 글리코실화 부위에 존재하며, 여기에서 X 및 Z는 Pro을 제외한 임의의 아미노산으로부터 독립적으로 선택된다(SEQ ID NO: 2). 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위를 포함할 수 있으며, 각각은 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 담체 단백질은 EPA-4 담체 단백질, 예를 들어 SEQ ID NO: 3의 아미노산 서열을 포함하는 EPA-4 담체 단백질이다.
특정 구체예에서, 하기를 포함하는 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)이 본원에 제공된다: (i) SEQ ID NO: 3을 포함하는 탈독소화된 P. 애루기노사의 외독소 A 담체 단백질(EPA-4 담체 단백질)에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트로서, 대장균 글루코실화된 O4 항원 다당류는 화학식 (O4-Glc+)의 구조를 포함하는 바이오컨쥬게이트; (ii) EPA-4 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O1A 항원 다당류는 화학식 (O1A)의 구조를 포함하는 바이오컨쥬게이트; (iii) EPA-4 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트로서, 대장균 O2 항원 다당류는 화학식 (O2)의 구조를 포함하는 바이오컨쥬게이트; (iv) EPA-4 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O6A 항원 다당류는 화학식 (O6A)의 구조를 포함하는 바이오컨쥬게이트; (v) EPA-4 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트로서, 대장균 O8 항원 다당류는 화학식 (O8)의 구조를 포함하는 바이오컨쥬게이트; (vi) EPA-4 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트로서, 대장균 O15 항원 다당류는 화학식 (O15)의 구조를 포함하는 바이오컨쥬게이트; (vii) EPA-4 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트로서, 대장균 O16 항원 다당류는 화학식 (O16)의 구조를 포함하는 바이오컨쥬게이트; (viii) EPA-4 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트로서, 대장균 O25B 항원 다당류는 화학식 (O25B)의 구조를 포함하는 바이오컨쥬게이트; 및 (ix) EPA-4 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트로서, 대장균 O75 항원 다당류는 화학식 (O75)의 구조를 포함하는 바이오컨쥬게이트(여기에서 각각의 화학식은 표 1에 제공되며, 각각의 화학식에 있어서, 독립적으로 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어 5 내지 40의 정수이다).
특정 구체예에서, 상기 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 하기를 추가로 포함한다: (x) EPA-4 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트로서, 대장균 O18A 항원 다당류는 표 1에 나타낸 바와 같은 화학식 (O18A)의 구조를 포함하며, 여기에서 이 구조에 있어서 n은 1 내지 100, 예를 들어 1 내지 50, 바람직하게는 3 내지 50, 예를 들어 5 내지 40의 정수이다.
일부 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 조성물에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 약 1.5 내지 6배, 예를 들어 약 2 내지 4배 더 높은 농도, 예컨대 1.5, 2, 3, 4, 5 또는 6배 더 높은 농도로 조성물에 존재한다.
특정 구체예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O25B:O75의 바이오컨쥬게이트가 1:1:1:1:1:1:1:2:1 또는 2:1:1:2:1:1:1:4:1의 비율(O-항원 다당류의 중량 기준)로 존재한다.
특정 구체예에서, 조성물은 대장균 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O18A, O25B 및 O75 항원 다당류의 바이오컨쥬게이트를 포함하고, 여기에서 O1A:O2:글루코실화된 O4:O6A:O8:O15:O16:O18A:O25B:O75의 바이오컨쥬게이트가 1:1:1:1:1:1:1:1:2:1 또는 2:1:1:2:1:1:1:1:4:1의 비율(O-항원 다당류의 중량 기준)로 존재한다.
일부 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기에서 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 2 내지 50 μg/mL, 바람직하게는 8내지 40 μg/mL, 더욱 바람직하게는 16 내지 32 μg/mL, 예컨대 16, 18, 20, 22, 24, 26, 28, 30, 또는 32 μg/mL의 농도로 조성물에 존재한다. 이러한 구체예에서, 대장균 O25B 항원 다당류의 바이오컨쥬게이트 농도는 조성물 중에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 바람직하게는, 약 1.5 내지 6배, 예를 들어, 약 2 내지 4배 더 높고, 예를 들어 1.5, 2, 3, 4, 5, 또는 6배 더 높다.
특정 구체예에서, 본원에 기재된 조성물(예를 들어, 약학적 및/또는 면역원성 조성물)은 애쥬번트를 포함하거나 이와 조합되어 투여된다. 본원에 기재된 조성물과 조합하여 투여하기 위한 애쥬번트는 상기 조성물의 투여 전(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내), 동시에 또는 후에(예를 들어, 72시간, 48시간, 24시간, 12시간, 6시간, 2시간, 1시간, 10분 이내) 투여될 수 있다. 본원에 사용된 바와 같은 용어 "애쥬번트"는 본원에 기술된 조성물과 함께 또는 이의 일부로서 투여되는 경우, 바이오컨쥬게이트의 대장균 O-항원 다당류에 대한 면역 반응을 증대, 강화 및/또는 부스팅하며, 애쥬번트 화합물이 단독으로 투여되는 경우, 바이오컨쥬게이트 중의 대장균 O-항원 다당류에 대한 면역 반응을 발생시키지 않는 화합물을 나타낸다. 일부 구체예에서, 애쥬번트는 이의 바이오컨쥬게이트의 대장균 O-항원 다당류에 대한 면역 반응을 향상시키고, 알레르기 또는 다른 부작용을 일으키지 않는다. 애쥬번트는 예를 들어, 림프구 동원, B 및/또는 T 세포의 자극, 및 대식세포의 자극을 포함하는 여러 기전에 의해 면역 반응을 향상시킬 수 있다.
적합한 애쥬번트의 예는 임의적으로 QS7과 조합되는, 비제한적으로, 알루미늄 염(명반)(예컨대, 명반 또는 나노명반 제형을 포함하는 나노입자를 포함하는 수산화알루미늄, 인산알루미늄, 황산알루미늄 및 산화알루미늄), 인산칼슘, 모노포스포릴 지질 A(MPL) 또는 3-데-O-아실화된 모노포스포릴 지질 A(3D-MPL)(예를 들어, 영국 특허 GB2220211, EP0971739, EP1194166, US6491919 참조), AS01, AS02, AS03 및 AS04(모두 GlaxoSmithKline; 예를 들어, AS04에 있어서 EP1126876, US7357936, AS02에 있어서 EP0671948, EP0761231, US5750110), MF59(Novartis), 이미다조피리딘 화합물(WO2007/109812 참조), 이미다조퀴녹살린 화합물(WO2007/109813 참조), 델타-이눌린, STING-활성화 합성 사이클릭-디-뉴클레오티드(예를 들어, US20150056224), 레시틴과 카르보머 호모폴리머의 조합물(예를 들어, US6676958), 및 사포닌, 예컨대 QuilA 및 QS21(예를 들어, 문헌 [Zhu D and W Tuo, 2016, Nat Prod Chem Res 3: e113 (doi:10.4172/2329-6836.1000e113] 참조), Matrix M, Iscoms, Iscomatrix 등을 포함한다(문헌 [Kensil et al., in Vaccine Design: The Subunit and Adjuvant Approach (eds. Powell & Newman, Plenum Press, NY, 1995)]; 미국 특허 번호 5,057,540 참조). 일부 구체예에서, 애쥬번트는 프로운트 애쥬번트(완전 또는 불완전)이다. 다른 애쥬번트는 선택적으로 모노포스포릴 지질 A와 같은 면역 자극제와 조합된 수중유 에멀젼(예컨대, 스쿠알렌 또는 땅콩 오일)이다(문헌 [Stoute et al., N. Engl. J. Med. 336, 86-91(1997)] 참조). 또 다른 애쥬번트는 CpG이다(Bioworld Today, Nov. 15, 1998). 애주번트의 추가 예는 AS01E 및 AS01B에서와 같이 MPL 및 QS21과 같은 면역 자극제를 함유하는 리포솜이다(예를 들어, US 2011/0206758). 애쥬번트의 다른 예는 CpG(Bioworld Today, Nov. 15, 1998) 및 이미다조퀴놀린(예컨대, 이미퀴모드 및 R848)이다. 예를 들어, 문헌 [Reed G, et al., 2013, Nature Med, 19: 1597-1608] 참조. 특정 구체예에서, 애쥬번트는 톨-유사 수용체 4(TLR4) 효능제를 함유한다. TLR4 효능제는 당업계에 잘 알려져 있다(예를 들어, 문헌 [Ireton GC and SG Reed, 2013, Expert Rev Vaccines 12: 793-807] 참조). 특정 구체예에서, 애쥬번트는 지질 A를 포함하는 TLR4 효능제, 또는 이의 유사체 또는 유도체, 예컨대 MPL, 3D-MPL, RC529(예를 들어, EP1385541), PET-지질 A, GLA(글리코피라노실 지질 애쥬번트, 합성 이당류 당지질; 예를 들어, US20100310602, US8722064), SLA(예를 들어, 문헌 [Carter D et al, 2016, Clin Transl Immunology 5: e108 (doi: 10.1038/cti.2016.63)]으로서, 이는 인간 백신을 위한 TLR4 리간드를 최적화시키기 위한 구조-기능 접근법을 기술함), PHAD(포스포릴화된 헥사아실 이당류), 3D-PHAD (이의 구조는 GLA의 구조와 동일함), 3D-(6-아실)-PHAD (3D(6A)-PHAD) (PHAD, 3D-PHAD 및 3D(6A)PHAD는 합성 지질 A 변이체이며, 예를 들어, 이들 분자의 구조를 또한 제공하는 avantilipids.com/divisions/adjuvants 참조), E6020(CAS 번호 287180-63-6), ONO4007, OM-174 등을 포함한다.
특정 구체예에서, 본원에 기재된 조성물은 애쥬번트를 포함하지 않으며, 애쥬번트와 조합되어 투여되지 않는다.
특정 구체예에서, 본원에 기재된 조성물은 대상체에 대한 의도된 투여 경로에 적합하도록 제형화된다. 예를 들어, 본원에 기재된 조성물(예를 들어, 약학적 및/또는 면역원성)은 피하, 비경구, 경구, 설하, 협측, 피내, 경피, 결장직장, 복강내, 직장 투여, 정맥내, 비강내, 기관내, 근육내, 국소용, 경피 또는 피내 투여를 위해 제형화될 수 있다. 특정 구체예에서, 본원에 제공된 조성물(예를 들어, 약학적 및/또는 면역원성)은 근육내 주사용으로 제형화된다.
사용 방법
본원에 제공된 바이오컨쥬게이트 및 조성물은 대상체에서 대장균 글루코실화된 O4 항원에 대한 항체를 유도하고, 대장균, 특히 장외 병원성 대장균(ExPEC)에 대하여 대상체를 백신화시키는 데 사용될 수 있다. 본원에 사용된 바와 같은 "대상체"는 본원에 제공된 바이오컨쥬게이트 또는 조성물이 투여되거나 투여될 임의의 동물, 바람직하게는 포유동물을 의미한다. 본원에 사용된 바와 같은 용어 "포유동물"은 임의의 포유동물을 포함한다. 포유동물의 예에는 소, 말, 양, 돼지, 고양이, 개, 마우스, 래트, 토끼, 기니아 피그, 원숭이 또는 유인원과 같은 비인간 영장류(NHP), 인간 등이 포함되나 이에 제한되지 않는다. 특정 구체예에서, 대상체는 인간이다. 인간 대상체는 모든 연령이 될 수 있다. 특정 구체예에서, 대상체는 약 2개월 내지 약 18세, 예를 들어 1세 내지 18세의 인간이다. 특정 구체예에서, 대상체는 적어도 18세의 인간이다. 특정 구체예에서, 대상체는 15 내지 50세, 예를 들어 18 내지 45세, 예를 들어 20 내지 40세의 인간이다. 특정 구체예에서, 대상체는 인간 남성이다. 특정 구체예에서, 대상체는 인간 여성이다. 특정 구체예에서, 대상체는 면역저하된 대상체이다. 특정 구체예에서, 대상체는 적어도 50세, 적어도 55세, 적어도 60세, 적어도 65세의 인간이다. 특정 구체예에서, 대상체는 100세 이하, 95세 이하, 90세 이하, 85세 이하, 80세 이하, 또는 75세 이하인 인간이다. 특정 구체예에서, 대상체는 적어도 60세, 및 85세 이하의 인간이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 인간이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 적어도 60세 및 85세 이하의 인간 성인이다. 특정 구체예에서, 대상체는 요로 감염(UTI, 즉 요도, 방광, 요관 및/또는 신장의 박테리아 감염)의 병력이 있는, 즉 그의 또는 그녀의 인생에 적어도 1회의 UTI 에피소드를 갖는 인간이다. 특정 구체예에서, 대상체는 지난 20, 15, 12, 10, 9, 8, 7, 6, 5, 4, 3, 2 또는 1년 동안 UTI의 병력이 있는 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 인간이다. 특정 구체예에서, 대상체는 재발성 UTI의 병력, 즉 6개월 동안 적어도 2회의 UTI 또는 1년 동안 적어도 3회의 UTI를 갖는 인간 대상체이다. 특정 구체예에서, 대상체는 지난 2년 동안 재발성 UTI의 병력이 있는 인간 대상체이다. 특정 구체예에서, 대상체는 안정적인 건강 상태의 60세 이상의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 60세 이상의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 적어도 60세 및 75세 미만의 인간이다. 특정 구체예에서, 대상체는 지난 2년 동안 UTI의 병력이 있는 75세 이상의 인간 대상체이다. 특정 구체예에서, 대상체는 선택적 비뇨생식기 및/또는 복부 시술 또는 수술, 예를 들어 경직장 초음파-유도 전립선 바늘 생검(TRUS-PNB)을 받도록 예정된 환자이다.
일 양태에서, 대상체에서 대장균 글루코실화된 O4 항원에 대한 항체를 유도하는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 임의의 바이오컨쥬게이트, 또는 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 단독으로 또는 다른 대장균 O-항원 다당류 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합하여 포함하는 조성물을 대상체에 투여하는 단계를 포함하는 방법이 본원에 제공된다.
특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 확인된 항체는 옵소닌식세포 활성을 갖는다. 특정 구체예, 유도되거나, 유발되거나 확인된 항체는 대장균 글루코실화된 및 글루코실화되지 않은 O4 균주 둘 모두의 옵소닌식세포 치사를 매개할 수 있는 교차-반응성 항체이다.
특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 또는 확인된 항체는 비변형된 및 글루코스 변형된 O4 항원 다당류를 특이적으로 인식한다. 특정 구체예에서, 대장균 글루코실화된 O4 항원에 대해 유도되거나, 유발되거나 확인된 항체는 O4 혈청형의 대장균을 특이적으로 인식한다. 특정 구체예에서, 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트에 의해 유도된 항체는 비-글루코실화된 O4 항원과 비교하여 글루코실화된 O4 항원에 우선적으로 결합한다.
본원에 기재된 바이오컨쥬게이트 및 조성물에 의해 유도된 항체는 면역글로불린 분자 및 면역글로불린 분자의 면역학적 활성 부분, 즉 대장균 O-항원 다당류, 예를 들어 글루코실화된 O4 항원 다당류에 특이적으로 결합하는 항원 결합 부위를 함유하는 분자를 포함할 수 있다.
본원에 제공된 바이오컨쥬게이트 또는 조성물을 사용하여 유도되거나, 유발되거나 확인된 항체를 사용하여 요법 및/또는 질환 진행의 효능을 모니터링할 수 있다. 방사면역검정, ELISA(효소 결합 면역흡착 검정), 전기화학발광(ECL)-기반 면역검정, "샌드위치" 면역검정, 프레시피틴 반응, 겔 확산 침전 반응, 면역확산 검정, 면역방사 검정, 형광 면역검정, 단백질 A 면역검정 및 면역전기영도 검정과 같은 기술을 사용하는 경쟁적 및 비경쟁적 검정 시스템을 포함하나 이에 제한되지 않는 당업계에 공지된 임의의 면역검정 시스템이 이러한 목적으로 사용될 수 있다. 이러함 검정 중 여러개는 예를 들어, ECL-기반 면역검정은 다중 형식으로 수행되 수 있으며, 전형적으로 다중 검정 형식이 선호된다.
대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 사용하여 유도되거나, 유발되거나 확인된 항체는 예를 들어, 복수의 대장균 균주로부터 대장균 O4 균주, 특히 글루코실화된 O4 균주를 검출하고/거나 대장균 O4 또는 글루코실화된 O4 균주에 의한 감염을 진단하는데 사용될 수 있다.
또 다른 양태에서, 대장균(예를 들어, 장외 병원성 대장균, ExPEC)에 대해 대상체를 백신화시키는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 단독의 또는 다른 대장균 O-항원 또는 이의 글리코컨주에이트 또는 바이오컨쥬게이트와 추가로 조합되는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물 중 임의의 것을 대상체에 투여하는 단계를 포함하는 방법이 본원에 제공된다. 당업자는 대장균 균주의 O 항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트가 투여되는 조성물에 존재하는 대장균 균주에 대해 대상체가 백신화될 것임을 이해할 것이다. 예를 들어, O1A, O2, 글루코실화된 O4, O6A 및 O25B 항원 다당류를 포함하는 조성물의 투여는 대장균 혈청형 O1A, O2, O4, O6A 및 O25B에 대해 대상체를 백신화하는데 사용될 수 있다.
특정 구체예에서, 백신화는 침습성 ExPEC 질환(IED), 예를 들어, 요로감염, 균혈증, 패혈증 등을 예방하기 위한 것이다. 특정 구체예에서, 백신화는 요로 감염의 발생 또는 중증을 예방하거나 감소시키기 위한 것이다. 특정 구체예에서, IED는 예를 들어, 비뇨생식기 및/또는 복부 시술 또는 수술을 받는 환자에서 병원 획득될 수 있다. 특정 구체예에서, IED는 예를 들어, 병원, 외래 수술 센터 말기 신장 질환 시설, 장기 요양 시설 등에서 예를 들어, 일부 경우에, 중앙 라인, 카테터 등을 통해 또 다른 상태에 대해 건강 관리를 받고 있는 환자에서 건강 관리와 관련될 수 있다. 특정 구체예에서, IED는 예를 들어, 최근에 의료 위험에 노출되지 않은 환자에서 지역사회 획득될 수 있다.
또 다른 양태에서, 대상체에서 대장균(예를 들어, ExPEC)에 대해 면역 반응을 유도하는 방법으로서, 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 단독의 또는 다른 대장균 O-항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합되는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물 중 임의의 것을 대상체에게 투여하는 것을 포함하는 방법이 본원에 제공된다. 한 구체예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염을 갖는다. 바람직한 구체예에서, 대상체는 투여 시점에 대장균(예를 들어, ExPEC) 감염을 갖지 않는다.
특정 구체예에서, 본원에 기재된 조성물 및 바이오컨쥬게이트는 항체, 바람직하게는 옵소닌식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 유도하기 위해 대상체에게 투여될 수 있다. 이러한 항체는 당업자에게 공지된 기술(예를 들어, 면역친화성 크로마토그래피, 원심분리, 침전 등)을 사용하여 단리될 수 있다.
대상체에서 면역 반응을 생성하는 본원에 기재된 바이오컨쥬게이트 및 조성물의 능력은 당업자에게 공지되거나 본원에 기재된 임의의 접근법을 사용하여 평가될 수 있다. 일부 구체예에서, 대상체에서 면역 반응을 생성하는 바이오컨쥬게이트의 능력은 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 대상체 세트를 본원에 기재된 바이오컨쥬게이트로 면역화하고 추가의 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이) 또는 대상체 세트를 대조군(PBS)으로 면역화시킴으로써 평가될 수 있다. 대상체 또는 대상체 세트는 이후에 ExPEC로 자극될 수 있으며, 대상체 또는 대상체 세트에서 질병(예를 들어, UTI, 균혈증, 또는 기타 질병)을 초래하는 ExPEC의 능력이 결정될 수 있다. 당업자는, 대조군으로 면역화된 대상체 또는 대상체 세트가 ExPEC로 자극 후 질병을 앓지만 본원에 기재된 바이오컨쥬게이트(들) 또는 이의 조성물로 면역화된 대상체 또는 대상체 세트는 질병을 덜 앓거나 질병에 걸리지 않은 경우, 바이오컨쥬게이트는 대상체에서 면역 반응을 발생시킬 수 있음을 인식할 것이다. ExPEC로부터의 O 항원과 교차 반응하는 항혈청을 유도하는 본원에 기재된 바이오컨쥬게이트(들) 또는 이의 조성물의 능력은 예를 들어, 면역검정, 예컨대 ELISA(예를 들어, [Van den Dobbelsteen et al, 2016, Vaccine 34: 4152-4160] 참조) 또는 ECL-기반 면역검정에 의해 테스트될 수 있다.
예를 들어, 대상체에서 면역 반응을 생성하는 본원에 기재된 바이오컨쥬게이트의 능력은 혈청 살균 검정(SBA) 또는 옵소닌식세포 치사 검정(OPK 검정, 또는 OPKA)을 사용하여 검출될 수 있으며, 이는 글리코컨쥬게이트-기반 백신의 승인을 얻는데 사용된 확립되고 허용되는 방법을 대표한다. 이러한 검정은 당업계에 잘 공지되어 있으며, 간략하게는 대상체(예를 들어, 마우스, 래트, 토끼 또는 원숭이)에게 항체를 유발하는 화합물을 투여함으로써 관심 표적(예를 들어, O 항원 다당류, 예를 들어 대장균 글루코실화된 O4 항원 다당류)에 대한 항체를 발생시키고 분리하는 단계를 포함한다. 그 후, 항체의 멸균 능력은 예를 들어, 항체 및 보체 및 - 검정에 따라 - 호중구 세포의 존재 하에 문제의 박테리아(예를 들어, 관련 혈청형의 대장균)를 배양하고, 예를 들어, 표준 미생물학적 접근법을 사용하여 박테리아의 치사 및/또는 중화를 매개하는 항체의 능력을 검정함으로써 평가될 수 있다. 대장균 바이오컨쥬게이트 백신에 대한 OPK 검정의 예에 있어서, 예를 들어, 문헌 [Abbanat et al, 2017, Clin. Vaccine Immunol. 24: e00123-17] 참조. OPK 검정은 모노플렉스 또는 멀티플렉스 형식으로 수행될 수 있으며, 이중 멀티플렉스 형식(예를 들어, 동시에 다중 혈청형 테스트)이 전형적으로 선호된다. 멀티플렉스 OPK 검정은 종종 'MOPA'로서 본원에 지칭된다.
일부 구체예에서, 본원에 기재된 방법은 본원에 기재된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트, 또는 다른 대장균 O-항원 또는 이의 글리코컨쥬게이트 또는 바이오컨쥬게이트와 추가로 조합된 또는 단독의 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원의 바이오컨쥬게이트를 포함하는 조성물을 유효량으로 투여하는 것을 포함한다. 한 구체예에서, "유효량"은 대장균(예를 들어, ExPEC)에 대해 대상체를 백신화시키는 양이다. 또 다른 구체예에서, "유효량"은 대장균(예를 들어, ExPEC)에 대한 면역 반응, 예컨대 항체, 바람직하게는 옵소닌식세포 활성을 갖는 항체의 생성을 포함하는 면역 반응을 대상체에서 유도하는 양이다.
특정 구체예에서, 본원에 제공된 조성물은 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, 및 적어도 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 포함하고, 대장균 O25B 항원 다당류의 유효량은 조성물에 존재하는 임의의 다른 바이오컨쥬게이트의 농도보다 약 1.5 내지 6배, 예를 들어 약 2 내지 4배 더 높으며, 예컨대 1.5, 2, 3, 4, 5 또는 6배 더 높다. 이러한 구체예에서, 대장균 O25B 항원 다당류의 유효량은 예를 들어, 투여 당 약 5 내지 18 μg, 예컨대 투여 당 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18 μg이다.
특정 구체예에서, 본 발명에 따른 바이오컨쥬게이트 또는 조성물은 대상체에게 1회 투여된다. 특정 구체예에서, 본 발명에 따른 바이오컨쥬게이트 또는 조성물은 예를 들어, 프라임-부스트 요법으로 대상체에게 1회 넘게 투여된다. 특정 구체예에서, 두 투여 사이의 시간은 적어도 2주, 적어도 1개월, 적어도 2개월, 적어도 3개월, 적어도 6개월, 적어도 1년, 적어도 2년, 적어도 5년, 적어도 10년 또는 적어도 15년이다. 인간에서 원하는 면역 반응은 전형적으로 본 발명에 따른 바이오컨쥬게이트 또는 조성물의 단일 투여에 의해 발생할 수 있다. 특정 구체예에서, 예를 들어 10년 후에 반복 투여가 제공된다.
숙주 세포
대장균 O 항원 및 이러한 대장균 O 항원을 포함하는 바이오컨쥬게이트를 생성할 수 있는 숙주 세포, 예를 들어 원핵 숙주 세포가 본원에 제공된다. 본원에 제공된 숙주 세포는 바람직하게는, 대장균 O-항원 다당류 및/또는 이의 바이오컨쥬게이트를 생성하는데 사용되는 숙주 세포 기구(예를 들어, 글리코실트랜스퍼라제)를 인코딩하는 핵산을 (예를 들어, 유전자 조작을 통해) 하나 이상 포함하도록 변형된다.
당업자에게 공지된 임의의 숙주 세포는 고세균, 원핵 숙주 세포 및 진핵 숙주 세포를 포함하는 본원에 기재된 대장균 O 항원 다당류(예를 들어, 대장균 글루코실화된 O4 항원 다당류) 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트(예를 들어, 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트)를 생성하는데 사용될 수 있다. 바람직한 구체예에서, 숙주 세포는 원핵 숙주 세포이다. 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트의 생성에 사용하기 위한 예시적인 원핵 숙주 세포는 비제한적으로, 에스체리치아(Escherichia) 종, 쉬겔라(Shigella) 종, 클레브시엘라(Klebsiella) 종, 잔토모나스(Xhantomonas) 종, 살모넬라(Salmonella) 종, 예르시니아(Yersinia) 종, 락토코커스(Lactococcus) 종, 락토바실러스(Lactobacillus) 종, 슈도모나스(Pseudomonas) 종, 코리네박테리움(Corynebacterium) 종, 스트렙토마이세스(Streptomyces) 종, 스트렙토코커스(Streptococcus) 종, 스타필로코커스(Staphylococcus) 종, 바실러스(Bacillus) 종 및 클로스트리듐(Clostridium) 종을 포함한다.
특정 구체예에서, 본원에 기재된 대장균 O 항원 다당류 및 본원에 기재된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트를 생성하는데 사용된 숙주 세포는 원핵 숙주 세포이며, 바람직하게는 대장균이다.
특정 구체예에서, 본원에 기재된 대장균 O 항원 다당류 및 바이오컨쥬게이트를 생성하는데 사용된 숙주 세포는 이종성 핵산, 예를 들어 요망되는 O 항원 혈청형의 rfb 유전자 클러스터를 포함하는 이종성 핵산, 하나 이상의 담체 단백질 및/또는 글리코실트랜스퍼라제를 인코딩하는 이종성 핵산을 포함하도록 조작된다. 특정 구체예에서, 이종성 rfb 유전자, 및/또는 글리코실화 경로(예를 들어, 원핵생물 및/또는 진핵생물 글리코실화 경로)에 관여하는 단백질을 인코딩하는 이종성 핵산은 본원에 기재된 숙주 세포 내로 도입될 수 있다. 이러한 핵산은 비제한적으로 올리고사카릴 트랜스퍼라제 및/또는 글리코실트랜스퍼라제를 포함하는 단백질을 인코딩할 수 있다.
예를 들어, 대장균 O 항원 다당류 및 이의 바이오컨쥬게이트를 제조하는 데 사용될 수 있는 재조합 숙주 세포를 제조하는 데 유용한 글리코실트랜스퍼라제를 인코딩하는 다양한 유전자 및 유전자 클러스터의 서열이 본원에 기재된다. 당업자는 유전자 코드의 축퇴성으로 인해 특정 아미노산 서열을 갖는 단백질이 다수의 상이한 핵산에 의해 인코딩될 수 있음을 이해할 것이다. 따라서, 당업자는 본원에 제공된 핵산이 핵산에 의해 인코딩되는 단백질의 아미노산 서열에 영향을 미치지 않으면서 이의 서열이 본원에 제공된 서열과 상이한 방식으로 변경될 수 있음을 이해할 것이다.
대장균 글루코실화된 O4 항원 다당류, O1A 항원 다당류, O2 항원 다당류, O6A 항원 다당류, O8 항원 다당류, O15 항원 다당류, O16 항원 다당류, O18A 항원 다당류, O25B 항원 다당류 또는 O75 항원 다당류의 바이오컨쥬게이트를 생성하기 위한 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 본원에 제공되는 숙주 세포는 대장균 O 항원 다당류를 생성할 수 있는 효소(예를 들어, 글리코실트랜스퍼라제)를 인코딩하는 핵산을 포함한다. 본원에 제공된 숙주 세포는 관심 O 항원을 생성할 수 있는 핵산을 자연적으로 발현할 수 있거나, 숙주 세포는 이러한 핵산을 발현하도록 제조될 수 있다. 특정 구체예에서, 핵산은 숙주 세포에 이종성이며, 당업계에 공지된 유전자 접근법을 사용하여 숙주 세포 내에 도입된다. 예를 들어, 핵산은 유전자 조작에 의해 숙주 세포 내에 도입될 수 있다(예를 들어, 유전자 클러스터는 플라스미드 또는 플라스미드 상에 발현되거나 숙주 세포 게놈 내로 통합된다(예를 들어, 국제 특허 출원 공개 WO 2014/037585, WO 2014/057109, WO 2015/052344 참조).
한 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 이러한 숙주 세포는 바람직하게는, 전구체 세포를 조작함으로써 gtrS 유전자를 인코딩하는 핵산 서열을 포함하는데, 이는 본 발명자들이 아는 한 글루코스를 대장균 O4 항원 및 특히, α-1,3-글리코시드 결합을 통해 L-Rha에 전달할 수 있는 다당류 분지 효소(즉, 대장군 O4 항원 다당류에 특이적인 글루코실트랜스퍼라제)를 인코딩하는 것으로서 본원에서 처음으로 확인되었다. 이러한 분지 효소의 아미노산 서열의 예는 SEQ ID NO: 4에 제공된다. 다른 예는 이에 대해 적어도 80% 동일한 아미노산 서열을 포함한다. 대장균 O4 항원 다당류에 특이적인 gtrS 유전자를 인코딩하는 핵산 서열의 예시적인 예는 비제한적으로 SEQ ID NO: 5, 또는 SEQ ID NO: 4를 인코딩하는 이에 대한 퇴화 핵산 서열, 또는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 갖는 기능성 O4-특이적 GtrS 효소를 인코딩하는 핵산 서열을 포함한다.
특정 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성, 예컨대 SEQ ID NO: 4에 대해 약 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 95%, 97%, 98%, 99% 또는 100% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 포함한다. 유전자 코드의 중복성의 관점에서, 당업자는 요망되는 경우, 예를 들어, 코돈 최적화된 서열을 사용하여 글루코실 트랜스퍼라제의 아미노산 서열을 인코딩하는 핵산의 변이체를 만들 수 있다.
특정 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제(GtrS)를 인코딩하는 뉴클레오티드 서열을 포함하는, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 7에 대해 적어도 80% 서열 동일성을 갖는 박토프레놀-연결된 글루코스 트랜스로카제(GtrA)를 인코딩하는 뉴클레오티드 서열, 및 SEQ ID NO: 8에 대해 적어도 80% 서열 동일성을 갖는 박토프레놀 글루코실 트랜스퍼라제(GtrB)를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 특정 구체예에서, 상기 핵산 서열은 각각 SEQ ID NO: 7 및 8에 대해 적어도 약 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99% 또는 100% 동일한 GtrA 및 GtrB 단백질을 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제(SEQ ID NO: 7) 및 박토프레놀 글루코실 트랜스퍼라제(SEQ ID NO: 8)를 갖는다. 유전자 코드의 중복성의 관점에서, 당업자는 요망되는 경우, 예를 들어, 코돈 최적화된 서열을 사용하여 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제의 아미노산 서열을 인코딩하는 핵산의 변이체를 만들 수 있다.
본원에 제공된 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열을 추가로 포함한다. 대장균 O4 항원 다당류의 생성에 유용한 rfb 유전자 클러스터의 예는 본원에서 SEQ ID NO: 9로서 제공된다. 또 다른 예는 GenBank, 유전자좌 AY568960에서 찾을 수 있다. 이 서열에 의해 인코딩된 것과 동일한 효소를 인코딩하는 퇴화 핵산 서열, 또는 적어도 80% 동일한, 바람직하게는 적어도 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일한 효소를 인코딩하는 서열이 또한 사용될 수 있다.
특정 구체예에서, 글루코실화된 O4 항원 다당류를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포, 바람직하게는 재조합 대장균 숙주 세포)가 본원에 제공되며, 여기에서 숙주 세포는 gtrS, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터, 및 담체 단백질을 인코딩하는 핵산을 포함한다. 이러한 숙주 세포는 gtrS 유전자, rfb 유전자 클러스터, 및/또는 담체 단백질을 인코딩하는 핵산을 포함하는 하나 이상의 플라스미드를 포함하거나, gtrS, rfb 클러스터 및/또는 숙주 세포 게놈 내로 통합된 담체 단백질을 인코딩하는 핵산과 같은 관련 유전자 일부 또는 모두를 포함하도록 재조합 접근법을 이용하여 조작될 수 있다. 특정 구체예에서, 유전자 또는 유전자 클러스터는 상동 재조합을 사용하여 숙주 세포의 게놈 내로 통합되었다. 숙주 세포의 게놈 내로의 유전자를 통합하는 장점은 항생제 선택의 부재 하의 안정성이다.
또 다른 특정 구체예에서, 글루코실화된 O4 항원 다당류를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)가 본원에 제공되며, 숙주 세포는 GtrS(글루코실트랜스퍼라제)는 물론 O4 rfb 클러스터에 의해 인코딩된 효소를 포함한다. 특정 구체예에서, 상기 언급된 효소의 일부 또는 전부는 숙주 세포에 대해 이종성이다.
다른 특정 구체예에서, 대장균 글루코실화된 O4 항원 다당류, 바람직하게는 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하는 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)가 본원에 제공되며, 숙주 세포는 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열 및/또는 담체 단백질을 인코딩하는 뉴클레오티드 서열을 추가로 포함한다. 한 특정 구체예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이다. 또 다른 특정 구체예에서, 담체 단백질은 숙주 세포에 대해 이종성이다. 바람직하게는, 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 이종성 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, O4 클러스터의 rfb 유전자는 숙주 세포에 이종성이다. 바람직하게는, O4 항원에 분지된 글루코스 측쇄를 도입할 수 있는 효소를 인코딩하는 서열, 즉 gtrS 유전자(SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩함)는 숙주 세포에 대해 이종성이다. 핵산은 동일한 서열이 상기 숙주 세포에 자연적으로 존재하지 않는 경우 숙주 세포에 대해 이종성이다. 예를 들어, 이종성 핵산은 유전자 조작에 의해, 예를 들어 형질전환(예를 들어, 화학적 형질전환 또는 전기천공) 및/또는 재조합에 의해 어미 세포에 도입될 수 있다. 특정 구체예에서, 이종성 핵산, 예컨대 요망되는 rfb 유전자좌, gtrS 코딩 서열, 담체 단백질 인코딩 서열 및/또는 글리코실트랜스퍼라제 인코딩 서열은 숙주 세포, 바람직하게는 박테리아 숙주 세포, 바람직하게는 대장균 숙주 세포의 게놈 내에 도입된다. 바람직한 구체예에서, 내인성 rfb 유전자좌 및 적용 가능한 경우 gtrS 코딩 서열은 불활성화되고, 바람직하게는 이의 선행자와 비교하여 재조합 숙주 세포의 게놈으로부터 결실되고, 바람직하게는 이들은 각각 원하는 이종성 rfb 유전자좌 및 적용 가능한 경우 원하는 gtrS 코딩 서열에 의해 대체된다. 특정 구체예에서, 숙주 세포는 대장균의 K-12(비제한적인 예로서, 대장균 균주 W3110은 K-12 균주임), 또는 대장균의 B 균주(비제한적인 예로서, 대장균 균주 BL21은 B 균주임), 또는 일차 야생형 분리주와 대조적으로 대장균의 다른 잘 정의된 균주, 예를 들어 실험실 균주 또는 생산 균주이다. 바람직한 구체예에서, 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 gtrS 유전자 및 O4 rfb 유전자좌를, O4 항원 또는 글루코실화된 O4 항원을 발현하지 않는 대장균 내에 도입시킴으써 이러한 대장균으로부터 유래한다. 숙주 세포의 전구체로서 대장균 K-12 또는 대장균 B와 같은 잘 특성 규명된 균주를 사용하는 이점은 생산 균주의 특성이 잘 규정되어 있기 때문에 다양한 O-항원 바이오컨쥬게이트에 대해 유사한 생산 공정을 사용할 수 있는 가능성이다. 다양한 O-항원의 바이오컨쥬게이트가 상이하게 행동할 것이고, 발현 과정이 생산 균주마다 최적화될 수 있지만, 적어도 O-항원 바이오컨쥬게이트의 생성을 위한 기본 과정은 야생형 분리주와 같은 알려지지 않은 균주가 숙주 균주의 생성을 위한 전구체로서 사용되는 경우보다 더 잘 규정된 전구체 균주를 사용하여 더욱 예측가능할 것이다. 이러한 방식으로, 예를 들어, WO 2015/124769 및 WO 2017/035181에 기술된 바와 같은 O1A, O2, O6A 및 O25B 바이오컨쥬게이트와 같은 이전에 기술된 대장균 O-항원 바이오컨쥬게이트의 생산에 대한 경험은 다른 대장균 O-항원 바이오컨쥬게이트의 생산을 설계하기 위한 기초로 사용될 수 있다. gtrS와 달리, gtrA 및 gtrB 유전자는 혈청형 특이적이지 않으며, 특정 구체예에서, 숙주 세포에 대해 상동성이다(예를 들어, 대장균 K12 균주 W3110은 내인성 gtrS 유전자를 대체하는 SEQ ID NO: 4의 글루코실 트랜스퍼라제 또는 이와 적어도 80% 동일한 글루코실 트랜스퍼라제를 인코딩하는 O4-혈청형 특이적 재조합 도입된 gtrS 유전자와 함께 기능할 수 있는 gtrA 및 gtrB 유전자를 포함한다). 다른 구체예에서, gtrA 및 gtrB 유전자(각각 SEQ ID NO: 7 및 8과 적어도 약 80% 동일한 GtrA 및 GtrB를 인코딩하며, 각각 박토프레놀-연결된 글루코스 트랜스로카제 및 박토프레놀 글루코실 트랜스퍼라제 활성을 가짐) 중 하나 또는 둘 모두는 또한 예를 들어, 숙주 세포가 내인성 gtrA 및/또는 gtrB 유전자를 갖지 않는 경우 숙주 세포에 재조합적으로 도입된다.
또한, 담체 단백질에 공유 결합된 대장균 O1A, O2, O6A, O8, O15, O16, O18A, O25B 또는 O75 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)가 본원에 제공된다. 이러한 숙주 세포(예를 들어, 재조합 숙주 세포)는 O-항원 다당류에 특이적인 rfb 유전자 클러스터의 뉴클레오티드 서열을 포함한다. rfb 유전자 클러스터는 야생형 대장균 균주로부터 분리되고, 하나의 숙주 세포 내부에서 올리고사카릴 트랜스퍼라제(예를 들어, PgIB) 및 담체 단백질(예를 들어, EPA)을 인코딩하는 핵산과 조합될 수 있어 관심 대장균 O-항원 또는 이의 바이오컨쥬게이트를 생성하는 재조합 숙주 세포를 수득할 수 있다. 예를 들어, 이러한 숙주 세포는 WO 2014/037585, WO 2009/104074, 및 WO 2009/089396에 기술된 것과 같은 바이오컨쥬게이션 기술을 사용하여 rfb 유전자 클러스터, 올리고사카릴 트랜스퍼라제(예를 들어, PglB) 및 담체 단백질(예를 들어, EPA)을 포함하는 하나 이상의 플라스미드를 포함하도록 재조합 접근법을 사용하여 조작될 수 있다. 바람직하게는, 숙주 세포는 이들의 게놈 내로 통합된 rfb 유전자 클러스터를 포함한다. 올리고사카릴 트랜스퍼라제, 담체 단백질 및 적용 가능한 경우 gtrS 유전자를 인코딩하는 핵산은 특정 구체예에서, 또한 숙주 세포의 게놈 내로 통합된다. 이종성 또는 상동성 gtrA 및 gtrB 유전자는 특정 구체예에서, 또한 숙주 세포의 게놈 내에 통합된다.
O1A, O2, O6A 및 O25B 항원에 대한 바이오컨쥬게이트의 제조는 WO 2015/124769 및 WO 2017/035181에 상세히 설명되어 있다. 각 대장균 O 항원(rfb 유전자좌)에 대한 예시적인 유전자 클러스터는 문헌 [Iguchi A, et al, DNA Research, 2014, 1-7 (doi: 10.1093/dnares/dsu043), and in DebRoy C, et al, PLoS One. 2016, 11(1):e0147434 (doi: 10.1371/journal.pone.0147434; correction in: Plos One. 2016, 11(4):e0154551, doi: 10.1371/journal.pone.0154551)]에 설명되어 있다. rfb 클러스터에 대한 핵산 서열 및 여기에 인코딩된 단백질에 대한 아미노산 서열 또한 GenBank와 같은 공개 데이터베이스에서 찾아볼 수 있다. 본원에 기재된 혈청형의 다당류 항원과의 바이오컨쥬게이트에 대한 생산 균주에 사용될 수 있는 rfb 클러스터에 대한 예시적인 서열은 또한 SEQ ID NO: 9 및 11-19에 제공된다. 따라서, 상기 언급된 요망되는 바이오컨쥬게이트 각각에 있어서, 각 rfb 클러스터는 숙주 세포 내로 도입되어 요망되는 O-항원에 대한 특이적 rfb 클러스터를 가질뿐만 아니라 올리고사카릴트랜스퍼라제 및 담체 단백질을 인코딩하는 핵산을 함유하는 숙주 세포를 수득할 수 있다. 상기 언급된 이유로, 바람직하게는 숙주 세포는 재조합 숙주 세포이며, 바람직하게는 비교적 잘 공지된 특징을 갖는 균주, 예컨대 대장균 실험실 또는 생성 균주, 예를 들어, 대장균 K12 또는 대장균 BL21 등으로부터 유래된다. 바람직하게는, rfb 클러스터는 숙주 세포에 이종성이며, 예를 들어, 숙주 세포의 전구체 세포에 도입되며, 바람직하게는 이의 게놈 내에 통합된다. 바람직하게는, 원래 rfb 유전자 클러스터가 전구체 세포에 존재하는 경우, 이는 숙주 세포에서 관심 O-항원에 대한 rfb 유전자 클러스터에 의해 대체되어 관심 O-항원의 바이오컨쥬게이트의 생성을 가능하게 하였다. 바람직하게는, 올리고사카릴트랜스퍼라제는 숙주 세포에 대해 이종성이며, 특정 구체예에서, 이러한 올리고사카릴트랜스퍼라제를 인코딩하는 핵산은 숙주 세포의 게놈 내로 통합된다.
본원에 제공된 임의의 숙주 세포(예를 들어, 재조합 숙주 세포, 바람직하게는 재조합 원핵 숙주 세포)는 단백질의 N-글리코실화에서 활성인 추가적인 효소를 인코딩하는 핵산을 포함하며, 예를 들어, 본원에 제공된 숙주 세포는 다른 글리코실트랜스퍼라제를 인코딩하는 핵산 또는 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산을 추가로 포함할 수 있다.
본원에 제공된 숙주 세포는 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산을 포함한다. 올리고사카릴 트랜스퍼라제는 N-글리코실화 컨센서스 모티프를 포함하는 초기 폴리펩티드 사슬의 아스파라긴 잔기로 지질-연결된 다당류를 전달한다. 올리고사카릴 트랜스퍼라제를 인코딩하는 핵산은 숙주 세포에 대해 고유할 수 있거나, 유전자 접근법을 사용하여 숙주 세포 내에 도입될 수 있다. 바람직한 구체예에서, 올리고사카릴 트랜스퍼라제는 숙주 세포에 대해 이종성이다. 대장균은 자연적으로 올리고사카릴 트랜스퍼라제를 포함하지 않으며, 따라서 대장균이 바이오컨쥬게이트의 생성을 위한 숙주 세포로서 사용되는 경우, 이종성 올리고사카릴 트랜스퍼라제는 예를 들어, 유전자 조작에 의해 도입시 이러한 숙주 세포에 포함된다. 올리고사카릴 트랜스퍼라제는 본 개시내용의 관점에서 당업계에 공지된 임의의 공급원으로부터 비롯될 수 있다.
특정 구체예에서, 예를 들어, 비제한적인 예로서 PglL로서 O-글리코실트랜스퍼라제와 같은 N-글리코실트랜스퍼라제 활성을 갖는 올리고사카릴 트랜스퍼라제에 대한 대안은 예를 들어, WO 2016/82597에 기술된 바와 같이 담체 단백질에서 이들 자신의 상이한 글리코실화 컨센서스 서열과 함께 사용될 수 있다. 따라서, O-글리코실트랜스퍼라제와 같은 다른 글리코실트랜스퍼라제는 본 발명에 따른 올리고사카릴트랜스퍼라제로서 사용될 수 있다.
특정 바람직한 구체예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터로부터의 올리고사카릴 트랜스퍼라제이다. 예를 들어, 한 구체예에서, 올리고사카릴 트랜스퍼라제는 캄포르박터 제주니로부터의 올리고사카릴 트랜스퍼라제이다(즉, pglB; 예를 들어, 문헌 [Wacker et al., 2002, Science 298:1790-1793; see also, e.g., NCBI Gene ID: 3231775, UniProt Accession No. O86154] 참조). 또 다른 구체예에서, 올리고사카릴 트랜스퍼라제는 캄필로박터 라리로부터의 올리고사카릴 트랜스퍼라제이다(예를 들어, NCBI Gene ID: 7410986 참조).
특정 구체예에서, 올리고사카릴 트랜스퍼라제는 천연(야생형) 단백질 또는 이의 임의의 변이체, 예컨대 국제 특허 출원 공개 WO 2016/107818 및 WO 2016/107819에 기술된 것들을 포함하는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제이다. PglB는 지질-연결된 다당류를 컨센서스 서열 SEQ ID NO: 1 및 SEQ ID NO: 2의 아스파라긴 잔기로 전달할 수 있다. 특정 구체예에서, PglB 다당류 트랜스퍼라제는 SEQ ID NO: 6 또는 이의 변이체를 포함한다. 특정 구체예에서, 야생형 PglB에서 하나 이상의 내인성 글리코실화 컨센서스 서열은 변이되어 PglB 자가글리코실화를 회피하였으며, 예를 들어, SEQ ID NO: 6은 돌연변이 N534Q를 포함한다. 본원에 제공된 재조합 숙주 세포에 사용하기에 적합한 변이체 PglB 올리고사카릴 트랜스퍼라제의 예는 N311V, K482R, D483H, A669V, Y77H, S80R, Q287P 및 K289R로 구성된 군으로부터 선택되는 적어도 하나의 돌연변이를 포함하는 SEQ ID NO: 6의 PglB 올리고사카릴 트랜스퍼라제를 포함한다. 한 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 SEQ ID NO: 6을 갖는다. 또 다른 특정 구체예에서, 변이체 PglB 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 SEQ ID NO: 6을 갖는다. 특정 PglB 올리고사카릴 트랜스퍼라제 변이체가 특정 혈청형의 대장균 O-항원 바이오컨쥬게이트의 생성에서 현저하게 개선된 수율을 제공한다는 것이 본원에서 발견되고 설명되었다. 주어진 대장균 O-항원에 대한 개선되거나 최적의 PglB 변이체는 예측할 수 없었다. 따라서, 특정 양태에서, 본 발명은 또한 올리고사카릴 트랜스퍼라제로서 특정 PglB 변이체를 사용하여 특정 대장균 O-항원의 바이오컨쥬게이트를 생성하는 방법을 제공한다. SEQ ID NO: 6과 적어도 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 동일하며, 여전히 올리고사카릴 트랜스퍼라제 활성을 가져, 바람직하게는 본원에서 조합되어 개시된 지정된 위치에서 특정 아미노산 중 하나 이상을 갖는 PglB의 추가의 변이체 (예를 들어, 77Y, 80S, 287Q, 289K, 311N, 482K, 483D, 669A; 또는 311V; 또는 311V, 482R, 483H, 669V; 또는 77H, 80R, 287P, 289R, 311V; 또는 77H, 311V; 등)가 또한 바이오컨쥬게이트의 생성에 사용될 수 있다.
특정 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 N311V를 포함하는 SEQ ID NO: 6, 또는 더욱 바람직하게는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
다른 특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O1A, O6A, 또는 O15 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6 또는 바람직하게는, 돌연변이 N311V, K482R, D483H 및 A669V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6, 또는 바람직하게는 돌연변이 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
특정 구체예에서, 담체 단백질에 공유 결합된 대장균 O8, O18A, O25B, 또는 O2 항원 다당류의 바이오컨쥬게이트를 생성할 수 있는 숙주 세포(예를 들어, 재조합 숙주 세포)는 SEQ ID NO: 6의 아미노산 서열을 갖는 캄필로박터 제주니로부터의 PglB 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 바람직하게는 SEQ ID NO: 6은 위치 77, 80, 287, 289, 311, 482, 483, 및 669에서 아미노산 돌연변이를 포함하지 않는다.
일부 구체예에서, 본원에 제공된 임의의 숙주 세포는 담체 단백질, 예를 들어 숙주 세포 글리코실화 기구에 의해 생성된 O-항원 다당류(들)가 부착되어 바이오컨쥬게이트를 형성할 수 있는 단백질을 인코딩하는 핵산을 포함한다. 숙주 세포는, 비제한적으로, 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D를 포함하는 본 개시의 관점에서 당업자에게 공지된 임의의 담체 단백질을 인코딩하는 핵산을 포함할 수 있다.
바람직한 구체예에서, 숙주 세포는 탈독소화된 P. 애루기노사의 외독소 A(EPA)를 인코딩하는 핵산을 추가로 포함한다. 바람직하게는, EPA 담체 단백질은 1-10개의 글리코실화 부위, 바람직하게는 2 내지 4개의 글리코실화 부위, 가장 바람직하게는 4개의 글리코실화 부위, 예컨대 1-10개, 바람직하게는 2-4개, 및 더욱 바람직하게는 4개의 글리코실화 부위를 포함하며, 각각은 SEQ ID NO: 1의 아미노산 서열을 가지며, 더욱 바람직하게는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 숙주 세포는 SEQ ID NO: 3을 포함하는 EPA-4 담체 단백질을 인코딩하는 핵산을 추가로 포함한다.
특정 구체예에서, 본원에 기재된 숙주 세포에 의해 바이오컨쥬게이트의 생성에 사용되는 담체 단백질은 "tag", 즉 담체 단백질의 분리 및/또는 확인을 허용하는 아미노산의 서열을 포함한다. 예를 들어, tag를 담체 단백질에 추가하는 것은 그 단백질의 정제에 유용할 수 있으며, 따라서 컨쥬게이트 백신의 정제는 태깅된 담체 단백질을 포함한다. 본원에 사용될 수 있는 예시적인 tag는 비제한적으로, 히스티딘(HIS) tag(예를 들어, 헥사-히스티딘-tag, 또는 6XHis-Tag), FLAG-TAG 및 HA tag를 포함한다. 특정 구체예에서, 본원에 사용된 tag는 제거가능하며, 예를 들어, 일단 이들이 더 이상 필요하지 않으면, 예를 들어, 단백질이 정제된 후에 예를 들어, 화학적 제제 또는 효소적 수단에 의해 제거된다. 다른 구체예에서, 담체 단백질은 tag를 포함하지 않는다.
특정 구체예에서, 본원에 기재된 담체 단백질은 담체 단백질을 발현하는 숙주 세포의 주변세포질 공간으로 담체 단백질을 표적화하는 신호 서열을 포함한다. 특정 구체예에서, 신호 서열은 대장균 DsbA, 대장균 외막 포린 A(OmpA), 대장균 말토스 결합 단백질(MalE), 에르위니아 카로토보란스 펙테이트 리아제(Erwinia carotovorans pectate lyase)(PelB), FlgI, NikA, 또는 바실러스 종 엔독실라나제(XynA), 열 민감 대장균 장독소 LTIIB, 바실러스 엔독실라나제 XynA 또는 대장균 플래겔린(FlgI)으로부터 비롯된다. 한 구체예에서, 신호 서열은 SEQ ID NO: 10을 포함한다. 신호 서열은 단백질의 주변 세포질로의 전위 후에 절단될 수 있고, 따라서 바이오컨쥬게이트의 최종 담체 단백질에 더 이상 존재하지 않을 수 있다.
특정 구체예에서, 추가적인 변형이 (예를 들어, 재조합 기술을 사용하여) 본원에 기재된 숙주 세포 내로 도입될 수 있다. 예를 들어, 아마도 경쟁하거나 간섭하는 글리코실화 경로(예를 들어, 숙주 세포 내로 재조합으로 도입되는 글리코실화에 관련된 하나 이상의 이종성 유전자와 경쟁하거나 이를 간섭함)의 일부를 형성하는 단백질을 인코딩하는 숙주 세포 핵산(예를 들어, 유전자)은 이들을 불활성/기능이상으로 만드는 방식으로 숙주 세포 배경(게놈)에서 결실되거나 변형될 수 있다(즉, 결실/변형되는 숙주 세포 핵산은 기능성 단백질을 인코딩하지 않음). 특정 구체예에서, 핵산이 본원에 제공된 숙주 세포의 게놈으로부터 결실될 때, 이들은 바람직한 서열, 예를 들어 O 항원 다당류 또는 이의 바이오컨쥬게이트의 생성에 유용한 서열로 대체된다.
숙주 세포에서 결실될 수 있는 (일부 경우에, 다른 요망되는 핵산 서열로 대체될 수 있는) 예시적인 유전자 또는 유전자 클러스터는 waaL과 같은 당지질 생합성에 관여하는 숙주 세포의 유전자 또는 유전자 클러스터(예를 들어, 문헌 [Feldman et al., 2005, PNAS USA 102:3016-3021] 참조), 지질 A 코어 생합성 클러스터(waa), 갈락토스 클러스터(gal), 아라비노스 클러스터(ara), 콜론산 클러스터(wc), 캡슐 다당류 클러스터, 운데카프레놀-p 생합성 유전자(예를 들어, uppS, uppP), und-P 재순환 유전자, 뉴클레오티드 활성화된 당 생합성에 관여하는 대사 효소, 엔테로박터 공통 항원 클러스터(eca) 및 프로파지 O 항원 변형 클러스터, 예컨대 gtrABS 클러스터 또는 이의 영역을 포함한다. 특정 구체예에서, 본원에 기재된 숙주 세포는 이들이 요망되는 O 항원 다당류, 예를 들어 글루코실화된 O4 항원 다당류 이외의 임의의 O 항원 다당류를 생성하지 않도록 변형된다.
특정 구체예에서, waaL 유전자는 본원에 제공된 숙주 세포(예를 들어, 재조합 숙주 세포)의 게놈으로부터 결실되거나 기능적으로 불활성화된다. 용어 "waaL" 및 "waaL 유전자"는 주변 세포질에 위치한 활성 부위를 갖는 막 결합 효소를 인코딩하는 O-항원 리가제 유전자를 지칭한다. 인코딩된 효소는 운데카프레닐포스페이트(UPP)-결합된 O 항원을 지질 A 코어에 전달하여 지질다당류를 형성한다. 내인성 waaL 유전자(예를 들어, ΔwaaL 균주)의 결실 또는 방해하는 O-항원의 지질 A로의 전달을 방해하고, 대신 O-항원을 또 다른 생체분자, 예컨대 담체 단백질로의 전달을 향상시킬 수 있다.
또 다른 특정 구체예에서, waaL 유전자, gtrA 유전자, gtrB 유전자, gtrS 유전자 및 rfb 유전자 클러스터 중 하나 이상은 본원에 제공된 원핵 숙주 세포의 원래의 게놈으로부터 결실되거나 기능적으로 불활성화된다.
한 구체예에서, 본원에 사용된 숙주 세포는 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하는 대장균이고, 여기서 waaL 유전자는 숙주 세포의 게놈으로부터 결실되거나 기능적으로 불활성화되고, 대장균 O4 항원 다당류에 특이적인 gtrS 유전자가 삽입된다. 글루코실화된 O4 O-항원의 바이오컨쥬게이트를 위한 생산 균주에 대한 특정 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 gtrS 유전자는 모 균주의 gtrS 유전자를 O4 항원의 글루코실화를 담당하는 것으로 대체하도록 모 균주의 gtrS 유전자 대신 삽입된다. 이러한 모 균주의 예는 대장균 K-12 균주 W3110이다. gtrA 및 gtrB 유전자는 모 균주에 대해 상동일 수 있거나, 대안적으로 이들 유전자 중 하나 또는 둘 모두는 모 균주에 대해 이종성일 수 있다. 전형적으로, gtrS 유전자와 달리 이러한 gtrA 및 gtrB 유전자는 O-항원 구조에 특이적이지 않다.
또한 재조합 숙주 세포를 제조하는 방법이 본원에 제공된다. 본원에 기재된 방법에 의해 생성된 재조합 숙주 세포는 대장균 O 항원의 바이오컨쥬게이트를 생성하는데 사용될 수 있다. 방법은 하나 이상의 재조합 핵산 분자를 세포 내로 도입하여 재조합 숙주 세포를 생성하는 것을 포함한다. 전형적으로, 재조합 핵산 분자는 이종성이다. 본 개시내용의 관점에서 당업계에 공지된 임의의 방법을 사용하여 재조합 핵산 분자를 숙주 세포에 도입할 수 있다. 재조합 핵산은 당업자에게 공지된 임의의 방법, 예를 들어 전기천공, 화학적 형질전환, 열 충격, 자연 형질전환, 파지 형질도입 및 컨쥬게이션을 사용하여 본원에 기재된 숙주 세포 내로 도입될 수 있다. 특정 구체예에서, 재조합 핵산은 플라스미드를 사용하여 본원에 기재된 숙주 세포 내로 도입된다. 예를 들어, 이종성 핵산은 플라스미드(예를 들어, 발현 벡터)에 의해 숙주 세포에서 발현될 수 있다. 또 다른 특정 구체예에서, 이종성 핵산은 예를 들어, 국제 특허 출원 공개 WO 2014/037585, WO 2014/057109, 또는 WO 2015/052344에 기재된 바와 같은 게놈 내로의 삽입 방법을 사용하여 본원에 기재된 숙주 세포 내로 도입된다.
한 구체예에서, 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 생성하기 위한 재조합 숙주 세포를 제조하는 방법은 하나 이상의 재조합 핵산 분자를 세포, 바람직하게는 대장균 세포에 도입하여 재조합 숙주 세포를 생성하는 것을 포함한다. 이러한 구체예에서, 세포 내로 도입된 재조합 핵산 분자는 (i) 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (ii) SEQ ID NO: 4에 대해 적어도 80%의 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로서, 글루코실 트랜스퍼라제는 대장균 글루코실화된 O4 항원 다당류를 생성하기 위해 대장균 O4 항원 다당류를 변형시킬 수 있는, 뉴클레오티드 서열; (iii) 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및 (iv) 대장균 글루코실화된 O4 항원 다당류를 담체 단백질에 공유 결합시켜 바이오컨쥬게이트를 생성할 수 있는 올리고사카릴 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열을 포함한다. 바람직한 구체예에서, SEQ ID NO: 4에 대해 적어도 80% 서열 동일성을 갖는 글루코실 트랜스퍼라제를 인코딩하는 뉴클레오티드 서열은 내인성 gtrS 유전자를 대체한다. 내인성 gtrS를 삭제하면 글루코실화된 O4 항원 다당류 구조의 생성을 방해하지 않을 것이라는 이점이 있다. 특정 구체예에서, 대장균 O4 항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열은 재조합 숙주 세포를 제조하는 데 사용되는 모 균주의 내인성 rfb 유전자 클러스터를 대체한다. 세포가 아직 gtrA 및/또는 gtrB 유전자를 인코딩하지 않는 경우, 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 동일성을 갖는 트랜스로카제(gtrA) 및 글리코실트랜스퍼라제(gtrB)를 인코딩하는 뉴클레오티드 서열이 세포에 도입될 수 있다. 세포가 이미 gtrA 및 gtrB 유전자를 인코딩하는 경우(예를 들어, 대장균 K-12 균주 W3110의 경우), 이러한 유전자를 도입하거나 변경할 필요가 없다.
특정 구체예에서, 글루코실 트랜스퍼라제(O4 항원에 글루코스 분지를 부가하는데 특이적인 gtrS)는 SEQ ID NO: 4를 갖는다.
특정 구체예에서, 올리고사카릴 트랜스퍼라제는 C. 제주니로부터의 PglB이다. 이러한 한 구체예에서, 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함한다. 또 다른 이러한 구체예에서, 올리고사카릴 트랜스퍼라제는 돌연변이 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 포함한다. 또 다른 이러한 구체예에서, 올리고사카릴 트랜스퍼라제는 돌연변이 Y77H 및 N311V를 포함하는 SEQ ID NO: 6의 아미노산 서열을 포함한다.
또 다른 특정 구체예에서, 담체 단백질은 SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함한다. 또 다른 특정 구체예에서, 담체 단백질은 EPA, 바람직하게는 EPA-4, 예컨대 SEQ ID NO: 3을 포함하는 EPA-4이다.
도구 및 모델 유기체 둘 모두로서 분자 생물학에서 관례적으로 사용되는 대장균 균주는 예를 들어, 본 발명에 따른 특정 구체예에서 숙주 세포에 대한 모체로서 사용될 수 있다. 비제한적 예는 대장균 K12 균주(예를 들어, 예컨대 W1485, W2637, W3110, MG1655, DH1, DH5α, DH10 등), B 균주(예를 들어, BL-21, REL606 등), C 균주 또는 W 균주를 포함한다. 한 특정 구체예에서, 숙주 균주는 모 균주 W3110으로부터 유래된다. 이 균주는 예를 들어, 예일의 E. coli Genetic Stock Center에서 얻을 수 있다. 대장균에 대한 자세한 내용에 있어서는, 예를 들어, Ecoliwiki.net. 참조.
컨쥬게이트 및 바이오컨쥬게이트를 생성하는 방법
또한, 본원에 기재된 대장균 O 항원 다당류의 글리코컨쥬게이트를 생성하는 방법이 제공된다. 바이오컨쥬게이트를 포함하는 글리코컨쥬게이트는 예를 들어, 생산을 위해 본원에 기재된 재조합 숙주 세포를 사용하여 시험관내 또는 생체내에서 제조될 수 있다.
일부 구체예에서, 글리코컨쥬게이트는 화학적 합성에 의해 제조될 수 있으며, 즉 숙주 세포 외부에서 (시험관내) 제조될 수 있다. 예를 들어, 대장균 O 항원 다당류는 담체 단백질 뿐만 아니라 다당류/올리고당류에서 활성화 반응기를 사용하는 것을 포함하는, 당업자에게 공지된 방법을 사용하여 담체 단백질에 컨쥬게이션될 수 있다. 예를 들어, 그 개시내용이 본원에 참조로 통합되는 문헌 [Pawlowski et al., 2000, Vaccine 18:1873-1885; and Robbins, et al., 2009, Proc Natl Acad Sci USA 106:7974-7978)] 참조. 이러한 접근법은 숙주 세포로부터 항원성 다당류/올리고당을 추출하고, 다당류/올리고당을 정제하고, 다당류/올리고당을 화학적으로 활성화하고, 다당류/올리고당을 담체 단백질에 컨쥬게이션시키는 것을 포함한다.
일부 구체예에서, 본원에 기재된 숙주 세포를 사용하여 담체 단백질에 공유 결합된 대장균 O 항원 다당류를 포함하는 바이오컨쥬게이트를 생성할 수 있다. 숙주 세포를 사용하여 이러한 바이오컨쥬게이트를 생성하는 방법은 당업계에 공지되어 있다. 예를 들어, WO 2003/074687 및 WO 2006/119987을 참조한다. 이러한 방법은 바이오컨쥬게이트의 생성을 위한 조건 하에 본원에 기재된 임의의 재조합 숙주 세포를 배양하는 것을 포함한다. 바이오컨쥬게이트는 본 개시내용의 관점에서 당업계에 공지된 임의의 방법을 사용하여 재조합 숙주 세포로부터 단리, 분리 및/또는 정제될 수 있다. 예를 들어, 바이오컨쥬게이트는 예를 들어, 크로마토그래피(예를 들어, 이온 교환, 음이온 교환, 친화도 및 사이징 컬럼 크로마토그래피), 원심분리, 차등 용해도에 의해 또는 단백질 정제를 위한 임의의 다른 표준 기술에 의해 단백질의 정제를 위해 당업계에 공지된 임의의 방법에 의해 정제될 수 있다. 예를 들어, WO 2009/104074에 기술된 방법을 참조한다. 추가로, 바이오컨쥬게이트는 정제를 용이하게 하기 위해 이종성 폴리펩티드 서열에 융합될 수 있다. 특정 바이오컨쥬게이트를 정제하는데 사용되는 실제 조건은 부분적으로 바이오컨쥬게이트의 순 전하, 소수성 및/또는 친수성과 같은 인자에 의존적일 것이며, 당업자에게 명백할 것이다. O1A, O2, O6A 및 O25B에 대한 바이오컨쥬게이트의 제조 뿐만 아니라 이들을 포함하는 백신 조성물은 예를 들어, WO 2015/124769및 WO 2017/035181에 기재되어 있다.
또한, 본원에 기재된 방법에 의해, 즉, 본원에 기재된 재조합 숙주 세포를 사용하여 생성된 바이오컨쥬게이트가 제공된다.
일부 구체예에서, 담체 단백질에 공유 결합된 대장균 O-항원 다당류의 바이오컨쥬게이트를 제조하는 방법은 (i) (a) O-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열; (b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하고, 더욱 바람직하게는 각각 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 4개의 글리코실화 부위를 포함하는 담체 단백질, 바람직하게는 EPA를 인코딩하는 뉴클레오티드 서열; 및 (c) 올리고당 트랜스퍼라제, 예를 들어 PglB 올리고당 트랜스퍼라제 또는 이의 변이체를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다.
특정 구체예에서, 본원에 기재된 재조합 숙주 세포를 사용하여 생성된 대장균 O-항원 다당류는 특정 다당류 대 단백질 중량비(w/w)로 담체 단백질에 공유 결합된다. 담체 단백질에 공유 결합된 O-항원 다당류의 양의 이러한 중량비는 "글리칸/단백질 비" 또는 "다당류/단백질 비" 또는 "PS/단백질 비"로 언급된다. 일부 구체예에서, O-항원 다당류는 약 1:20 내지 20:1, 바람직하게는 1:10 내지 10:1, 더욱 바람직하게는 1:3 내지 3:1의 다당류 대 단백질 (w/w) 비율로 담체 단백질에 공유 결합된다. 본원에 기재된 바이오컨쥬게이트에 대한 특정 비제한적인 구체예에서, 글리칸/단백질 비율은 약 0.1 내지 0.5, 예컨대 0.1, 0.15, 0.2, 0.25, 0.3, 0.35, 0.4, 0.45, 또는 0.5이다. 이러한 구체예에서, O-항원 다당류:단백질의 중량비는 특정 O-항원 혈청형에 따라 약 1:10 내지 1:2, 예컨대 1:10, 1:9, 1:8, 1:7, 1:6, 1:5, 1:4, 1:3 또는 1:2이다. 특정 구체예에서, 글리칸/단백질 비는 약 0.15 내지 약 0.45이다. 일반적으로, O-항원 다당류 대 담체 단백질의 더 높은 글리칸/단백질 비율이 선호되는데, 그 이유는 다량의 담체 단백질이 일부 경우에 면역학적 간섭을 유발할 수 있기 때문이다. 또한, 더 높은 글리칸/단백질 비율은 바이오컨쥬게이트 형태로 투여된 충분한 O-항원 다당류를 얻는 데 도움이 될 것이며, 담체 단백질의 양은 상대적으로 낮게 유지되며, 이는 다중 혈청형이 조성물 예를 들어, 적어도 4개의 상이한 O-항원, 적어도 5개의 상이한 O-항원, 적어도 6개의 상이한 O-항원, 적어도 7개의 상이한 O-항원, 적어도 8개의 상이한 O-항원, 적어도 9개의 상이한 O-항원, 적어도 10개의 상이한 O-항원 등으로부터의 바이오컨쥬게이트를 포함하는 조성물에 의해 커버되어야 하는 다가 조성물에 특히 유리하다.
본 발명에 따른 컨쥬게이트의 글리칸/단백질 비는 단백질 양 및 글리칸 양을 결정함으로써 결정될 수 있다. 단백질 양은 280 nm에서의 UV 흡광도(A280)를 측정하여 결정될 수 있다. 글리칸 양은 (예를 들어, 표 1의 O8에 대한 Man, 및 표 1의 다른 글리칸에 대한 GlcNAc의) 반복 단위에서 당의 펄스 전류계 검출(IC-PAD)과 이온 크로마토그래피를 기반으로 결정될 수 있으며, 그 후 반복 단위의 구조 정보는 총 글리칸 양을 계산하는데 사용될 수 있다(예를 들어, O1A의 반복 단위는 845 Da의 몰 질량을 가지며, 이러한 반복 단위 1몰은 1몰의 GlcNAc를 함유하며, 이는 GlcNAc의 양이 IC-PAD에 의해 결정될 때 총 글리칸 양의 계산을 가능하게 한다).
일부 구체예에서, 본원에 기재된 세포 및 방법에 따라 재조합 숙주 세포를 사용하여 생성된 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트는 L-Rh 당의 위치 2에서 특정 정도의 아세틸화를 갖는다. 바이오컨쥬게이트에서 O25B 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%이다.
유사하게는, 바이오컨쥬게이트에서 대장균 O16 항원 다당류의 O-아세틸화 정도는 바람직하게는 적어도 30%, 바람직하게는 적어도 50%, 예컨대 적어도 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95% 또는 100%이다.
특정 구체예에서, O-항원 다당류의 바이오컨쥬게이트를 제조하는 방법은 생성되는 O-항원 다당류 바이오컨쥬게이트에 따라 특정 올리고사카릴 트랜스퍼라제 효소, 특히 PglB 올리고사카릴 트랜스퍼라제 또는 이의 변이체를 인코딩하는 핵산 서열을 포함하는 재조합 숙주 세포를 제공하는 단계를 포함한다. 특정 올리고사카릴 트랜스퍼라제 효소 변이체는 숙주 세포에 의해 생성된 바이오컨쥬게이트의 수율에 영향을 미칠 수 있다. 전형적으로, 수율이 특정 바이오컨쥬게이트를 생산하는 비용에 영향을 미치기 때문에 더 높은 수율이 바람직하며, 이는 여러 상이한 바이오컨쥬게이트를 포함하는 다가 조성물에 특히 중요한다. 일부 구체예에서, 방법은 재조합 숙주 세포로부터 바이오컨쥬게이트를 분리하는 것을 추가로 포함한다.
한 특정 구체예에서, O-항원이 O1A, O6A, 또는 O15 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V, K482R, D483H, 및 A669V의 아미노산 돌연변이를 포함하고, 여기에서 아미노산 돌연변이는 SEQ DI NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구체예에서, O-항원이 글루코실화된 O4 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 아미노산 돌연변이 N311V, 또는 Y77H 및 N311V의 아미노산 돌연변이를 포함하며, 여기에서 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구체예에서, O-항원인 O16 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며, 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구체예에서, O-항원이 O75 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 N311V의 아미노산 돌연변이를 포함하며, 여기에서 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이다.
또 다른 특정 구체예에서, O-항원이 O8, O18A, O25B 또는 O2 항원 다당류인 경우, PglB 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함하며, 여기에서 SEQ ID NO: 6은 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다. 이의 특정 구체예에서, PglB 올리고사카릴 트랜스퍼라제는 SEQ ID NO: 6의 아미노산 서열을 포함한다.
일부 구체예에서, 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.
특정 구체예에서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다. 바람직하게는, EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다. 바람직하게는, 각각의 글리코실화 부위는 SEQ ID NO: 2의 아미노산 서열을 갖는 글리코실화 컨센서스 서열을 포함한다. 특정 구체예에서, 숙주 세포는 SEQ ID NO: 3을 포함하는 EPA-4 담체 단백질을 인코딩하는 핵산을 포함한다.
특정 구체예에서, 재조합 숙주 세포는 대장균 세포, 예를 들어 대장균 K-12 균주, 예컨대 균주 W3110이다.
또한, 상기 나타낸 O-항원/PglB 올리고사카릴 트랜스퍼라제 쌍에 따라 올리고사카릴 트랜스퍼라제 효소를 인코딩하는 재조합 숙주 세포를 사용하여 생성된 O-항원 다당류의 바이오컨쥬게이트가 본원에 제공된다. 또한, 이러한 바이오컨쥬게이트를 포함하는 조성물이 제공된다. 특정 구체예에서, 조성물은 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 이러한 바이오컨쥬게이트를 포함한다.
일부 구체예에서, 상기 나타낸 O-항원/PglB 올리고사카릴 트랜스퍼라제 쌍에 따라 올리고사카릴 트랜스퍼라제 효소를 인코딩하는 재조합 숙주 세포에 의해 생성된 O-항원 다당류의 바이오컨쥬게이트는 바람직하게는 본원에 기재된 바람직한 속성, 예를 들어 글리칸/단백질 비 및/또는 다중-글리코실화된 담체 단백질의 양 또는 중량 중 하나 이상을 갖는다.
구체예
구체예 1은 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이며, 상기 방법은
(i) a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 숙주 세포를 배양하는 단계를 포함하며,
여기에서,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O8 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O18A 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하고,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 표 1에 제시된 바와 같은 각각 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 2는 구체예 1의 방법이며, 여기에서 Ox-항원은 O1A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 3은 구체예 1의 방법이며, 여기에서 Ox-항원은 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함한다.
구체예 4는 구체예 3의 방법이며, 여기에서 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
구체예 5는 구체예 1의 방법이며, 여기에서 Ox-항원은 O6A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 6은 구체예 1의 방법이며, 여기에서 Ox-항원은 O8 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
구체예 7은 구체예 1의 방법이며, 여기에서 Ox-항원은 O15 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 8은 구체예 1의 방법이며, 여기에서 Ox-항원은 O16 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.
구체예 9는 구체예 1의 방법이며, 여기에서 Ox-항원은 O18A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
구체예 10은 구체예 1의 방법이며, 여기에서 Ox-항원은 O75 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.
구체예 11은 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법이며, 상기 방법은
(i) (a) Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
(c) 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 숙주 세포를 배양하는 단계를 포함하며,
PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하고,
여기에서 Ox-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고, Ox-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 표 1에 제시된 바와 같이 각각 화학식 (O1A), (O4-Glc+), (O6A), (O15), (O16) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 12는 구체예 1 내지 11 중 어느 하나의 방법으로서, 재조합 숙주 세포로부터 바이오컨쥬게이트를 단리하는 단계를 추가로 포함한다.
구체예 13은 구체예 1 내지 12 중 어느 하나의 방법이며, 여기에서 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.
구체예 14는 구체예 13의 방법이며, 여기에서 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다.
구체예 15는 구체예 14의 방법이며, 여기에서 EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다.
구체예 16은 구체예 15의 방법이며, 여기에서 각각의 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다.
구체예 17은 구체예 16의 방법이며, 여기에서 EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.
구체예 18은 구체예 1 내지 17 중 어느 하나의 방법이며, 여기에서 재조합 숙주 세포는 대장균 세포, 예를 들어 대장균 K-12 균주, 예를 들어 균주 W3110이다.
구체예 19는 구체예 1-18 중 어느 하나의 방법에 의해 생성된 바이오컨쥬게이트이다.
구체예 20은 구체예 19의 바이오컨쥬게이트를 포함하는 조성물이다.
구체예 21은 구체예 19의 적어도 2개, 바람직하게는 적어도 3개, 더욱 바람직하게는 적어도 5개, 더욱 더 바람직하게는 적어도 7개의 바이오컨쥬게이트를 포함하는 조성물이다.
구체예 22는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트를 포함하는 구체예 20 또는 21의 조성물이며, 여기에서 글루코실화된 O4 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
구체예 23은 적어도 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트를 추가로 포함하는 구체예 20 내지 22 중 어느 하나의 조성물이며, 여기에서 O25B 항원 다당류는 표 1에 제시된 화학식 (O25B)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 24는 적어도 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트를 추가로 포함하는 구체예 20 내지 23 중 어느 하나의 조성물이며, 여기에서 O2 항원 다당류는 표 1에 제시된 화학식 (O2)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 25는 구체예 20 내지 24 중 어느 하나의 조성물이며, 이는 (i) 담체 단백질에 공유 결합된 대장균 O1A 항원 다당류의 바이오컨쥬게이트, (ii) 담체 단백질에 공유 결합된 대장균 O2 항원 다당류의 바이오컨쥬게이트, (iii) 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트, (iv) 담체 단백질에 공유 결합된 대장균 O6A 항원 다당류의 바이오컨쥬게이트, (v) 담체 단백질에 공유 결합된 대장균 O8 항원 다당류의 바이오컨쥬게이트, (vi) 담체 단백질에 공유 결합된 대장균 O15 항원 다당류의 바이오컨쥬게이트, (vii) 담체 단백질에 공유 결합된 대장균 O16 항원 다당류의 바이오컨쥬게이트, (viii) 담체 단백질에 공유 결합된 대장균 O25B 항원 다당류의 바이오컨쥬게이트 및 (ix) 담체 단백질에 공유 결합된 대장균 O75 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기서 O1A, O2, 글루코실화된 O4, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 도시된 바와 같은 화학식 (O1A), (O2), (O4-Glc+), (O6A), (O8), (O15), (O16), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 26은 구체예 25의 조성물이며, 이는 추가로 (x) 담체 단백질에 공유 결합된 대장균 O18A 항원 다당류의 바이오컨쥬게이트를 포함하며, 여기에서 O18A 항원 다당류는 표 1에 제시된 화학식 (O18A)의 구조를 가지며, n은 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어, 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 27은 구체예 20 내지 26 중 어느 하나의 조성물이며, 여기에서 조성물은 면역원성 조성물이다.
구체예 28은 대장균, 특히 장외 병원성 대장균(ExPEC)에 대해 대상체를 백신화시키는 방법으로서, 대상체에 구체예 19의 바이오컨쥬게이트 또는 구체예 20 내지 27 중 어느 하나의 조성물 또는 면역원성 조성물을 투여하는 것을 포함하는 방법이다.
구체예 29는 장외 병원성 대장균(ExPEC)에 대한 백신화에 사용하기 위한 구체예 19의 바이오컨쥬게이트, 또는 구체예 20 내지 27 중 어느 하나의 조성물 또는 면역원성 조성물이다.
구체예 30은 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 숙주 세포이며, 재조합 숙주 세포는
(a) Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
(b) SEQ ID NO: 1, 바람직하게는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
(c) 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하며,
여기에서,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O8 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하고;
Ox-항원이 O18A 항원 다당류인 경우, PglBy는 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않으며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하고,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O8, O15, O16, O18A 및 O75 항원 다당류는 표 1에 제시된 바와 같이 각각 화학식 (O1A), (O4-Glc+), (O6A), (O8), (O15), (O16), (O18A) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어 5 내지 40, 예를 들어 7 내지 25, 예를 들어 10 내지 20의 정수이다.
구체예 31은 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O1A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 32는 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원이 글루코실화된 O4 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함한다.
구체예 33은 구체예 32의 재조합 숙주 세포이며, 여기에서 재조합 숙주 세포는 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함한다.
구체예 34는 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O6A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 35는 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O8 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
구체예 36은 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O15 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함한다.
구체예 37은 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O16 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함한다.
구체예 38은 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O18A 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이를 포함하지 않는다.
구체예 39는 구체예 30의 재조합 숙주 세포이며, 여기에서 Ox-항원은 O75 항원 다당류이고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 N311V의 아미노산 돌연변이를 포함한다.
구체예 40은 구체예 30 내지 39 중 어느 하나의 재조합 숙주 세포이며, 여기에서 담체 단백질은 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택된다.
구현예 41은 구체예 30-40 중 어느 하나의 재조합 숙주 세포이며, 여기에서 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)이다.
구체예 42는 구체예 41의 재조합 숙주 세포이며, 여기에서 EPA 담체 단백질은 1-10개, 바람직하게는 2-4개, 더욱 바람직하게는 4개의 글리코실화 부위를 포함한다.
구체예 43은 구체예 42의 재조합 숙주 세포이며, 여기에서 각 글리코실화 부위는 SEQ ID NO: 2를 갖는 글리코실화 컨센서스 서열을 포함한다.
구체예 44는 구체예 43의 재조합 숙주 세포이며, 여기에서 EPA 담체 단백질은 SEQ ID NO: 3을 포함한다.
구체예 45는 구체예 30 내지 44 중 어느 하나의 재조합 숙주 세포이며, 여기에서 재조합 숙주 세포는 대장균 세포, 예를 들어, 대장균 K-12 균주, 예컨대 균주 W3110이다.
구체예 46은 구체예 19에 따른 바이오컨쥬게이트이며, 여기에서 바이오컨쥬게이트는 담체 단백질에 공유 결합된 대장균 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트이다.
구체예 47은 구체예 46에 따른 바이오컨쥬게이트이며, 여기에서 담체 단백질은 SEQ ID NO: 3을 포함하는 EPA 담체 단백질이다.
구체예 48은 구체예 46 또는 47에 따른 바이오컨쥬게이트이며, 여기에서 글루코실화된 O4 항원 다당류는 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 가지며, n은 5 내지 40의 정수이다.
구체예 49는 구체예 46-48 중 어느 하나에 따른 바이오컨쥬게이트를 포함하는 조성물이다.
구체예 50은 구체예 49에 따른 조성물로서, 담체 단백질에 공유 결합된 대장균 항원 다당류를 각각 포함하는 하나 이상의 컨쥬게이트를 추가로 포함하는 조성물이다.
구체예 51은 구체예 50에 따른 조성물이며, 여기에서 하나 이상의 컨쥬게이트는 대장균 혈청형 O1A, O2, O6A, O8, O15, O16, O18A, O25B, 및 O75 중 하나 이상의 대장균 항원 다당류를 포함하며, 여기에서 O1A, O2, O6A, O8, O15, O16, O25B 및 O75 항원 다당류는 각각 표 1에 제시된 바와 같은 화학식 (O1A), (O2), (O6A), (O8), (O15), (O16), (O18A), (O25B) 및 (O75)의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100, 바람직하게는 3 내지 50, 예를 들어, 5 내지 40, 예를 들어, 7 내지 25, 예를 들어, 10 내지 20의 정수이다.
구체예 52는 구체예 51에 따른 조성물로서, 대장균 혈청형 O1A, O2, O6A, O8, O15, O16, O18A, O25B 및 O75의 컨쥬게이트를 포함하는 조성물이다.
구체예 53은 구체예 52에 따른 조성물이며, 여기에서 컨쥬게이트 각각은 바이오컨쥬게이트이다.
실시예
본 발명의 하기 실시예는 본 발명의 성질을 추가로 예시하기 위한 것이다. 하기 실시예는 본 발명을 제한하지 않으며, 본 발명의 범위는 첨부된 청구범위에 의해 결정되어야 함을 이해해야 한다.
실시예 1:
대장균 감염의 역학 데이터
균혈증 초래 대장균의 O-혈청형 분포를 결정하기 위해, 글로벌 감시 연구를 수행하였다. 2011년과 2017년 사이에 북미, 유럽, 아시아 태평양 지역 및 남미 국가에서 입원한 60세 이상의 환자로부터 3200개가 넘는 대장균 혈류 분리주를 수집하였다. 각 균주는 고전적 응집 기술 및 서열-기반 O-유전자형을 이용하여 O 항원 혈청형에 대해 분석되었다. 표 2 참조.
분리된 인간 혈액 샘플을 분석하여 그 안의 병원체의 정체와 이들의 항생제 내성 패턴을 결정하였다. 대장균 분리주를 분석 후 샘플로부터 수득하였다. 대장균 정체를 MALDI-TOF MS에 의해 확인하였다. 대장균 분리주에 대한 추가의 분석은 O-항원 혈청형을 결정하기 위해 항혈청-기반 응집 검정을 사용하여 수행하였다(DebRoy et al. (2011) Animal health research reviews / Conference of Research Workers in Animal Diseases 12, 169-185). 응집 방법으로 유형화할 수 없는 분리주를 전체-게놈 시퀀싱에 이어서 O-혈청형 wzy 및 wzx 유전자 서열을 기반으로 하는 O-지노타이핑에 의해 추가로 분석하였다.
표 2: 응집에 의한 O-지노타이핑과 응집에 의한 유형화할 수 없는 분리주의 O-지노타이핑을 기반으로 한, 2011년에서 2017년 사이에 전 세계적으로 수집된 3217개 혈액 분리주의 컬렉션으로부터 가장 공통적인 균혈증-관련 대장균 O-혈청형의 분포 대상체는 다음 국가의 입원 대상체였다: USA, 캐나다, 아르헨티나, 브라질, 영국, 독일, 스페인, 이탈리아, 네덜란드, 프랑스, 일본, 태국, 한국 및 호주.
전 세계의 균혈증 관련 대장균 세트에서 지리적 위치에 대한 계층화는 위치와 무관한 상위 10개 O-혈청형의 유병률을 보여주었으며, 이는 이들이 균혈증을 초래하는 대장균과 전세계적으로 관련된 우세한 O-혈청형임을 시사한다.
전 세계의 균혈증-관련 다중-약물 내성 대장균 분리주(n=345), 즉 임상적으로 관련된 항미생물제의 적어도 3가지 부류에 내성이 있는 이러한 균주 세트에서, 상위 10개 O-혈청형의 유병률은 75.4%이다.
역학 분석의 모든 정보를 종합하면, 유형화할 수 없는 균주의 하위부분을 내포한다고 가정할 경우 10가지 우세한 O-혈청형이 대장균-관련 균혈증 감염의 추정되는 60-80%를 커버할 수 있다.
균혈증-초래 대장균 혈청형의 상당 부분을 커버하는 다가 백신은 매우 유용할 것이다. 따라서, 표 2의 O-혈청형은 O-항원 기반 다가 백신에 대한 좋은 후보가 될 것이다. 이러한 백신은 바이오컨쥬게이션 기술을 사용하여 유리하게 제조될 수 있다.
상위 10개 혈청형(표 2) 중 하나는 O4이다. 따라서, 담체 단백질에 결합된 대장균 혈청형 O4의 O-항원 다당류를 포함하는 바이오컨쥬게이트 백신을 제조하는 것이 유익할 것이다.
실시예 2
: O-항원 변형 효소를 인코딩하는 유전자에 대한 현대 O4 임상 분리주의 특성 규명
대장균 O4 항원 다당류의 2개 변이체가 기술되었는데(예를 들어, 문헌 [Jann B, et al., 1993, Carbohydr. Res. 248: 241-250] 참조), 하나는 비분지된 구조(표 1에서 (O4-Glc-)로서 제시된 구조)를 가지며, 또 다른 변이체는 추가의 글루코스 측분지(표 1에서 (O4-Glc+)로서 제시된 구조)로 치환된 것이다. 이들 두 변이체가 현대 임상 분리주 중에서 발견되는 비율은 알려져 있지 않았다. 두 변이체 모두는 O4 항혈청과 반응하지만, 이들 변이체 사이에 면역학적 차이가 존재하는지의 여부는 또한 알려지지 않았다. 또한, (O4-Glc+) 항원 다당류를 생성하기 위해 글루코스 측-분지를 부착시키는 역할을 하는 효소는 지금까지 확인되지 않았으며, 이의 추정 코딩 서열은 아마도 O4 rfb 유전자 클러스터 외부에 존재할 것이다.
미국과 유럽 연합의 대상체로부터 2011-2012년 기간 동안 원래 분리된 32개의 응집 확인된 대장균 O4 임상 분리주 세트를 전체 게놈 서열 분석으로 처리하였다. 32개의 시퀀싱된 O4 분리주로부터 추출된 rfb 유전자 클러스터 서열을 참조 균주의 서열과 정렬하고, 뉴클레오티드 수준에서 비교하였다. 일부 자연 발생 단일 뉴클레오티드 다형성을 제외하고, 특성 규명된 분리주 모두는 O4 참조 균주와 동일한 rfb 클러스터를 나타내었으며, 이는 대장균 O4 균주가 이들의 Glc-분지 상태와 무관하게 동일한 rfb 유전자 클러스터를 수반함을 나타낸다. 따라서, 대장균 O4-Glc+ 항원 다당류를 생성하기 위해, 대장균 O4-특이적 분지 효소를 인코딩하고, 대장균 O4 rfb 유전자 클러스터의 외부 어딘가에 있을 알려지지 않은 서열을 갖는 유전자가 필요할 가능성이 높다. 이러한 알려지지 않은 유전자의 서열은 확인되어야 하며, 대장균 O4-Glc-항원 다당류와의 바이오컨쥬게이트를 생성하기만 할 균주에서 대장균 O4-Glc+ 항원 다당류를 갖는 바이오컨쥬게이트를 생성하고자 하는 경우, 사용되어야 한다.
그 후, 전체-게놈 서열 데이터를 O-항원 변형 효소를 인코딩할 수 있는 rfb 유전자 클러스터 외부에 있는 유전자의 존재에 대해 분석하였다. 쉬겔라 플렉스네리(Shigella flexneri) 중의 gtrAB의 상동체를 먼저 대장균 O4에서 확인하였다. 그 후, 대장균에서 gtrAB 다운스트림의 오픈 리딩 프레임은 대장균 O4-특이적 유전자 gtrS로서 추정적으로 확인되었으며, 이는 대장균 O4 항원에의 글루코스 분지 첨가를 담당하는 추정적 대장균 O4 특이적 분지 효소 GtrS를 인코딩할 수 있다.
O4 특이적 GtrS 효소의 아미노산 서열은 SEQ ID NO: 4로서 제공된다. 이러한 단백질을 인코딩하는 예시적인 핵산 서열은 SEQ ID NO: 5로서 제공된다.
특성 규명된 대장균 O4 분리주 중 약 80%가 여기에서 확인된 gtrS 유전자를 수반하는 것으로 밝혀졌다(32개 중 26개). 대장균 O4-특이적 gtrS 서열의 유병률은 또한 미국 및 유럽 연합에서 2014년-2016년 기간 동안 대상체로부터 분리된 20개의 응집-확인된 대장균 O4 임상 분리주의 독립된 세트에서 서열 특이적 프라이머를 사용하여 PCR에 의해 결정되었다. 이 분석은 20개의 분리주 중 17개가 O4 gtrS 염기서열을 수반하고 있음을 보여주었고, 이는 85%의 유병률에 해당한다.
실시예 3:
O4
gtrS
의 대장균 W3110으로의 클로닝, Glc-변형된 O4 바이오컨쥬게이트의 생성 및 구조 확인
분지형 글루코스로 변형된 O4-항원 다당류를 포함하는 바이오컨쥬게이트가 제조될 수 있는지의 여부를 테스트하기 위해, 추정되는 분지 효소를 갖는 대장균 O4-항원 EPA 바이오컨쥬게이트 생산 균주를 작제하였다. 이를 위해 내인성 O16-gtrS 유전자를 추정되는 O4-gtrS 유전자(SEQ ID NO: 5, 실시예 2참조)로 치환하고, 상동성 재조합에 의해 대장균 균주 W3110 ΔwzzE-wecG ΔwaaL ΔwbbI-J-K에서 O16 rfb 클러스터를 O4 rfb 클러스터로 대체하였다. 대안적으로, 일부 균주에서, O4 rfb 클러스터를 플라스미드에 인코딩하였다.
후속하여, 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA) 담체 단백질(각각 'EPA-2' 및 'EPA-4'로 지칭되는 2 또는 4개의 컨센서스 글리코실화 부위를 갖는 변이체) 및 올리고사카릴 트랜스퍼라제 PglB를 인코딩하는 플라스미드를 균주에 도입하였다. Glc로 변형된 O4-EPA 바이오컨쥬게이트는 생물반응기 배양에서 대장균 생산 균주를 성장시키고, 각각 IPTG 및 아라비노스에 의해 PglB 및 EPA 발현을 유도하여 생성하였다. O4-EPA 바이오컨쥬게이트는 바이오매스 주변세포질 추출물로부터 추출하였다.
상세한 다당류 조성 및 O4-EPA 바이오컨쥬게이트의 연결을 확인하기 위해, 다중 NMR 실험은 EPA-4 담체 단백질을 갖는 바이오컨쥬게이트에 대해 수행하였다(데이터는 미도시됨). 수득된 배치는 공개된 문헌과 일치하였다(Jansson, P.E., et al., 1984, Carbohydr. Res. 134(2): 283-291; Jann B, et al., 1993, Carbohydr. Res. 248: 241-250). 313K에서 기록된 1D 스펙트럼은 5개의 아노머, 2개의 NAc 및 2개의 H6 신호(Rha & FucNAc)가 있는 O4 오당류 RU에서 큰 HOD 신호와 작고 날카로운 신호를 보여주었다.
1D 양성자 배치는 2D 양성자-양성자 및 양성자-탄소 상관 NMR 실험을 사용하여 확인되었다. 먼저, 2D TOCSY(120 ms) 실험은 O4 오당류 RU에 대해 H1 및 H6(Rha 및 FucNAc의 경우)에서 예상되는 교차 피크와 말단 RU 및 EPA에서 작은 피크를 보여주었다. 메틸 영역에서, TOCSY는 O4 RU에 있어서 α-FucNAc에 대한 H6 내지 H5 및 α-Rha에 있어서 H6 내지 H1의 교차 피크를 보여주었다. 관찰된 다른 피크는 EPA 아미노산 및 말단 Rha (tRha)로부터 비롯된다. 두번째, 탄소 NMR 스펙트럼은 O4 RU에 대해 잘 분산되고 진단적인 단일 피크를 함유하였다. 탄소는 HSQC 실험을 사용하여 부착된 양성자를 통해 간접적으로 프로파일링하였다. HSQC-DEPT 실험은 CH2 기에 대한 역 피크를 제공하였다. HSQC는 O4 오당류 RU [5개의 아노머, 고리, 2개의 N-아세틸 및 2개의 메틸(Rha 및 FucNAc)] 기는 물론 특징적인 영역의 EPA 아미노산에 대한 교차 피크를 제공하였다. O4에 대한 각각의 양성자/탄소 쌍은 양성자 배치 및 문헌에 따라 배치될 수 있다.
따라서, 구조적 특성 규명 실험은 Glc-분지된 O4 바이오컨쥬게이트(표 1에서 화학식 (O4-Glc+)로 나타낸 바와 같이 다당류 항원 구조를 포함)가 실시예 2에서 확인된 추정 대장균 O4-gtrS 유전자를 사용하여 생성될 수 있음을 확인시켜 주었다.
실시예 4
: 토끼에서 Glc-분지된 O4 바이오컨쥬게이트의 면역원성
Glc-변형된 O4 바이오컨쥬게이트(즉, 표 1에 제시된 바와 같은 화학식 (O4-Glc+)의 구조를 갖는 글리칸을 가짐)는 스피디-래빗 프로토콜(Eurogentec)을 적용함으로써 토끼 면역화에 사용하였다. 면역화된 토끼로부터의 혈청을 Glc-분지의 존재 (Glc+; 즉, 글루코실화된 O4 다당류를 함유) 또는 부재(Glc-; 즉, 비-글루코실화된 O4 다당류 함유) 하에 정제된 O4 지질다당류(LPS)에 대한 항-O4 IgG 역가에 대해 ELISA에 의해 분석하였다. 바이오컨쥬게이트로의 면역화는 두 토끼 모두에서 높은 IGg 역가를 발생시켰다(도 1). 두 경우 모두에서, Glc+ LPS에 대한 O4 바이오컨쥬게이트에 의해 유도된 항체 역가는 Glc- LPS와 비교하여 더 높았다.
혈청을 또한 풀링시키고, 특성 규명된 gtrS 상태를 갖는 대장균 O4 분리주의 테스트 세트를 사용하여 전체 세포 ELISA 연구에 사용하였다. 5개의 gtrS-음성(Glc-분지 없음) 및 6개의 gtrS-양성(Glc-분지) 대장균 O4 분리주 및 음성 대조군 균주를 테스트하였다. Glc-변형된 O4 바이오컨쥬게이트로 면역화된 토끼로부터의 풀링된 혈청은 시험된 O4 분리주를 특이적으로 인식하는 높은 역가의 IgG를 함유하였다(도 2). LPS ELISA에 따라, 모든 시험된 O4 분리주는 면역 혈청에 의해 인식되었다. gtrS-양성 분리주는 gtrS-음성 분리주보다 전반적으로 더 높은 결합을 나타내었다(도 2). 특히, 다음 분리주는 gtrS-양성이었으며: Y1382, E551, OC24334, stGVXN4983, stGVXN4994 및 OC24794; 다음 분리주는 gtrS-음성이었다: A2625, stGVXN4988, OC24784, OC24787, 및 OC24788. 면역 혈청은 비관련 O-혈청형의 음성 대조군 균주인 대장균 OC9487(ATCC 35383)에 결합하지 않았다.
은-염색된 폴리아크릴아미드 겔에서 gtrS-양성 및 -음성 분리주의 테스트 세트로부터 추출된 LPS의 프로파일은 O4 항원의 비변형된 형태 및 변형된 형태를 발현하는 분리주 사이의 현격한 차이를 드러내지 않았으며, 이는 관찰된 차이가 LPS 발현 수준에서 정량적 차이(데이타 미제시됨)로 설명되지 않음을 확인시켜준다.
풀링된 면역 혈청을 사용하여 추출된 LPS의 웨스턴 블롯을 수행하여 Glc-변형된 O4 바이오컨쥬게이트로의 면역화에 대한 반응으로 유발된 IgG에 의한 O4 O-항원의 인식을 평가하였다. 변형된 O4 면역화된 토끼로부터의 IgG에 의한 변형된 및 비변형된 O4 LPS 둘 모두의 결합이 관찰되었으며, 고분자량 LPS 밴드를 포함하는 광범위한 크기에 걸친 LPS 밴드의 특정 인식을 포함하였다(도 3).
하기 추가 실험에서, 'O4' 바이오컨쥬게이트 또는 생산 균주 또는 'EcoO4'가 언급될 경우, 달리 특정하게 나타내지 않는 한 Glc-분지된 O4(표 1의 글리칸 구조 (O4-Glc+)를 가짐)의 바이오컨쥬게이트 또는 생산 균주를 의미한다(따라서, 용어 'O4' 및 'O4-Glc+'은 이들 실험에서 바이오컨쥬게이트 또는 생산 균주에 대해 상호교환적으로 사용됨).
실시예 5
: 래트에서 Glc-분지된 O4 바이오컨쥬게이트의 면역원성
Sprague Dawley 래트를 3가지 상이한 용량(0.04 μg, 0.40 μg 또는 4.0 μg)의 제형 완충액 또는 (O4-Glc+)-EPA 바이오컨쥬게이트(즉, EPA 담체 단백질에 공유 결합된 글루코실화된 O4 항원 다당류의 바이오컨쥬게이트; 담체 단백질은 상기 실시예 3에 기재된 바와 같이 EPA-2임)로 근육내 3회 면역화시켰다. 면역화 후 0, 14 및 42일째에 혈청 항체 수준을 ELISA로 측정하였다.
0.04 μg, 0.40 μg 및 4.00 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트로의 면역화는 제형 완충액과 비교하여 면역화 후 42일??에 IgG 항체 수준의 현저한 증가를 유도하였다(도 4a). (O4-Glc+)-컨쥬게이트에 의해 유도된 항체는 기능적이었고, 즉 (O4-Glc+) 대장균 균주의 치사를 매개할 수 있었다(도 4b).
0.04 μg, 0.40 μg 및 4.0 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체 수준은 기준선에서 검출된 것과 비교하여 면역화 후 42일째(42일 vs 0일, 모든 용량에 있어서 P = 0.006) 및 면역화 후 14일째(42일 vs 14일, 모든 용량에 있어서 P = 0.006) 현저하게 증가되었다(도 5). 4.0 μg의 바이오컨쥬게이트가 투여된 군에서, 역가 또한 0일과 비교해 14일째에 현저하게 증가하였으며, 이는 단일 용량의 4.0 μg의 (O4-Glc+)-EPA 바이오컨쥬게이트가 IgG 역가의 현저한 증가를 유도함을 나타낸다(14일째 vs 0일, P=0.012). 시험한 모든 3개의 바이오컨쥬게이트 농도에 있어서 14일 내지 42일째에 관찰된 IgG 역가에서의 현저한 증가는 제3 용량의 (O4-Glc+)-EPA 바이오컨쥬게이트가 항체 반응을 증대시킬 수 있음을 보여주었다(도 5).
제형 완충액 또는 4.00 μg/용량의 바이오컨쥬게이트로 3회 근육내 면역화시킨 래트에서 O4-Glc+-EPA 컨쥬게이트에 의해 유도된 항체의 기능성은 O4(Glu+) 및 O4(Glu-) 대장균 균주를 사용하는 옵소닌식세포 치사 검정(OPKA)에 의해 결정하였다. (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체는 기능적이었고, 즉 (O4-Glc+) 대장균 균주의 치사를 매개할 수 있다(도 4b, 도 6). 특히, (O4-Glc+)-EPA 바이오컨쥬게이트에 의해 유도된 항체는 (O4-Glc+) 및 (O4-Glc-, 즉 표 1에서 화학식 (O4-Glc-)의 구조를 갖는 글리칸을 가짐, 즉 Glc-분지가 없는 O4 다당류) 대장균 균주 둘 모두의 치사를 매개할 수 있었다(도 6).
결론적으로, O4-Glc+-EPA 바이오컨쥬게이트에 의해 유도된 항체는 교차-반응성이며, 글루코스 분지의 존재 및 부재하의 대장균 O4 균주의 치사를 매개할 수 있다.
실시예 6:
대장균 O-항원 바이오컨쥬게이트에 대한 생성 균주 및 생성된 바이오컨쥬게이트 생성물
상기 기술된 바와 같이 제조된 (O4-Glc+)-EPA 바이오컨쥬게이트 이외에, 9개의 다른 바이오컨쥬게이트를 생성하였다. 특히, 추가로 생성된 바이오컨쥬게이트는 대장균 O1A-EPA 바이오컨쥬게이트, O2-EPA 바이오컨쥬게이트, O6A-EPA 바이오컨쥬게이트, O8-EPA 바이오컨쥬게이트, O15-EPA 바이오컨쥬게이트, O16-EPA 바이오컨쥬게이트, O18A-EPA 바이오컨쥬게이트, O25B-EPA 바이오컨쥬게이트 및 O75-EPA 바이오컨쥬게이트를 포함하였다. 이들 컨쥬게이트의 글리칸의 화학 구조는 표 1의 각 화학식에서 찾아볼 수 있다. 10개 바이오컨쥬게이트를 포함하는 조성물은 'ExPEC10V'로 본원에서 지칭된다. O1A-EPA, O2-EPA, O6A-EPA 및 O25B-EPA 바이오컨쥬게이트를 포함하는 조성물은 'ExPEC4V'로서 언급된다(예를 들어, WO 2015/124769 및 WO 2017/035181에 이전에 기술되었음).
대장균 W3110 모 균주
비병원성 대장균 K12 균주 W3110은 모든 10개 생산 균주의 작제물을 위한 모 균주로서 사용하였다. 대장균 K12 균주 W3110은 Coli Genetic Stock Center(Yale University, New Haven(CT), USA, 제품 번호 CGSC#4474)에서 입수하였다. 이의 관련 유전자형은 종래 기술되었으며(대장균 W3110, F-, 람다-, IN(rrnD-rrnE)1, rph-1), 및 이의 게놈 서열은 종래 기술되었다(Hayashi K, et al., 2006, Mol. Syst. Biol. 2006.0007 (doi:10.1038/msb4100049). 대장균 W3110 균주는 대장균 O-항원 바이오컨쥬게이트 각각의 생산을 가능하게 하도록 유전자 변형되었다(표 3).
바이오컨쥬게이트 생산 균주
"ExPEC4V" 및 "ExPEC10V" 조성물은 둘 다 동일한 생산 균주로부터의 O2-EPA 및 O25B-EPA 바이오컨쥬게이트를 포함한다. "ExPEC4V" 조성물은 stGVXN4411 또는 stLMTB10217 생산 균주로부터의 O1A-EPA 바이오컨쥬게이트를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10217 생산 균주로부터의 O1A-EPA 바이오컨쥬게이트를 포함한다. "ExPEC4V" 조성물은 stGVXN4112 생산 균주로부터의 O6A-EPA 바이오컨쥬게이트를 포함하는 반면, "ExPEC10V" 조성물은 stLMTB10923 생산 균주로부터의 O6A-EPA 바이오컨쥬게이트를 포함한다. 또한, "ExPEC10V" 조성물은 "ExPEC4V"에 사용되지 않은 생산 균주로부터의 O4-EPA (즉, (O4-Glc+)-EPA), O8-EPA, O15-EPA, O16-EPA, O18A-EPA 및 O75-EPA 바이오컨쥬게이트를 포함한다. 다양한 생산 균주는 하기 나타낸 바와 같이 EPA 담체 단백질 및/또는 올리고사카릴 트랜스퍼라제 PglB의 발현을 위한 플라스미드에서 다를 수 있다. 여러 생산 균주의 개요가 아래 표 3에 나와 있다.
표 3:
ExPEC4V 및 ExPEC10V 백신 조성물을 위한 O-항원 바이오컨쥬게이트에 대한 대장균 생산 균주의 유전자 공학 개요
O-항원 생합성(
rfb
) 유전자 클러스터
모든 대장균 O-항원 생산 균주에서, 자연 발생 대장균 W3110 게놈 O16::IS5 -항원 생합성(rfb) 유전자 클러스터는 선택된 혈청형의 대장균 균주로부터 선택된 O-항원-특이적 생합성 클러스터에 의해 대체되었으며, 이는 혈청형-특이적 O-항원 구조를 인코딩한다(이러한 O-항원 구조에 대해서는 표 1 참조). 10개의 공여체 rfb 클러스터는 대장균 혈액 분리주의 전체-게놈 분석 후 선택하고 확인하였다. O-항원 생합성에 결함이 있는 W3110 O16::IS5 rfb 유전자 클러스터의 대체는 단일 상동 재조합 사건으로 달성되었다. O16 및 O18A rfb 유전자 클러스터의 경우, 공여체 DNA는 측접하는 gnd 및 rmlCA 유전자를 통해 재조합되는 반면, 다른 균주의 rfb 유전자 클러스터는 측접하는 gnd 및 galF 유전자를 통해 재조합되었다. 생산 균주에서 rfb 클러스터의 서열은 SEQ ID NO: 9 및 11-19로 제공된다.
O-항원 리가제(
waaL
) 유전자
모든 대장균 O-항원 생산 균주는 waaL 유전자에 의해 인코딩된 대장균 W3110 게놈 O-항원 리가제의 결실을 인공적으로 도입하였다. ΔwaaL 균주에서 지질 A로의 O-항원의 전달이 중단되고, 이는 대신에 O-항원의 담체 단백질로의 직접 전달을 유도하여 생성물 수율을 증가시킨다.
O-항원 글루코실화(
gtrABS
) 유전자
대장균 O8, O15, O16, O18A, O25B 및 O75 생산 균주에서, O16 O-항원 글루코실화를 담당하는 대장균 W3110 게놈 gtrABS 유전자가 결실되었다. 상이한 혈청형의 gtrA 및 gtrB 유전자는 고도로 상동성이고 상호교환가능하지만, gtrS 유전자는 혈청형-특이적 O-항원 글리코실 트랜스퍼라제를 인코딩한다. 대장균 W3110에서 GtrS는 대장균 O16 O-항원의 α-L-Rha-(1→3)-d-GlcNAc 모티프에 있는 GlcNAc 당에 글루코스(Glc) 잔기를 전달할 수 있다. 대장균 O1A, O2 및 O6A 생산 균주에서는 gtrABS 유전자의 결실 또는 대체가 발생하지 않았다. 이러한 O-항원은 대장균 O16 gtrS의 천연 기질인 α-L-Rha-(1→3)-D-GlcNAc 모티프를 놓치게 된다. 대장균 O4 생산 균주에서, W3110 gtrS 유전자는 대장균 O4 gtrS 유전자로 대체되어 대장균 O4 O-항원의 적절한 글루코실화를 수용하였다.
올리고사카릴 트랜스퍼라제 PglB
모든 대장균 O-항원 생산 균주는 C. 제주니 글리코실 트랜스퍼라제 PglB의 변이체를 발현하였으며, 이는 N-글리코실화에 의해 담체 단백질 상의 아미노산 컨센서스 서열 상으로 O-항원을 전달할 수 있다. PglB는 광범위한 기질 인식을 가졌으나, 낮은 생성물 수율로 인해, 변형된 기질 특이성을 갖는 PglB 변이체를 발현하는 여러 생산 균주를 제조하였으며, 이는 향상된 생성물 수율을 발생시켰다(예를 들어, WO 2016/107818, WO 2016/107819 참조). pgIB 유전자는 플라스미드 상의 이소프로필 β-D-1-티오갈락토피라노시드(IPTG) 유도성 프로모터 뒤에 배치되었다. 하기 표 4는 상기 기술된 ExPEC4V 및 ExPEC10V 조성물을 위한 바이오컨쥬게이트에 대한 대장균 O-항원 생산 균주의 생산에 사용되는 플라스미드에 의해 인코딩된 PglB 변이체를 나열한다. 벡터 백본, 항생제 내성 마커 및/또는 대안적 PglB 변이체에 변이가 있는 추가 플라스미드도 또한 바이오컨쥬게이트 생산에 대해 성공적으로 테스트되었다.
표 4:
대장균 O-항원 생산 균주에 사용되는 PglB 및 EPA 플라스미드
1 SpR, 스펙티노마이신 내성; AmpR, 암피실린 내성; KanR, 카나마이신 내성
담체 단백질 (EPA)
모든 대장균 O-항원 생산 균주는 O-항원에 대한 담체 단백질로서 유전학적으로 탈독소화된 P. 애루기노사 AD-리보실트랜스퍼라제 톡소이드(EPA)를 발현하였다. EPA 톡소이드는 2개 잔기에서 야생형 EPA 독소와 상이하다: Leu552는 Val로 변경되었으며, Glu553(촉매 도메인에서)이 결실되었다. Glue553 결실은 독성을 현저하게 감소시키는 것으로 보고되었다. 탈독소화 돌연변이 외에도, 4개(EPA-4) 컨센서스 N-글리코실화 부위 모티프를 도입하였다. epa 유전자는 플라스미드 상의 L-아라비노스(Ara) 유도성 프로모터 뒤에 위치하였다(표 4). 표 4는 상기 기재된 "ExPEC4V" 및 "ExPEC10V" 조성물에 사용된 바이오컨쥬게이트에 대한 생산 균주에 사용되는 플라스미드로 제한된다. 벡터 백본, 항생제 내성 마커 및/또는 EPA 변이체에서 변이를 갖는, 예를 들어 컨센서스 N-글리코실화 부위 모티프의 수(예를 들어, 2개의 이러한 모티프, EPA-2를 가짐)가 변화하는 플라스미드도 바이오컨쥬게이트 생산에 대해 성공적으로 테스트되었다.
실시예 7
: 글루코실화된 O4(O4-Glc+) 항원과의 바이컨쥬게이트의 생성을 위한 올리고사카릴트랜스퍼라제 최적화
바이오컨쥬게이트 생산을 위한 수율 최적화는 C. 제주니 올리고사카릴 트랜스퍼라제 PglB의 변형에 의해 달성될 수 있으며, 이는 EPA 담체 단백질에 대한 관심 O-항원의 더욱 효율적인 또는 더 높은 등급의 N-글리코실화로 이어질 수 있다. 글루코실화된 O4 (O4-Glc+) O-항원 다당류를 갖는 바이오컨쥬게이트의 생산을 위한 대장균 균주에서, 이러한 최적화 전략을 적용하였으며, 바이오컨쥬게이트 생성물 수율을 향상시키는 (O4-Glc+)-특이적 최적화된 PglB 변이체를 발생시켰다.
이러한 접근법에서, EPA-발현 플라스미드를 함유하는 O4-Glc+ O-항원 다당류 생산 균주는 다양한 상이한 PglB 발현 플라스미드로 형질전환되었으며, 이들 각각은 PglB 단백질에 상이한 아미노산 치환을 함유하여 기질 특이성을 변경시켰다. 각 균주의 바이오컨쥬게이트 생산 수준 및 프로파일은 삼투압 충격 실험에서 쉐이크-플라스크 수준으로 평가하였으며, 판독은 O4-Glc+ -특이적 모노클로날 항체를 사용하여 주변 세포질 추출물에 대한 모세관 전기영동 면역검정에 의해 수행하였다.
N311V 아미노산 치환을 함유하는 테스트한 PglB 변이체 중 하나는 글루코실화된 O4 바이오컨쥬게이트의 생성물 수율을 현저하게 향상시키는 것으로 밝혀졌다(도 7a).
N311V PglB-변이체가 추가로 변형된 추가 개선에서, Y77H 아미노산 치환은 N311V PglB-변이체와 비교하여 O4-Glc+-특이적 생성물 수율을 추가로 향상시켰으며, 증가된 정도의 디- 및 트리-글리코실화 생성물을 나타내었으며, 여기에서 다른 변형은 중립적이거나 생성물 수율에 부정적인 영향을 미치는 것으로 밝혀졌다(도 7b). 플라스미드 pLMTB4008(SpR)은 돌연변이 Y77H 및 N311V가 있는, 대장균 코돈 사용 최적화되고 (O4-Glc+)-기질 최적화된 PglB 변이체를 인코딩한다.
야생형 (wt) C. 제주니 글리코실 트랜스퍼라제 PglB와 비교해 N311V 및 Y77H 아미노산 치환을 함유하는 O4-Glc+ O-항원 다당류에 대한 최적화된 기질 특이성을 갖는 PglB 변이체는 1차 라운드 최적화된 PglB-N311V 변이체와 비교하여 바이오컨쥬게이트 수율이 두배인 것으로 밝혀졌다.
유사하게 스트린을 사용하여, ExPEC10V 조성물 중 다른 9개 혈청형의 대장균 O-항원 바이오컨쥬게이트 생성에 대해 가장 최적 수율을 갖는 PglB 변이체를 또한 결정하였다.
O1A, O6A 또는 O15 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 N311V, K482R, D483H 및 A669V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O2, O8, O18A 또는 O25B 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 야생형 PglB(즉, 위치 77, 80, 287, 289, 311, 482, 483 및 669에서 아미노산 돌연변이가 없음)가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O16 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 Y77H, S80R, Q287P, K289R 및 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
O75 항원 다당류를 갖는 바이오컨쥬게이트에 있어서, 아미노산 돌연변이 N311V를 갖는 PglB가 가장 높은 수율을 제공하는 것으로 밝혀졌다.
이들 결과로부터 최적의 PglB 변이체가 다양한 O-항원에 있어서 상이하고, 주어진 O-항원 다당류를 갖는 바이오컨쥬게이트를 생성하기 위한 최적의 PglB 변이체는 예측할 수 없음을 알 수 있다.
실시예 8: 10개 대장균 혈청형으로부터의 O-항원의 바이오컨쥬게이트 및 이들의 품질 속성
표적 O-항원의 O-글리칸 잔기는 구조적으로 다양하고, 가변적인 반복 단위를 갖는다. 글리코실 트랜스퍼라제 PglB의 특이성 및 친화성은 글리칸 구조와 연결되어 있다. 따라서, 요망되는 품질 속성, 예를 들어 순도, 글리칸/단백질 비율 등을 갖는 바이오컨쥬게이트를 만드는 것은 어렵고 간단하지 않은 작업이다. PglB와 EPA 담체 단백질의 올바른 조합은 수율을 결정하고, 글리코실화 효율에 영향을 미칠 수 있다. PglB 및 담체 단백질을 최적화시킴으로써, 요망되는 품질 속성을 갖는 바이오컨쥬게이트를 생성하였다. 매우 많은 양의 담체 단백질은 면역학적 간섭으로 이어질 수 있기 때문에, 특히 하나 이상의 O-항원 바이오컨쥬게이트가 함께 조합되어 단일 조성물 또는 백신으로 투여되는 경우, 총 담체 단백질의 더 낮은 역치 값을 유지하는 것이 또한 중요할 수 있다. 이러한 현상을 피하기 위해서 더 높은 글리칸/단백질 비율을 갖는 컨쥬게이트가 바람직하다. 따라서, ExPEC10V 백신에 있어서, (임상 시험으로 처리된 이전에 기술된 ExPEC4V 백신과) 적어도 유사한 글리코실화 비율을 갖는 바이오컨쥬게이트를 개발하였다.
바이오컨쥬게이트는 종래 기술된 방법에 따라 생물반응기(10 L 및/또는 200 L 부피)에서 각 숙주 세포(실시예 6, 표 3)를 배양하고 바이오컨쥬게이트의 발현에 의해 생성하였다. 각 약물 물질은 박테리아 유가식 발효에 의해 배치식으로 제조하여 상응하는 다당류 혈청형의 발현된 바이오컨쥬게이트를 함유하는 바이오매스를 생성하였다. 세포를 배양하고, IPTG 및 아라비노스로 유도하였다. 바이오컨쥬게이트는 삼투압 충격에 이어서 크로마토그래피 정제에 의해 생물반응기 배양물에서 세포의 주변세포질로부터 분리하였다. 이러한 공정은 10개 바이오컨쥬게이트 각각에 대해 수행하였다.
ExPEC10V 및 ExPEC4V에 대한 약물 물질(DS)인 이렇게 제조된 대장균 O-항원 바이오컨쥬게이트는 유사한 중요한 품질 속성을 나타내었다: (1) 공정-관련 순도(RH-HPLC에 의해 측정)는 95% 보다 높았음, (2) 약 0.1-0.5, 대부분 0.15 내지 0.45 범위의 다당류/단백질 비율, (3) 박테리아 내독소(Ph. Eur. 2.2.3)는 0.5 EU/μg 다당류 미만이었다. 개별 다당류 사슬의 평균 길이는 전형적으로 약 10-20 반복 단위였다(고해상도 SDS-PAGE를 사용하여 측정됨).
다당류 반복 단위의 구조는 상기 기술된 ExPEC10V 조성물에 있어서 DS인 모든 10개 바이오컨쥬게이트의 경우, 표 1에서 상응하는 혈청형에 대해 화학식으로 제시된 것으로 (온전한 또는 트립신-분해된 컨쥬게이트의 NMR 및 MS/MS에 의해) 확인되었다.
O18 혈청형은 ExPEC10V 조성물을 위해 만들어진 바이오컨쥬게이트의 10개 혈청형 중에서 바이오컨쥬게이트 생산 수율이 가장 낮았다.
ExPEC10V 의약품(DP)은 상기 기술된 10개 1가 DS의 혼합물을 포함한다.
실시예 9
: ExPEC10V 백신의 독성학
ExPEC10V를 사용한 단일-용량 파일럿 독성 및 국소 내성 연구(비-GLP)를 암컷 NZQ 토끼에서 수행하였다. 일 군(n=2)은 대조군(식염수)의 근육내(IM) 주사(0일째)로 처리되었으며, 두 번째 군(n=4)은 0.6 mL의 투여량(176 μg PS/mL)을 사용하여 105.6 μg 총 다당류 (PS)/용량 (각각 O-혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 있어서 용량 당 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 9.6: 19.2: 9.6 μg PS)으로 ExPEC10V의 IM 주입으로 처리하였다. 부검은 2일째에 수행하였다.
사망 사례는 관찰되지 않았다. 또한, 임상 관찰(Draize 스코어링을 사용한 주사 부위 효과 포함), 체중, 음식 섭취 및 체온에 대해 언급된 백신 관련 효과는 없었다. 조직병리학적으로 투여 부위 또는 배액(장골) 림프절에서 백신과 관련된 변화는 관찰되지 않았다. 비장의 배 중심 형성의 최소 증가가 처리된 동물 4마리 중 한 마리에서 관찰되었으며(2일째), 주사된 백신에 대한 정상적인 면역학적 반응으로 간주되었다. 전반적으로, 암컷 토끼에 대한 ExPEC10V의 단일 IM 용량의 투여는 내약성이 우수하였다.
실시예 10
: 토끼에서 ExPEC10V 블렌딩된 제형의 면역원성
ExPEC4V 백신(대장균 O1A, O2, O6A 및 O25B 혈청형의 바이오컨쥬게이트 포함)은 이전에 래트, 토끼 및 인간에서 이들 4가지 혈청형에 대해 면역원성인 것으로 나타났다(예를 들어, WO 2015/124769; WO 2017/035181; [Huttner et al, 2017, Lancet Infect Dis, https://dx.doi.org/10.1016/S1473-3099(17)30108-1, RW Frenck Jr, et al, 초록 5587, ASM Microbe 2018] 참조). 대장균 글루코실화된 O4 혈청형을 갖는 본 발명의 신규한 바이오컨쥬게이트는 상기 실시예 4 및 5에서 면역원성인 것으로 나타났다. 래트에 개별적으로 투여될 경우(일가) 대장균 혈청형 O8, O15, O16, O18A 및 O75의 바이오컨쥬게이트(이 실험에서 모두 담체 단백질로서 EPA-2를 가짐)의 면역원성은, 이들 바이오컨쥬게이트 각각이 또한 면역원성이라는 것을 확인시켜주었는데, 이는 ELISA 데이터가 이들 바이오컨쥬게이트 각각이 높은 수준의 대장균 O-항원 특이적 항체를 유발시킬 수 있음(미제시됨)을 나타내었기 때문이다.
상기 기술된 바와 같은 10개 바이오컨쥬게이트의 혼합물을 함유하는 10가 백신의 면역원성을 또한 테스트하였다. 뉴질랜드 화이트(NZW) 토끼(암컷, 12-16주령)는 2주 간격으로 투여된 ExPEC10V 또는 식염수로 3회의 근육내 면역화로 처리하였다(표 5; 0, 14 및 27일째에 투여). 이들 실험에 사용된 ExPEC10V의 일부인 10개의 다당류를 4개의 글리코실화 부위를 함유하는 EPA(EPA-4) 담체 단백질에 컨쥬게이션시켰다. 백신은 3개의 상이한 용량으로 제형화시켰다: 군 1 ('고용량'): 8 ug/용량의 O1A, O2, O6A, O4, O8, O15, O16, O18 및 O75 및 16 ug/투여량의 O25B; 군 2 ('중간 용량'): 4 ug/용량의 O2, O4, O8, O15, O16, O18 및 O75, 8 ug/용량의 O1A 및 O6A 및 16 ug/용량의 O25B; 군 3 ('저용량'): 0.4 ug/용량의 O2, O4, O8, O15, O16, O18 및 O75, 0.8 ug/용량의 O1A 및 O6A 및 1.6 ug/용량의 O25B. 대조군(군 4)의 동물에게는 식염수(0.9% (w/v) 염화나트륨 용액)만 제공하였다(표 5).
항체 반응은 0일째(면역화전) 및 면역화 후 14, 27 및 42일째에 평가하였다. 백신 및 담체 단백질 EPA에 포함된 각각의 바이오컨쥬게이트에 의해 유도된 혈청 항체 수준은 코팅 물질로서 유형 특이적 LPS를 사용하여 ELISA(총 IgG)에 의해 측정하였다. 항체 역가는 4-파라미터 로지스틱 비선형 회귀 모델에 플롯팅된 12-단계 적정 곡선의 중복을 기반으로 하는 최대 유효 농도 절단에 해당하는 EC50 값으로서 보고하였다. 기능적 활성은 OPK에 의해 결정되었다.
표 5. 실험군의 설명
결과는 도 8에 도시하고, 표 6에 요약하였다.
표 6. NZW 토끼에서 ExPEC10V에 의해 유도된 대장균 O-항원 특이적 항체 반응의 요약.
암회색 사각형은 p 값이 통계적으로 유의한 혈청형-특이적 항체 반응을 보여준다. 연회색 사각형은 p 값이 통계적으로 유의하지 않은(ns) 혈청형-특이적 항체 반응을 보여준다. 다중 비교를 위한 Bonferroni 보정과 Wilcoxon 순위 합계 테스트. ExPEC10V 백신화된 동물(군 1, 2 및 3) 대 식염수 대조군(군 4)을 비교. *p≤0.05, **p≤0.01. # P 값은 대조군에서 이상치 동물을 제외한 후 통계적으로 유의하였다(민감도 분석).
고용량의 ExPEC10V(군 1)은 O1A, O2, O4, O6A, O16, O18A 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일째)에서 현저하게 더 높은 IgG 항체 수준을 유도하였다(도 8, 표 6). 식염수 대조군과 비교할 경우 O8 및 O75 컨쥬게이트에 의해 유도된 현저하게 더 높은 항체 역가가 면역화 후 27일 및 42일째에 관찰되었다(도 8, 표 6).
중간 용량의 ExPEC10V(군 2) 및 저용량(군 3)은 O1A, O2, O4, O6A, O16 및 O25B에 대한 식염수 대조군과 비교할 경우 조사된 모든 시점(면역화 후 14, 27 및 42일째)에서 현저하게 더 높은 항체 수준을 유도하였다(도 8, 표 6). 식염수 대조군과 비교할 경우 O8, O18A 및 O75 컨쥬게이트에 의해 유도된 현저하게 더 높은 항체 역가가 면역화 후 27일 및 42일째에 관찰되었으며, 이는 토끼에서의 부스트 용량이 이들 O-혈청형에 대한 반응을 증가시킴을 시사한다(도 8, 표 6).
O15 컨쥬게이트에 있어서, 대조군에서 이상치 동물은 생략한 민감도 분석은 ExPEC10V 백신의 3개 용량 모두가 면역화 후 14, 27 및 42일째에 식염수 대조군과 비교하여 항체 반응의 현저한 증가를 유도함을 보여주었다(도 8, 표 6).
담체 단백질 EPA에 의해 유도된 항체는 조사된 모든 시점(14일, 27일 및 42일째)에서 테스트된 3가지 용량의 ExPEC10V(고, 중 및 저)에 대해 식염수-처리군(대조군)에서 EPA 항체 역가보다 현저하게 더 높았다(도 8).
용량간 비교(미제시됨)는 백신화 후 14일째에 고용량의 ExPEC10V가 테스트된 대부분의 컨쥬게이트(O1A, O2, O4, O6A, O15, O16, O18A 및 O25B) 저용량과 비교할 때 현저하게 더 높은 항체 반응을 유도하였음을 보여주었다. 중간 용량의 ExPEC10V는 또한 O1A, O2, O4, O18A, O25B 및 O75에 대한 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다. O8 컨쥬게이트에 있어서, ExPEC10V의 세 가지 제형 모두는 백신 접종 후 14일째에 유사한 수준의 항체를 유도하였다.
저용량의 ExPEC10V는 O1A, O2, O4, O16, O25B 및 O75 컨쥬게이트에 대한 고용량 및 중간 용량의 ExPEC10V과 비교하여 백신화 후 (프라임 및 2회 부스트 용량 후) 42일째에 항체 반응의 현저한 증가를 유도하였다. 이러한 발견은 예를 들어, 폐렴구균 컨쥬게이트 백신으로 백신화된 유아에서 용량과 일차 백신화에 대한 항체 반응의 크기 사이의 명확한 관계가 관찰되지 않았다는 컨쥬게이트 백신으로의 다른 경험과 일치한다(Poolman JT, et al. Expert Rev Vaccines. 2013, 12(12):1379-94).
O6A, O8 및 O15 컨쥬게이트에 대해 백신화 후 42일째에 테스트한 3가지 용량의 ExPEC10V 간에는 유의한 차이가 없었다. O18A 컨쥬게이트의 경우, 백신화 후 42일째에 중간 용량과 비교하여 고용량의 ExPEC10V가 현저하게 더 높은 항체 반응을 유도하였다.
담체 단백질(EPA)에 있어서, 고용량 및 중간 용량의 ExPEC10V는 백신화후 14일째에 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다. 고용량의 백신은 또한 백신화후 42일째에 저용량과 비교하여 현저하게 더 높은 항체 반응을 유도하였다.
결론적으로, 0, 14, 27일째에 근육내 주입을 통해 투여된 3가지 제형의 ExPEC10V(고, 중 및 저)는 토끼에서 면역원성이다.
지금까지, 토끼에서 이 백신에 의해 유도된 대장균 균주를 치사시킬 수 있는 기능적 항체는 혈청형 O1A, O2, O4, O6A, O15, O16 및 O25B에 대해 나타났다.
추가 실험에서, ExPEC10V 백신의 GMP 배치(생산에 대해서는 상기 실시예 8 참조)를 제조하고, 독성 연구의 일부로서 NZW 토끼에 주사하였다(표 7). 이 연구에서 NZW 토끼(수컷 및 암컷)는 ExPEC10V 백신(1일, 15일 및 29일)을 근육내 주사(0.6 mL)로 3회 처리하고, 대조군은 0.9%(w/v) 염화나트륨 용액(식염수)으로 처리하였다. 각 용량의 백신은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A 및 O75에 대한 9.6 μg 다당류(PS) 및 혈청형 O25B에 대한 19.2 μg PS를 함유하였으며, 이는 105.6 μg의 총 PS (176 μg 총 PS/mL) 및 382.8 μg의 총 EPA (638 μg EPA/mL)에 상응한다. O-항원 및 담체 단백질(EPA)에 대한 IgG 역가는 전처리 기간(1일) 및 면역화 후 31일 및 50일 동안 수집된 샘플로부터 결정되었다.
모든 O-항원 및 담체 단백질 EPA에 대한 항체 반응에서 현저한 증가는 단지 식염수로만 처리된 대조군과 비교할 경우 ExPEC10V로 처리한 군에서 백신화 후 31일째 및 50일째에 관찰되었다(도 9, 표 8). O1A 혈청형의 경우, 백신화된 동물을 대조군과 비교할 때 현저하게 더 높은 항체 반응이 또한 1일(기준선)째에 관찰되었다. 이들 결과는 일부 동물이 대장균에 사전 노출되었거나, O1A-LPS와의 교차 반응하는 항체를 가지고 있음을 시사한다.
표 7. NZW 토끼에 사용된 실험군 및 ExPEC10V 용량.
* 각 용량(0.6mL 부피 용량)은 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B, O75 각각에 대해 9.6:9.6:9.6:9.6:9.6:9.6:9.6:9.6:19.2:9.6 μg 다당류(PS)를 함유한다(176 μg 총 PS/mL). 각 용량은 382.8 μg EPA 단백질을 함유한다(638 μg EPA/mL).
표 8. 독성 연구의 일환으로 NZW 토끼에서 ExPEC10V의 면역원성.
ExPEC10V에 의해 유도된 항체 반응. 연회색 사각형은 대조군과 비교하여 백신군에서 항체 반응의 유의한 증가가 관찰된 혈청형을 나타낸다. 우도비로의 토빗 모델. ****P ≤0.0001.
실시예 11
: 인간에서 ExPEC10V 백신을 사용한 단계 1/2a 시험
현재 IED를 예방하기 위해 이용가능한 백신은 없다. ExPEC10V 백신을 포함하는 혈청형(O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75)은 ST131을 포함한 항균제 내성 IED를 유발하는 대부분의 ExPEC 분리주를 또한 대표하는 임상적으로 관련된 대다수의 ExPEC 균주로 인한 침습성 질환을 해결하기 위해 선택되었다. 선택된 혈청형은 노년층에서 혈류 감염을 일으키는 10가지 널리 퍼진 ExPEC O-혈청형을 대표하며, ExPEC로 인한 혈류 감염의 약 70%를 차지한다.
침습성 질환 예방에 있어서 컨쥬게이트 백신의 작용 기전은 항생제 내성기전의 영향을 받지 않을 것으로 예상되기 때문에, ExPEC10V 백신은 약물-내성 및 약물-감수성 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75 혈청형에 의해 유발된 IED에 대한 보호를 제공하는 것으로 여겨진다.
ExPEC10V에서도 발견되는 4가지 대장균 O-항원 컨쥬게이트(O1A, O2, O6A 및 O25B)의 서브세트를 포함하는 초기 백신 후보인 ExPEC4V에 대한 선행 임상 경험이 있다. 4건의 임상 연구(2건의 완료된 1상 연구, 1건의 완료된 2상 연구 및 진행 중인 2상 연구)의 결과에 기초하여, ExPEC4V는 연구 참가자들에 있어서 내약성이 우수하였으며, 혈청형(O1A, O2, O6A 및 O25B) 당 최대 16 μg 다당류(PS) 용량에서 백신 관련 안전성 신호가 관찰되지 않았다. 대부분의 유해 사례(AE)는 1등급 및 2등급이었고, 3등급 AE는 거의 보고되지 않았다. 후기 발병 예측 국소 AE(백신화 후 5일 이후에 시작되는 AE)는 주로 더 높은 용량의 ExPEC4V로 관찰되었다. 각 연구에서 ExPEC4V 백신은 면역원성인 것으로 나타났으며, 효소 결합 면역흡착 검정(ELISA)에 의해 측정된 바와 같이 용량 의존적 백신 면역 반응과 O-항원 특이적 면역글로불린 G(IgG) 역가 증가를 입증한다. 항체의 기능적 활성은 ExPEC4V-최적화된 옵소닌식세포 치사 검정(OPKA)으로 입증되었다. ELISA 및 OPKA 테스트 결과의 공동-분석은 검정 반응 사이의 상관관계를 보여주었으며(2상 임상 시험[연구 4V-BAC2001]에서 각각 30일 및 360일에 대한 피어슨 상관 계수 ≥0.61 및 ≥0.48), 이는 ELISA를 ExPEC4V 항체 역가의 일차 척도로 사용하고, 기능적 항체 활성을 예측하는데 사용함을 입증한다. 면역원성 데이터 분석은 ExPEC4V로의 백신화 후 3년에 걸쳐 면역 반응의 지속성을 입증하였다. 이제 ExPEC4V로 백신화되고, 혈청형-특이적 옵소닌식세포 항체의 역가가 높은 인간의 혈청은 이후에 O25B 또는 O2 혈청형으로 복강내 자극된 마우스에 수동적으로 전달될 경우 생체내 보호를 매개할 수 있었음이 또한 관찰되었다(미제시). 따라서, ExPEC4V-특이적 옵소닌식세포 인간 항체는 생체 내에서 박테리아 치사를 매개하며, 이는 제안된 보호 메커니즘이 박테리아 치사를 매개하는 옵소닌식세포 항체의 유도에 의한 것인 다른 컨쥬게이트 백신과 일치한다.
ExPEC10V는 총 10개의 혈청형을 포함하며, 60세 이상 성인에서 ExPEC로 인한 혈류 감염의 약 50%(ExPEC4V) 내지 약 70%로 적용 범위를 늘린다. ExPEC4V에 대한 임상 경험과 상기 실시예에서 논의된 ExPEC10V에 대한 전임상 데이터를 기반으로 하여, ExPEC10V의 투여가 또한 인간에서 대장균 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75에 대한 면역 반응을 유도할 것으로 예상된다.
ExPEC10V 백신의 3가지 다른 용량의 안전성, 반응원성 및 면역원성을 평가하기 위한 무작위, 관찰자 맹검, 인간 최초의 1/2a 상 연구를 안정적인 건강 상태의 60세 내지 85세 인간에서 수행하였다(연구 10V- BAC1001). 연구 설계는 2개의 코호트를 포함한다: 코호트 1에서 안정한 건강 상태의 60세 이상 내지 85세 이하의 404명의 참가자(참가자 100명/ExPEC10V 용량) 및 코호트 2에서 지난 5년 내에 UTI 병력이 있는 안정한 건강 상태의 60세 이상의 추가 600명 참가자로 총 1004명의 참가자가 연구에 등록되었다.
ExPEC10V는 60세 이상 성인의 침습성 장외 병원성 대장균(ExPEC) 질병(IED) 예방을 위해 개발 중인 10가 백신 후보이다. ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성되며, 이의 생성은 상기 기술되었다. O4 PS는 글루코실화된 형태이며, 표 1의 화학식 (O4-Glc+)의 구조를 갖는다.
목적 및 끝점
코호트 1 - 1/2a 상 관찰자-맹검 기간과 라벨 개방된 장기 추적 기간(N=404):
코호트 2 - 이중 맹검 기간과 이중 맹검 장기 추적 기간(N = 600):
전반적인 설계
이는 2개의 코호트를 포함하는 무작위의 다기관 중재 연구이다.
코호트 1의 경우, 이 연구는 관찰자-맹검 활성 대조된 설계를 가지고 있으며, UTI 병력이 있거나 없는 안정적인 건강 상태의 60세 이상 내지 85세 이하의 총 404명의 성인 참가자가 포함된다. 코호트 1에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일째 백신화를 통한 관찰자-맹검 181-일 추적 기간, 및 백신화 후 182일부터 3년까지(1096일) 지속되는 라벨 개방된 LTFU 기간(도 10a). 단지 ExPEC10V 선택된 용량 군으로부터의 참가자(약 100명 참가자) 및 Prevnar 13 군의 참가자만이 LTFU 기간으로 진행된다. 코호트 1의 끝은 마지막 참가자의 3년차 방문(1096일)이다.
코호트 2에 있어서, 연구는 이중 맹검 플라세보 제어된 설계를 가지며, 지난 5년 동안 UTI 병력을 갖는 안정한 건강 상태의 60세 이상의 총 600명의 성인 참가자가 포함된다. 등록은 코호트 1로부터 1/2a 상 일차 분석 및 ExPEC10V 용량 선택 완료 후 시작된다. 코호트 2에 대한 연구 설계는 3개의 기간을 포함한다: 최대 28일의 스크리닝 기간, 1일째 백신화를 통한 이중 맹검 181-일 추적 기간, 및 백신화 후 182일부터 3년까지(1096일) 지속되는 이중 맹검 LTFU 기간(도 10b). 코호트 2에서 모든 참가자는 LTFU 기간으로 진행된다. 연구 끝은 코호트 2에서 마지막 참가자의 3년차 방문(1096일)이다.
코호트 1: 1상
코호트 1의 1상에서, 총 84명의 참가자는 한 단계에서 다음 단계로 진행하기 전에 정위에서의 안전성 평가가 있는 단계적 용량-증량 절차에 따라 시차 접근 방식으로 등록된다. 내부 데이터 검토 위원회(DRC)는 이들 84명의 1상 참가자의 신체 검사 데이터(기준선 및 표적화됨), 기준선 인구 통계 데이터 및 백신화 후 14일째 안전성 데이터(예측 국소 및 전신 AE, 예측되지 않은 AE, SAE, 임상 실험실 데이터 및 활력 징후 포함)를 검토하기 위해 이 연구를 위해 위임되었다. 이러한 상의 연구에서, 참가자가 등록되고 6 단계로 무작위 배정하였다:
단계 1: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 저용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
단계 2: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 저용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
단계 3: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 중간 용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
단계 4: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 중간 용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
단계 5: 4명의 센티널 참가자가 등록되고 무작위 배정하였다; 2명의 참가자는 ExPEC10V 고용량 군(표 11)이며, 참가자 1명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
단계 6: 24명의 참가자가 등록되고 무작위 배정하였다; 18명의 참가자는 ExPEC10V 고용량 군(표 11)이며, 참가자 3명씩은 각각 ExPEC4V 및 Prevnar 13 군이었다.
모든 참가자는 배정된 연구 백신화 군에 따라 1일째에 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 단일 근육내(IM) 주사로 투여받았다. 단계 1, 3 및 5 각각에서 4명의 센티널 참가자는 백신화 후 24시간째에 전화로 연락하여 안전 정보를 수집하였다. 4명의 센티널 참가자의 각 군에서 백신화 후 24시간째에 맹검 안전성 데이터는 수석 연구원(PI), 연구 담당 의사(SRP) 및 후원 의료 책임자(SML)에 의해 검토되었다. 다음 단계를 위한 추가 참가자의 무작위 배정은 이러한 2일차 센티널 안전성 평가가 완료될 때까지 중단되었다.
임의의 임상적으로 유의한 결과가 없는 경우, 추가로 24명의 참가자(단계 2, 4 및 6)를 등록시키고, 3개 연구 백신화 군(표 11) 중 하나로 무작위 배정하여 ExPEC10V(3개 용량 중 1), ExPEC4V 또는 Prevnar 13을 1일째에 단일 IM 주사로 투여하였다.
각 용량 수준(2 단계 저용량, 4 단계 중간 용량 및 6 단계 고용량)에서 추가 24명 참가자의 백신화 후, 각 용량 수준에서 모두 28명(4+24) 참가자의 백신화 후 14일째 안전성 데이터를 다음 용량 수준 또는 2a 상으로 진행하기 전에 DCR에 의해 검토하였다.
코호트 1: 2a 상
초기 84명의 참가자에 대한 백신화 후 14일째 안전성 데이터 검토 후 DRC에 의해 결정된 바와 같은 허용가능한 안전성 및 반응성(임의의 안전성 문제 또는 특정 연구 일시 중지 룰을 충족하는 임의의 이벤트가 없는 경우)을 기반으로 하여, 코호트 1로부터의 나머지 320명 참가자를 무작위 배정시키고 2a 상 연구에서 투여하였다. 이들 추가의 320명 참가자를 등록시키고 5개의 백신화 연구 군 중 하나로 2:2:2:1:1의 비율로 병렬로 무작위 배정하여 1일째에 ExPEC10V (3개 용량 중 1), ExPEC4V 또는 Prevnar 13의 단일 IM 주사로 투여하였다(표 11).
초기 84명 참가자에 대한 14일째 안전성 검토를 수행하는 것 외에, DRC는 또한 연구 과정 동안 코호트 1의 안전성 데이터를 평가하며, 특정 백신화 연구 일시 중지 룰을 충족하는 임의의 이벤트 또는 발생할 수 있는 기타 안전 문제를 검토한다.
코호트 1에 있어서, 모든 참가자가 30일째 방문(4차 방문)을 완료하였거나 더 일찍 중단한 경우 일차 분석이 발생한다. 모든 참가자가 181일째 방문을 완료하였거나 더 일찍 중단되었을 때 최종 분석이 발생한다. 라벨 공개된 장기 추적(LTFU) 기간으로 진행되는 참가자에 있어서(ExPEC10V 선택된 용량 군 및 Prevnar 13군), 연간 추적 분석은 백신화 후 1년(366일), 2년(731일) 및 3년(1096일)차의 방문 시점에서 수집된 안전성 및 면역원성 데이터(다중 ECL-기반 면역검정 및 MOPA)를 포함한다.
코호트 2
코호트 2에서는 지난 5년 동안 UTI 병력이 있는 안정적 건강 상태의 60세 이상의 참자가를 대상으로 (코호트 1의 일차 분석 결과를 기반으로 하여) ExPEC10V의 선택적 용량의 안전성, 반응성 및 면역원성을 평가하였다. 코호트 2에 있어서, 이 연구는 이중-맹검 플라세보 대조 설계를 가지며, 총 600명의 참가자가 등록되고, 2:1 비율(ExPEC10V 군 400명 참가자 및 200명 플라세보군)로 병렬로 무작위 배정하였다.
모든 참가자는 배정된 연구 백신화 군에 따라 1일째에 선택된 용량의 ExPEC10V 또는 플라세보의 단일 IM 주사로 투여받았다(표 12).
코호트 2에 있어서, 일차 분석은 안전성 및 면역원성 데이터를 포함하며, 모든 참가자가 30일째 방문(4차 방문)을 완료했거나 일찍 중단하였을 경우 발생한다. 모든 참가자가 181일째 방문을 완료하였거나 더 일찍 중단되었을 때 최종 분석이 발생한다. 모든 참가자에 있어서, 연간 추적 분석은 백신화 후 1년차(366일), 2년차(731일) 및 3년차(1096일) 방문 시점까지 수집된 안전성 및 면역원성 데이터(다중 ECL 기반 면역검정 및 MOPA)를 포함한다.
대변 샘플 분석은 메타게노믹스를 이용하여 장내 세균총에서 병원체(예를 들어, 클로스트리듐 디피실레)의 유병률 및 ExPec10v 혈청형에 대한 ExPEC10V의 효과를 평가하기 위해 선택된 서브세트의 참가자에서 수행된다.
참가자 수
총 1004명의 참가자기 연구에 등록된다; 코호트 1의 참가자 404명 및 코호트 2의 참가자 600명.
중재 군
개입 설명
ExPEC10V: EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O 항원 PS를 함유하는 인산염 완충 용액 중 대장균 바이오컨쥬게이트 백신. 1일째에 ExPEC10V의 3가지 용량 중 하나의 단일 0.5mL IM(삼각근) 주사.
ExPEC4V: EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A, O25B(4:4:4:8 μg PS/ExPEC 혈청형)의 O-항원 PS를 함유하는 식염수 완충액 중 대장균 바이오컨쥬게이트 백신. 1일째에 ExPEC4V의 단일 0.5 mL IM(삼각근) 주사.
Prevnar 13: 비독소 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액. 1일째 단일 0.5 mL(삼각근) 주사, 단일 용량으로 미리 충전된 주사기로 제공됨.
플라세보: 생리식염수. 1일째에서 플라세보의 단일 0.5 mL IM(삼각근) 주사.
ExPEC 연구 중재 자료는 표 9에 설명되어 있다.
표 9. BAC1001MV ExPEC 연구 백신.
EPA = 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A; PS=다당류
ExPEC4V는 EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O-항원 다당류(PS)로 구성된다.
ExPEC10V는 EPA 담체 단백질에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.
용량은 PS만을 기준으로 한다. EPA(μg)는 측정값이다.
ExPEC10V는 10개의 1가 약물 물질(DS)로 구성된다. 이 임상 연구를 위해 2개의 상이한 농도(중간 및 고)의 의약품(DP)을 생성시킨다(표 10). 세 번째(저) 농도는 제형 완충액과 동일한 희석 완충액으로 고농도를 1:1로 희석하여 클리닉에서 얻는다. 각 DP는 pH 7.0(0.02% [w/w] 폴리소르베이트 80, 5% [w/w] 소르비톨, 10 mM 메티오닌)의 인산나트륨/인산칼륨 완충액에서 제형화된다.
표 10: 1/2a 상 임상 연구를 위한 ExPEC10V 백신의 조성
EPA = 담체 단백질로 사용되는 유전적으로 탈독소화된 P. 애루기노사 외독소 A
A 활성 성분은 PS 항원과 담체 단백질(EPA)로 구성된 생물학적으로 합성된 컨쥬게이트이다; 용량은 PS 모이어티에서만 계산된다.
b "저농도"는 "고농도"를 희석 완충액으로 1:1로 희석하여 클리닉에서 얻는다.
안전성 평가
주요 안전성 평가에는 예측된 국소 및 전신 AE, 예측되지 않은 AE, SAE, 신체 검사, 바이탈 사인 측정 및 임상 실험실 테스트가 포함된다.
면역원성 평가
수집된 혈청의 주요 면역원성 평가는, 다중 ECL-기반 면역검정에 의해 측정되는 백신에 의해 유발된 ExPEC10V 및 ExPEC4V 혈청형-특이적 총 IgG 항체 수준, 및 다중 포맷(MOPA)의 옵소닌식세포 치사 검정(OPKA)에 의해 측정되는 바와 같은 ExPEC10V 및 ExPEC4V 혈청형-특이적 기능성 항체의 평가를 포함한다. Prevnar 13에 의해 유발된 뉴모코컬 항체 역가의 면역원성 평가는 수행되지 않는다.
ExPEC10V에 의해 유도된 혈청 항체 수준은 다중 전기화학발광(ECL)-기반 면역검정에 의해 평가된다. 이 검정은 상이한 대장균 O-LPS 항원 또는 담체 단백질 EPA로 코팅된 다중-스팟 96웰 포맷 마이크로플레이트에서 고결합 탄소 전극을 조합한다. 혈청 샘플에 존재하는 항원 특이적 항체의 수준은 SULFO-TAG로 표지된 이차 항체(항-인간 IgG)를 사용하여 검출된다. SULFO-TAG는 결합된 IgG 항체의 양에 비례하여 증가하는 강도로 전기 자극이 있을 때 발광한다. 이 검정은 ICH(International Conference on Harmonization) 권장 사항에 따라 검증되었다.
ExPEC10V에 의해 유도된 기능적 항체의 수준은 다중 옵소닌식세포 검정(MOPA)으로 측정된다. 간단히 말해서, 열-불활성화된 혈청 샘플은 연속적으로 희석되고, 다양한 유형의 항생제에 특이적으로 내성이 있는 다른 대장균 균주와 함께 배양된다. 그 후, 인간 보체 및 식세포(HL60)를 반응에 첨가하고, 두 번째 배양 기간 후, 반응 혼합물의 분취량을 선택적으로 특정 항생제에 내성인 균주의 성장을 허용하는 특정 항생제가 보충된 배지를 함유하는 다양한 PVDF 친수성 막 필터 플레이트에 옮긴다. 밤새 성장시킨 후, 생존 박테리아의 수를 결정하기 위해 집락 형성 단위(CFU)를 계산한다. 이 검정은 ICH 권장 사항에 따라 검증되었다.
다중 ECL-기반 면역검정 및 MOPA에 의해 측정된 바와 같은 ExPEC10V 혈청형 항체 및 다중 ECL-기반 면역검정만으로 측정된 EPA에 있어서, 모든 면역원성 시점에 대해 백신화 연구 군에 의해 면역원성의 다음 측정이 평가되고 표로 작성된다:
- 1일째로부터 혈청 항체 역가가 2배 이상 및 4배 이상 증가한 참가자의 비율(백신화 전)
- 기하 평균 역가 (GMT)
- GMR: 기준선 이후/기준선 값으로부터 계산된 기준선으로부터의 배수 변화.
LTFU 기간 동안 각 혈청형에 있어서 면역원성에 대한 설명 요약이 제공된다.
나중 단계에 대한 용량 선택은 코호트 1(30일째 결과)의 일차 분석 시점에 이용 가능한 증거 전체를 고려한다.
표 11: 코호트 1: 백신화 일정
*ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.
** ExPEC4V는 담체 단백질인 슈도모나스 애루기노사로부터 유래한 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 별도로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O6A 및 O25B의 O-항원 다당류(PS)로 구성된다.
***Prevnar 13, 뉴모코컬 13-변이체 컨쥬게이트 백신(디프테리아 CRM197 단백질)은 비독소 디프테리아 CRM197 단백질에 개별적으로 연결된 스트렙토코커스 뉴모니애 혈청형 1, 3, 4, 5, 6A, 6B, 7F, 9V, 14, 18C, 19A, 19F 및 23F의 캡슐 항원의 당류의 멸균 현탁액이다.
표 12: 코호트 2: 백신화 일정
a ExPEC10V는 담체 단백질인 슈도모나스 애루기노사로부터 유래된 유전학적으로 탈독소화된 형태의 외독소 A(EPA)에 개별적으로 바이오컨쥬게이션된 ExPEC 혈청형 O1A, O2, O4, O6A, O8, O15, O16, O18A, O25B 및 O75의 O-항원 다당류(PS)로 구성된다.
연구의 코호트 2에 등록된 참가자의 무작위 배정 비율은 2:1(ExPEC10V:플라세보)이다. 코호트 2에 사용된 ExPEC10V 용량은 코호트 1의 일차 분석(30일째) 결과를 기반으로 한다.
상태
상기에서 설명한 연구의 코호트 1의 등록 및 백신화가 완료되었다. 연구는 맹검 방식으로 진행된다. 안전성 데이터의 지속적 검토에 근거하여, 주요 안전성 문제는 확인되지 않았으며, ExPEC10V 백신은 허용가능한 안전성 프로파일을 갖는다.
코호트 1 임상 샘플의 면역원성의 분석은 맹검 방식으로 진행 중이다. ECL 데이터는 100% 허용 품질 한계(Acceptance Quality Limit)(AQL) 체크되었으며, 데이터 관리를 위해 업로드되었다. MOPA 샘플의 분석은 진행중이다. 데이터 비맹검 및 통계 분석은 임상 연구 기관(CRO)을 사용하여 수행된다.
코호트에 대한 ExPEC10V 용량이 코호트 1로부터의 30일째 결과의 최종 일차 분석을 기반으로 확인되면, 코호트 2 백신화가 시작된다.
당업자는 본 발명의 광범위한 본 발명의 개념을 벗어나지 않고 전술한 구체예에 변경이 이루어질 수 있음을 이해할 것이다. 따라서, 본 발명은 개시된 특정 구체예에 제한되지 않고, 본 설명에 의해 정의된 본 발명의 사상 및 범위 내에 변형이 포함되도록 의도된 것으로 이해된다.
서열
SEQ ID NO: 1
(글리코실화 컨센서스 서열)
Asn-X-Ser(Thr), 여기에서 X는 Pro를 제외한 임의의 아미노산일 수 있음
SEQ ID NO: 2
(최적화된 글리코실화 컨센서스 서열)
Asp(Glu)-X-Asn-Z-Ser(Thr), 여기에서 X 및 Z는 Pro를 제외한 아미노산으로부터 독립적으로 선택됨
SEQ ID NO: 3 (4 글리코실화 컨센서스 서열을 포함하는 EPA 담체 단백질 (EPA-4))
SEQ ID NO: 4 (O4 GtrS 아미노산 서열)
SEQ ID NO: 5 (예시적 O4 gtrS 핵산 서열)
SEQ ID NO: 6 (예시적 PglB 서열('야생형'))
SEQ ID NO: 7
(예시적 gtrA 아미노산 서열; 대장균 W3110 yfdG, GenBank: BAA16209.1)
SEQ ID NO: 8
(예시적 gtrB 아미노산 서열 - 대장균 W3110 yfdH, GenBank: BAA16210.1)
SEQ ID NO: 9
(예시적 O4
rfb
유전자좌 뉴클레오티드 서열 - O4-EPA 생성 균주 BVEC-L-00684f)
SEQ ID NO: 10
(EPA 담체 단백질에 대한 예시적 신호 서열)
SEQ ID NO: 11
(예시적 O1A
rfb
유전자좌 뉴클레오티드 서열 - O1A-EPA 생성 균주 stGVXN4411 및 stLMTB10217)
SEQ ID NO: 12
(예시적 O2
rfb
유전자좌 뉴클레오티드 서열 - O2-EPA 생성 균주 stGVXN4906)
SEQ ID NO: 13
(예시적 O6A
rfb
유전자좌 뉴클레오티드 서열 - O6A-EPA 생성 균주 stGVXN4112 및 stLMTB10923)
SEQ ID NO: 14
(예시적 O8
rfb
유전자좌 뉴클레오티드 서열 - O8-EPA 생성 균주 stLMTB11734)
SEQ ID NO: 15
(예시적 O15
rfb
유전자좌 뉴클레오티드 서열 - O15-EPA 생성 균주 stLMTB11738)
SEQ ID NO: 16
(예시적 O16
rfb
유전자좌 뉴클레오티드 서열 - O16-EPA 생성 균주 stLMTB11739)
SEQ ID NO: 17
(예시적 O18A
rfb
유전자좌 뉴클레오티드 서열 - O18A-EPA 생성 균주 BVEC-L-00559)
SEQ ID NO: 18
(예시적 O25B rfb 유전자좌 뉴클레오티드 서열 - O25B-EPA 생성 균주 stGVXN4459)
SEQ ID NO: 19
(예시적 O75
rfb
유전자좌 뉴클레오티드 서열 - O75-EPA 생성 균주 stLMTB11737)
SEQUENCE LISTING
<110> Janssen Pharmaceuticals, Inc.
GlaxoSmithKline Biologicals S.A.
<120> Methods of Producing Bioconjugates of E. coli O-Antigen Polysaccharides,
Compositions Thereof, and Methods of Use Thereof
<130> 004852.11612/128WO1 (CRU6009WOPCT1; VB66734P)
<150> US62/819,762
<151> 2019-03-18
<160> 19
<170> PatentIn version 3.5
<210> 1
<211> 3
<212> PRT
<213> Artificial Sequence
<220>
<223> glycosylation consensus sequence
<220>
<221> VARIANT
<222> (2)..(2)
<223> any amino acid residue except Pro
<220>
<221> VARIANT
<222> (3)..(3)
<223> Ser orThr
<400> 1
Asn Xaa Xaa
1
<210> 2
<211> 5
<212> PRT
<213> Artificial Sequence
<220>
<223> optimized glycosylation consensus sequence
<220>
<221> VARIANT
<222> (1)..(1)
<223> Asp or Glu
<220>
<221> VARIANT
<222> (2)..(2)
<223> any amino acid residue except Pro
<220>
<221> VARIANT
<222> (4)..(4)
<223> any amino acid residue except Pro
<220>
<221> VARIANT
<222> (5)..(5)
<223> Ser or Thr
<400> 2
Xaa Xaa Asn Xaa Xaa
1 5
<210> 3
<211> 652
<212> PRT
<213> Artificial Sequence
<220>
<223> EPA carrier protein comprising 4 glycosylation consensus
sequences (EPA-4)
<400> 3
Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr Gly Ser Gly Gly Gly Lys
1 5 10 15
Leu Ala Glu Glu Ala Phe Asp Leu Trp Asn Glu Cys Ala Lys Ala Cys
20 25 30
Val Leu Asp Leu Lys Asp Gly Val Arg Ser Ser Arg Met Ser Val Asp
35 40 45
Pro Ala Ile Ala Asp Thr Asn Gly Gln Gly Val Leu His Tyr Ser Met
50 55 60
Val Leu Glu Gly Gly Asn Asp Ala Leu Lys Leu Ala Ile Asp Asn Ala
65 70 75 80
Leu Ser Ile Thr Ser Asp Gly Leu Thr Ile Arg Leu Glu Gly Gly Val
85 90 95
Glu Pro Asn Lys Pro Val Arg Tyr Ser Tyr Thr Arg Gln Ala Arg Gly
100 105 110
Ser Trp Ser Leu Asn Trp Leu Val Pro Ile Gly His Glu Lys Pro Ser
115 120 125
Asn Ile Lys Val Phe Ile His Glu Leu Asn Ala Gly Asn Gln Leu Ser
130 135 140
His Met Ser Pro Ile Tyr Thr Ile Glu Met Gly Asp Glu Leu Leu Ala
145 150 155 160
Lys Leu Ala Arg Asp Ala Thr Phe Phe Val Arg Ala His Glu Ser Asn
165 170 175
Glu Met Gln Pro Thr Leu Ala Ile Ser His Ala Gly Val Ser Val Val
180 185 190
Met Ala Gln Ala Gln Pro Arg Arg Glu Lys Arg Trp Ser Glu Trp Ala
195 200 205
Ser Gly Lys Val Leu Cys Leu Leu Asp Pro Leu Asp Gly Val Tyr Asn
210 215 220
Tyr Leu Ala Gln Gln Arg Cys Asn Leu Asp Asp Thr Trp Glu Gly Lys
225 230 235 240
Ile Tyr Arg Val Leu Ala Gly Asn Pro Ala Lys His Asp Leu Asp Ile
245 250 255
Lys Asp Asn Asn Asn Ser Thr Pro Thr Val Ile Ser His Arg Leu His
260 265 270
Phe Pro Glu Gly Gly Ser Leu Ala Ala Leu Thr Ala His Gln Ala Cys
275 280 285
His Leu Pro Leu Glu Ala Phe Thr Arg His Arg Gln Pro Arg Gly Trp
290 295 300
Glu Gln Leu Glu Gln Cys Gly Tyr Pro Val Gln Arg Leu Val Ala Leu
305 310 315 320
Tyr Leu Ala Ala Arg Leu Ser Trp Asn Gln Val Asp Gln Val Ile Arg
325 330 335
Asn Ala Leu Ala Ser Pro Gly Ser Gly Gly Asp Leu Gly Glu Ala Ile
340 345 350
Arg Glu Gln Pro Glu Gln Ala Arg Leu Ala Leu Thr Leu Ala Ala Ala
355 360 365
Glu Ser Glu Arg Phe Val Arg Gln Gly Thr Gly Asn Asp Glu Ala Gly
370 375 380
Ala Ala Ser Ala Asp Val Val Ser Leu Thr Cys Pro Val Ala Lys Asp
385 390 395 400
Gln Asn Arg Thr Lys Gly Glu Cys Ala Gly Pro Ala Asp Ser Gly Asp
405 410 415
Ala Leu Leu Glu Arg Asn Tyr Pro Thr Gly Ala Glu Phe Leu Gly Asp
420 425 430
Gly Gly Asp Val Ser Phe Ser Thr Arg Gly Thr Gln Asn Trp Thr Val
435 440 445
Glu Arg Leu Leu Gln Ala His Arg Gln Leu Glu Glu Arg Gly Tyr Val
450 455 460
Phe Val Gly Tyr His Gly Thr Phe Leu Glu Ala Ala Gln Ser Ile Val
465 470 475 480
Phe Gly Gly Val Arg Ala Arg Ser Gln Asp Leu Asp Ala Ile Trp Arg
485 490 495
Gly Phe Tyr Ile Ala Gly Asp Pro Ala Leu Ala Tyr Gly Tyr Ala Gln
500 505 510
Asp Gln Glu Pro Asp Ala Arg Gly Arg Ile Arg Asn Gly Ala Leu Leu
515 520 525
Arg Val Tyr Val Pro Arg Trp Ser Leu Pro Gly Phe Tyr Arg Thr Gly
530 535 540
Leu Thr Leu Ala Ala Pro Glu Ala Ala Gly Glu Val Glu Arg Leu Ile
545 550 555 560
Gly His Pro Leu Pro Leu Arg Leu Asp Ala Ile Thr Gly Pro Glu Glu
565 570 575
Glu Gly Gly Arg Val Thr Ile Leu Gly Trp Pro Leu Ala Glu Arg Thr
580 585 590
Val Val Ile Pro Ser Ala Ile Pro Thr Asp Pro Arg Asn Val Gly Gly
595 600 605
Asp Leu Asp Pro Ser Ser Ile Pro Asp Lys Glu Gln Ala Ile Ser Ala
610 615 620
Leu Pro Asp Tyr Ala Ser Gln Pro Gly Lys Pro Pro Arg Glu Asp Leu
625 630 635 640
Lys Leu Gly Ser Gly Gly Gly Asp Gln Asn Ala Thr
645 650
<210> 4
<211> 421
<212> PRT
<213> Artificial Sequence
<220>
<223> O4 GtrS amino acid sequence
<400> 4
Met Asn Asn Leu Ile Met Asn Asn Trp Cys Lys Leu Ser Ile Phe Ile
1 5 10 15
Ile Ala Phe Ile Leu Leu Trp Leu Arg Arg Pro Asp Ile Leu Thr Asn
20 25 30
Ala Gln Phe Trp Ala Glu Asp Ser Val Phe Trp Tyr Lys Asp Ala Tyr
35 40 45
Glu Asn Gly Phe Leu Ser Ser Leu Thr Thr Pro Arg Asn Gly Tyr Phe
50 55 60
Gln Thr Val Ser Thr Phe Ile Val Gly Leu Thr Ala Leu Leu Asn Pro
65 70 75 80
Asp Tyr Ala Pro Phe Val Ser Asn Phe Phe Gly Ile Met Ile Arg Ser
85 90 95
Val Ile Ile Trp Phe Leu Phe Thr Glu Arg Phe Asn Phe Leu Thr Leu
100 105 110
Thr Thr Arg Ile Phe Leu Ser Ile Tyr Phe Leu Cys Met Pro Gly Leu
115 120 125
Asp Glu Val His Ala Asn Ile Thr Asn Ala His Trp Tyr Leu Ser Leu
130 135 140
Tyr Val Ser Met Ile Leu Ile Ala Arg Asn Pro Ser Ser Lys Ser Trp
145 150 155 160
Arg Phe His Asp Ile Phe Phe Ile Leu Leu Ser Gly Leu Ser Gly Pro
165 170 175
Phe Ile Ile Phe Ile Leu Ala Ala Ser Cys Phe Lys Phe Ile Asn Asn
180 185 190
Cys Lys Asp His Ile Ser Val Arg Ser Phe Ile Asn Phe Tyr Leu Arg
195 200 205
Gln Pro Tyr Ala Leu Met Ile Val Cys Ala Leu Ile Gln Gly Thr Ser
210 215 220
Ile Ile Leu Thr Phe Asn Gly Thr Arg Ser Ser Ala Pro Leu Gly Phe
225 230 235 240
Ser Phe Asp Val Ile Ser Ser Ile Ile Ser Ser Asn Ile Phe Leu Phe
245 250 255
Thr Phe Val Pro Trp Asp Ile Ala Lys Ala Gly Trp Asp Asn Leu Leu
260 265 270
Leu Ser Tyr Phe Leu Ser Val Ser Ile Leu Ser Cys Ala Ala Phe Val
275 280 285
Phe Val Lys Gly Thr Trp Arg Met Lys Val Phe Ala Thr Leu Pro Leu
290 295 300
Leu Ile Ile Ile Phe Ser Met Ala Lys Pro Gln Leu Thr Asp Ser Ala
305 310 315 320
Pro Gln Leu Pro Thr Leu Ile Asn Gly Gln Gly Ser Arg Tyr Phe Val
325 330 335
Asn Ile His Ile Ala Ile Phe Ser Leu Leu Cys Val Tyr Leu Leu Glu
340 345 350
Cys Val Arg Gly Lys Val Ala Thr Leu Phe Ser Lys Ile Tyr Leu Thr
355 360 365
Ile Leu Leu Phe Val Met Gly Cys Leu Asn Phe Val Ile Thr Pro Leu
370 375 380
Pro Asn Met Asn Trp Arg Glu Gly Ala Thr Leu Ile Asn Asn Ala Lys
385 390 395 400
Thr Gly Asp Val Ile Ser Ile Gln Val Leu Pro Pro Gly Leu Thr Leu
405 410 415
Glu Leu Arg Lys Lys
420
<210> 5
<211> 1266
<212> DNA
<213> Artificial Sequence
<220>
<223> Example O4 gtrS nucleic acid sequence
<400> 5
atgaataatt taattatgaa taactggtgt aaattatcta tatttattat tgcatttatt 60
ttgctatggc ttagaaggcc ggatatactc acaaacgcac aattttgggc agaagattcc 120
gttttctggt ataaggacgc ctatgagaac ggattcttaa gttcactaac aacgcctagg 180
aatgggtatt tccagactgt ttctacattt atagttggtc tgactgcttt attaaatcca 240
gattatgcac cttttgtttc taattttttt ggcataatga ttcgctcagt aattatatgg 300
tttttattta cagaaagatt caacttcctc acattgacta ctaggatttt cttatctatt 360
tattttctat gcatgcctgg attggatgaa gttcatgcaa atataacaaa tgcacattgg 420
tatttgtcat tatatgtatc aatgatcctg atagctcgca atccaagttc aaaatcatgg 480
aggtttcatg atatattctt tatcttgcta tccgggctca gtggcccatt tataattttc 540
attttagcag cttcatgctt taaatttata aataattgta aagatcatat tagtgtaaga 600
tctttcataa atttctactt gcgtcagcca tacgcattaa tgattgtttg cgctttaatt 660
caaggaactt ctataattct aactttcaat ggcacacgtt cctcagcacc gctaggattc 720
agttttgatg tgatttcgtc tattatatca tcgaatattt ttttatttac atttgtccca 780
tgggatattg caaaggctgg gtgggataat ttactgttat cttatttttt gtctgtttcg 840
attttgtcgt gtgcggcctt tgtttttgtt aaaggtacgt ggcgaatgaa agtatttgca 900
actttaccat tgctaattat aatattttca atggcaaaac cacaattgac agactcggca 960
cctcaattgc caacacttat taatgggcaa ggttcaagat acttcgtaaa tatacatatt 1020
gcgatattct ctttgctatg tgtttactta cttgagtgcg tcagggggaa agtggcaact 1080
ttattttcca aaatatactt aacaattttg ctattcgtga tgggatgttt gaattttgtt 1140
atcaccccac tcccaaacat gaactggagg gaaggtgcta ctttgattaa taatgcaaaa 1200
actggtgatg tcatttcgat tcaagtgcta ccacctggcc taacacttga actaaggaaa 1260
aaataa 1266
<210> 6
<211> 713
<212> PRT
<213> Artificial Sequence
<220>
<223> Example PglB sequence ('wild-type')
<400> 6
Met Leu Lys Lys Glu Tyr Leu Lys Asn Pro Tyr Leu Val Leu Phe Ala
1 5 10 15
Met Ile Ile Leu Ala Tyr Val Phe Ser Val Phe Cys Arg Phe Tyr Trp
20 25 30
Val Trp Trp Ala Ser Glu Phe Asn Glu Tyr Phe Phe Asn Asn Gln Leu
35 40 45
Met Ile Ile Ser Asn Asp Gly Tyr Ala Phe Ala Glu Gly Ala Arg Asp
50 55 60
Met Ile Ala Gly Phe His Gln Pro Asn Asp Leu Ser Tyr Tyr Gly Ser
65 70 75 80
Ser Leu Ser Ala Leu Thr Tyr Trp Leu Tyr Lys Ile Thr Pro Phe Ser
85 90 95
Phe Glu Ser Ile Ile Leu Tyr Met Ser Thr Phe Leu Ser Ser Leu Val
100 105 110
Val Ile Pro Thr Ile Leu Leu Ala Asn Glu Tyr Lys Arg Pro Leu Met
115 120 125
Gly Phe Val Ala Ala Leu Leu Ala Ser Ile Ala Asn Ser Tyr Tyr Asn
130 135 140
Arg Thr Met Ser Gly Tyr Tyr Asp Thr Asp Met Leu Val Ile Val Leu
145 150 155 160
Pro Met Phe Ile Leu Phe Phe Met Val Arg Met Ile Leu Lys Lys Asp
165 170 175
Phe Phe Ser Leu Ile Ala Leu Pro Leu Phe Ile Gly Ile Tyr Leu Trp
180 185 190
Trp Tyr Pro Ser Ser Tyr Thr Leu Asn Val Ala Leu Ile Gly Leu Phe
195 200 205
Leu Ile Tyr Thr Leu Ile Phe His Arg Lys Glu Lys Ile Phe Tyr Ile
210 215 220
Ala Val Ile Leu Ser Ser Leu Thr Leu Ser Asn Ile Ala Trp Phe Tyr
225 230 235 240
Gln Ser Ala Ile Ile Val Ile Leu Phe Ala Leu Phe Ala Leu Glu Gln
245 250 255
Lys Arg Leu Asn Phe Met Ile Ile Gly Ile Leu Gly Ser Ala Thr Leu
260 265 270
Ile Phe Leu Ile Leu Ser Gly Gly Val Asp Pro Ile Leu Tyr Gln Leu
275 280 285
Lys Phe Tyr Ile Phe Arg Ser Asp Glu Ser Ala Asn Leu Thr Gln Gly
290 295 300
Phe Met Tyr Phe Asn Val Asn Gln Thr Ile Gln Glu Val Glu Asn Val
305 310 315 320
Asp Leu Ser Glu Phe Met Arg Arg Ile Ser Gly Ser Glu Ile Val Phe
325 330 335
Leu Phe Ser Leu Phe Gly Phe Val Trp Leu Leu Arg Lys His Lys Ser
340 345 350
Met Ile Met Ala Leu Pro Ile Leu Val Leu Gly Phe Leu Ala Leu Lys
355 360 365
Gly Gly Leu Arg Phe Thr Ile Tyr Ser Val Pro Val Met Ala Leu Gly
370 375 380
Phe Gly Phe Leu Leu Ser Glu Phe Lys Ala Ile Met Val Lys Lys Tyr
385 390 395 400
Ser Gln Leu Thr Ser Asn Val Cys Ile Val Phe Ala Thr Ile Leu Thr
405 410 415
Leu Ala Pro Val Phe Ile His Ile Tyr Asn Tyr Lys Ala Pro Thr Val
420 425 430
Phe Ser Gln Asn Glu Ala Ser Leu Leu Asn Gln Leu Lys Asn Ile Ala
435 440 445
Asn Arg Glu Asp Tyr Val Val Thr Trp Trp Asp Tyr Gly Tyr Pro Val
450 455 460
Arg Tyr Tyr Ser Asp Val Lys Thr Leu Val Asp Gly Gly Lys His Leu
465 470 475 480
Gly Lys Asp Asn Phe Phe Pro Ser Phe Ala Leu Ser Lys Asp Glu Gln
485 490 495
Ala Ala Ala Asn Met Ala Arg Leu Ser Val Glu Tyr Thr Glu Lys Ser
500 505 510
Phe Tyr Ala Pro Gln Asn Asp Ile Leu Lys Thr Asp Ile Leu Gln Ala
515 520 525
Met Met Lys Asp Tyr Asn Gln Ser Asn Val Asp Leu Phe Leu Ala Ser
530 535 540
Leu Ser Lys Pro Asp Phe Lys Ile Asp Thr Pro Lys Thr Arg Asp Ile
545 550 555 560
Tyr Leu Tyr Met Pro Ala Arg Met Ser Leu Ile Phe Ser Thr Val Ala
565 570 575
Ser Phe Ser Phe Ile Asn Leu Asp Thr Gly Val Leu Asp Lys Pro Phe
580 585 590
Thr Phe Ser Thr Ala Tyr Pro Leu Asp Val Lys Asn Gly Glu Ile Tyr
595 600 605
Leu Ser Asn Gly Val Val Leu Ser Asp Asp Phe Arg Ser Phe Lys Ile
610 615 620
Gly Asp Asn Val Val Ser Val Asn Ser Ile Val Glu Ile Asn Ser Ile
625 630 635 640
Lys Gln Gly Glu Tyr Lys Ile Thr Pro Ile Asp Asp Lys Ala Gln Phe
645 650 655
Tyr Ile Phe Tyr Leu Lys Asp Ser Ala Ile Pro Tyr Ala Gln Phe Ile
660 665 670
Leu Met Asp Lys Thr Met Phe Asn Ser Ala Tyr Val Gln Met Phe Phe
675 680 685
Leu Gly Asn Tyr Asp Lys Asn Leu Phe Asp Leu Val Ile Asn Ser Arg
690 695 700
Asp Ala Lys Val Phe Lys Leu Lys Ile
705 710
<210> 7
<211> 120
<212> PRT
<213> Escherichia coli
<400> 7
Met Leu Lys Leu Phe Ala Lys Tyr Thr Ser Ile Gly Val Leu Asn Thr
1 5 10 15
Leu Ile His Trp Val Val Phe Gly Val Cys Ile Tyr Val Ala His Thr
20 25 30
Asn Gln Ala Leu Ala Asn Phe Ala Gly Phe Val Val Ala Val Ser Phe
35 40 45
Ser Phe Phe Ala Asn Ala Lys Phe Thr Phe Lys Ala Ser Thr Thr Thr
50 55 60
Met Arg Tyr Met Leu Tyr Val Gly Phe Met Gly Thr Leu Ser Ala Thr
65 70 75 80
Val Gly Trp Ala Ala Asp Arg Cys Ala Leu Pro Pro Met Ile Thr Leu
85 90 95
Val Thr Phe Ser Ala Ile Ser Leu Val Cys Gly Phe Val Tyr Ser Lys
100 105 110
Phe Ile Val Phe Arg Asp Ala Lys
115 120
<210> 8
<211> 306
<212> PRT
<213> Escherichia coli
<400> 8
Met Lys Ile Ser Leu Val Val Pro Val Phe Asn Glu Glu Glu Ala Ile
1 5 10 15
Pro Ile Phe Tyr Lys Thr Val Arg Glu Phe Glu Glu Leu Lys Ser Tyr
20 25 30
Glu Val Glu Ile Val Phe Ile Asn Asp Gly Ser Lys Asp Ala Thr Glu
35 40 45
Ser Ile Ile Asn Ala Leu Ala Val Ser Asp Pro Leu Val Val Pro Leu
50 55 60
Ser Phe Thr Arg Asn Phe Gly Lys Glu Pro Ala Leu Phe Ala Gly Leu
65 70 75 80
Asp His Ala Thr Gly Asp Ala Ile Ile Pro Ile Asp Val Asp Leu Gln
85 90 95
Asp Pro Ile Glu Val Ile Pro His Leu Ile Glu Lys Trp Gln Ala Gly
100 105 110
Ala Asp Met Val Leu Ala Lys Arg Ser Asp Arg Ser Thr Asp Gly Arg
115 120 125
Leu Lys Arg Lys Thr Ala Glu Trp Phe Tyr Lys Leu His Asn Lys Ile
130 135 140
Ser Asn Pro Lys Ile Glu Glu Asn Val Gly Asp Phe Arg Leu Met Ser
145 150 155 160
Arg Asp Val Val Glu Asn Ile Lys Leu Met Pro Glu Arg Asn Leu Phe
165 170 175
Met Lys Gly Ile Leu Ser Trp Val Gly Gly Lys Thr Asp Ile Val Glu
180 185 190
Tyr Val Arg Ala Glu Arg Ile Ala Gly Asp Thr Lys Phe Asn Gly Trp
195 200 205
Lys Leu Trp Asn Leu Ala Leu Glu Gly Ile Thr Ser Phe Ser Thr Phe
210 215 220
Pro Leu Arg Ile Trp Thr Tyr Ile Gly Leu Val Val Ala Ser Val Ala
225 230 235 240
Phe Ile Tyr Gly Ala Trp Met Ile Leu Asp Thr Ile Ile Phe Gly Asn
245 250 255
Ala Val Arg Gly Tyr Pro Ser Leu Leu Val Ser Ile Leu Phe Leu Gly
260 265 270
Gly Ile Gln Met Ile Gly Ile Gly Val Leu Gly Glu Tyr Ile Gly Arg
275 280 285
Thr Tyr Ile Glu Thr Lys Lys Arg Pro Lys Tyr Ile Ile Lys Arg Val
290 295 300
Lys Lys
305
<210> 9
<211> 14440
<212> DNA
<213> Artificial Sequence
<220>
<223> example O4 rfb locus nucleotide sequence - O4-EPA production
strain BVEC-L-00684f
<400> 9
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtatatggt 1680
gatttgcctc atcctgacga ggtaaataat acagaagaat tacccttatt tactgagaca 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtaccta tggtttaccg accattgtga ctaattgctc taacaattat 1860
ggtccttatc atttcccgga aaaattgatt ccattggtta ttctcaatgc tctggaaggt 1920
aaagcattac ctatttatgg taaaggggat caaattcgcg actggctgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatagat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc cgatcgtccg 2160
ggacacgatc gccgttatgc gattgatgct gagaatattg gtcgcgaatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgg aagacagtgg aatggtatct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaga gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctctg ggtaacttga ttgctcttga tgttcattcc actgattatt 2460
gtggcgattt cagtaacccc gaaggtgtgg ctgaaaccgt caaaaaaatt cgcccagatg 2520
ttattgttaa tgctgctgct cataccgcgg tagataaggc tgagtcagaa ccagaatttg 2580
cacaattact caatgcgacc agcgttgaag caattgcaaa agcggctaat gaagttgggg 2640
cttgggtaat tcattactca actgactacg tcttccctgg aaatggcgac atgccatggc 2700
tcgagactga tgtaaccgct ccgctcaatg tttatggcaa aaccaaattg gctggagaaa 2760
gagcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatatgcag 2820
gtaaaggaaa taactttgcc aaaacaatgt tacgtctggc aaaagagcgc gaagaactgg 2880
ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940
ctcatgccat tcgcgtggca ttaaaaaaac cagaagttgc tggcttgtac catctggtag 3000
caaatggcac aacaacctgg cacgattacg ccgcgctagt attcgaagaa gcccgtaaag 3060
cagggattga ccttgcactt aacaaactca acgccgtacc aacaacggct tatcctactc 3120
cagcccgccg tcctcataat tctcgcctca ataccgaaaa gtttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240
cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300
aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360
tatcctgtga cgatggcagt gagtaaacaa ctgctgccga tttatgataa gccgatgatt 3420
tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tatcagtacg 3480
ccacaggata caccgcgttt ccaacaattg ttgggggacg ggagtcagtg ggggcttaat 3540
ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggtgaa 3600
gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660
gacttgccga aattaatgga agctgctgtt aacaaagaaa tcggtgcaac ggtatttgct 3720
tatcacgtca atgatcctga acgttatggt gtcgtggagt ttgataataa cggtactgca 3780
attagcctgg aagaaaaacc gctggaacca aaaagtaact atgcggttac tgggctttat 3840
ttctatgaca atgatgttgt agaaatggcg aaaaacctta agccttctgc ccgtggcgaa 3900
ctggaaatta ccgatattaa ccgtatttat atggagcagg gacgtttgtc tgtcgctatg 3960
atggggcgtg gttatgcctg gttggatact ggtacacatc aaagtcttat tgaagcaagt 4020
aacttcattg ccaccattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080
gcttaccgta aagggtttat tgatgctgag caggtgaaag tattagccga accgctgaag 4140
aaaaatgatt atggtcagta tctgctaaaa atgattaaag gttattaata aaatgaacgt 4200
aattaaaact gaaattcctg atgtgctgat ttttgaacca aaagtttttg gtgatgaacg 4260
tggcttcttt tttgagagtt ttaaccagaa agtatttgaa gaagctgtag gacggaaggt 4320
tgaatttgtt caggataacc attctaagtc taaaataaat gtattgcgtg ggatgcatta 4380
tcaaacacaa aatactcaag gaaaactggt tcgggtaatt tctggttcag tatatgatgt 4440
tgccgtagat ttaagagaaa aatcaaagac atttggcaaa tgggtgggtg tagaattatc 4500
tgggaataat aaaagacaat tgtggatccc cgaaggtttt gcccatggtt tttatgtgtt 4560
ggaggagaat accgaatttg tttataaatg taccgatact tataaccctg ctcatgaaca 4620
cacattgcta tggaatgatc caactatcaa tataagttgg ccaatcatac aaaactgcaa 4680
gccaattatt tctgaaaaag atgctaatgg acatcttttt tcacataaaa cctatttctg 4740
aaatgcaata ttatgagttt aattagaaac agtttctata atattgctgg ttttgctgtg 4800
ccgacattag ttgcagtccc tgctttgggg attcttgcca ggctgcttgg accggagaat 4860
tttggacttt tcacactagc attcgctttg ataggatatg caagtatttt cgacgccggg 4920
attagtcgag ctgtaatcag agaaatcgct ctttatcgag aaagtgaaaa agagcaaata 4980
caaattattt cgacagcaag tgtaatcgta ctattcttag gggtggttgc agctttgtta 5040
ctttatttta gtagtaataa agttgttgag ttattgaatg ttagttccgt ttatattgaa 5100
acagcagtgc gtgcattctc tgttatttca tttataatac ctgtgtatct gattaaccag 5160
atttggcttg gttatctgga agggctagaa aaatttgcaa atataaatgt tcagagaatg 5220
atttctagca caagcttggc tatattacca gtgatatttt gttattacaa tccctcgttg 5280
ctttatgcta tgtatgggtt ggtggttggg cgtgtgattt catttttgat tagcgcaata 5340
atttgtcgag atattattct taaaagtaaa ctttacttta atgtggcaac ttgcaatcgt 5400
cttatctctt ttggtggatg gataacagtt agtaatatca taagcccaat catggcatat 5460
ttcgaccgct ttatcatctc tcatattatg ggggcttcga gaattgcatt ttatacagcg 5520
ccctcagagg gtgtatcaag gttaattaat atcccatatg ctttggcaag agctctattt 5580
cctaaattgg catatagcaa taatgatgat gaacgaaaaa aattacaact acagagctac 5640
gcaattataa gcattgtatg tctacccata gttgttattg gtgtcatttt tgcctcattc 5700
ataatgacaa catggatggg acctgattat gccttagaag cagcaactat catgaaaata 5760
cttcttgctg gttttttctt taactcttta gcgcaaatac cttatgcata cttgcaatct 5820
atcggaaagt caaaaattac cgcatttgtg catctcatag aacttgcgcc atacttatta 5880
ttattgtatt acttcacaat gcatttcggc ataattggca cggcaatcgc ttggtcactt 5940
agaacatttt gtgattttgt tatactactt tcgatatcga gaagaaaatg attgcggttg 6000
atattgcgct tgcaacctac aatggtgcta attttattcg gcaacagatt gaatctatcc 6060
agaaacaaac ttatagaaat tggcgtctta taataagtga tgataactcg agtgatgata 6120
ctgttgatat tattaaggat atgatgtcta acgacagtcg tatctatttg gtaggaaata 6180
aaagacaagg aggggttatt cagaacttta attatgctct ttcacaaact acatctgaaa 6240
ttgtgttact atgtgaccag gatgacattt ggccggagga gcgtctggaa attcttatag 6300
ataaatttaa ggccttgcag cgtaatgatt ttgttccggc aatgatgttt actgatttga 6360
aattagtaga cgaaaataat tgtttgattg cagaaagttt ttatcgaacg aataatatta 6420
atccacaaga taatctgaaa aataataatc ttctctggcg ttcaacggta tatggctgta 6480
cttgcatcat gaataagaaa cttgttgata ttgcattgcc tatacctaca tatgcacata 6540
tgcatgatca atggttggca ttattagcga agcaatatgg taacattttt tatttcgact 6600
atgcgtctgt tcgttatagg caacattcta caaatgttgt tggtggtaga aataaaacgc 6660
catttcaaaa atttaattcc atacaaaaaa acctaaaaag gattaatttg ctagtggata 6720
gaactgttgc tttaattaaa tcaaataacg atttctatcc agggaataaa atggaaaata 6780
aaattgatta cttaaaattt ggagtgaatg aagtattacc ttatcttttt aaaggaaaca 6840
agaaagtttt ttcactttgt gtattaatta gtttggcatt acaaaaatga tatatttatt 6900
attttttttt gcactgttta tgatctgtac gtttttaaca cacaggcgac aggcattata 6960
tgttgtatct gcgttagtat ttcttttttt ggctttaacc tatccatcag gaggggactg 7020
gataggttat tttctccatt atgactgcat ggttaatgag cagtgtaata atggttttat 7080
aatgtttgaa cctggatatg aattaattgt ttccttattt ggatatttgg gatttcagac 7140
aattattatt tttatagccg ctgtaaatgt aattctaata ttaaattttg caaagcattt 7200
tgaaaacgga agttttgtta ttgttgcgat aatgtgcatg ttcctttgga gtgtttatgt 7260
tgaggcgatt agacaggctc tggccttatc tatagttata tttgggattc attctctttt 7320
tttgggtaga aaaaggaaat ttataacatt agtattattt gcgtcaactt tccatataac 7380
tgctttgatt tgttttcttc taatgactcc tctattttca aagaaattaa gcaagataat 7440
aagttatagc ctattaattt tcagtagctt ctttttcgct ttttctgaaa ccatattaag 7500
tgcactcctt gcaattttgc cagaaggatc cattgccagt gaaaaattaa gtttttactt 7560
agcaaccgag caatacaggc cacagttatc tattgggagt ggcactattc ttgacattat 7620
acttattttt ctgatatgtg taagttttaa acgaataaag aaatatatgc tcgctaatta 7680
taatgctgca aatgagatat tgcttattgg ttgctgtctt tatatttctt tcggtatttt 7740
tatcgggaaa atgatgccag ttatgactcg cattggttgg tatggttttc catttgttat 7800
agtacttctt tatattaact tgggttattc agaatatttt aagaggtata taaataaaag 7860
agggtgtggg tatagcaaat tattaattgc tttttatttt ttgctacaaa ttttgcgacc 7920
attaacatat gattatagct attataatat aatgcaccag gatactttgc tgaataggtt 7980
tgatgcatta gatgatgcat cattaagaca atcagcgaag agaaaatgtt tcgatttggg 8040
aaagatagga tatggtttct tatgtagtat ataatatcct gcattcattc ggataatttc 8100
ctatggaagt gtcctttgct ctgtctgtcc tcatttgttg aaattttatg ttaataagaa 8160
gctttagata accacttagg aactgtatgt ttgatctgtc caaaaattat attattgtaa 8220
gtgcgacggc gctggcttcc ggaggtgcat taactatatt aaagcaattt ataaaacatg 8280
catcacaaaa ttcaaatgac tatattatgt ttgtatctgc gggattggag ttgccggtct 8340
gtgataacat catttacata gaaaacacac caaaaggatg gttgaaaaga atatattggg 8400
attggttcgg ttgtcggaag tttatctcgg aacataagat taacgttaag aaagtaattt 8460
ctctacaaaa ttccagtttg aatgttcctt acgaacagat tatttacttg caccagccaa 8520
ttccttttag taaagttgat tcttttttaa aaaatatcac atccgataac gtaaagcttt 8580
ttttatataa aaagttttat tcctatttta tatttaaata tgtgaatgcc aatacaacca 8640
tcgtagtgca aacgaattgg atgaaaaaag gagtgctgga gcaatgtgat aaaattagta 8700
ccgaaagggt ccttgttata aaacctgata tcaaagcatt taataatact aattttgatg 8760
tagatatgga tgtatctgca aaaacactct tatatccagc gacaccactt acctataaaa 8820
atcatttggt cattctgaag gcgttggtta ttttaaagaa aaagtatttt atagatgatc 8880
tgaaattcca agtgactttt gaaaagaata ggtacaaaaa ttttgataag tttgtgcaat 8940
taaataactt aagcaaaaac gttgattatc tcggcgttct ttcatactcg aacttgcaaa 9000
aaaaatatat ggcggcatct ttaatcgttt ttcctagcta tatcgaatca tatgggttac 9060
cactcatcga agctgctagt ttaggaaaaa aaatcattag tagtgatctt ccttatgccc 9120
gggatgtttt aaaggattat agcggcgtag attttgtaat ttacaataat gaagatggct 9180
gggctaaggc gttgtttaat gttttaaatg gcaattcgaa gctcaatttt aggccttatg 9240
aaaaagatag tcgttcatct tggccacagt tcttctctat tttgaaataa ggtgtattat 9300
gtttaatggt aaaatattgt taattactgg tggtacgggg tctttcggta atgctgttct 9360
aagacgtttt cttgacactg atatcaaaga aatacgtatt ttttcccggg atgaaaaaaa 9420
acaagatgac atgaggaaaa aatataataa tccgaaactt aagttctata taggtgatgt 9480
tcgcgactat tcgagtatcc tcaatgcttc tcgaggtgtt gattttattt atcatgctgc 9540
agctctgaag caagtacctt cctgcgaatt ccacccaatg gaagctgtaa aaacgaatgt 9600
tttaggtacg gaaaacgtac tggaagcggc aatagctaat ggagttaggc gaattgtatg 9660
tttgagtaca gataaagctg tatatcctat caatgcaatg ggtatttcca aagcgatgat 9720
ggaaaaagta atggtagcaa aatcgcgcaa tgttgactgc tctaaaacgg ttatttgcgg 9780
tacacgttat ggcaatgtaa tggcatctcg tggttcagtt atcccattat ttgtcgatct 9840
gattaaatca ggtagaccaa tgacgataac agaccctaat atgactcgtt tcatgatgac 9900
tctcgaagac gctgttgatt tggttcttta cgcatttgaa catggcaata atggtgatat 9960
ttttgtccaa aaggcacctg cggctaccat cgaaacgttg gctattgcac tcaaagaatt 10020
acttaatgta aaccaacacc ctgtaaatat aatcggcacc cgacacgggg aaaaactgta 10080
cgaagcgtta ttgagccgag aggaaatgat tgcagcggag gatatgggtg attattatcg 10140
tgttccacca gatctccgcg atttgaacta tggaaaatat gtggaacatg gtgaccgtcg 10200
tatctcggaa gtggaagatt ataactctca taatactgat aggttagatg ttgagggaat 10260
gaaaaaatta ctgctaaaac ttccttttat ccgggcactt cggtctggtg aagattatga 10320
gttggattca taatatgaaa attttagtta ctggcgctgc agggtttatc ggtcgaaatt 10380
tggtattccg gcttaaggaa gctggatata acgaactcat tacgatagat cgtaactctt 10440
ctttggcgga tttagagcag ggacttaagc aggcagattt tatttttcac cttgctgggg 10500
taaatcgtcc cgtgaaggag tgtgaatttg aagagggaaa tagtaatcta actcaacaga 10560
ttgttgatat cctgaaaaaa aacaataaaa atactcctat catgctgagt tcttccatcc 10620
aggctgaatg tgataacgct tatggaaaga gtaaagcagc tgcggaaaaa atcattcagc 10680
agtatgggga aacgacaaac gctaaatatt atatttatcg cttgccgaat gtattcggta 10740
agtggtgtcg accaaattat aactccttta tagcaacttt ctgccatcgc attgcaaatg 10800
atgaagctat tacaattaat gatccttcag cagttgtaaa tctggtgtat atagatgact 10860
tttgttctga catattaaag ctattagaag gagcgaacga aactggttac aggacatttg 10920
gtccaattta ttctgttact gttggtgaag tggcacaatt aatttaccgg tttaaagaaa 10980
gtcgccaaac attaatcacc gaagatgtag gtaatggatt tacacgtgca ttgtactcaa 11040
catggttaag ttacctgtct cctgaacagt ttgcgtatac ggttccttct tatagtgatg 11100
acagaggggt attctgtgaa gtattgaaaa cgaaaaacgc gggccagttt tcgttcttta 11160
ctgcgcatcc aggaattact cggggtggtc attatcatca ttccaaaaat gagaaattta 11220
ttgtcatccg aggaagtgct tgtttcaaat ttgaaaatat tgtcacgagt gaacgatatg 11280
aacttaatgt ttcctctgat gattttaaaa ttgttgaaac agttccggga tggacgcata 11340
acattactaa taatggctcg gatgagctag ttgttatgct ttgggcaaat gaaatattta 11400
atcgttctga accagatact atagcgagag ttttatcgtg aaaaaattga aagtcatgtc 11460
ggttgttggg actcgtccag aaattattcg actctcgcgt gtccttgcaa aattagatga 11520
atattgtgac caccttattg ttcataccgg gcaaaactac gattatgaac tgaatgaagt 11580
ttttttcaaa gatttgggtg ttcgcaaacc tgattatttt cttaatgccg caggtaaaaa 11640
tgcagcagag actattggac aagttatcat taaagttgat gaggtccttg aacaggaaaa 11700
accagaagcc atgttagtac ttggcgatac taactcctgt atttcagcaa taccagcaaa 11760
gcgtcgaaga attccgatct tccatatgga ggctgggaat cgttgttttg accaacgcgt 11820
accggaagaa actaacagaa aaatagttga tcataccgct gatatcaata tgacatatag 11880
tgatatcgcg cgtgaatatc ttctggctga aggtgtacca gccgatagaa ttattaaaac 11940
cggtagccca atgtttgaag tactcactca ttatatgccg cagattgatg gttccgatgt 12000
actttctcgc ctgaatttaa cacctgggaa tttctttgtg gtaagtgccc acagagaaga 12060
aaatgttgat acccctaaac aacttgtgaa actggcgaat atacttaata ccgtggctga 12120
aaaatatgat gtcccggtag ttgtttctac tcatcctcgc actcgtaacc gcatcaacga 12180
aaacggtatt caattccata aaaatatctt gcttcttaag ccattaggat ttcacgatta 12240
caaccatctg caaaaaaatg cacgtgctgt tttatcggat agtgggacta ttacagaaga 12300
gtcctccatt atgaacttcc ctgcactcaa tatacgagaa gcgcacgaac gcccggaagg 12360
cttcgaagaa ggggcagtaa tgatggtcgg tcttgaatct gatcgcgttt tacaggcatt 12420
agaaattatt gcaacacagc ctcgtggaga agtacgctta cttcgtcagg ttagtgacta 12480
tagcatgcca aatgtttcag ataaagttct gcgtattatc cattcatata ctgactacgt 12540
taaacgggtt gtctggaagc aatactaatg aaacttgcat taatcattga tgattatttg 12600
ccccatagca cacgcgttgg ggctaaaatg tttcatgagt taggccttga attactgagc 12660
agaggccatg atgtaactgt aattacgcct gacatctcat tacaagcaat ttattctatt 12720
agtatgattg atggtataaa ggtttggcgt ttcaaaagtg gacctttaaa ggatgtaggt 12780
aaggctaaac gtgccataaa tgaaactctt ttatcttttc gcgcatggcg cgcatttaag 12840
cacctcattc aacatgatac atttgatggt atcgtttatt attccccctc tattttttgg 12900
ggcgacttgg ttaaaaaaat aaaacaacga tgccagtgcc caagctatct gatcctaagg 12960
gatatgtttc cacagtgggt cattgatgca ggtatgttga aagccggttc accaattgaa 13020
aaatatttta ggtattttga aaaaaagtca tatcagcagg ctggccggat aggggtaatg 13080
tctgataaga atcttgagat atttcgccag accaataaag gttatccgtg tgaagtttta 13140
cgtaattggg cctcaatgac tcctgtgtct gccagcgatg attatcattc acttcgtcaa 13200
aaatacgatc taaaagataa agtcattttt ttctatggcg gtaatattgg gcatgctcag 13260
gatatggcaa acttaatgcg ccttgcgcgt aatatgatgc gttatcatga tgctcatttc 13320
ctgtttatag ggcagggtga tgaagttgag ctgataaaat ctcttgctgc agaatggaat 13380
ttaactaatt tcactcatct accttcagtg aaccaggaag agtttaaatt aattttatct 13440
gaagttgatg tcggcctgtt ctccctttca tctcgccatt cttcacataa tttccccgga 13500
aaattactag ggtatatggt tcaatcaatc ccgatccttg ggagtgtgaa tggcggcaat 13560
gatttaatgg atgtaattaa taagcacaga gccggtttca ttcatgttaa tggtgaagat 13620
gataaactgt ttgaatctgc acaattgctt cttagtgatt cagttttaag aaaacagcta 13680
ggtcagaacg ctaatgtgtt gttaaagtct caattttcgg ttgaatcggc ggcacatact 13740
atcgaagtcc gactggaggc tggagaatgc gtttagttga tgacaatatt ctggatgaac 13800
tttttcgcac tgcagcaaat tctgaacgtt tgcgcgctca ttatttattg cacgcatctc 13860
atcaggagaa ggttcaacgt ttacttattg catttgtacg cgacagctat gttgaacccc 13920
attggcatga gttaccgcat cagtgggaaa tgtttgtcgt catgcaaggg caattagaag 13980
tttgtttgta tgagcaaaat ggtgagatcc aaaaacagtt tgttgttgga gacggtacgg 14040
gaataagcgt cgtggaattt tccccaggag atatacatag tgtcaaatgc ctgtcaccaa 14100
aagcccttat gttggagata aaggaggggc catttgaccc actcaaagct aaggcttttt 14160
ctaagtggtt atagggcgat acaccaccgt ttattcttct atcttattct atacatgctg 14220
ggttaccatc ttagcttctt caagccgcgc aaccccgcgg tgaccacccc tgacaggagt 14280
agctagcatt tgaccacccc tgacaggatt agctagcata tgagctcgag gatatctact 14340
gtgggtaccc gggatccgtg taggctggag ctgcttcgaa gttcctatac tttctagaga 14400
ataggaactt cggaatagga actaaggagg atattcatat 14440
<210> 10
<211> 19
<212> PRT
<213> Artificial Sequence
<220>
<223> example signal sequence for EPA carrier protein
<400> 10
Met Lys Lys Ile Trp Leu Ala Leu Ala Gly Leu Val Leu Ala Phe Ser
1 5 10 15
Ala Ser Ala
<210> 11
<211> 13043
<212> DNA
<213> Artificial Sequence
<220>
<223> example O1A rfb locus nucleotide sequence - O1A-EPA production
strain stGVXN4411 and stLMTB10217
<400> 11
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcgtgaagat acttgttact aggggcgcag gatttattgg ttctgctgta 1320
gttcgtcaca ttataaataa tacgcaggat agtgttgtta atgtcgataa attaacgtac 1380
gccggaaacc tggaatcact tgctgatgtt tctgactctg aacgctatgt ttttgaacat 1440
gcggatattt gcgatgctgc tgcaatggcg cggatttttg ctcagcatca gccggatgca 1500
gtgatgcacc tggctgctga aagccatgtg gatcgttcaa ttacaggccc tgcggcattt 1560
attgaaacca atattgttgg tacttatgtc cttttggaag cggctcgcaa ttactggtct 1620
gctcttgatg gcgacaagaa aaatagcttc cgttttcatc atatttctac tgacgaagtc 1680
tatggtgatt tgcctcatcc tgacgaagta aataataaag aacaattacc cctctttact 1740
gagacgacag cttacgcgcc tagtagtcct tattccgcat caaaagcatc cagcgatcat 1800
ttagtccgcg cgtggaaacg tacctatggt ttaccgacta ttgtgactaa ctgttcgaat 1860
aactacggtc cttatcactt tccggaaaaa ttgattccac tagtaattct taatgctctg 1920
gaaggtaagg cattacctat ttatggcaaa ggggatcaaa ttcgtgactg gctgtatgtt 1980
gaagatcatg cgcgtgcgtt atataccgta gttactgaag gtcaagcggg tgaaacctat 2040
aacattggcg gacacaacga aaagaaaaac atcgatgttg tgctgactat ttgtgatttg 2100
ttggacgaga tagtcccgaa agagaaatct tatcgtgagc aaattactta tgttgctgat 2160
cgcccagggc atgatcgccg ttatgcgatt gatgctgaga agattggtcg cgaattggga 2220
tggaaaccac aggaaacgtt tgagagtggg attcgtaaaa cggtggaatg gtatttggct 2280
aatgcaaaat gggttgataa tgtgaaaagt ggtgcctatc aatcgtggat tgaacagaac 2340
tatgagggcc gccagtaatg aatatcctcc tttttggcaa aacagggcag gtaggttggg 2400
aactacagcg tgctctggca cctctgggta atttgattgc tcttgatgtt cactccactg 2460
attactgtgg tgattttagt aaccctgaag gtgtggctga aacagtcaaa agaattcgac 2520
ctgatgttat tgttaatgct gcggctcaca ccgcagtaga taaggctgag tcagaacccg 2580
aatttgcaca attactcaat gcgactagcg ttgaatcaat tgcaaaagcg gcaaatgaag 2640
ttggggcttg ggtaattcat tactcaactg actacgtatt ccctggaaat ggcgacacgc 2700
catggctgga gatggatgca accgcaccgc taaatgttta cggtgaaacc aagttagctg 2760
gagaaaaagc attacaagag cattgtgcga agcacctaat tttccgtacc agctgggtct 2820
atgcaggtaa aggaaataat ttcgccaaaa cgatgttgcg tctggcaaaa gagcgtgaag 2880
aactagccgt tattaatgat cagtttggtg cgccaacagg tgctgaactg ctggctgatt 2940
gtacggcaca tgccattcgt gtcgcactga ataaaccgga tgtcgcaggc ttgtaccatt 3000
tggtagccag tggtaccaca acctggtacg attatgctgc gctggttttt gaagaggcgc 3060
gcaatgcagg cattcctctt gcactcaaca agctcaacgc agtaccaaca actgcctatc 3120
ctacaccagc tcgtcgtcca cataactctc gccttaatac agaaaaattt cagcagaatt 3180
ttgcgcttgt attgcctgac tggcaggttg gtgtgaaacg catgctcaac gaattattta 3240
cgactacagc aatttaatag tttttgcatc ttgttcgtga tggtggagca agatgaatta 3300
aaaggaatga tgaaatgaaa acgcgtaaag gtattatttt agcgggtggt tctggtactc 3360
gtctttatcc tgtgactatg gtcgtcagta aacagctatt acctatatat gataaaccga 3420
tgatctatta tccgctttct acactgatgt tagcgggtat tcgcgatatt ctgattatta 3480
gtacgccaca ggatactcct cgttttcaac aactgctggg tgacggtagc cagtggggcc 3540
tgaatcttca gtacaaagtg caaccgagtc cggatggtct tgcgcaggca tttattatcg 3600
gtgaagagtt tattggtggt gatgattgtg ctttggtact tggtgataat atcttctacg 3660
gtcacgacct gcctaagtta atggatgccg ctgttaacaa agaaagtggt gcaacggtat 3720
ttgcctatca cgttaatgat cctgaacgct atggtgtcgt tgagtttgat aaaaacggta 3780
cggcgatcag cctggaagaa aaaccgctac aaccaaaaag taattatgcg gtaaccgggc 3840
tttattttta tgataacgac gttgtcgaaa tggcgaaaaa tcttaagcct tctgcccgcg 3900
gtgaactgga aattaccgat attaaccgta tctatatgga acaagggcgt ttatctgttg 3960
ccatgatggg gcgtggttat gcgtggttag acacggggac acatcagagc ctgattgagg 4020
caagcaactt tattgcaaca attgaagagc gtcaggggct gaaagtttcc tgcccggaag 4080
aaattgctta ccgtaaaggg tttgttgatg ctgagcaggt gaaagtatta gctgaacctc 4140
tgaaaaaaaa tgcttatggt cagtatctgc tgaaaatgat taaaggttat taataaaatg 4200
aacgtaatta aaacagaaat tcctgatgta ctgatttttg aaccgaaagt ttttggtgat 4260
gagcgtggtt tcttttttga gagctttaac cagaaggttt ttgaggaagc tgtaggccgc 4320
aaagttgaat ttgttcagga taaccattcg aagtctagta aaggtgtttt acgcgggctg 4380
cattatcagt tggaacctta tgcacaagga aaattggtgc gttgcgttgt cggtgaagtt 4440
tttgacgtag ctgttgatat tcgtaaatcg tcatcgactt ttggcaaatg ggttggggtg 4500
aatttatctg ctgagaataa gcggcaattg tggattcctg agggatttgc acatggtttt 4560
ttagtgctga gtgagacggc ggagtttttg tataagacga caaattatta tcatcctcag 4620
agtgatagag gaataaaatg ggatgatcca agcatcaata tttcatggcc agtcgattca 4680
caagtgctgc tatcagctaa agataataag catcctccat taacaaagat tgaaatgtat 4740
agttaagatc acgataaatc ttggaagggt tgcaaaattg aataaaatag tgagcaaaag 4800
tgaaataagg aacgtaatcc acaatgctgg ctatatgatg attactcaga tagctttata 4860
tgttgcacca ttatttatac tgagttatct gttaaaaaca ctgggggttg cacagtttgg 4920
taattatgcc ttaatactat caatcgttgc atatttacag attataacgg attatggttt 4980
ttcttttagt gcaagtcgtg cgatctcaca gaatagagag gacaaagaat atatatcaaa 5040
aatttatctg tcaactatga ctatcaagtt ggcgatatgc gctttcttat tcttattgct 5100
catgctattt ttaaatcttt tgcctgtgca agctgaatta aaacaaggaa tattatatgg 5160
atatcttctt gtaataggaa atactttcca accacaatgg tttttccaag gtatcgaaaa 5220
attaaaaatc atagcccttt ctaatgttat atcaagatgc gccgcgtgtt tacttgtatt 5280
tatctatgtg aggaatagcg aggatttaca aaaagcactt ttagtacagt cacttccatt 5340
agtaatttct gcgattggat taaatatatt tatattgaaa tatatcaata ttatttttcc 5400
ggaaaaaaaa ttatttaagg taattttaaa agaaggtaag gatttttttc ttgcatcact 5460
ttattctgtt attctcaata atagtggcat ttttctatta gggattttta ctaatcctgt 5520
tattgttggt gtatatgccg ccgctgaaaa gatagtcaag gccgtattgt cgctatttac 5580
accactgacg caagctatat atccttataa ttgtcgtaag ttttcactat ccgtatttga 5640
cggcattgag gcagcaaaaa aaactggtat accaattata attttagcat ttatagctgc 5700
tgttatcgtt gcaattacct tacctgttgc aatcgactat cttaattttc caaaagaaac 5760
aatttttgta ggtcaaatat taagtgcatg gatctttttt ggtgttctta ataatgtatt 5820
cggcattcag atattgagtg catcaggaag aagtaaaata tatagtagga tggtattcgt 5880
atcagcgctt ataacattac ttttgattac tctattattg cagttttgta acgccactgg 5940
agtggcatgt gcaatattat tgggtgaaat gttcttatca atattgttac ttaagcgata 6000
taaaaaaata atttaaggaa tagttatgaa gaagttatta ttagtgttcg gtactaggcc 6060
tgaagcaata aagatggcct ctatcattga attattaaaa aaagattgta gattcgaata 6120
taaaatatgt gtgacaggcc aacataaaga gatgcttgat caagttatgc aagtatttga 6180
tgttaaacct gattataatt tacggattat gcagcctggg caaacattag tatctatagc 6240
aacaaatata ctctcacggt taagtgaagt tttaattata gaaaagccag atattatact 6300
tgtgcatggg gatacaacga ctacccttgc tgctacttta gctgggtatt accaccaaat 6360
aaaagtttgt catgtggaag caggattaag aacaggggat atttactctc cttggcctga 6420
agagggcaat cgtaaagtta caggggcatt agcatgtatt catttcgccc caacagagag 6480
atcaaaagat aatctcctga gggagggggt caaagtaaat aatatatttg taacgggtaa 6540
taccgtcatc gactctttat ttattgcaaa agatatcata gataatgacc ctaatataaa 6600
gaacgcttta cataataaat ttaattttct tgataaaagc cgacgagtag tacttataac 6660
aggtcatcga agagaaaatt tcgggaaagg ttttgaagat atatgctttg caataaagga 6720
attagctttc atttatccta atgtagattt tatttatccg gtgcatctta atcccaatgt 6780
aatggaacca gtacatcgta tattagataa tatatgtaat atttacctta ttgagccctt 6840
ggattatttg ccttttgttt atttaatgaa tgagtcatat ttaatattga ctgattcagg 6900
ggggatacaa gaagaagcgc cttcgttagg taaaccggtt ttggttatgc gtgatactac 6960
tgaacgccct gaggcggttg aggctggtac tgttgtatta gtggggactt ctaagataaa 7020
aatagtaaat aaagtaacgg agctattaaa caatgctgat atctacaatg ctatgtctct 7080
gttacataat ccatatggcg atggaacagc tgctcaaaaa attcttaatg tgctcgccca 7140
agagctaatt taatttaagc taaaaatatg ttattaatta ttgctgatta tccaaacgaa 7200
atgaatatgc gcgagggagc tatgcaacga atagatgcga tagactctct cattcgagat 7260
cgcaagcgag tgtatttgaa tatttcattc aaaaagcatc tagttcgctc aaatagttcc 7320
tttaataatg ttatagttga aaatctaaat gcaattattc acagaaacat cataaaacag 7380
tacatgcaaa aatcaacaac tatatatgtt cattctgttt ataatttatt aaaggttata 7440
acgctcattg atctaaaaaa aacaattctt gatatacatg gtgttgtacc ggaagaactt 7500
ttggcagata ataaaaaatt acttagtaaa gtatataaca tggtggaaaa aaaaggtgtc 7560
cttggatgca aaaaattaat acacgtcagt acagaaatgc aaaaacacta tgaagcaaaa 7620
tatggagtaa acttggctga aaggtcaata gtgctcccga tttttgaata taaaaatata 7680
acccaatcgc aaaacaaatg gacagaaaat aaaatacgaa gtatctatct tggaggatta 7740
caaacatggc aaaatattga taaaatgatt caagtttgtg atgacacagt gataaacaat 7800
gaagcaggta agtatgaatt caactttttc atcccacaga gtaacttgga agggtttata 7860
gataaatatt cgttaaaatt acataatatc aatgctaatg catctacgct atcacgtgat 7920
gaagtaattc cctttctaaa agaatgtcat attggttttg tattgcgcga tgatataata 7980
gtaaacagag ttgcgtgccc tacaaaattg gttgaatatt tagagtgtgg tgtcgttcca 8040
gttgtgctct ccccacttat aggtgatttt tattcgatgg gatatcaata cattactaca 8100
gaggaaatgg ctaacagaag tataagtttg ttggatcttg aaaaaatggc tgcacataat 8160
ttacaaattt tgacttctta tcagaagaga acctacaagg cacagaaaga acttattgct 8220
caactgtgct gaatttttta catatataaa attatgtaag catatcgcgg gtcaggtaat 8280
tgtatgcgta tcaaatataa agataacggt tatatattat gttttctatt atgtttcatt 8340
ttgagctact tagttttact caaatctgac tactttcctg ctgattttct gccatataca 8400
gaaatatacg atgggacata cggagaaatc aataatattg agcctgcctt tttatattta 8460
acacggttgt ttcattattt aaatttcccc tatatatttt ttgcaatgtt agtttgtgcc 8520
ttatgtttaa gttggaaaat aaaatatgca agaaaaataa ttaaagatag ttatatatat 8580
ttgttcttgt atgtatatgt atcattttat gtgtttttgc atgaaatgac tcaattgcgc 8640
atagcaattg cagtcactat gtgctatgtg tcggtttatt attactttta taaaaattgt 8700
attaaacatg cactgccatg gatggtgttg gctattttgt ttcattacag cgccttgctt 8760
ttatttatgt cattatttat atacagttat aggaggttat taatagtaat tatagggttt 8820
gtaatatgta tgagcttttt aaacgtgtat gcagatacaa ttgcactata tttgccaaat 8880
gaaaaaatag taaattattt atatagtatt tcatcatcat tagacaatag aaatgatttg 8940
gcaatattca acctgaataa tataatattt ttatcaatat ttattttgat cttttatctt 9000
agccgatata taaaattaaa tgataatgag gcgaagttta ttaagtatgt gcaatgttca 9060
ggaatattag ccttttgtat tttctttctg gctagtggag tcccggtcat tgcttatcga 9120
actgcagagt tgctgcgaat attttatccg atggctttag tattaatcct ttcgcatata 9180
aaaaataata atatgcgtta ttttattgca gtcattatag ttatcctttc aggcttaatg 9240
ttgtttataa cactaagggc tgtatcaata gttggtcaag gattataaaa tgaatgttgc 9300
tattttgttg tctacgtata atggcgaaaa atatttagag gaacaactgg attcattgct 9360
gcttcaaagt tatcaggatt ttgtagtgta tatccgtgat gacggatcat ctgatagaac 9420
tgtaaatata ataaaccaat acgtaatgaa agataacaga tttattaacg tgggtaattc 9480
agaaaatctt ggttgtgctg cttcgtttat taatttatta agaaatgctt cagccgatat 9540
ttatatgttt tgtgaccaag atgattattg gcttccgaat aaattacagc gtgctgtgga 9600
ttatttttcg gctattgatc ctttacaacc taccttgtat cattgcgatc taagcgttgt 9660
tgatgaaaaa cttaatatta tacaaaattc atttttgcag catcagaaaa tgtcagcgta 9720
tgattcaatg agaaaaaata atcttttcat acaaaatttt gttgttggtt gttcatgtgc 9780
tgttaatgct tcacttgcgg aatttgttct ttcgcgaatt ggagagcagc atgtaaaaat 9840
gatagctatg catgactggt ggttagccgt gactgcaaaa ctttttggtc gaatccattt 9900
tgataatact caaacgattc tttatcgaca acatcagggc aatgtattag gtgcaaaatc 9960
atcaggtatg atgcgtttta ttcgattagg attaaatggg caagggattt cgcgagtagt 10020
atcttttaga aaaaaagttt gtgcgcaaaa taagcttctt ttagatgtct atgataaaga 10080
tttaaatctt gagcaaaaaa aatctatcag gcttgtaatt gagggcctta aagagaactc 10140
ttcaattgct gaccttttaa aatgtttcta tcatggtagc tatatgcaag gttttaaacg 10200
taatcttgcc ttaatatatt cagttcttta cacaaaaaaa agaagatagt gtatccttat 10260
gaaaaaaatt gctattatcg gtactgttgg cataccagca tcatatggcg gatttgaaac 10320
attagttgaa aatttaacaa gatacaattc ctcgggagtt gaatataatg ttttttgttc 10380
atcgtttcac tacaaatccc accaaaaaaa acataatggg gcccgtttaa tttatattcc 10440
gcttaaagcc aatggatggc agagcattgc gtatgacata atttcgttag catattctat 10500
ttttttgaag cctgatgtga ttctgatttt aggggtttct ggttgttcat ttttgccttt 10560
cttcaaactc ttaacacgcg ctaagtttat tactaatatt gatggcctgg aatggcgaag 10620
agataaatgg aattcaaaag tgaaacgttt cttaaaattt tcagaaaaaa tcgcagttca 10680
atattcggat gtcgttatta cggataatga ggcaatttct gagtacgttt ttaacgagta 10740
taataaagat agccgagtta ttgcctatgg aggggatcat gcatggttaa atactgagga 10800
tgtatttaca acaagaaatt ataaaagcga ttactacctt tctgtatgtc gtatcgaacc 10860
cgaaaacaat gtagaattaa ttttaaaaac attttcaaag ctaaaatata aaataaaatt 10920
tattggaaat tggaatggca gcgagtttgg aaagaaactt aggctgcatt attctaacta 10980
tccaaatatt gaaatgattg atccgattta tgatcttcaa caattatttc acttacgaaa 11040
taattgcata ggatatatac atggtcattc ggctggagga acaaaccctt ctttagtcga 11100
ggcaatgcat tttagtaaac ctatatttgc atatgattgt aagtttaata ggtacactac 11160
tgaaaatgaa gcatgttatt tttctaatga atctgacctc gcagagaaaa tcataatgca 11220
ttgtgagcta tcattaggtg tctctggcac gaaaatgaaa gaaattgcta accagaaata 11280
cacttggaga cgaatagcag aaatgtatga ggattgctat taactctgtt aaacttcaaa 11340
tcttttacaa tatatggcat gactataagc gcattaattg tttttcaagc cgctctcgcg 11400
gtgaccaccc cctgacaggg gatccgtgta ggctggagct gcttcgaagt tcctatactt 11460
tctagagaat aggaacttcg gaataggaac taaggaggat attcatatgg ataaagccgt 11520
aagcatataa gcatggataa gctatttata ctttaataag tactttgtat acttatttgc 11580
gaacattcca ggccgcgagc attcagcgcg gtgatcacac ctgacaggag tatgtaatgt 11640
ccaagcaaca gatcggcgta gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca 11700
tcgaaagccg tggttatacc gtctctattt tcaaccgttc ccgtgagaag acggaagaag 11760
tgattgccga aaatccaggc aagaaactgg ttccttacta tacggtgaaa gagtttgtcg 11820
aatctctgga aacgcctcgt cgcatcctgt taatggtgaa agcaggtgca ggcacggatg 11880
ctgctattga ttccctcaaa ccatatctcg ataaaggaga catcatcatt gatggtggta 11940
acaccttctt ccaggacact attcgtcgta atcgtgagct ttcagcagag ggctttaact 12000
tcatcggtac cggtgtttct ggcggtgaag agggggcgct gaaaggtcct tctattatgc 12060
ctggtggcca gaaagaagcc tatgaattgg tagcaccgat cctgaccaaa atcgccgccg 12120
tagctgaaga cggtgaacca tgcgttacct atattggtgc cgatggcgca ggtcactatg 12180
tgaagatggt tcacaacggt attgaatacg gcgatatgca gctgattgct gaagcctatt 12240
ctctgcttaa aggtggcctg aacctcacca acgaagaact ggcgcagacc tttaccgagt 12300
ggaataacgg tgaactgagc agttacctga tcgacatcac caaagatatc ttcaccaaaa 12360
aagatgaaga cggtaactac ctggttgatg tgatcctgga tgaagcggct aacaaaggta 12420
ccggtaaatg gaccagccag agcgcgctgg atctcggcga accgctgtcg ctgattaccg 12480
agtctgtgtt tgcacgttat atctcttctc tgaaagatca gcgtgttgcc gcatctaaag 12540
ttctctctgg tccgcaagca cagccagcag gcgacaaggc tgagttcatc gaaaaagttc 12600
gtcgtgcgct gtatctgggc aaaatcgttt cttacgccca gggcttctct cagctgcgtg 12660
ctgcgtctga agagtacaac tgggatctga actacggcga aatcgcgaag attttccgtg 12720
ctggctgcat catccgtgcg cagttcctgc agaaaatcac cgatgcttat gccgaaaatc 12780
cacagatcgc taacctgttg ctggctccgt acttcaagca aattgccgat gactaccagc 12840
aggcgctgcg tgatgtcgtt gcttatgcag tacagaacgg tattccggtt ccgaccttct 12900
ccgcagcggt tgcctattac gacagctacc gtgctgctgt tctgcctgcg aacctgatcc 12960
aggcacagcg tgactatttt ggtgcgcata cttataagcg tatcgataaa gaaggtgtgt 13020
tccataccga atggctggat taa 13043
<210> 12
<211> 13790
<212> DNA
<213> Artificial Sequence
<220>
<223> example O2 rfb locus nucleotide sequence - O2-EPA production
strain stGVXN4906
<400> 12
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcatgga aacgtacgta tggtttaccg accattgtga ctaattgctc gaacaactat 1860
ggtccgtatc acttcccgga aaagcttatt ccattggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggggat caaattcgcg actggttgta tgtagaggat 1980
catgctcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggcggacaca acgaaaagaa aaacatcgat gttgtgctga ctatttgtga tttgttggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatta cttatgttgc tgatcgccca 2160
gggcatgatc gccgttatgc aattgatgcc gataaaatta gccgcgaatt gggctggaaa 2220
ccacaggaaa cgtttgagag cgggattcgc aaaacggtgg aatggtatct ggctaataca 2280
aattgggttg agaatgtgaa aagcggtgct tatcagtcat ggatcgaaca aaactatgag 2340
ggccgtcagt aatgaatatc ctgcttttcg gcaaaacagg gcaggtgggt tgggaactgc 2400
agcgtgctct ggcgccgctg ggtaatctga tcgctcttga tgttcactcc actaattatt 2460
gtggagattt cagcaacccc gaaggtgtgg cagaaaccgt caaaaaaatt cgtcctgacg 2520
ttattgttaa tgctgctgct cacactgcag tagataaagc agaatcagaa ccggatttcg 2580
cacaattact taacgcgaca agcgtcgaag cgattgcaaa agctgctaat gaagtcgggg 2640
cctgggttat acactactct actgattatg ttttcccagg cagtggtgac gcgccatggc 2700
tggaaacgga tgcaacagca ccgctaaatg tttacggtga aacaaaatta gctggggaaa 2760
aggcattaca agaacattgc gcaaagcatc ttattttccg taccagctgg gtatacgctg 2820
gtaaaggaaa taactttgct aaaacgatgt tgcgtttggc aaaagaacgc gaagaactgg 2880
ctgtgataaa cgatcagttt ggcgcaccaa caggtgctga attgctggct gattgcaccg 2940
ctcatgccat tcgcgtggca ttaaaaaaac cagaagtcgc tggcttgtac catctggtag 3000
caagtggcac aacaacctgg cacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
cagggattaa tcttgcactt aacaaactta acgccgtgcc aacaacggcc tatcccacac 3120
cagcccgtcg accccataac tctcgcctca atacagaaaa gtttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gtgggcgtga aacgtatgct caacgaatta tttacgacta 3240
cggcaattta acaaattttt gcatctcgct catgatgcca gagcgggatg aattaaaagg 3300
aatggtgaaa tgaaaacgcg taaaggtatt attctggctg gtggttccgg cactcgtctt 3360
tatcctgtga cgatggcagt gagtaaacaa ttgctgccga tttatgataa gccgatgatt 3420
tattatccgc tttcaacgct tatgttagcg ggtattcgcg atattcttat tattagtacg 3480
ccacaggata caccgcgttt ccaacaatta ttgggggacg ggagccagtg gggtcttaat 3540
ctacagtata aagtacaacc gagtccggat ggcctggcgc aagcgtttat tattggcgaa 3600
gactttattg gtggtgatga ttgtgcactc gtacttggcg ataatatctt ctatggacac 3660
gacttgccga aattgatgga agctgctgtt aacaaagaaa gcggtgcaac ggtatttgct 3720
tatcacgtta atgatcctga acgctatggt gtcgtggagt ttgataataa cggtacggca 3780
attagcctgg aagaaaaacc gctggagcca aaaagcaact atgcggttac tgggctttat 3840
ttctatgaca atgacgttgt ggaaatggct aaaaacctta agccttctgc ccgtggcgaa 3900
ctggaaatta ccgatattaa ccgtatttat atggaacaag gacgtttgtc tgtagccatg 3960
atggggcgtg gctatgcatg gttggataca gggacgcatc aaagccttat tgaagcaagt 4020
aacttcattg caacaattga agagcgtcag ggattaaagg tatcttgccc ggaagagatt 4080
gcttaccgta aagggtttat tgatgccgag caggtgaaag tattagccga accgcttatc 4140
aagaatcaat atggtcaata tttgctgaaa atgatcagcg aatagtatat gggaactcaa 4200
tgatggatat taaattaatc tctttgcaaa aacatgggga tgagcgcggt gcattaattg 4260
ctcttgaaga gcaacgaaat atacctttcg aagtcaaaag aatatattac atacttgaga 4320
ctcttaatgg agtaagacgc ggatttcatg cgcacaaggt tactcgtcag ttagctattg 4380
tagtcaaggg agcttgtaaa tttcatctgg ataatggtaa agaaacaaag caggtggaac 4440
ttaatgatcc aacaattgcg ttgctgatag aaccctatat atggcatgaa atgtatgatt 4500
ttagtgatga ttgtgtgctg cttgtaattg cggatgattt ctataaagag tctgattata 4560
tccgcaatta tgatgatttt attagaagag taaattcaat tgagaattca taagctaagt 4620
gacgtccaga caacatcaat tggtgatgga acaactatct ggcagtttgt tgtgatacta 4680
aaaggtgctg taattggtaa taattgcaac atctgtgcaa ataccttaat tgaaaataac 4740
gttgtaattg gtaacaatgt cacagtcaaa agcggtgtgt atatttggga tggcgttaaa 4800
atagaggata atgtttttat tggtccttgt gtagcattta caaatgataa gtatcctcgc 4860
tctaaagtct atcctgatga atttttgcaa acaataatac gcaaaggagc atcaataggt 4920
gctaacgcaa ccatcctgcc aggaattgaa attggtgaaa aagcaatcgt tggtgcgggg 4980
agtgttgtaa ccaaaaatgt accgccatgc gcaatagtag taggtaatcc agctcgattt 5040
attaaatggg tagaggataa tgaataaaat tgatttttta gatctttttg caattaacca 5100
gcgacagcac aaagaattag tctctgcgtt tagtagggtg ctagattctg gttggtatat 5160
catgggcgaa gaacttgagc agttcgagaa agagttcgca gaatactgtg gagttaagta 5220
ttgcattggt gtagcaaatg gccttgatgc gttgatacta gtattgaggg catggaaaga 5280
acttggctat cttgaagacg gtgacgaggt attagtaccg gcaaatacat atattgcttc 5340
tattcttgct ataacagaga acaaacttgt tcctgttctt gttgaaccag atatagaaac 5400
ttataatatt aatcctgctt taattgaaaa ttacattacg gaaaaaacta aagcaatatt 5460
accggttcac ttatatggtc tattgtgcaa tatgccagaa attagtgcaa tcgccagaaa 5520
atataatctg ttgattcttg aagattgtgc acaagcacat ggtgcaatac gtgatggtcg 5580
caaagctgga gcttgggggg atgctgcagg atttagtttt tatccaggaa aaaaccttgg 5640
agctttgggg gatgcgggag ctgttactac aaataatgca gaattatcct caactataaa 5700
agctttgcga aattatgggt cacataagaa atatgaaaat atttatcagg gattgaatag 5760
tcgattggat gaactgcaag cagccttatt gcgtgtaaaa atccatacat taccggaaga 5820
tactgcgatt cggcaaagga ttgctgaaaa atatattcgt gaaataaaaa accctgcgat 5880
tacgttacca gtgtacgaag gccaaggtgc gcatgtttgg catttatttg tagtaagaat 5940
cgctaatcgt gaaaaattcc agtcatactt attagagaag ggtatcaaaa ccttaattca 6000
ctatccatta ccaccccata agcagcaagc atatcaaaat atgtctagcc ttagccttcc 6060
aattactgag caaattcatg atgaagtcat ttctttacct ataagtccgg taatgagtga 6120
agatgatgtc aattatgtaa tcaaaatggt caatgattac aagtaatgaa aaaatttctt 6180
caggtaacta tattatccgc tatctataca ttcattaaaa tgattgcggg ttttatcatc 6240
ggtaaggtag tagcaattta tacagggcca tcaggggtag caatgcttgg ccaagtgcaa 6300
agtttaatca caatagttgc aggtactacc tctgcacctg taagcacagg ccttgttcga 6360
tatactgcgg aaaattggca agaaggacaa gaagcatgcg cgccatggtg gcgcgcatgc 6420
ttaagggtta ctctgttttt attcttgctt attattcccg ttgttattat attgtcgaaa 6480
aatattagtg agttactttt tagcgatgga caatacacat ggttaatcat tttcgcatgt 6540
tgtatattgc cattctccat tataaataca ttgatcgctt cagttttaaa tggtcaacaa 6600
ttttataagc aatatatatt ggttgggatg ttttctgtat tcatttctac tatgtttatg 6660
attttgttga ttgtagctta taatcttaaa ggtgcattga ttgccacagc tataaatagt 6720
gctattgctg gtcttgtatt ggttttattt tgtctcaata aatcttggtt tagatttaaa 6780
tattggtggg gtaaaacgga taaagacaaa attataaaaa ttattcatta tactctgatg 6840
gctctggttt ctgttatctc catgcctaca gcattgatgt gtattagaaa aatattgatt 6900
gctaaaactg gttgggagga tgcagggcaa tggcaggccg tatggaagat atctgaggtt 6960
tatcttggtg ttgtgacaat tgctttgtca acatatttct taccaagatt gacaattata 7020
aaaacaagtt tccttataaa aaaagaagta aatagtacta tattatacat aatatctatt 7080
acttcattca tggcgttgag tatctattta ttccgcgatt tggtaataac agttttattt 7140
actgaacagt ttcgctcagc tcgtgaatta tttttattac aacttatagg ggatgtaata 7200
aaaattgctg ggtttcttta tgcataccct cttcaaagtc aggggcatac taaactattc 7260
atcagttcag aagtgatttt ttctatgctc tttatcatta ccacctatat ttttgttgta 7320
aattatggag tacatggtgc taacataagt tatgtcatta catatagttt atattttgtg 7380
tttgcatttg tgtttactaa ttttattaat gttagaagaa ataattaaaa acagaggttg 7440
aattttgaaa ataattatac ctgtcttagg atttggcagg gctggtggtg aaagagttct 7500
ttctaagctg gcaactgaat tgatgaatta tggacatgat gtaagttttg ttgttccaga 7560
taatagaact aatccatatt atgctaccac agcaaaaatt gtcacgagta aatctagtca 7620
aaaccgtgta aaaatattga gaatcattaa aaattactat aatctgtggc gtaaatgcat 7680
agagttaaat cctgatgctg tagttgctag ttttcatttg actgcctatc ttgtcgcatt 7740
attaccaatc acccgtcgta agaaatatta ttatattcag gcgtatgaag ttaatttttt 7800
tgataatata atatggaaat taatagcggg tttaacatat tatttaccgc ttaaaaaaat 7860
actaaatagt cctaatttgc ttcctcataa acatgatgat tttataggag tagttcctgc 7920
aggagtagat ttaaacgttt tctatccgaa accatcaaat aggttattaa atggtcacac 7980
atcaataggg attattggta gaaaagagaa gcacaaagga actagcgaaa ttatttcagt 8040
attgtgttca ctggaaaata aagctggaat tataatcaat attgcgatct atcttgaaga 8100
agttgataag cagcgtttaa tcgctgccgg gtttcaggtt aatttttttc cgattacttc 8160
tgatttagaa ttggcatcct tttatcgaag caatgacatc atgattgctg ttgggttaat 8220
tgaagatggc gctttccatt atccttgtgc tgaatcaatg gcttgtggtt gtcttgttat 8280
ttcaaattat gcgccactta ctgaaactaa cagtgtactt aaattagtca agtttgatgc 8340
ttgcaaactt ggtgaagcaa ttaatctttg tctcaatctt gacctagaag aaaaaagcaa 8400
agaaatccaa tctaatattt ctgtgttgaa taaatatgac tggaaaattg ttggtgaaac 8460
tttcaatagt ttattgttag atgcaaataa atagtatacg ttgatgggga aaatatgaat 8520
attgttaaaa ctgatattcc agatctgatc gttcttgaac caaaagtgtt tagtgatgaa 8580
cgcggctttt ttatggagag ttataatcag attgaatttg agaaggcaat aggaaggcac 8640
gtaaattttg ttcaggataa tcattcaaaa tctagtaaag gcgtactacg tgggttgcat 8700
tatcaattag caccgtatgc acaggctaaa ttagttcgat gtgttgtagg tcaggtattt 8760
gatgttgctg ttgatcttag aaaaaattca ccaacgttca aaaaatggtt tggaataacc 8820
ctttccgcag aaaataaacg acaattatgg atacccgaag gatttgctca tggtttcttg 8880
gtgaccagtg atgaagctga gttcatttat aagacaacta actactatgc tcctggtcat 8940
cagcaagcaa ttatttacaa tgatcctatt ttaaacatcg attggccttt ctgcagtagt 9000
gctctgtcat tatcacaaaa agatcaagaa gcaaaattat tttcagaatt attggacagt 9060
gaactgttct aataaagtgt gccaccttat ccgtctgaag gataggtggt tgcttatatt 9120
tttttgagta tgtttgtata atgacagaaa atagtccgaa atataaacac gataaaagct 9180
taataagttt tatctactta ttttttatat ttacacttat tgtaggcttt attatcgcaa 9240
atacccagtt tttggggcga agtagagact atgataatta tatacagatc ttttctggta 9300
aagaagggga gggggttctt gaattatttt atcgcggatt gatgttaata acgaccagct 9360
atgaaactat catttttata attttaacat gttctttttt tataaaggca aggtttctcg 9420
ctaactattc gcgtaatttt tcaggcttga ccttattctt tatttattat gcaagcgttg 9480
cactttgggt tttagattat actcaattca gaaatggtct atgtatttcc attttaatgt 9540
tttccgtata ctatttattt ataaataaac cgacttattt ttatttctcg gtattatgtg 9600
caattgcaac tcattggtct gctttgcctt ttttgctttt atatcctttt gtctattcaa 9660
caaaaataag acgccttggt tatttttgtt tcagtattct tgttttgatt gcgatctcag 9720
gagaaggaaa agagatcata tcttttataa gaaattttgg agtgggacaa aaaataggaa 9780
atgaagctgg tgtaaattta ataaattcat tatcccttac cgctatttcc tggtttatta 9840
ttagttacat atcaagcatt ggaaatgaaa ggagaaattt aaggcttttc ttttgttatg 9900
gtgtcatgca atacgtgact tttagccttt tctctctacc tgttatggct ttccgtattt 9960
tggaaatgta ttttttcctt atgctaacca ttggggtgtt tattaagcaa aaaaagaatt 10020
attattttat tttttgcaaa gtgttaattt tattgtatct aacatactat tatcatatgg 10080
tctttggagt gattaatgtg taaggctaag gtgttggcta taattgttac ttacaacccg 10140
gaaattattc gattgacgga atgtattaac tctttagccc cacaagttga gagaataatt 10200
cttgtagata atggctcaaa taatagtgat ttgataaaaa atatcagtat taataacctt 10260
gaaattattt tactttcgga aaacaaaggc attgcatttg ctcagaacca tggtgttaag 10320
aagggcctgg aagcaaaaga gtttgactat ttatttttct cagatcagga tacttgcttt 10380
cctagcgatg ttattgaaaa acttaagagt acatttacga aaaataataa aaaaggtaaa 10440
aatgttgctt gtgcttctcc tttttttaaa gaccatcgtt caaattatat gcatccgtca 10500
gtcagcctaa atatttttac gagtacaaaa gttatatgta gtgaagtaga cgatgatctt 10560
tatccctcgc atgttattgc ttctgggatg ttaatgtctc gtgaagcatg gcgcgtcgtc 10620
ggaccatttt gtgaaaaact ctttatagac tgggttgata cagaatggtg ttggcgtgca 10680
ttagctaata atatgattat tgttcagaca ccatcagtca tcatttctca tgaacttggg 10740
tatgggcaga aaatttttgc tggtcgatct gttacaatac ataattcttt cagaaatttt 10800
tataaaatac gcaatgcaat atacttaatg ctgcattcaa attatagctt caagtatcgt 10860
tatcatgctt tttttcatgc gacaaagaat gttgtatttg aaattttata ttcgaaagaa 10920
aaattaaatt cactgaaggt ttgttttaaa gctgtacgtg atggtatgtt caataatttt 10980
taatacgaaa atagttaggc tcaaggtgtt taaatggaag aaaataatat gaagacggtc 11040
gctgtagttg gcacagtggg tgttcctgct tgttatggtg ggttcgaatc acttgttcag 11100
aatctaattg attatcaatc tgatggtata caatatcaga tattttgctc ttcaaaaaaa 11160
tatgataaaa aatttaaaaa ttataaaaat gcagaattaa tctatttgcc gataaatgcc 11220
aatggcgtct ctagcataat ttatgatatt atgtgtttaa ttatttgttt attcaaaagg 11280
ccagatgttg ttttaatatt gggggtgtct ggttgtttat ttctaccaat ttataaacta 11340
ttttcaaaat caaagattat tgtcaatatt gatgggcttg aatggcgtag aaataaatgg 11400
ggaacgtttg ctaagaaatt tcttaaaata tctgaggcga tatctattag aatagctgat 11460
attatcattt cagataatca agcaatagct gattatgtgg aaaataagta caagaaaaaa 11520
agtgtagtta tagcttatgg cggagatcat gccactaatc ttagtacacc gatagacaat 11580
gatcaaaaaa aagaaggtta ttatttgggg ctttgtagga tagagcctga gaataatata 11640
gaaatgattc tgaatgcctt cattaataca gataaaaaaa ttaaatttat gggtaattgg 11700
gataacagcg agtatggacg ccagctaaaa aaatattatt caaactatcc aaatatcacc 11760
ctactagaac ctaactataa tattgaagag ctttataaac taagaaaaaa ttgtcttgca 11820
tacattcatg gacactcggc tggtggaaca aacccttctt tagttgaagc gatgcatttt 11880
aatattccta tttttgcttt cgattgtgac tttaatcgtt acacaactaa caatttagct 11940
cattacttta atgattctga acaacttagc ttattagcag aaagtttgtc ttttggaaat 12000
cttaaatgtc gagtattaga tttaaaaaat tatgctgaag atatgtataa ctggaggcat 12060
atagctgcta tgtatgaatc tatttattaa acgcattaac aataatataa ttgaccttat 12120
atagcaggga aagatcacgt aacgctgcgg cgcgccgatc cccatatgaa tatcctcctt 12180
agttcctatt ccgaagttcc tattctttct agagaatagg aacttcggaa taggaactaa 12240
ggaggatatt catatggata aagccgtaag catataagca tggataagct atttatactt 12300
taataagtac tttgtatact tatttgcgaa cattccaggc cgcgagcatt cagcgcggtg 12360
atcacacctg acaggagtat gtaatgtcca agcaacagat cggcgtagtc ggtatggcag 12420
tgatgggacg caaccttgcg ctcaacatcg aaagccgtgg ttataccgtc tctattttca 12480
accgttcccg tgagaagacg gaagaagtga ttgccgaaaa tccaggcaag aaactggttc 12540
cttactatac ggtgaaagag tttgtcgaat ctctggaaac gcctcgtcgc atcctgttaa 12600
tggtgaaagc aggtgcaggc acggatgctg ctattgattc cctcaaacca tatctcgata 12660
aaggagacat catcattgat ggtggtaaca ccttcttcca ggacactatt cgtcgtaatc 12720
gtgagctttc agcagagggc tttaacttca tcggtaccgg tgtttctggc ggtgaagagg 12780
gggcgctgaa aggtccttct attatgcctg gtggccagaa agaagcctat gaattggtag 12840
caccgatcct gaccaaaatc gccgccgtag ctgaagacgg tgaaccatgc gttacctata 12900
ttggtgccga tggcgcaggt cactatgtga agatggttca caacggtatt gaatacggcg 12960
atatgcagct gattgctgaa gcctattctc tgcttaaagg tggcctgaac ctcaccaacg 13020
aagaactggc gcagaccttt accgagtgga ataacggtga actgagcagt tacctgatcg 13080
acatcaccaa agatatcttc accaaaaaag atgaagacgg taactacctg gttgatgtga 13140
tcctggatga agcggctaac aaaggtaccg gtaaatggac cagccagagc gcgctggatc 13200
tcggcgaacc gctgtcgctg attaccgagt ctgtgtttgc acgttatatc tcttctctga 13260
aagatcagcg tgttgccgca tctaaagttc tctctggtcc gcaagcacag ccagcaggcg 13320
acaaggctga gttcatcgaa aaagttcgtc gtgcgctgta tctgggcaaa atcgtttctt 13380
acgcccaggg cttctctcag ctgcgtgctg cgtctgaaga gtacaactgg gatctgaact 13440
acggcgaaat cgcgaagatt ttccgtgctg gctgcatcat ccgtgcgcag ttcctgcaga 13500
aaatcaccga tgcttatgcc gaaaatccac agatcgctaa cctgttgctg gctccgtact 13560
tcaagcaaat tgccgatgac taccagcagg cgctgcgtga tgtcgttgct tatgcagtac 13620
agaacggtat tccggttccg accttctccg cagcggttgc ctattacgac agctaccgtg 13680
ctgctgttct gcctgcgaac ctgatccagg cacagcgtga ctattttggt gcgcatactt 13740
ataagcgtat cgataaagaa ggtgtgttcc ataccgaatg gctggattaa 13790
<210> 13
<211> 13777
<212> DNA
<213> Artificial Sequence
<220>
<223> example O6A rfb locus nucleotide sequence - O6A-EPA production
strain stGVXN4112 and stLMTB10923
<400> 13
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatttgcc cgccgggcgt gacaattatg 300
aacgtgcgtc agggcgaacc tttaggtttg ggccactcca ttttatgtgc acgacctgcc 360
attggtgaca atccatttgt cgtggtgctg ccagacgttg tgatcgacga cgccagcgcc 420
gacccgctgc gctacaacct tgctgccatg attgcgcgct tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actctgtcat ccagaccaaa 540
gagccgctgg accgcgaagg taaagtcagc cgcattgttg aattcatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgttggtc gctatgtgct ttctgccgat 660
atttggccgg aacttgaacg cactcagcct ggtgcatggg ggcgtattca gctgactgat 720
gccattgccg aactggcgaa aaaacagtcc gttgatgcca tgctgatgac cggcgacagc 780
tacgactgcg gtaaaaaaat gggttatatg caagcgttcg tgaagtatgg actacgcaac 840
ctcaaagaag gggcgaagtt ccgtaaaggg attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaagatt agcggcgaaa 960
gtaatttgtt gcgaattttc ctgccgttgt tttatataaa caatcagaat aacaacgact 1020
tagcaatagg attttcgtca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcatttgaat tttacgggtt tagcgcgagt gggtaacgct cgtcacatcg 1140
tagacatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gctgaaatta 1200
taaagtcatt cttatagaac atcgcatttc aataatataa ttacacctaa atgaatagga 1260
tacaacgtgt gcacaattat ttaaggctta aagataaaat aaaaaacgta tttttagggt 1320
tgtatatatt gcagttattt aattatatcg cgccattggt aattatccct atcctgataa 1380
aatatattgg gttgggggaa tatggggaat tggtctatat tacatctatt tatcaaatag 1440
tggctttgat tattgatttt ggctttactt acacaggacc tgtggttgct gcgagacata 1500
gatgtgagac ccaaaattta cagcgctatt actcaatagt tgttctttta aaatcattgc 1560
tttttataat tgcattaaca tgtgtatttt tattgtgcag attaaatata gtccacttgt 1620
cattttttgg gtttttgtca atttttctat gcactattgg taatatatta tcgcccaatt 1680
ggtttttgca ggggattggt gattttaaaa aactttcata ctcacaagta atagtgagaa 1740
taacattgtt tatcatactt cttgtttatg tctgtagtgg cggagataat gtttttatcc 1800
taagtttttt gcaaaatgca acattactca tatgctgtat atacttatgg ccaaatattc 1860
atattagcca tgttgttcat cttaaaccta atgaatgcat tgtggaattt aagaaggcag 1920
gaaatgtttt tattggcgta ataggtacga ttggttacaa tggtctaatt cctgtgttaa 1980
ttggaaacct ttgcggtaat acgagtcttg gtgttttttc aatcgttcaa aaaatgacaa 2040
cagcatgtca aagtctaatt aatccaatat cacagtatat gttatctcaa gtttcagaaa 2100
ttaaacctca agataaactg ttttattata gaattaaaaa aagttttttt gtgcatttaa 2160
caattagcat aattgcatgt ttatgttata tggggttagg gcaatatgtg gcgactttta 2220
taggtaaagt tgacgtttca tttgttatta ttttatttgc gtcaataatt accatttttt 2280
catctttaaa taatgtcctt ggtatacagt ttcttatacc gacagataat gtaaaaatac 2340
tacgaagtat aaatgttatg gcgggaatta ttgttgttag tttgtcctgg ctgttaatat 2400
cacgctttga cattctgggg ggggttttat taaacctaat tggtgagttt cttgtattca 2460
gtatgctagc ttttattgcc catcgaaagt ggggagcgag agtataatga aagtgaaggc 2520
ggttcctgct attacattct atttaagttt aatgctgaca attttagtgt tactgtttgg 2580
taatgaacca aataaatcac aatatatcct tgttatagca acgataacag ttttttatat 2640
cgcatatatc actaataaaa taacttctcc ggccagcctt ctcgttatat catcttttgt 2700
gtttttaggt tgtcgccctt tattatcttt gtttgcaaac tatgattata ggattgccga 2760
ttggtttatt gaaggatata tggatgacga tgtgattttg gctaactatg ctataacact 2820
aatgtattat ggttatacat tgggactaat tctatgcaaa aatactgaaa aattttatcc 2880
gcatggtcct tatcctgaaa aacaattgct aaaaataaag tttcttttga ctttattttt 2940
tctgggttcg ataggtatgg ttgtaaaagg gatattcttt tttaacttta tagaatctaa 3000
tagttatgtt gatatttatc aatcaaatat aacaacgcca ataggttatg attttctatc 3060
ttatttattt tattgttctt ttttccttat atgtgcgttt catatacagt tcagaacaaa 3120
taaaaaattt ctttttattg cgatatgcat tgctgcattt agcaccttga agggtagtcg 3180
tagtgaagct ataacgtttc ttttaacggt tacatgtata tattttaatg aagtaaagac 3240
aagaaactta cgtctgctga ttacaatgat ttttgttttt agcgtcattt ttgtgattag 3300
tgaatttatc tcaatgtggc gcactggagg gagttttttt caattaatgc agggtaataa 3360
tcctgttata aactttgtat acggcatggg agtatcatat ctttccattt atcaatcagt 3420
aaaactacaa ctattgtcag ggggatataa tgttacctat ctattcagcc agttaataat 3480
aacttgctcg tcaatattta atgtcaaatt gagcttgccg gaaataagct atagccattt 3540
ggcctcatac acagcaaacc cagaactata taatcttggg ttcggacttg gggggagtta 3600
tttagcagaa tcgtttttag catttggtct gattggatgt ttcattatac cctttttact 3660
tttacttaat ttaaatgtat tggaaaaata tacaaaaaac aaaccaatta tatattttgt 3720
ttattatagt gtgttgccac ctatattatt cacaccaaga gagactttgt tctatttctt 3780
cccctatctt gtcaaaagta tatttgttgc ttttttagtt acattataca tccagtataa 3840
aaaggattga ccaaaatgtc agaaaaaaat gtcagcataa taatcccaag ttataacagg 3900
gctcatattc ttaaggaggt cataccaagt tattttcagg atgagacttt agaggttata 3960
gttatcaatg atggatcaac agataataca aatagtgtat tagctgaact gaaggaaaaa 4020
tattctcagt tagttatttt agaaaatgaa acgaataaaa aacagatgta ttctaaaaac 4080
cgagggattg aaatagccaa agggaaatat attttttttg gtgatgatga ctcttacctc 4140
ttacccggtg ttatatctcg gttattggct acaaaatatg agacaggcgc tgatgtaatc 4200
ggcgcaagaa tactttatat gaataataac gagaaaacaa ttgaagattg cataaatcga 4260
cataaaaaag aggggcgttt tgttagtgat ctaaatagat tggattttag ttatacatgt 4320
gatttggacc atccgattga atgtttttat gcacagcctt ttgttctagc tgaaagggaa 4380
ctaatatcga aatatcgatt tgatatatct tatacgggaa actgctatcg tgaggaaact 4440
gatttcatgc tatctctatt tattaaaaat aaaaaattta tatatgattc aaaggctttg 4500
ttaataaatt tacctccaag aaaagcgacg ggaggggcaa gaacagctaa tcgattaaaa 4560
tatcattacg aaagttgcat aaataattat agatttttaa aaaaatataa tgataatttg 4620
aatcttcttt caggacaaaa gcatgctata ttttaccgac agtgtcaatt cgttctgcta 4680
aaaatgaagt cgtttatcgg gaagttttta aaatgattat atatatcgcc gcgtataatg 4740
gttcaggagg gcaaggtggg gtggaaaggg ttgttgccca acaatgtaac attcttaaaa 4800
atttgggggt taaagtcatt atacttgata aaacatactt caaaatttct aacaaaattc 4860
gtaacaaaaa aatacaagta gcactttatc caatattagt ttctctttat ttaaccttac 4920
aaaaattacg tggcgtgacg tttaaagtta ttgcacatgg ctattgttct cctttttata 4980
ggaatgacat cttaatagct catggcaata tgaaatgtta ttttcaaaca gtcatgaata 5040
aaaaacctaa tcggttgtct ggcagtggtc ttttatcttt ctatgagcgt tgggctggag 5100
cattttcaaa aaatatctgg gctgtttcaa ataaggttaa aagtgaatgg aatgagcttt 5160
acaatattaa ttcacataaa atcaaagttg ttcgaaattt tataaatctt gcacaatttg 5220
attacactga tgttaatgaa gcagaatatg tgacatttgt cgggcgattg gaaaaaggaa 5280
aaggaataga tgatctgtat tacatatgta aaaatctgcc agatacttcc ttccatttag 5340
tttcaagtat tcccgcccca caaaattttg cttcgctaaa taatgttctg accagcattg 5400
ctgtccccta tgcgaaaatg ccagaaatat ttaagaaatc cagagtactt attttaccgt 5460
cctattatga aggatatgag ctggttacta ttgaagcgct atgctgtggt tgccctgtga 5520
taggctataa tgttggtgca attagagagt tgtatgcaga aagttttcct ggcgtattta 5580
ttgccaataa taaagaagat ttagcacaag tagcctacaa attaattagt cttgataatg 5640
aaaaatatta tcatttgaga caaactattt atagcaagcg tgagcttttt tctgaagaga 5700
gatatgcgga aattttaacg gcggcattta atgaaaaaaa ataagaaact ctgtctcatt 5760
tcaattaact catataatga acttaccgga ggaggagtat atttacgtac gcttgttagt 5820
tttctacaaa aacagaatgt taatttaaca cttattgata aaaaatcctc aggtaaacta 5880
ttcgaagaca atacttttca acatatatca tttattaaag gtaaacgtca ggatataata 5940
tccaggcttt tttttatacc atcattttat gtcccttata ttttctcaat aattaaaatt 6000
ttacggaagc aagatattct tgcttttcac aactctcggc ttggattgtt atgtctgctt 6060
tttagaatac tcatgcccca caaaaagatc atattgttta cggataactt cgaatatgac 6120
ttaataagac aaaaagataa aaacataact acttttattg aaaaattaat tgtttatctc 6180
aatgaattta tcgggcttaa gaattcagat ttagttagct atattacccg gcaagataaa 6240
aatgcaatgg ataaatttta tgggattaaa aaaagcagaa atttaattct ccctgtgata 6300
tttagtagag aaaaaccaac tgatgtattg tcagctcact ttattaatga gtataatcga 6360
ttgaataatg ataataggaa aaaagtagta tttactgcat cttttgattt ttttccaaat 6420
atagatgctg ccaactatgt tttaaatgca gcaaagtcta ataatgatta ttgctatatt 6480
ttggcaggta ggaaaagtac tactttgaat cttcctgatt tggataattt attttttttc 6540
gataatctat ctaatagtga aatgtcatat ttattatctg cttgtgatgt tttttattct 6600
cctatagttt taggaagtgg aatgaaaaca aaaattgcag aagcactatc atatggatta 6660
tatatttatg cgacagagca ttccttaatc ggctatgatg aaattataca caataaggag 6720
tgtgttaaaa aaatctcaca tttggatgag gaatttccta aagatttcaa gatgaaaagt 6780
atcaataaac agctaataat gtcttatcag caaaaatatt attcacatta tcggtttaat 6840
ggccatgaac ttgatataat aaattttgac gattagttag tggagatata atatgaacat 6900
attagtaact ggtggtgctg gatatatcgg atctcatacg gctattgaat tactgaatgc 6960
aggtcatgag attatcgttc tggacaattt cagtaatgct tcatacaagt gtatcgaaaa 7020
aataaaagaa attactcgac gtgattttat aacaattact ggagatgctg ggtgtaggaa 7080
gacactctcc gctattttcg agaaacacgc catagatata gttattcatt ttgctggctt 7140
taaatctgtt tcagagtcta aaagtgaacc cttaaagtat taccagaata atgttggagt 7200
gaccattact ttattacagg taatggaaga gtacagaatt aaaaaattta tctttagttc 7260
atctgcgaca gtctatggtg aaccagagat aattccaatt ccagaaacag ctaaaattgg 7320
aggaactacg aatccatatg gcacatcgaa gtattttgtt gaaaaaattc tagaggatgt 7380
tagttccacg ggaaaactgg atataatttg cttgagatat tttaatcctg tcggtgctca 7440
ttctagtggt aaaataggtg aggctccatc tggtatccct aataatcttg ttccttattt 7500
attggatgtt gcgagtggta aacgtgataa attatttatt tatggcaatg attaccctac 7560
taatgatgga acaggtgtaa gggattttat tcatgttgtt gacttagcga aaggtcattt 7620
ggctgcaatg aattatttaa gtatcaattc gggatataat atctttaatc ttggtacagg 7680
aaaaggttat tcggtacttg aattaatcac tacatttgaa aaattaacaa acattaaggt 7740
caataaatct tttatagaga gaagggcagg ggatgttgcg tcttgttggg ctgatgcaga 7800
taaagctaat tctttattgg actggcaagc cgaacaaact ctagaacaga tgttattgga 7860
ctcgtggcgt tggaaaaaaa attatccaga cggattctga atataaaagg tttcagtttt 7920
atgaatcaat cagagcagag aaaaaaaata ctggttctta cacctcgctt tccctaccct 7980
gtcattggag gggatagatt aagagtctat atgttatgta aagaactttc caaaaaatat 8040
gatcttattc ttctgagctt atgtgatcaa ccactagaac ttgaaataaa tataaatgac 8100
tcggtcttca aagaaattca tcgtgtctat ctaccaaaat ataaatcata ttataatgta 8160
ttaaaagctt tggttacgca aaaaccgttg caaattgctt attatcaatc ggacacattt 8220
aagaataaat acaataaatt aattaaacaa tgcgatgcag tattttgtca tctgataaga 8280
gttgctgatt atgttaagga tacagacaag ttcaaaattc ttgatatgac agatgcaata 8340
tctttgaatt acagtcgcgt taaaaaatta gcaagtaaaa aaagtttgcg tgcaattatt 8400
tattctctgg aacaaaaaag attagaatca tatgaacgtt ctgtggcgaa tctttttgat 8460
ttgaccactt ttatttcatc cgtagaccgt gactatctct accctaatct gggcagtaat 8520
atccatatag tcaataatgg ggttgataca tcagccttga gatatataaa aagagaaata 8580
aaaatcgata agcctgtgga acttatattt atcggaaata tgtattcttt acaaaatatg 8640
gatgctgcaa aacattttgc taagaatatt ttaccttgct tgtatgatga gtttaatatt 8700
atttttaaag tgattggtaa gatctcagaa actaataaaa atatattaaa ttcatttaaa 8760
aatacaattg ctttaggtac tgttgatgat atcaattctt ccgcttctac agggcatata 8820
ggtatatgtc ctgttcgtct tggagcaggc gtacaaaata aaattcttga atacatggct 8880
ttaggtttac catgtattac atctagcatt ggttatgaag gtattaatgc aaaatcaggt 8940
agcgaaattt ttgttgcaga tacagtagag caatataaaa acgtactaag agaaataatt 9000
tacgattata atcgttatac tgaagtggct gaaaatgccc gtagttttgt agaaaataat 9060
ttttcttggg aatcaaaagt tgccaattta atgaatacat tagatgagaa attatatgaa 9120
caataataaa attattacac ctatcattat ggctggtggt tcaggcagtc ggttgtggcc 9180
actatcaaga attctctatc cgaaacaatt tcttagccta atcggtagtc ataccatgct 9240
tcaaacaacg gctaatcgtc tggatggttt ggattgtacc aacccttatg tcatttgtaa 9300
tgaacaatac cgctttatag ttgctgaaca gcttagaaaa atcgatagat tgacttcaaa 9360
gaatatcatc cttgagcctg ttgggcgtaa cactgcccct gcaattgcat tagcggcgtt 9420
gctgatgtct aagtctgata aaagtgcaga tgatcttatg ctcgtactgg ctgcagatca 9480
cgttatacac gatgaagaaa aattttgtaa cgctgttaga tcggcaattc catacgctgc 9540
tgatgggaaa ttggtaacat ttggtataat tccagacaaa gcagaaactg gttatggtta 9600
tatacatcga ggacaatata ttaatcagga agattcggat gcatttatag tgtcatcatt 9660
tgttgaaaag ccaaatcatg agacagccac taaatatctt gcttccggtg agtattattg 9720
gaatagcggt atgtttttgt ttagtgcaaa tcgttatata gaggaactta aacaatttcg 9780
gcctgatatt ttatccgctt gtgaaaaagc aattgcttca gcgaactttg accttgattt 9840
tgtgcgttta gatgaaagtt ctttctctaa gtgccctgaa gaatcaattg attacgctgt 9900
aatggaaaaa acaaaagacg caattgttat tccaatggat gctggctgga gtgatgtcgg 9960
ttcatggtct tctctttggg aaattaatga taaagactca gacggcaacg taatagttgg 10020
ggatattttc tctcatgaaa caaagaattc tttcatatat gccgaatcgg gaattgttgc 10080
tacagttgga gtggaaaatt tagttgttgt ccaaacaaag gatgctgttc ttgtctcaga 10140
gagaaataaa gttcaggatg taaagaaaat agtagaacaa attaaaaatt caggtcgtag 10200
cgagcattat gttcatcgcg aagtatatcg tccttggggt aaatatgatt ccattgacac 10260
aggggagcgt tatcaggtca aacgtataac agtaaatcct ggtgaaggac tttctttaca 10320
aatgcaccat catagggcag aacattggat catagtttct ggaactgcaa gggtgactat 10380
aggttctgaa actaagattc ttagcgaaaa tgaatctgtt tacatacctc ttggtgtaat 10440
acactgcttg gaaaatccag ggaaaattcc tcttgattta attgaagttc gttctggatc 10500
ttatttagaa gaagacgatg ttatccgttt tcaggaccga tatggtcgta gctaaatttt 10560
tgataatgta acgttagtag aagagcgcta atatttttag ttaatctgta ataagtatta 10620
tttgtttaag gtatatcatg tcgagtttac cctgctttaa agcctatgat attcgcggga 10680
aattaggcga agaactgaat gaagatattg cctggcgcat tggtcgcgct tatggcgaat 10740
ttctcaaacc gaaaaccatt gtgttaggcg gtgacgtccg actcaccagc gaaaccttaa 10800
aactggcgct ggcgaagggg ttacaggatg cgggcgtcga tgtgctggat attggcatgt 10860
ccggcaccga agagatctat ttcgccacgt tccatctcgg cgtggatggc ggcatcgaag 10920
ttaccgccag ccataacccg atggattaca acggcatgaa actggtgcgc gaaggggctc 10980
gcccgatcag cggtgatacc ggactgcgcg acatccagcg tctggcagaa gccaacgact 11040
ttcctcccgt tgatgaaacc aaacgcggtc gctatcagca aatcaatctg cgtgacgctt 11100
acgttgatca cctgttcggt tatatcaacg tcaaaaacct cacgccgctc aagctggtga 11160
ttaactccgg gaacggcgcg gcgggtccgg tggtggacgc cattgaagcc cgctttaaag 11220
ccctcggcgc acccgtggaa ttaatcaaag tgcacaacac gccggacggc aatttcccca 11280
acggtattcc taacccgcta ctgccggaat gtcgcgacga cacccgcaat gcggtcatca 11340
aacacggcgc ggatatgggc attgcctttg atggcgattt tgaccgctgt ttcctgtttg 11400
acgaaaaagg gcagtttatt gagggctact acattgtcgg cctgctggca gaagcgttcc 11460
tcgaaaaaaa tcccggcgcg aagatcatcc acgatccacg tctctcctgg aacaccgttg 11520
atgtggtgac tgccgcaggc ggcaccccgg taatgtcgaa aaccggacac gcctttatta 11580
aagaacgtat gcgcaaggaa gacgctatct acggtggcga aatgagcgcc caccattact 11640
tccgtgattt cgcttactgc gacagcggca tgatcccgtg gctgctggtc gccgaactgg 11700
tgtgcctgaa aggaaaaacg ctgggcgaac tggtgcgcga ccggatggca gcgtttccgg 11760
caagcggtga gatcaacagc aaactggcac accccgttga ggcgattaac cgcgtggaac 11820
agcactttag ccgcgaggcg ctggcggtgg atcgcaccga tggcatcagc atgacctttg 11880
ccgactggcg ctttaacctg cgctcctcta acaccgaacc ggtggtgcgg ttgaatgtgg 11940
aatcgcgcgg cgatgtaccg ctgatggaag aaaagacaaa acttatcctt gagttactga 12000
acaagtaatt cagtaatttc atataaatgg gttttaaaaa acggaaaaga tgagatatcc 12060
ggtgtggtat atccaaggta atgctattca gtatctctat gagtgagtta acatctatac 12120
cacatttaag ccgcacactt cgggatcccc atatgaatat cctccttagt tcctattccg 12180
aagttcctat tctttctaga gaataggaac ttcggaatag gaactaagga ggatattcat 12240
atggataaag ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt 12300
gtatacttat ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca 12360
ggagtatgta atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa 12420
ccttgcgctc aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga 12480
gaagacggaa gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt 12540
gaaagagttt gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg 12600
tgcaggcacg gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat 12660
cattgatggt ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc 12720
agagggcttt aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg 12780
tccttctatt atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac 12840
caaaatcgcc gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg 12900
cgcaggtcac tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat 12960
tgctgaagcc tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca 13020
gacctttacc gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga 13080
tatcttcacc aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc 13140
ggctaacaaa ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct 13200
gtcgctgatt accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt 13260
tgccgcatct aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt 13320
catcgaaaaa gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt 13380
ctctcagctg cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc 13440
gaagattttc cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc 13500
ttatgccgaa aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc 13560
cgatgactac cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc 13620
ggttccgacc ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc 13680
tgcgaacctg atccaggcac agcgtgacta ttttggtgcg catacttata agcgtatcga 13740
taaagaaggt gtgttccata ccgaatggct ggattaa 13777
<210> 14
<211> 15027
<212> DNA
<213> Artificial Sequence
<220>
<223> example O8 rfb locus nucleotide sequence - O8-EPA production
strain stLMTB11734
<400> 14
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcgatcgctt aagatctagg atttcattat gttacttcct gtaattatgg 1320
ctggtggtac cggcagtcgt ctctggccga tgtcacgcga gctttatccg aaacagttcc 1380
tccgcctgtt cgggcagaac tccatgctgc aggaaaccat cacccgactc tcgggccttg 1440
aaatccatga accgatggtc atctgtaacg aagagcaccg cttcctggtg gctgaacagc 1500
tacgccagct caataagctg tcgaataata ttattcttga gccggtcggg cgcaacaccg 1560
ccccggccat cgccctggca gcccttcagg ccacccgcga cggcgacgac ccgctgatgc 1620
tggttctcgc cgctgaccat atcatcaata accagtcggc cttccacgac gccatccggg 1680
tcgccgagca gtatgctgat gaaggtcatc tggtcacctt cggtatcgtg ccgaatgccc 1740
cggaaactgg ctacggttac attcagcgcg gcgtggcgct caccgatagt gcccattccg 1800
cgtaccaggt ggcccgcttt gtggagaagc cggatcgcga gcgcgccgag gcttacctcg 1860
cctccgggga gtactactgg aacagcggca tgtttatgtt ccgcgccaag aaatacctca 1920
tcgagctggc caaataccgt ccggatatcc tggaagcctg ccaggctgcg gtgaatgccg 1980
ccgataatgg cagcgatttc atcaatatcc cgcatgatat tttctgcgag tgcccggatg 2040
agtccgtgga ctatgccgtt atggagaaaa ccgccgatgc ggtggtggtc ggtctcgatg 2100
ctgactggag cgacgtcggc tcctggtccg cactatggga ggtcagcccg aaagacgagc 2160
agggcaatgt cctcagcggt gacgcgtggg tacacaacag cgaaaactgc tacatcaaca 2220
gcgacgagaa gctagtggcg gccattggcg tagagaatct ggtgattgtc agcactaagg 2280
acgccgtgct ggtgatgaat cgcgagcgtt cccaggacgt gaagaaggcg gtcgagttcc 2340
tcaagcagaa ccagcgcagc gagtacaagc gccaccgtga gatttaccgc ccctggggcc 2400
gttgcgacgt agtggtccag accccgcgct tcaacgtcaa ccgcatcacg gtgaaaccag 2460
gcggtgcctt ctcgatgcag atgcaccacc atcgcgccga gcattgggtt attctcgccg 2520
gcaccggtca ggtgactgtc aacggtaagc agttcctgtt gtccgagaac cagtccacct 2580
ttattccgat tggcgccgag cactgcctgg aaaaccctgg ctgtattccg ctggaagtgc 2640
tggagatcca gtcgggggcg taccttggcg aggacgacat tattcgtatt aaagaccagt 2700
atggtcgttg ctaattattt tcgggacaag acgcagaatg acacagttaa cttgttttaa 2760
agcttatgac atccgtggtg aactgggtga ggaactgaac gaggacatcg cctaccgtat 2820
cggtcgcgcc tacggcgaat ttctgaaacc cgggaagata gtggtggggg gcgatgtgcg 2880
cctcacaagc gagtcgctga agctggcgct ggcccgcggg ttaatggacg ccggtaccga 2940
cgtgctggac atcggcctga gcggtaccga agagatttac tttgccacct tccaccttgg 3000
ggtagatggt ggcatcgagg tgaccgcgag ccacaatcct atgaactaca acggcatgaa 3060
gctggtgcgc gagaatgcga agcccatcag cggcgacacc ggcctgcggg atatccagcg 3120
cctggcggag gaaaaccagt tcccgccagt ggacccggcg cgtcgcggga ccctgagcaa 3180
gatatcggta ctgaaggagt atgttgacca tctgatgagc tacgtggact tctcgaactt 3240
cacccgtcca ctgaagttgg tggtgaactc cggaaacggg gctgcggggc acgtgattga 3300
tgaggtggag aaacgcttcg cggcggctgg ggtgccggta acctttatca aggtgcatca 3360
ccagccggat ggccatttcc ctaacggtat cccgaatccg ctgctgccgg agtgccgcca 3420
ggataccgcc gacgcggtgc gcgagcatca ggccgacatg gggattgcct ttgacggcga 3480
cttcgatcgc tgcttcctgt tcgatgacga agcttcgttt atcgaggggt attacattgt 3540
cggcctgctg gctgaggcgt tcctgcagaa gcagccggga gcgaaaatca ttcacgaccc 3600
gcgcttgacg tggaacacgg tagacatcgt gacccgcaac ggcggccagc cggtgatgtc 3660
gaagacgggg catgcgttca tcaaggagcg gatgcgtcag gaagacgcta tctacggcgg 3720
ggagatgagt gcgcaccatt acttccgcga tttcgcctac tgcgatagcg ggatgatccc 3780
gtggctgctg gtggcggagc tgctgtgtct gaagaacagc tcgctgaaat cgctggtggc 3840
ggaccgccag aaggcgttcc ctgcgtcggg agagatcaac cgcaagctaa gtaatgctgc 3900
tgaggcgatc gcccgcatcc gggcgcagta tgagccggcg gctgcacaca tcgacacaac 3960
ggacgggatc agtattgaat accctgaatg gcgctttaac ctgcgcacgt ctaacaccga 4020
gccggtggtg cgtctgaacg ttgagtccag agctgatgtg gcgcttatga atgaaaaaac 4080
gaccgagctg ttacacctgt taagcgggga ataaggtgag agatttacta acgacgattt 4140
atcgttatcg gggatttatc tggagcagtg ttaaacgtga ttttcaggca cgctatcaaa 4200
ctagtatgct gggcgcacta tggctcgttt tacaaccgct ctctatgatt ctggtctata 4260
ccctggtttt ttccgaggtg atgaaggcaa gaatgcccga taataccggg tcgtttgcct 4320
atagtattta tctctgttcc ggggtactga cctggggatt atttactgag atgctggata 4380
aaggtcagag cgtatttatt aacaatgcta atctgatcaa gaaactcagt tttccgaaaa 4440
tctgtctgcc gatcatcgtg acgttatcgg cggtgctaaa tttcgcgatt attttcagtc 4500
tgtttctaat ttttatcatt gtcaccggta acttccccgg ctggctcttt ctctcggtga 4560
taccggtcct gcttttgcag atcctgtttg ccggtgggct ggggatgatc cttggtgtca 4620
tgaacgtctt tttcagggat gtggggcaac tggttggcgt tgcgctgcaa ttctggtttt 4680
ggttcacacc cattgtttat gtactgaatt cattacctgc atgggcaaaa aatctgatga 4740
tgtataaccc gatgactcgg atcatgcaat cttatcagtc catcttcgcc tatcatctgg 4800
cccccaactg gtattcgcta tggccagtat tggctctcgc cattattttc tgcgtcatcg 4860
gtttcaggat gttccgcaag catgcggcgg atatggtgga tgaattataa tgagttatat 4920
cagagtaaat aatgtcggta aggcgtatcg ccagtatcac tcaaagaccg ggagactgat 4980
cgaatggtta tcccctctga ataccaaacg ccataatttg aaatggatcc tccgcgatat 5040
taatttcgaa gtcgctccgg gcgaggctgt cggtattatc ggtatcaacg gtgcaggcaa 5100
gagtaccctg cttaaactca taaccgggac gtccaggccg acgactggag aaattgaaat 5160
ctccggacgt gtcgctgcat tactcgaatt ggggatgggg tttcattctg atttcactgg 5220
tcggcagaat gtttatatgt ctgggcaact gttggggtta tcgtcagaga aaataactga 5280
actgatgccg caaattgaag agtttgctga gattggggac tatatcgatc aacctgtgcg 5340
cgtctactcc agtgggatgc aagttcgatt agcttttagt gtagcgacgg ctatccgtcc 5400
tgatgtgcta attatcgatg aggcattatc tgttggggat gcatatttcc agcataaaag 5460
ctttgagcgt attcgaaaat ttcgtcagga agggaccacg ctgttgctgg tatcccatga 5520
taaacaagcg atccaaagca tttgcgaccg ggccatttta ttgaataaag gccaaattga 5580
aatggaaggt gaacctgaag cagtgatgga ttattacaat gctcttctgg ccgataaaca 5640
aaatcagtcc attaaacaag ttgagcataa tggtaaaacg caaactgttt caggcactgg 5700
tgaggtgact atctctgagg ttcatcttct cgatgaacag ggcaatgtga ctgaatttgt 5760
ttcggtaggg catcgtgtca gcttgcaggt caacgttgag gtcaaggacg atattcctga 5820
gcttgttgtc ggatatatga ttaaggatcg acttgggcag ccgattttcg ggaccaatac 5880
gtaccatctc aatcagacac tcacctccct gaaaaaagga gaaaagcgtt cgttcttatt 5940
ttctttcgat gcgagattgg gggttggctc ctattctgtc gctgtcgcgt tgcatacttc 6000
cagtacgcac ctcggcaaaa actatgaatg gcgcgatctg gccgtggtat tcaacgtcgt 6060
taacacggaa caacaagagt ttgtcggcgt gtcctggttg ccgcctgaac tggagatttc 6120
ttaatgggtt cgtcgtttta tcgttcattt gaagaacgac acagaggttc ggttgaagaa 6180
atcaagcgcc gcttgagttt ttatttacct tttcttgcag gtctgaagga catttatcct 6240
gatggcgtga ttgcggatat tggttgcgga cgtggcgaat ggttggagat cctgactgaa 6300
aatggcattg cgaacatcgg cgtcgatctc gatgatggca tgctggcgcg cgccagggag 6360
gccggactga atgtgcagaa aatggattgt ctgcagtttt tgcaaagtca ggcggatcag 6420
agcctgatag cgttgaccgg ttttcatatt gctgagcatt tgccgtttga ggtcctgcag 6480
caactcgcca tgcataccct acgggtgctg aaaccaggtg gtttgctgat cctcgaaacg 6540
ccgaacccgg agaatgtaag cgtcggcacc tgttcatttt atatggatcc aacgcataat 6600
catcctctgc caccgccact gcttgagttt ttacctattc attatggttt tacccgagca 6660
attaccgttc gtctgcagga aaaagaggtt cttcaatctc cggatgcagc cgttaatttg 6720
gtcgatgtac tcaaaggggt gagccccgac tacagcatca ttgctcagaa agcagcgcca 6780
acagatattc ttgaacgctt tgacaccctg tttacccagc agtacggtct gacgctggat 6840
gctctgagca accgttacga tgcgattttg cgccaacagt tttcgtccgt tgtctcacgg 6900
ctggagacgt tgaaccaaac ctatatgcaa cagataagcc aaatgtcaga gactattcag 6960
acgttgcaag gtgaggttga cgatctgagt catgtcatcg atcagaacca tcagcttcat 7020
cagcaaatgg cggatttaca taacagtcgt tcatggcgta ttactcaacc actacgctgg 7080
ttgtctttgc aacgtcaatt attacgtcag gaaggggcta aagtgcgagc ccgtagggct 7140
gggaaaaaaa tattgcgcaa agggatggcg ctctcgctgg tctttttcca tcgttaccct 7200
aagtctaagg tttatctgtt taaggttctg agaaaaactg gctgctatac attgctacaa 7260
cgtttgttcc aacgcgtaat gctggtgcaa tctgacacga tgatgatgca gtccagaaga 7320
tatgatgtgg gtactgaaga aatgacaagt cgcgcgatga gtatttataa cgaattaaaa 7380
aataaaaata cggagaaata acgatgcgta ttgtcataga tttacaaggc gcacagacgg 7440
aaagccgctt tcgtggcatc ggtcgttata gtatcgcaat cgccagaggc ataatcagaa 7500
ataacagccg gcatgagatt ttcatcgcgc tatccgccat gctggatgag tcgattgcaa 7560
atattaaggc gcaatttgcc gatctcctgc cggcagaaaa tatagtcgta tggcatgccg 7620
taggccctgt tcgtgcgatg gaccaaggta atgaatggcg tcgggagagc gcagaactga 7680
ttcgggaagc gtttcttgaa tcattgtgtc cagatgtcgt tttcattacg agtttgtttg 7740
aaggtcatgt cgacgatgcg gctacatcgg tacacaaatt tagtcgtcag tataaagtag 7800
ccgtactgca ccacgatctt atccccctcg tgcaggcgga aacctatctg caggacgatg 7860
tatacaaacc ctactattta cagaaagttg agtggttaaa aaacgctgac cttttgttga 7920
ctaactctgc ttataccgca caggaagcga tcgagcatct gcatttacag ggcgatcatg 7980
tgcagaatat tgcagccgca gtcgattctc agttttgtat ggcggaggtg gcagcgagcg 8040
aaaaagagac cgtccttggc cattacggta ttcagcgcga gttcatgttg tatgcgcccg 8100
gaggatttga ctcaaggaaa aactttaaac ggttgattga ggcctatgcc gggctcagtg 8160
atgccttacg tcgcagtcat caactggtca tcgtcagtaa gctttccatc ggtgatcgtc 8220
agtatctgga atcccttgcg tcaggtaatg gtttacagca gggcgaactg gtactcactg 8280
gttatgtgcc ggaagatgag ctgatccagc tctatcgcct atgtaagctg ttcatctttg 8340
cttcactaca tgaaggtttt gggttgccgg ttctggaagc aatgtcgtgc ggtgcgccgg 8400
tgattggctc aaatgtcacc agtattcctg aagtcatcgg taatcctgag gcattattcg 8460
acccgtattc tgtctcttcc atgagggata agatcgcgca atgtttgact gatgatacct 8520
tcctcgcgcg tctgaaagaa atggcgcagc agcaagcgcg taatttctct tgggataaag 8580
ctgcggtgac tgctctggaa gctttcgaaa agatcgcggt agaagacacc ggtactgcgc 8640
aggttttgcc tgaagctttg attcagaaga tccttgctat ctcacaaggg cagccagatg 8700
accgcgatct gcgcttgtgc gcaacggcca ttgattacaa tctgaaaacg gcagaacttt 8760
atcaaatcga cgataaatcg ctgaactggc gtgtggaagg cccattcgat agctcatata 8820
gtctggcgtt ggtcaaccgc gaatttgccc gggcactctc agccgatggt gtagaggttt 8880
tattgcattc cactgaagga ccaggtgatt ttgccccaga tgcctcgttt atggcacagt 8940
cggaaaatag tgatcttctg gcattttata atcaatgtca gacccgcaag agtaacgaaa 9000
agatagatat tattagcaga aatatctatc caccgcgggt taccaaaatg gatgccaaag 9060
taaaattcct tcattgttat gcttgggaag aaacgggctt tccgcaaccg tggatcaatg 9120
aatttaatcg ggaacttgac ggagtgctgt gtacttcgga acatgttcgt aaaatactga 9180
ttgataacgg actgaatgtg cccgcatttg ttgttggcaa tggctgtgac cattggctca 9240
atatcccagc cgagacgaca aaagatgtgg atcacggaac attccgtttc ctgcacgtct 9300
cttcttgttt cccacgcaaa gggatacagg caatgcttca ggcttggggg aaggcgttca 9360
ctcgtcgtga caatgttatc ttaatcatta agacttttaa caatccgcac aatgaaattg 9420
acgcatggct ggctcaggcc caggctcaat tcatagacta tcccaaagtt gaagtgatca 9480
aagaggatat gtcagccacc gagcttaaag ggctttatga aagctgtgat gttttggttg 9540
ctccaggttg cgctgaaggc tttggtttac ctattgctga agcaatgctg agtgggctac 9600
cggctatcgt caccaattgg agcgggcaac ttgattttgt taattcacaa aattcatggc 9660
tggttgacta tcagttcact cgggtaaaaa cgcactttgg tctgttttcc tcagcctggg 9720
ccagtgtgga tattgacaac ttaacagatg cattaaaagc ggcagcctca accgataaat 9780
cagtgctgcg tgacatggcc aatgctggtc gcgagcttct tctgcagcag tttacctgga 9840
aagcggtggc tgatcgttct tgccaggcgg tcaagactct gcgtgcgcat attgatattg 9900
cacagcatcg ggcgcgcatt ggctgggtga cgacctggaa cacgaaatgt gggatcgcaa 9960
cctattccca gcatctggtg gaaagcgcac ctcatggcgc ggatgttgtt tttgctcccc 10020
aggtcagcgc tggcgatctt gtgtgtgcag acgaagagtt tgtacttcgc aactggattg 10080
taggtaaaga gagcaactat ctggaaaacc tccagccaca cattgatgct ctgagactcg 10140
atgtcattgt gatccaattc aactatggat tctttaatca tcgagaactg tcggcgttta 10200
ttcgtcgcca gcatgacgcc ggtcgttcag ttgttatgac gatgcactca actgtggatc 10260
cgctggaaaa agagccgagc tggaatttcc gtcttgctga aatgaaagag gcgctggcac 10320
tttgcgaccg gttgttggtg cattcgattg ccgatatgaa ccgccttaaa gatttaggct 10380
taactgcgaa tgttgcttta ttcccgcacg gtgttatcaa ctactccgca gcgagcgtca 10440
cacgtcaaca gcagtcttta ccgctaattg cgagctatgg cttctgctta ccgcataagg 10500
gcctgatgga actagtagaa tccgtccata gactcaagca agccggtaaa ccggttcgtt 10560
tacgactggt gaacgcagag tatcctgttg gggagtcacg cgatctggtg gcagagctta 10620
aagctgctgc tcagcggtta ggtgttaccg atctgattga gatgcataat gatttcctac 10680
ctgatgcgga gagtctgcgg ttgctttcag aagccgatct tctgattttt gcttatcaga 10740
atactgggga gtctgctagc ggggcggtac gttatggtat ggcgactcaa aaacctgttg 10800
cggtaacgcc cctggcgata tttgatgatt tggacgatgc cgtctttaaa tttgatggat 10860
gcagcgtcga tgatatcagt caggggattg accggatcct gaattccatc cgtgaacaga 10920
actcttgggc aaccaggact caacaacgtg ccgatgcatg gcgggaacaa catgattatc 10980
aagctgtttc acgccgtctg gttaatatgt gtcaaggctt agctaaagct aaatatttta 11040
aataaaaata tctctcttgt attttttgcc tttgaataca agaggggtta gataatgtgt 11100
catttattat gaaaattatt tttgctactg agccaattaa atacccatta acgggcatcg 11160
gtcggtattc cctggagctg gttaagcggc tggcggtcgc ccgcgaaatt gaagaattaa 11220
agctatttca cggtgcgtcg tttatagaac agatcccttt ggtggagaat aaaagcgata 11280
ccaaagccag caatcatggt cgtctgtcgg cgtttctacg ccgacagacg ctgttgattg 11340
aggcttatcg cttgctgcat ccgcggcgcc aggcgtgggc attgcgcgac tataaggatt 11400
atatctacca tggccccaat ttttatctgc cgcataaact ggaacgcgcc gtgaccacgt 11460
ttcatgacat atccattttt acctgcccgg aatatcatcc aaaagatcgg gttcgctata 11520
tggagaagtc cctgcatgag agtctggatt cggcaaagct gatcctgacc gtttctgatt 11580
tctcgcgcag tgaaattatc cgcttgttca actatccggc ggagcggatc gtaaccacca 11640
agctagcctg cagcagtgac tatatcccac gcagcccggc agagtgtctg ccggtactgc 11700
agaaatatca gctggcgtgg caggcctacg cgctatatat cggcactatg gagccacgta 11760
aaaatatccg aggcctgctg catgcctatc agctgctacc gatggagatc cgcatgcgct 11820
atccgctaat ccttagcggc tatcgcggct gggaagacga tgtgctgtgg cagttagtcg 11880
agcgcggtac tcgggaaggc tggatccgtt acctcggata tgttccggat gaagacctgc 11940
cgtatctgta cgcagcggcc agagtctttg tttatccctc cttctacgag ggattcggtt 12000
tacctattct tgaagcgatg tcttgcggtg tgccggtagt atgctccaat gtcacctctt 12060
tgcctgaggt tgttggcgat gccggcctcg ttgccgatcc taatgatata gacgcgatta 12120
gcgcgcaaat tttgcagagc ctgcaagatg atagctggcg ggaaatcgcc accgcgcgcg 12180
gtcttgctca ggcgaaacag ttttcgtggg agaactgtgc gacacagacc attaacgcct 12240
ataaattact ctaagggtgt cagttgagag ttctacacgt ctataagact tactatcccg 12300
atacctacgg cggtattgag caggtcattt atcagctaag tcagggctgc gcccgccggg 12360
gaatcgcagc cgatgttttc acttttagcc cggacaaaga tacaggtcct gtcgcttacg 12420
aagatcatcg ggtcatttat aataaacagc tttttgaaat tgcctccacg ccgttttcgc 12480
tgaaagcgtt aaagcgtttt aagctgatta aagatgacta cgatatcatc aactaccatt 12540
ttccgtttcc ctttatggat atgctgcatc tttcggcgcg gcctgacgcc aggactgtgg 12600
tgacctatca ctctgatata gtgaaacaaa aacggttaat gaagctgtac cagccgctgc 12660
aggagcgatt tctcagcggc gtagattgca tcgttgcctc gtcgcccaat tacgtggctt 12720
ccagccagac cctgaaaaaa tatctggata aaacggtggt gatcccgttt ggtctggagc 12780
agcaggacgt gcagcacgat ccgcagaggg tcgcgcactg gcgggaaact gtcggcgata 12840
agttctttct cttcgtcggc actttccgct actacaaagg gctgcatatt ctgatggatg 12900
ccgctgagcg tagccgactg ccagtggtgg ttgtaggggg cgggccgctg gaatcggaag 12960
tgcggcgtga agcgcagcag cgcgggctga gcaatgtgat gtttaccggc atgctcaacg 13020
acgaagataa gtacattctc ttccagctct gccggggcgt ggtattcccc tcgcatctgc 13080
gctctgaggc gtttggcatt acgttattgg aaggcgcacg ctttgcaagg ccgctgatct 13140
cttgcgagat cggtacaggt acctctttca ttaaccagga caaagtgagt ggttgcgtga 13200
ttccgccgaa tgatagccag gcgctggtgg aggcgatgaa tgagctctgg aataacgagg 13260
aaacctccaa ccgctatggc gaaaactcgc gtcgtcgttt tgaagagatg tttactgccg 13320
accatatgat tgacgcctat gtcaatctct acactacatt gctggaaagc aaatcctgag 13380
cggccgcgag ctcgtcgact cgaggatccg tgtaggctgg agctgcttcg aagttcctat 13440
actttctaga gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag 13500
ccgtaagcat ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat 13560
ttgcgaacat tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta 13620
atgtccaagc aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc 13680
aacatcgaaa gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa 13740
gaagtgattg ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt 13800
gtcgaatctc tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg 13860
gatgctgcta ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt 13920
ggtaacacct tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt 13980
aacttcatcg gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt 14040
atgcctggtg gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc 14100
gccgtagctg aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac 14160
tatgtgaaga tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc 14220
tattctctgc ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc 14280
gagtggaata acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc 14340
aaaaaagatg aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa 14400
ggtaccggta aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt 14460
accgagtctg tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct 14520
aaagttctct ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa 14580
gttcgtcgtg cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg 14640
cgtgctgcgt ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc 14700
cgtgctggct gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa 14760
aatccacaga tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac 14820
cagcaggcgc tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc 14880
ttctccgcag cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg 14940
atccaggcac agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt 15000
gtgttccata ccgaatggct ggattaa 15027
<210> 15
<211> 11283
<212> DNA
<213> Artificial Sequence
<220>
<223> example O15 rfb locus nucleotide sequence - O15-EPA production
strain stLMTB11738
<400> 15
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcatgagcaa aactaaacta aatgttcttt accttgcaat aagtcagggt 1320
gccaattacc tactgccatt attaattttt ccttatcttg ttagagtcat tggtgtatcg 1380
aattttggtg atctgagttt ttcattgata actatacaag tgttgttaat ggttgttgaa 1440
tatggttttg gatatagtgg gacaagagaa atagcactaa ataacgataa aaaataccat 1500
tctgaatttt tttgcggtgt ggtgcttgct cgttttatat taatgctaat tgcagctata 1560
atactcataa tactctgttt tttttatgtt tttaacgacg ttaagtcttt gttatgtgtt 1620
ggttttctgt ccgtaattgc aggtgttttc aatccaaatt ggtttttgca aggtaaggaa 1680
atgatgagtg tgatggctgt gctgtcacta ttttcacgag gcatagcagt cgttgcagtt 1740
tatctaatta taaaacccgc aacgccgatg tacatcagtg ccttattatt gagcatgcca 1800
tatattttgt attcattctg tggcgttgcc tacttactta ttatcaagga gattttttta 1860
tgtaggccac cgataaagaa aattcaagta attttaaaaa atggatttca ttttttttgt 1920
tcaacacttg cgactagtgc atacacaatg ttgacccctc ttgtattggg tggcgtatct 1980
ggaaagtttg atgtaggcat ctttaactca gctaacatga tcaaacaagg tttggctgga 2040
cttgcatcac cattagtcca agctttttat ccaagaatta acattttgca aagagagaat 2100
ccatatattg caaacttaaa atctagaatg attcttaaat acttgcttgt tttttacatg 2160
gctttagcaa taccattttt actttttgcc aaccaattat cattattaat attcggcatg 2220
aaaggtgaag taattgcagg tgcaatgcaa ttaatgacat tgcttcctat attcataggt 2280
tttaatacag ttgtcgggtt acttgtatta gtacctaatg ggatgcaaaa acagtatttc 2340
aaatctattt tcctaggaac tattacttgt ttaagcatag tttatccagc atgtaaatat 2400
tatggagcaa cgggtgcgat tgtgagtctt attgtagctg aaattttcgt tggcatggga 2460
atgcttaaac aattcattaa agtaaataaa accgtatgta ggcctcataa attatgaata 2520
tctcggtaat aatatctgtt tggaaacgcc cagttcaatt agaattgatt ctctctgagc 2580
tcgattctca ggctaaagac aatagtctac acctagaagt aattgtttcc gatagtcata 2640
gtggtaaaga aattgatgat gtagttgctg ataatattca taaaaagaaa aatattaata 2700
ttatccatca acatactaaa aatatactct ccgctaagcg caatttcgga gcatccctag 2760
cccatgggga ttatttaata tttcttgatg atgattgtat acccgcaagt ggatatatat 2820
catcgttgct gaactattta aaaaaaatga atagtaaaag cgttttatgt ggggaagtta 2880
gattcgaaaa tgaactcatt gagaccagca attactatcg ctacaggaac tctttacacc 2940
ctaagtttag tgatagtcct gatatctcta tgaatgcctg gacttttgtc gcaatgaatt 3000
gtgttcttga tagaaaggca ttttcatcag gtatagtttc atataatgaa aattttattg 3060
gttatggttg tgaagatcat gagtttgggt ggcaacttga aaaaaatgac ttcaaaatta 3120
tttttgctga ttttaaaata ttacatcacg aatacagtgg cgatatagaa ggatatacaa 3180
aaaaaattcg tgctacagca cgtgatggta tgaatgtatt aagcaaagta aggcctgaaa 3240
tgttttctac taataaaaaa ttattcctag ttgagaaaat atttagtaaa cacaaaacgt 3300
ttagtaaaat atgccaatca atatttttca ataaatttat ttttaaaaaa ataatacaat 3360
ttttaaaaaa aacagatgca aataaaaaac tctatttccc aattctttac agatatgtgt 3420
tgatttcggc atatatacat ggtattggag agcgtggcac ctcaaaaaca gatgatttgc 3480
ttaagaactg gtatatatag atgatgctat cttcatttat taagacattt gtatggaagg 3540
taaaaaacaa tgaagtataa tgcattgatg gcttttttat tattttttgt tgtttttttt 3600
agattgtcgc tgataatacc tttcttatat ttggcattta ttcctgcatt ttttggtatt 3660
atgtatttag tgcgtaattt tatgattact atgggcaatg gattggtatc tatagatcgt 3720
aaaaatttgt tgctgttatc tatattcata attatttttt tattttgttt ggttttcgat 3780
ttgtttcaaa aaagccattc ttttcaaagt tattttaccg ttagattatt tatgttgttt 3840
ttattttcat ttgttcctgc gtattattta gtaaatagat tcataaaggg tgacttgaaa 3900
ttaatggagc gaatattagt gtattctctc tgggttcaaa tagttatttt ttttggtatg 3960
tatataagtc cagagttaaa aagattgtta tatactttct ttggtatgtc tgactctgtt 4020
aatctttggg aacaaaatgc taaagtaaga ggatttgggt tgtcgggtga aataaatttc 4080
atgacaccat ttttgatgat ctatatgtca ttttttatga tgaaaaggcg ttatgcttta 4140
attactttaa tttgtctgac tcaaatcgta aattctaaca tggctgtgat tgcagccatt 4200
attggtatcg gttgctctag acttaatatt aatataaaaa ttgcaacagt attgattttg 4260
ggagttttag tttatagctt aggagcggtg ttctttcctc gattttatga tgagttcgtt 4320
tctggagatg gcacaagaac tctggatatc ttattacagc aacatgtgtt tgttgtaggt 4380
aatttagatt tttttaatat tatatttgga ttacagcaaa acatatcttc atcaatcccc 4440
gatattaaac aaagttcgga tatgggctgg gttatactgt ttaattacgg tgggttaaca 4500
tttattacac tctttttatt tttaatcttt actatttcta ttgcgacatt tggaatgaca 4560
tatcaagcaa ttatatggat gttaattggg ataattttca ataccaaagg tttagtttta 4620
ggatctaacg gctatttctt tctatctttt atatatatgt ttttgaatag agtaacactt 4680
agtggacaga gttcaattac taataagtta ggtcaagtaa gtaaatagct tccagagtat 4740
atttgtcaat gatttgaggt tcggttatta tgttttcatc taaaacactg ttaattactg 4800
gtggtactgg ctctttcggg aatgctgtat taaatagatt tcttgataca gatattgcag 4860
aaatccgtat atttagtcgt gatgaaaaaa aacaagatga tatgcggaaa aaatacaata 4920
atcaaaaatt aaagttctat attggtgatg tcagagatta ccgtagtatt ttgaatgcga 4980
ctcgcggtgt tgattttata tatcatgcag cggcacttaa gcaagttcca tcatgtgaat 5040
ttcatcctat ggaagccgtt aaaactaata tccttggtac ggaaaatgtt cttgaagcag 5100
ctatagcgaa tgaagtgaag agggttgtat gcctaagtac tgataaagct gtatacccga 5160
ttaacgcaat gggtatttca aaagctatga tggaaaaggt catggtcgcg aaatcccgta 5220
atgttgatcg caataaaaca gtaatatgtg gtacccgtta tgggaatgtt atggcatctc 5280
gcggttcagt tattccatta tttgttgatc ttattagagc gggcaagcca ctcacaataa 5340
ctgatcctaa tatgacccgc tttatgatga ctcttgagga tgcggtagat ttagttcttt 5400
atgcgtttga acatggtaat aatggtgata tctttgtgca aaaagcacct gcagcaacta 5460
ttgacacatt agctattgct ttaaaggaat tactaaatgt tcctgaccat ccggtaaatg 5520
tcattggaac gcgtcatggc gagaaattat atgaagctct acttagtcgt gaggaaatga 5580
tcgctgctat agatatgggc gattattacc gtgtcccgcc agatcttcgt gaccttaatt 5640
atggcaaata tgttgagcaa ggtgatagcc gaatatctga aatagaagat tataactctc 5700
ataatactca acggttagat gttgaaggca tgaaagagct cttgctaaaa ttagccttta 5760
ttcgagcaat tcgtgctggt gaaaaatata atctggattc atgatatgaa aatattagtt 5820
actggtgcaa atggttttat tggtcgtaat ttatgtttga ggcttgagga acttggttat 5880
aaagatctta ttagaattga tcgagaatca acgaagcaag atcttgaaca aggcttacag 5940
gatgccgatt ttatttatca cttagctggt atcaatagac ctaagactga tgatgagttt 6000
atttctggaa acagtgattt aacaaagcat atagttgagt atctcctttc tattggtaag 6060
aatacaccaa ttatgctaag ttcttcgata caagctgaac ttaataatgc ttatggggtt 6120
agcaaagctg tagctgaaag ctatgtcgaa aaatatgctg ctgctagtgg ttcttcgtat 6180
tatattttca gatatccaaa cgtttttggt aaatggtgta agccaaacta taattctttt 6240
atagcaactt tttgctacaa tatttccaat gatattgaga ttactatcaa tgatgcagca 6300
gcgccagtca atctggtcta tattgatgat gtttgtactg atgctatagc tcttctctct 6360
gggacggttg aaagtggata taaagttgtt gcaccaattt attcaacaac agttggtgaa 6420
gttgcagaat taatttatag cttcaaaaat agccgttcca ccctgatcac agaggctgtc 6480
ggggcgggat ttacccgtgc attgtattct acatggctga gttatttacc agcagagaag 6540
tttgcgtaca aggtaccttt ttatggggat gcccgcggag tcttttgtga gatgttgaaa 6600
acgccttcag cggggcagtt ttcatttttt actgctcacc ctggtattac gcgtggcgga 6660
cattaccatc acagtaaaaa tgagaagttt ttggtcattc gaggtcaggc atgctttaaa 6720
tttgaacatg tgattaccgg tgagcgatat gaactgaaag tttcatcggg tgagtttaag 6780
attgttgaaa cagttcctgg ttggacacat gacattacaa atattggaac tgatgaatta 6840
atagtcatgc tctgggcaaa tgaaattttc aaccgtgatg agcccgatac tattgcgaga 6900
cctctataat gaaaaaatta aaagttatgt ctgttgttgg aacccgtcct gagattatcc 6960
gtttgtcgag ggttcttgct aagtttgatg aatactgcga gcatattatt gtccatactg 7020
gtcaaaatta tgattacgaa ttaaatgaag tgttcttcaa tgacttgggt gttcgaaaac 7080
ctgattattt tttaaatgca gcgggtaaaa atgcggcgga aaccattggt caggttatta 7140
ttaaggtaga tgaagtatta gaaatcgaaa aacctgaagc aatactggta ttgggcgata 7200
cgaattcatg tatttctgcc attccggcca aacgccgtaa agtgcctata tttcatatgg 7260
aagcaggtaa ccgttgtttc gatcaacgcg tgcctgaaga aaccaacaga cgtattgttg 7320
accatacggc tgatatcaat atgacctaca gtgatattgc tcgtgaatat ctcttggctg 7380
aaggtatccc agctgatcgg atcataaaaa ctggtagccc tatgtttgag gttctttcat 7440
attatatgcc ccaaattgat ggttcagatg tgctatcgcg tttgaatcta cagtctggtg 7500
agttttttgt agtaagtgcg catcgtgaag agaatgttga ttctccaaaa cagctcgtaa 7560
agcttgcgaa cattctaaat actgttgctg aaaaatataa tcttccagtt attgtctcca 7620
cacacccaag gacacgtaac cgaatccgtg agcaaggaat tgaatttcat tcaaatataa 7680
atctactgaa accattgggt ttccatgatt ataaccactt gcagaagaac tcacgagctg 7740
tgctttcaga tagcggtact atcactgaag agtcatccat catgaatttc ccagcggtaa 7800
acatccggga agcgcatgag cgtccggaag gctttgagga agcatccgtc atgatggtgg 7860
ggttagagtg tgaacgcgta ttacaagcgc tggatattct ggcaacacaa ccgcgaggtg 7920
aagtccgtct tttacgtcag gttagtgatt acagcatgcc aaatgtgtcg gataaagttg 7980
tcagaattgt tcactcttac acagattatg ttaagagagt cgtctggaaa gaatattgat 8040
gaaacttgct ttaatcatag atgattacct gcccaacagt actcgtgttg gtgcaaaaat 8100
gtttcatgaa cttgctcaag aatttatcca gcgtgggcac gatgttacgg taattactcc 8160
tggtacgggc atgcaagaag agatttcttt tgataccttt cagggggtaa aaacatggcg 8220
ttttaaaagc gggccgctca aggatgtaag taaaattcag cgagcggtca atgaaacgct 8280
tttgtcctat cgggcgtgga aagccatcaa aaaatgggta aaaaaagaga cctttgaggg 8340
ggtgatttat tattcacctt ccatattctg ggggccttta gttaaaaaaa ttaaagctcg 8400
ttgccaatgt cctgcttatc ttattttaag agatatgttt ccacaatggg taattgatgc 8460
aggaatgctt aatgctggtt ccccaataga acgctacttt cgtctttttg aaaaaatatc 8520
ttatcgtcag gcaaatcgta ttggacttat gtctgataag aatcttgatg tttttcggaa 8580
agataataaa ggctatccgt gcgaagtttt gcgtaattgg gcatccctaa caccaacgat 8640
catacccaag gattatatac cactacgtaa gcgacttggc ctagaggata aaaccatttt 8700
cttctatggt ggaaacatag gtcatgcaca ggacatgaca aacttgatgc gacttgtgag 8760
aaacatggca gcatatcctc aagctcattt cctatttatt ggccaggggg atgaagttga 8820
attaattaat tcattagcat ctgagtgggc attgacgaat ttcacctatt tgccctcggt 8880
taaccaagat gaatttaagt tcattttgtc ggaaatggat atcggcttgt tttctctttc 8940
cgctagacac tcttcccata attttcctgg taagttatta ggctatatgg ttcagtcgct 9000
acctatttta ggtagcgtaa atgccggaaa tgatttgctc gacattgtca atcaaaataa 9060
tgcgggatta atccatgtca atggtgagga cgataaatta tgtcaatctg cgctattaat 9120
gttgcatgat attgatgtgc gccggcaact tggttcgggg gcgaatatat tgttgaaaga 9180
acaattctcc gttgagtctg cggcacagac gatagaaatg aggttggagg catgcaatgc 9240
gattaattga taatgaccaa ctcgacgaat tatatgatca agccgggcaa tcggaacgtt 9300
tacgttccca ccttatgatg cacggctcgc atcaagaaaa ggtacagcgt ttacttattg 9360
cattagtaaa gggcagctat gttgaaccgc attatcacga acttcctcat cagtgggaaa 9420
tgttcattgt tatggagggg caacttcagg tttgtttgta tggtagaaat ggtgaggtta 9480
taaagcaatt tatagcagga gataatactg gaatgagcat tgtggagttt tctccgggcg 9540
atatacacag tgtcgaatgc ctatctccgc gtgctcttat ggtggaagtt aaggaggggc 9600
catttgaccc ttcttttgca aaatcgttcg tgtgagcggc cgcgagctcg tcgactcgag 9660
gatccgtgta ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg 9720
gaataggaac taaggaggat attcatatgg ataaagccgt aagcatataa gcatggataa 9780
gctatttata ctttaataag tactttgtat acttatttgc gaacattcca ggccgcgagc 9840
attcagcgcg gtgatcacac ctgacaggag tatgtaatgt ccaagcaaca gatcggcgta 9900
gtcggtatgg cagtgatggg acgcaacctt gcgctcaaca tcgaaagccg tggttatacc 9960
gtctctattt tcaaccgttc ccgtgagaag acggaagaag tgattgccga aaatccaggc 10020
aagaaactgg ttccttacta tacggtgaaa gagtttgtcg aatctctgga aacgcctcgt 10080
cgcatcctgt taatggtgaa agcaggtgca ggcacggatg ctgctattga ttccctcaaa 10140
ccatatctcg ataaaggaga catcatcatt gatggtggta acaccttctt ccaggacact 10200
attcgtcgta atcgtgagct ttcagcagag ggctttaact tcatcggtac cggtgtttct 10260
ggcggtgaag agggggcgct gaaaggtcct tctattatgc ctggtggcca gaaagaagcc 10320
tatgaattgg tagcaccgat cctgaccaaa atcgccgccg tagctgaaga cggtgaacca 10380
tgcgttacct atattggtgc cgatggcgca ggtcactatg tgaagatggt tcacaacggt 10440
attgaatacg gcgatatgca gctgattgct gaagcctatt ctctgcttaa aggtggcctg 10500
aacctcacca acgaagaact ggcgcagacc tttaccgagt ggaataacgg tgaactgagc 10560
agttacctga tcgacatcac caaagatatc ttcaccaaaa aagatgaaga cggtaactac 10620
ctggttgatg tgatcctgga tgaagcggct aacaaaggta ccggtaaatg gaccagccag 10680
agcgcgctgg atctcggcga accgctgtcg ctgattaccg agtctgtgtt tgcacgttat 10740
atctcttctc tgaaagatca gcgtgttgcc gcatctaaag ttctctctgg tccgcaagca 10800
cagccagcag gcgacaaggc tgagttcatc gaaaaagttc gtcgtgcgct gtatctgggc 10860
aaaatcgttt cttacgccca gggcttctct cagctgcgtg ctgcgtctga agagtacaac 10920
tgggatctga actacggcga aatcgcgaag attttccgtg ctggctgcat catccgtgcg 10980
cagttcctgc agaaaatcac cgatgcttat gccgaaaatc cacagatcgc taacctgttg 11040
ctggctccgt acttcaagca aattgccgat gactaccagc aggcgctgcg tgatgtcgtt 11100
gcttatgcag tacagaacgg tattccggtt ccgaccttct ccgcagcggt tgcctattac 11160
gacagctacc gtgctgctgt tctgcctgcg aacctgatcc aggcacagcg tgactatttt 11220
ggtgcgcata cttataagcg tattgataaa gaaggtgtgt tccataccga atggctggat 11280
taa 11283
<210> 16
<211> 13435
<212> DNA
<213> Artificial Sequence
<220>
<223> example O16 rfb locus nucleotide sequence - O16-EPA production
strain stLMTB11739
<400> 16
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860
ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160
ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460
gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520
ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580
cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640
cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700
tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760
aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820
gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880
cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940
cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000
ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120
cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240
cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300
atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360
atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420
attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480
ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540
ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600
agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660
atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720
atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780
tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840
tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900
tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960
tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020
attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080
catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140
agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200
tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260
tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320
ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380
acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440
tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500
agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560
gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620
tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680
cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740
tgcatgaata cgaataaatt atctttaaga agaaacgtta tatatctggc tgtcgttcaa 4800
ggtagcaatt atcttttacc attgcttaca tttccatatc ttgtaagaac acttggtcct 4860
gaaaatttcg gtatattcgg tttttgccaa gcgactatgc tatatatgat aatgtttgtt 4920
gaatatggtt tcaatctcac agcaactcag agtattgcca aagcagcaga tagtaaagat 4980
aaagtaacgt ctattttttg ggcggtgata ttttcaaaaa tagttcttat cgtcattaca 5040
ttgattttct taacgtcgat gaccttgctt gttcctgaat ataacaagca tgccgtaatt 5100
atatggtcgt ttgttcctgc attagtcggg aatttaatct accctatctg gctgtttcag 5160
ggaaaagaaa aaatgaaatg gctgacttta agtagtattt tatcccgctt ggctattatc 5220
cctctaacat ttatttttgt gaacacaaag tcagatatag caattgccgg ttttattcag 5280
tcaagtgcaa atctggttgc tggaattatt gcactagcta tcgttgttca tgaaggttgg 5340
attggtaaag ttacgctatc attacataat gtgcgtcgat ctttagcaga cggttttcat 5400
gtttttattt ccacatctgc tattagttta tattctacgg gaatagttat tatcctggga 5460
tttatatctg gaccaacgtc cgtagggaat tttaatgcgg ccaatactat aagaaacgcg 5520
cttcaagggc tattaaatcc tatcacccaa gcaatatacc caagaatatc aagtacgctt 5580
gttcttaatc gtgtgaaggg tgtgatttta attaaaaaat cattgacctg cttgagtttg 5640
attggtggtg ctttttcatt aattctgctc ttgggtgcat ctatactagt aaaaataagt 5700
atagggccgg gatatgataa tgcagtgatt gtgctaatga ttatatcgcc tctgcctttt 5760
cttatttcat taagtaatgt ctatggcatt caagttatgc tgacccataa ttataagaaa 5820
gaattcagta agattttaat cgctgcgggt ttgttgagtt tgttgttgat ttttccgcta 5880
acaactcttt ttaaagagat tggtgcagca ataacattgc ttgcaacaga gtgcttagtt 5940
acgtcactca tgctgatgtt cgtaagaaat aataaattac tggtttgctg aggattttat 6000
gtacgattat atcattgttg gttctggttt gtttggtgcc gtttgtgcga atgagttaaa 6060
aaagctaaac aaaaaagttt tagtgattga gaaaagaaat catatcggtg gaaatgcgta 6120
cacagaggac tgtgagggta tccagattca taaatatggt gcacatattt ttcataccaa 6180
tgataaatat atatgggatt acgttaatga tttagtagaa tttaatcgtt ttactaattc 6240
tccactggcg atttataaag acaaattatt caaccttcct tttaatatga atactttcca 6300
ccaaatgtgg ggagttaaag atcctcaaga agctcaaaat atcattaatg ctcagaaaaa 6360
aaagtatggt gacaaggtac ctgaaaattt ggaggagcag gcgatttcat tagttgggga 6420
ggacttatac caagcattga taaagggtta tacggagaag cagtggggaa gaagtgcaaa 6480
agaattgcct gcatttatta ttaagcgaat cccagtgaga tttacgtttg ataacaatta 6540
tttttccgat cgctatcaag gtattccggt gggaggctac actaagctta ttgaaaaaat 6600
gcttgaaggt gtggacgtaa aattaggcat tgattttttg aaagacaaag attctctagc 6660
gagtaaagcc catagaatca tctacactgg acccattgat cagtacttcg actataggtt 6720
tggagcgtta gaatatcgct ctttaaaatt tgagacggaa cgccatgaat ttccaaactt 6780
ccaagggaat gcagtaataa atttcactga tgctaatgta ccatatacca gaataattga 6840
gcataaacat tttgactatg ttgagacaaa gcatacggtt gttacaaaag aatatccatt 6900
agagtggaaa gttggcgacg aaccctacta tccagttaat gataataaaa acatggagct 6960
ttttaagaaa tatagagagt tagctagcag agaagacaag gttatatttg gcgggcgttt 7020
ggccgagtat aaatattatg atatgcatca agtgatatct gccgctcttt atcaagtgaa 7080
aaatataatg agtacggatt aatgatctat cttgtaatta gtgtctttct cattacagca 7140
tttatctgtt tatatcttaa gaaggatata ttttatccag ccgtatgcgt taatatcatc 7200
ttcgcactgg tcttattggg atatgaaata acgtcagata tatatgcttt tcagttaaat 7260
gacgctacgt tgatttttct actttgcaat gttttgacat ttaccctgtc atgtttattg 7320
acggaaagtg tattagatct aaatatcaga aaagtcaata atgctattta tagcatacca 7380
tcgaagaaag tgcataatgt aggcttgtta gttatttctt tttcgatgat atatatatgc 7440
atgaggttaa gtaactacca gttcgggact agcttactta gctatatgaa tttgataaga 7500
gatgctgatg ttgaagacac atcaagaaat ttctcagcat acatgcagcc aatcattcta 7560
actacttttg ctttatttat ttggtctaaa aaatttacta atacaaaggt aagtaaaaca 7620
tttactttac ttgtttttat tgtattcatc tttgcaatta tactgaatac tggtaagcaa 7680
attgtcttta tggttatcat ctcttatgca ttcatcgtag gtgttaatag agtaaaacat 7740
tatgtttatc ttattacagc tgtaggtgtt ctattctcct tgtatatgct ctttttacgt 7800
ggactgcctg gggggatggc atattatcta tccatgtatt tggtcagccc tataatcgcg 7860
tttcaggagt tttattttca gcaagtatct aactctgcca gttctcatgt cttttggttt 7920
tttgaaaggc tgatggggct attaacaggt ggagtctcta tgtcgttgca taaagaattt 7980
gtgtgggtgg gtttgccaac aaatgtttat actgcttttt cggattatgt ttatatttcc 8040
gcggagctaa gctatttgat gatggttatt catggctgta tttcaggtgt tttatggaga 8100
ttgtctcgaa attacatatc tgtgaaaata ttttattcat attttattta taccttttct 8160
ttcatttttt atcatgaaag cttcatgact aatattagca gttggataca aataactctt 8220
tgtatcatag tattctctca atttcttaag gcccagaaaa taaagtgaaa atgtattttt 8280
tgaatgattt aaatttctct agacgcgatg ctggatttaa agcaagaaaa gatgcactgg 8340
acattgcttc agattatgaa aacatttctg ttgttaacat tcctctatgg ggtggagtag 8400
tccagagaat tattagttct gttaagctta gtacatttct ctgcggtctt gaaaataaag 8460
atgttttaat tttcaatttc ccgatggcca aaccattttg gcatatattg tcattctttc 8520
accgccttct aaaatttaga atagtacctc tgattcatga tattgatgaa ttaagaggag 8580
gagggggtag tgattctgtg cggcttgcta cctgtgatat ggtcataagt cacaatccac 8640
aaatgacaaa gtaccttagt aaatatatgt ctcaggataa aatcaaagac ataaaaatat 8700
ttgattacct cgtctcatct gatgtggagc atcgagatgt tacggataag caacgagggg 8760
tcatatatgc tggcaacctt tctaggcata aatgttcttt catatatact gaaggatgcg 8820
attttactct ctttggtgtc aactatgaaa ataaagataa tcctaaatat cttggaagtt 8880
ttgatgctca atctccggaa aagattaacc tcccaggcat gcaatttgga ctcatttggg 8940
atggagattc tgtcgaaacc tgtagtggtg cctttggcga ctatttaaag tttaataacc 9000
ctcataagac atctctttat ctttcaatgg aacttccagt atttatatgg gataaagccg 9060
cccttgcgga tttcattgta gataatagaa taggatatgc agtgggatca atcaaagaaa 9120
tgcaagagat tgttgactcc atgacaatag aaacttataa gcaaattagt gagaatacaa 9180
aaattatttc tcagaaaatt cgaacaggaa gttacttcag ggatgttctt gaagaggtga 9240
tcgatgatct taaaactcgc taaacgatat ggtctctgtg gttttattcg gcttgttaga 9300
gatgtcttat tgactcgtgt attttaccgg aactgtagaa ttattcgatt tccctgctat 9360
attcgcaatg atggtagcat taattttggt gaaaatttca caagtggagt cggtctcagg 9420
ctggatgcat ttggacgtgg cgtgattttt ttttccgata atgtgcaagt taacgactat 9480
gttcatatcg cctcaattga gagcgttacg ataggtcggg atacgcttat tgcaagtaaa 9540
gtatttatta ccgatcataa tcacggttcc tttaagcact ctgatccaat gagttcgcca 9600
aatatacctc cagacatgcg cacgttggaa tcttcagctg ttgtaattgg ccagagggtt 9660
tggttgggtg agaatgtgac ggttttgcct ggaacaatta ttggtaatgg agtcgtagtc 9720
ggcgccaatt ctgttgttag aggttctatt cccgaaaata ctgtcattgc gggagtacca 9780
gcaaaaatca taaagaaata caatcatgag accaaattat gggaaaaagc atagtcgttg 9840
tttctgcggt caattttacc actggcggtc catttaccat tttgaaaaaa tttttggcag 9900
caactaataa taaagaaaat gtcagtttta tcgcattagt ccattctgct aaagagttaa 9960
aagaaagtta tccatgggtt aaattcattg agtttcctga ggttaaaggg tcgtggctaa 10020
aacgtttgca ctttgaatat gtagtttgta aaaaactttc aaaagagctg aatgctacgc 10080
attggatttg tctgcatgat attacggcca atgtcgtcac taaaaaaaga tatgtgtatt 10140
gtcataaccc tgcccctttt tataaaggaa ttttattccg tgaaattctt atggagccta 10200
gctttttctt atttaaaatg ctatacgggc tgatatataa aataaacatt aaaaaaaata 10260
ctgcagtgtt tgttcaacaa ttctggatga aagaaaaatt tatcaagaaa tattctataa 10320
ataacatcat tgtcagtcgg ccagaaatta aattatctga taaaagccaa cttactgatg 10380
atgattctca atttaagaat aacccttctg agttgacaat attttaccct gctgttccac 10440
gagtatttaa aaattacgag cttattatta gtgcagcaag gaaattgaaa gaacaatcca 10500
atattaaatt tctgcttact atcagtggta cagaaaatgc gtatgcaaaa tatattatca 10560
gtcttgcaga aggactggat aatgttcatt tcctcgggta cttggataaa gaaaaaatcg 10620
atcattgtta taatatttca gatatagttt gttttccctc taggttagaa acatggggat 10680
tgccgttgtc tgaggctaaa gagcgaggta agtgggtatt agcatcagat ttcccattta 10740
ctagagaaac tcttggtagt tatgaaaaga aagctttttt tgattctaat aacgatgaca 10800
tgttagttaa acttattatt gacttcaaaa aaggtaacct caaaaaagat atctctgatg 10860
caaatttcat ttatcgtaat gaaaatgtat tagttgggtt tgatgaacta gttaatttta 10920
ttactgaaga acattgaaat ggtatatata ataatcgttt cccacggaca tgaagactac 10980
atcaaaaaat tactcgaaaa tcttaatgct gacgatgagc actacaagat tatcgtacgc 11040
gacaacaaag actctctatt attgaaacaa atatgccagc attatgcagg cctggactat 11100
attagtggag gtgtatacgg ctttggtcat aataataata ttgcggtggc gtatgtaaag 11160
gaaaaatata gacccgcaga tgatgattac attttgtttt tgaatcccga tatcatcatg 11220
aagcatgatg atttgctgac atatattaaa tatgtcgaaa gtaagcgtta tgcttttagt 11280
acattatgcc tgttccgaga tgaagcgaaa tctttacatg attattccgt aagaaaattt 11340
cctgtgcttt ctgattttat tgtgtcattt atgttaggga ttaataaaac aaaaattcct 11400
aaagaaagta tctattctga tacggttgtt gattggtgcg caggatcatt tatgctggta 11460
cgtttttcag attttgtgcg tgtaaatggc ttcgatcaag gttactttat gtactgtgaa 11520
gatattgacc tgtgcttgag gcttagcctg gctggtgtca gacttcatta tgttcccgct 11580
tttcatgcga tacattatgc tcatcatgac aatcgaagtt ttttttcaaa agccttcaga 11640
tggcacttaa aaagtacttt tagatattta gccagaaaac gtattttatc aaatcgcaac 11700
tttgatcgaa tttcatcagt ttttcacccg taagagctcg gtacccgggc ctagggtgta 11760
ggctggagct gcttcgaagt tcctatactt tctagagaat aggaacttcg gaataggaac 11820
taaggaggat attcatatcc gtcgacggcg gccgccctgc aggcatgcaa gcttgatcca 11880
tatggatcgc tagcttaatt aaataaagcc gtaagcatat aagcatggat aagctattta 11940
tactttaata agtactttgt atacttattt gcgaacattc caggccgcga gcattcagcg 12000
cggtgatcac acctgacagg agtatgtaat gtccaagcaa cagatcggcg tagtcggtat 12060
ggcagtgatg ggacgcaacc ttgcgctcaa catcgaaagc cgtggttata ccgtctctat 12120
tttcaaccgt tcccgtgaga agacggaaga agtgattgcc gaaaatccag gcaagaaact 12180
ggttccttac tatacggtga aagagtttgt cgaatctctg gaaacgcctc gtcgcatcct 12240
gttaatggtg aaagcaggtg caggcacgga tgctgctatt gattccctca aaccatatct 12300
cgataaagga gacatcatca ttgatggtgg taacaccttc ttccaggaca ctattcgtcg 12360
taatcgtgag ctttcagcag agggctttaa cttcatcggt acgggtgttt ctggcggtga 12420
agagggggcg ctgaaaggtc cttctattat gcctggtggc cagaaagaag cctatgaatt 12480
ggtagcaccg atcctgacca aaatcgccgc cgtagctgaa gacggtgaac catgcgttac 12540
ctatattggt gccgatggcg caggtcacta tgtgaagatg gttcacaacg gtattgaata 12600
cggcgatatg cagctgattg ctgaagccta ttctctgctt aaaggtggcc tgaacctcac 12660
caacgaagaa ctggcgcaga cctttaccga gtggaataac ggtgaactga gcagttacct 12720
gatcgacatc accaaagata tcttcaccaa aaaagatgaa gacggtaact acctggttga 12780
tgtgatcctg gatgaagcgg ctaacaaagg tacgggtaaa tggaccagcc agagcgcgct 12840
ggatctcggc gaaccgctgt cgctgattac cgagtctgtg tttgcacgtt atatctcttc 12900
tctgaaagat cagcgtgttg ccgcatctaa agttctctct ggtccgcaag cacagccagc 12960
aggcgacaag gctgagttca tcgaaaaagt tcgtcgtgcg ctgtatctgg gcaaaatcgt 13020
ttcttacgcc cagggcttct ctcagctgcg tgctgcgtct gaagagtaca actgggatct 13080
gaactacggc gaaatcgcga agattttccg tgctggctgc atcatccgtg cgcagttcct 13140
gcaaaaaatc accgatgctt atgccgaaaa tccacagatc gctaacctgt tgctggctcc 13200
gtacttcaag caaattgccg atgactacca gcaggcgctg cgtgatgtcg ttgcttatgc 13260
agtacagaac ggtattccgg ttccgacctt ctccgcagcg gttgcctatt acgacagcta 13320
ccgtgctgct gttctgcctg cgaacctgat ccaggcacag cgtgactatt ttggtgcgca 13380
tacttataag cgtattgata aagaaggtgt gttccatacc gaatggctgg attaa 13435
<210> 17
<211> 13228
<212> DNA
<213> Artificial Sequence
<220>
<223> example O18A rfb locus nucleotide sequence - O18A-EPA production
strain BVEC-L-00559
<400> 17
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagtga aaatacttgt tactggtggc gcaggattta ttggttcagc tgtagttcgt 1320
cacattataa ataatacgca ggatagtgtt gttaatgtcg ataaattaac gtacgccgga 1380
aaccgggaat cacttgctga tgtttctgat tctgaacgct atgtttttga acatgcggat 1440
atttgcgatg cacctgcaat ggcacggatt tttgctcagc atcagccgga tgcagtgatg 1500
cacctggctg ctgaaagcca tgttgaccgt tcaattacag gccctgcggc atttattgaa 1560
accaatattg ttggtactta tgtccttttg gaagccgctc gcaattactg gtctgctctt 1620
gatagcgaca agaaaaatag cttccgtttt catcatattt ctactgacga agtctatggt 1680
gatttgcctc atccagatga agtaaataat acagaagaat tacccttatt tactgagacg 1740
acagcttacg cgccaagcag cccttattcc gcatccaaag catccagcga tcatttagtc 1800
cgcgcgtgga aacgtacata tggtttaccg acaattgtga ctaattgctc gaacaactat 1860
ggtccttatc atttcccgga aaagcttatt ccactggtta ttcttaatgc actggaaggt 1920
aaggcattac ctatttatgg caaaggagat cagatccgcg actggttgta tgttgaagat 1980
catgcgcgtg cgttatatac cgtcgtaacc gaaggtaaag cgggtgaaac ttataacatt 2040
ggtgggcaca acgaaaagaa aaacatcgat gtagtgctca ctatttgtga tttgctggat 2100
gagattgtac cgaaagagaa atcttatcgt gagcaaatca cttatgttgc tgatcgtccg 2160
ggacacgatc gccgctatgc tattgatgct gagaagattg gtcgcgcatt gggatggaaa 2220
ccacaggaaa cgtttgagag cgggattcgt aaaacggtgg aatggtacct gtccaataca 2280
aaatgggttg ataatgtgaa aagtggtgcc tatcaatcgt ggattgaaca gaactatgag 2340
ggccgccagt aatgaatatc ctcctttttg gcaaaacagg gcaggtaggt tgggaactac 2400
agcgtgctct ggcacctttg ggtaatttga ttgcttttga tgttcactct actgattatt 2460
gcggtgattt tagtaatcct gaaggtgtag ctgaaaccgt aagaagcatt cggccggata 2520
ttattgtcaa tgcagccgct cacaccgcag tagacaaagc agaatcagaa ccggagtttg 2580
cacaattaat taacgcaaca agtgtcgaag cgattgcgaa agcagcaaat gaagttggag 2640
cctgggttat ccattactcg actgattacg tcttccctgg aaatggcgat atgccatggc 2700
tggagacgga tgcaaccgca ccactaaatg tttacggtga aaccaagtta gccggagaaa 2760
aagcgttaca ggaatattgc gcgaagcatc ttattttccg gaccagctgg gtctatgcag 2820
gaaaaggaaa taacttcgcc aaaacgatgt tacgtctggc aaaagagcgt gaagaattag 2880
cggttattaa cgatcagttt ggtgcgccaa caggtgctga actgctggct gattgtacag 2940
cacatgccat tcgtgtcgca ctgaataaac cggatgtcgc aggcttgtac catttggtag 3000
ccagtggtac cacaacctgg tacgattatg ctgcgctggt ttttgaagag gcgcgcaaag 3060
caggcattcc ccttgcactc aacaagctca acgcagtacc aacaacagcc tatcctacac 3120
cagctcgtcg tccacataac tctcgcctta atacagaaaa atttcagcag aactttgcgc 3180
ttgtcttgcc tgactggcag gttggcgtga aacgaatgct caatgaatta tttacgacta 3240
cagcaattta atagtttttg catcttgttc gtgatggtgg agcaagatga attaaaagga 3300
atgatgaaat gaaaatgcgt aaaggtatta ttttagcggg tggttctggt acacgtcttt 3360
atcctgtgac tatggctgtc agtaaacagc tattacctat ttatgataaa ccgatgatct 3420
attacccgct ctctacactg atgttggcgg gtattcgcga tattttgatt atcagtacac 3480
ctcaggatac tcctcgtttt caacaattgc tgggtgacgg tagccagtgg ggcctgaatc 3540
ttcagtacaa agtgcaacct agcccagatg gcctcgcgca ggcatttatc atcggtgaag 3600
agtttattgg tggtgatgat tgtgctttgg ttcttggtga taatatcttt tacggtcacg 3660
atctgccgaa gctaatggag gccgctgtta acaaagaaag tggtgcaacg gtatttgcct 3720
atcacgttaa tgatccagaa cgctatggtg tcgttgagtt tgataaaaac ggtacggcaa 3780
tcagtctgga agaaaaaccg ttagaaccaa agagtaatta cgccgttaca ggtctgtact 3840
tttatgataa cgacgtggtt cagatggcga aaaacttgaa gccgtctgca cgtggtgagt 3900
tagaaattac agatattaac cgtatttatc ttgagcaggg acgtctgtct gtcgcgatga 3960
tggggcgtgg ctacgcgtgg ctggacacgg ggactcatca gagtctgata gaagcaagta 4020
attttattgc gacaattgaa gagcgccagg gattgaaggt ttcctgtcct gaagagattg 4080
catttcgtaa aggttttatt gatgttgagc aagtaagaaa attagctgta ccactaataa 4140
agaataatta tgggcagtat ctttataaaa tgacgaagga ttcaaattaa tgaatgtgat 4200
tagaactgaa attgaagatg tgctaattct ggagccaaga gtatttggtg atgatagagg 4260
tttcttttat gagagcttta atcaatcagc atttgaacat attctaggct atccggtcag 4320
ctttgttcaa gacaatcact cacgttcatc aaaaaatgta ctcagaggcc ttcactttca 4380
acgcggcgag tacgcacaag ataaacttgt acgctgcact catggagcag tttttgatgt 4440
tgctgttgat attcgaccca attcggtatc ctttggtaaa tgggttggtg ttctgctttc 4500
agctgataat aagcagcagt tgtggatacc aaaagggttt gctcatggct ttttggttct 4560
gtctgatatc gctgaatttc aatataaaac tacaaactat tatcatcctg aaagcgattg 4620
tggaatatgt tggaatgatg aacgcattgc aattgattgg ccccaaacat cagggttaat 4680
cctttcgcca aaagatgaaa ggctctttac gttagatgag cttatcagat taaaattaat 4740
tgcatgaggc cggccttaag gaggactagt cccggcgcgc catgagttta atcaaaaaca 4800
gtttttggaa cctttgcggg tatgtacttc cagctattgt gacactacca gctttgggta 4860
ttatggggcg aaaattaggc ccagaattat ttggtgtatt cactttggca ttagctgttg 4920
tgggttatgc aagcattttt gatgcaggcc ttactcgcgc agtgatacga gaagtcgcaa 4980
ttgaaaaaga taatgaagaa aataagttga aaattatttc ttcagcgaca gttgtaatta 5040
tttatttgag tttggccgcc tcactcttat tatttttttt tagtggtcat atcgcattgc 5100
tactgaacat tagtgagact ttttttcata atgtaagtgt ctcgcttaaa attctcgcag 5160
catccatacc attatttttg attactcaaa tatggttgtc aattttagaa ggtgaagaaa 5220
gatttggttt acttaatatc tacaaatcaa ttacgggagt gatattagca atctcaccgg 5280
cattatttat acttattaaa ccctctttga tgtatgcgat aataggctta gttctagcaa 5340
ggtttttatg ttttattttg gcttttataa tttgtcacga taaagtgctt aaagctaaac 5400
taacaatcga tataccaaca attaaaagat tgtttatgtt cggtggttgg attacagtaa 5460
gtaatatcat cagccctgtg ctatcatatt ttgataggtt tattgtttca aatcaacttg 5520
gggctgctaa tgttgctttt tatactgcac catcagaaat tatttctcgg cttagtataa 5580
ttccaggtgc gttttcaaga gccttatttc caagattagc taatgcaaat aattccgctg 5640
aaagatataa aacgaaaaga ttaattacaa tttcactttt aataatcatc acccctattt 5700
tttgtattgg cgtgttattt tcagagaaga taatggtttt atggatgggg gcatcatttt 5760
ttggtgagcc tggtttggta ttatcaatat tactgattgg ctttattttt aatggattgg 5820
cacaagtacc atttgccagt attcaatccc gaggtcatgc taagataact gcatttgttc 5880
atctcttaga gttgtttcct tatttattac ttttatttta cctcataaaa gcacatgggg 5940
ttgttggcgc gggtattgcg tggtcagtga ggatgatagt agattatata gcattaagtc 6000
ttttggacgg taagtatatt aataaataaa attcaaaatg caagttaata actcatggct 6060
ttatttgggt aggtgacaat ttataatgat atatatatta actttaactc ttcttctagt 6120
tatagccata atgttttctc ttctcggcac aaaaagtagg atcacatctc cattaccttt 6180
gcatttttta ccatggttac taactttaat tgtcgggata agtaattacg atcaatttta 6240
cgagtttaat gaaagaagct tttactcttt gttgatttgg tttacagtta tttttatatt 6300
ttatttcata ggggaactgg ttaattataa acgtgaaaat ataaatgttt attatggtct 6360
ttcacatatt aaatatgaat gtaaaaaata ttggatcatt gtcatcccaa tttcattata 6420
taccattttc gaaatatata tggttggtat ggggggagca gatggattct ttctcaattt 6480
acgtcttgca aatacattgg agggctatac gggtaaaaaa tttatcttaa tgcctgctgt 6540
atatcctcta atgatggcta tgttcgcaat tgtttgtcta acaaaaactt ccaaattaaa 6600
taaatactcc atttatttct ggatgttttt gtattgtatt ggcacaatgg gaaaattttc 6660
aatattaacg ccaatattga catatttaat tatttatgac ttcaaacata gattaaaagt 6720
aaaaaaaaca ataaagttta cattgttgat aattatatta gctttaactt tgcattttac 6780
acgtatggct gagaatgacc actcaacatt tttatctatt ttagggctct atatttattc 6840
accaataatt gctttaggcc agttgaatga agtaaatagt agtcattttg gtgagtatac 6900
gtttagattc atatatgcta taactaataa aattggcctt attaaagaat tgccagtaaa 6960
tactattctt gactattcat acgttcctgt accaacaaat gtatatactg cacttcaacc 7020
attttaccag gattttggtt atactggcat catatttgga gcagtattat acggactaat 7080
atatgtgagt ttatacacgg ccggtgttcg tggaaataat acacaggcat tactgattta 7140
cgcattgttt tcagttagca gtgcaacggc tttcttcgct gaaacgctag taacgaattt 7200
agctggaaat gtgatgttag tattatgtac catcttacta tggcgattta cagtaatatg 7260
caaaccagta cagtaaccat tctaatggcc acctacaatg gcgaggcctt catcaaaaat 7320
cagattttgt cactacaaca acaaacattt tctaactggc ggttatttat tcaggatgat 7380
gggtctacag acaatactat atctataata aaaaacttcc aaaaatctga ctccagaatt 7440
cggctagttg atgataattt gaaaggtcaa ggtgcaggaa aaaatttttt atcgctgata 7500
aagtacagcg agacagatta tacaatttat tgtgaccaag atgatatttg gttagaaaac 7560
aaaatatttg aattagtaaa gtatgcaaat gaaattaaat tgaatgtatc agatgcgcct 7620
tcgctagttt atgctgatgg ctatgcttat atggatggtg agggtacaat cgatttttct 7680
gggatatcta acaatcatgc tgatcaatta aaggattttc ttttttttaa tggtggatac 7740
caaggatgtt ctattatgtt caatcgtgca atgaccaaat ttcttctgaa ttatcgagga 7800
tttgtatatc tacatgacga tatcacaaca ttagctgcat acgctcttgg taaagtttat 7860
tttctcccga aataccttat gttatataga cagcacacga atgcggtaac tggtatcaaa 7920
acattccgca atggattgac ttctaaattt aaatcaccag taaactatct tttatcacga 7980
aaacattatc aggtaaaaaa atcttttttt gaatgtaaca gctctatctt atcagagacg 8040
aataaaaaag tttttttgga ttttatttca ttttgtgaat caaataataa atttacagat 8100
ttttttaagt tatggcgagg tgggtttaga ttaaataaca gtagaactaa attattatta 8160
aaattcttaa tacggagaaa atttagcgaa tgatttcaat acttacacct acttttaatc 8220
ggcaacatac tttatcaagg ctattcaatt ctcttatatt acaaactgat aaagattttg 8280
agtggataat aattgatgat ggtagtatag atgcaacagc ggtacttgta gaagatttta 8340
gaaaaaaatg tgattttgac ttgatttatt gctatcagga aaataatggt aagcccatgg 8400
ctttaaacgc tggtgttaaa gcttgtagag gcgattatat ctttattgtt gacagtgatg 8460
atgcactaac tcccgatgcc ataaaattaa ttaaagaatc aatacatgat tgcttatctg 8520
agaaggaaag tttcagcgga gtcggtttta gaaaagcata tataaaaggg gggattattg 8580
gtaatgattt aaataattct tcagaacata tatactattt aaatgcgact gagattagca 8640
atttaataaa tggtgatgtt gcatattgtt ttaaaaaaga aagtttggta aaaaatccat 8700
tcccccgtat agaagatgaa aaatttgttc cagaattata tatttggaat aaaataactg 8760
acaaggcgaa gattcgattt aacataagca aagttatata tctttgtgag tatcttgatg 8820
atggtctttc taaaaatttc cataaccagc ttaaaaaata cccaaagggg tttaagattt 8880
attacaaaga tcaaagaaaa cgagagaaaa cttatataaa aaaaacaaag atgctaatta 8940
gatatttgca atgttgttat tatgagaaaa taaaatgaaa atactatttg tcattacagg 9000
tttaggcctt ggaggtgctg agaagcaggt ttgtctttta gctgataaat taagtttaag 9060
cgggcaccat gtaaagatta tttcacttgg acatatgtct aataataaag tctttcctag 9120
cgaaaataat gttaatgtca ttaatgtaaa tatgtcaaaa aacatttctg gagttataaa 9180
aggttgtgtc agaattagag atgttatagc taatttcaaa ccagacattg tacacagtca 9240
tatgtttcat gcaaacatta tcactagatt gtctgtaatt ggaatcaaaa acagacctgg 9300
tattatatca actgcacata ataaaaatga aggtgggtat ttcagaatgc tcacatatag 9360
aataaccgat tgtttaagtg attgttgtac aaatgttagc aaagaagcag tggatgagtt 9420
tttacggata aaagccttta atcccgctaa agcaattact atgtataatg ggatagatac 9480
caataaattt aaatttgatt tattggcaag gagggaaatt cgagacggta ttaatataaa 9540
aaatgatgat atattattac ttgctgcagg tcgtttaacg ttagctaaag attatcctaa 9600
tttattgaat gcaatgactc tgcttcctga acactttaaa cttattatta ttggtgatgg 9660
tgaattgcgt gacgaaatta atatgcttat aaaaaaattg caattatcta atagggtgtc 9720
cttgttggga gttaaaaaaa atattgctcc ctatttttct gcatgtgata tttttgttct 9780
ctcttctcgt tgggaaggat ttggattagt cgtggcagaa gctatgtcat gtgagcgaat 9840
tgttgttggc acggattcag ggggagtaag agaagttatt ggtgacgatg attttcttgt 9900
acccatatct gattcaacac aacttgcaag caaaattgaa aaattgtctt tgagccagat 9960
acgtgatcac attggttttc ggaatcgtga gcgtatttta aaaaatttct caatagatac 10020
tattattatg cagtggcaag aactctatgg aactataatt tgctcaaaac atgaaaggta 10080
gatttatatt tggaacgtgt cttttgtttg aatttaattc aatctcaatt gagatttttg 10140
tatttcaaaa ataccatcat agctaacgat gattggtatt tattttaaga tgctttctat 10200
aaatatattg acgtttttaa tgcgccgaaa cgattgggct gggaacagag aagtaaaact 10260
gttttgagaa tgaagagttt ttgagatgtt tatggatatt aaaaattgat ccagtgaatt 10320
aattatttat aataaatcaa gatttaatgt taataaatga taatcttttc tgacactcat 10380
attaattatg agtggtacgt ttggtaaacg gtaaactatt atatgacagc tagaacaact 10440
aaagttttgc acttacaatt actcccactc ttaagtggcg ttcaaagggt aacattaaac 10500
gaaattagtg cgttatatac tgattatgat tatacactag tttgctcaaa aaaaggtcca 10560
ctaacaaaag cattgctgga atatgatgtc gattgtcatt gtatccccga acttacgaga 10620
gaaattaccg taaagaatga ttttaaagca ttgttcaagc tttataagtt cataaaaaaa 10680
gaaaaatttg acattgtgca tacacattct tcaaaaacag gtattttggg gcgagttgct 10740
gccaaattag cacgtgttgg aaaggtgatc cacactgtac atggtttttc ttttccagcc 10800
gcatctagta aaaaaagtta ttacctttat tttttcatgg aatggatagc aaagttcttt 10860
acggataagt taatcgtctt gaatgtagat gatgaatata tagcaataaa caaattaaaa 10920
ttcaagcggg ataaagtttt tttaattcct aatggagtag acactgataa gttttctcct 10980
ttagaaaata aaatttatag tagcaccttg aatctagtaa tggttggtag attatccaag 11040
caaaaagatc ctgagacatt attgcttgct gttgaaaaac tgctgaatga aaatgttaat 11100
gttaagctga cacttgtagg agatggtgaa ctaaaagaac agttagaaag caggttcaaa 11160
cggcaagatg gacgtataat ttttcatgga tggtcagata acattgttaa tattttaaaa 11220
gttaatgatc tttttatatt accttctctt tgggagggta tgccattagc aattttagaa 11280
gcattgagct gtggacttcc atgtatagtc actaatattc caggtaataa tagcttaata 11340
gaagatggct ataatggttg tttgtttgaa attagagatt gtcagttatt atctcaaaaa 11400
atcatgtcat atgttggtaa gccagaactg attgcacagc aatctaccaa tgcacgatca 11460
tttattctga aaaattatgg attagttaaa agaaataata aggtcagaca gctatatgat 11520
aattaagagc tcggtacccg ggcctagggt gtaggctgga gctgcttcga agttcctata 11580
ctttctagag aataggaact tcggaatagg aactaaggag gatattcata tccgtcgacg 11640
gcggccgccc tgcaggcatg caagcttgat ccatatggat cgctagctta attaaataaa 11700
gccgtaagca tataagcatg gataagctat ttatacttta ataagtactt tgtatactta 11760
tttgcgaaca ttccaggccg cgagcattca gcgcggtgat cacacctgac aggagtatgt 11820
aatgtccaag caacagatcg gcgtagtcgg tatggcagtg atgggacgca accttgcgct 11880
caacatcgaa agccgtggtt ataccgtctc tattttcaac cgttcccgtg agaagacgga 11940
agaagtgatt gccgaaaatc caggcaagaa actggttcct tactatacgg tgaaagagtt 12000
tgtcgaatct ctggaaacgc ctcgtcgcat cctgttaatg gtgaaagcag gtgcaggcac 12060
ggatgctgct attgattccc tcaaaccata tctcgataaa ggagacatca tcattgatgg 12120
tggtaacacc ttcttccagg acactattcg tcgtaatcgt gagctttcag cagagggctt 12180
taacttcatc ggtaccggtg tttctggcgg tgaagagggg gcgctgaaag gtccttctat 12240
tatgcctggt ggccagaaag aagcctatga attggtagca ccgatcctga ccaaaatcgc 12300
cgccgtagct gaagacggtg aaccatgcgt tacctatatt ggtgccgatg gcgcaggtca 12360
ctatgtgaag atggttcaca acggtattga atacggcgat atgcagctga ttgctgaagc 12420
ctattctctg cttaaaggtg gcctgaacct caccaacgaa gaactggcgc agacctttac 12480
cgagtggaat aacggtgaac tgagcagtta cctgatcgac atcaccaaag atatcttcac 12540
caaaaaagat gaagacggta actacctggt tgatgtgatc ctggatgaag cggctaacaa 12600
aggtacgggt aaatggacca gccagagcgc gctggatctc ggcgaaccgc tgtcgctgat 12660
taccgagtct gtgtttgcac gttatatctc ttctctgaaa gatcagcgtg ttgccgcatc 12720
taaagttctc tctggtccgc aagcacagcc agcaggcgac aaggctgagt tcatcgaaaa 12780
agttcgtcgt gcgctgtatc tgggcaaaat cgtttcttac gcccagggct tctctcagct 12840
gcgtgctgcg tctgaagagt acaactggga tctgaactac ggcgaaatcg cgaagatttt 12900
ccgtgctggc tgcatcatcc gtgcgcagtt cctgcaaaaa atcaccgatg cttatgccga 12960
aaatccacag atcgctaacc tgttgctggc tccgtacttc aagcaaattg ccgatgacta 13020
ccagcaggcg ctgcgtgatg tcgttgctta tgcagtacag aacggtattc cggttccgac 13080
cttctccgca gcggttgcct attacgacag ctaccgtgct gctgttctgc ctgcgaacct 13140
gatccaggca cagcgtgact attttggtgc gcatacttat aagcgtattg ataaagaagg 13200
tgtgttccat accgaatggc tggattaa 13228
<210> 18
<211> 13554
<212> DNA
<213> Artificial Sequence
<220>
<223> example O25B rfb locus nucleotide sequence - O25B-EPA production
strain stGVXN4459
<400> 18
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320
tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380
cgccggaaac ctggaatcac ttgcagatgt ttctgattct gaacgctatt tctttgaaca 1440
tgcggatatt tgtgatgcag ctgcaatggc acggattttt gctcagcatc agccggatgc 1500
agtgatgcac ctggcagctg aaagccatgt tgaccgttca attacaggcc ctgcggcatt 1560
tattgaaacc aatattgtgg gtacttatgt ccttttagaa gcggctcgga attattggtc 1620
tggtctggat gatgaaaaga aaaaaaactt ccgttttcat catatttcta ctgatgaggt 1680
gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740
ggaaacgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800
tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860
caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaattcact 1920
ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980
agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040
taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100
gttggatgag atagtcccga aagagaaatc ttaccgcgag caaattactt atgttaccga 2160
tcgtccggga cacgatcgcc gttatgcgat tgatgctgag aagattggtc gcgaattggg 2220
atggaaacca caggaaacgt ttgagagtgg gattcgtaaa acggtggaat ggtacctgtc 2280
caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340
ctatgagggc cgccagtaat gaatatcctc ctttttggca aaacagggca ggtaggttgg 2400
gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460
gattactgtg gtgattttag taatcctgaa ggtgtagctg aaaccgtaag aagcattcgg 2520
cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580
aagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640
gtcggcgcct gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700
ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagcg 2760
ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820
tatgcaggta aaggaaataa cttcgccaaa acaatgttgc gtctggcaaa agagcgtgaa 2880
gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt actggctgat 2940
tgtacggcac atgctattcg tgtggcactg aataaaccgg aagtcgcagg cttgtaccat 3000
ctggtagcta gtggtaccac aacgtggcac gattatgctg cgctggtttt tgaagaggcg 3060
cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagcctat 3120
cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180
tttgcgcttg tcttgcctga ctggcaggtt ggcgtgaaac gaatgcttaa cgaattattt 3240
acgactacag caatttaata gtttttgcat cttgttcgta atggtggagc aagatgtatt 3300
aaaaggaatg atgaaatgaa aacgcgtaaa ggtattattt tggcgggtgg ttctggtact 3360
cgtctttatc ctgtgacgat ggccgtcagt aaacagctgt taccgattta tgataaaccg 3420
atgatctatt acccgctctc tacactgatg ttagcgggta ttcgcgatat tctgattatc 3480
agtacaccac aggatactcc tcgttttcaa caactgctgg gtgacgggag ccagtggggc 3540
ctgaatcttc agtacaaagt gcaaccgagt ccggatggtc ttgcgcaggc gtttattatc 3600
ggtgaagagt ttattggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660
ggccacgacc tgccgaagtt aatggacgta gctgttaaca aagaaagtgg tgcaacggta 3720
tttgcctatc acgttaatga tcctgaacgt tatggtgtcg tggagtttga taataacggt 3780
actgcaatta gcctggaaga aaaaccgctg gaaccaaaaa gtaactatgc ggttactggg 3840
ctttatttct atgacaatga cgttgtggaa atggcgaaaa accttaagcc ttctgcccga 3900
ggtgaactgg aaattaccga tattaaccgt atttatatgg aacaaggacg tttgtctgtc 3960
gctatgatgg ggcgtggcta tgcatggctg gatacaggga cgcatcaaag tcttattgaa 4020
gcaagcaact tcattgccac cattgaagag cgccagggac taaaggtttc ctgtccggaa 4080
gaaattgctt atcgtaaagg gtttattgat gctgagcagg taaaagtatt agccgaaccg 4140
ttgaagaaaa atgcttatgg tcagtatctg ctcaaaatga ttaaaggtta ttaataagat 4200
gaacgtaatt aaaactgaaa ttcctgatgt gctgattttt gaaccaaaag tttttgggga 4260
tgaacgtggc ttcttttttg agagttttaa tcagaggatt tttgaagaag cagtaggtcg 4320
taaggttgag tttgttcagg ataaccattc taagtccagt aaaggtgttt tacgtggtct 4380
tcattatcag ttagaacctt atgctcaagg aaaactggtg cgctgtgttg ttggcgaggt 4440
ttttgatgtt gcggttgata ttcgtaaatc gtcacctaca tttgggaaat gggttggggt 4500
gaatttgtct gctgagaata agcgtcagtt gtggattcct gagggatttg cacatggttt 4560
tttggtgctg agtgatttag cagaagtttt atataaaacg aatcaatatt atgctccatc 4620
acatgaaaaa aatattatat ggaatgacct cttgcttaat attaaatggc cgagcacagc 4680
actgatcact ctgtctgata aggatgcaaa tggggaaaga tttgaactaa gtgagttttg 4740
aaatgtctct cttaaaacat agtatatgga atgttgcggg ctactttata ccaacattaa 4800
ttgcaattcc cgcctttgga ttaattgcga ggaaaattgg tgtagaacta tttggtttgt 4860
atacgttagc aatgattttt atagggtatg caagtatatt tgatgctggg ttaacaagag 4920
ctgttgtgcg tgaaatagca ttactaaaaa acagagtgga cgattgtaat acgataatag 4980
taacttctat tatcgctgtg atatttttag ggtttatcgg aggcggggga gtgtttctgc 5040
ttaaaggcga tattattgaa ctgttaaata tctcaccaat atattacgcc gattcgataa 5100
agtctctagt attattatca tctctgatac ctgtattctt agtcacgcaa atactattag 5160
cagagcttga gggtcgggaa tattttggga ttctaaatat acaaaaaagt gtagggaatt 5220
ctttaattgc agggttacct gcattatttg ttttaattaa tcaaacgctt ttttctgcaa 5280
ttattggtgt agcgattgca agagttatat gcttgtggtt aagctacatt atgagcaggg 5340
aaagaataac tatcgatatc tcattttttt caataactgt tttaaagcgg ttatttagat 5400
atggcgggtg ggtaactata agtaacataa tatctcctat attagcgagt atggatagat 5460
ttattctatc ccatatccag ggagcatcaa aaatatcatt ctatacagtc cctaatgagc 5520
tggtaactag gcttggaata gttccaggct ctcttgggaa agctgttttt ccaaaattaa 5580
gtcatgcaag gaattttaca gcgtcatatg cagagcaaaa aaaagcttat atattaatga 5640
ctgtcattgt aatgcctttg gttttatttg tatattatta cgcaaagttt attttaacat 5700
tgtggatggg ggctgagtat gcagggattt cggtcgaaat attacggatt atgcttatag 5760
ggtatatttt taactgttat tcacaaatct cttttgccaa catacaggcc tttggaaaag 5820
caaaatacac tgcatacatc catatgatgg aatttattcc ttatttgata atgttatata 5880
taatttcaaa ggaatatggg gttattggtg ttgcgtggtt atggacaatt cgagtaataa 5940
ttgatttttt gatgctttta tatatgagtt atcgttgtaa taatcttatg aaaaaagggt 6000
agcctgatga tatatattgt ggtattaaat tggaatgggg ctatagatac cattaattgt 6060
gttaaaagtt taatggattt aaatgttagc gattataaaa ttatcattgt tgataactgt 6120
tctatggata actcatatga tactataaaa gaaaatctta attcattata tattgctgat 6180
aaaagtatca ttgaggtgaa gtatgaggat agaaataaat ataaaacctt agaaaacgat 6240
aaaatcatat taatacaatc tccgcaaaat aatgggtacg caagtggtaa taatattggc 6300
atagagttcg ctcttaatca ggagaatatg aaatacgtct gggttctgaa taatgatact 6360
gaagtggata aagaggcttt aactcattta attagtaaat gtgattcaga taaaagtata 6420
gggatttgcg gttctcgttt agtctatttt gccgacagag agatgcagca aggactaggt 6480
ggggtgcata acaaatggtt atgcactaca aaaaattatg aaatgggaag attagtttcc 6540
aaaaaatatg atgatgaagt cattagtaat gatatagatt atataattgg cgcatcgatg 6600
tttttctcta gagaatgttt ggaaacagtt ggattgatga atgaagaata ttttttatac 6660
tatgaagagt tagatatttg cctcagagca aaagcaaaga actttaaatt aggtatttgc 6720
tcagaaagtt tggtttatca taaaataggt gcaagtactg atgggggaaa gagcatgatg 6780
gctgatcttt gctcaataaa aaataggctg gtcattacag aaaggtttta tccccaatat 6840
tattggacgg tatggttgtc actttttgtt gtagcattta accgtgctag aagaggtgag 6900
tttaataaga tgaaaagatg tttgaatgtt atgtttaact tcaaacgaaa caaaggtagc 6960
aaatgccatt agaatatgca cttaatcatg gtgttaataa atctatagtt tgatatgtta 7020
ttaaagggta tttaatgaaa gtggcttttt tatctgctta tgatccacta tctacatcca 7080
gttggtctgg cacaccttat tatatgctaa aggcattatc gaagagaaat atttccattg 7140
aaatattagg accggtaaat agctatatga tatacatgtt aaaagtatat aaattaatat 7200
taaggtgttt cggaaaagaa tatgattata gtcattcgaa gttgctttcc aggtattacg 7260
gtagaatatt cggtaggaaa ttaaaaaaaa ttgatggttt ggattttatt atcgcacctg 7320
caggttcctc acaaattgct tttttaaaaa caaccatacc aataatatat ctatcggata 7380
caacatatga tcaattaaaa agctattatc cgaatttaaa taaaaaaaca attataaatg 7440
atgaggatgc aagtttaatc gaacgcaagg ctattgaaaa agcaacagta gtatctttcc 7500
catctaaatg ggcaatggat ttttgcagga attattacag attagatttt gataaattag 7560
ttgaaatacc atggggggct aatttatttg atgatattca ctttgctaat aaaaatataa 7620
ttcaaaagaa tagttatact tgtcttttct tgggagttga ttgggaaaga aaaggtggga 7680
aaacagcctt gaaagcaatt gaatatgtaa ggcagttata tgggatcgat gttagactaa 7740
aaatttgtgg atgtactccg aatcaaaaga ttttacctac ttgggttgaa ttaattgata 7800
aagtagataa aaataacgtt gacgaatatc agaaattcat cgatgtgtta tctaacgctg 7860
atatacttct tttaccaacc attgctgaat gttatggaat ggtattttgt gaagctgctg 7920
cttttggatt gcctgttgtc gctacagata caggtggagt cagttctata gttatcaacg 7980
aaaggacggg gatattaatt aaagacccgt tagactataa gcactttgga aatgcaattc 8040
ataaaataat tagttccgta gagacttatc aaaactactc ccaaaacgca agaattagat 8100
ataataatat attgcattgg gacaattggg ctaaaaagat aattgagatt atgtatgagc 8160
ataagaatag aagaatcaaa tagcacaaaa agaattatat gtttatttat actttttctt 8220
gttttccctg attttttgtt ttatacatta ggggttgata attttagcat ttcaacgata 8280
atctcaatta cattgctttt tgttttttta agagctaaaa atatttgcaa agataatttt 8340
ctaataatag tagcgttatt catattgttg tgttttaact gtttgttaag tatgctattt 8400
aatattgaac aggctttaac atttaaagtt gtactttcaa tatatagcat cttaataatg 8460
gcatacgtct cctcttgtta tgcacagacg ttgtggttat gttctgaaga aatacttaag 8520
agatccgtct tttatttgtt cgcatttctt tgccttattg gcattataag tattctttta 8580
cagaagactg agattataca tgataaaagt atgattcttt ttcctgaacc atcagcattt 8640
gcattggttt ttatacctat cttttcattt tgtttatact atacaagagg gggggggcta 8700
ctattgctct atatattatc tttgggtatt gcgttaggta tccagaattt aacaatgttg 8760
gtaggcattg tgattagtgt ttttgtgatg aaaaaaataa ctataaggca aactattgtt 8820
atacttttgg gggcatggat tttttccatg atattaagtg atttagacat ttcttactat 8880
acatcgcggc ttgattttaa aaatactacg aacctatcag tgcttgtata tctttcagga 8940
attgaaagag ctttcttgaa ttttattaca agttatggtc ttggtattgg ttttcaacaa 9000
atgggagtga atggggagat aggaatatat caacaaattt tagctgaact tgatgcccct 9060
atgttaaata tatacgatgg ctcatttatt tcttctaagt taatatctga gtttggggtt 9120
attggtgcat taatgtgtat tttctatttt ttttattttt cccgatttta tctgcgtttc 9180
aaaaaaagta agagatattc accgcagtat attttagcat atagcttcta catgtgtttc 9240
ttcatccctc tttttatacg tggtgctggt tatataaacc cctatgtgtt tatgttattt 9300
tcatcaatat ttttgtgcaa atatcacgct aaaaatatct tgatgaaatc taatgtccag 9360
atagctatat aatagtagat tatattatca ttatcacgta aattacatat taatagcata 9420
tatgataact aggacataaa taatgtgcat taaaaaaaaa cttaagttaa ttaaacgata 9480
tggcctttat ggtggtctta ggcttcttaa agatatattc ttaacaaaat ttttattttg 9540
ttcaaatgtt aggattatta gatttccatg ttatattaga aaagatggaa gtgttagttt 9600
tggaaaaggt tttacatcag gtgtaggatt acgagttgat gcatttatgg atgccgtagt 9660
ttccattgga gaaaatgttc aaattaatga ctatgttcac atcgcggcta ttaataatgt 9720
cattattggt agagatacat taatagcaag taaagtattt attagtgatc ataatcatgg 9780
tattttttct aaatccgata tccatagttc accaactatt attccttcgt ctaggcccct 9840
tgaatctgca cctgtgtata ttggagagcg tgtgtggatt ggcgaaaatg tgacaatatt 9900
accaggtgcg tgtataggta atggtgtagt tattggcgca aacagtgttg ttcgtggtga 9960
gattcctaat aatgtgatca ttgctggtgt tccagctaaa attgttaaaa aatataacta 10020
tgagcgtatg caatgggaaa gaatatagtt gtaatatcgg ctgttaattt tacaaccgga 10080
ggccccttta ccgtactaaa aaatgtgctt acagcaacta aagatagagc cgaatgtaaa 10140
tttattgcac tggttcatag ctctgctgaa ctaatggaat tatttccgtg ggttgaattt 10200
atagagtatc cagaagtcaa gtcttcgtgg gttaaaagat tatatttcga atatataact 10260
tgcaatagat tatctaaggt gattaaggca actcattggg tatgcttaca tgatattaca 10320
gcaaatgtta gtgtacccta tagatttgtt tattgccaca atcctgcacc gttctataaa 10380
tatttaagct atcgagatat tataggagaa cctaaatttt atctttttta tcttttttat 10440
gggcttttat acaatatcaa tataaaaaag aacacagcag tttttgttca gcagcagtgg 10500
ctaaaaaaag aattcgaaaa aaaatataag ttaaagaatg ttgttgttag tcgccctgaa 10560
gatatttgcc cttttgaaag tgatggtttg gtaagaaata ataataaaaa ggatgtgagg 10620
atattttacc cagcagtgcc ccgtatattt aaaaactttg aagttatcat acgtgctgca 10680
caaatattac aagataaaaa tattcatttt tatcttactt ttgatggtac tgaaaataag 10740
tatgcaaaaa gaatatataa attagcttcc gaactgaaaa atgtacattt cctcggttac 10800
cttaatgcaa ccgagatggt taacttttat caagattcag atattatttg tttcccatcg 10860
aaactagaaa cgtggggatt accattatca gaagctaaaa catacaaaaa atggatattt 10920
gcggcagact taccttatgc tcatgaagtt ttatataact attcaaaaac tagatatttt 10980
ccatttgacg atgagaaaat acttgttcgc tacatattag agtacacaag taaaaatatg 11040
catgaagata taaaaaatag tagggtgaat tttaataatg atgcattgac tggttttgaa 11100
cagtttattg aatatatcct caaggggaac tgacgtggtt tatattataa tcgtttcaca 11160
tggccatgat gactatatag aaaatctttt attaaattta aagttgccct ctggaagatt 11220
taaaataata gttcgtgata acaaaagttc aatggtttta aaaaaaacat gcgaaaaaaa 11280
ttgcgtaacc tatttgcatg gagggcaata tggatttgga cataataata acatagcagt 11340
gtcatatata attaataact tcatgattat gaataatgat tattttctct ttcttaaccc 11400
cgatgtattc ataaccagtg aaagtttgat taattatgtt gattatataa ttagtaatga 11460
ttataagttt agcacattat gtctttatcg agattttact aaaagcaaac atgattattc 11520
aatacggagt tttccaactt tatatgattt tctttgttct tttttattgg gggtgaataa 11580
aagtaaaatt aagaaggaaa atatactttc tgatactgta gttgattggt gtgctggctc 11640
atttatgctt attcatgctt taagtttctt aaatgtgaat ggttttgatc aaaaatattt 11700
tatgtattgt gaagatattg acctttgtat gcgtttaaaa ttaagtggag tagatcttta 11760
ctatactccc cattttgatg ctattcatta tgcgcagcat gaaaatagaa gaatatttac 11820
taaagcattt cgatggcata taaggagtat tacgcgctac atattacgga aaccaattct 11880
ttcttataaa aactatagaa aaattacatc cgaactggta aagtgattaa ggatccgtgt 11940
aggctggagc tgcttcgaag ttcctatact ttctagagaa taggaacttc ggaataggaa 12000
ctaaggagga tattcatatg gataaagccg taagcatata agcatggata agctatttat 12060
actttaataa gtactttgta tacttatttg cgaacattcc aggccgcgag cattcagcgc 12120
ggtgatcaca cctgacagga gtatgtaatg tccaagcaac agatcggcgt agtcggtatg 12180
gcagtgatgg gacgcaacct tgcgctcaac atcgaaagcc gtggttatac cgtctctatt 12240
ttcaaccgtt cccgtgagaa gacggaagaa gtgattgccg aaaatccagg caagaaactg 12300
gttccttact atacggtgaa agagtttgtc gaatctctgg aaacgcctcg tcgcatcctg 12360
ttaatggtga aagcaggtgc aggcacggat gctgctattg attccctcaa accatatctc 12420
gataaaggag acatcatcat tgatggtggt aacaccttct tccaggacac tattcgtcgt 12480
aatcgtgagc tttcagcaga gggctttaac ttcatcggta ccggtgtttc tggcggtgaa 12540
gagggggcgc tgaaaggtcc ttctattatg cctggtggcc agaaagaagc ctatgaattg 12600
gtagcaccga tcctgaccaa aatcgccgcc gtagctgaag acggtgaacc atgcgttacc 12660
tatattggtg ccgatggcgc aggtcactat gtgaagatgg ttcacaacgg tattgaatac 12720
ggcgatatgc agctgattgc tgaagcctat tctctgctta aaggtggcct gaacctcacc 12780
aacgaagaac tggcgcagac ctttaccgag tggaataacg gtgaactgag cagttacctg 12840
atcgacatca ccaaagatat cttcaccaaa aaagatgaag acggtaacta cctggttgat 12900
gtgatcctgg atgaagcggc taacaaaggt accggtaaat ggaccagcca gagcgcgctg 12960
gatctcggcg aaccgctgtc gctgattacc gagtctgtgt ttgcacgtta tatctcttct 13020
ctgaaagatc agcgtgttgc cgcatctaaa gttctctctg gtccgcaagc acagccagca 13080
ggcgacaagg ctgagttcat cgaaaaagtt cgtcgtgcgc tgtatctggg caaaatcgtt 13140
tcttacgccc agggcttctc tcagctgcgt gctgcgtctg aagagtacaa ctgggatctg 13200
aactacggcg aaatcgcgaa gattttccgt gctggctgca tcatccgtgc gcagttcctg 13260
cagaaaatca ccgatgctta tgccgaaaat ccacagatcg ctaacctgtt gctggctccg 13320
tacttcaagc aaattgccga tgactaccag caggcgctgc gtgatgtcgt tgcttatgca 13380
gtacagaacg gtattccggt tccgaccttc tccgcagcgg ttgcctatta cgacagctac 13440
cgtgctgctg ttctgcctgc gaacctgatc caggcacagc gtgactattt tggtgcgcat 13500
acttataagc gtattgataa agaaggtgtg ttccataccg aatggctgga ttaa 13554
<210> 19
<211> 15197
<212> DNA
<213> Artificial Sequence
<220>
<223> example O75 rfb locus nucleotide sequence - O75-EPA production
strain stLMTB11737
<400> 19
atgacgaatt taaaagcagt tattcctgta gcgggtctcg ggatgcatat gttgcctgcc 60
actaaggcga tacccaaaga gatgctacca atcgtcgaca agccaatgat tcagtacatt 120
gttgacgaga ttgtggctgc agggatcaaa gaaatcctcc tggtaactca cgcgtccaag 180
aacgcggtcg aaaaccactt cgacacctct tatgagttag aatcactcct tgagcagcgc 240
gtgaagcgtc aactgctggc ggaagtacag tccatctgtc cgccgggcgt gaccattatg 300
aacgtgcgtc agggcgaacc tttaggttta ggccactcca ttttgtgtgc gcgacctgcc 360
attggtgaca acccatttgt cgtggtactg ccagacgttg tgatcgacga tgccagcgcc 420
gacccgctac gttacaacct tgctgccatg attgcacgtt tcaacgaaac gggccgcagc 480
caggtgctgg caaaacgtat gccgggtgac ctctctgaat actccgtcat ccagactaaa 540
gagccgctgg accgtgaggg taaagtcagc cgcattgttg aatttatcga aaaaccggat 600
cagccgcaga cgctggactc agacatcatg gccgtaggtc gctatgtgct ttctgccgat 660
atttggccgg aactggaacg tactcagcct ggtgcatggg gacgtattca gctgactgat 720
gctattgccg agctggcgaa aaaacaatcc gttgatgcaa tgctgatgac cggcgacagt 780
tacgactgcg gcaaaaaaat gggctatatg caggcgtttg tgaagtatgg cctacgcaac 840
ctgaaagaag gggcgaagtt ccgtaaaggt attgagaagc tgttaagcga ataatgaaaa 900
tctgaccgga tgtaacggtt gataagaaaa ttataacggc agtgaaaatt cgcagcaaaa 960
gtaatttgtt gcgaatcttc ctgccgttgt tttatataaa ccatcagaat aacaacgagt 1020
tagcagtagg gttttattca aagttttcca ggattttcct tgtttccaga gcggattggt 1080
aagacaatta gcgtttgaat ttttcgggtt tagcgcgagt gggtaacgct cgtcacatca 1140
taggcatgca tgcagtgctc tggtagctgt aaagccaggg gcggtagcgt gcattaatac 1200
ctctattaat caaactgaga gccgcttatt tcacagcatg ctctgaagta atatggaata 1260
aattaagcta gcagtgaaga tacttgttac tggtggcgca ggatttattg gttctgctgt 1320
tgttcgtcac ataataaata atacgcaaga tagtgttgtt aatgtcgata aattaacata 1380
cgccggaaac ctggaatcgc tcgctgaaat ttctgattct gaacgttatt catttgagca 1440
tgcagatatc tgcgatgccg aagcgatggc tcgtattttc gcacagcacc agccagacgc 1500
ggtgatgcac ctggcagcag agagccacgt tgaccgctca ataactggcc ctgcggcatt 1560
tattgaaacc aatattgtgg gtacttatgt tcttttagaa gcggcgcgca attattggtc 1620
tggtctggat gatgaaaaga aaaaaaactt ccgctttcat catatttcta ctgatgaggt 1680
gtatggtgac ttaccccatc cggatgaagt aaatagcaat gaaacgttgc cgctatttac 1740
ggaaatgaca gcatacgcgc caagtagtcc atattctgct tctaaagctt ccagcgatca 1800
tttggttcgc gcatggaaac gtacttatgg tttaccgacc attgtgacta attgctcgaa 1860
caactatggt ccttatcatt tcccggaaaa gcttattcca ctggttattc ttaatgcact 1920
ggaaggtaag gcattaccta tttatggcaa aggagatcag atccgcgact ggttgtatgt 1980
agaggatcat gctcgagcgt tatataccgt cgtaaccgaa ggtaaagcgg gcgaaactta 2040
taacattggt ggacacaacg aaaagaaaaa catcgacgta gtgttcacta tttgtgattt 2100
gttggatgag atagtcccga aagagaaatc ttatcgtgag caaattacct atgttgctga 2160
tcgcccaggg catgatcgcc gttatgcaat tgatgccgat aaaattagcc gcgaattggg 2220
ctggaaacca caggaaacgt ttgagagcgg gattcgtaaa actgtggaat ggtatctgtc 2280
caatacaaaa tgggttgata atgtgaaaag tggtgcctat caatcgtgga ttgaacagaa 2340
ctatgggggc cgccactaat gaatatcctc ctttttggca aaacagggca ggttggttgg 2400
gaactacagc gtgctctggc acctctgggt aatttgattg ctcttgatgt tcactccact 2460
gattactgtg gtgattttag taaccctgaa ggtgtggctg aaaccgttag aagcattcgg 2520
cctgatatta ttgtcaacgc agccgctcac accgcagtag acaaagcaga atcagaaccg 2580
gagtttgcac aattactgaa cgcgacgagt gtcgaagcga tcgcgaaagc agccaatgaa 2640
gtcggcgctt gggttattca ctactctact gactacgtat ttccggggac cggtgaaata 2700
ccatggcagg aggaggatgc aaccgcaccg ctaaatgttt acggtgaaac caagttagca 2760
ggagaaaaag cattacaaga gcattgtgcg aagcacctta ttttccggac cagctgggtc 2820
tatgcaggta aaggaaataa cttcgccaaa acgatgttgc gtctggcaaa agagcgtgaa 2880
gaattagccg ttattaatga tcagtttggt gcgccaactg gcgcagagtt gctggctgat 2940
tgtacggcac atgccattcg tgtggcactg aataaaccgg aagtcgcagg tttgtaccat 3000
ctggtagcca gtggtaccac aacctggcac gattatgctg cgctggtttt tgaagaggcg 3060
cgcaaagcag gcattcccct tgcactcaac aagctcaacg cagtaccaac aacagtctat 3120
cctacaccag ctcgtcgtcc acataactct cgccttaata cagaaaaatt tcagcagaac 3180
tttgcgcttg tcttgcctga ctggcaggtt ggtgtgaaac gcatgctcaa cgaattattt 3240
acgactacag caatttaata gtttttgcat cttgttcgtg atggtggaac aagatgaatt 3300
aaaaggaatg atggaatgaa tacgcgtaaa ggtattattt tagcgggtgg ttctggtaca 3360
cgtctttatc ctgtgactat ggctgtcagt aaacagctgt taccgattta tgataaaccg 3420
atgatctatt acccgctctc tacactgatg ttggcgggta ttcgcgatat tttgattatc 3480
agcacgccac aggatactcc tcgttttcaa caactgctgg gtgatgggag ccagtggggg 3540
ctaaatcttc actacaaagt gcaaccgagt ccggatggtc ttgcgcaggc atttatcatc 3600
ggtgaagagt ttatcggtgg tgatgattgt gctttggtac ttggtgataa tatcttctac 3660
ggtcacgacc tgcctaagtt aatggatgcc gctgttaaca aagaaagtgg tgcaacggta 3720
tttgcctatc acgttaatga tcctgaacgc tatggtgtcg ttgagtttga taaaaacggt 3780
actgcaatca gcctggaaga aaaaccgtta caaccaaaaa gtaattatgc ggtaaccggg 3840
ctttatttct atgataacta cgttgtggaa atggcgaaaa atcttaagcc ttctgcccgc 3900
ggtgaactgg aaattaccga tattaaccgt atctatatgg aacaggggca tttatctgtt 3960
gccatgatgg gacgtggata tgcctggctg gacacgggga cacatcaaag tcttattgaa 4020
gcaagcaact tcattgccac cattgaagag cgccagggct tgaaagtttc ctgcccggaa 4080
gaaattgctt accgtaaagg gtttattgat gctgagcagg tgaaagtatt agctaaaccg 4140
ctgaaaaaaa atgcttatgg tcagtatctg ctaaaaatga ttaaaggtta ttaataaaat 4200
gaatgttatt aaaacagaaa ttccagatgt actgattttt gaaccgaaag tttttggtga 4260
tgagcgtggt ttctttatgg aaagctttaa tcagaaagtt ttcgaagagg ctgtagggcg 4320
gaaggttgaa tttgttcagg ataatcattc taaatcgtgt aaaggtgtac ttagaggttt 4380
acactttcag cttcctccct ttgagcaggc aaaattagta aggtgtatag ttggcgaggt 4440
atttgatgtt gcagtagaca ttagacctaa ttctgaaaca tttggttcat gggttggagt 4500
aactctttcg tcagaaaata aaaggcagct atggattcca gaaggattcg cccatggttt 4560
tttaacttta agtgatattg cagagtttgt ttataaaact aacaactatt attctttaaa 4620
tcatgaaagg ggagtcattt ggaacgatga ggaaattaac attgcctggc cctctcaatc 4680
agagaagatt ctgtcacaga aagatattaa tttaccatca tttagatttg ttcaaatgtt 4740
tagcaagtag tgttatcttt acactgcaca tagtcatcat tttttatgct ttaagtaaat 4800
tatattgcac atctataaca caaagcgcaa taatatttcg acctgatgaa ggtttgtggt 4860
tatttatctt tctaggcgtt ttttatgact aaaatagttg tggtttctac agctccaata 4920
ttcccgacaa ataatgggta caaaagttct gtattaggaa gaattgatga gttattaaat 4980
gaggataatg aggtcgtttt gattgaaata aaccttgaaa atgttacgga aaagaaagat 5040
gaattaatac caacaagatt taataatatt caaagatatg aagtaaaaaa aatatctaga 5100
tcatttattg ccgagttaca aatattattt gatatcagaa ctcggtatga acaattattt 5160
tcttctgctg acattagaga taacataaaa aagataattg atttagaaaa accttctatt 5220
attattgctg agtctatatg ggcgttgcaa gcattgccta ttgaaattag tgcgagaata 5280
cactgtgtta ttcatgatgt ggcaactgat ttctttaaag aaatgtttgt atctcataat 5340
gaggttgtac gaaaaatttt gttttttaat gattacctaa agttgaaaat tactgaagaa 5400
aatattatca aacgtttgag agttgagcaa tttatctttc tgacagaaga agataaatgt 5460
tggtataaaa caagatacaa tattgatgag ggttgttgtt ccttagcgag caatcatctt 5520
tatgtagaaa agattaagag aactatcaat ttccaaaccc ctttcctgct tattcccggt 5580
agcattgaat tttcacaaaa tttttacggc ttaaattggt ttataaaaaa tatatatcct 5640
ggattaaata ggaaaataag aatagttgta acaggaaagg catcagataa aaaaataaag 5700
atgttaaact gtggagagga aattaccttt acgggagagc ttgacttttc cacatataat 5760
aaacttagct caacatgctt gtgtgttatt gcaccgatta caacgggcac tggaattaaa 5820
ataaaaatat tagaagctgt acaaaaaggt attcctgtac ttacaacaaa atttgcttca 5880
aaaggaatat gttccgattt atgtttttat tgcgaggagg atactgacac aaactttgtc 5940
aatttaatta acagttttct tgaaacgaca ttaagagtcc aagaatgaat ttattgcttt 6000
tttcagtcct tgcgtttggt ttaatattgg ctttggccca taataataaa agtggagata 6060
ttaacgcata cttaatgttt tttctcgtgg tcctaatggt attaatatca gggctgcgta 6120
tgaatgatag tgattatatc gaatacagga aaatgtataa tgaagtgcct attttatgtg 6180
actttagtct cgcatctata agagatatac atggggaggt aggctatcta ttcttatcat 6240
caatctttaa aactttatgc ttgccatttc aattatttct tttttttatt gcttttttat 6300
cactcctgct tacatatttt tcattcagaa aaataagttt aataccgata ctatcgttag 6360
ttttttattt aagccatgct tttatagtta gagatttgat tcaaattagg gcaggattag 6420
ctgttagcat atcattatat tcaataatta aatttaaagg aaataaaagt ataattacag 6480
gagttttatt tgcttctttg attcattctg gggcgcttat tattgctctt tgttatcctt 6540
ttttcaaaaa aaaatacata acattaaaaa tgatgttgtt tttattttta gtgtcaatta 6600
ttttttctta tttgaatggg cttaatttat cgatacaact cttatctcaa tatagtttgc 6660
ttccaactgc aatttcgaat tatgttggtt gggaagaata tgattatcgg gtgagtatat 6720
ttactaatcc ggtttttatt aaaggtgttt ttttaattgt cttaatgcac aaatatgtac 6780
tttcagatat taaaaatgag aaaattatag tgctttataa cttatatgtt ttaggtgtat 6840
tagctatggt tgcattgagt gggatggcta ttctttcagg ccgtctttca tcctttctga 6900
cactaggtga aagcatttta attgtatatg ctctgttcta caaaagaaat acacctctgg 6960
cgtttctaat tttttctttt ttaacaattg tgcaattagg atatgatcta tttatttcta 7020
atgtgcatcc tgagcttact ctgattatat ttgggtgaat ctaagtgaaa aataataaaa 7080
taggcatact tatctctaaa atacaaaatc ttggacctgt gaatgtagta cgaggattga 7140
taaaagaaaa taaaaaatat gcttttactg ttttttgttt aacaaatagc gtagataaaa 7200
atatatatga tgagttatgc tgtttaggag ccaaggttat attaatacca gatggtactt 7260
ggttcagcaa aattttattt gtgagaagtt ttttaaagga acatccacat aatatcttac 7320
attcacatgg gatcacggcc gatatgtttt cttactttct gaatggcgtg aaaatatcta 7380
ctattcacaa tagactagat gaggattata tcccattatt tggcgcggtt aaagggaatg 7440
ctatatatta tcttcatcgt tttatattac gaagatttaa tcatatcgtt gcttgctcag 7500
cagcggtcca atcaaaactg aaacaatcga aagtaaaaac taaaataacc accatccaga 7560
atgggattga tataactagg tttaagacac ttgagtctga taaaaaaaaa ttattgaggg 7620
aaaaacacgg atttgatagt gaaaaaagaa tatttatata ttgtggctcg ttatcattaa 7680
ggaaaaatat tgcttacctc ttggaacact tagccatcga agaaaatgat atatttttaa 7740
ttctaggtga tggtgaactt tttagatatt gtaaggataa atattctaaa gatttacggt 7800
atatatttat ggggaaagtt gaatgccctc ttgaatatta tcaattatca gatatttttg 7860
tttccgcttc tttatcggaa gggctcccct tggcactatt agaagctgcc tctactgggt 7920
gctatttata tgttagcgat atagagcccc atagagaaat tgcatctcta ttaggagagg 7980
aaaatatttc tatgtttaaa attaaggatg gatcatataa ttatttgcaa cctaaaataa 8040
aaaaagctga ctataacgct ctttctgacg ataaacttta caatatatcc gataaaaaaa 8100
tgtcaaatct ttatgacaaa ctttttgttt ctttattaga gcagaggcac taatataatg 8160
atttatgttt cggtaatttc tcatggtcat ttcaaaactc ttaaggaatt aggagcagta 8220
tcaaaattaa ataatcacag cagaattaaa gttatcatca aagataattt aggagagagc 8280
gagcttttgg atttttgtca ggaaaacaaa ataacttatt taaggtctaa agagaaaaaa 8340
ggatttggag agaataataa tgaagttttt tcctctatat cctccttaat tactaaggaa 8400
gatttttttg tggttatgaa tcctgatata tatattgagt gctctgatct attagatgtc 8460
gtagatgagt gtggttcagc gaatgttaat ctagcaacga taaatttata cagggatttt 8520
gataaaaaaa catatgataa ctcagtaagg aaatttccct cggcaattga tttttttatg 8580
tcatttttat ttaagaaaaa tgactgtgta gtaaataaga acaaaataac gaaaccaaca 8640
tatgttgatt gggctgcagg ttcttttcta atatttaatg ccttctttta ttcaaaactc 8700
aacggattca acgaaaagta ttttatgtat tgcgaagata ttgatatatg ttggcgagct 8760
aaaaaacact tcaatacttc agttttatac tatccatgct atgcagcaat tcatttggca 8820
caatttaaca atcgtaggat ttttagtaga catttcattt ggcatataaa aagtattatc 8880
ctttttttat tatataaaaa tggtatgctg cgttctagta agttgcttta atgctaatat 8940
tcttttaaga ggtgagaatg atacctgtta ttttggctgg tggttcggga agtcgcttgt 9000
ggccactttc acgagaaaag ttccccaagc agtttttaaa gttgactggc agtttgacaa 9060
tgttgcagtc aacattgtca cgtcttaata atttaaatgc tgatgattca atagttatat 9120
gcaacgaaga gcatagattt attgttgcag aacaattaag agagttaggc aaactttcaa 9180
ataacattat tcttgaaccc aaaggtcgta atacagcccc tgctataaca ctcgcagcat 9240
tagcagcaaa aagaaaattc gctgatgaag atccattgat tcttatttta gctgcagatc 9300
acaacatcca agacgaacat gttttctgtg aggcaattaa taaggcgtca tctttagcta 9360
gttatggaaa actagtgact tttggtatcg ttccattcaa acctgaaact gggtatggct 9420
atattcgtcg cggtgatgaa gtgcctgtag atgagcagca tgcggtggcc tttgaagtgg 9480
cgcagtttgt cgaaaaaccg aatctggaaa ccgcgcaggc ctatgtggca agcggcgaat 9540
attactggaa cagcggtatg ttcctgttcc gtgccggacg ctatctcgaa gaactgaaaa 9600
agtatcgtcc ggatattctc gatgcctgtg aaaaagcgat gagcgccgtc gatccggatc 9660
tcgattttat tcgtgtggat gaagaggcgt ttctcgcttg tccggaagag tcggtggatt 9720
acgcggtcat ggaatgcacg gcagatgccg ttgtggtgcc gatggatgcg ggctggagcg 9780
atgtcggttc ctggtcttca ttatgggaga tcagcgccca caccgccgag ggcaacgttt 9840
gccacggcga tgtgattaat cacaaaactg aaaacagcta tgtgtacgcc gaatctggcc 9900
tggtcaccac cgtcggggtg aaagatttgg tggtagtgca gaccaaagat gcagtgctga 9960
ttgccgaccg taatgcggtg caggatgtga agaaagtggt cgagcagatc aaagctgatg 10020
gtcgccatga gcatcgggtg catcgcgaag tgtatcgtcc gtggggcaaa tatgactcta 10080
tcgacgcggg cgaccgctac caggtgaaac gcatcaccgt gaaaccgggc gaaggtttgt 10140
cggtacagat gcattatcat cgcgcggaac actgggtggt tgtcgcggga acggcaaaag 10200
tcactatcaa cggtgatatc aaactgcttg gtgaaaacga gtccatttat attccgctgg 10260
gggcgatgca ctgcctggaa aacccgggga aaatagattt agaattaatt gaagttcgct 10320
ctggtgcata tcttgaagaa gatgatgtta ttagatgtta tgatcgctat ggacgaaagt 10380
aatatataat aattatttca gaattagaaa tgataattat aagttttcgt ctggataaac 10440
aatagatagt atgggttgga aaatatgagt tctttaactt gttttaaagc ttacgacatt 10500
cgcgggaaat taggtgaaga actgaatgaa gatatcgcct ggcgcattgg tcgcgcctat 10560
ggcgaatttc tcaaaccgaa aaccattgtg ttaggcggtg atgtccgtct caccagcgaa 10620
accttaaaac tggcgctggc aaaaggttta caggatgcgg gcgtcgatgt gctggatatt 10680
ggcatgtccg gcaccgaaga gatttatttc gccacgttcc atctcggcgt ggatggcggc 10740
attgaagtta ccgccagcca taatccgatg gattacaacg gcatgaagct ggtgcgcgaa 10800
ggggctcgcc cgatcagcgg tgataccgga ctgcgcgacg tccagcgtct ggcagaagct 10860
aacgactttc ctcccgtcga tgaaaccaaa cgcggtcgct atcagcaaat caatctgcgt 10920
gacgcttacg ttgatcacct gttcggttat atcaatgtca aaaaccttac gccgctcaag 10980
ctggtgatca actccgggaa tggcgcagcg ggtccggtgg tggacgctat cgaagcccgc 11040
tttaaagccc tcggcgcacc ggtggagtta atcaaagtgc ataacacgcc ggacggcaat 11100
ttccccaacg gtattcctaa cccgttgctg ccggaatgtc gcgacgacac ccgcaatgcg 11160
gtcatcaaac acggcgcgga tatgggcatt gcctttgatg gcgattttga ccgctgtttc 11220
ctgtttgacg aaaaagggca gtttattgag ggctactaca ttgtcggcct gctggcagaa 11280
gcgttcctcg aaaaaaatcc cggcgcgaag atcatccacg atccacgtct ctcctggaac 11340
accattgatg tggtgacggc cgcgggcggc acgccggtga tgtcgaaaac aggacacgcc 11400
tttattaaag aacgtatgcg caaggaagac gccatctacg gtggcgaaat gagcgctcac 11460
cattacttcc gcgatttcgc ttactgtgac agcggcatga tcccgtggct gctggtcgcc 11520
gaactggtgt gcctgaaagg aaaaacgctg ggcgaactgg tgcgcgaccg gatggcggcg 11580
tttccggcaa gcggtgagat caacagaaaa ctggcgcacc ctgttgaggc gattaaccgc 11640
gtggaacagc attttagccg tgaggtgctg gcggtggatc gcaccgatgg catcagcatg 11700
acctttgccg actggcgctt taacctgcgc tcttccaaca ccgaaccggt ggtgcgcctg 11760
aatgtggaat ctcgcggtga tgttcaggtt atggtaatcc atactcaaga aatattatca 11820
attttgacgt cataaagaat aagccctgac aagttagggc ttaattaata tatatttttt 11880
ttgaattggg gatttgtggt aagattttta atatgttatt taatgtggtt gaattaatgt 11940
tgactggaaa ataataatga gaacgaaaaa agcattacac aactttaaag ttgatttatt 12000
aattactttt ttattggttt tgctagggtt ttatattcga actgtttttg tttcaaaaat 12060
gggaagtgat attactggag tgatgttact attcacacag ttgacagcat atctcaattt 12120
ggcagaatta ggtattggaa ttgcagctgc cagcgtatta tataaaccgc tcagcgagaa 12180
tgaatacaat aaaataactt acataatatc tttgctctca gtcatataca aatatatatt 12240
tgtgtttgtt ttgattcttg gcgttgttat aggtatctgt atttattact ttattgattc 12300
tgtaaaggtt gtaaatggcg tttttttata ttgggctttg ttcgttttta atacatcgtt 12360
gacatatagt tatgctaaat actccacatt attaactgct aatcagcggt actcagcagt 12420
aagaaaaatt caaggtggcg gaaaagttat aataattgta tttcagatat taattttgtg 12480
ctttacgcaa agtttcatac tttatttgtt agttgagact ttaggtattt tttctcaata 12540
tttgattttt aaaaaaataa ttgggaacgg aaatcaatat ctcagtaatg aggttttact 12600
tattgaaagc gataaacttt tgataaaaaa agaattaaaa ataagaataa aaaatatgtt 12660
cttccataaa ataggtgctg tgcttgtcct taatacagac tacctgcttg tatcaaagtt 12720
tctgacatta agttatgtga caatttttgg cagctatatg atggtatttc agatagtaac 12780
tgttttgatg tcaagttttg ttaatgctat tactgcagga atgggtaatt acttaattaa 12840
taaaagtaat ttagaaatta aggaaattac acgtcaattt tatgtgatat ttatcgcctt 12900
tgcaacattc atatcactaa atatgttttt tcttgttaat gattttatcg caaaatggat 12960
aggtgttaat tatacattaa gtaacaccct agttgcatta atgattgtta acgtattcat 13020
tagtgttgtc agggtacctt ctgatatatt aaaaaacgca agtggacatt ttggtgatat 13080
ttattatcca ttattagaag gtgtgctgaa tattacgata tccatcattt tggctatcat 13140
tattggatta cctggcatta ttatagggac aatagtatct aacttaatag taataatgct 13200
tgcgaaacca ttatatcttt actctaagtt atttaatctt agaaatccga cgagggttta 13260
ttttgaattt atttctcggc ctatgttata ttcattatgt gtgattgggg tgagctattt 13320
attgcgcgat gaaatatatt catttaaagt aagtacatgg ttggatttta ttaacaagct 13380
actcttagtc tctactccta gcatattggt aatatgtgct attttctcta cggatagtga 13440
ctttagatta tttttcagaa aaattatata tgtgattatg aagaaataaa aatttcgaaa 13500
atgtattaat cgaaattatg caacgagctt tatttttata aatgatatgt gatcttttcg 13560
cgaataggag taaggatccg tgtaggctgg agctgcttcg aagttcctat actttctaga 13620
gaataggaac ttcggaatag gaactaagga ggatattcat atggataaag ccgtaagcat 13680
ataagcatgg ataagctatt tatactttaa taagtacttt gtatacttat ttgcgaacat 13740
tccaggccgc gagcattcag cgcggtgatc acacctgaca ggagtatgta atgtccaagc 13800
aacagatcgg cgtagtcggt atggcagtga tgggacgcaa ccttgcgctc aacatcgaaa 13860
gccgtggtta taccgtctct attttcaacc gttcccgtga gaagacggaa gaagtgattg 13920
ccgaaaatcc aggcaagaaa ctggttcctt actatacggt gaaagagttt gtcgaatctc 13980
tggaaacgcc tcgtcgcatc ctgttaatgg tgaaagcagg tgcaggcacg gatgctgcta 14040
ttgattccct caaaccatat ctcgataaag gagacatcat cattgatggt ggtaacacct 14100
tcttccagga cactattcgt cgtaatcgtg agctttcagc agagggcttt aacttcatcg 14160
gtaccggtgt ttctggcggt gaagaggggg cgctgaaagg tccttctatt atgcctggtg 14220
gccagaaaga agcctatgaa ttggtagcac cgatcctgac caaaatcgcc gccgtagctg 14280
aagacggtga accatgcgtt acctatattg gtgccgatgg cgcaggtcac tatgtgaaga 14340
tggttcacaa cggtattgaa tacggcgata tgcagctgat tgctgaagcc tattctctgc 14400
ttaaaggtgg cctgaacctc accaacgaag aactggcgca gacctttacc gagtggaata 14460
acggtgaact gagcagttac ctgatcgaca tcaccaaaga tatcttcacc aaaaaagatg 14520
aagacggtaa ctacctggtt gatgtgatcc tggatgaagc ggctaacaaa ggtaccggta 14580
aatggaccag ccagagcgcg ctggatctcg gcgaaccgct gtcgctgatt accgagtctg 14640
tgtttgcacg ttatatctct tctctgaaag atcagcgtgt tgccgcatct aaagttctct 14700
ctggtccgca agcacagcca gcaggcgaca aggctgagtt catcgaaaaa gttcgtcgtg 14760
cgctgtatct gggcaaaatc gtttcttacg cccagggctt ctctcagctg cgtgctgcgt 14820
ctgaagagta caactgggat ctgaactacg gcgaaatcgc gaagattttc cgtgctggct 14880
gcatcatccg tgcgcagttc ctgcagaaaa tcaccgatgc ttatgccgaa aatccacaga 14940
tcgctaacct gttgctggct ccgtacttca agcaaattgc cgatgactac cagcaggcgc 15000
tgcgtgatgt cgttgcttat gcagtacaga acggtattcc ggttccgacc ttctccgcag 15060
cggttgccta ttacgacagc taccgtgctg ctgttctgcc tgcgaacctg atccaggcac 15120
agcgtgacta ttttggtgcg catacttata agcgtattga taaagaaggt gtgttccata 15180
ccgaatggct ggattaa 15197
Claims (19)
- 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법으로서, 상기 방법은
(i) a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 원핵 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 원핵 숙주 세포를 배양하는 단계를 포함하며,
여기에서 Ox-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하며,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각 화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(016)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 방법. - 제1항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 방법.
- 제1항에 있어서, Ox-항원이 글루코실화된 O4 항원 다당류이며, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하는, 방법.
- 제3항에 있어서, 재조합 원핵 숙주 세포가 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 방법.
- 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하는 방법으로서, 상기 방법은
(i) a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하는 재조합 원핵 숙주 세포를 제공하는 단계; 및
(ii) 바이오컨쥬게이트의 생성을 위한 조건하에서 재조합 원핵 숙주 세포를 배양하는 단계를 포함하며,
여기에서 PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB와 비교해 아미노산 돌연변이 N311V를 포함하며,
여기에서 Ox-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이며,
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각
화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(O16)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 방법. - 제5항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포로부터 바이오컨쥬게이트를 분리하는 단계를 추가로 포함하는 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 담체 단백질이 탈독소화된 P. 애루기노사(P. aeruginosa)의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스(S. aureus)의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애(Streptococcus pneumoniae) 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스(Neisseria meningitidis)의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자(Haemophilus influenzae)로부터의 단백질 D로 구성된 군으로부터 선택되는, 방법.
- 제8항에 있어서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인, 방법.
- 제9항에 있어서, EPA 담체 단백질은 SEQ ID NO: 3을 포함하는, 방법.
- 제1항 내지 제6항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포가 대장균 세포, 대장균 K-12 균주, 또는 균주 W3110인, 방법.
- 담체 단백질에 공유 결합된 대장균 Ox 항원 다당류의 바이오컨쥬게이트를 제조하기 위한 재조합 원핵 숙주 세포로서, 상기 재조합 원핵 숙주 세포가
a. Ox-항원 다당류에 대한 rfb 유전자 클러스터의 뉴클레오티드 서열;
b. 글리코실화 컨센서스 서열 Asn-X-Ser(Thr) (여기에서, X는 Pro를 제외한 임의의 아미노산임) (SEQ ID NO: 1), 또는 글리코실화 컨센서스 서열 Asp(Glu)-X-Asn-Z-Ser(Thr) (여기에서, X 및 Z는 Pro를 제외한 임의의 아미노산으로부터 독립적으로 선택됨) (SEQ ID NO: 2)을 포함하는 적어도 하나의 글리코실화 부위를 포함하는 담체 단백질을 인코딩하는 뉴클레오티드 서열; 및
c. 올리고사카릴 트랜스퍼라제 PglBy를 인코딩하는 뉴클레오티드 서열을 포함하며,
여기에서 Ox-항원은 O1A 항원 다당류, 글루코실화된 O4 항원 다당류, O6A 항원 다당류, O15 항원 다당류, O16 항원 다당류 또는 O75 항원 다당류이고,
Ox-항원이 O1A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 글루코실화된 O4 항원 다당류인 경우, PglBy는 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하고, 재조합 원핵 숙주 세포는 SEQ ID NO: 4에 대해 적어도 80% 동일성을 가지며, 글루코스의 첨가에 의해 대장균 O4 항원 다당류를 변형시켜 대장균 글루코실화된 O4 항원 다당류를 생성할 수 있는 글루코실트랜스퍼라제 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8에 대해 적어도 80% 서열 동일성을 갖는 트랜스로카제 GtrA 및 글리코실트랜스퍼라제 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하며, 여기에서 트랜스로카제는 박토프레놀 결합된 글루코스를 전위시킬 수 있으며, 글리코실트랜스퍼라제는 박토프레놀을 글루코실화시킬 수 있으며;
Ox-항원이 O6A 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O15 항원 다당류인 경우, PglBy는 N311V, K482R, D483H 및 A669V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O16 항원 다당류인 경우, PglBy는 Y77H, S80R, Q287P, K289R 및 N311V의 아미노산 돌연변이를 포함하며;
Ox-항원이 O75 항원 다당류인 경우, PglBy는 N311V의 아미노산 돌연변이를 포함하며,
여기에서 각각의 경우에 아미노산 돌연변이는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PglB에 대한 것이며,
여기에서 O1A, 글루코실화된 O4, O6A, O15, O16 및 O75 항원 다당류는 각각 화학식
(O1A)
;
(O4-Glc+)
;
(O6A)
;
(O15)
;
(016)
; 및
(O75)
의 구조를 가지며, 각각의 n은 독립적으로 1 내지 100의 정수인, 재조합 원핵 숙주 세포. - 제12항에 있어서, 각각의 n은 독립적으로 7 내지 25의 정수인, 재조합 원핵 숙주 세포.
- 제12항에 있어서, Ox-항원이 글루코실화된 O4 항원 다당류고, PglBy는 SEQ ID NO: 6의 아미노산 서열을 갖는 야생형 PdlB와 비교해 아미노산 돌연변이 N311V 또는 아미노산 돌연변이 Y77H 및 N311V를 포함하는, 재조합 원핵 숙주 세포.
- 제14항에 있어서, 재조합 원핵 숙주 세포가 SEQ ID NO: 4의 아미노산 서열을 갖는 GtrS를 인코딩하는 서열, 및 각각 SEQ ID NO: 7 및 8의 아미노산 서열을 갖는 GtrA 및 GtrB를 인코딩하는 뉴클레오티드 서열을 추가로 포함하는, 재조합 원핵 숙주 세포.
- 제12항 내지 제15항 중 어느 한 항에 있어서, 담체 단백질이 탈독소화된 P. 애루기노사의 외독소 A(EPA), 대장균 플라겔린(FliC), CRM197, 말토스 결합 단백질(MBP), 디프테리아 톡소이드, 테타누스 톡소이드, 탈독소화된 S. 아우레우스의 헤모리신 A, 응괴 인자 A, 응괴 인자 B, 대장균 열 민감 장독소, 탈독소화된 대장균 열 민감 장독소의 변이체, 콜레라 독소 B 서브유닛(CTB), 콜레라 독소, 탈독소화된 콜레라 독소의 변이체, 대장균 Sat 단백질, 대장균 Sat 단백질의 패신저 도메인, 스트렙토코커스 뉴모니애 뉴모리신, 키홀 림펫 헤모시아닌(KLH), P. 애루기노사 PcrV, 네이세리아 메닌지티디스의 외막 단백질(OMPC) 및 비정형 헤모필루스 인플루엔자로부터의 단백질 D로 구성된 군으로부터 선택되는, 재조합 원핵 숙주 세포.
- 제16항에 있어서, 담체 단백질은 탈독소화된 슈도모나스 애루기노사의 외독소 A(EPA)인, 재조합 원핵 숙주 세포.
- 제17항에 있어서, EPA 담체 단백질은 SEQ ID NO: 3을 포함하는, 재조합 원핵 숙주 세포.
- 제12항 내지 제15항 중 어느 한 항에 있어서, 재조합 원핵 숙주 세포가 대장균 세포, 대장균 K-12 균주, 또는 균주 W3110인, 재조합 원핵 숙주 세포.
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962819762P | 2019-03-18 | 2019-03-18 | |
US62/819,762 | 2019-03-18 | ||
PCT/US2020/023415 WO2020191088A1 (en) | 2019-03-18 | 2020-03-18 | Methods of producing bioconjugates of e. coli o-antigen polysaccharides, compositions thereof, and methods of use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20210134044A KR20210134044A (ko) | 2021-11-08 |
KR102574882B1 true KR102574882B1 (ko) | 2023-09-04 |
Family
ID=70285928
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020217033419A KR102574882B1 (ko) | 2019-03-18 | 2020-03-18 | 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 |
Country Status (22)
Country | Link |
---|---|
US (2) | US11491220B2 (ko) |
EP (2) | EP4253554A3 (ko) |
JP (1) | JP2022525773A (ko) |
KR (1) | KR102574882B1 (ko) |
CN (1) | CN113950524A (ko) |
AR (1) | AR118389A1 (ko) |
AU (1) | AU2020240075A1 (ko) |
BR (1) | BR112021018258A2 (ko) |
CA (1) | CA3134045A1 (ko) |
EA (1) | EA202192392A1 (ko) |
ES (1) | ES2951442T3 (ko) |
HR (1) | HRP20231026T1 (ko) |
HU (1) | HUE063875T2 (ko) |
IL (1) | IL286467A (ko) |
MA (1) | MA55365B1 (ko) |
MD (1) | MD3942028T2 (ko) |
MX (1) | MX2021011418A (ko) |
PL (1) | PL3942028T3 (ko) |
RS (1) | RS64521B1 (ko) |
SG (1) | SG11202110303XA (ko) |
TW (1) | TWI771663B (ko) |
WO (1) | WO2020191088A1 (ko) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2711512C2 (ru) | 2013-01-17 | 2020-01-17 | Экс4 Фамасьютиклз (Остриэ) ГмбХ | Рекомбинантное антитело, фармацевтический препарат, диагностический препарат, способ идентификации антитела-кандидата, способ лечения, профилактики и способ диагностики субъектов, потенциально подверженных риску заражения или страдающих от инфекций, вызванных штаммами Е. coli с множественной лекарственной устойчивостью |
CN106535927B (zh) | 2014-02-24 | 2019-09-20 | 葛兰素史密丝克莱恩生物有限公司 | 新颖多糖及其用途 |
TWI715617B (zh) | 2015-08-24 | 2021-01-11 | 比利時商葛蘭素史密斯克藍生物品公司 | 對抗腸道外病原性大腸桿菌之免疫保護之方法及組合物 |
AR109621A1 (es) | 2016-10-24 | 2018-12-26 | Janssen Pharmaceuticals Inc | Formulaciones de vacunas contra glucoconjugados de expec |
WO2020191082A1 (en) | 2019-03-18 | 2020-09-24 | Janssen Pharmaceuticals, Inc. | Bioconjugates of e. coli o-antigen polysaccharides, methods of production thereof, and methods of use thereof |
MX2023003169A (es) * | 2020-09-17 | 2023-03-27 | Janssen Pharmaceuticals Inc | Composiciones de vacunas multivalentes y usos de las mismas. |
IL301880A (en) | 2020-11-30 | 2023-06-01 | Janssen Pharmaceuticals Inc | Analytical method for glycoconjugation using a capillary-based immunoassay system |
JP2024513914A (ja) | 2021-04-08 | 2024-03-27 | ヤンセン ファーマシューティカルズ,インコーポレーテッド | バイオコンジュゲート生産のためのプロセス |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016107818A1 (en) * | 2014-12-30 | 2016-07-07 | Glycovaxyn Ag | Compositions and methods for protein glycosylation |
Family Cites Families (44)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3700612A (en) | 1971-06-23 | 1972-10-24 | Tenneco Chem | Aqueous surface-coating compositions containing hydroxyalkyl ethers of galactomannan gums as thickeners |
US5057540A (en) | 1987-05-29 | 1991-10-15 | Cambridge Biotech Corporation | Saponin adjuvant |
US4912094B1 (en) | 1988-06-29 | 1994-02-15 | Ribi Immunochem Research Inc. | Modified lipopolysaccharides and process of preparation |
US5370872A (en) | 1991-08-12 | 1994-12-06 | Swiss Serum And Vaccine Institute Berne | Escherichia coliO-polysaccharide-protein conjugate vaccine |
PT761231E (pt) | 1992-06-25 | 2000-06-30 | Smithkline Beecham Biolog | Composicao de vacina contendo adjuvantes |
CA2284586C (en) | 1997-04-01 | 2011-02-08 | Ribi Immunochem Research, Inc. | Aqueous immunologic adjuvant compositions of monophosphoryl lipid a |
US6491919B2 (en) | 1997-04-01 | 2002-12-10 | Corixa Corporation | Aqueous immunologic adjuvant compostions of monophosphoryl lipid A |
DK1126876T3 (da) | 1998-10-16 | 2007-07-02 | Glaxosmithkline Biolog Sa | Adjuvanssystemer og vacciner |
AU5162201A (en) | 2000-04-13 | 2001-10-30 | Corixa Corporation | Immunostimulant compositions comprising an aminoalkyl glucosaminide phosphate and qs-21 |
US6676958B2 (en) | 2001-06-19 | 2004-01-13 | Advanced Bioadjuvants, Llc | Adjuvant composition for mucosal and injection delivered vaccines |
DE60303591T2 (de) | 2002-03-07 | 2007-03-01 | Eidgenössische Technische Hochschule Zürich | System und methode zur herstellung von rekombinanten, glykosylierten protein in prokaryontischen wirtszellen |
CN1324134C (zh) * | 2003-12-22 | 2007-07-04 | 南开大学 | 对大肠杆菌o81型的o-抗原特异的核苷酸 |
ATE483027T1 (de) | 2005-05-11 | 2010-10-15 | Eth Zuerich | Rekombinante n-glykosylierte proteine aus prokaryontischen zellen |
TWI457133B (zh) | 2005-12-13 | 2014-10-21 | Glaxosmithkline Biolog Sa | 新穎組合物 |
ES2536426T3 (es) | 2006-03-23 | 2015-05-25 | Novartis Ag | Compuestos de imidazoquinoxalina como inmunomoduladores |
US8063063B2 (en) | 2006-03-23 | 2011-11-22 | Novartis Ag | Immunopotentiating compounds |
EP2242505A4 (en) | 2008-01-08 | 2012-03-07 | Biogenerix Ag | GLYCOCONJUGATION OF POLYPEPTIDES USING OLIGOSACCHARYLTRANSFERASES |
JP5782258B2 (ja) | 2008-02-20 | 2015-09-24 | グリコヴァキシン アーゲー | 原核細胞由来の組換えn−グリコシル化タンパク質から作製したバイオコンジュゲート |
CN102481312B (zh) | 2009-06-05 | 2015-07-15 | 传染性疾病研究院 | 合成的吡喃葡萄糖脂佐剂 |
CN102724997B (zh) | 2009-11-19 | 2016-09-21 | 格林考瓦因有限公司 | 在原核细胞中产生免疫原性多糖的生物合成系统 |
CN103391714A (zh) | 2010-12-10 | 2013-11-13 | 默沙东公司 | 减轻搅动引起的免疫原性组合物聚集的新制剂 |
JP2014526449A (ja) | 2011-09-06 | 2014-10-06 | グリコヴァキシン アーゲー | 原核細胞において製造されるバイオコンジュゲートワクチン |
US9932598B2 (en) | 2012-08-02 | 2018-04-03 | The Regents Of The University Of California | Metabolic engineering of microbial organisms |
BR112015004817A2 (pt) | 2012-09-10 | 2017-07-04 | Glycovaxyn Ag | bioconjugados compreendendo antígenos modificados e seus usos |
ES2905107T3 (es) | 2012-10-12 | 2022-04-07 | Glaxosmithkline Biologicals Sa | Procedimientos de modificación de células hospedadoras |
EP2917351B1 (en) * | 2012-11-07 | 2018-12-19 | GlaxoSmithKline Biologicals S.A. | Production of recombinant vaccine in e. coli by enzymatic conjugation |
JP2016501550A (ja) | 2012-12-27 | 2016-01-21 | グリコヴァキシン アーゲー | Crm197に関する方法及び組成物 |
RU2711512C2 (ru) | 2013-01-17 | 2020-01-17 | Экс4 Фамасьютиклз (Остриэ) ГмбХ | Рекомбинантное антитело, фармацевтический препарат, диагностический препарат, способ идентификации антитела-кандидата, способ лечения, профилактики и способ диагностики субъектов, потенциально подверженных риску заражения или страдающих от инфекций, вызванных штаммами Е. coli с множественной лекарственной устойчивостью |
LT2996473T (lt) | 2013-05-18 | 2019-12-10 | Aduro Biotech Inc | Kompozicijos ir būdai, skirti aktyvuoti nuo "interferono geno stimuliatoriaus" priklausomą signalinį kelią |
CA2926523C (en) | 2013-10-11 | 2023-09-26 | Glycovaxyn Ag | Methods of host cell modification |
EP2870974A1 (en) * | 2013-11-08 | 2015-05-13 | Novartis AG | Salmonella conjugate vaccines |
JP2016540764A (ja) | 2013-12-04 | 2016-12-28 | グリコヴァキシン アーゲー | 大腸菌で合成された糖タンパク質ワクチンによる黄色ブドウ球菌感染の予防 |
CA2935532A1 (en) | 2014-02-06 | 2015-08-13 | Arsanis Biosciences Gmbh | E. coli specific antibody sequences |
CN106535927B (zh) | 2014-02-24 | 2019-09-20 | 葛兰素史密丝克莱恩生物有限公司 | 新颖多糖及其用途 |
ES2805000T3 (es) | 2014-04-17 | 2021-02-10 | Glaxosmithkline Biologicals Sa | Células huéspedes modificadas y usos de las mismas |
CN105695497B (zh) | 2014-11-27 | 2019-09-24 | 中国人民解放军军事医学科学院生物工程研究所 | 一种细菌多糖修饰的重组融合蛋白的制备方法及其应用 |
TWI715617B (zh) | 2015-08-24 | 2021-01-11 | 比利時商葛蘭素史密斯克藍生物品公司 | 對抗腸道外病原性大腸桿菌之免疫保護之方法及組合物 |
GB201518668D0 (en) | 2015-10-21 | 2015-12-02 | Glaxosmithkline Biolog Sa | Immunogenic Comosition |
GB201610599D0 (en) | 2016-06-17 | 2016-08-03 | Glaxosmithkline Biologicals Sa | Immunogenic Composition |
AR109621A1 (es) | 2016-10-24 | 2018-12-26 | Janssen Pharmaceuticals Inc | Formulaciones de vacunas contra glucoconjugados de expec |
GB201721582D0 (en) * | 2017-12-21 | 2018-02-07 | Glaxosmithkline Biologicals Sa | S aureus antigens and immunogenic compositions |
WO2020191082A1 (en) | 2019-03-18 | 2020-09-24 | Janssen Pharmaceuticals, Inc. | Bioconjugates of e. coli o-antigen polysaccharides, methods of production thereof, and methods of use thereof |
FR3098334B1 (fr) | 2019-07-05 | 2021-07-23 | Airbus Operations Sas | Procédé et système de surveillance d’un état de conscience d’un opérateur dans un poste de pilotage d’un aéronef |
MX2023003169A (es) | 2020-09-17 | 2023-03-27 | Janssen Pharmaceuticals Inc | Composiciones de vacunas multivalentes y usos de las mismas. |
-
2020
- 2020-03-18 TW TW109109076A patent/TWI771663B/zh active
- 2020-03-18 MD MDE20220091T patent/MD3942028T2/ro unknown
- 2020-03-18 HR HRP20231026TT patent/HRP20231026T1/hr unknown
- 2020-03-18 EA EA202192392A patent/EA202192392A1/ru unknown
- 2020-03-18 AU AU2020240075A patent/AU2020240075A1/en active Pending
- 2020-03-18 ES ES20718990T patent/ES2951442T3/es active Active
- 2020-03-18 RS RS20230733A patent/RS64521B1/sr unknown
- 2020-03-18 MA MA55365A patent/MA55365B1/fr unknown
- 2020-03-18 JP JP2021556239A patent/JP2022525773A/ja active Pending
- 2020-03-18 PL PL20718990.3T patent/PL3942028T3/pl unknown
- 2020-03-18 HU HUE20718990A patent/HUE063875T2/hu unknown
- 2020-03-18 CN CN202080036789.XA patent/CN113950524A/zh active Pending
- 2020-03-18 EP EP23177116.3A patent/EP4253554A3/en active Pending
- 2020-03-18 KR KR1020217033419A patent/KR102574882B1/ko active IP Right Grant
- 2020-03-18 EP EP20718990.3A patent/EP3942028B9/en active Active
- 2020-03-18 US US16/822,403 patent/US11491220B2/en active Active
- 2020-03-18 BR BR112021018258A patent/BR112021018258A2/pt unknown
- 2020-03-18 CA CA3134045A patent/CA3134045A1/en active Pending
- 2020-03-18 SG SG11202110303XA patent/SG11202110303XA/en unknown
- 2020-03-18 AR ARP200100747A patent/AR118389A1/es unknown
- 2020-03-18 MX MX2021011418A patent/MX2021011418A/es unknown
- 2020-03-18 WO PCT/US2020/023415 patent/WO2020191088A1/en active Application Filing
-
2021
- 2021-09-19 IL IL286467A patent/IL286467A/en unknown
-
2022
- 2022-10-06 US US17/938,454 patent/US20230190926A1/en active Pending
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016107818A1 (en) * | 2014-12-30 | 2016-07-07 | Glycovaxyn Ag | Compositions and methods for protein glycosylation |
Also Published As
Publication number | Publication date |
---|---|
AU2020240075A1 (en) | 2021-10-14 |
US11491220B2 (en) | 2022-11-08 |
CN113950524A (zh) | 2022-01-18 |
HRP20231026T1 (hr) | 2023-12-08 |
MA55365B1 (fr) | 2023-09-27 |
BR112021018258A2 (pt) | 2022-02-08 |
JP2022525773A (ja) | 2022-05-19 |
EP3942028C0 (en) | 2023-06-07 |
PL3942028T3 (pl) | 2023-10-23 |
EP3942028B1 (en) | 2023-06-07 |
EP4253554A3 (en) | 2024-01-17 |
MD3942028T2 (ro) | 2023-11-30 |
TWI771663B (zh) | 2022-07-21 |
WO2020191088A9 (en) | 2021-03-18 |
MA55365A (fr) | 2022-01-26 |
EP3942028A1 (en) | 2022-01-26 |
EP4253554A2 (en) | 2023-10-04 |
MX2021011418A (es) | 2021-10-13 |
US20230190926A1 (en) | 2023-06-22 |
US20200353073A1 (en) | 2020-11-12 |
HUE063875T2 (hu) | 2024-02-28 |
WO2020191088A1 (en) | 2020-09-24 |
AU2020240075A8 (en) | 2021-10-21 |
KR20210134044A (ko) | 2021-11-08 |
TW202102670A (zh) | 2021-01-16 |
RS64521B1 (sr) | 2023-09-29 |
CA3134045A1 (en) | 2020-09-24 |
SG11202110303XA (en) | 2021-10-28 |
ES2951442T3 (es) | 2023-10-20 |
IL286467A (en) | 2021-12-01 |
EA202192392A1 (ru) | 2022-02-09 |
EP3942028B9 (en) | 2023-08-23 |
AR118389A1 (es) | 2021-09-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR102532707B1 (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트, 이의 제조 방법, 및 이의 사용 방법 | |
KR102574882B1 (ko) | 대장균 o-항원 다당류의 바이오컨쥬게이트의 생성 방법, 이의 조성물 및 이의 사용 방법 | |
DK3209381T3 (en) | COMPOSITIONS COMPREHENSIVE BAKERY STUES | |
AU2016219667B2 (en) | Antibacterial phage, phage peptides and methods of use thereof | |
RU2754446C2 (ru) | Композиции, относящиеся к мутантному токсину CLOSTRIDIUM DIFFICILE, и способы их применения | |
KR20230043157A (ko) | 다가 백신 조성물 및 이의 용도 | |
KR100886095B1 (ko) | 폴리펩티드 항원을 암호화하는 신규한 스트렙토코쿠스 뉴모니애 개방형 판독 프레임 및 이를 포함하는 조성물 | |
AU2017201193B2 (en) | Compositions and methods relating to a mutant clostridium difficile toxin | |
KR101916290B1 (ko) | 캡슐형 그람-양성 세균 생체접합체 백신 | |
EP0934336A1 (en) | Novel compounds | |
JPH09322781A (ja) | Staphylococcus aureusポリヌクレオチドおよび配列 | |
KR20140101835A (ko) | 클로스트리듐 디피실레 톡신-기반 백신 | |
KR102625114B1 (ko) | 클로스트리디움 디피실레에 대항한 면역 반응을 도출하기 위한 조성물 및 방법 | |
KR20150056540A (ko) | 백신으로서의 클로스트리듐 디피실 폴리펩티드 | |
AU2021240230B2 (en) | Vaccines and vaccine components for inhibition of microbial cells | |
US20100003283A1 (en) | Lipid a deficient mutants of neisseria meningitidis | |
RU2773880C1 (ru) | Композиции, относящиеся к мутантному токсину CLOSTRIDIUM DIFFICILE, и способы их применения | |
EA046206B1 (ru) | Биоконъюгаты полисахаридных о-антигенов e.coli, способы их получения и способы их применения |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |