RU2801248C2

RU2801248C2 - Hybrid protein containing fragments of fluorescent proteins and its application

Info

Publication number: RU2801248C2
Application number: RU2021130321A
Authority: RU
Inventors: Сун У; Чжэньшань ЧЗАН; Хуэйлин ЛЮ; Вэй Чэнь
Original assignee: Нингбо Кунпенг Биотекх Ко., Лтд.
Priority date: 2019-03-19
Filing date: 2020-03-18
Publication date: 2023-08-04

Abstract

FIELD: biotechnology.

SUBSTANCE: invention relates to hybrid proteins based on fragments of fluorescent proteins and target therapeutic polypeptides, and can be used to express and obtain the target polypeptide. A fusion protein construct is proposed that contains fragments of fluorescent proteins and a target therapeutic polypeptide selected from human insulin precursor protein, insulin lispro precursor protein, insulin glargine precursor protein, glucagon-like peptide and its derivatives exenatide and liraglutide, insulin, calcitonin, teduglutide.

EFFECT: invention provides an increase in the efficiency of obtaining said target therapeutic polypeptides.

10 cl, 5 dwg, 1 tbl, 6 ex

Description

Область техникиTechnical field

Настоящее изобретение относится к биотехнологии, в частности, к гибридным белкам, содержащим фрагменты флуоресцентных белков, и к области их применения.The present invention relates to biotechnology, in particular, to hybrid proteins containing fragments of fluorescent proteins, and to the field of their application.

Уровень техникиState of the art

Пептиды являются классом биомолекул, широко используемых в качестве реагентов во многих областях биомедицинских исследований, а также в качестве терапевтических средств при лечении заболеваний, в качестве диагностических средств при обнаружении патогенных бактерий и в качестве биомаркеров. Широко распространены два способа синтезирования пептидов; одним является химический синтез, а другим - рекомбинантная экспрессия. Химический синтез используется для приготовления разнообразных терапевтических пептидов, включая кортикорелин, паратиреоидный гормон (ПТГ), глюкагоноподобный пептид (ГПП-1) и его производные эксенатид и лираглутид, а также энфувиртид, кальцитонин, бивалирудин, зиконотид, семорелин, соматорелин, секретин, тедуглутид и инсулин. Данный способ требует выполнения многостадийной конденсации фрагментов аминокислот для образования пептидов, а также требует проведения неудобных стадий защиты, снятия защиты и очистки. На сегодняшний момент большинство коммерческих пептидов с количеством аминокислотных остатков менее 50 производятся указанным способом. По мере увеличения спроса на пептиды в фармацевтической промышленности и индустрии проведения биомедицинских исследований растет также и цена аминокислотных фрагментов, используемых при химическом синтезе. Как следствие, в будущем поддержание цен на доступном уровне на терапевтические средства на основе пептидов (например, ГПП-1), используемые для ежедневного приема, может оказаться проблематичным. Хотя с технической точки зрения и существует возможность химического синтеза пептидов с количеством аминокислотных остатков менее 50, однако низкая полезная продуктивность этого процесса и большое количество образующихся при этом органических отходов делают такой процесс синтеза неэкономичным. В настоящее время большинство пептидов с количеством аминокислотных остатков более 50 производятся способом рекомбинантной экспрессии в клетках-хозяевах таких организмов, как, например, бактерии, дрожжи, насекомые и млекопитающие. В течение многих лет обычным способом обеспечения экспрессии полипептидов являлось использование гибридных белков. Тем не менее, использование доступных на данный момент времени способов использования гибридных белков для обеспечения экспрессии пептидов сопряжено со множеством технических проблем, особенно при получении пептидов, продуцирующих менее 50 аминокислотных остатков. Например, известный из предыдущего уровня техники гибридный белок характеризуется большим молекулярным весом, сильной гидрофобностью и трудностью проведения сепарации. Целевой белок характеризуется низким значением удельной плотности, низким значением коэффициента слияния, устойчивой структурой, трудностью усвоения и значительным мертвым объемом в загрузочной ионной колонке и гидрофобной колонке.Peptides are a class of biomolecules widely used as reagents in many areas of biomedical research, as well as therapeutic agents in the treatment of diseases, as diagnostic agents in the detection of pathogenic bacteria, and as biomarkers. Two methods for synthesizing peptides are widely used; one is chemical synthesis and the other is recombinant expression. Chemical synthesis is used to prepare a variety of therapeutic peptides, including corticorelin, parathyroid hormone (PTH), glucagon-like peptide (GLP-1) and its derivatives exenatide and liraglutide, as well as enfuvirtide, calcitonin, bivalirudin, ziconotide, semorelin, somatorelin, secretin, teduglutide and insulin. This method requires multi-step condensation of amino acid fragments to form peptides, and also requires inconvenient protection, deprotection and purification steps. To date, most commercial peptides with amino acid residues less than 50 are produced in this manner. As the demand for peptides in the pharmaceutical and biomedical research industries increases, so does the price of amino acid fragments used in chemical synthesis. As a consequence, maintaining affordable prices for peptide-based therapeutics (eg, GLP-1) used for daily use may be problematic in the future. Although from a technical point of view there is the possibility of chemical synthesis of peptides with the number of amino acid residues less than 50, however, the low useful productivity of this process and the large amount of organic waste generated in this process make such a synthesis process uneconomical. Currently, most peptides with more than 50 amino acid residues are produced by recombinant expression in host cells of organisms such as bacteria, yeast, insects and mammals. For many years, the usual way to ensure the expression of polypeptides was the use of hybrid proteins. However, the use of currently available methods of using hybrid proteins to provide expression of peptides is associated with many technical problems, especially when obtaining peptides producing less than 50 amino acid residues. For example, the fusion protein known from the prior art is characterized by high molecular weight, strong hydrophobicity, and difficulty in separation. The target protein is characterized by low specific gravity, low fusion ratio, stable structure, difficult digestion, and significant dead volume in the loading ion column and hydrophobic column.

Таким образом, существует насущная потребность в разработке нового гибридного белка для обеспечения экспрессии целевого пептида, для преодоления ограничений, связанных с использованием существующих гибридных белков и, в то же самое время, для увеличения полезной продуктивности вставляемых аминокислотных белков, например, повышения выработки искусственных аминокислотных белков, таких как трет-бутоксикарбонил-лизиновые белки.Thus, there is an urgent need to develop a new fusion protein to provide expression of the target peptide, to overcome the limitations associated with the use of existing fusion proteins and, at the same time, to increase the useful productivity of the inserted amino acid proteins, for example, increase the production of artificial amino acid proteins. such as tert-butoxycarbonyl-lysine proteins.

Сущность изобретенияThe essence of the invention

Целью настоящего изобретения является создание нового гибридного белка для обеспечения экспрессии целевого пептида и, в то же самое время, увеличения полезной продуктивности вставляемых искусственных аминокислотных белков, например, повышения выработки искусственных аминокислотных белков, таких как трет-бутоксикарбонил-лизиновые белки.The aim of the present invention is to provide a novel fusion protein to allow expression of the target peptide and at the same time increase the beneficial productivity of the inserted artificial amino acid proteins, for example, increase the production of artificial amino acid proteins such as t-butoxycarbonyl-lysine proteins.

Первый объект настоящего изобретения касается гибридного белка, имеющего структуру, показанную в Формуле I:The first object of the present invention relates to a hybrid protein having the structure shown in Formula I:

гдеWhere

«-» обозначает пептидную связь или линкерный пептид,"-" denotes a peptide bond or linker peptide,

каждый Р1 независимо является первым целевым пептидом;each P1 is independently the first target peptide;

каждый Р2 независимо является вторым целевым пептидом;each P2 is independently the second target peptide;

каждый L1 независимо является отсутствующим или первым линкерным пептидом;each L1 is independently the missing or first linker peptide;

каждый L2 независимо является отсутствующим или вторым линкерным пептидом;each L2 is independently the missing or second linker peptide;

А1 является отсутствующим или сигнальным пептидом;A1 is a missing or signal peptide;

А2 является отсутствующим или сигнальным пептидом;A2 is a missing or signal peptide;

каждый X независимо является одиночным β-складчатым блоком флуоресцентного белка;each X is independently a single β-pleated block of a fluorescent protein;

n является положительным целым числом от 1 до 8;n is a positive integer from 1 to 8;

s может принимать значения 0, 1 или 2;s can take the values 0, 1 or 2;

t может принимать значения 0, 1 или 2; иt can take the values 0, 1 or 2; And

дополнительным условием является неравенство s и t нулю одновременно.an additional condition is the inequality s and t to zero simultaneously.

В еще одном предпочтительном варианте осуществления s = 0 и t = 1.In yet another preferred embodiment, s = 0 and t = 1.

В еще одном предпочтительном варианте осуществления s = 1 и t = 0.In yet another preferred embodiment, s = 1 and t = 0.

В еще одном предпочтительном варианте осуществления значение n принадлежит диапазону 1-6, предпочтительно, диапазону 2-4.In yet another preferred embodiment, the value of n is in the range 1-6, preferably in the range 2-4.

В еще одном предпочтительном варианте осуществления А1 является сигнальным пептидом, а А2 является отсутствующим пептидом.In yet another preferred embodiment, A1 is the signal peptide and A2 is the missing peptide.

В еще одном предпочтительном варианте осуществления β-складчатый блок выбирается из группы, состоящей из β-складчатых блоков u1, u2, u3, u4, u5, u6, u7, u8, u9, u10 и u11 флуоресцентного белка.In yet another preferred embodiment, the β-fold block is selected from the group consisting of u1, u2, u3, u4, u5, u6, u7, u8, u9, u10 and u11 fluorescent protein β-sheet blocks.

В еще одном предпочтительном варианте осуществления длина каждого X составляет 10-14 аминокислот.In yet another preferred embodiment, each X is 10-14 amino acids in length.

В еще одном предпочтительном варианте осуществления каждый X является различным.In another preferred embodiment, each X is different.

В еще одном предпочтительном варианте осуществления каждый X является тем же самым.In yet another preferred embodiment, each X is the same.

В еще одном предпочтительном варианте осуществления флуоресцентный белок выбирается из группы, состоящей из зеленого флуоресцентного белка (ЗФБ), желтого флуоресцентного белка (ЖФБ), синего флуоресцентного белка (СФБ), гена голубого флуоресцентного белка (ГФБ) и любой из комбинаций указанных элементов.In yet another preferred embodiment, the fluorescent protein is selected from the group consisting of green fluorescent protein (GFP), yellow fluorescent protein (YFP), blue fluorescent protein (GBP), blue fluorescent protein (GFP) gene, and any combination of these elements.

В еще одном предпочтительном варианте осуществления в качестве флуоресцентного белка используется зеленый флуоресцентный белок (ЗФБ).In yet another preferred embodiment, green fluorescent protein (GFP) is used as the fluorescent protein.

В еще одном предпочтительном варианте осуществления ЗФБ имеет последовательность аминокислот, показанную на SEQ ID NO.: 13.In another preferred embodiment, the GFP has the amino acid sequence shown in SEQ ID NO.: 13.

В еще одном предпочтительном варианте осуществления между любыми двумя (3-складчатыми блоками отсутствует гибкое соединение.In yet another preferred embodiment, there is no flexible connection between any two (3-fold) blocks.

В еще одном предпочтительном варианте осуществления (Х)n выполняет роль элемента, способствующего экспрессии белка.In yet another preferred embodiment, (X)n acts as a protein expression facilitator.

В еще одном предпочтительном варианте осуществления общая длина Ln элемента (Х)n составляет 3,7-30% общей длины L0 флуоресцентного белка, предпочтительно, 7,5-20,5%, более предпочтительно, 7,5-15,5%).In another preferred embodiment, the total length Ln of element (X)n is 3.7-30% of the total length L0 of the fluorescent protein, preferably 7.5-20.5%, more preferably 7.5-15.5%) .

В еще одном предпочтительном варианте осуществления X выбирается из группы, состоящей изIn another preferred embodiment, X is selected from the group consisting of

элемента uj, который имеет последовательность аминокислот, показанную на SEQ ID NO.: j;element uj, which has the amino acid sequence shown in SEQ ID NO.: j;

где j может принимать значения 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 или 11.where j can be 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, or 11.

В еще одном предпочтительном варианте осуществления X выбирается из группы, состоящей из:In another preferred embodiment, X is selected from the group consisting of:

В еще одном предпочтительном варианте осуществления X, кроме того, включает в себя последовательность аминокислот, образованную путем взаимного замещения элементов R, K и Н в любой из последовательностей, как показано на SEQIDNO.: 1-11; и/илиIn yet another preferred embodiment, X further comprises an amino acid sequence formed by mutual substitution of the elements R, K and H in any of the sequences as shown in SEQIDNO.: 1-11; and/or

X, кроме того, включает в себя последовательность аминокислот, образованную путем взаимного замещения элементов Р и Q в последовательности, как показано на любом из SEQ ID NO.: 1-11; и/илиX further includes an amino acid sequence formed by mutual substitution of P and Q elements in the sequence as shown in any one of SEQ ID NO.: 1-11; and/or

X, кроме того, включает в себя последовательность аминокислот, образованную путем взаимного замещения элементов Т и S в последовательности, как показано на любом из SEQ ID NO.: 1-11.X further includes an amino acid sequence formed by mutual substitution of elements T and S in the sequence as shown in any one of SEQ ID NO.: 1-11.

(A) полипептида, имеющего последовательность аминокислот, показанную на любом из SEQ ID NO.: 1-11;(A) a polypeptide having the amino acid sequence shown in any of SEQ ID NO.: 1-11;

(B) полипептида, имеющего гомологию ≥80% (предпочтительно, гомологию ≥85%, более предпочтительно, ≥90%, более предпочтительно, ≥95%, наиболее предпочтительно, ≥97%) с последовательностью аминокислот, показанной на любом из SEQ ID NO: 1-11, с сохранением характеристик;(B) a polypeptide having ≥80% homology (preferably ≥85% homology, more preferably ≥90%, more preferably ≥95%, most preferably ≥97%) with the amino acid sequence shown in any of SEQ ID NO : 1-11, with preservation of characteristics;

(C) производного полипептида, образованного путем замещения, удаления или добавления аминокислотных остатков 1-5 к последовательности аминокислот, показанной на любом из SEQ ID NO: 1-11, с сохранением характеристик.(C) a polypeptide derivative formed by substitution, deletion or addition of amino acid residues 1-5 to the amino acid sequence shown in any of SEQ ID NOs: 1-11, while maintaining characteristics.

В еще одном предпочтительном варианте осуществления (Х)n может быть u8, u9, u2-u3, u4-u5, u8-u9, u1-u2-u3, u2-u3-u4, u3-u4-u5, u5-u6-u7, u8-u9-u 10, u9-u10-u11, u3-u5-u7, u3-u4-u6, u4-u7-u10, u6-u8-u10, u1-u2-u3-u4, u2-u3-u4-u5, u3-u4-u3-u4, u3-u5-u7-u9, u5-u6-u7-u8, u1-u3-u7-u9, u2-u2-u7-u8, u7-u2-u5-u11, u3-u4-u7-u 10, u1-I-u2, u1-I-u5, u2-I-u4, u3-I-u8, u5-I-u6 или u 10-I-u11.In yet another preferred embodiment, (X)n may be u8, u9, u2-u3, u4-u5, u8-u9, u1-u2-u3, u2-u3-u4, u3-u4-u5, u5-u6- u7, u8-u9-u 10, u9-u10-u11, u3-u5-u7, u3-u4-u6, u4-u7-u10, u6-u8-u10, u1-u2-u3-u4, u2-u3 -u4-u5, u3-u4-u3-u4, u3-u5-u7-u9, u5-u6-u7-u8, u1-u3-u7-u9, u2-u2-u7-u8, u7-u2-u5 -u11, u3-u4-u7-u 10, u1-I-u2, u1-I-u5, u2-I-u4, u3-I-u8, u5-I-u6 or u 10-I-u11.

В еще одном предпочтительном варианте осуществления А1 или А2 имеет последовательность аминокислот, показанную на SEQ ID NO.: 12 (MVSKGEELFTGV).In yet another preferred embodiment, A1 or A2 has the amino acid sequence shown in SEQ ID NO.: 12 (MVSKGEELFTGV).

В еще одном предпочтительном варианте осуществления А1-(Х)n имеет последовательность аминокислот, показанную на SEQ ID NO.: 14, 15, 16, 17, 22, 23, 24, 26, 27, 28, 29 или 30.In another preferred embodiment, A1-(X)n has the amino acid sequence shown in SEQ ID NO.: 14, 15, 16, 17, 22, 23, 24, 26, 27, 28, 29, or 30.

В еще одном предпочтительном варианте осуществления первый линкерный пептид содержит первый участок рестрикции (например, участок рестрикции TEV).In yet another preferred embodiment, the first linker peptide contains a first restriction site (eg, a TEV restriction site).

В еще одном предпочтительном варианте осуществления второй линкерный пептид содержит второй участок рестрикции.In another preferred embodiment, the second linker peptide contains a second restriction site.

В еще одном предпочтительном варианте осуществления гибкий линкер I содержит третий участок рестрикции.In yet another preferred embodiment, flexible linker I contains a third restriction site.

В еще одном предпочтительном варианте осуществления третий участок рестрикции является участком рестрикции ЕК (как показано в последовательности DDDDK, SEQ ID NO.: 25).In yet another preferred embodiment, the third restriction site is a EK restriction site (as shown in the sequence DDDDK, SEQ ID NO.: 25).

В еще одном предпочтительном варианте осуществления (Х)n может являться одним из следующих элементов: u1-EK-u2, u1-EK-u5, u2-EK-u4, u3-EK-u8, u5-EK-u6 или u10-EK-u11, где EK представляет собой участок рестрикции фермента EK.In yet another preferred embodiment, (X)n may be one of the following: u1-EK-u2, u1-EK-u5, u2-EK-u4, u3-EK-u8, u5-EK-u6, or u10-EK -u11, where EK is the restriction site of the EK enzyme.

В еще одном предпочтительном варианте осуществления первый, второй и третий участки рестрикции отличаются друг от друга.In another preferred embodiment, the first, second and third restriction sites are different from each other.

В еще одном предпочтительном варианте осуществления два или три из состава первого, второго и третьего участков рестрикции являются одинаковыми.In another preferred embodiment, two or three of the composition of the first, second and third restriction sites are the same.

В еще одном предпочтительном варианте осуществления первый, второй и третий участки рестрикции отсутствуют в Р1 и Р2.In another preferred embodiment, the first, second and third restriction sites are absent in P1 and P2.

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид, кроме того, содержат участки рестрикции, отличающиеся от первого, второго и третьего участков рестрикции.In another preferred embodiment, the first linker peptide and/or the second linker peptide further comprise restriction sites other than the first, second and third restriction sites.

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид содержат участок рестрикции трипсина, предпочтительно, первый линкерный пептид и/или второй линкерный пептид содержат, по меньшей мере, либо аргинин (R), либо лизин (K).In yet another preferred embodiment, the first linker peptide and/or the second linker peptide comprise a trypsin restriction site, preferably the first linker peptide and/or the second linker peptide comprise at least either arginine (R) or lysine (K).

В еще одном предпочтительном варианте осуществления N-концевой аминокислотой первого линкерного пептида является Arg или Lys.In another preferred embodiment, the N-terminal amino acid of the first linker peptide is Arg or Lys.

В еще одном предпочтительном варианте осуществления С-концевой аминокислотой второго линкерного пептида является Arg или Lys.In another preferred embodiment, the C-terminal amino acid of the second linker peptide is Arg or Lys.

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид, кроме того, содержат последовательность распознавания протеазы вируса гравировки табака.In yet another preferred embodiment, the first linker peptide and/or the second linker peptide further comprise a tobacco etch virus protease recognition sequence.

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид содержат последовательность аминокислот, показанную на SEQ ID NO.: 18.In yet another preferred embodiment, the first linker peptide and/or the second linker peptide comprise the amino acid sequence shown in SEQ ID NO.: 18.

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид, кроме того, содержат последовательность меток, содействующую экспрессии и/или очистке.In yet another preferred embodiment, the first linker peptide and/or the second linker peptide further comprise a tag sequence to aid in expression and/or purification.

В еще одном предпочтительном варианте осуществления последовательность меток представляет собой гистидиновый таг, предпочтительно, таг размерностью 6×HIS.In yet another preferred embodiment, the tag sequence is a histidine tag, preferably a 6xHIS tag.

В еще одном предпочтительном варианте осуществления как Р1, так и Р2 независимо выбираются из следующего: белок-предшественник человеческого инсулина, белок-предшественник инсулина лизпро, белок-предшественник инсулина гларгин, паратиреоидный гормон, кортикорелин, кальцитонин, бивалирудин, глюкагоноподобный пептид и его производные эксенатид и лираглутид, а также зиконотид, серморелин, соматорелин, секретин, тедуглутид, гирудин, гормон роста, фактор роста, фактор, высвобождающий гормон роста, адренокортикотропный гормон, рилизинг-фактор, деслорелин, десмопрессин, элкатонин, глюкагон, лейпрорелин, лютропин-рилизинг-гормон, соматостатин, тиреотропин-рилизинг-гормон, трипторелин, вазоактивный пептид кишечника, интерферон, паратиреоидный гормон, пептид ВН3, амилоидный пептид или фрагменты указанных выше пептидов, или одна из комбинаций (предпочтительно, указанных выше полипептидов, однако не ограничиваясь ими).In another preferred embodiment, both P1 and P2 are independently selected from the following: human insulin precursor protein, insulin lispro precursor protein, insulin glargine precursor protein, parathyroid hormone, corticorelin, calcitonin, bivalirudin, glucagon-like peptide, and exenatide derivatives thereof. and liraglutide, as well as ziconotide, sermorelin, somatorelin, secretin, teduglutide, hirudin, growth hormone, growth factor, growth hormone releasing factor, adrenocorticotropic hormone, releasing factor, deslorelin, desmopressin, elcatonin, glucagon, leuprorelin, lutropin-releasing- hormone, somatostatin, thyrotropin-releasing hormone, triptorelin, intestinal vasoactive peptide, interferon, parathyroid hormone, BH3 peptide, amyloid peptide or fragments of the above peptides, or one of the combinations (preferably, but not limited to the above polypeptides).

В еще одном предпочтительном варианте осуществления как Р1, так и Р2 независимо являются белком искусственной аминокислоты.In yet another preferred embodiment, both P1 and P2 are independently an artificial amino acid protein.

В еще одном предпочтительном варианте осуществления как Р1, так и Р2 независимо имеют последовательность длиной 10-200 аминокислот, предпочтительно, последовательность длиной 10-80 аминокислот.In another preferred embodiment, both P1 and P2 independently have a sequence of 10-200 amino acids, preferably a sequence of 10-80 amino acids.

В еще одном предпочтительном варианте осуществления как Р1, так и Р2 независимо являются проинсулином или инсулином, предпочтительно, человеческим проинсулином или человеческим инсулином.In another preferred embodiment, both P1 and P2 are independently proinsulin or insulin, preferably human proinsulin or human insulin.

В еще одном предпочтительном варианте осуществления инсулин включает в себя инсулин медленного действия или инсулин быстрого действия.In yet another preferred embodiment, the insulin includes slow acting insulin or rapid acting insulin.

В еще одном предпочтительном варианте осуществления лизин в позиции 29 проинсулина является производным алкинилоксикарбонил-лизина, производным трет-бутоксикарбонил-лизинового белка (трет-бутоксикарбонил-L-лизина), ацилированного алифатического лизина или комбинацией указанных элементов.In another preferred embodiment, the lysine at position 29 of proinsulin is an alkynyloxycarbonyl lysine derivative, a tert-butoxycarbonyl-lysine protein derivative (tert-butoxycarbonyl-L-lysine), an acylated aliphatic lysine, or a combination of these elements.

В еще одном предпочтительном варианте осуществления проинсулин имеет последовательность аминокислот, показанную на SEQ ID NO: 19 или 20.In yet another preferred embodiment, proinsulin has the amino acid sequence shown in SEQ ID NO: 19 or 20.

В еще одном предпочтительном варианте осуществления целевой пептид Р2 располагается у С-конца (Х)n (или соединяется с ним).In yet another preferred embodiment, the target P2 peptide is located at the C-terminus of (X)n (or connected to it).

В еще одном предпочтительном варианте осуществления гибридный белок перерабатывается для образования первого целевого пептида и/или второго целевого пептида.In yet another preferred embodiment, the fusion protein is processed to form a first target peptide and/or a second target peptide.

В еще одном предпочтительном варианте осуществления первый целевой пептид и второй целевой пептид могут быть одинаковыми или различными.In another preferred embodiment, the first target peptide and the second target peptide may be the same or different.

В еще одном предпочтительном варианте осуществления гибридный белок перерабатывается для образования первого целевого пептида и/или второго целевого пептида, а (Х)n разделяется с образованием короткого пептида длиной Lx, намного меньшей длины Lp первого целевого пептида и/или второго целевого пептида.In yet another preferred embodiment, the fusion protein is processed to form a first target peptide and/or a second target peptide, and (X)n is separated to form a short peptide of length Lx, much shorter than the length Lp of the first target peptide and/or second target peptide.

В еще одном предпочтительном варианте осуществления каждый Lx является аминокислотой 1-25.In yet another preferred embodiment, each Lx is amino acid 1-25.

В еще одном предпочтительном варианте осуществления отношение длины Lx к длине Lp составляет от 1/2 до 1/10, предпочтительно, от 1/3 to 1/8.In yet another preferred embodiment, the ratio of length Lx to length Lp is 1/2 to 1/10, preferably 1/3 to 1/8.

В еще одном предпочтительном варианте осуществления разность длины Lp и длины L превышает 1,3KD.In yet another preferred embodiment, the difference between the length Lp and the length L is greater than 1.3KD.

В еще одном предпочтительном варианте осуществления гибридный белок имеет структуру, выбираемую из группы, состоящей из: A1-u8-L2-P2, A1-u9-L2-P2, A1-u2-u3-L2-P2, A1-u4- u5-L2-P2, A1-u8-u9-L2-P2, A1-u3-u5-u7-L2-P2, A1-u1-u2-u3-L2-P2, A1-u1-u2-u3-u4-L2-P2, A1-u3-u4-u6-L2-P2, A1-u4-u7-u10-L2-P2, A1-u3-u4-u7-u10-L2-P2 или A1-u5-EK-u6-L2-P2.In yet another preferred embodiment, the fusion protein has a structure selected from the group consisting of: A1-u8-L2-P2, A1-u9-L2-P2, A1-u2-u3-L2-P2, A1-u4-u5- L2-P2, A1-u8-u9-L2-P2, A1-u3-u5-u7-L2-P2, A1-u1-u2-u3-L2-P2, A1-u1-u2-u3-u4-L2- P2, A1-u3-u4-u6-L2-P2, A1-u4-u7-u10-L2-P2, A1-u3-u4-u7-u10-L2-P2 or A1-u5-EK-u6-L2- P2.

В еще одном предпочтительном варианте осуществления гибридный белок имеет последовательность аминокислот, показанную на SEQ ID NO.: 21.In another preferred embodiment, the fusion protein has the amino acid sequence shown in SEQ ID NO.: 21.

Второй объект настоящего изобретения касается изолированного полинуклеотидного кодирования гибридного белка в соответствии с первым объектом настоящего изобретения.The second aspect of the present invention relates to the isolated polynucleotide encoding of a fusion protein according to the first aspect of the present invention.

Третий объект настоящего изобретения касается вектора, включающего в себя полинуклеотид в соответствии со вторым объектом настоящего изобретения.The third object of the present invention relates to a vector that includes a polynucleotide in accordance with the second object of the present invention.

В еще одном предпочтительном варианте осуществления вектор выбирается из группы, состоящей из ДНК, РНК, плазмиды, лентивирусного вектора, аденовирусного вектора, ретровирусного вектора, транспозона или комбинации вышеуказанных элементов.In yet another preferred embodiment, the vector is selected from the group consisting of DNA, RNA, plasmid, lentiviral vector, adenovirus vector, retroviral vector, transposon, or a combination of the above.

В еще одном предпочтительном варианте осуществления вектор является плазмидой; предпочтительно, вектор является вектором pBAD-HisA и/или вектором pEvol-pBpF.In another preferred embodiment, the vector is a plasmid; preferably, the vector is a pBAD-HisA vector and/or a pEvol-pBpF vector.

Четвертый объект настоящего изобретения касается клетки-хозяина, содержащей вектор согласно третьему объекту настоящего изобретения, или полинуклеотида согласно второму объекту настоящего изобретения, интегрированному в хромосому или же обеспечивающему экспрессию гибридного белка согласно первому объекту настоящего изобретения.The fourth object of the present invention relates to a host cell containing a vector according to the third object of the present invention, or a polynucleotide according to the second object of the present invention integrated into a chromosome or allowing the expression of a fusion protein according to the first object of the present invention.

В еще одном предпочтительном варианте осуществления клетка-хозяин является кишечной палочкой, сенной палочкой, дрожжевой клеткой, клеткой насекомого, клеткой млекопитающего или же комбинацией вышеуказанных элементов.In another preferred embodiment, the host cell is E. coli, hay bacillus, yeast cell, insect cell, mammalian cell, or a combination of the above elements.

В еще одном предпочтительном варианте осуществления ни одна из клеток-хозяев не содержит протеаз, соответствующих первому, второму и третьему участкам рестрикции.In another preferred embodiment, none of the host cells contains proteases corresponding to the first, second and third restriction sites.

Пятый объект настоящего изобретения касается способа приготовления белка, содержащего следующие этапы:The fifth object of the present invention relates to a method for preparing a protein, comprising the following steps:

(а) производят культурирование клетки-хозяина согласно четвертому объекту настоящего изобретения, получая, таким образом, гибридный белок согласно первому аспекту настоящего изобретения.(a) culture the host cell according to the fourth aspect of the present invention, thereby obtaining a fusion protein according to the first aspect of the present invention.

В еще одном предпочтительном варианте осуществления способ, кроме того, содержит следующий этап: (b) очищают гибридный белок, полученный на этапе (а).In yet another preferred embodiment, the method further comprises the following step: (b) the fusion protein obtained in step (a) is purified.

В еще одном предпочтительном варианте осуществления способ, кроме того, включает в себя процедуру протеолитической переработки гибридного белка согласно первому аспекту настоящего изобретения, для высвобождения целевого пептида из гибридного белка.In yet another preferred embodiment, the method further comprises a procedure for proteolytically processing the fusion protein according to the first aspect of the present invention to release the target peptide from the fusion protein.

В еще одном предпочтительном варианте осуществления при выполнении этапа (с) перерабатывают гибридный белок согласно первому объекту настоящего изобретения с использованием протеазы для получения переработанного продукта; и, необязательно,In yet another preferred embodiment, in step (c), the fusion protein according to the first aspect of the present invention is processed using a protease to obtain a processed product; and optionally

(d) изолируют или очищают целевой пептид от переработанного продукта.(d) isolate or purify the target peptide from the processed product.

В еще одном предпочтительном варианте осуществления этап очистки включает в себя дальнейшую очистку целевого пептида путем гель-фильтрации или использования процесса высокоэффективной жидкостной хроматографии.In yet another preferred embodiment, the purification step includes further purification of the target peptide by gel filtration or the use of a high performance liquid chromatography process.

Шестой объект настоящего изобретения касается использования гибридного белка согласно первому объекту настоящего изобретения, или полинуклеотида согласно второму объекту настоящего изобретения, или вектора согласно третьему объекту настоящего изобретения, или клетки-хозяина согласно четвертому объекту настоящего изобретения, для обеспечения экспрессии и подготовки целевого пептида.The sixth aspect of the present invention relates to the use of a fusion protein according to the first aspect of the present invention, or a polynucleotide according to the second aspect of the present invention, or a vector according to the third aspect of the present invention, or a host cell according to the fourth aspect of the present invention, to ensure the expression and preparation of the target peptide.

Следует понимать, что в пределах объема настоящего изобретения все вышеупомянутые технические особенности настоящего изобретения и все технические характеристики, подробно описанные ниже (например, варианты осуществления), могут быть объединены друг с другом для образования нового или предпочтительного технического решения. Вследствие ограниченного объема указанное в настоящем документе не повторяется.It should be understood that within the scope of the present invention, all of the aforementioned technical features of the present invention and all of the technical features detailed below (eg, embodiments) may be combined with each other to form a new or preferred technical solution. Due to space limitations, this document does not repeat.

Описание чертежейDescription of drawings

На Фигуре 1 показана структура созревшего инсулина, корректно образующего дисульфидные связи.Figure 1 shows the structure of mature insulin correctly forming disulfide bonds.

На Фигуре 2 показана плазмидная карта экспрессии гибридного белка рекомбинантного человеческого инсулина.Figure 2 shows a plasmid expression map of the recombinant human insulin fusion protein.

На Фигуре 3 показано схематическое изображение гибридного белка рекомбинантного человеческого инсулина.Figure 3 shows a schematic representation of a fusion protein of recombinant human insulin.

На Фигуре 4 показана структура трет-бутоксикарбонил-лизина.Figure 4 shows the structure of tert-butoxycarbonyl-lysine.

На Фигуре 5 продемонстрирована экспрессия рекомбинантного гибридного белка. Линия 1, Экспрессия гибридного белка A1-u4-u5-TEV-R-MinilNS с молекулярной массой 11,2 кД; Линия 2, Экспрессия гибридного белка A1-u4-u5-TEV-R-GLP1 с молекулярной массой 8,7 кД; Линия 3, Экспрессия гибридного белка A1-u8-TEV-R-MiniINS с молекулярной массой 10,0 кД; линия 4, экспрессия гибридного белка A1-u3-u5-u7-TEV-R-MiniINS с молекулярной массой 12,2 кД; линия 5, Экспрессия гибридного белка А1-и5-EK-u6-TEV-R-MiniINS с молекулярной массой 12,0 кД; М представляет собой стандарт молекулярной массы белка.Figure 5 shows the expression of the recombinant fusion protein. Lane 1, Expression of the 11.2 kD A1-u4-u5-TEV-R-MinilNS fusion protein; Lane 2, Expression of the 8.7 kD A1-u4-u5-TEV-R-GLP1 fusion protein; Lane 3, Expression of the 10.0 kD A1-u8-TEV-R-MiniINS fusion protein; lane 4, expression of the 12.2 kD A1-u3-u5-u7-TEV-R-MiniINS fusion protein; line 5, Expression of the hybrid protein A1-u5-EK-u6-TEV-R-MiniINS with a molecular weight of 12.0 kD; M is the protein molecular weight standard.

Подробное описаниеDetailed description

После обширных и всесторонних исследований изобретатели впервые получили новый гибридный белок, пригодный для обеспечения экспрессии целевого пептида. Наличие (Х)n или А1-(Х)n в гибридном белке настоящего изобретения обеспечивает улучшенные параметры процесса складывания и экспрессии целевого гибридного пептида; при этом повышается полезная продуктивность и растворимость гибридного белка и снижается степень его межмолекулярного взаимодействия, так что целевой гибридный пептид может складываться при высоких значениях концентраций, что обеспечивает промышленную значимость процесса. Кроме того, элементы (Х)n или А1-(Х)n гибридного белка могут быть расщеплены на множество коротких пептидов намного меньшей длины, по сравнению с целевым пептидом, что обеспечивает более эффективное отделение его от целевого пептида, повышая удобство процедуры очистки целевого пептида. Руководствуясь вышеизложенным, изобретатели представили настоящее изобретение.After extensive and comprehensive research, the inventors for the first time have received a new hybrid protein suitable for providing expression of the target peptide. The presence of (X)n or A1-(X)n in the fusion protein of the present invention provides improved parameters for the folding process and expression of the target fusion peptide; this increases the useful productivity and solubility of the hybrid protein and reduces the degree of its intermolecular interaction, so that the target hybrid peptide can be folded at high concentrations, which ensures the industrial significance of the process. In addition, the (X)n or A1-(X)n elements of the fusion protein can be cleaved into many short peptides of much smaller length compared to the target peptide, which provides a more efficient separation of it from the target peptide, increasing the convenience of the target peptide purification procedure. . Based on the foregoing, the inventors have presented the present invention.

ТерминыTerms

Перед представлением описания настоящего изобретения необходимо указать, что настоящее изобретение не ограничивается описанными конкретными способами и экспериментальными условиями, т.к. такие способы и условия могут варьироваться. Необходимо также понимать, что термины, использованные в данном документе, предназначены лишь для описания конкретных вариантов осуществления, а не для ограничения объема настоящего изобретения, который ограничивается лишь прилагаемой формулой изобретения.Before presenting the description of the present invention, it is necessary to point out that the present invention is not limited to the specific methods and experimental conditions described; such methods and conditions may vary. It should also be understood that the terms used herein are only intended to describe specific embodiments, and not to limit the scope of the present invention, which is limited only by the appended claims.

Если не указано иное, все технические и научные термины, используемые в данном документе, имеют значение, согласующееся с обычным трактованием его специалистами в той области техники, к которой относится настоящее изобретение.Unless otherwise indicated, all technical and scientific terms used in this document have the meaning consistent with the usual interpretation of its specialists in the field of technology to which the present invention pertains.

В контексте данного документа, при использовании в отношении конкретно приводимого значения, термин «около» означает, что значение может отклоняться от приведенного значения не более чем на 1%. Например, в контексте данного документа выражение «около 100» включает в себя все значения от 99 до 101 (например, 99,1; 99,2; 99,3; 99,4 и т.д.).In the context of this document, when used in relation to a specifically recited value, the term "about" means that the value may deviate from the recited value by no more than 1%. For example, in the context of this document, the expression "about 100" includes all values from 99 to 101 (eg, 99.1; 99.2; 99.3; 99.4, etc.).

В контексте данного документа термин «содержащий» или «включающий» может быть неограничивающим, частично ограничивающим и ограничивающим. Другими словами, такой термин также включает в себя значения «в значительной степени состоящий из» или «состоящий из».In the context of this document, the term "comprising" or "including" may be non-limiting, partially limiting and limiting. In other words, such a term also includes the meanings "substantially consisting of" or "consisting of".

Трехбуквенные и однобуквенные коды аминокислот, используемые в настоящем изобретении, соответствуют описанию, приведенному в публикации J. biool. chem, 243, с. 3558 (1968).The three-letter and one-letter amino acid codes used in the present invention are as described in J. biool. chem, 243, p. 3558 (1968).

В контексте данного документа использование термина «необязательный» или «необязательно» означает, что событие или ситуация, описываемые далее, могут произойти или возникнуть, но не обязаны произойти или возникнуть.In the context of this document, the use of the term "optional" or "optional" means that the event or situation described below may occur or occur, but does not have to occur or occur.

Термин «идентичность последовательности», используемый в настоящем изобретении, относится к степени идентичности двух нуклеиновых кислот или двух последовательностей аминокислот при их оптимальном выравнивании и сравнении с допустимыми мутациями, такими как замещение, вставка или делеция. Степень идентичности при сравнении последовательности, описанной в настоящем изобретении, с ее идентичной последовательностью может доходить, по меньшей мере, до 85%, 90% или 95%; предпочтительно, по меньшей мере до 95%. Неограничивающие примеры включают в себя 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%.The term "sequence identity" as used in the present invention refers to the degree of identity between two nucleic acids or two amino acid sequences when optimally aligned and compared to allowable mutations such as substitution, insertion or deletion. The degree of identity when comparing the sequence described in the present invention, with its identical sequence can reach at least 85%, 90% or 95%; preferably at least up to 95%. Non-limiting examples include 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 100%.

Гибридный белокhybrid protein

В контексте данного документа термины «гибридный белок настоящего изобретения», «рекомбинантный гибридный белок» и «полипептид» относятся к гибридному белку согласно первому объекту настоящего изобретения.In the context of this document, the terms "fusion protein of the present invention", "recombinant fusion protein" and "polypeptide" refer to a fusion protein according to the first aspect of the present invention.

Так, гибридный белок настоящего изобретения включает в себя структуру, показанную в Формуле I:Thus, the fusion protein of the present invention includes the structure shown in Formula I:

гдеWhere

В еще одном предпочтительном варианте осуществления используемый флуоресцентный белок представляет собой ЗФБ, причем предпочтительно в состав аминокислотной последовательности ЗФБ входит аминокислотная последовательность (241 АА), как показано на SEQ ID NO.: 13.In yet another preferred embodiment, the fluorescent protein used is GFB, and preferably the amino acid sequence of GFB includes the amino acid sequence (241 AA) as shown in SEQ ID NO.: 13.

Среди них, в указанной выше последовательности подчеркнутые части представляют собой β-складчатые блоки u1, u2, u3, u4, u5, u6, u7, u8, u9, u10 и u11 флуоресцентного белка последовательности.Among them, in the above sequence, the underlined portions are the β-pleated blocks u1, u2, u3, u4, u5, u6, u7, u8, u9, u10 and u11 of the fluorescent protein sequence.

В еще одном предпочтительном варианте осуществления (Х)n может являться одним из следующих элементов: u8, u9, u2-u3, u4-u5, u8-u9, u1-u2-u3, u2-u3-u4, u3-u4-u5, u5-u6-u7, u8-u9-u10, u9-u10-u11, u3-u5-u7, u3-u4-u6, u4-u7-10 u10, u6-u8-u10, u1-u2-u3-u4, u2-u3-u4-u5, u3-u4-u3-u4, u3-u5-u7-u9, u5-u6-u7-u8, u1-u3-u7-u9, u2-u2-u7-u8, u7-u2-u5-u11, u3-u4-u7-u10, u1-I-u2, u1-I-u5, u2-I-u4, u3-I-u8, u5-I-u6 или u10-I-u11.In yet another preferred embodiment, (X)n may be one of the following: u8, u9, u2-u3, u4-u5, u8-u9, u1-u2-u3, u2-u3-u4, u3-u4-u5 , u5-u6-u7, u8-u9-u10, u9-u10-u11, u3-u5-u7, u3-u4-u6, u4-u7-10 u10, u6-u8-u10, u1-u2-u3- u4, u2-u3-u4-u5, u3-u4-u3-u4, u3-u5-u7-u9, u5-u6-u7-u8, u1-u3-u7-u9, u2-u2-u7-u8, u7-u2-u5-u11, u3-u4-u7-u10, u1-I-u2, u1-I-u5, u2-I-u4, u3-I-u8, u5-I-u6 or u10-I- u11.

В еще одном предпочтительном варианте осуществления каждый X(uj) из состава (Х)n имеет или не имеет гибкое соединение I, предпочтительно, гибкий линкер I.In yet another preferred embodiment, each X(uj) of composition (X)n has or does not have a flexible compound I, preferably a flexible linker I.

В еще одном предпочтительном варианте осуществления гибкий линкер I содержит участок рестрикции фермента ЕК (DDDDK).In yet another preferred embodiment, flexible linker I contains a EK restriction enzyme site (DDDDK).

В еще одном предпочтительном варианте осуществления гибридный белокIn yet another preferred embodiment, the fusion protein

перерабатывается для образования первого целевого пептида и/или второго целевого пептида, а (Х)n разрезается с образованием короткого пептида с длиной Lx, являющейся намного меньшей длины Lp первого целевого пептида и/или второго целевого пептида.is processed to form a first target peptide and/or a second target peptide, and (X)n is cut to form a short peptide with a length Lx that is much shorter than the length Lp of the first target peptide and/or the second target peptide.

В еще одном предпочтительном варианте осуществления А1-(Х)n представляет собой A1-u8, A1-u9, A1-u2-u3, A1-u4-u5, A1-u8-u9, A1-u3-u5-u7, A1-u1-u2-u3, A1-u1-u2-u3-u4, A1-u3-u4-u6, A1-u4-u7-u10, A1-u3-u4-u7-u10 или A1-u5-EK-u6.In another preferred embodiment, A1-(X)n is A1-u8, A1-u9, A1-u2-u3, A1-u4-u5, A1-u8-u9, A1-u3-u5-u7, A1- u1-u2-u3, A1-u1-u2-u3-u4, A1-u3-u4-u6, A1-u4-u7-u10, A1-u3-u4-u7-u10 or A1-u5-EK-u6.

В еще одном предпочтительном варианте осуществления А1-(Х)n имеет 30 последовательность аминокислот, показанную на SEQ ID NO.: 14, 15, 16, 17, 22, 23, 24, 26, 27, 28, 29 или 30.In yet another preferred embodiment, A1-(X)n has the 30 amino acid sequence shown in SEQ ID NO.: 14, 15, 16, 17, 22, 23, 24, 26, 27, 28, 29, or 30.

Последовательность A1-u8:Sequence A1-u8:

MVSKGEELFTGVGIKANFKIRHNVED (SEQ ID NO.: 23)MVSKGEELFTGVGIKANFKIRHNVED (SEQ ID NO.: 23)

Последовательность A1-u9:Sequence A1-u9:

MVSKGEELFTGVVQLADHYQQNTPIG (SEQ ID NO.: 17)MVSKGEELFTGVVQLADHYQQNTPIG (SEQ ID NO.: 17)

Последовательность A1-u2-u3:Sequence A1-u2-u3:

MVSKGEELFTGVHKFSVRGEGEGDATKLTLKFICTT (SEQ ID NO.: 24)MVSKGEELFTGVHKFSVRGEGEGDATKLTLKFICTT (SEQ ID NO.: 24)

Последовательность A1-u4-u5:Sequence A1-u4-u5:

MVSKGEELFTGVYVQERTISFKDTYKTRAEVKFEGD (SEQ ID NO.: 16)MVSKGEELFTGVYVQERTISFKDTYKTRAEVKFEGD (SEQ ID NO.: 16)

Последовательность A1-u3-u5-u7:Sequence A1-u3-u5-u7:

MVSKGEELFTGVKLTLKFICTTTYKTRAEVKFEGDHNVYITADKQ (SEQ ID NO.: 15)MVSKGEELFTGVKLTLKFICTTTYKTRAEVKFEGDHNVYITADKQ (SEQ ID NO.: 15)

Последовательность u8-u9 (A1 отсутствует):Sequence u8-u9 (A1 missing):

GIKANFKIRHNVEDVQLADHYQQNTPIG (SEQ ID NO.: 14)GIKANFKIRHNVEDVQLADHYQQNTPIG (SEQ ID NO.: 14)

Последовательность A1-u5-EK-u6:Sequence A1-u5-EK-u6:

MVSKGEELFTGVTYKTRAEVKFEGDDDDDKTLVNRIELKGIDF (SEQ ID NO.: 22)MVSKGEELFTGVTYKTRAEVKFEGDDDDDKTLVNRIELKGIDF (SEQ ID NO.: 22)

Последовательность A1-u1-u2-u3:Sequence A1-u1-u2-u3:

MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATKLTLKFICTT (SEQ ID NO.: 26)MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATKLTLKFICTT (SEQ ID NO.: 26)

Последовательность A1-u1-u2-u3-u4:Sequence A1-u1-u2-u3-u4:

MVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATKLTLKFICTTMVSKGEELFTGVVPILVELDGDVNGHKFSVRGEGEGDATKLTLKFICTTT

YVQERTISFKD (SEQ ID NO.: 27)YVQERTISFKD (SEQ ID NO.: 27)

Последовательность A1-u3-u4-u6:Sequence A1-u3-u4-u6:

MVSKGEELFTGVKLTLKFICTTYVQERTISFKDTLVNRIELKGIDF (SEQ ID NO.: 28)MVSKGEELFTGVKLTLKFICTTYVQERTISFKDTLVNRIELKGIDF (SEQ ID NO.: 28)

Последовательность A1-u4-u7-u10:Sequence A1-u4-u7-u10:

MVSKGEELFTGVYVQERTISFKDHNVYITADKQHYLSTQSVLSKD (SEQ ID NO.: 29)MVSKGEELFTGVYVQERTISFKDHNVYITADKQHYLSTQSVLSKD (SEQ ID NO.: 29)

Последовательность A1-u3-u4-u7-u10:Sequence A1-u3-u4-u7-u10:

MVSKGEELFTGVKLTLKFICTTYVQERTISFKDHNVYITADKQHYLSTQS VLSKD (SEQ ID NO.: 30)MVSKGEELFTGVKLTLKFICTTYVQERTISFKDHNVYITADKQHYLSTQS VLSKD (SEQ ID NO.: 30)

В еще одном предпочтительном варианте осуществления первый линкерный пептид и/или второй линкерный пептид содержат последовательность аминокислот, показанную на SEQ ID NO.: 18 (ENLYFQGR).In yet another preferred embodiment, the first linker peptide and/or the second linker peptide comprise the amino acid sequence shown in SEQ ID NO.: 18 (ENLYFQGR).

В контексте данного документа термин «гибридный белок» также включает в себя варианты, проявляющие указанную выше активность. В состав указанных вариантов входят следующие (список, однако, не является исчерпывающим): 1-3 (обычно 1-2, более предпочтительно 1) аминокислотных делеций, вставок и/или замещений, а также добавление или удаление одной или нескольких (как правило, 3-х или менее, предпочтительно, 2-х или менее, более предпочтительно, 1-й или менее) аминокислот у С-конца и/или N-конца. В качестве примера, в этой области при замещении аминокислот с близкими или идентичными свойствами функция белка обычно не изменяется. В качестве еще одного примера, добавление или удаление одной или нескольких аминокислот у С-конца и/или N-конца обычно не изменяет структуру и функцию белка. Кроме того, указанный термин также включает в себя полипептид настоящего изобретения в мономерной и мультимерной формах. Указанный термин также включает в себя линейные и нелинейные полипептиды (например, циклические пептиды).In the context of this document, the term "fusion protein" also includes options that exhibit the above activity. These options include the following (however, the list is not exhaustive): 1-3 (usually 1-2, more preferably 1) amino acid deletions, insertions and / or substitutions, as well as the addition or removal of one or more (usually 3 or less, preferably 2 or less, more preferably 1 or less) amino acids at the C-terminus and/or N-terminus. As an example, in this region, when amino acids with similar or identical properties are substituted, the function of the protein is usually not altered. As another example, the addition or removal of one or more amino acids at the C-terminus and/or N-terminus usually does not change the structure and function of the protein. In addition, this term also includes the polypeptide of the present invention in monomeric and multimeric forms. The term also includes linear and non-linear polypeptides (eg, cyclic peptides).

Настоящее изобретение также включает в себя активные фрагменты, производные и аналоги упомянутого выше гибридного белка. В контексте данного документа термины «фрагмент», «производная» и «аналог» относятся к полипептиду, который в значительной степени сохраняет функцию или активность гибридного белка настоящего изобретения. Фрагменты, производные или аналоги полипептида настоящего изобретения могут представлять собой (i) полипептид, в котором замещены один или несколько консервативных или неконсервативных аминокислотных остатков (предпочтительно, консервативных аминокислотных остатков), или (ii) полипептид с заместительной группой в одном или нескольких аминокислотных остатках, или (iii) полипептид, образованный путем слияния полипептида с другим составом (например, составом, продлевающим время полужизни полипептида, такой как полиэтиленгликоль), или (iv) полипептид, образованный путем слияния дополнительной аминокислотной последовательности с последовательностью этого полипептида (гибридный белок, образованный путем слияния с лидерной последовательностью, секреторной последовательностью или последовательностью тага 6His). Согласно принципам, содержащимся в данном документе, указанные фрагменты, производные и аналоги подпадают под сферу действия, хорошо известную специалистам в данной области.The present invention also includes active fragments, derivatives and analogues of the fusion protein mentioned above. As used herein, the terms "fragment", "derivative", and "analogue" refer to a polypeptide that substantially retains the function or activity of the fusion protein of the present invention. Fragments, derivatives or analogs of a polypeptide of the present invention may be (i) a polypeptide in which one or more conservative or non-conservative amino acid residues (preferably conservative amino acid residues) are substituted, or (ii) a polypeptide with a substituent group on one or more amino acid residues, or (iii) a polypeptide formed by fusing a polypeptide with another compound (e.g., a compound that extends the half-life of a polypeptide, such as polyethylene glycol), or (iv) a polypeptide formed by fusing an additional amino acid sequence with that of the polypeptide (a fusion protein formed by fusion with a leader sequence, a secretory sequence, or a 6His tag sequence). According to the principles contained in this document, these fragments, derivatives and analogs fall within the scope, well known to specialists in this field.

Использование термина «предпочтительный тип» в применении к активной производной означает, что, в сравнении с аминокислотной последовательностью настоящего изобретения максимум 3, предпочтительно, максимум 2 и, более предпочтительно, максимум 1 аминокислота в процессе образования полипептида замещается аминокислотами с близкими или аналогичными свойствами. Лучшим способом производства указанных консервативных вариантных полипептидов, согласно Таблице А, является замещение аминокислот.The use of the term "preferred type" when applied to an active derivative means that, compared to the amino acid sequence of the present invention, a maximum of 3, preferably a maximum of 2, and more preferably a maximum of 1 amino acid is replaced by amino acids with similar or similar properties during the formation of the polypeptide. The best way to produce these conserved variant polypeptides, according to Table A, is amino acid substitution.

Настоящее изобретение также представляет аналоги гибридного белка настоящего изобретения. Отличие между указанными аналогами и полипептидом настоящего изобретения может заключаться в наличии иной аминокислотной последовательности, может также заключаться в наличии иной модифицированной формы, не влияющей на последовательность, или же в наличии обоих указанных различий. В состав аналогов также входят аналоги, имеющие остатки, отличающиеся от естественных L-аминокислот (например, D-аминокислоты), и аналоги, имеющие аминокислоты, не встречающиеся в естественном виде, или же синтетические аминокислоты (например, β- и γ-аминокислоты). Необходимо понимать, что полипептид настоящего изобретения может являться не только одним из репрезентативных полипептидов, приведенных в качестве примера выше.The present invention also provides analogues of the fusion protein of the present invention. The difference between these analogs and the polypeptide of the present invention may be the presence of a different amino acid sequence, may also be the presence of a different modified form that does not affect the sequence, or both of these differences. Analogues also include analogs having residues other than naturally occurring L-amino acids (e.g. D-amino acids) and analogs having amino acids not naturally occurring or synthetic amino acids (e.g. β- and γ-amino acids) . It is to be understood that the polypeptide of the present invention may be other than one of the representative polypeptides exemplified above.

Кроме того, гибридный белок настоящего изобретения также может быть модифицирован. Модифицированные (как правило, без изменения первичной структуры) формы включают в себя: химически полученные (например, в процессе ацетилирования или карбоксилирования) in vivo или in vitro формы полипептидов. Процедуры модифицирования также включают в себя гликозилирование, используемое, например, для получения полипептидов в процессе гликозилирующей модификации во время синтеза и переработки полипептида или же во время выполнения дальнейших шагов переработки. Такое модифицирование может быть достигнуто путем обеспечения воздействия на полипептид фермента, выполняющего глизозилирующую роль (например, гликозилазы или дегликозилазы млекопитающих). Модифицированные формы также включают в себя последовательности с аминокислотными остатками (например, фосфотирозином, фосфосерином, фосфотреонином). В их состав также входят полипептиды, подвергшиеся модификации для улучшения своих антипротеолитических свойств или оптимизации своих свойств растворимости.In addition, the fusion protein of the present invention can also be modified. Modified (as a rule, without changing the primary structure) forms include: chemically obtained (for example, in the process of acetylation or carboxylation) in vivo or in vitro forms of polypeptides. Modification procedures also include glycosylation used, for example, to obtain polypeptides during glycosylation modification during polypeptide synthesis and processing, or during further processing steps. Such modification can be achieved by exposing the polypeptide to an enzyme that performs a glycosylating role (eg, a mammalian glycosylase or deglycosylase). Modified forms also include sequences with amino acid residues (eg, phosphotyrosine, phosphoserine, phosphothreonine). They also include polypeptides that have been modified to improve their antiproteolytic properties or optimize their solubility properties.

Термин «полинуклеотид, кодирующий гибридный белок настоящего изобретения» может включать в себя полинуклеотид, кодирующий гибридный белок настоящего изобретения, или же полинуклеотид, включающий в себя также дополнительные кодирующие и/или некодирующие последовательности.The term "polynucleotide encoding a fusion protein of the present invention" may include a polynucleotide encoding a fusion protein of the present invention, or a polynucleotide also including additional coding and/or non-coding sequences.

Настоящее изобретение также относится к вариантам вышеупомянутых полинуклеотидов, которые кодируют фрагменты, аналоги и производные полипептидов или гибридных белков, имеющих аминокислотную последовательность, аналогичную рассматриваемой в настоящем изобретении. Указанные нуклеотидные варианты включают в себя варианты замещения, варианты делеции и варианты вставки. Как известно из уровня техники, аллельный вариант представляет собой альтернативную форму полинуклеотида. Он может представлять собой замещение, делецию или вставку одного или нескольких нуклеотидов, но не изменяет функцию закодированного гибридного белка существенным образом.The present invention also relates to variants of the aforementioned polynucleotides that encode fragments, analogs and derivatives of polypeptides or fusion proteins having an amino acid sequence similar to that discussed in the present invention. These nucleotide variants include substitution variants, deletion variants, and insertion variants. As is known in the art, an allelic variant is an alternative form of a polynucleotide. It may be a substitution, deletion, or insertion of one or more nucleotides, but does not significantly alter the function of the encoded fusion protein.

Настоящее изобретение также относится к полинуклеотидам, гибридизирующимся с вышеупомянутыми последовательностями и характеризующимся, по меньшей мере, 50%, предпочтительно, по меньшей мере, 70% и, более предпочтительно, по меньшей мере 80% идентичностью указанных двух последовательностей. Настоящее изобретение, в частности, относится к полинуклеотидам, гибридизирующимся с полинуклеотидом настоящего изобретения при соблюдении строгих условий (или в жестких условиях). В настоящем изобретении термин «строгие условия» относится к следующему: (1) гибридизации и элюированию при низких значениях ионной силы и высоких температурах, например, 0,2×SSC, 0,1%) SDS, 60°С; или (2) добавлению денатуранта в процессе гибридизации, например, 50% (по объему) формамида, 0,1% телячьей сыворотки / 0,1% фиколла, 42°С, и т.д.; или (3) гибридизации, происходящей лишь тогда, когда степень идентичности двух последовательностей достигает значения 90% или более и, более предпочтительно, 95% или более.The present invention also relates to polynucleotides hybridizing to the above sequences and having at least 50%, preferably at least 70% and more preferably at least 80% identity between the two sequences. The present invention particularly relates to polynucleotides that hybridize to a polynucleotide of the present invention under stringent conditions (or under stringent conditions). In the present invention, the term "stringent conditions" refers to the following: (1) hybridization and elution at low ionic strengths and high temperatures, for example, 0.2×SSC, 0.1%) SDS, 60°C; or (2) adding a denaturant during hybridization, eg 50% (v/v) formamide, 0.1% calf serum/0.1% ficoll, 42°C, etc.; or (3) hybridization occurring only when the degree of identity between the two sequences reaches 90% or more, and more preferably 95% or more.

Предпочтительно, обеспечивается наличие гибридного белка и полинуклеотидов настоящего изобретения в изолированной форме и, более предпочтительно, очищенных до достижения однородности.Preferably, the fusion protein and polynucleotides of the present invention are provided in isolated form and, more preferably, purified to homogeneity.

Полноразмерная последовательность полинуклеотида настоящего изобретения может, как правило, быть получена с использованием способа ПЦР-амплификации, способа рекомбинации или способа искусственного синтезирования. При использовании способа ПЦР-амплификации праймеры могут разрабатываться на основе соответствующей нуклеотидной последовательности, раскрываемой в настоящем изобретении, особенно, последовательности открытой рамки считывания, а также с использованием коммерчески доступной библиотеки кДНК, или же библиотеки кДНК, подготовленной с использованием традиционного способа, известного специалистам в данной области техники, в качестве шаблона для усиления соответствующей последовательности. Если последовательность является длинной, часто оказывается необходимым выполнение двух или более процедур ПЦР-амплификации; затем амплифицированные фрагменты сращиваются в правильном порядке.The full-length sequence of a polynucleotide of the present invention can generally be obtained using a PCR amplification method, a recombination method, or an artificial synthesis method. When using the PCR amplification method, primers can be designed based on the corresponding nucleotide sequence disclosed in the present invention, especially the open reading frame sequence, as well as using a commercially available cDNA library, or a cDNA library prepared using a traditional method known to those skilled in the art. of the art, as a template for amplifying the corresponding sequence. If the sequence is long, it is often necessary to perform two or more PCR amplifications; the amplified fragments are then spliced in the correct order.

Как только была получена соответствующая последовательность, для получения этой соответствующей последовательности в больших количествах может быть использован способ рекомбинации. Как правило, это достигается путем клонирования последовательности в вектор, а затем перенесения ее в клетку и изолирования от пролифелированных клеток-хозяев с использованием традиционных методов.Once the corresponding sequence has been obtained, a recombination method can be used to obtain this corresponding sequence in large quantities. Typically, this is achieved by cloning the sequence into a vector and then transferring it into a cell and isolating it from proliferated host cells using conventional methods.

Кроме того, для синтезирования родственных последовательностей могут также использоваться способы искусственного синтезирования, особенно в случае малой длины фрагмента. (Как правило, путем синтезирования множественных малых фрагментов с последующим получением фрагментов с очень длинными последовательностями.)In addition, artificial synthesis methods can also be used to synthesize related sequences, especially in the case of a small fragment length. (Typically by synthesizing multiple small fragments, followed by very long sequence fragments.)

На данный момент времени процедура кодирования белка (или же его фрагмента или производной) ДНК-последовательностью, согласно настоящему изобретению, реализуется полностью с использованием химического синтеза. Затем ДНК-последовательность может вводиться в различные существующие ДНК-молекулы (или же, например, векторы) и клетки, известные из уровня техники.At this point in time, the procedure for encoding a protein (or a fragment or derivative thereof) with a DNA sequence, according to the present invention, is implemented entirely using chemical synthesis. The DNA sequence can then be introduced into various existing DNA molecules (or, for example, vectors) and cells known in the art.

Предпочтительно, для получения полинуклеотида настоящего изобретения должен использоваться способ, заключающийся в применении ПЦР-технологии для амплификации ДНК/РНК. Предпочтительно, должен использоваться способ быстрой амплификации концов кДНК (RACE-cDNA), особенно в тех случаях, когда получение полноразмерных кДНК из библиотеки затруднено, а надлежащий отбор праймеров, используемых для ПЦР, может осуществляться в соответствии с информацией о последовательности, раскрытой в настоящем изобретении; указанные праймеры могут синтезироваться с применением традиционных способов. Амплифицированные фрагменты ДНК/РНК могут разделяться и очищаться с использованием традиционных методов, например, гель-электрофореза.Preferably, to obtain a polynucleotide of the present invention, a method consisting in the use of PCR technology to amplify DNA/RNA should be used. Preferably, a rapid cDNA end amplification (RACE-cDNA) method should be used, especially in cases where it is difficult to obtain full-length cDNA from a library, and proper selection of primers used for PCR can be carried out in accordance with the sequence information disclosed in the present invention. ; these primers can be synthesized using conventional methods. Amplified DNA/RNA fragments can be separated and purified using traditional methods such as gel electrophoresis.

Вектор экспрессииexpression vector

Настоящее изобретение также относится к вектору, содержащему полинуклеотид настоящего изобретения, клетку-хозяина, полученную способом генной инженерии с использованием вектора настоящего изобретения, или же последовательность кодирования гибридного белка настоящего изобретения, а также к способу получения полипептида настоящего изобретения с использованием рекомбинантной технологии.The present invention also relates to a vector containing a polynucleotide of the present invention, a host cell obtained by a genetic engineering method using a vector of the present invention, or a fusion protein coding sequence of the present invention, as well as a method for producing a polypeptide of the present invention using recombinant technology.

В случае применения традиционной рекомбинатной ДНК-технологии полинуклеотидная последовательность настоящего изобретения может использоваться для обеспечения экспрессии или получения рекомбинантного гибридного белка. В общем случае, присутствуют следующие этапы:In the case of conventional recombinant DNA technology, the polynucleotide sequence of the present invention may be used to provide expression or production of a recombinant fusion protein. In general, the following steps are present:

(1) использование полинуклеотида (или варианта) настоящего изобретения для кодирования гибридного белка настоящего изобретения, или же использование рекомбинантного вектора экспрессии, содержащего полинуклеотид, для трансформирования или преобразования подходящей клетки-хозяина;(1) using a polynucleotide (or variant) of the present invention to encode a fusion protein of the present invention, or using a recombinant expression vector containing the polynucleotide to transform or convert a suitable host cell;

(2) культурирование клетки-хозяина в подходящей среде;(2) culture the host cell in a suitable medium;

(3) изолирование и очистка белка от культуральной среды или клеток.(3) isolation and purification of the protein from the culture medium or cells.

В настоящем изобретении полинуклеотидная последовательность, кодирующая гибридный белок, может вставляться в рекомбинантный вектор экспрессии. Термин «рекомбинантный вектор экспрессии» относится к бактериальным плазмидам, бактериофагам, дрожжевым плазмидам, вирусам растительных клеток, вирусам клеток млекопитающих, таким как аденовирусы, ретровирусы, или же к другим векторам, известным из данной области техники. Могут использоваться любая плазмида и любой вектор, при условии, что удается их воспроизвести и стабилизировать в хозяине. Важной характеристикой вектора экспрессии является то, что он, как правило, содержит точку начала репликации, промотор, маркерный ген и элементы управления трансляцией.In the present invention, a polynucleotide sequence encoding a fusion protein can be inserted into a recombinant expression vector. The term "recombinant expression vector" refers to bacterial plasmids, bacteriophages, yeast plasmids, plant cell viruses, mammalian cell viruses such as adenoviruses, retroviruses, or other vectors known in the art. Any plasmid and any vector can be used, as long as they can be reproduced and stabilized in the host. An important characteristic of an expression vector is that it typically contains an origin of replication, a promoter, a marker gene, and translational controls.

Для конструирования вектора экспрессии, содержащего ДНК-последовательность, кодирующую гибридный белок настоящего изобретения, и соответствующие сигналы управления транскрипцией/трансляцией, могут использоваться способы, хорошо известные специалистам в данной области техники. Указанные способы включают в себя рекомбинантную ДНК-технологию in vitro, технологию синтеза ДНК и рекомбинантную технологию in vivo. ДНК-последовательность может быть эффективно связана с соответствующим промотором в векторе экспрессии для направления синтеза мРНК. Типичными примерами указанных промоторов являются следующие: Лактозный промотор или триптофан промотор кишечной палочки; лямбда-фаг PL промотор; эукариотические промоторы, включая предранний промотор ЦМВ, промотор тимидинкиназы ВПГ, ранний и поздний промотор вируса SV40, ретровирусные LTR-последовательности и некоторые другие известные промоторы, способные контролировать экспрессию генов в прокариотических или эукариотических клетках или вирусах. Вектор экспрессии также включает в себя участок связывания рибосомы для инициирования трансляции, и терминатор транскрипции.Methods well known to those skilled in the art can be used to construct an expression vector containing a DNA sequence encoding a fusion protein of the present invention and appropriate transcription/translation control signals. These methods include in vitro recombinant DNA technology, DNA synthesis technology and in vivo recombinant technology. The DNA sequence can be efficiently linked to an appropriate promoter in an expression vector to direct mRNA synthesis. Typical examples of these promoters are the following: Lactose promoter or tryptophan promoter of Escherichia coli; lambda phage PL promoter; eukaryotic promoters, including the CMV immediate early promoter, the HSV thymidine kinase promoter, the SV40 virus early and late promoter, retroviral LTR sequences, and certain other known promoters capable of controlling gene expression in prokaryotic or eukaryotic cells or viruses. The expression vector also includes a ribosome binding site for translation initiation and a transcription terminator.

Кроме того, вектор экспрессии, предпочтительно, содержит один или несколько селектируемых маркерных генов для обеспечения фенотипических признаков для выбора трансформированных клеток-хозяев, таких как дигидрофолатредуктаза для эукариотической клеточной культуры, ген резистентности к неомицину, и зеленый флуоресцентный белок (ЗФБ) или же ген резистентности Е. Coli. к тетрациклину или ампициллину.In addition, the expression vector preferably contains one or more selectable marker genes to provide phenotypic traits for selecting transformed host cells, such as dihydrofolate reductase for eukaryotic cell culture, neomycin resistance gene, and green fluorescent protein (GFP) or resistance gene. E. coli. to tetracycline or ampicillin.

Вектор, содержащий вышеупомянутую соответствующую ДНК-последовательность и соответствующий промотор или управляющую последовательность, может использоваться для трансформирования соответствующей клетки-хозяина таким способом, что она окажется способной обеспечивать экспрессию белка.A vector containing the aforementioned appropriate DNA sequence and an appropriate promoter or control sequence can be used to transform an appropriate host cell in such a way that it is capable of expressing the protein.

Клетка-хозяин может быть прокариотической клеткой, например, бактериальной клеткой, или эукариотической клеткой, например, дрожжевой клеткой, или же высшей эукариотической клеткой, например, клеткой млекопитающего. Типичными примерами являются следующие: Кишечная палочка, стрептомицеты; бактериальные клетки палочки мышиного тифа; грибковые клетки, такие как дрожжи, и клетки растений (например, клетки женьшеня).The host cell may be a prokaryotic cell, eg a bacterial cell, or a eukaryotic cell, eg a yeast cell, or a higher eukaryotic cell, eg a mammalian cell. Typical examples are the following: Escherichia coli, streptomycetes; bacterial cells of mouse typhoid fever; fungal cells such as yeast; and plant cells (eg ginseng cells).

Если экспрессия полинуклеотида настоящего изобретения происходит в высших эукариотических клетках, то при вставке в вектор энхансерной последовательности транскрипция будет усилена. Энхансеры представляют собой факторы ДНК, состоящие, как правило, из 10-300 базовых пар и действующие в цис-положении на промоторы для усиления транскрипции генов. Примеры включают в себя энхансер SV40 (состоящий из 100-270 базовых пар) на поздней стороне точки начала репликации, полиомный энхансер на поздней стороне точки начала репликации и аденовирусные энхансеры (включая подобные им).If the expression of the polynucleotide of the present invention occurs in higher eukaryotic cells, then when the enhancer sequence is inserted into the vector, transcription will be increased. Enhancers are DNA factors typically consisting of 10-300 base pairs that act cis on promoters to enhance gene transcription. Examples include the SV40 enhancer (consisting of 100-270 base pairs) on the late side of the replication origin, the polyoma enhancer on the late side of the replication origin, and adenoviral enhancers (including the like).

Специалисты, обладающие обычными знаниями в данной области техники, знакомы с процедурой выбора надлежащих векторов, промоторов, энхансеров и клеток-хозяев.Those of ordinary skill in the art are familiar with the procedure for selecting appropriate vectors, promoters, enhancers, and host cells.

Трансформирование клеток-хозяев с рекомбинантной ДНК может осуществляться с использованием традиционных методик, хорошо известных специалистам в этой области техники. Если хозяин является прокариотом (например, кишечная палочка), то сбор компетентных клеток, способных к абсорбции ДНК, может осуществляться после фазы экспоненциального роста, а обработка их - по методу CaCl₂. Используемые при этом этапы хорошо известны из уровня техники. Другой способ заключается в использовании MgCl₂. При необходимости процесс трансформирования может осуществляться при помощи электропорации. Если хозяин является эукариотом, могут быть выбраны следующие способы трансфекции ДНК: способ совместного осаждения фосфата кальция, традиционные механические методы, например, микроинъекция, электропорация, упаковка в липосомы и т.д.Transformation of host cells with recombinant DNA can be carried out using conventional techniques well known to those skilled in the art. If the host is a prokaryote (eg, Escherichia coli), then the collection of competent cells capable of absorbing DNA can be carried out after the exponential growth phase, and processing them - by the method of CaCl ₂ . The steps involved are well known in the art. Another way is to use MgCl ₂ . If necessary, the transformation process can be carried out using electroporation. If the host is a eukaryote, the following DNA transfection methods can be selected: calcium phosphate co-precipitation method, traditional mechanical methods such as microinjection, electroporation, liposome packaging, etc.

Получаемые трансформанты могут культурироваться с использованием традиционных методов для обеспечения экспрессии полипептида, кодируемого геном настоящего изобретения. В зависимости от используемой клетки-хозяина может использоваться одна из традиционных культуральных сред. Процесс культурирования осуществляется в условиях, подходящих для выращивания клеток-хозяев. После того как в процессе роста клеток-хозяев будет достигнуто необходимое значение плотности клеток, выбранный промотор индуцируется с использованием соответствующего метода (например, температурной конверсии или химической индукции), и клетки культурируются в течение определенного периода времени.The resulting transformants can be cultured using conventional methods to ensure expression of the polypeptide encoded by the gene of the present invention. Depending on the host cell used, one of the conventional culture media may be used. The culture process is carried out under conditions suitable for growing host cells. Once the desired cell density has been reached during growth of the host cells, the selected promoter is induced using an appropriate method (eg, temperature conversion or chemical induction) and the cells are cultured for a specified period of time.

При использовании указанного выше метода рекомбинантный полипептид может экспрессироваться в клетке или на клеточной мембране или же секретироваться из клетки. При необходимости могут использоваться физические, химические и другие характеристики рекомбинантного белка для его отделения и очистки с использованием различных методов разделения. Указанные методы хорошо известны специалистам в этой области техники. Примеры указанных методов включают в себя следующее (список, однако, не является исчерпывающим): традиционная ренатурационная обработка, обработка осадителем белка (способ высаливания), центрифугирование, разрушение бактерий посредством осмоса, ультраобработка, ультрацентрифугирование, молекулярно-ситовая хроматография (гель-фильтрация), адсорбционная хроматография, ионообменная хроматография, высокоэффективная жидкостная хроматография (ВЭЖХ) и различные другие методы жидкостной хроматографии, а также комбинации указанных методов.Using the above method, the recombinant polypeptide can be expressed in the cell or on the cell membrane, or secreted from the cell. If necessary, physical, chemical and other characteristics of the recombinant protein can be used to separate and purify it using various separation methods. These methods are well known to those skilled in the art. Examples of these methods include the following (however, the list is not exhaustive): conventional renaturation treatment, treatment with a protein precipitant (salting out method), centrifugation, destruction of bacteria by osmosis, ultraprocessing, ultracentrifugation, molecular sieve chromatography (gel filtration), adsorption chromatography, ion exchange chromatography, high performance liquid chromatography (HPLC), and various other liquid chromatography methods, as well as combinations of these methods.

Синтезирование инсулинаInsulin synthesis

Инсулин является четко выраженным пептидом с известной аминокислотной последовательностью и структурными характеристиками. Он является белком, насчитывающим 51 аминокислотный остаток, с двумя аминокислотными цепями. Гормон содержит две независимые пептидные цепи, цепь А (21 аминокислота) и цепь В (30 аминокислот). Имеются 6 цистеиновых остатков в двух аминокислотных цепях, и каждая из цепей имеет два цистеиновых остатка, соединенных друг с другом посредством дисульфидных связей. С точки зрения статистики существует 15 возможных вариантов образования дисульфидных связей в молекуле человеческого инсулина. Однако в человеческом инсулине, проявляющем биологическую активность, присутствует лишь один из указанных 15 возможных вариантов, и указанные дисульфидные связи являются следующими: 1) А6-А11; 2) А7-В7; 3) А20-В19. Проинсулин является биологическим предшественником инсулина. Он представляет собой одноцепной пептид, образующийся путем связывания цепи А и цепи В пептидом С. Две пептидные цепи инсулина соединяются дисульфидными связями (Фигура 1).Insulin is a well-defined peptide with a known amino acid sequence and structural characteristics. It is a 51 amino acid protein with two amino acid chains. The hormone contains two independent peptide chains, the A chain (21 amino acids) and the B chain (30 amino acids). There are 6 cysteine residues in two amino acid chains, and each of the chains has two cysteine residues connected to each other through disulfide bonds. In terms of statistics, there are 15 possible variants of the formation of disulfide bonds in the human insulin molecule. However, in biologically active human insulin, only one of these 15 possible variants is present, and these disulfide bonds are as follows: 1) A6-A11; 2) A7-B7; 3) A20-B19. Proinsulin is the biological precursor of insulin. It is a single chain peptide formed by linking chain A and chain B with peptide C. Two peptide chains of insulin are connected by disulfide bonds (Figure 1).

Инсулин представляет собой белковый гормон, выделяемый островными клетками поджелудочной железы, стимулируемыми эндогенными веществами, такими как глюкоза. Первым секретом островных клеток поджелудочной железы является проинсулин, длинноцепочечный полипептид, состоящий из 84 аминокислот. Проинсулин отщепляется от средней части (цепи С) проинсулина под действием особых ферментов РС1 и РС2, осуществляющих преобразование протеазы в проинсулин, а также под действием карбоксипептидазы Е (СРЕ), в то время как карбоксильная часть (цепь А) и аминная часть (цепь В) проинсулина соединяются дисульфидными связями с образованием инсулина. Зрелый инсулин содержится в секреторных пузырьках островных клеток поджелудочной железы и координируется при помощи ионов цинка для образования гексамеров. При внешней стимуляции инсулин высвобождается в кровь вместе с секреторными пузырьками и оказывает свое физиологическое воздействие. Кровь пациентов с диабетом 1-го типа теряет способность к регулированию уровня глюкозы вследствие утери островными клетками поджелудочной железы способности к образованию инсулина.Insulin is a protein hormone secreted by pancreatic insular cells stimulated by endogenous substances such as glucose. The first secretion of the pancreatic island cells is proinsulin, a long chain polypeptide of 84 amino acids. Proinsulin is cleaved from the middle part (chain C) of proinsulin by the action of special enzymes PC1 and PC2, which convert the protease into proinsulin, as well as by the action of carboxypeptidase E (CPE), while the carboxyl part (chain A) and the amine part (chain B ) of proinsulin are connected by disulfide bonds to form insulin. Mature insulin is contained in the secretory vesicles of the pancreatic islet cells and is coordinated by zinc ions to form hexamers. With external stimulation, insulin is released into the blood along with secretory vesicles and exerts its physiological effects. The blood of patients with type 1 diabetes loses the ability to regulate glucose levels due to the loss of the ability of pancreatic island cells to form insulin.

На данный момент времени существуют два способа получения различных типов коммерческого рекомбинантного человеческого инсулина - способ «комбинирования цепей» и «проинсулиновый» способ. При использовании способа «комбинирования цепей» две пептидные цепи, составляющие инсулин - цепь А и цепь В - синтезируются отдельно с применением биологического рекомбинирования, а затем цепь А и цепь В смешиваются для образования дисульфидных связей для формирования биологически активного человеческого инсулина. Тем не менее, эффективность процесса прямого смешивания двух пептидных цепей для образования биологически активного человеческого инсулина является относительно невысокой, и окончательный выход вещества составляет лишь около 7%. Данный метод постепенно вытесняется вторым, «проинсулиновым» способом. При использовании «проинсулинового» способа проинсулин, состоящий из инсулиновых цепей В, С и А, сначала экспрессируется в Е. coli или дрожжах, а затем, после очистки, ренатурируется in vitro. Ренатурированный проинсулин затем подвергается гидролизу и перерабатывается с использованием трипсина и карбоксипептидазы В, для получения человеческого инсулина, характеризующегося естественной активностью. При использовании «проинсулинового» способа трипсин специфически распознает лизин и аргинин в белке и расщепляет пептидную связь у С-конца лизина и аргинина. По конформационным причинам аргинин в позиции В22 проинсулина не гидролизируется трипсином. Однако трипсин распознает и гидролизирует лизин в позиции В29 инсулина, образуя, как следствие, инсулин в качестве побочного продукта (инсулин DesB30), в котором исключен треонин в позиции В30. Для снижения выработки инсулина DesB30 должны строго контролироваться количество трипсина и время реакции. Тем не менее, определенное количество инсулина DesB30 будет все же произведено. Вследствие того, что инсулин DesB30 и обычный инсулин отличаются лишь наличием или отсутствием треонина, их разделение является весьма трудной задачей. Для промышленного разделения инсулина используется технология высокоэффективной жидкостной хроматографии, проводимой в крупных масштабах; однако в процессе разделения обычного инсулина и инсулина DesB30 с использованием указанного способа образуется большое количество промышленных отходов, что существенно повышает стоимость производства существующего рекомбинантного человеческого инсулина.Currently, there are two methods for producing different types of commercial recombinant human insulin - the "chain combination" method and the "pro-insulin" method. When using the "chain combination" method, the two peptide chains that make up insulin - chain A and chain B - are synthesized separately using biological recombination, and then chain A and chain B are mixed to form disulfide bonds to form biologically active human insulin. However, the efficiency of the process of direct mixing of two peptide chains to form biologically active human insulin is relatively low, and the final yield of the substance is only about 7%. This method is gradually being replaced by the second, "pro-insulin" method. When using the "proinsulin" method, proinsulin, consisting of insulin chains B, C and A, is first expressed in E. coli or yeast and then, after purification, is renatured in vitro. Renatured proinsulin is then hydrolyzed and processed using trypsin and carboxypeptidase B to produce naturally active human insulin. When using the "pro-insulin" method, trypsin specifically recognizes lysine and arginine in the protein and cleaves the peptide bond at the C-terminus of lysine and arginine. For conformational reasons, the arginine at position B22 of proinsulin is not hydrolyzed by trypsin. However, trypsin recognizes and hydrolyzes the lysine at the B29 position of the insulin, resulting in insulin as a by-product (insulin DesB30), which eliminates the threonine at the B30 position. To reduce insulin production DesB30, the amount of trypsin and reaction time must be strictly controlled. However, a certain amount of DesB30 insulin will still be produced. Because insulin DesB30 and regular insulin differ only in the presence or absence of threonine, their separation is a very difficult task. For the industrial separation of insulin, high-performance liquid chromatography technology is used, carried out on a large scale; however, the separation of conventional insulin and DesB30 insulin using this method generates a large amount of industrial waste, which significantly increases the cost of production of existing recombinant human insulin.

Настоящее изобретение представляет способ получения человеческого инсулина с корректно соединенными цистеиновыми мостиками. В процессе своей реализации данный метод требует меньшего количества этапов, благодаря чему можно добиться большей производительности процесса выработки человеческого инсулина.The present invention provides a process for the production of human insulin with properly connected cysteine bridges. In the course of its implementation, this method requires fewer steps, due to which it is possible to achieve greater productivity in the process of producing human insulin.

Химическим способом был синтезирован фрагмент ДНК; при этом структура кодирования 2β-TEV-R-MiniINS фрагмента ДНК состояла из аминокислотной последовательности, показанной на SEQ ID NO.: 21. Указанный фрагмент ДНК клонировался в вектор бактериальной экспрессии, регулируемый промотором araBAD. Вектор экспрессии, содержащий 2β-TEV-R-MiniINS, преобразовывался в штамм Top10 Е. coli, а рекомбинантные клетки культурировались в среде Лурия-Бертани, содержащей примесные элементы. Гибридный белок 2β-TEV-R-MiniINS извлекался из внутриклеточных включений и складывался при определенных условиях, что приводило к тому, что образованная дисульфидная связь в сложенном гибридном белке 2β-TEV-R-MiniINS была идентична дисульфидной связи в сложенном человеческом проинсулине, т.е., формировались дисульфидные связи А6-А11, А7-В7 и А20-В19. Разделенный корректно сложенный гибридный белок 2β-TEV-R-MiniINS перерабатывался с использованием трипсина и карбоксипептидазы В для образования правильно сложенного трет-бутоксикарбонильного человеческого инсулина. Трет-бутоксикарбонильный человеческий инсулин очищался до степени чистоты 90% с использованием процесса гидрофобной хроматографии. Затем осуществлялась депротекция трет-бутоксикарбонила кислотой для образования корректно сложенного человеческого инсулина, который затем очищался в процессе ВЭЖХ в режиме обращения фазы. Для определения свойств полученного таким способом чистого человеческого инсулина использовались процессы N-терминального анализа последовательностей, определения молекулярной массы и пептидного картирования.A DNA fragment was synthesized chemically; wherein the coding structure of the 2β-TEV-R-MiniINS DNA fragment consisted of the amino acid sequence shown in SEQ ID NO.: 21. This DNA fragment was cloned into a bacterial expression vector regulated by the araBAD promoter. The expression vector containing 2β-TEV-R-MiniINS was converted into E. coli Top10 strain, and the recombinant cells were cultured in Luria-Bertani medium containing contaminants. The 2β-TEV-R-MiniINS fusion protein was extracted from intracellular inclusions and folded under certain conditions, resulting in the formed disulfide bond in the folded 2β-TEV-R-MiniINS fusion protein being identical to the disulfide bond in folded human proinsulin, i.e. e., disulfide bonds A6-A11, A7-B7 and A20-B19 were formed. The separated, correctly folded 2β-TEV-R-MiniINS fusion protein was processed using trypsin and carboxypeptidase B to form correctly folded tert-butoxycarbonyl human insulin. Tert-butoxycarbonyl human insulin was purified to 90% purity using a hydrophobic chromatography process. The tert-butoxycarbonyl was then deprotected with acid to form correctly folded human insulin, which was then purified by reverse phase HPLC. N-terminal sequence analysis, molecular weight determination, and peptide mapping processes were used to determine the properties of pure human insulin thus obtained.

По сравнению с предшествующим уровнем техники основными преимуществами настоящего изобретения являются следующие:Compared with the prior art, the main advantages of the present invention are as follows:

1) Элемент гибридного белка настоящего изобретения, способствующий экспрессии белка, может также способствовать складыванию гибридного белка.1) An element of the fusion protein of the present invention that promotes protein expression may also contribute to the folding of the fusion protein.

2) Элемент гибридного белка настоящего изобретения, способствующий экспрессии белка, может повышать степень растворимости растворимого гибридного белка и снижать степень его межмолекулярного взаимодействия, так что появляется возможность складывания гибридного белка при высоких значениях концентраций, что обеспечивает промышленную значимость процесса.2) The protein expression promoting element of the fusion protein of the present invention can increase the solubility of the soluble fusion protein and reduce the degree of intermolecular interaction thereof, so that the fusion protein can be folded at high concentrations, which makes the process industrially useful.

3) В процессе подготовки целевого пептида отсутствует необходимость в проведении бромцианового расщепления, окислительного гидролиза сульфитов и связанных с ними этапов очистки.3) In the process of preparing the target peptide, there is no need to carry out cyanogen bromide cleavage, oxidative hydrolysis of sulfites and associated purification steps.

4) В процессе подготовки целевых пептидов отсутствует необходимость в использовании тиолов или гидрофобных адсорбирующих смол в высоких концентрациях.4) In the process of preparing the target peptides, there is no need to use thiols or hydrophobic adsorbent resins in high concentrations.

5) Обеспечивается защита целевых пептидов от внутриклеточной деструкции микробных хозяев.5) The target peptides are protected from intracellular destruction of microbial hosts.

6) Целевой белок характеризуется высокими значениями удельной плотности (повышенным коэффициентом слияния). Элементы (Х)n или А1-(Х)n гибридного белка могут перерабатываться в малые фрагменты с участием протеазы. В сравнении с целевым белком обеспечивается широкое различие значений молекулярной массы и существенная простота разделения.6) The target protein is characterized by high values of specific gravity (increased fusion coefficient). The (X)n or A1-(X)n elements of the fusion protein can be processed into small fragments by the protease. Compared to the target protein, a wide variation in molecular weight values and significant ease of separation are provided.

7) Гибридный белок настоящего изобретения может способствовать экспрессии целевого пептида; существенно повышаются уровень экспрессии и выход целевого пептида.7) The fusion protein of the present invention can promote the expression of the target peptide; the level of expression and the yield of the target peptide are significantly increased.

8) Гибридный белок настоящего изобретения весьма подходит для обеспечения экспрессии целевых пептидов с участием искусственных аминокислот и, очевидно, может способствовать складыванию целевых пептидов с участием искусственных аминокислот.8) The fusion protein of the present invention is highly suitable for expression of artificial amino acid target peptides, and can obviously assist in the folding of artificial amino acid target peptides.

Настоящее изобретение будет дополнительно разъяснено ниже с демонстрацией конкретных вариантов осуществления. Следует понимать, что указанные варианты осуществления используются только для иллюстрации настоящего изобретения, а не для ограничения объема настоящего изобретения. Экспериментальные способы без указания конкретных условий их осуществления в следующих примерах обычно реализуются в общепринятых условиях, например, в условиях, описанных в работе Сэмбрука (Sambrook) с соавторами «Молекулярное клонирование»: Лабораторное руководство (Нью-Йорк: Cold Spring Harbor Laboratory Press, 1989), или же в соответствии с условиями, предлагаемыми производителем. Если не указано иное, проценты и части представляют собой массовые проценты и массовые части.The present invention will be further explained below with demonstration of specific embodiments. It should be understood that these embodiments are used only to illustrate the present invention and not to limit the scope of the present invention. Experimental methods without specifying the specific conditions for their implementation in the following examples are usually carried out under conventional conditions, for example, under the conditions described in Sambrook (Sambrook) with co-authors "Molecular Cloning": Laboratory Manual (New York: Cold Spring Harbor Laboratory Press, 1989 ), or in accordance with the conditions offered by the manufacturer. Unless otherwise indicated, percentages and parts are weight percent and weight parts.

Указанные варианты осуществления используют в качестве примера целевого пептида человеческий инсулин, однако данный пример не является ограничивающим.These embodiments use human insulin as an example of the target peptide, however, this example is not limiting.

Пример 1. Конструирование вектора экспрессии A1-u4-u5-TEV-R-MiniINSExample 1 Construction of the A1-u4-u5-TEV-R-MiniINS Expression Vector

Структура экспрессии A1-u4-u5-TEV-R-MiniINS содержит ген, кодирующий белок человеческого инсулина, который слит с С-концом структуры A1-u4-u5. Линкерный пептид, соединяющий A1-u4-u5 и инсулиновый белок MiniINS, представляет собой октапептид Glu-Asn-Leu-Tyr-Phe-Gln-Gly-Arg. Указанный октапептид может гидролизироваться трипсином у карбоксильного конца Arg, и может также гидролизироваться TEV-протеазой между Gin и Gly. ДНК-последовательность октапептида является кодон-оптимизированной, что позволяет реализовать высокоуровневую экспрессию функционального белка в Е. coli.The A1-u4-u5-TEV-R-MiniINS expression structure contains the gene encoding the human insulin protein, which is fused to the C-terminus of the A1-u4-u5 structure. The linker peptide connecting A1-u4-u5 and MiniINS insulin protein is Glu-Asn-Leu-Tyr-Phe-Gln-Gly-Arg octapeptide. This octapeptide can be hydrolysed by trypsin at the carboxyl terminus of Arg, and can also be hydrolyzed by TEV protease between Gin and Gly. The DNA sequence of the octapeptide is codon-optimized, which allows high-level expression of a functional protein in E. coli.

Все использованные фрагменты гибридного рекомбинантного белка синтезировались при помощи Gen Script и загружались в вектор pUC57. Структура A1-u4-u5-TEV-R-MiniINS удалялась из синтетического вектора pUC57-A1-u4-u5-TEV-R-MiniINS с использованием рестрикционных ферментов NcoI и XhoI; в то же самое время вектор экспрессии pBAD/His A(KanaR) вырезался с использованием тех же самых рестрикционных ферментов NcoI и XhoI. Переработанные продукты разделялись сначала с использованием процедуры электрофореза в агарозном геле, а затем - набора для восстановления ДНК в агарозном геле для экстракции; наконец, два ДНК-фрагмента соединялись с использованием ДНК-лигазы Т4. Продукт лигирования трансформировался в клетки Е. coli Тор 10, а затем трансформированные клетки культурировались на агаровой среде Луриа-Бертани, содержащей канамицин в концентрации 50 мкг/мл (дрожжевой пептон 10 г/л, порошок дрожжевого экстракта 5 г/л, NaCl 10 г/л, агар 1,5%), в течение ночи. Были выбраны 3 живых колонии; в течение ночи производилось их культурирование в 5 мл жидкой среды Луриа-Бертани (дрожжевой пептон -10 г/л, порошок дрожжевого экстракта - 5 г/л, NaCl - 10 т/л), содержащей 50 мкг/мл канамицина, и с использованием для экстракции плазмиды мини-набора Plasmid. Затем экстрагированная плазмида подвергалась секвенированию. Полученной в конце всех этих манипуляций плазмиде было присвоено название pBAD-A1-u4-u5-TEV-R-MiniINS. Карта плазмиды и схема гибридного белка показаны на Фиг. 2 и 3, соответственно.All fragments of the hybrid recombinant protein used were synthesized using Gen Script and loaded into the pUC57 vector. The A1-u4-u5-TEV-R-MiniINS structure was removed from the synthetic vector pUC57-A1-u4-u5-TEV-R-MiniINS using restriction enzymes NcoI and XhoI; at the same time, the expression vector pBAD/His A(KanaR) was excised using the same restriction enzymes NcoI and XhoI. The processed products were separated first using an agarose gel electrophoresis procedure and then an agarose gel DNA repair kit for extraction; finally, the two DNA fragments were joined using T4 DNA ligase. The ligation product was transformed into E. coli Top 10 cells, and then the transformed cells were cultured on a Luria-Bertani agar medium containing kanamycin at a concentration of 50 μg/ml (yeast peptone 10 g/l, yeast extract powder 5 g/l, NaCl 10 g /l, agar 1.5%), overnight. 3 living colonies were selected; overnight, they were cultured in 5 ml of Luria-Bertani liquid medium (yeast peptone - 10 g/l, yeast extract powder - 5 g/l, NaCl - 10 t/l) containing 50 μg/ml of kanamycin, and using for plasmid extraction with the Plasmid Mini-Kit. The extracted plasmid was then subjected to sequencing. The plasmid obtained at the end of all these manipulations was named pBAD-A1-u4-u5-TEV-R-MiniINS. The plasmid map and fusion protein scheme are shown in FIG. 2 and 3, respectively.

Пример 2. Конструирование структуры экспрессии A1-u4-u5-TEV-R-GLP1Example 2 Construction of the A1-u4-u5-TEV-R-GLP1 Expression Structure

Порядок конструирования и синтезирования структуры экспрессии pUC57-A1-u4-u5-TEV-R-GLPl описан в Примере 1. В то же самое время для вырезания вектора экспрессии pBAD/His A(KanaR) использовались рестрикционные ферменты NcoI и XhoI, и переработанные продукты разделялись с использованием процедуры электрофореза в агарозном геле, а затем - с использованием набора для восстановления ДНК в агарозном геле для экстракции; наконец, два ДНК-фрагмента соединялись с использованием ДНК-лигазы Т4. Продукт лигирования химически трансформировался в клетки Е. coli Тор10, а затем трансформированные клетки культурировались на агаровой среде Луриа-Бертани, содержащей канамицин в концентрации 50 мкг/мл (дрожжевой пептон - 10 г/л, порошок дрожжевого экстракта - 5 г/л, NaCl - 10 г/л, агар - 1,5%) в течение ночи. Были выбраны 3 живых колонии; в течение ночи производилось их культурирование в 5 мл жидкой среды Луриа-Бертани (дрожжевой пептон - 10 г/л, порошок дрожжевого экстракта - 5 г/л, NaCl - 10 г/л), содержащей 50 мкг/мл канамицина, и с использованием для экстракции плазмиды мини-набора Plasmid. Затем экстрагированная плазмида подвергалась секвенированию с использованием олигонуклеотидного праймера для секвенирования 5'-ATGCCATAGCATTTTTATCC-3' для подтверждения корректности вставки. Полученной плазмиде было присвоено название pBAD-A 1-u4-u5-TEV-R-GLP1.The procedure for constructing and synthesizing the expression structure pUC57-A1-u4-u5-TEV-R-GLPl is described in Example 1. At the same time, restriction enzymes NcoI and XhoI were used to excise the pBAD/His A(KanaR) expression vector, and processed products separated using an agarose gel electrophoresis procedure and then using an agarose DNA recovery gel extraction kit; finally, the two DNA fragments were joined using T4 DNA ligase. The ligation product was chemically transformed into E. coli Top10 cells, and then the transformed cells were cultured on a Luria-Bertani agar medium containing kanamycin at a concentration of 50 μg/ml (yeast peptone - 10 g/l, yeast extract powder - 5 g/l, NaCl - 10 g/l, agar - 1.5%) during the night. 3 living colonies were selected; overnight, they were cultured in 5 ml of liquid Luria-Bertani medium (yeast peptone - 10 g/l, yeast extract powder - 5 g/l, NaCl - 10 g/l) containing 50 μg/ml of kanamycin, and using for plasmid extraction with the Plasmid Mini-Kit. The extracted plasmid was then subjected to sequencing using the oligonucleotide sequencing primer 5'-ATGCCATAGCATTTTTATCC-3' to confirm the correct insertion. The resulting plasmid was named pBAD-A 1-u4-u5-TEV-R-GLP1.

Пример 3. Экспрессия, разделение и очистка гибридного белка А1-и4-u5-TEV-R-MiniINSExample 3 Expression, separation and purification of the A1-u4-u5-TEV-R-MiniINS fusion protein

Для обеспечения экспрессии фрагмента слияния A1-u4-u5-TEV-R-MiniINS, содержащего аминокислотную последовательность SEQ ID NO.: 21. Плазмида pBAD-A1-u4-u5-TEV-R-MiniINS, подтвержденная посредствомTo allow expression of the A1-u4-u5-TEV-R-MiniINS fusion fragment containing the amino acid sequence of SEQ ID NO.: 21. Plasmid pBAD-A1-u4-u5-TEV-R-MiniINS, verified by

секвенирования, и плазмида аминоацил-тРНК-синтетазы для пирролизина pEvol-pylRs-pylT (где плазмида аминоацил-тРНК-синтетазы для пирролизина pEvol-pylRs-pylT использовалась для обеспечения экспрессии аминоацил-тРНК-синтетазы и тРНК, как показано в Примере 1 Заявки на патент №2011103886241) совместно трансформировались в штамм Top10 Е. coli. Трансформационный раствор размещался на ночь на агаровой среде Луриа-Бертани, содержащей канамицин в концентрации 25 мкг/мл и хлорамфеникол в концентрации 17 мкг/мл. Выбиралась одиночная колония; в течение ночи производилось ее культурирование в жидкой среде Луриа-Бертани, содержащей канамицин в концентрации 25 мкг/мл и хлорамфеникол в концентрации 17 мкг/мл. Затем ночная культура вносилась в 100 мл среды Луриа-Бертани (жидкая среда Луриа-Бертани: дрожжевой пептон - 12 г/л, порошок дрожжевого экстракта - 24 г/л, глицерол - 4 мл/л, партнерский белок киназы 4%, пеноподавляющее средство 0,3%о. Раствор партнерского белка киназы: KH₂PO₄ 23,1 г/л, безводный K₂HPO₄ 125,4 г/л), содержащий канамицин в концентрации 25 мкг/мл и хлорамфеникол в концентрации 17 мкг/мл; инкубирование производилось при 37°С до достижения уровня значений 2~4 оптической плотности OD₆₀₀. Затем к среде добавлялся 25% раствор арабинозы до достижения окончательной концентрации 0,25%, и добавлялось 0,1 М трет-бутоксикарбонил-лизинового раствора (трет-бутоксикарбонил-лизина, где структура трет-бутоксикарбонила показана на Фиг. 4) до достижения окончательной концентрации 5 нМ для индуцирования экспрессии гибридного белка. Раствор культуры непрерывно культурировался в течение 16-20 часов, а затем осуществлялась процедура сбора центрифугированием (10000 об/мин, 5 мин, 4°С).sequencing, and the pyrrolysin aminoacyl-tRNA synthetase plasmid pEvol-pylRs-pylT (wherein the pyrrolysin aminoacyl-tRNA synthetase plasmid pEvol-pylRs-pylT was used to allow the expression of aminoacyl-tRNA synthetase and tRNA as shown in Example 1 of the Application for patent No. 2011103886241) were co-transformed into E. coli strain Top10. The transformation solution was placed overnight on a Luria-Bertani agar medium containing kanamycin at a concentration of 25 μg/ml and chloramphenicol at a concentration of 17 μg/ml. A single colony was chosen; overnight, it was cultured in a liquid Luria-Bertani medium containing kanamycin at a concentration of 25 μg/ml and chloramphenicol at a concentration of 17 μg/ml. Then the overnight culture was added to 100 ml of Luria-Bertani medium (Luria-Bertani liquid medium: yeast peptone - 12 g/l, yeast extract powder - 24 g/l, glycerol - 4 ml/l, kinase partner protein 4%, antifoam agent 0.3% kinase partner protein solution: KH ₂ PO ₄ 23.1 g/l, anhydrous K ₂ HPO ₄ 125.4 g/l), containing kanamycin at a concentration of 25 μg/ml and chloramphenicol at a concentration of 17 μg/l ml; incubation was carried out at 37°C until reaching the level of values of 2~4 optical density OD ₆₀₀ . Then a 25% solution of arabinose was added to the medium until a final concentration of 0.25% was reached, and 0.1 M tert-butoxycarbonyl-lysine solution (tert-butoxycarbonyl-lysine, where the structure of tert-butoxycarbonyl is shown in Fig. 4) was added until the final concentration was reached. concentration of 5 nm to induce the expression of the hybrid protein. The culture solution was continuously cultured for 16-20 hours, followed by a centrifugation collection procedure (10,000 rpm, 5 min, 4°C).

Экспрессия гибридного белка A1-u4-u5-TEV-R-MiniINS осуществлялась в форме нерастворимых «внутриклеточных включений». Для высвобождения внутриклеточных включений клетки Е. coli разрушались с использованием гомогенизатора высокого давления. Нуклеиновые кислоты, клеточный детрит и растворимые белки удалялись посредством центрифугирования при 10000g. Внутриклеточные включения, содержащие гибридный белок A1-u4-u5-TEV-R-MiniINS, вымывались чистой водой; образующийся в результате осадок внутриклеточных включений использовался в качестве сырья для складывания. Окончательный уровень экспрессии гибридного белка составлял 14 г/л в пересчете на ферментативный бульон. Схема ДСН-ПААГ-электрофореза гибридного белка показана на Фиг. 5. Из Фиг. 5 можно видеть, что целевой белок, экспрессируемый гибридным белком, может экспрессироваться полностью без разрыва, и гибридный белок, вставляемый в целевой искусственный аминокислотный белок, также может экспрессироваться в целости, без разрыва.The expression of the hybrid protein A1-u4-u5-TEV-R-MiniINS was carried out in the form of insoluble "intracellular inclusions". To release intracellular inclusions, E. coli cells were destroyed using a high pressure homogenizer. Nucleic acids, cell debris and soluble proteins were removed by centrifugation at 10,000g. Intracellular inclusions containing the A1-u4-u5-TEV-R-MiniINS fusion protein were washed out with pure water; the resulting precipitate of intracellular inclusions was used as the raw material for folding. The final level of expression of the hybrid protein was 14 g/l in terms of fermentation broth. A scheme of SDS-PAGE fusion protein electrophoresis is shown in FIG. 5. From FIG. 5, it can be seen that the target protein expressed by the fusion protein can be expressed completely without break, and the fusion protein inserted into the target artificial amino acid protein can also be expressed intact without break.

Для повторного складывания гибридного белка внутриклеточные включения растворяются в 7,5 М раствора мочевины (рН 10,5), содержащего 2-10 мМ меркаптоэтанола; так что общая концентрация белка после растворения составляла 10-25 мг/мл. Образец разбавлялся 5-10 раз; процесс традиционного складывания проводился в течение 16-30 часов при температуре 4-8°С и значении рН от 10,5 до 11,7. При температуре 18-25°С значение рН поддерживалось на уровне 8,0-9,5; для перерабатывания гибридного белка в течение 10-20 часов использовались трипсин и карбоксипептидаза В; затем добавлялся 0,45 М раствор сульфата аммония для прекращения реакции ферментативного гидролиза. Результаты ВЭЖХ анализа в режиме обращения фазы показывают, что выход продукта на указанном этапе ферментативного гидролиза составляет более 90%. Аналог инсулина, получаемый после переработки с участием трипсина и карбоксипептидазы В, носит название «трет-бутоксикарбонильный человеческий инсулин». Процедура ферментативного гидролиза трет-бутоксикарбонильного человеческого инсулина в указанных выше условиях является невозможной. Образец осветлялся в процессе мембранной фильтрации, с использованием 0,45 мМ раствора сульфата аммония в качестве буфера; предварительная очистка трет-бутоксикарбонильного человеческого инсулина осуществлялась с использованием процесса гидрофобной хроматографии. Степень чистоты электрофореза в полиакриламидном геле с использованием натрия додецилсульфата достигает 90%, а окончательный выход трет-бутоксикарбонильного человеческого инсулина на 1 литр ферментативного бульона составляет около 2,1 г; получаемый трет-бутоксикарбонильный человеческий инсулин анализировался с использованием метода масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF); было найдено, что фактическое значение молекулярной массы соответствовало теоретическому значению 5907,7 Да. Сбор образцов осуществлялся с применением метода гидрофобной хроматографии; для обеспечения протекания реакции снятия защиты трет-бутоксикарбонильного человеческого инсулина добавлялась соляная кислота. Для доведения значения рН до уровня 2,8 ~ 3,2 (для прекращения реакции) добавлялся раствор гидроксида натрия. После проведения двух этапов обращенно-фазовой хроматографии высокого давления выход рекомбинантного человеческого инсулина составлял более 85%. Окончательный выход рекомбинантного человеческого инсулина на 1 литр ферментативного бульона составляет около 700 мг.To refold the fusion protein, intracellular inclusions are dissolved in a 7.5 M urea solution (pH 10.5) containing 2-10 mM mercaptoethanol; so that the total protein concentration after dissolution was 10-25 mg/ml. The sample was diluted 5-10 times; the traditional folding process was carried out for 16-30 hours at a temperature of 4-8°C and a pH value of 10.5 to 11.7. At a temperature of 18-25°C, the pH value was maintained at the level of 8.0-9.5; trypsin and carboxypeptidase B were used to process the fusion protein for 10-20 hours; then 0.45 M ammonium sulfate solution was added to terminate the enzymatic hydrolysis reaction. The results of HPLC analysis in reverse phase mode show that the yield of the product at this stage of enzymatic hydrolysis is more than 90%. The insulin analogue obtained after processing with the participation of trypsin and carboxypeptidase B is called "tert-butoxycarbonyl human insulin". The procedure for enzymatic hydrolysis of tert-butoxycarbonyl human insulin under the above conditions is not possible. The sample was clarified by membrane filtration using 0.45 mM ammonium sulfate as a buffer; pre-purification of tert-butoxycarbonyl human insulin was carried out using a hydrophobic chromatography process. The degree of purity of polyacrylamide gel electrophoresis using sodium dodecyl sulfate reaches 90%, and the final yield of tert-butoxycarbonyl human insulin per 1 liter of fermentation broth is about 2.1 g; the resulting tert-butoxycarbonyl human insulin was analyzed using a matrix-assisted laser desorption/ionization (MALDI-TOF) mass spectrometry method; it was found that the actual value of the molecular weight corresponded to the theoretical value of 5907.7 Da. The collection of samples was carried out using the method of hydrophobic chromatography; hydrochloric acid was added to allow the deprotection of tert-butoxycarbonyl human insulin to proceed. Sodium hydroxide solution was added to bring the pH to 2.8 ~ 3.2 (to stop the reaction). After two steps of reverse phase high pressure chromatography, the yield of recombinant human insulin was over 85%. The final yield of recombinant human insulin per liter of fermentation broth is about 700 mg.

Пример 4. Конструирование структуры экспрессии pBAD-A1-u8-TEV-R-MiniINS и экспрессия, разделение и очистка гибридного белка А1-и8-TEV-R- MiniINSExample 4 Construction of the pBAD-A1-u8-TEV-R-MiniINS Expression Structure and Expression, Separation and Purification of the A1-u8-TEV-R-MiniINS Fusion Protein

Используется тот же самый экспериментальный способ, что и в Примере 1-3; осуществляется замена A1-u4-u5 (SEQ ID NO.: 16) в A1-u4-u5-TEV-R-MiniINS последовательностью A1-u8 (SEQ ID NO.: 23). Была сконструирована рекомбинантная плазмида, названная pBAD-A1-u8-TEV-R-MiniINS; экспрессия гибридного белка A1-u8-TEV-R-MiniINS обеспечивалась согласно указанному способу (Фиг. 5). Окончательный выход трет-бутоксикарбонильного человеческого инсулина составляет около 1,9 г/л; получаемый трет-бутоксикарбонильный человеческий инсулин анализировался с использованием метода масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF). Результаты показывают соответствие фактического значения молекулярной массы теоретическому.The same experimental method as in Example 1-3 is used; A1-u4-u5 (SEQ ID NO.: 16) is replaced in A1-u4-u5-TEV-R-MiniINS with the sequence A1-u8 (SEQ ID NO.: 23). A recombinant plasmid was constructed and named pBAD-A1-u8-TEV-R-MiniINS; the expression of the hybrid protein A1-u8-TEV-R-MiniINS was provided according to the specified method (Fig. 5). The final yield of tert-butoxycarbonyl human insulin is about 1.9 g/L; the resulting tert-butoxycarbonyl human insulin was analyzed using a matrix-assisted laser desorption/ionization (MALDI-TOF) mass spectrometry method. The results show that the actual value of the molecular weight corresponds to the theoretical one.

Пример 5. Конструирование структуры экспрессии pBAD-A1-u3-u5-u7-TEV-R-MiniINS и экспрессия, разделение и очистка гибридного белка А1-u3-u5-u7-TEV-R-MiniINSExample 5 Construction of the pBAD-A1-u3-u5-u7-TEV-R-MiniINS Expression Structure and Expression, Separation and Purification of the A1-u3-u5-u7-TEV-R-MiniINS Fusion Protein

Используется тот же самый экспериментальный способ, что и в Примере 1-3; осуществляется замена A1-u4-u5 (SEQ ID NO.: 16) в A1-u4-u5-TEV-R-MiniINS последовательностью A1-u3-u5-u7 (SEQ ID NO.: 15). Была сконструирована рекомбинантная плазмида, названная pBAD-A1-u3-u5-u7-TEV-R-MiniINS; экспрессия гибридного белка A1-u3-u5-u7-TEV-R-MiniINS обеспечивалась согласно указанному способу. Окончательный выход трет-бутоксикарбонильного человеческого инсулина составляет около 2,0 г/л; получаемый трет-бутоксикарбонильный человеческий инсулин анализировался с использованием метода масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF). Результаты показывают соответствие фактического значения молекулярной массы теоретическому.The same experimental method as in Example 1-3 is used; A1-u4-u5 (SEQ ID NO.: 16) is replaced in A1-u4-u5-TEV-R-MiniINS with the sequence A1-u3-u5-u7 (SEQ ID NO.: 15). A recombinant plasmid was constructed and named pBAD-A1-u3-u5-u7-TEV-R-MiniINS; the expression of the hybrid protein A1-u3-u5-u7-TEV-R-MiniINS was provided according to the specified method. The final yield of tert-butoxycarbonyl human insulin is about 2.0 g/l; the resulting tert-butoxycarbonyl human insulin was analyzed using a matrix-assisted laser desorption/ionization (MALDI-TOF) mass spectrometry method. The results show that the actual value of the molecular weight corresponds to the theoretical one.

Пример 6. Конструирование структуры экспрессии pBAD-A1-u5-EK-u6-TEV-R-MiniINS и экспрессия, разделение и очистка гибридного белка A1-u5-EK-u6-TEV-R-MiniINSExample 6 Construction of the pBAD-A1-u5-EK-u6-TEV-R-MiniINS Expression Structure and Expression, Separation and Purification of the A1-u5-EK-u6-TEV-R-MiniINS Fusion Protein

Используется тот же самый экспериментальный способ, что и в Примере 1-3; осуществляется замена A1-u4-u5 (SEQ ID NO.: 16) в A1-u4-u5-TEV-R-MiniINS последовательностью A1-u5-EK-u6 (SEQ ID NO.: 22), где ЕК представляет собой участок рестрикции фермента EK DDDDK (SEQ ID NO.: 25). Была сконструирована рекомбинантная плазмида, названная pBAD-A1-u5-EK-u6-TEV-R-MiniINS; экспрессия гибридного белка A1-u5-EK-u6-TEV-R-MiniINS обеспечивалась согласно указанному способу. Окончательный выход трет-бутоксикарбонильного человеческого инсулина составляет около 1,9 г/л; получаемый трет-бутоксикарбонильный человеческий инсулин анализировался с использованием метода масс-спектрометрии с матрично-активированной лазерной десорбцией/ионизацией (MALDI-TOF). Результаты показывают соответствие фактического значения молекулярной массы теоретическому.The same experimental method as in Example 1-3 is used; A1-u4-u5 (SEQ ID NO.: 16) is replaced in A1-u4-u5-TEV-R-MiniINS with the sequence A1-u5-EK-u6 (SEQ ID NO.: 22), where EK is a restriction site enzyme EK DDDDK (SEQ ID NO.: 25). A recombinant plasmid was constructed and named pBAD-A1-u5-EK-u6-TEV-R-MiniINS; the expression of the hybrid protein A1-u5-EK-u6-TEV-R-MiniINS was provided according to the specified method. The final yield of tert-butoxycarbonyl human insulin is about 1.9 g/L; the resulting tert-butoxycarbonyl human insulin was analyzed using a matrix-assisted laser desorption/ionization (MALDI-TOF) mass spectrometry method. The results show that the actual value of the molecular weight corresponds to the theoretical one.

Все документы, упомянутые в настоящем изобретении, включены в настоящий документ в виде ссылок, как если бы они были включены при помощи ссылок по отдельности. Кроме того, необходимо понимать, что после ознакомления с вышеуказанными идеями настоящего изобретения специалисты в этой области техники могут вносить в изобретение различные изменения и модификации, а также что указанные эквиваленты равным образом подпадают под сферу действия формулы изобретения, прилагаемой к данной заявке.All documents referred to in the present invention are incorporated herein by reference as if they were incorporated by reference individually. In addition, it should be understood that after becoming familiar with the above ideas of the present invention, various changes and modifications can be made to the invention by specialists in this field of technology, and also that these equivalents equally fall within the scope of the claims appended to this application.

--->--->

ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙ SEQUENCE LIST

<110> НИНГБО КУНПЕНГ БИОТЕКХ КО., ЛТД. <110> NINGBO KUNPENG BIOTECH CO., LTD.

<120> ГИБРИДНЫЙ БЕЛОК, СОДЕРЖАЩИЙ ФРАГМЕНТЫ ФЛУОРЕСЦЕНТНЫХ БЕЛКОВ, И ЕГО ПРИМЕНЕНИЕ<120> FUSION PROTEIN CONTAINING FLUORESCENT PROTEIN FRAGMENTS AND ITS APPLICATIONS

<130> P2020-0086<130> P2020-0086

<150> CN201910210102.9<150> CN201910210102.9

<151> 2019-03-19<151> 2019-03-19

<160> 31 <160> 31

<170> PatentIn version 3.5<170>PatentIn version 3.5

<210> 1<210> 1

<211> 13<211> 13

<212> ПРТ<212> PRT

<213> искусственная последовательность<213> artificial sequence

<220><220>

<223> u1<223>u1

<400> 1<400> 1

Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly Val Pro Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly

1 5 10 1 5 10

<210> 2<210> 2

<211> 14<211> 14

<212> ПРТ<212> PRT

<220><220>

<223> u2<223> u2

<400> 2<400> 2

His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr His Lys Phe Ser Val Arg Gly Glu Gly Glu Gly Asp Ala Thr

1 5 10 1 5 10

<210> 3<210> 3

<211> 10<211> 10

<212> ПРТ<212> PRT

<220><220>

<223> u3<223> u3

<400> 3<400> 3

Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr

1 5 10 1 5 10

<210> 4<210> 4

<211> 11<211> 11

<212> ПРТ<212> PRT

<220><220>

<223> u4<223> u4

<400> 4<400> 4

Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp

1 5 10 1 5 10

<210> 5<210> 5

<211> 13<211> 13

<212> ПРТ<212> PRT

<220><220>

<223> u5<223> u5

<400> 5<400> 5

Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu Gly Asp

1 5 10 1 5 10

<210> 6<210> 6

<211> 13<211> 13

<212> ПРТ<212> PRT

<220><220>

<223> u6<223> u6

<400> 6<400> 6

Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe

1 5 10 1 5 10

<210> 7<210> 7

<211> 10<211> 10

<212> ПРТ<212> PRT

<220><220>

<223> u7<223> u7

<400> 7<400> 7

His Asn Val Tyr Ile Thr Ala Asp Lys Gln His Asn Val Tyr Ile Thr Ala Asp Lys Gln

1 5 10 1 5 10

<210> 8<210> 8

<211> 14<211> 14

<212> ПРТ<212> PRT

<220><220>

<223> u8<223> u8

<400> 8<400> 8

Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp

1 5 10 1 5 10

<210> 9<210> 9

<211> 14<211> 14

<212> ПРТ<212> PRT

<220><220>

<223> u9<223> u9

<400> 9<400> 9

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly

1 5 10 1 5 10

<210> 10<210> 10

<211> 12<211> 12

<212> ПРТ<212> PRT

<220><220>

<223> u10<223> u10

<400> 10<400> 10

His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp

1 5 10 1 5 10

<210> 11<210> 11

<211> 13<211> 13

<212> ПРТ<212> PRT

<220><220>

<223> u11<223>u11

<400> 11<400> 11

His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile His Met Val Leu Leu Glu Phe Val Thr Ala Ala Gly Ile

1 5 10 1 5 10

<210> 12<210> 12

<211> 12<211> 12

<212> ПРТ<212> PRT

<220><220>

<223> A1 или A2<223> A1 or A2

<400> 12<400> 12

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val

1 5 10 1 5 10

<210> 13<210> 13

<211> 241<211> 241

<212> ПРТ<212> PRT

<220><220>

<223> GFP<223>GFP

<400> 13<400> 13

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro Ile Leu

1 5 10 15 1 5 10 15

Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly

20 25 30 20 25 30

Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile Glu Gly Glu Gly Asp Ala Thr Asn Gly Lys Leu Thr Leu Lys Phe Ile

35 40 45 35 40 45

Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr

50 55 60 50 55 60

Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys Leu Thr Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His Met Lys

65 70 75 80 65 70 75 80

Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu

85 90 95 85 90 95

Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu

100 105 110 100 105 110

Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly

115 120 125 115 120 125

Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr

130 135 140 130 135 140

Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn Asn Phe Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln Lys Asn

145 150 155 160 145 150 155 160

Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Gly Ser

165 170 175 165 170 175

Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly

180 185 190 180 185 190

Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val Leu Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser Val Leu

195 200 205 195 200 205

Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu Glu Phe

210 215 220 210 215 220

Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Ala Gly Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Tyr Ala Gly

225 230 235 240 225 230 235 240

Ser Ser

<210> 14<210> 14

<211> 28<211> 28

<212> ПРТ<212> PRT

<220><220>

<223> u8-u9 <223> u8-u9

<400> 14<400> 14

Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Val Gln Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Val Glu Asp Val Gln

1 5 10 15 1 5 10 15

Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly

20 25 20 25

<210> 15<210> 15

<211> 45<211> 45

<212> ПРТ<212> PRT

<220><220>

<223> A1-u3-u5-u7<223> A1-u3-u5-u7

<400> 15<400> 15

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Lys Leu Thr Leu Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Lys Leu Thr Leu

1 5 10 15 1 5 10 15

Lys Phe Ile Cys Thr Thr Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Lys Phe Ile Cys Thr Thr Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe

20 25 30 20 25 30

Glu Gly Asp His Asn Val Tyr Ile Thr Ala Asp Lys Gln Glu Gly Asp His Asn Val Tyr Ile Thr Ala Asp Lys Gln

35 40 45 35 40 45

<210> 16<210> 16

<211> 36<211> 36

<212> ПРТ<212> PRT

<220><220>

<223> A1-u4-u5 <223> A1-u4-u5

<400> 16<400> 16

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Tyr Val Gln Glu Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Tyr Val Gln Glu

1 5 10 15 1 5 10 15

Arg Thr Ile Ser Phe Lys Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys Arg Thr Ile Ser Phe Lys Asp Thr Tyr Lys Thr Arg Ala Glu Val Lys

20 25 30 20 25 30

Phe Glu Gly Asp Phe Glu Gly Asp

35 35

<210> 17<210> 17

<211> 26<211> 26

<212> ПРТ<212> PRT

<220><220>

<223> A1-u9 <223> A1-u9

<400> 17<400> 17

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Gln Leu Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Gln Leu Ala

1 5 10 15 1 5 10 15

Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp His Tyr Gln Gln Asn Thr Pro Ile Gly

20 25 20 25

<210> 18<210> 18

<211> 8<211> 8

<212> ПРТ<212> PRT

<220><220>

<223> первый линкерный пептид и/или второй линкерный пептид<223> first linker peptide and/or second linker peptide

<400> 18<400> 18

Glu Asn Leu Tyr Phe Gln Gly Arg Glu Asn Leu Tyr Phe Gln Gly Arg

1 5 15

<210> 19<210> 19

<211> 86<211> 86

<212> ПРТ<212> PRT

<220><220>

<223> проинсулин<223> proinsulin

<400> 19<400> 19

Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Phe Val Asn Gln His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr

1 5 10 15 1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Arg

20 25 30 20 25 30

Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro Glu Ala Glu Asp Leu Gln Val Gly Gln Val Glu Leu Gly Gly Gly Pro

35 40 45 35 40 45

Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys Gly Ala Gly Ser Leu Gln Pro Leu Ala Leu Glu Gly Ser Leu Gln Lys

50 55 60 50 55 60

Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Arg Gly Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln

65 70 75 80 65 70 75 80

Leu Glu Asn Tyr Cys Asn Leu Glu Asn Tyr Cys Asn

85 85

<210> 20<210> 20

<211> 52<211> 52

<212> ПРТ<212> PRT

<220><220>

<223> проинсулин<223> proinsulin

<400> 20<400> 20

1 5 10 15 1 5 10 15

Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Gly Leu Val Cys Gly Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Gly

20 25 30 20 25 30

Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Ile Val Glu Gln Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu

35 40 45 35 40 45

Asn Tyr Cys Asn Asn Tyr Cys Asn

50 50

<210> 21<210> 21

<211> 96<211> 96

<212> ПРТ<212> PRT

<220><220>

<223> гибридный белок<223> fusion protein

<400> 21<400> 21

1 5 10 15 1 5 10 15

20 25 30 20 25 30

Phe Glu Gly Asp Glu Asn Leu Tyr Phe Gln Gly Arg Phe Val Asn Gln Phe Glu Gly Asp Glu Asn Leu Tyr Phe Gln Gly Arg Phe Val Asn Gln

35 40 45 35 40 45

His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly His Leu Cys Gly Ser His Leu Val Glu Ala Leu Tyr Leu Val Cys Gly

50 55 60 50 55 60

Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Gly Ile Val Glu Gln Glu Arg Gly Phe Phe Tyr Thr Pro Lys Thr Arg Gly Ile Val Glu Gln

65 70 75 80 65 70 75 80

Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn Cys Cys Thr Ser Ile Cys Ser Leu Tyr Gln Leu Glu Asn Tyr Cys Asn

85 90 95 85 90 95

<210> 22<210> 22

<211> 43<211> 43

<212> ПРТ<212> PRT

<220><220>

<223> A1-u5-EK-u6<223> A1-u5-EK-u6

<400> 22<400> 22

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Thr Tyr Lys Thr Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Thr Tyr Lys Thr

1 5 10 15 1 5 10 15

Arg Ala Glu Val Lys Phe Glu Gly Asp Asp Asp Asp Asp Lys Thr Leu Arg Ala Glu Val Lys Phe Glu Gly Asp Asp Asp Asp Asp Lys Thr Leu

20 25 30 20 25 30

Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe

35 40 35 40

<210> 23<210> 23

<211> 26<211> 26

<212> ПРТ<212> PRT

<220><220>

<223> A1-u8<223> A1-u8

<400> 23<400> 23

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Gly Ile Lys Ala Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Gly Ile Lys Ala

1 5 10 15 1 5 10 15

Asn Phe Lys Ile Arg His Asn Val Glu Asp Asn Phe Lys Ile Arg His Asn Val Glu Asp

20 25 20 25

<210> 24<210> 24

<211> 36<211> 36

<212> ПРТ<212> PRT

<220><220>

<223> A1-u2-u3 <223> A1-u2-u3

<400> 24<400> 24

Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val His Lys Phe Ser Met Val Ser Lys Gly Glu Glu Leu Phe Thr Gly Val His Lys Phe Ser

1 5 10 15 1 5 10 15

Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Lys Leu Thr Leu Lys Phe Val Arg Gly Glu Gly Glu Gly Asp Ala Thr Lys Leu Thr Leu Lys Phe

20 25 30 20 25 30

Ile Cys Thr Thr Ile Cys Thr Thr

35 35

<210> 25<210> 25

<211> 5<211> 5

<212> ПРТ<212> PRT

<220><220>

<223> участок рестрикции фермента EK<223> EK restriction site

<400> 25<400> 25

Asp Asp Asp Asp Lys Asp Asp Asp Asp Lys

1 5 15

<210> 26<210> 26

<211> 49<211> 49

<212> ПРТ<212> PRT

<220><220>

<223> A1-u1-u2-u3 <223> A1-u1-u2-u3

<400> 26<400> 26

1 5 10 15 1 5 10 15

20 25 30 20 25 30

Glu Gly Glu Gly Asp Ala Thr Lys Leu Thr Leu Lys Phe Ile Cys Thr Glu Gly Glu Gly Asp Ala Thr Lys Leu Thr Leu Lys Phe Ile Cys Thr

35 40 45 35 40 45

Thr Thr

<210> 27<210> 27

<211> 60<211> 60

<212> ПРТ<212> PRT

<220><220>

<223> A1-u1-u2-u3-u4 <223> A1-u1-u2-u3-u4

<400> 27<400> 27

1 5 10 15 1 5 10 15

20 25 30 20 25 30

35 40 45 35 40 45

Thr Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp Thr Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Asp

50 55 60 50 55 60

<210> 28<210> 28

<211> 46<211> 46

<212> ПРТ<212> PRT

<220><220>

<223> A1-u3-u4-u6<223> A1-u3-u4-u6

<400> 28<400> 28

1 5 10 15 1 5 10 15

Lys Phe Ile Cys Thr Thr Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys Lys Phe Ile Cys Thr Thr Tyr Val Gln Glu Arg Thr Ile Ser Phe Lys

20 25 30 20 25 30

Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe

35 40 45 35 40 45

<210> 29<210> 29

<211> 45<211> 45

<212> ПРТ<212> PRT

<220><220>

<223> A1-u4-u7-u10 <223> A1-u4-u7-u10

<400> 29<400> 29

1 5 10 15 1 5 10 15

Arg Thr Ile Ser Phe Lys Asp His Asn Val Tyr Ile Thr Ala Asp Lys Arg Thr Ile Ser Phe Lys Asp His Asn Val Tyr Ile Thr Ala Asp Lys

20 25 30 20 25 30

Gln His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp Gln His Tyr Leu Ser Thr Gln Ser Val Leu Ser Lys Asp

35 40 45 35 40 45

<210> 30<210> 30

<211> 55<211> 55

<212> ПРТ<212> PRT

<220><220>

<223> A1-u3-u4-u7-u10<223> A1-u3-u4-u7-u10

<400> 30<400> 30

1 5 10 15 1 5 10 15

20 25 30 20 25 30

Asp His Asn Val Tyr Ile Thr Ala Asp Lys Gln His Tyr Leu Ser Thr Asp His Asn Val Tyr Ile Thr Ala Asp Lys Gln His Tyr Leu Ser Thr

35 40 45 35 40 45

Gln Ser Val Leu Ser Lys Asp Gln Ser Val Leu Ser Lys Asp

50 55 50 55

<210> 31<210> 31

<211> 20<211> 20

<212> ДНК<212> DNA

<220><220>

<223> Олигонуклеозиды<223> Oligonucleosides

<400> 31<400> 31

atgccatagc atttttatcc 20atgccatagc atttttatcc 20

<---<---

Claims

1. Fusion protein for expression and production of the target polypeptide containing the structure shown in Formula I:

(P1-L1)s-A1-(X)n-A2-(L2-P2)t (I)

Where

"-" denotes a peptide bond or linker peptide,

each P1 is independently the first target peptide;

each P2 is independently the second target peptide;

each L1 is independently the missing or first linker peptide;

each L2 is independently the missing or second linker peptide;

A1 is a missing or signal peptide;

A2 is a missing or signal peptide;

each X is independently a single β-pleated block of a fluorescent protein;

n is a positive integer from 1 to 8;

s can take the values 0, 1 or 2;

t can take the values 0, 1 or 2; And

an additional condition is the inequality of s and t to zero simultaneously;

and (X)n is u8, u9, u2-u3, u4-u5, u8-u9, u1-u2-u3, u2-u3-u4, u3-u4-u5, u5-u6-u7, u8-u9- u10, u9-u10-u11, u3-u5-u7, u3-u4-u6, u4-u7-u10, u6-u8-u10, u1-u2-u3-u4, u2-u3-u4-u5, u3- u4-u3-u4, u3-u5-u7-u9, u5-u6-u7-u8, u1-u3-u7-u9, u2-u2-u7-u8, u7-u2-u5-u11, u3-u4- u7-u10, u1-I-u2, u1-I-u5, u2-I-u4, u3-I-u8, u5-I-u6 or u10-I-u11;

I - flexible linker containing a restriction site;

where the amino acid sequences u1-u11 are shown below:

u1 VPILVELDGDVNG (SEQ ID NO.: 1) u2 HKFSVRGEGEGDAT (SEQ ID NO.: 2) u3 KLTLKFICTTT (SEQ ID NO.: 3) u4 YVQERTISFKD (SEQ ID NO.: 4) u5 TYKTRAEVKFEGD (SEQ ID NO.: 5) u6 TLVNRIELKGIDF (SEQ ID NO.: 6) u7 HNVYITADKQ (SEQ ID NO.: 7) u8 GIKANFKIRHNVED (SEQ ID NO.: 8) u9 VQLADHYQQNTPIG (SEQ ID NO.: 9) u10 HYLSTQSVLSKD (SEQ ID NO.: 10) u11 HMVLLEFVTAAGI (SEQ ID NO.: 11);

P1 and P2 are each independently selected from: human insulin precursor protein, insulin lispro precursor protein, insulin glargine precursor protein, glucagon-like peptide and its derivatives exenatide and liraglutide, insulin, calcitonin, teduglutide.

2. The fusion protein of claim 1, wherein the first target peptide and/or the second target peptide is a protein with an artificial amino acid.

3. The fusion protein of claim 1, wherein A1-(X)n has the amino acid sequence shown in SEQ ID NO.: 14, 15, 16, 17, 22, 23, 24, 26, 27, 28, 29, or 30 .

4. The fusion protein of claim 1, wherein a flexible linker I is present between any two β-fold blocks and the flexible linker I contains a restriction site.

5. An isolated polynucleotide encoding a fusion protein according to claim 1.

6. A vector for expressing a fusion protein according to claim 1, which includes a polynucleotide according to claim 5.

7. Host cell for expression of the fusion protein according to claim 1, containing the vector according to claim 6.

8. A host cell for expressing the fusion protein of claim 1, wherein the exogenous polynucleotide of claim 5 is integrated into the chromosome of the host cell.

9. A method for producing a fusion protein according to claim 1, comprising the following steps:

(a) under conditions suitable for obtaining a fusion protein according to claim 1, a host cell according to any one of claims 7 to 8 is cultured, thereby obtaining a fusion protein according to claim 1.

10. Use of a host cell according to any one of claims 7-8 for expression and production of the target polypeptide according to claim 1.