CN1329667A

CN1329667A - 在制备多肽的方法中有效的真菌转录激活因子

Info

Publication number: CN1329667A
Application number: CN99814016A
Authority: CN
Inventors: 卡斯滕·约尔特; 西斯·A·M·J·J·范德亨德尔; 彼得·J·庞特; 弗兰克·H·J·舒伦
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 1998-10-05
Filing date: 1999-10-05
Publication date: 2002-01-02
Anticipated expiration: 2019-10-05
Also published as: ATE349528T1; EP1783223A1; DE69934596D1; CN1329667B; AU5850999A; JP4563585B2; DE69934596T2; EP1117798B1; WO2000020596A1; DK1117798T3; JP2002526112A; EP1117798A1

Abstract

本发明涉及分离的核酸序列,其编码具有转录激活活性的多肽,同时本发明涉及所述的多肽。本发明还涉及包括所述核酸序列的核酸构建体、载体以及宿主细胞。本发明进一步涉及有效用于制备所述多肽的宿主细胞,在所述的宿主细胞中转录激活因子的产生或功能被改变,本发明还涉及用于制备所述多肽的方法。

Description

在制备多肽的方法中有效的真菌转录激活因子

发明背景

发明领域

本发明涉及分离的核酸序列，其编码具有转录激活活性的多肽，本发明还涉及所述的多肽。本发明还涉及包括所述核酸序列的核酸构建体、载体以及宿主细胞。本发明进一步涉及有效用于制备所述多肽的宿主细胞，在所述的宿主细胞中转录激活因子的产生或功能被改变，本发明还涉及用于制备所述多肽的方法。

相关技术描述

近年来，重组宿主细胞在异源蛋白表达中的应用大大简化了商品化蛋白的大量制备，否则只有通过从其天然来源中纯化才能获得所述的蛋白。目前，可以选择不同的表达系统，包括细菌和真核宿主，从所述的系统中选择用于制备任何特定蛋白。对适当表达系统的选择通常不仅有赖于宿主细胞在活跃状态产生足够产量蛋白的能力，而且在很大程度上也可能由所述蛋白预期的最终用途决定。

经常遇到的一个问题是由特定宿主细胞产生的或存在于培养基中的高水平的蛋白水解酶。一个建议是提供失去了产生特异性蛋白水解化合物能力的宿主生物体。例如，WO90/00192(Genencor，Inc.)描述了不能分泌有酶活性的天冬氨酸蛋白酶的丝状真菌宿主。EP574347(Ciba Geigy AG)描述了枯草杆菌蛋白酶型的丝氨酸蛋白酶缺陷的曲霉宿主。WO98/12300(NovoNordisk A/S)描述了金属蛋白酶以及碱性蛋白酶缺陷的宿主。WO97/12045(Genencor，Inc.)描述了由于参与蛋白酶基因调节的启动子序列的破坏而导致造成蛋白酶缺陷的酵母和细菌宿主系统。

Mattern，I.E.等，(1992.分子和普通遗传学(Mol Gen Genet)234：332-336)描述了黑曲霉的一个突变株，其被表明仅仅具有亲代菌株1％到2％的细胞外蛋白酶活性，这显然是由于至少两种蛋白酶曲霉胃蛋白酶A(aspergillopepsinA)和曲霉胃蛋白酶B(aspergillopepsin B)的缺陷。提示蛋白酶缺陷表型可能由影响编码两种蛋白酶基因表达的调控性突变造成。

真核转录在一个特定启动子或一组启动子处的启始需要一种真核转录激活因子，其为一种多肽，但其本身不是RNA聚合酶的一部分。许多转录激活因子结合至启动子上的特定位点形成启始该多肽编码序列的转录所需的一种功能性启动子。然而，只有在其他多肽存在下，转录激活因子也可以被并入一种转录启始复合物。对真菌中具有转录激活活性的多肽已经进行了描述，而且已公开了此类多肽的名单(Dhawale，S.S.，和Lane，A.C.1993.核酸研究(Nucleic Acid Research)21：5537-5546)。

本发明建议的解决方法：

本发明的一个目的是提供改进的方法用于在宿主细胞中增加多肽的产生，在所述的宿主细胞中参与调节蛋白酶产生的转录激活因子的活性被改变。

发明简述

本发明的一个方面涉及一种分离的编码转录激活因子的核酸序列，其选自：

(a)与SEQ ID NO：1的核酸序列有至少70％同一性的核酸序列；

(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2的氨基酸序列有至少50％的同一性。

(c)在低严谨度条件下与(i)SEQ ID NO：1的核酸序列，或者(ii)其互补链杂交的核酸序列，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200mg/ml剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；

(d)(a)、(b)或(c)的等位基因变体；

(e)(a)、(b)、(c)或(d)的子序列，其中该子序列编码一种具有转录激活活性的多肽片段；以及

(f)(a)、(b)、(c)或(d)的子序列，其中该子序列编码一种具有SEQID NO：3的氨基酸序列的多肽。

在另一方面，本发明还涉及包括所述核酸序列的核酸构建体、载体和宿主细胞，以及由所述核酸序列编码的多肽。本发明进一步涉及可用于制备多肽的宿主细胞，在所述的宿主细胞中转录激活因子的产生或功能被改变，本发明还涉及用于制备所述多肽的方法。

附图简述

图1显示质粒pPAP的限制性图谱，其构建过程在实施例1中描述。

图2显示质粒pAopyrGcosArpl的限制性图谱，其构建过程在实施例1中描述。

图3显示质粒pEESl的限制性图谱，其构建过程在实施例1中描述。

图4显示质粒pDprt的限制性图谱，其构建过程在实施例3中描述。

图5显示质粒pGPprt的限制性图谱，其构建过程在实施例4中描述。

发明详述

编码转录激活因子的核酸序列

本发明一方面涉及一种分离的编码转录激活因子的核酸序列，其选自：

(a)与SEQ ID NO：1的核酸序列有至少70％同一性的核酸序列；

(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列具有与SEQ IDNO：2的氨基酸序列有至少50％同一性。

(d)(a)、(b)或(c)的等位基因变体；

(f)(a)、(b)、(c)或(d)的子序列，其中该子序列编码一种具有SEQ ID NO：3的氨基酸序列的多肽。

本文中所用的术语“转录激活因子”指能激活一个特定启动子或一组启动子的多肽，所述的启动子是其连接的多肽编码序列转录启始所必需的。

本文中所用的术语“分离的核酸序列”指一种基本上没有其他核酸序列的核酸序列，例如通过琼脂糖电泳测定纯度为至少大约20％，优选至少大约40％，更优选至少大约60％，甚至更优选至少大约80％，最优选至少大约90％。例如，分离的核酸序列可以通过在遗传工程中用来将核酸序列从其天然位置重新定位至其将被复制的另一位点处的标准克隆过程来获得。所述的克隆过程可以包括切割和分离含编码该多肽的核酸序列的目的核酸片段，将该片段插入到一种载体分子中，并将该重组载体引入到一种宿主细胞中，在所述的宿主细胞中该核酸序列的多个拷贝或克隆将被复制。所述的核酸序列可以是基因组序列、cDNA、RNA、半合成、合成来源的或者其任何组合。

在一优选的实施方案中，所述核酸序列与在SEQ ID NO：1中所列的核酸序列具有至少大约70％，优选至少大约80％，更优选至少大约85％，甚至更优选至少大约90％，最优选至少大约95％，甚至最优选至少大约97％的同一性，其编码一种有活性的多肽。为了本发明的目的，通过Clustal方法(Higgins，1989，CABIOS 5：151-153)以一个同一性表，裂隙罚分为10以及裂隙长度罚分为10对两种核酸序列之间同一性的程度进行测定。

在一更优选的实施方案中，编码转录激活因子的核酸序列具有在SEQ IDNO：1中所列的核酸序列。

对编码本发明多肽的核酸序列的修饰可能是合成与该多肽基本上相似的多肽所需的。术语与该多肽“基本上相似”指该多肽的非天然存在的形式。这些多肽可能在一些设计方面上与从其天然来源分离的多肽不同。例如，需要用定点诱变等来合成该多肽的变体，其中变体在比活性、结合特异性和/或亲和力等方面不同。根据作为SEQ ID NO：1的多肽编码部分给出的核酸序列，例如其一个子序列，和/或通过引入核苷酸置换可以构建相似的序列，其中所述的核苷酸置换不产生由该核酸序列所编码的多肽的另一种氨基酸序列，但其与待用于制备该酶的宿主生物体的密码子应用相应，或者所述的核苷酸置换产生不同的氨基酸序列。对于核苷酸置换的一般描述见，例如Ford等，1991，蛋白质表达和纯化(Protein Expression and Purification)2：95-107。

在另一优选的实施方案中，本发明涉及分离的编码多肽的核酸序列，所述多肽的氨基酸序列与在SEQ ID NO：2中所列的氨基酸序列具有至少大约50％，优选至少大约60％，优选至少约70％，更优选至少大约80％，甚至更优选至少大约90％，最优选至少大约95％，甚至最优选至少大约97％的同一性程度，其在性质上保留有所述多肽的转录激活活性(此后为“同源性多肽”)。

在一优选的实施方案中，同源性多肽具有与SEQ ID NO：2中所列氨基酸序列有5个氨基酸，优选4个氨基酸，更优选3个氨基酸，甚至更优选2个氨基酸，最优选1个氨基酸不同的氨基酸序列。为了本发明的目的，通过Clustal方法(Higgins，1989，同上)以一个同一性表，裂隙罚分为10以及裂隙长度罚分为10对两种氨基酸序列之间的同一性程度进行测定。

杂交表明通过标准的SOUTHERN印迹方法，在低到高严谨度条件下(即，于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA以及相对于低、中等和高严谨度分别为25、35或50％的甲酰胺中预杂交和杂交)，该核酸序列与对应于SEQ ID NO：1中所示核酸序列的多肽编码部分的寡核苷酸探针杂交。为鉴定同源于SEQ ID NO：1的克隆或DNA，将杂交反应液用2X SSC，0.2％SDS洗三次，每次30分钟，温度优选为至少50℃，更优选至少55℃，更优选至少60℃，更优选至少65℃，甚至更优选至少70℃，最优选至少75℃。

SEQ ID NO：1的核酸序列或者其子序列，以及SEQ ID NO：2的氨基酸序列或者其部分序列，或者SEQ ID NO：3的氨基酸序列可被用来设计寡核苷酸探针，以根据本领域众所周知的方法鉴定并分离或者克隆任何属或种的同源基因。

具体为，为了鉴定并分离目的属或种中相应的基因，按照标准的SOUTHERN印迹方法，可将上述探针用来与目的属或种的基因组或cDNA杂交。上述探针可以大大短于完整序列，但长度应该为至少15个，优选至少25个，而且更优选至少40个核苷酸。更长的探针也可以使用。DNA和RNA探针都可以使用。为了检测相应的基因，通常对探针进行标记(例如，用³²P、³H、³⁵S、生物素或亲和素)。例如，与³²P-、³H-或³⁵S-标记的寡核苷酸探针杂交的分子可以通过利用X线胶片检测到。

因此，可以对由上述其他生物体制备的基因组、cDNA或组合化学文库筛选与上述探针杂交并编码具有转录激活活性的多肽的DNA。通过琼脂糖或聚丙烯酰胺凝胶电泳或者其他分离技术可以对来自上述其他生物体的基因组或其他DNA进行分离。来自文库的DNA或者分离的DNA可以被转移并固定于硝酸纤维素或其他适当的载体材料上。然后按照标准的SOUTHERN印迹方法可以对与SEQ ID NO：1同源的克隆或DNA进行鉴定。

一个等位基因变体指占据相同染色体位点的一个基因的两个或多个可选形式中任何一个。等位基因变异通过突变自然发生，并且可以导致群体内表型的多态性。基因突变可以是沉默突变(即，在所编码的多肽中没有改变)或者可以编码氨基酸序列发生改变的多肽。

术语“多肽的等位基因变体”是由基因的一个等位基因变体所编码的多肽。在一优选的实施方案中，编码本发明的转录激活因子的核酸序列为选自下述核酸序列中的一种核酸序列变体：(a)与SEQ ID NO：1的核酸序列有至少70％同一性的核酸序列，(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2的氨基酸序列有至少50％同一性，(c)在低严谨度条件下与SEQ ID NO：1的核酸序列，或者其互补链杂交的核酸序列，以及(d)编码一种具有SEQ ID NO：3氨基酸序列的多肽的核酸序列。

本发明还包括由于遗传密码的简并性而与SEQ ID NO：1不同的核酸序列。本发明还涉及SEQ ID NO：1的子序列，其中SEQ ID NO：1的一个子序列为除了从5’和/或3’末端的一个或多个核苷酸被删除外，由SEQ ID NO：1所包含的核酸序列。优选SEQ ID NO：1的一个子序列编码一种具有转录激活活性的多肽。在一个更优选的实施方案中，SEQ ID NO：1的一个子序列含有至少一种编码在SEQ ID NO：3中所示多肽序列的核酸序列。

用于对编码一种多肽的核酸序列进行分离或克隆的技术在本领域中是已知的，而且包括从基因组DNA分离、从cDNA制备或者将它们联合。例如通过利用基于聚合酶链式反应(PCR)或者对表达文库进行抗体筛选以检测具有共同结构特征的克隆化DNA片段的方法，从上述基因组DNA中对本发明核酸序列进行克隆是可以实现的(见，例如Innis等，1990，PCR：方法和应用指导(PCR：A Guideto Methods and Application)，Academic Press，纽约)。其他核酸扩增方法也可以利用，例如连接酶链式反应(LCR)、连接激活转录(ligated activated transcription)(LAT)和基于核酸序列的扩增(NASBA)。所述的核酸序列可以克隆自一种微生物或者另一种或相关生物体，因此，例如其可能为所述核酸序列多肽编码区的等位基因变体或物种变体。

由与寡核苷酸探针杂交的核酸序列编码的转录激活因子可以获自任何属的微生物，所述的寡核苷酸探针与SEQ ID NO：1的核酸序列、其互补链，或SEQ ID NO：1的等位基因变体和子序列，或者转录激活因子的等位基因变体和片段杂交。

在一优选的实施方案中，转录激活因子可以获自真菌细胞。本文中所用的“真菌”包括子囊菌(Ascomycota)门、担子菌(Basidiomycota)门、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(由Hawksworth等定义，在Ainsworth和Bisby真菌词典，第8版，1995，CAB International，UniversityPress，Cambridge，UK中)以及卵菌门(Oomycota)(在Hawksworth等，1995，同上，171页中列举)和所有有丝分裂孢子真菌(Hawksworth等，1995，同上)。

在优选的实施方案中，真菌来源为一种丝状真菌菌株。“丝状真菌”包括真菌(Eumycota)和卵菌亚门的所有丝状形式(由Hawksworth等，1995，同上，所定义)。丝状真菌以由几丁质、纤维素、葡聚糖、几丁聚糖、甘露聚糖和其他复杂多糖组成的菌丝体壁为特征。生长是通过菌丝延长进行的，碳分解代谢是专性需氧的。丝状真菌菌株包括，但不限于，枝顶孢属、曲霉属、桃木属、隐球菌属、Filibasidium、镰刀菌属、腐质霉属、Magnaporthe、毛霉属、毁丝霉属、Neocallimastix、链孢菌属、拟青霉属、青霉属、Piromyces、裂褶菌属、踝节菌属、热子囊菌属、草根霉属、Tolypocladium和木霉属的菌株。

在一个更优选的实施方案中，编码本发明一种转录激活因子的核酸序列获自曲霉属菌株，例如泡盛曲霉或构巢曲霉。优选所述的核酸序列获自黑曲霉或米曲霉菌株。甚至更优选所述的核酸序列获自黑曲霉菌株DSM 12298的分离株；例如，在SEQ ID NO：1中所列的核酸序列。

在另一更优选的实施方案中，编码本发明的一种转录激活因子的核酸序列获自镰刀菌属菌株，例如尖孢镰刀菌。优选所述的菌株为Fusariumvenenatum的菌株(Nirenberg sp.nov.)。

在另一优选的实施方案中，编码本发明一种转录激活因子的核酸序列获自一种酵母菌株，例如念珠菌属、克鲁维酵母属、裂殖酵母属(Schizosaccharomyces)或Yarrowia的菌株。优选所述的菌株为汉森酵母属、毕赤酵母属或酵母属的菌株。

不言而喻，对于前面提到的物种，不论它们已知的物种名称为何，本发明包括其完整和不完整的名称以及其他分类学等同物，例如无性型。本领域的技术人员很容易识别相应等同物的本体。例如，所述的多肽可以获自为Raper，K.D.和Fennel，D.I.(1965.曲霉属(The Genus Aspergillus)，The WilkinsCompany，Baltimore MD)所定义的曲霉属分类学等同物，而不论其已知的物种名称为何。曲霉菌为产有丝分裂孢子的真菌，其特征为：由分生孢子柄组成喷洒器状，泡囊末端不带有已知的有性形式，泡囊本身带有一或两层同步形成的分别称为小梗或瓶梗的特化细胞，以及被称为分生孢子的无性孢子。曲霉属已知的有性型包括Eurotium、新缝匠菌和裸孢壳属。曲霉属的菌株及其有性型由多个培养物保藏中心向公众开放，例如美国典型培养物保藏中心(ATCC)、德意志微生物保藏中心(DSM)、真菌菌种保藏中心(CBS)以及农业研究机构专利培养物保藏中心(Agricultural Research Service Patent CultureCollection)、北方区域研究中心(Northem Regional Research Center，NRRL)。

此外，利用上述的探针可以从其他来源中对此类转录激活因子进行鉴定和分离，所述的来源包括自然界(例如，土壤、堆肥、水等)分离的微生物。用于从天然生长环境中分离微生物的技术是本领域所众所周知的。然后类似地通过筛选另一种微生物的基因组文库或cDNA文库可以得到核酸序列。一旦用探针检测到编码转录激活因子的核酸序列，那么用本领域技术人员已知的技术可以对该序列进行分离或克隆(见，例如，J.Sambrook，E.F.Fritsch，和T.Maniatus，1989，分子克隆，实验指南，第二版，冷泉港，纽约)。

在另一优选的实施方案中，分离的核酸序列编码一种包含SEQ ID NO：2的氨基酸序列或其一个片段的多肽，所述的多肽具有转录激活活性。

在另一优选的实施方案中，分离的核酸序列编码一种包括SEQ ID NO：3的氨基酸序列的多肽。

本发明还涉及分离的编码本发明转录激活因子的核酸序列，例如利用上述标准的SOUTHERN印迹方法(参看，Sambrook等，1989，同上)，所述的核酸序列在低严谨度条件下，更优选中等严谨度条件下，而最优选高严谨度条件下与一种寡核苷酸探针杂交，所述的寡核苷酸探针在相同的条件下与在SEQ ID NO：1的核酸序列或其互补链，或者SEQ ID NO：1的编码真菌转录激活因子的等位基因变体和子序列杂交。

在另一更优选的实施方案中，所述的核酸序列编码一种包含在质粒pEES中具有DNA结合活性的多肽，所述的质粒包含于大肠杆菌DSM 12294中。

核酸构建体

本发明的另一个方面涉及包含编码本发明转录激活因子的核酸序列的核酸构建体，所述的核酸序列可操作地连接于一个或多个在适当的表达宿主中控制该转录激活因子产生的调控序列。在一优选的实施方案中，所述的核酸序列编码一种多肽，其包含在质粒pEES中，所述的质粒pEES包容于大肠杆菌DSM 12294内。

不言而喻，表达包括多肽产生所涉及的任何步骤，其包括，但不限于，转录、转录后修饰、翻译、翻译后修饰以及分泌。根据表达载体的不同对编码多肽的核酸序列在其插入到该载体之前进行操作可以是优选的或必须的。利用克隆方法修饰核酸序列的技术在本领域中是众所周知的。

本文中将“核酸构建体”定义为一种单链或双链核酸分子，其分离自天然存在的基因或者其被修饰后含有以自然界不存在的方式联合和并置的核酸片段。当核酸构建体包含编码序列的表达所需的所有调控序列时，术语核酸构建体与术语表达盒意思相同。本文中所定义的术语“编码序列”可被转录成mRNA并被翻译成本发明的转录激活因子。编码序列的界限通常由在mRNA5’末端的ATG启始密码子和mRNA 3’末端紧邻开放阅读框下游的转录终止序列来确定。编码序列可以包括，但不限于，DNA、eDNA和重组核酸序列。

本文中将术语“调控序列”定义为包括多肽表达所必需的或有利的所有元件。每个调控序列对于编码所述多肽的核酸序列可以是固有的或者外源的。此类调控序列包括，但不限于，引导序列、多聚腺苷酸化序列、前肽序列、启动子、信号序列以及转录终止子。调控序列至少包括一个启动子以及转录和翻译终止信号。为了引入特异性限制性位点，以将调控序列与编码多肽的核酸序列的编码区连接，可以为调控序列提供连接子。本文中将术语“可操作地连接”定义为一种布局，其中将调控序列放置在相对于DNA序列中编码序列的适当位置上以便该调控序列指导多肽的产生。

调控序列可以为适当的启动子序列，一种为了核酸序列的表达而被宿主细胞识别的核酸序列。启动子序列包括转录调控序列，其介导所述多肽的表达。启动子可以为在所述细胞中表现出转录活性的任何核酸序列，包括突变的、截断的和杂合的启动子，而且可以获自编码与所述细胞同源或异源的细胞外或细胞内多肽的任何基因。

调控序列还可以为适宜的转录终止子序列，一种被丝状真菌细胞识别来终止转录的序列。将终止子序列可操作地连接于编码所述多肽的核酸序列的3’末端。任何在所述细胞中有功能的终止子在本发明中均可以使用。

对于丝状真菌细胞优选的终止子获自编码米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶、黑曲霉α-葡糖苷酶以及尖孢镰刀菌胰蛋白酶样蛋白酶的基因。

调控序列还可以为适宜的引导序列，即mRNA的一个非翻译区，其对于由丝状真菌细胞进行的翻译至关重要。将引导序列可操作地连接于编码所述多肽的核酸序列的5’末端。任何在所述细胞中有功能的引导序列在本发明中均可以使用。

对于丝状真菌细胞优选的引导序列获自编码米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶的基因。

调控序列还可以为多聚腺苷酸化序列，其被可操作地连接于所述核酸序列3’末端的序列而且在转录时其被丝状真菌细胞识别为一个信号来向转录的mRNA添加多聚腺苷酸。任何在所述细胞中有功能的多聚腺苷酸化序列在本发明中均可以使用。

对于丝状真菌细胞优选的多聚腺苷酸化序列获自编码米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合成酶以及黑曲霉α-葡糖苷酶的基因。

调控序列还可以为信号肽编码区，其编码连接于多肽氨基末端的氨基酸序列，其能够引导所编码的多肽进入细胞分泌途径。所述核酸序列中编码序列的5’末端可以固有地含有一个信号肽编码区，其与编码分泌型多肽的编码区片段天然相连于翻译阅读框内。或者，编码序列的5’末端可以含有一个信号肽编码区，其对于该编码序列是外源的。编码序列通常不含有信号肽编码区时可能需要外源的信号肽编码区。或者，为了提高所述多肽的分泌，可以简单地用外源的信号肽编码区置换固有的信号肽编码区。信号肽编码区可以获自曲霉种的葡糖淀粉酶或淀粉酶基因，或者根毛霉(Rhizomucor)种的脂肪酶或蛋白酶基因。然而，引导所表达的多肽进入丝状真菌细胞分泌途径的任何信号肽编码区在本发明中均可使用。

对于丝状真菌细胞有效的信号肽编码区为获自米曲霉TAKA淀粉酶基因、黑曲霉中性淀粉酶基因、米赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶基因或者Humicola lanuginosa纤维素酶基因的信号肽编码区。

调控序列还可以为前肽编码区，其编码位于多肽氨基末端的一段氨基酸序列。所得的多肽被称为原酶或前多肽(或者在某些情况下为酶原)。前多肽通常无活性，而且通过从前多肽中对前肽的催化性或自身催化性切割，可以将其转化为成熟的有活性的多肽。前肽编码区可以获自米赫根毛霉的天冬氨酸蛋白酶基因或者嗜热毁丝霉的漆酶基因(WO 95/33836)。

信号肽和前肽区均存在于多肽的氨基末端，前肽区紧邻多肽的氨基末端而信号肽区紧邻前肽区的氨基末端。

表达载体

本发明还涉及重组表达载体，其包括本发明的核酸序列、启动子以及转录和翻译终止信号。可以将上述的各种核酸和调控序列连接起来，形成重组表达载体，其可能包括一个或多个方便的限制性位点以使编码所述多肽的核酸序列可以在这些位点处插入或置换。或者，编码所述多肽的核酸序列可以通过将该序列或包括该序列的核酸构建体插入到用于表达的适当载体中进行表达。在制备表达载体的过程中，编码序列位于载体中，以便将该编码序列可操作地与用于表达并且可能用于分泌的适当调控序列相连。

重组表达载体可以为任何载体(例如，质粒或病毒)，其可以很方便地进行重组DNA操作，而且可以使编码所述多肽的核酸序列表达。所述载体的选择通常取决于载体与待引入所述载体的丝状真菌细胞的相容性。所述的载体可以为线性或闭合环状质粒。所述的载体可以为一种自我复制载体，即以一种染色体外单元形式存在的载体，其复制不依赖于染色体的复制，例如，质粒、染色体外元件、极微染色体或人工染色体。所述的载体可以包括用于保证自我复制的任何方式。或者所述的载体可以为下述载体，在将其引入到丝状真菌细胞中时整合到基因组中并与将其整合进来的染色体一起复制。载体系统可以为一个单个载体或质粒，或者两个或多个载体或质粒，所述的载体或质粒含有待引入到丝状真菌细胞基因组中的完整DNA或者一个转座子。

载体优选含有一个或多个可筛选标志物，其使得可以很容易地对转化的细胞进行筛选。可筛选标志物为一种基因，其产物提供生物杀灭剂或病毒抗性、对重金属的抗性、原养型变成营养缺陷型等等。用于在丝状真菌细胞中使用的可筛选标志可以选自，但不限于，amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰转移酶)、bar(膦丝菌素乙酰转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合成酶)，以及来自其他物种的等同物。优选用于在曲霉细胞中使用的为构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyceshygroscopicus)的bar基因。

载体优选含有使所述载体可以稳定整合到宿主细胞基因组中或者可以在细胞中不依赖于细胞的基因组而自我复制的元件。

宿主细胞

本发明的另一个方面涉及包括本发明的一个核酸构建体或一种表达载体的宿主细胞。

在本发明的方法中对宿主细胞的选择范围很大，这取决于编码目的多肽的核酸序列的来源。

表达载体或核酸构建体向丝状真菌细胞中的引入可以包括下述过程：原生质体的形成、原生质体的转化以及细胞壁以本质上已知的一种方式再生。用于转化曲霉细胞的适当的方法描述于EP238023和Yelton等，1984，美国科学院院刊(Proceedings of the National Academy of Sciences USA)81：1470-1474中。转化镰刀菌属的适当的方法描述于Malardier等，1989，基因(Gene)78：147-156或在WO 96/00787中。

“引入”意指将包括编码所述多肽的核酸序列的载体引入到丝状真菌细胞中，以便将载体保持为染色体的一个组成部分或一种自我复制的染色体外载体。整合通常被认为是一种优点，因为核酸序列将更有可能稳定地保持在细胞中。通过同源重组、非同源重组或转位使载体发生向染色体中的整合。

为了向宿主细胞基因组中整合，所述的载体可以依赖编码所述多肽的核酸序列或所述的载体中用于通过同源或非同源重组将该载体向基因组中稳定整合的任何其他元件。或者，所述的载体可以含有额外的指导通过同源重组整合到宿主细胞基因组中的核酸序列。额外的核酸序列使该载体能整合到宿主细胞基因组中染色体的精确位置上。为了提高在精确位置上整合的可能性，整合元件优选应该含有足够数量的核酸，例如100到1,500个碱基对，优选400到1,500个碱基对，而最优选800到1,500个碱基对，其与相应的靶序列高度同源以提高同源重组的可能性。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。这些核酸序列可以是任何与宿主细胞基因组中的靶序列同源的序列，并且可以是非编码或编码序列。

为了自我复制，载体可以进一步包括一个使载体能够在宿主细胞中自我复制的复制起点。

用于连接上述的元件以构建重组表达载体的方法是本领域技术人员众所周知的(见，例如Sambrook，等，同上)。

在一优选的实施方案中，所述的丝状真菌宿主细胞为，但不限于，枝顶孢属、曲霉属、镰刀菌属、腐质霉属、毛霉属、毁丝霉属、链孢霉属、青霉属、草根霉属、Tolypocladium或木霉属的一种细胞。

在一更优选的实施方案中，所述的丝状真菌细胞为曲霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为枝顶孢属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为镰刀菌属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为腐质霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为毛霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为毁丝霉属属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为链孢霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为青霉属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为草根霉属属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为Tolypocladium属的细胞。在另一更优选的实施方案中，所述的丝状真菌细胞为木霉属的细胞。

在一最优选的实施方案中，所述的丝状真菌细胞为泡盛曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为杆孢状镰刀菌、Fusarium cerealis、Fusariumcrookwellense、黄色镰刀菌、禾谷镰刀菌、禾赤镰刀菌、异孢镰刀菌、合欢木镰刀菌、尖孢镰刀菌、多枝镰刀菌、粉红镰刀菌、接骨木镰刀菌、肤色镰刀菌、硫色镰刀菌、Fusarium tomloseum、Fusarium trichothecioides或Fusariumvenenatum细胞。在一最优选的实施方案中，所述的丝状真菌细胞为Fusariumvenenatum(Nirenberg sp.nov.)。在另一最优选的实施方案中，所述的丝状真菌细胞为Humicola insolens或Humicola lanuginosa细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为米赫毛霉。在另一最优选的实施方案中，所述的丝状真菌细胞为嗜热毁丝霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为粗糙链孢霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为产紫青霉细胞。在另一最优选的实施方案中，所述的丝状真菌细胞为Thielavia terrestris细胞。在另一最优选的实施方案中，所述木霉属细胞为Trichoderma harzianum、康宁氏木霉、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉(Trichoderma viride)细胞。

具有转录激活活性的多肽

本发明的另一个方面涉及一种分离的多肽，其选自：

(a)一种多肽，在一种核酸序列中对其进行编码，所述的核酸序列在低严谨度条件下与(i)SEQ ID NO：1的核酸序列；(ii)其互补链，或(iii)编码具有转录激活活性的多肽片段的SEQ ID NO：1的子序列杂交，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200μg/ml剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟：

(b)一种多肽，其氨基酸序列与SEQ ID NO：2的氨基酸序列有至少50％的同一性；

(c)(a)或(b)的等位基因变体；

(d)(a)、(b)或(c)的一个片段，其中所述的片段具有转录激活活性；以及

(e)包括SEQ ID NO：3的氨基酸序列的一种多肽或者其等位基因变体。

利用本文中所述的技术可以对转录激活因子进行分离。如本文中所定义的，一种“分离”的多肽为一种基本上没有其他多肽的多肽，例如通过SDS-PAGE测定的纯度为至少大约20％，优选至少大约40％，更优选大约60％，甚至更优选大约80％，最优选大约90％，而且还最优选大约95％。

本发明还涉及下述分离的多肽，其氨基酸序列与具有转录激活活性的SEQ ID NO：2氨基酸序列的同一性至少大约50％，优选至少大约55％，优选至少大约60％，优选至少大约65％，优选至少大约70％，优选至少大约75％，优选至少大约80％，更优选至少大约85％，甚至更优选至少大约90％，最优选至少大约95％，而且还最优选至少大约97％。

在更优选的实施方案中，本发明的转录激活因子包括SEQ ID NO：2的氨基酸序列，或者其一个片段，其中所述的片段保留有转录激活活性。在一最优选的实施方案中，所述的多肽具有SEQ ID NO：2的氨基酸序列。SEQ IDNO：2的一个片段是从该氨基酸序列的氨基和/或羧基末端缺失一个或多个氨基酸的多肽。优选，SEQ ID NO：2的一个片段至少含有在SEQ ID NO：3中所示的多肽序列。

同源多肽的氨基酸序列可因一个或多个氨基酸残基的插入或缺失和/或被不同氨基酸残基置换而与SEQ ID NO：2或SEQ ID NO：3的氨基酸序列不同。优选，氨基酸的改变属于一种次要的特性，其为不会显著影响所述蛋白折叠和/或活性的保守性氨基酸置换；通常1至大约30个氨基酸的小的缺失；小的氨基或羧基末端延伸(extension)，例如氨基末端的蛋氨酸残基；多达大约20-25个残基的小的连接肽；或者通过改变净电荷或其他功能而有利于纯化的小的延伸，例如多聚组氨酸域、抗原性表位或结合结构域。

保守性置换的实例在碱性氨基酸(例如精氨酸、赖氨酸和组氨酸)、酸性氨基酸(例如谷氨酸和天冬氨酸)、极性氨基酸(例如谷氨酰胺和天冬酰胺)、疏水性氨基酸(例如亮氨酸、异亮氨酸和缬氨酸)、芳香族氨基酸(例如苯丙氨酸、色氨酸和酪氨酸)以及小的氨基酸(例如甘氨酸、丙氨酸、丝氨酸、苏氨酸和蛋氨酸)内。通常不改变比活性的氨基酸置换在本领域中是已知的，而且由例如H.Neurath和R.L.Hill(1979，蛋白质(The Proteins)，Academic Press，纽约)所描述。最常见的交换为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Als/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Glv，以及这些反过来进行交换。

在一更优选的实施方案中，本发明的转录激活因子获自黑曲霉菌株，更优选获自黑曲霉AB4.1(van Haringsveldt，W.，等，1987，分子和普通遗传学(Mol.Gen.Genet.)206：71-75)，而且最优选获自已在DSM保藏为DSM 12298的黑曲霉13PAP2，或其突变株，它们携有例如具有SEQ ID NO：2或SEQ IDNO：3氨基酸序列的多肽。

在另一优选的实施方案中，本发明的转录激活因子为由在质粒pEES中所含的核酸序列编码的多肽，而质粒pEES包含于大肠杆菌DSM 12294中。

本发明还涉及用于制备本发明的转录激活因子的方法，其包括(a)将包容有核酸构建体或表达载体的宿主细胞在有助于所述多肽产生的条件下进行培养，所述的核酸构建体或表达载体含有编码本发明的转录激活因子的核酸序列；并(b)回收该多肽。

具有改变的转录激活活性的宿主细胞

本发明的另一方面涉及一种对多肽制备有效的宿主细胞，其为亲代真菌细胞的突变体，其中亲代细胞包括一个或多个编码一种蛋白酶的核酸序列，所述核酸序列的转录由本发明的转录激活因子激活，而且在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

利用本领域中众所周知的方法可以构建突变细胞；例如通过在编码转录激活因子的基因中一个或多个核苷酸的插入或缺失。

在一优选的实施方案中，所述突变细胞通过使细胞中表达转录激活因子所必需的核酸序列得到修饰或灭活而获得。

在一更优选的实施方案中，所述的核酸序列选自：(a)与SEQ ID NO：1的核酸序列有至少70％同一性的核酸序列；(b)编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2的氨基酸序列有至少50％同一性；(c)在低严谨度条件下与(i)SEQ ID NO：l的核酸序列，或者(ii)其互补链杂交的核酸序列；(d)(a)、(b)或(c)的等位基因变体；(e)(a)、(b)、(c)或(d)的子序列，其中该子序列编码一种具有转录激活活性的多肽片段；以及(f)(a)、(b)、(c)或(d)的子序列，其中该子序列编码一种具有SEQ ID NO：3的氨基酸序列的多肽。

在另一优选的实施方案中，转录激活因子在突变细胞中降低的表达是通过对该转录激活因子表达所需的调控序列的修饰或灭活而获得的。如上，在标题为“核酸构建体”的章节中对术语“调控序列”进行了定义。在一更优选的实施方案中，突变细胞中的调控序列为启动子序列或其功能性部分，即足以影响所述核酸序列表达的一个部分。其他可能进行修饰的调控序列包括，但不限于，引导序列、多聚腺苷酸化序列、前肽序列、信号序列和转录终止子。

通过将亲代细胞用于诱变并筛选产生转录激活因子的能力已被降低的突变细胞可以进行基因的修饰或灭活。诱变，其可以为特异的或随机的，例如可以通过利用适当的物理或化学诱变剂、通过利用适当的寡核苷酸，或者通过将该DNA序列用于PCR产生的诱变来进行。另外，可以通过利用这些诱变剂的任何组合来进行诱变。

适于本目的的物理或化学诱变剂的实例包括紫外线(UV)辐射、羟胺、N-甲基-N’-硝基-N-亚硝基胍(MNNG)、邻甲基羟胺、亚硝酸、甲磺酸乙酯(ethylmethane sulphonate)(EMS)、亚硫酸氢钠、甲酸以及核苷酸类似物。

当利用此类试剂时，诱变通常是通过下述步骤进行：在所选诱变剂的存在下将待诱变的亲代细胞于适当的条件下温育，并筛选表现出所述基因表达降低的突变细胞。

通过在基因的核酸序列或其转录或翻译所需的调节性元件中引入、置换或去除一个或多个核苷酸可以完成对该基因的修饰或灭活。例如，可以将核苷酸插入或去除以便造成终止密码子的引入、启始密码子的去除或者开放阅读框的改变。此类修饰或灭活可以按照本领域已知的方法通过定点诱变或PCR产生的诱变来完成。虽然原则上修饰可以在体内进行，即直接在表达待修饰基因的真菌细胞上进行，但如下面所举例说明的优选在体外进行修饰。

灭活或降低目的真菌细胞中所述基因表达的一种方便方法的实例是以基因置换或基因阻断技术为基础。例如，在基因阻断方法中，在体外将与内源性基因或目的基因片段相应的核酸序列进行诱变以产生一种缺陷的核酸序列，然后将其转化到亲代细胞中以产生一种缺陷的基因。通过同源重组，缺陷的核酸序列取代内源性基因或基因片段。理想的是缺陷的基因或基因片段还编码一种标志物，所述的标志物可以用于对其中核酸序列已经被修饰或破坏的转化子进行筛选。

或者，所述基因的修饰或灭活可以通过已建立的反义技术利用与该基因的核酸序列互补的一种核苷酸序列来进行。更具体为，通过引入一种核苷酸序列可以降低或清除丝状真菌细胞对所述基因的表达，所述的核苷酸序列与在该细胞中可被转录的核酸序列互补而且能够与细胞中产生的mRNA杂交。因此，在允许互补反义核苷酸序列与所述mRNA杂交的条件下，降低或清除了所翻译的蛋白质的数量。

与SEQ ID NO：1的核酸序列互补的一种核苷酸序列可以获自任何微生物来源。优选的来源为真菌，例如，如上所述的酵母和丝状真菌。优选的丝状真菌来源包括，但不限于，枝顶孢属、曲霉属、镰刀菌属、腐质霉属、毁丝霉属、毛霉属、链孢菌属、青霉属、Phanerochaete、草根霉属、Tolypocladium和木霉属。优选的酵母来源包括，但不限于，念珠菌属、汉森酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属和Yarrowia属。此外，所述的核酸序列可以是丝状真菌细胞固有的。

在另一优选的实施方案中，亲代细胞包容有一种基因，所述的基因具有编码一种多肽的核酸序列，所述多肽的氨基酸序列与SEQ ID NO：2的氨基酸序列具有至少50％的同一性。

在另一优选的实施方案中，亲代细胞包容有一种基因，所述基因的核酸序列与SEQ ID NO：1的核酸序列具有至少70％的同一性。

在另一优选的实施方案中，突变细胞包容有一种核酸序列，所述的核酸序列已经被上述方法中的任何方法修饰或灭活，而且在相同条件下培养时突变细胞产生少于亲代细胞的蛋白酶或蛋白酶组合。在相同条件下培养时，突变细胞产生的蛋白酶或蛋白酶组合优选比亲代细胞少至少大约25％，更优选少至少大约50％，甚至更优选约75％，而且还更优选约95％。

在一更优选的实施方案中，当在相同条件下培养时，突变细胞与亲代细胞比产生基本上无法检测到的蛋白酶或蛋白酶的组合。

利用已知的方法可以对蛋白酶进行检测。在一个这样的方法中，将一份取自培养48小时的培养基在pH4.0下与³H-标记的抹香鲸肌球蛋白温育，并对TCA-可溶性组分中的放射活性进行检测(van Noort，J.M.，等，1991.分析生物化学(Anal.Biochem)198：385-390)。已对其它鉴定方法进行了描述，它们用于鉴定例如黑曲霉的天冬氨酸蛋白酶A(Takahashi，K.，1991.酶学方法(Meth.In Enzymo1.)248：146-155)、内肽酶(Morihara，K.，1995.酶学方法248：242-253)、羧肽酶(Reminton，J.，和Breddam，K.，1994.酶学方法244：231-248)、二肽酶(Ikehara，Y，等，244：515-227)以及氨肽酶(Little，G.，等，1976.酶学方法45：495-503)。

在另一优选的实施方案中，突变细胞包容有编码目的多肽的核酸序列的至少一个拷贝。

本发明的另一个方面涉及一种对多肽制备有效的宿主细胞，其中宿主细胞为亲代真菌细胞的突变体，其中突变体(a)在相同的条件下培养时与亲代细胞相比产生更多的本发明转录激活因子；而且(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

在一优选的实施方案中，通过向亲代细胞中引入一个或多个拷贝的(i)编码一种转录激活因子的核酸序列、(ii)包括编码一种转录激活因子的核酸序列的核酸构建体或者(iii)如上在“表达载体”部分中所定义的表达载体，当在相同的条件下培养时宿主细胞产生比亲代细胞多的转录激活因子。

包括编码本发明转录激活因子的核酸序列的核酸构建体还可以包括一个或多个核酸序列，所述的核酸序列编码一个或多个有利于指导所述多肽表达的因子，例如转录激活因子(如，反式作用因子)、分子伴娘和加工蛋白酶。在目的丝状真菌细胞中有功能的任何因子均可以用于本发明中。编码这些因子中的一个或多个的核酸不必与编码所述多肽的核酸序列串联。

激活因子为一种蛋白，其激活编码多肽的核酸序列的转录(Kudla等，1990，欧洲分子生物学组织杂志(EMBO Journal)9：1355-1364；Jarai和Buxton，1994，当代遗传学(Current Genetics)26：2238-244；Verdier，1990，酵母(Yeast)6：271-297)。编码激活因子的核酸序列可以获自编码酿酒酵母血红素活化蛋白l(hapl)、酿酒酵母半乳糖代谢蛋白4(gal4)、构巢曲霉氨调节蛋白(areA)以及米曲霉α-淀粉酶激活因子(amyR)的基因。其他实例见Verdier，1990，同上以及MacKenzie等，1993，普通微生物学杂志(Journal of GeneralMicrobiology)139：2295-2307。

分子伴娘为一种蛋白，其协助另一种多肽正确地折叠(Hartl等，1994，TIBS 19：20-25；Bergeron等，1994，TIBS 19：124-128；Demolder等，1994，生物技术杂志(Journal of Biotechnology)32：179-189；Craig，1993，科学(Science)260：1902-1903；Gething和Sambrook，1992，自然(Nature)355：33-45；Puig和Gilbert，1994，生物化学杂志(Joumal of BiologicalChemistry)269：7764-7771；Wang和Tsou，1993，The FASEB Journal7：1515-11157；Robinson等，1994，生物技术(Bio/Technology)l：381-384；Jacobs等，1993，分子微生物学(Molecular Microbiology)8：957-966)。编码分子伴娘的核酸序列可以获自编码米曲霉蛋白二硫化物异构酶或者酿酒酵母calnexin、酿酒酵母BiP/GRP78以及酿酒酵母Hsp70的基因。其他实例见Gething和Sambrook，1992，同上以及Hartl等，1994，同上。

加工蛋白酶为一种蛋白酶，其切割前肽产生成熟的有生物化学活性的多肽(Enderlin和Ogrydziak，1994，酵母10：67-79；Fuller等，1989，美国国家科学院院刊86：1434-1438；Julius等，1984，细胞(Cell)37：1075-1089；Julius等，1983，细胞32：839-852；美国专利第5,702,934号)。编码加工蛋白酶的核酸序列可以获自编码酿酒酵母二肽基氨肽酶、酿酒酵母Kex2、Yarrowialipolytica二元加工型内切蛋白酶(xpr6)以及尖孢镰刀菌金属蛋白酶(p45基因)的基因。

在一更优选的实施方案中，将编码转录激活因子的核酸序列可操作地与一个启动子或其功能性部分连接，所述的启动子比亲代细胞的相应启动子强。在一更优选的实施方案中，所述启动子或其功能性部分介导编码细胞外蛋白酶的基因表达，例如米曲霉碱性蛋白酶、米曲霉中性金属蛋白酶、黑曲霉曲霉胃蛋白酶、尖孢镰刀菌胰蛋白酶样蛋白酶或者Fusarium venenatum胰蛋白酶。

本发明还涉及一种有效用于多肽制备的宿主细胞，其中宿主细胞为亲代真菌细胞的突变体，其中突变体包括

(a)对本发明转录激活因子或其调控序列的修饰或灭活，以及

(b)(i)一个诱导性启动子，其可操作地与编码本发明转录激活因子的核酸序列相连，和(ii)所述转录激活因子可以结合的一个启动子序列，其可操作地与编码所述多肽的核酸序列相连，其中可以将(i)和(ii)同时或顺序引入。

按照上面所公开的任何方法，通过对存在于细胞中并且是固有转录激活因子表达所需的核酸序列进行灭活或修饰可以获得上面(a)中转录激活因子的无活性形式。在一优选的实施方案中，通过下述方法获得所述的灭活或修饰，所述的方法包括，但不限于，一个或多个核苷酸的插入、缺失或置换、特异性或随机诱变、基因置换或基因阻断以及利用与所述转录激活因子的核酸序列互补的核苷酸序列进行的反义技术。在另一优选的实施方案中，通过对所述转录激活因子表达所需的调控序列进行灭活或修饰获得固有转录激活因子的无活性形式。

在另一优选的实施方案中，编码固有转录激活因子的核酸序列具有在SEQ ID NO：1中所列的序列。在另一优选的实施方案中，所述的转录激活因子包括具有SEQ ID NO：3中氨基酸序列的多肽。

上面(b)中的可诱导启动子可以为任何启动子序列或其功能性部分，其中根据发酵条件，可以对启动子的转录启始活性进行诱导。优选，该诱导是由一种碳或氮的分解代谢产物介导的。在一优选的实施方案中，启动子为构巢曲霉或米曲霉的amdS启动子；构巢曲霉、米曲霉或黑曲霉的niaD启动子；曲霉属的niiA启动子、曲霉属的碱性磷酸酶启动子、曲霉属的酸性磷酸酶启动子或者黑曲霉的alcA启动子。

在另一优选的实施方案中，宿主细胞还包括一个启动子序列，其中所述的启动子序列可以被所述转录激活因子激活而且它可操作地连接于编码所述多肽的核酸序列。

被本发明转录激活因子激活的启动子序列可以为任何启动子序列或其功能性部分，其选自，但不限于，下述编码基因的启动子：米曲霉TAKA淀粉酶、米赫根毛霉天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉乙酰胺酶、NA2-tpi启动子(黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因启动子的一种杂合体)以及它们突变的、截断的和杂合的启动子。特别优选用于丝状真菌细胞中的启动子为蛋白酶基因的启动子或其功能性部分，例如尖孢镰刀菌胰蛋白酶样蛋白酶基因(美国专利4,288,627)、米曲霉碱性蛋白酶基因(alp)、黑曲霉pacA基因、米曲霉碱性蛋白酶基因、米曲霉中性金属蛋白酶基因、黑曲霉曲霉胃蛋白酶基因或者Fusarium venenatum胰蛋白酶基因。

在另一优选的实施方案中，宿主细胞包容有至少一个拷贝的编码多肽的核酸序列。

在另一优选的实施方案中，当在相同条件下培养时表达本发明转录激活因子的宿主细胞比亲代细胞在产生一种或多种固有蛋白酶时产量减少。利用上述的任何方法可以对所述的蛋白酶进行检测。在一更优选的实施方案中，将一份取自培养48小时的培养基在pH4.0下与³H-标记的抹香鲸肌球蛋白温育，并对TCA-可溶性组分中的放射活性进行检测(van Noort，J.M.，等，同上)。

按照上面在“宿主细胞”部分所述的任何方法可以将本文中所述的核酸构建体引入亲代真菌细胞，以获得一种可有效产生多肽的宿主细胞。在一优选的实施方案中，核酸构建体被整合到细胞染色体中。在另一优选的实施方案中，核酸构建体保持为一种自我复制的染色体外载体。

不言而喻，对于获得突变的真菌细胞，本发明的方法不限于一个具体的顺序。在构建产生多肽的细胞的过程中，可以在任何步骤处将对第二个核酸序列的修饰引入亲代细胞。

制备多肽

本发明的另一方面涉及在本发明的宿主细胞中制备多肽的方法，其包括：(a)在适于所述多肽产生的营养培养基中对包容有编码该多肽的基因的宿主细胞进行培养；并(b)从宿主细胞的营养培养基中回收该多肽。

在一个实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中亲代细胞包括一个或多个编码蛋白酶的基因，所述基因的转录由本发明的转录激活因子激活，而且在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

在另一实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中该突变体(a)在相同的条件下培养时与亲代细胞相比产生更多的本发明转录激活因子；而且(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

在另一实施方案中，宿主细胞为亲代真菌细胞的一个突变体，其中该突变体包括(a)对本发明转录激活因子或其调控序列的修饰或灭活，以及(b)可操作地与编码本发明转录激活因子的核酸序列相连的诱导性启动子和所述转录激活因子可以结合的启动子序列，其中可以将(i)和(ii)同时或顺序引入。

利用本领域已知的方法将本发明的宿主细胞培养于适于制备目的多肽的营养培养基中。例如，通过在适当培养基中并在允许对所述多肽进行表达和/或分离的条件下进行摇瓶培养、在实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、分批给料或固态发酵)可以对细胞进行培养。利用本领域已知的方法(见，例如Bennett，J.W.和LaSure，L.编，更多在真菌中的基因操作(More Gene Manipulations in Fungi)，Academic Press，CA，1991)，在包括碳和氮源以及无机盐的适当营养培养基中进行培养。适当的培养基可从供应商处获得，或者可以利用公开的组合物来制备(例如，在美国典型培养物保藏中心的目录中的)。如果所述的多肽被分泌到营养培养基中，那么可以从培养基中直接回收该多肽。如果所述的多肽不被分泌，则从细胞裂解液中将其回收。

通过本领域已知的方法可以对所获的多肽进行分离。例如，通过传统方法可以从营养培养基中对所述的多肽进行分离，所述的传统方法包括，但不限于，离心、过滤、抽提、喷雾干燥、蒸发或沉淀。然后通过本领域已知的多种方法可以对分离的多肽进行进一步纯化，所述的方法包括，但不限于，层析法(例如，离子交换层析、亲和层析、疏水层析、层析聚焦以及分子筛层析)、电泳方法(例如，制备型等电聚焦)、差异溶解法(例如，硫酸铵沉淀)或者抽提(见，例如蛋白质纯化(Protein Purification)，J.-C.Janson和Lars Ryden编，VCH Publishers，纽约，1989)。

利用本领域已知的特别针对所述多肽的方法可以对该多肽进行检测。这些检测方法包括特异性抗体的利用、酶产物的形成、酶底物的消失或者SDS-PAGE。例如，可用酶检测法测定所述多肽的活性。很多酶的酶活性测定法在本领域是已知的。

在本发明的方法中，当在相同的条件下培养时，宿主细胞产生的所述多肽比相应的亲代细胞至少多大约20％，优选至少多大约50％，更优选至少多大约100％，甚至更优选至少多大约200％，最优选至少多大约300％。

所述的多肽可以为任何多肽，不论对突变体丝状真菌细胞是固有的还是异源的。本文中将术语“异源多肽”定义为一种并非由细胞产生的多肽。本文中术语“多肽”并非意指一种特定长度的编码产物，因而包括肽、寡肽和蛋白质。所述的多肽还可以为细胞固有多肽的重组多肽，其由一个核酸序列编码，所述的核酸序列包括一个或多个与该核酸序列不同来源的调控序列，所述的调控序列参与所述多肽的制备。所述的多肽可以为野生型多肽或其变体。所述的多肽还可以为一种杂合多肽，其包括对获自至少两种不同多肽的部分或整个多肽序列的联合，其中所述多肽中的一个或多个对于所述的细胞可以是异源的。多肽进一步包括上述多肽的天然等位基因变体和工程化变体。

在一优选的实施方案中，所述的多肽为抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报告蛋白或转运蛋白。

在一更优选的实施方案中，所述的酶为氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。

在一还更优选的实施方案中，所述的酶为氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶(cutinase)、脱氧核糖核酸酶、葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶(glucoamylase)、α-糖苷酶、β-糖苷酶、卤过氧化物酶(haloperoxidase)、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶裂解酶(pectinolytic enzyme)、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶或木聚糖酶。

在另一还更优选的实施方案中，所述的多肽为人胰岛素或其类似物、人生长激素、红细胞生成素或促胰岛素激素。

编码异源多肽的核酸序列可以获自任何原核的、真核的、或其他来源。为了本发明的目的，本文中与给定来源连用的术语“获自”意指所述的多肽由该来源产生或者由其中已经插入了来自该来源的基因的细胞产生。

在本发明的方法中，突变体丝状真菌细胞还可以用于细胞固有多肽的重组制备。对固有多肽重组制备可通过将编码该多肽的基因置于另一个启动子的控制下以提高该多肽的表达，通过利用信号序列以加速目的固有多肽转运到细胞外，以及增加由细胞正常产生的多肽编码基因的拷贝数。在术语“异源多肽”的范围内，本发明还包括细胞固有多肽的此类重组制备，在这个意义上此类表达涉及非细胞固有的遗传元件的利用，或者固有元件的利用，所述的固有元件经过处理以一种正常在丝状真菌细胞中不存在的方式发挥作用。用于分离或克隆异源多肽的核酸序列的技术在本领域是已知的，包括从基因组DNA分离、从cDNA制备或者两者结合。例如通过利用众所周知的聚合酶链式反应(PCR)可以实现从此类基因组DNA克隆所述核酸序列。见，例如，Innis等，1990，PCR方案：方法和应用指导(PCR Protocols：A Guideto Methods and Application)，Academic Press，纽约。克隆方法可能涉及对包括编码所述多肽的核酸序列的目的核酸片段进行切除和分离、所述片段向载体分子中的插入以及重组载体向突变体真菌细胞中的掺入，在所述的真菌细胞中所述核酸序列的多个拷贝或克隆将被复制。所述的核酸序列可以为基因组、cDNA、RNA、半合成、合成来源的，或者它们的任何组合。

在本发明的方法中，异源多肽还可以包括融合的或杂合的多肽，其中将另一种多肽融合于所述多肽或其片段的N-末端或C-末端。通过将编码一种多肽的核酸序列(或其一部分)融合于编码另一种多肽的核酸序列(或其一部分)可对融合多肽进行制备。用于制备融合多肽的技术在本领域是已知的，并且包括，将所述多肽的编码序列连接以便它们阅读框一致而且融合多肽的表达处于相同启动子和终止子的控制下。杂合多肽可以包括对获自至少两种不同多肽的部分或整个多肽序列的联合，其中所述多肽中的一个或多个对于所述的突变体真菌细胞可以是异源的。对分离的编码目的异源多肽的核酸序列可以以多种方式进行处理以用于所述多肽的表达。表达应被理解为包括参与所述多肽产生的任何步骤，其包括，但不限于，转录、转录后修饰、翻译、翻译后修饰以及分泌。根据表达载体，对编码多肽的核酸序列在其插入到载体中之前进行的处理是理想的或必需的。用于通过利用克隆方法修饰核酸序列的技术在本领域中是众所周知的。

通过下面的实施例对本发明进行进一步描述，不应将实施例认为是限制本发明的范围。

实施例

材料

用作缓冲液和底物的化学制品为至少试剂级的商品化的产品。

菌株

AB4.1：黑曲霉的一个菌株，其为菌株ATTC 9029的一个cspAl pyrGl衍生株(van Hartingsveldt，W.，等，1987.分子和普通遗传学206：71-75；Bos，C.J.，等，当代遗传学14：437-443)。

AB1.13：黑曲霉的一个蛋白酶缺陷菌株，其源自AB4.1的UV诱变(Mattern，I.E.等，1992.分子和普通遗传学234：332-336)。

13PAP2：AB1.13的一个衍生株，其含有黑曲霉的pepA启动子(Jarai G.和Buxton F.1994.当代遗传学26：238-244)控制下的多个拷贝构巢曲霉amdS基因(Corrick，R.A.，等，1987.基因(Gene)53：63-71)。该菌株具有蛋白酶缺陷表型而且在含有乙酰胺作为唯一氮源的培养基上无法生长。菌株13PAP2已经以DSM NO.12298的名称保藏于DSM。

4PAP6：AB4.1的一个衍生株，其含有黑曲霉的pepA启动子控制下的多个拷贝构巢曲霉amdS基因。该菌株不具有蛋白酶缺陷表型，而且在含有乙酰胺作为唯一氮源的培养基上能够生长。

N402：黑曲霉的一个菌株，其以ATCC号：64974保藏于ATCC(ManassasVA，美国)。

MC1046：大肠杆菌的一个菌株，其以ATCC号：35467保藏于ATCC。

质粒

pPAP：如下在实施例1中所述进行构建并示于图1中

oAopyrGcosArpl：如下在实施例1中所述进行构建并示于图2中

pEESl：如下在实施例1中所述进行构建并示于图3中

p3SR2：如由C.M.Corrick，A.P.Twomey和M.J.Hynes(1987.基因53：63-71)所述，含有构巢曲霉amdS基因

pABPYRG^*-Not：如由Verdoes，J.C.，等(1994.基因145：179-187)所述，含有被灭活的pyrG基因

pHelpl：含有来自米曲霉的pyrG基因作为筛选标志物，并含有使其可以在黑曲霉中自我复制的AMAl序列，如由Gems，D.，等(1991.基因98：61-67)所述，它们被克隆到大肠杆菌载体pIC20R中

pAnscosl：如由Osiewacz，H.D.(1994.当代遗传学26：87-90)所述，含有两个cos位点

pAO4-2：如由De Ruiter-Jacobs，Y.M.J.T，等(1989.当代遗传学16：159-163)所述，含有米曲霉pyrG基因

pAO4-13：如由De Ruiter-Jacobs，Y.M.J.T，等(1989.当代遗传学16：159-163)所述，含有米曲霉pyrG基因

pUC19：如由Yanisch-Perron，C.，Vieira，J.，和Messig，J.(1985.基因33：103-119)所述

实施例1：从黑曲霉中克隆prtT转录激活因子

prtT克隆自13PAP2，一种黑曲霉突变株，所述的菌株无法表达由pepA蛋白酶基因启动子调节的amdS基因，具有蛋白酶缺陷表型(prt^-)。

黑曲霉13PAP2报告菌株的构建

通过连接下面的三个片段对质粒pPA1进行构建：

1)经EcoRI和KpnI消化的大肠杆菌载体pBlueScript II SK(StratageneCloning System，La Jolla CA，美国)；

2)一个1.4kb的EcoRI/BamHI限制性片段，其包括1.2kb的pepA基因启动子区和与之相连的从启始密码子到一内部BamHI位点的大约130bp的amdS编码序列，通过PCR扩增获得；以及

3)来自p3SR2的一个2.1kb的BamHI/KpnI片段，其含有构巢曲霉amdS基因的大部分

片段2是通过两个步骤来构建的。在第一步中，以如下在“粘粒文库的构建”部分中所述从原生质体中制备的来自黑曲霉N402的基因组DNA用作模板，将下面所示的两条寡核苷酸，pepApr和pepA/amdS，用作引物：

pepApr：CGG AAT TCG CAT GCT GGA GGT GCT TCT AA

pepA/amdS：TTC CCA GGA TTG AGG CAT TTT GAC CAC GAG AAT

然后，将获自该反应的1200bp的PCR产物与下面所示的寡核苷酸MBL1213一起，在第二个PCR反应中用作引物，并以质粒p3SR2作为模板。

MBL1213：TAA CTT CCA CCG AGG TC

随后将上述的3个片段连接，所获产物转染到大肠杆菌DH5α中。

在最后的构建步骤中，将pPA1用NotI进行消化，并连接于来自pABPYRG^*-Not的一个3.8kb的NotI片段，获得示于图1中的质粒pPAP。将pPAP转化到黑曲霉AB1.13中，并对pPAP以多个拷贝整合到pyrG位点的转化子进行分离。将该转化子的一个自发的5 flourotic acid(FOA)抗性、需尿苷的突变体命名为13PAP2，其可以用pyrG基因补足。

pAopyrGcosArpl的构建

通过将下面的3个片段连接随后转染到大肠杆菌DH5α中来对质粒pAopyrGcosArpl进行构建：

1)经Acc65I和BamHI切割的大肠杆菌载体pHelpl

2)来自pAnscosl的一个3.0kb的BamHI/HindIII片段，其含有2个cos位点

3)来自pAO4-2的一个3.2 kb的Acc65I/HindIII片段，其含有米曲霉pyrG基因

所获的质粒pAopyrGcosArpl在曲霉中可以自我复制，并且可以通过在缺少尿苷的培养基上培养来对其进行筛选。在图2中对pAopyrGcosArpl进行了描述。

粘粒文库的构建

利用“SuperCosl粘粒载体试剂盒”(Stratagene Cloning Systems，La JollaCA，美国)按照供应商的说明构建一个黑曲霉的粘粒文库。

从通过标准方法制备的原生质体中制备黑曲霉N402的基因组DNA。

分离后，通过在Beckman GS-6R中于2000rpm离心10分钟使原生质体沉淀，然后将沉淀悬于含有22.5mM三异萘磺酸(tri-isonaphtalene sulphonicacid)、275 mM对氨基水杨酸、0.2M Tris-HCl(pH8.5)、0.25M NaCl和50mMEDTA的缓冲液中，随后立即加入1个体积的苯酚/氯仿(1∶1)。小心混合并于3000rpm离心20分钟后，轻轻倾出水相并利用标准的方法沉淀DNA。

通过在0.3％的琼脂糖凝胶上以30伏电压于4℃电泳20个小时来对基因组DNA的大小进行分析。溴化乙锭染色的凝胶显示所获DNA的大小从50kb到大于100kb。利用MboI对所述DNA进行部分消化。通过与上面相同类型的凝胶分析所确定的，消化后DNA的大小为30到50kb。将利用QIAGEN(Venlo，荷兰)的试剂盒按照说明书纯化的pAopyrGcosArpl载体用BamHI消化、去磷酸化并凝胶纯化。按照标准的方法进行连接和组装。

在测定文库的滴度后，将一次连接和组装的所有组装混合物转染到宿主细胞MC1046中，并于50μg/ml氨苄青霉素LB平板上铺板。获得了大约40,000个菌落。来自10个菌落的粘粒制备物显示它们都有预期大小的插入子。然后将40,000个菌落浸泡于LB培养基中并从平板上刮下，然后分装，在15％甘油中储藏于-80℃。这代表对黑曲霉基因组大约40倍的扩增。

prtT克隆的筛选

从所述的文库中制备粘粒DNA并按照由P.J.Punt和C.A.M.J.J.Van DenHondel(1992.酶学方法216：447-457)所描述的转化方法将其引入13PAP2。反复尽力对pyrG标志物进行筛选只导致回收了4000到30,000个转化子。对pyrG标志物和在含乙酰胺作为唯一氮源的培养基上的生长所进行的双重筛选，从5个不同的实验中产生一共65个初级转化子。

对每个初级转化子筛选蛋白酶活性、在含乙酰胺作为唯一氮源的培养基上的生长以及这两个特征的不稳定性。通过在含乙酰胺的培养基上生长而筛选的乙酰胺酶⁺表型是因报告物表达盒内pepA启动子的激活而导致的乙酰胺酶活性的一个指示，在所述的表达盒中pepA启动子连接于amdS编码序列。利用含透析过的脱脂奶作为唯一氮源的基本培养基平板对蛋白酶⁺表型进行筛选(Mattern，I.E.，等，1992.分子和普通遗传学234：332-336)。在这些平板上，野生型的AB4.1菌株产生透明环，而AB1.13突变体则产生很小的环。这种差别并非由于pepA活性的不同，因为pepA缺失的菌株在这些平板上也可以产生大的环。因此，在牛奶平板上形成大的环表示其他细胞外蛋白酶的激活。

通过在含尿苷的培养基上培养稀释的孢子原种来对不稳定性进行检测。从这些平板种挑取单个孢子衍生的菌落，并对其检测蛋白酶活性和在乙酰胺上的生长。筛选结果揭示在超过70％的菌落中这两种特征均已丧失。因此，所述的两个表型或者一同丧失，或者一同保留，表明pepA启动子和其他蛋白酶启动子的激活被协同调节，并且与pyrG标志物的存在相关联。负责该表型的基因被称为prtT。然后分离了12个乙酰胺酶+、蛋白酶+转化子。

prtT基因的分离

为了从13PAP2的乙酰胺酶⁺、蛋白酶⁺转化子中挽救prtT基因，如前所述，从生长于基本培养基中的菌丝体中制备DNA。将该DNA用于尝试转化大肠杆菌DH5α感受态细胞。获得数百株氨苄青霉素抗性菌落。DNA分析显示它们均含有源自pHelpl质粒的序列。然后将从大肠杆菌菌落中分离的粘粒DNA重新转化到13PAP2中。两个DNA样品产生转化子，所述的转化子表现出在含有乙酰胺培养基上生长以及增高的蛋白酶活性。然后用几种限制性酶对来自粘粒之一，ACRl的DNA进行消化。然后将所获的片段与pAopyrGcosArpl一起共转化到菌株13PAP2中。EcoRJ、PstI、BamHI和KpnI对ACRl的消化产生了能够在乙酰胺上生长并具有高蛋白酶活性的转化子，而SalI和HindIII消化则未产生。因为EcoRI消化产生最简单的模式，所以对单个EcoRI片段利用凝胶进行分离并与pAopyrGcosArpl一起用于共转化13PAP2。只有一个15kb的EcoRI片段产生了能够在含乙酰胺培养基上生长的转化子。为了从粘粒中亚克隆prtT，将该片段亚克隆到pBluescript II SK中。由于该克隆的插入片段仍相当大，所以对分离的PstI条带通过凝胶进行分离并将每个与pAopyrGcosArpl一起共转化到13PAP2中。只有一个2.5kb的PstI片段产生了能够在含乙酰胺培养基上生长的转化子。将该片段亚克隆到pBluescriptII SK中。基于限制性图谱，由该质粒构建4个亚克隆，ClE0.7、ClE1.8、NcE1.1和NcE1.4。此外，对一个6.5kb的SstI/EcoRJ片段进行了亚克隆，得到了pEES1(示于图3中)，所述的SstI/EcoRI片段包括2.5kb的PstI片段。

对来自AB4.1的基因组DNA进行的SOUTHERN印迹分析表明只存在一个拷贝的prtT。

实施例2：对prtT基因的测序以及序列分析

利用来自Perkin-Elmer公司(Branchburg NJ，美国)的罗丹明终止剂循环测序试剂盒或BigDye^TM终止剂循环测序试剂盒制备所有的测序反应。将反应在ABI PRISM^377 DNA测序仪(Perkin-Elmer公司)上按照制造商的说明来运行。

从基因组克隆ClE0.7、ClE1.8、NcE1.1、NcE 1.4和pEES1中对prtT基因进行测序。将所用的序列特异性引物列举如下：

122958： CGA TCG ATG ACT GCC TGT

122956： AGA GAC ACA TAG TGC CTT

122959： GCT TAT AGT CGA TAG CGC

122960： CCT CTC TCC AGC GAT GGT

122962： ATG GAA TAC ATA CTG CTT

122961： ATG AAA CCC ACT GTA GCT

122963： TGC TCG ATA AGC GGG TCC

122964： AAT CTT ATG GAC CCG CTT

124289： CCC CGG GAA ACA AGA ACA GG

124290： GTT GGC GGA CCT TGA CTA TG

125112： ACA GCT ACA GTG GGT TTC ATC T

125111： AGT CAA CGG GGG AAG TCT C

128330： CTA GCA GCG TAT CGG TCA GC

130887： CTT GGA AAA GAA ACG ATA G

130888： AAC GTA CGC TTT CCT CCT T

134135： GGG TCC GTC CAG TCC GTT CTT

-48反向：AGC GGA TAA CAA TTT CAC ACA GGA

-40通用：GTT TTC CCA GTC ACG AC

利用下述引物，通过对分离自突变株AB1.13的基因组DNA进行PCR扩增获得了该基因的一个突变的等位基因：

PstI：TC ATC CCT GGT GTT ACT GC

PstII：C ATG GAT TGG CTG GCC G

prtT基因的完整DNA序列示于SEQ ID NO：1中。所述突变的等位基因的PCR片段的序列示于SEQ ID NO：4中。

利用计算机软件Netgene2(S.M.Hebsgaard，P.G.Korning，N.Tolstrup，J.Engelbrecht，P.Rouze，S.Brunak，1996.核酸研究24：3439-3452)对DNA序列SEQ ID NO：1的分析表明存在5个外显子(见SEQ ID NO：1的注释)

prtT cDNA的分析

利用市售的多聚(A)⁺RNA分离试剂盒(Pharmacia，Uppsala SE)从来自黑曲霉培养物的总RNA中纯化mRNA，所述的黑曲霉培养物在有利于蛋白酶产生的条件下生长(J.P.T.N.Van Den Hombergh，等，1997.欧洲生物化学杂志(Eur.J.Biochem.)247：605-613)。利用标准的方法制备双链cDNA并将其用于利用下列引物进行的PCR反应：

寡聚-dT引物：T₂₀N

prt270n： TACTCTCCAGATTGCCTG

prt1420r： TGAGATACCACTCAGCAG

prt1350n： TGCACTTCTCTGTCTCTG

prt2365r： GACTTCTGGCATCAGTTG

prt2320n： CTCATGGATGGCATGATC

利用引物Prt270n和Prtl420r进行的PCR反应产生一个大约1.0kb的片段。将该片段克隆到pGEM-T载体(Promega公司，Madison WI，美国)中，并利用引物122958、122960、-40通用和-48反向对所获质粒中的插入序列进行测序。结果证实在所述基因的该部分存在2个内含子。

利用引物Prt1350n和Prt2365r进行的第二个PCR反应产生大约0.9kb的片段。将该片段也克隆到一个pGEM-T载体中，并利用引物124289、124290、-40通用和-48反向对所获质粒中的插入序列进行测序。结果证实在所述基因的该部分存在1个内含子。

利用寡聚-dT引物和引物Prt2320n进行的另一个PCR反应产生大约350bp的片段。将该片段也克隆到一个pGEM-T载体中。利用引物-40通用和-48反向对插入序列进行的测序表明该片段含有prtT基因的3’部分并证实存在另一个内含子。

对所翻译的prtT基因推导的蛋白质序列示于SEQ ID NO：2中。对所翻译的突变等位基因prt13推导的蛋白质序列示于SEQ ID NO：5中。SEQ IDNO：2和SEQ ID NO：5的比较表明两者之间唯一的差别在第112位上，在该位点上，所翻译的prtT基因中的亮氨酸残基在所翻译的prt13基因中被脯氨酸取代。

对所推导prtT蛋白序列的分析显示存在一个Zinc(II)2Cys6双核簇(binuclear cluster)DNA结合基元(SEQ ID NO：2，47-81位残基)。该基元对GAL4类真菌转录激活因子进行了界定(Reece，M.J.，和Ptashne，M.1993.科学261：909-911)。所述基元在prtT基因中的存在强烈表明prtT为一种转录激活因子。

实施例3：在野生型黑曲霉菌株中对prtT基因的阻断

构建了一种质粒，其中由米曲霉的pryG基因将prtT基因的上游和下游序列分隔开。将质粒pEES1用MunI和NheI消化，去除一个含有prtT大部分编码序列的2.1kb片段。将来自pAO4-13的一个含有米曲霉pyrG基因的2.3kb EcoRI/NheI片段克隆到pEES1的MunI和NheI位点中。所获的质粒被称为pDprt，其示于图4中。然后将该构建体用于转化黑曲霉菌株AB4.1使之变成尿苷原养型。然后在含脱脂奶的平板上对大约150个尿苷原养型转化子分析蛋白酶的活性。这些转化子中有5个在这些平板上不形成晕环，表明蛋白酶活性非常低。prtT基因被阻断的菌株与突变的AB1.13菌株相比在蛋白酶活性或表型上未显示出任何差别。

实施例4：PrtT的过表达

对一种质粒pGPprt(图5)进行构建，其含有与黑曲霉gpd基因启动子融合的prtT的编码区和3′非编码区。gpd基因编码3-磷酸甘油醛脱氢酶，其为参与基本代谢的一种组成型表达酶。所用的启动子为编码区上游的一个片段。将所述的质粒与pyrG筛选质粒pAO4-13共转化到黑曲霉AB4.1中。对通过SOUTHERN印迹分析确定prtT转录增加的转化子分析其增高的蛋白酶表达。

生物材料的保藏

根据布达佩斯条约，已将下述生物材料保藏于德国微生物和细胞培养物保藏中心(Mascheroder Weg 1b，D-38124 Braunschweig，德国)，并给予了下列登记号：

保藏登记号保藏日

大肠杆菌，pEES DSM 12294 1998-07-14

黑曲霉13PAP2 DSM 12298 1998-07-14

菌株保藏的条件是，在本专利申请悬而待决期间，保证可获取培养物。该保藏物代表相当于所保藏菌株的纯培养。本专利申请的副本或后续申请进入其它国家时，根据所在国专利法的要求可提供上述保藏物。但应理解，保藏物的可提供性并非许可在侵犯政府所授予的专利权利的条件下实施本发明。

在此所描述并要求专利保护的发明并不限于本文中所公开的特定实施方案的范围内，因为这些实施方案意图作为对本发明几个方面的说明。任何等同的实施方案均在本发明的范围内。事实上，除了那些在此所示并描述的修改外，本领域的技术人很容易根据前面的描述对本发明作各种修改。这些修改也在所附权利要求的范围内。

本文中引用了各种参考文献，其公开内容整个被引入作为参考。

序列表(1)一般资料：

(i)申请人：

(A)名称：Novo Nordisk A/S

(B)街道：Novo Alle

(C)城市：Bagsvaerd

(E)国家：丹麦

(F)邮编(ZIP)：2880

(G)电话：+45 4444 8888

(ii)发明标题：在制备多肽的方法中有效的真菌转录激活因子

(iii)序列数：1

(iv)计算机可读形式：

(A)介质类型：软盘

(B)计算机：IBM PC兼容机

(C)操作系统：PC-DOS/MS-DOS

(D)软件：PatentIn Release#1.0，Version#1.30(EP0)(2)SEQ ID NO：l的信息：

(i)序列特征：

(A)长度：4098碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑构型：线性

(ii)分子类型：DNA(基因组)

(vi)来源：

(B)菌株：DSM 12294

(ix)特征：

(A)名称/关键词：外显子

(B)位置：978..1204

(ix)FEATURE：

(A)名称/关键词：外显子

(B)位置：1317..1718

(ix)FEATURE：

(A)名称/关键词：外显子

(B)位置：1777..2202

(ix)FEATURE：

(A)名称/关键词：外显子

(B)位置：2253..3116

(ix)FEATURE：

(A)名称/关键词：外显子

(B)位置：3173..3248

(xi)序列描述：SEQ ID NO：1：TTGGTGCTGG AAAGCCCATT TAAGGGATCT TATAAGGTAA TTGCCAATGT TCAGTCGCCT 60ATGGTCTTTG TCGAGAGAAA CTCTTTCTCG TTAAGATCTA CATGATCGCT TTTGATTTTC 120TCTGGGTTCA CGCGGTACTT TCTCCCCGTC AATCCCCAAC CGCTGTTGTG CCTGACCATC 180AATGTGGAAC GGATAAGGGG ACAAGAGAAA TTGAAGGAGC GATCATAAAA AGCTAATTTT 240GGTTTATTAT TTTTTTTTCT TATAAAACTC AAAAAAGAAA ACGAAAACGA AAAAGGAAAA 300AAGAAAAGGT AAAATGGAAA AAGAAAGGCG GTCATCACTT CCAATAACCA TCAGCCAAAG 360ATACAGACGA GTTACTGACC TTCTTATCCT GGACTTCCGC CCGATCCATA TCTTCATGAT 420AAGCAGGGAA CCGAACAAAT CAACGCCAAC TTCAGCGGCA GTTCCTCACT AATTTCCCAC 480TTCCCACCGG CGTCATTTTG GTCCCAACCC CCTCCCTGGA AGCAGCGGGA TTTAGTTACG 540ATCCGGTTTA CATCGGAGAC TCGGAAAATA CCATAGCGCA TGCCAATCAA AACCCCTCCC 600AGGGTGACTG GCCAGTATCA CGACCCATTG TTTCTATCTT TCTAGAAGAC CTGCAGGGAC 660ATGGATTGGC TGGCCGCCGT GCTGCCGTCC ATTAGCGTCT ACCCCAGGTC AAGAACGGAC 720TGGACGGACC CATAACCAAT CTAACCAAAG CCAATTTCGT CAATTCCCAG CTGGCGAGCA 780CAATCCCATT CCCAGGGTTG GCCGCCAACT GTTAAAAGGC ACTATGTGTC TCTCCACCTG 840CCCGCCCCCC TCGATGGCCT GCGCGTAATA ACTATTCTAC TGCTTTTTGC CTCTTACTTG 900CCTCATTATT AGTATTTTAC TCTACTCTCC AGATTGCCTG CCAGCAATTG GTCCAAAGTG 960GACTTTGTTT GATGACATGA CTCGAACCGT GGACGAGATC AAATACGAAA CGCCTTCTTC 1020ATGGGAGCAC AAGAGCTTGG ACGTTGCCGA GGATGGCAGG CGACTAGCTC CCCATTCCGA 1080CACTGCTCGT CCGAAAGGCC GCATACGACG ATCGATGACT GCCTGTCACA CATGTCGGAA 1140GCTTAAAACT AGATGTGATC TAGATCCGCG CGGTCATGCG TGCCGTCGCT GTCTATCTCT 1200AAGGTCAGAG GCACTACCTA CCTGCCAGTT GAAGCTTTGT CCTTCTGAAC GCGACATGAT 1260ACTAGTCGTG GAATATAACT GTCCCAACTT TGCTGACAGT CCACAATATC TTTAGAATCG 1320ATTGTAAGCT GCCTGAAACG ACCGACCGCT TCCAAGACAG TGCTGCGATG TGGCCAGACG 1380CCACCTCGGC AATTCCCTCC ATCGAGGAGC GCCTCACCTC CCTAGAAAGA TGCATGAGGG 1440AGATGACGGG CATGATGCGA CAGATGCTAG ATCACTCCCC AGGTTTCGCA AATGCCTCGG 1500TTCCGCATTT GACCAAAAGC ATCATCACGG ATGAAACCGC CTCGATGGAG GGAAGCCCGT 1560CGTCCCCCTT CCTGCCTAAG CCCGTTCGCC TCATTCAGGA CCTCCAGTCC GACTTCTTCG 1620GAGAAGCAGA GACTTCCCCC GTTGACTCCC CTCTCTCCAG CGATGGTAAC CCCAAGGGCG 1680CTATCGACTC TAAGCTATCC CTCAAATTGT TGCAAACGTA TGGGTATACC TGATTGACAA 1740TTACCAAAAA GCTGCTAATC CTTGGCGCAA ATCAGGTTTG TCGATCACTT TGGCGCTTGC 1800GTTTCCATTT ACAATCTCTC CGACATCCAC AACGACATGA AAGCCCCCGA CTCTTTACTG 1860TATAATACTG CATGCCTTCT AGCTTCACGC TATGTACCGG GGATACCGAC ATCTACCGTG 1920CATGCTATAT ACCTTCAAGT GCGACATGCA GTAGTCAATA TTTTGTGGGA AAAACCACCC 1980CTGAAGTATG AGACCCTCCA AGCACTTGCA CTTCTCTGTC TCTGGCCAGC AACCGCCCAG 2040AAAGAGCCAC CCATGGACAG CTGGCTGCTG AGTGGTATCT CAATTAACCA TGCAATTATC 2100GCGCTCGATT TCCTAAACTA TGCGCCCTCG GAAGTCATGG TGGACAATGA AACGGCTGCG 2160CAGCTGCGGC TATGGAATAC ATATTGCTTG ACACAGCTAC AGTGGGTTTC ATCTAAGATC 2220TCCCGTCCAG AAGATAGCTA ACAAGCTTTA GTTTTGCGGT CGGGAATGCG CGTCCTTTCC 2280ATATCCAGCA AAGATACCTT GACCACTGCC CACGGATACT GGAGCACCCA GCAGCAACTC 2340TGGAGGACGC AAGGGTTGTA GCAGAAATAC AGTTGTATTT GATGACATTG CGGCTCCAGA 2400GCAATAGCAG TCGAATGCGG TTGGCGGACC TTGACTATGA GGAAATAGAG CGATGGAAGA 2460GGGAGTGGGC TCACCTTTTC TGTAAGAAGC CTGTTCTTGT TTCCCGGGGA CTACCACTGA 2520CGAGAGCAAC AGCTGGGGAA AGTTCCACAT TGGAGCTGAG CCTTTGGTTC TGCCAGACAC 2580TCCTTCACCG CACAGCAATG AGGCTTCAGC CCAGATCCGA CAGGCTCGCA TCTGAGGTTC 2640TGCAAACCTC ACGTCTGATA ATATCGCGGT TCCTCCAGAT CCGGTACTCT ACCGCATTAA 2700GCCTTGTCGA CCAAGTCTAT TTCATTGTCG GCTACGCTGC ACTGAATCTG TGCGATTTCA 2760ATCTTATGGA CCCGCTTATC GAGCAAGTGC AGATGTTCCT GCTGCATCTC TCCCCGAACG 2820AAGACCACAT CGCCTACCGG TTTTCGTGCA TGGTCGCCGA GTTCAAGCGG CGATGTGGCA 2880GTGCGGAATG CAATGACCCA TCATCCACTG TCAAGGGGTC TCCGTTATCA TCCTACGGCG 2940ACAGTCGTAA GATGAGCATG GGGCAAGCAC CGTTCATGCC ACCGCTCATG GATGGCATGA 3000TCGAGGGGTA CGGCTTCGAG CAACTGATGC CAGAAGTCAT GCCGAGTTCC TTTCCGGATG 3060GGATACTCAA CGGAATGCCT GTGACTGGGC TAGCAGCGTA TCGGTCAGCG ACGCTGTAAG 3120TAATCGAGAT CGGGTTGGAA AGGACATGAG TGGGGGTGGT GGTGGTAGTA GCAGTAACAC 3180CAGGGATGAT AACCTGCAGC GGTGGTTTAG TTCCTGCCCA TGGGCTGAAC TAAAACCCCG 3240AACCTAGCAT GATGACGTGC AACGAAAGGA TCATAACCAA GGCCAAGTAA ATACTAAAAT 3300AAAATAATAT AATTCCACAC GATCCACTAC CACCACCACC ACCGGATCCA TCAGGTTGCC 3360TTCCTGCACA GGCCTATTTA GTTAGAGGGC CCGTGCCACG AAACATCACG TAATTGAGCG 3420CTTTTGCTTC CTTGCAACTT AAACAACCCC ATAGACACTC TCACATTCAC ATGCCAAACT 3480ACTAACTCCT ACTGACCACC AGCTGCAGGA AGCCAGCCAG CCACCATTTC CTAATCGGAT 3540ATATCTCCGA AACGTACGCT TTCCTCCTTT GTTCGGACCG TTCCGTGCCT CCGCGGAGAG 3600TTGAACGAGT CAGAACACAT TCTTTTCGTT TCTATCGTTT CTTTTCCAAG GCAGCAGAGA 3660GACGAACAAG TCAGTGCTTG CTAACTAACT TACCCCTCAG CATTTTAGTA AACTACTATT 3720TAGGAAAGAG TAATCATTCA TCGAAGACAA GATGTTTATT TCTCCGATCG ACCAAACAAA 3780AACGTTCAGG TAGACTAAGT AGTAGTAGTA GTATGTCTTT GACCCCTTTA CTCCACTATC 3840CGTTGACTGC ACATAGTAGT AAGTAACTAT CTAACCAGTT GCCGAGGAGA GGAAAGTGAG 3900TGGGTGGGAG CCGGAGGATG CCGCCGAGAA TTATTAAGTC GATCATTGCT AGTTAGTTAT 3960CTTTTCATGA TGAGGAGAGG AAGGAGAGGG GGGACGGGAT TAGAGAAATA AACTTTTCTC 4020TCCAATTAAT TATCTGGATT AATTAAAACT TGGAGAGGAG GGTAGGGGAG TTGGGTATTG 4080GTATGTTGCT GTGAATGT 4098(2)SEQ ID NO：2的信息：

(i)序列特征：

(A)长度：666氨基酸s

(B)类型：氨基酸

(C)链型：单链

(D)拓扑构型：线性

(ii)分子类型：肽

(xi)序列描述：SEQ ID NO：2：Met Thr Arg Thr Val Asp Glu Ile Lys Tyr Glu Thr Pro Ser Ser Trp1 5 10 15Glu His Lys Ser Leu Asp Val Ala Glu Asp Gly Arg Arg Leu Ala Pro

20 25 30His Ser Asp Thr Ala Arg Pro Lys Gly Arg Ile Arg Arg Ser Met Thr

35 40 45Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu Asp Pro

50 55 60Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp Cys Lys65 70 75 80Leu Pro Glu Thr Thr Asp Arg Phe Gin Asp Ser Ala Ala Met Trp Pro

85 90 95Asp Ala Thr Ser Ala Ile Pro Ser IIe Glu Glu Arg Leu Thr Ser Leu

100 105 110Glu Arg Cys Met Arg Glu Met Thr Gly Met Met Arg Gln Met Leu Asp

115 120 125His Ser Pro Gly Phe Ala Asn Ala Ser Val Pro His Leu Thr Lys Ser

130 135 140Ile Ile Thr Asp Glu Thr Ala Ser Met Glu Gly Ser Pro Ser Ser Pro145 150 155 160Phe Leu Pro Lys Pro Val Arg Leu Ile Gln Asp Leu Gln Ser Asp Phe

165 170 175Phe Gly Glu Ala Glu Thr Ser Pro Val Asp Ser Pro Leu Ser Ser Asp

180 185 190Gly Ash Ala Lys Gly Ala Ile Asp Ser Lys Leu Ser Leu Lys Leu Leu

195 200 205Gln Thr Phe Val Asp His Phe Gly Ala Cys Val Ser Ile Tyr Asn Leu

210 215 220Ser Asp Ile His Asn Asp Met Lys Ala Pro Asp Ser Leu Leu Tyr Asn225 230 235 240Thr Ala Cys Leu Leu Ala Ser Arg Tyr Val Pro Gly Ile Pro Thr Ser

245 250 255Thr Val His Ala Ile Tyr Leu Gln Val Arg His Ala Val Val Ash Ile

260 265 270Leu Trp Glu Lys Pro Pro Leu Lys Tyr Glu Thr Leu Gln Ala Leu Ala

275 280 285Leu Leu Cys Leu Trp Pro Ala Thr Ala Gln Lys Glu Pro Pro Met Asp

290 295 300Ser Trp Leu Leu Ser Gly Ile Ser Ile Ash His Ala Ile Ile Ala Leu305 310 315 320Asp Phe Leu Asn Tyr Ala Pro Ser Glu Val Met Val Asp Asn Glu Thr

325 330 335Ala Ala Gln Leu Arg Leu Trp Asn Thr Tyr Cys Leu Thr Gln Leu His

340 345 350Phe Ala Val Gly Asn Ala Arg Pro Phe His Ile Gln Gln Arg Tyr Leu

355 360 365Asp His Cys Pro Arg Ile Leu Glu His Pro Ala Ala Thr Leu Glu Asp

370 375 380Ala Arg Val Val Ala Glu Ile Gln Leu Tyr Leu Met Thr Leu Arg Leu385 390 395 400Gln Ser Asn Ser Ser Arg Met Arg Leu Ala Asp Leu Asp Tyr Glu Glu

405 410 415Ile Glu Arg Trp Lys Arg Glu Trp Ala His Leu Phe Cys Lys Lys Pro

420 425 430Val Leu Val Ser Arg Gly Leu Pro Leu Thr Arg Ala Thr Ala Gly Glu

435 440 445Ser Ser Thr Leu Glu Leu Ser Leu Trp Phe Cys Gln Thr Leu Leu His

450 455 460Arg Thr Ala Met Arg Leu Gln Pro Arg Ser Asp Arg Leu Ala Ser Glu465 470 475 480Val Leu Gln Thr Ser Arg Leu Ile Ile Ser Arg Phe Leu Gln Ile Arg

485 490 495Tyr Ser Thr Ala Leu Ser Leu Val Asp Gln Val Tyr Phe Ile Val Gly

500 505 510Tyr Ala Ala Leu Asn Leu Cys Asp Phe Asn Leu Met Asp Pro Leu Ile

515 520 525Glu Gln Val Gln Met Phe Leu Leu His Leu Ser Pro Asn Glu Asp His

530 535 540Ile Ala Tyr Arg Phe Ser Cys Met Val Ala Glu Phe Lys Arg Arg Cys545 550 555 560Gly Ser Ala Glu Cys Asn Asp Pro Ser Ser Thr Val Lys Gly Ser Pro

565 570 575Leu Ser Ser Tyr Gly Asp Ser Arg Lys Met Ser Met Gly Gln Ala Pro

580 585 590Phe Met Pro Pro Leu Met Asp Gly Met Ile Glu Gly Tyr Gly Phe Glu

595 600 605Gin Leu Met Pro Glu Val Met Pro Ser Ser Phe Pro Asp Gly Ile Leu

610 615 620Ash Gly Met Pro Val Thr Gly Leu Ala Ala Tyr Arg Ser Ala Thr Leu625 630 635 640Ser Ser Ash Thr Arg Asp Asp Asn Leu Gln Arg Trp Phe Ser Ser Cys

645 650 655Pro Trp Ala Glu Leu Lys Pro Arg Thr Pro

660 665(2)SEQ ID NO：3的信息：

(i)序列特征：

(A)长度：35氨基酸s

(B)类型：氨基酸

(C)链型：单链

(D)拓扑构型：线性

(ii)分子类型：肽

(xi)序列描述：SEQ ID NO：3：Met Thr Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu1 5 10 15Asp Pro Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp

20 25 30Cys Lys Leu

35(2)SEQ ID NO：4的信息：

(i)序列特征：

(A)长度：2542碱基对

(B)类型：核酸

(C)链型：单链

(D)拓扑构型：线性

(ii)分子类型：其它核酸

(A)描述：/desc＝″PCR片段″

(vi)来源：

(B)菌株：prt13等位基因变体

(xi)序列描述：SEQ ID NO：4：GACATGGATT GGCTGGCCGC CGTGCTGCCG TCCATTAGCG TCTACCCCAG GTCAAGAACG 60GACTGGACGG ACCCATAACC AATCTAACCA AAGCCAATTT CGTCAATTCC CAGCTGGCGA 120GCACAATCCC ATTCCCAGGG TTGGCCGCCA ACTGTTAAAA GGCACTATGT GTCTCTCCAC 180CTGCCCGCCC CCCTCGATGG CCTGCGCGTA ATAACTATTC TACTGCTTTT TGCCTCTTAC 240TTGCCTCATT ATTAGTATTT TACTCTACTC TCCAGATTGC CTGCCAGCAA TTGGTCCAAA 300GTGGACTTTG TTTGATGACA TGACTCGAAC CGTGGACGAG ATCAAATACG AAACGCCTTC 360TTCATGGGAG CACAAGAGCT TGGACGTTGC CGAGGATGGC AGGCGACTAG CTCCCCATTC 420CGACACTGCT CGTCCGAAAG GCCGCATACG ACGATCGATG ACTGCCTGTC ACACATGTCG 480GAAGCTTAAA ACTAGATGTG ATCTAGATCC GCGCGGTCAT GCGTGCCGTC GCTGTCTATC 540TCTAAGGTCA GAGGCACTAC CTACCTGCCA GTTGAAGCTT TGTCCTTCTG AACGCGACAT 600GATACTAGTC GTGGAATATA ACTGTCCCAA CTTTGCTGAC AGTCCACAAT ATCTTTAGAA 660TCGATTGTAA GCTGCCTGAA ACGACCGACC GCTTCCAAGA CAGTGCTGCG ATGTGGCCAG 720ACGCCACCTC GGCAATTCCC TCCATCGAGG AGCGCCTCAC CTCCCTAGAA AGATGCATGA 780GGGAGATGAC GGGCATGATG CGACAGATGC TAGATCACTC CCCAGGTTTC GCAAATGCCT 840CGGTTCCGCA TTTGACCAAA AGCATCATCA CGGATGAAAC CGCCTCGATG GAGGGAAGCC 900CGTCGTCCCC CTTCCTGCCT AAGCCCGTTC GCCTCATTCA GGACCTCCAG TCCGACTTCT 960TCGGAGAAGC AGAGACTTCC CCCGTTGACT CCCCTCTCTC CAGCGATGGT AACGCCAAGG 1020GCGCTATCGA CTCTAAGCTA TCCCTCAAAT TGTTGCAAAC GTATGGGTAT ACCTGATTGA 1080CAATTACCAA AAAGCTGCTA ATCCTTGGCG CAAATCAGGT TTGTCGATCA CTTTGGCGCT 1140TGCGTTTCCA TTTACAATCT CTCCGACATC CACAACGACA TGAAAGCCCC CGACTCTTTA 1200CTGTATAATA CTGCATGCCT TCTAGCTTCA CGCTATGTAC CGGGGATACC GACATCTACC 1260GTGCATGCTA TATACCTTCA AGTGCGACAT GCAGTAGTCA ATATTTTGTG GGAAAAACCA 1320CCCCTGAAGT ATGAGACCCT CCAAGCACTT GCACTTCTCT GTCTCTGGCC AGCAACCGCC 1380CAGAAAGAGC CACCCATGGA CAGCTGGCTG CTGAGTGGTA TCTCAATTAA CCATGCAATT 1440ATCGCGCTCG ATTTCCTAAA CTATGCGCCC TCGGAAGTCA TGGTGGACAA TGAAACGGCT 1500GCGCAGCTGC GGCTATGGAA TACATATTGC TTGACACAGC TACAGTGGGT TTCATCTAAG 1560ATCTCCCGTC CAGAAGATAG CTAACAAGCT TTAGTTTTGC GGTCGGGAAT GCGCGTCCTT 1620TCCATATCCA GCAAAGATAC CTTGACCACT GCCCACGGAT ACTGGAGCAC CCAGCAGCAA 1680CTCTGGAGGA CGCAAGGGTT GTAGCAGAAA TACAGTTGTA TTTGATGACA TTGCGGCTCC 1740AGAGCAATAG CAGTCGAATG CGGTTGGCGG ACCTTGACTA TGAGGAAATA GAGCGATGGA 1800AGAGGGAGTG GGCTCACCTT TTCTGTAAGA AGCCTGTTCT TGTTTCCCGG GGACTACCAC 1860TGACGAGAGC AACAGCTGGG GAAAGTTCCA CATTGGAGCT GAGCCTTTGG TTCTGCCAGA 1920CACTCCTTCA CCGCACAGCA ATGAGGCTTC AGCCCAGATC CGACAGGCTC GCATCTGAGG 1980TTCTGCAAAC CTCACGTCTG ATAATATCGC GGTTCCTCCA GATCCGGTAC TCTACCGCAT 2040TAAGCCTTGT CGACCAAGTC TATTTCATTG TCGGCTACGC TGCACTGAAT CTGTGCGATT 2100TCAATCTTAT GGACCCGCTT ATCGAGCAAG TGCAGATGTT CCTGCTGCAT CTCTCCCCGA 2160ACGAAGACCA CATCGCCTAC CGGTTTTCGT GCATGGTCGC CGAGTTCAAG CGGCGATGTG 2220GCAGTGCGGA ATGCAATGAC CCATCATCCA CTGTCAAGGG GTCTCCGTTA TCATCCTACG 2280GCGACAGTCG TAAGATGAGC ATGGGGCAAG CACCGTTCAT GCCACCGCTC ATGGATGGCA 2340TGATCGAGGG GTACGGCTTC GAGCAACTGA TGCCAGAAGT CATGCCGAGT TCCTTTCCGG 2400ATGGGATACT CAACGGAATG CCTGTGACTG GGCTAGCAGC GTATCGGTCA GCGACGCTGT 2460AAGTAATCGA GATCGGGTTG GAAAGGACAT GAGTGGGGGT GGTGGTGGTA GTAGCAGTAA 2520CACCAGGGAT GATAACCTGC AG 2542(2)SEQ ID NO：5的信息：

(i)序列特征：

(A)长度：665氨基酸s

(B)类型：氨基酸

(C)链型：单链

(D)拓扑构型：线性

(ii)分子类型：肽

(vi)来源：

(B)菌株：prtl3基因产物

(xi)序列描述：SEQ ID NO：5：Met Thr Arg Thr Val Asp Glu Ile Lys Tyr Glu Thr Pro Ser Ser Trp1 5 10 15Glu His Lys Ser Leu Asp Val Ala Glu Asp Gly Arg Arg Leu Ala Pro

20 25 30His Ser Asp Thr Ala Arg Pro Lys Gly Arg Ile Arg Arg Ser Met Thr

35 40 45Ala Cys His Thr Cys Arg Lys Leu Lys Thr Arg Cys Asp Leu Asp Pro

50 55 60Arg Gly His Ala Cys Arg Arg Cys Leu Ser Leu Arg Ile Asp Cys Lys65 70 75 80Leu Pro Glu Thr Thr Asp Arg Phe Gln Asp Ser Ala Ala Met Trp Pro

85 90 95Asp Ala Thr Ser Ala Ile Pro Ser Ile Glu Glu Arg Leu Thr Ser Pro

100 105 110Glu Arg Cys Met Arg Glu Met Thr Gly Met Met Arg Gln Met Leu Asp

115 120 125His Ser Pro Gly Phe Ala Asn Ala Ser Val Pro His Leu Thr Lys Ser

165 170 175Phe Gly Glu Ala Glu Thr Ser Pro Val Asp Ser Pro Leu Ser Ser Asp

180 185 190Gly Asn Ala Lys Gly Ala Ile Asp Ser Lys Leu Ser Leu Lys Leu Leu

195 200 205Gln Thr Phe Val Asp His Phe Gly Ala Cys Val Ser Ile Tyr Asn Leu

210 215 220Ser Asp Ile His Asn Asp Met Lys Ala Pro Asp Ser Leu Leu Tyr Ash225 230 235 240Thr Ala Cys Leu Leu Ala Ser Arg Tyr Val Pro Gly Ile Pro Thr Ser

245 250 255Thr Val His Ala Ile Tyr Leu Gln Val Arg His Ala Val Val Asn Ile

260 265 270Leu Trp Glu Lys Pro Pro Leu Lys Tyr Glu Thr Leu Gln Ala Leu Ala

275 280 285Leu Leu Cys Leu Trp Pro Ala Thr Ala Gln Lys Glu Pro Pro Met Asp

290 295 300Ser Trp Leu Leu Ser Gly Ile Ser Ile Asn His Ala Ile Ile Ala Leu305 310 315 320Asp Phe Leu Ash Tyr Ala Pro Ser Glu Val Met Val Asp Asn Glu Thr

325 330 335Ala Ala Gln Leu Arg Leu Trp Ash Thr Tyr Cys Leu Thr Gln Leu His

340 345 350Phe Ala Val Gly Ash Ala Arg Pro Phe His Ile Gln Gln Arg Tyr Leu

355 360 365Asp His Cys Pro Arg Ile Leu Glu His Pro Ala Ala Thr Leu Glu Asp

405 410 415Ile Glu Arg Trp Lys Arg Glu Trp Ala His Leu Phe Cys Lys Lys Pro

420 425 430Val Leu Val Ser Arg Gly Leu Pro Leu Thr Arg Ala Thr Ala Gly Glu

435 440 445Ser Ser Thr Leu Glu Leu Ser Leu Trp Phe Cys Gln Thr Leu Leu His

485 490 495Tyr Ser Thr Ala Leu Ser Leu Val Asp Gln Val Tyr Phe Ile Val Gly

500 505 510Tyr Ala Ala Leu Asn Leu Cys Asp Phe Ash Leu Met Asp Pro Leu Ile

515 520 525Glu Gln Val Gln Met Phe Leu Leu His Leu Ser Pro Asn Glu Asp His

565 570 575Leu Ser Ser Tyr Gly Asp Ser Arg Lys Met Ser Met Gly Gln Ala Pro

580 585 590Phe Met Pro Pro Leu Met Asp Gly Met Ile Glu Gly Tyr Gly Phe Glu

595 600 605Gin Leu Met Pro Glu Val Met Pro Ser Ser Phe Pro Asp Gly Ile Leu

610 615 620Asn Gly Met Pro Val Thr Gly Leu Ala Ala Tyr Arg Ser Ala Thr Leu625 630 635 640Ser Ser Asn Thr Arg Asp Asp Asn Leu Gln Arg Trp Phe Ser Ser Cys

645 650 655Pro Trp Ala Glu Leu Lys Pro Arg Thr

660 665

Claims

1.分离的核酸序列，其编码一种具有转录激活活性的多肽，其选自：

(a)与SEQ ID NO：1的核酸序列有至少70％的同一性的核酸序列；

(d)(a)、(b)或(c)的等位基因变体；

2.权利要求1的核酸序列，其与SEQ ID NO：1的核酸序列具有至少70％，优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，甚至最优选至少97％的同一性。

3.权利要求1的核酸序列，其具有SEQ ID NO：1的核酸序列。

4.权利要求1至3中任何一个的核酸序列，其编码一种多肽，所述多肽包括的氨基酸序列与SEQ ID NO：2的氨基酸序列具有至少50％，优选至少60％，优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％的同一性。

5.权利要求1至4中任何一个的核酸序列，其中所述的核酸序列获自真菌细胞或酵母细胞。

6.权利要求5的核酸序列，其中所述的真菌细胞为丝状真菌细胞。

7.权利要求6的核酸序列，其中所述的丝状真菌细胞为曲霉属、镰刀菌属、青霉属或木霉属细胞。

8.权利要求7的核酸序列，其中所述的曲霉属细胞为黑曲霉或米曲霉的菌株，或者它们的同物异名或有性型。

9.权利要求8的核酸序列，其中所述的曲霉细胞为黑曲霉DSM 12298菌株。

10.权利要求7的核酸序列，其中所述的镰刀菌属细胞为Fusariumvenenatum的菌株，或者其同物异名或有性型。

11.权利要求5的核酸序列，其中所述的酵母细胞为汉森酵母属、毕赤酵母属或酵母属细胞。

12.权利要求1至11中任何一个的核酸序列，其编码一种多肽，所述多肽包括SEQ ID NO：2的氨基酸序列或其一个片段，其具有转录激活活性。

13.权利要求1至11中任何一个的核酸序列，其编码一种多肽，所述多肽包括SEQ ID NO：3的氨基酸序列。

14.权利要求1至13中任何一个的核酸序列，其在低严谨度条件下，优选中等严谨度条件下，更优选高严谨度条件下与(i)在SEQ IDNO：1中所列的核酸序列或者(ii)相应的互补链或其子序列杂交。

15.权利要求14的核酸序列，其中将低严谨度定义为于42℃在5×SSPE、0.3％SDS、200mg/m1剪切并变性的鲑鱼精DNA以及25％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；将中等严谨度定义为于42℃在5×SSPE、0.3％SDS、200mg/ml剪切并变性的鲑鱼精DNA以及35％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于60℃在2×SSC、0.2％SDS中洗涤30分钟；而将高严谨度定义为于42℃在5×SSPE、0.3％SDS、200mg/ml剪切并变性的鲑鱼精DNA以及50％的甲酰胺中预杂交和杂交，并将洗涤条件定义为于70℃在2×SSC、0.2％SDS中洗涤30分钟。

16.权利要求1至15中任何一个核酸序列，其包括编码一种包含在质粒pEES中具有转录激活活性的多肽的核酸序列，所述的质粒pEES位于大肠杆菌DSM 12294内。

17.核酸构建体，其包括权利要求1至16中任何一个的核酸序列，所述的核酸序列可操作地连接于一个或多个在适当的表达宿主中指导所述多肽的产生的调控序列。

18.表达载体，其包括权利要求17的核酸序列、启动子以及转录和翻译终止信号。

19.宿主细胞，其包括权利要求17的核酸构建体或者权利要求18的表达载体。

20.分离的多肽，其选自：

(a)一种多肽，在一种核酸序列中对其进行编码，所述的核酸序列在低严谨度条件下与(i)SEQID NO：1的核酸序列；(ii)其互补链，或(iii)SEQ ID NO：1中编码具有转录激活活性的多肽片段的子序列杂交，其中将低严谨度条件定义为于42℃在5×SSPE、0.3％SDS、200μg/mi剪切并变性的鲑鱼精DNA和25％甲酰胺中预杂交和杂交，并将洗涤条件定义为于50℃在2×SSC、0.2％SDS中洗涤30分钟；

(c)(a)或(b)的等位基因变体；

(d)(a)、(b)或(c)的片段，其中所述的片段具有转录激活活性；以及

(e)一种包括SEQ ID NO：3的氨基酸序列的多肽或者其等位基因变体。

21.权利要求20的多肽，其包括的氨基酸序列与SEQ ID NO：2的氨基酸序列具有至少50％，优选至少60％，优选至少70％，更优选至少80％，还更优选至少90％，而最优选至少95％的同一性。

22.权利要求20或21的多肽，其包括SEQ ID NO：2的氨基酸序列或其一个片段，其中所述的片段保留有转录激活活性。

23.权利要求20至22中任何一个的多肽，在包含于质粒pEES内的核酸序列中对其进行编码，所述的质粒pEES包含于大肠杆菌DSM12294内。

24.权利要求20至23中任何一个的多肽，其包括SEQ ID NO：3的氨基酸序列。

25.用于制备权利要求20至24中任何一个多肽的方法，其包括(a)在有助于所述多肽制备的条件下对权利要求19的宿主细胞进行培养；和(b)回收该多肽。

26.有效制备多肽的真菌宿主细胞，其中所述的细胞：

(a)为亲代真菌细胞的突变体，其中亲代细胞包括一个或多个编码蛋白酶的DNA序列，所述DNA序列的转录由权利要求1至16中任一核酸序列所编码的转录激活因子激活；而且

(b)在相同的条件下培养时，突变细胞产生少于亲代细胞的转录激活因子和蛋白酶。

27.权利要求26的宿主细胞，其中所述转录激活因子产量的降低是通过对细胞内存在的而且是该转录激活因子表达所必需的核酸序列进行修饰或灭活来获得的。

28.权利要求26或27的宿主细胞，其中所述转录激活因子产量的降低是通过对所述多肽表达所需的调控序列进行修饰或灭活来获得的。

29.权利要求28的宿主细胞，其中所述的调控序列为启动子序列或其功能性部分。

30.权利要求26至29中任何一个的宿主细胞，其中待修饰或灭活的核酸序列为在权利要求1至16任何一个中所定义的序列。

31.权利要求26至30中任何一个的宿主细胞，其中所述的修饰或灭活是通过特异性诱变或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或置换、基因阻断或基因置换技术、反义技术或它们的组合来进行的。

32.有效用于制备多肽的真菌宿主细胞，其中所述的宿主细胞为亲代细胞的突变体，其中该突变体：

(a)在相同的条件下培养时产生比亲代细胞多的由权利要求1至16中任一核酸序列所编码的转录激活因子；而且

(b)包括编码所述多肽的DNA序列，其转录被所述的转录激活因子激活。

33.权利要求32的宿主细胞，其中通过向亲代细胞中引入一个或多个拷贝的(i)权利要求1至16中任何一个的核酸序列，(ii)权利要求17的核酸构建体或者(iii)权利要求18的表达载体，使所述的宿主细胞产生比亲代细胞多的转录激活因子，由此当在相同条件下培养时，所述宿主细胞产生的所述多肽比亲代细胞多。

34.权利要求32或33的宿主细胞，其中将编码转录激活因子的核酸序列可操作地与一启动子相连，所述的启动子比亲代细胞的相应启动子强。

35.权利要求34的宿主细胞，其中所述的启动子介导一种细胞外蛋白酶的编码基因表达，优选为米曲霉碱性蛋白酶、米曲霉中性金属蛋白酶、黑曲霉曲霉胃蛋白酶、尖孢镰刀菌胰蛋白酶样蛋白酶或者Fusarium venenatum胰蛋白酶。

36.有效用于制备多肽的真菌宿主细胞，其中所述的细胞为亲代细胞的突变体，其中该突变体包括

(a)对转录激活因子或其调控序列的修饰或灭活，所述的转录激活因子由权利要求1至16中任一固有的核酸序列编码，以及

(b)(i)可操作地与权利要求1至16中任一核酸序列相连的诱导性启动子，和(ii)由权利要求1至16中任一核酸序列所编码的转录激活因子可以结合的启动子序列，其可操作地与编码所述多肽的核酸序列相连，其中(i)和(ii)可以被同时或先后引入。

37.权利要求36的宿主细胞，其中通过特异性诱变或随机诱变、定点诱变、PCR产生的诱变、核苷酸插入和/或置换、基因阻断或基因置换技术、反义技术或它们的组合来对所述的固有核酸序列或其调节序列进行修饰或灭活。

38.权利要求36或37的宿主细胞，其中所述的诱导性启动子选自由碳或氮的分解代谢产物来介导其诱导的启动子。

39.权利要求33至38中任一个的宿主细胞，其还包括一个启动子序列，其中所述的启动子序列可以被所述转录激活因子激活，而且该序列可操作地与编码所述多肽的核酸序列相连。

40.权利要求33至39中任何一个的宿主细胞，其中所述的启动子序列或其功能性部分来自一种蛋白酶基因。

41.权利要求33至40中任何一个宿主细胞，其中所述的蛋白酶基因为尖孢镰刀菌胰蛋白酶样蛋白酶基因、米曲霉碱性蛋白酶基因、黑曲霉pacA基因、米曲霉碱性蛋白酶基因、米曲霉中性金属蛋白酶基因、黑曲霉曲霉胃蛋白酶基因或者Fusarium venenatum胰蛋白酶基因。

42.权利要求26至41中任何一个的宿主细胞，其中所述的宿主细胞包括至少一个拷贝的编码所述多肽的核酸序列。

43.权利要求26至42中任何一个宿主细胞，其中在相同条件下培养时所述的宿主细胞产生比亲代细胞少的固有蛋白酶或固有蛋白酶组合。

44.权利要求26至43中任何一个宿主细胞，其中通过在pH4下对³H-标记的抹香鲸肌球蛋白的降解对所述蛋白酶的活性进行检测。

45.制备多肽的方法，其包括：

(a)在适于所述多肽产生的营养培养基中对权利要求26至44中任何一个的宿主细胞进行培养，其中所述的宿主细胞携有编码所述多肽的基因；和

(b)从突变细胞的营养培养基中回收所述的多肽。

46.权利要求45的方法，其中所述的多肽对所述亲代细胞是固有的。

47.权利要求45的方法，其中所述的多肽对所述亲代细胞是异源的。

48.权利要求45的方法，其中所述的多肽为抗体或其部分、抗原、凝血因子、酶、激素或激素变体、受体或其部分、调控蛋白、结构蛋白、报告蛋白或转运蛋白。

49.权利要求48的方法，其中所述的酶为氧化还原酶、转移酶、水解酶、裂解酶、异构酶或连接酶。

50.权利要求49的方法，其中所述的酶为氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、脱氧核糖核酸酶、葡聚糖酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-糖苷酶、β-糖苷酶、卤过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、mutanase、氧化酶、果胶裂解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、谷氨酰胺转移酶或木聚糖酶。