CN101039955A - 与sars冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物 - Google Patents

与sars冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物 Download PDF

Info

Publication number
CN101039955A
CN101039955A CN 200580026090 CN200580026090A CN101039955A CN 101039955 A CN101039955 A CN 101039955A CN 200580026090 CN200580026090 CN 200580026090 CN 200580026090 A CN200580026090 A CN 200580026090A CN 101039955 A CN101039955 A CN 101039955A
Authority
CN
China
Prior art keywords
thr
leu
polypeptide
ser
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200580026090
Other languages
English (en)
Inventor
拉尔夫·阿尔特迈尔
贝亚特丽斯·纳尔-罗吉耶
陈澈曼
弗朗索瓦·基恩
甘耀永
肖雨岚
谢空山
伊莎贝尔·斯塔罗波利
让-克洛德·马努圭拉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institut Pasteur de Lille
Pasteur Research Center HKU
Original Assignee
Institut Pasteur de Lille
Pasteur Research Center HKU
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institut Pasteur de Lille, Pasteur Research Center HKU filed Critical Institut Pasteur de Lille
Publication of CN101039955A publication Critical patent/CN101039955A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本发明披露了与SARS冠状病毒(SARS CoV)刺突蛋白相关的核酸分子、多肽、免疫原性组合物、疫苗和制备及使用所述核苷酸和所编码的多肽的方法。

Description

与SARS冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物
相关申请
本申请要求申请日为2004年6月4日的美国专利申请No.10/860,641和申请日为2004年6月10日的美国临时专利申请No.60/578,348的优先权,在此通过引用将上述申请并入本申请。2005年5月23日提交了将美国专利申请No.10/860,641变更为临时申请的请求。
技术领域
本发明涉及纯化的和分离的核酸、多肽、纯化的和分离的多肽、编码此类多肽的核酸、产生重组形式的此类多肽的方法、针对这些多肽所产生的抗体、以及此类核酸和多肽在诊断方法、试剂盒、免疫原性组合物、疫苗或抗病毒治疗中的用途。
背景技术
2002年,中国南方的广东省出现了一种新的感染性疾病,称为严重急性呼吸综合征(SARS)。SARS在29个国家中发生传播,据报道有8,098人受累,并造成774人死亡(Stadler et al.)。虽然已经通过严格的隔离检疫措施遏制了SARS疫情,但并不知道SARS何时或是否将在人群中再次出现。
SARS的主要特征为流感样综合征,包括高热超过100.4、肌痛、干咳呼吸困难、低淋巴细胞血症、以及胸部X线上的侵润(Stadler et al.)。所有病例中有38%因出现了导致急性呼吸障碍的肺炎而需要人工呼吸机。总体死亡率大约为10%,但随年龄的不同而变化明显,因为SARS在儿童人群中似乎较轻,但在年长者中的死亡率则高达50%。
引起SARS的是由一种以前未知的冠状病毒(CoV),冠状病毒是一多样化的大的、有包膜病毒群,在人和动物中引起呼吸道和肠道疾病。SARS CoV分离自接种了来自患者的临床标本的FRhK-4细胞和Vero E6细胞,而接种了这种病毒的猕猴出现了类似于在SARS的人类病例中所观察到的那些症状。迄今为止,已经分离并测序了超过30种不同的SARSCoV。
SARS CoV含有大约30kB的RNA基因组(Accession No.AY310120),并具有冠状病毒的许多典型的特征。核苷酸1-72含有推定的RNA前导序列,其位于跨越192个核苷酸的非翻译区(UTR)之前。位于UTR下游的是两个重叠的可读框,它们覆盖了大约2/3的基因组(核苷酸265-21485),并编码蛋白酶以及复制和转录所需的蛋白质(综述可参见Stadler et al.,2004)。基因组余下所3′部分编码4种结构蛋白,这些蛋白在所有CoV中均以相同的顺序排列:刺突(Spike)蛋白、包膜蛋白、膜糖蛋白、和核壳蛋白。SARS CoV基因组的结构蛋白区域还编码称为“附属基因(accessory gene)”的额外的非结构蛋白。尽管SARS CoV基因组的总体组织结构类似于其他冠状病毒,但所编码的蛋白质的氨基酸保守性通常较低。
刺突蛋白形成冠状病毒所特有的大的表面突出物。刺突被大量糖基化,具有1,255个氨基酸,含有位于氨基端的球形头部、紧邻的是茎部、单一的跨膜区、以及短的胞浆尾部(参见Stadler et al.)。
尽管有报道认为β-干扰素在体外干扰SARS病毒的复制,但现在还没有批准任何药物或疫苗。此外,在现有的抗病毒剂或者大的化学剂文库中大规模筛查潜在的复制抑制剂的工作目前还没有成果。实际上,在首诊时要确诊SARS也几乎是不可能的,因为现有检测方法的敏感性和特异性会随着发生接触或出现症状之后的时间推移而变化(参见Raineret al.)。目前还没有任何简便、快速、准确的检测方法能够在发病第一周内诊断SARS,也没有能够在采集样品后的数小时内给出结果的方法。鉴于这些原因,十分需要进一步详细了解SARS CoV蛋白。这样的了解能够为治疗或者控制这种感染提供有效的手段,且有助于对人类的SARSCoV感染进行诊断。
发明内容
因此,本发明的目的在于满足现有技术中的上述需求。本发明包括一种纯化的核酸分子,其包含SEQ ID NO:2、SEQ ID NO:3、或SEQ IDNO:6的DNA序列。本发明还包括与上述序列互补的核酸分子,例如全长的互补序列。
本发明包括那些包含SEQ ID NO:2、SEQ ID NO:3、或SEQ ID NO:6的DNA序列的双链核酸分子和编码SEQ ID NO:4或SEQ ID NO:7的氨基酸序列的纯化的核酸分子。本发明既包括单链的也包括双链的RNA和DNA核酸分子。这些分子可用于检测本发明所包括的单链和双链RNA和DNA。双链DNA探针能够检测与所述核酸分子的任一链等价的核酸分子。
那些在高严格性条件下与包含SEQ ID NO:2、SEQ ID NO:3、或SEQID NO:6的DNA序列的变性的双链DNA、或者与编码SEQ ID NO:4或SEQ ID NO:7的氨基酸序列的纯化的核酸分子杂交的纯化的核酸分子,包括在本发明的范围内。
本发明还包括通过体外诱变而自SEQ ID NO:1-3和6衍生的纯化的核酸分子。体外诱变包括本领域已知的多种技术,包括但不限于,定点诱变、随机诱变和体外核酸合成。
本发明的核酸分子包括DNA和RNA,这些核酸分子在此称为“刺突核酸(Spike nucleic acids)”或者“刺突DNA(Spike DNA)”,由这些分子编码的氨基酸序列在此称为“刺突多肽”或者“刺突蛋白”。
本发明还包括因遗传密码简并性而自SEQ ID NO:1-3和6简并得到的纯化的核酸分子、作为刺突核酸的等位基因变体或者刺突核酸的同系物的纯化的核酸分子。
本发明包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸。
本发明还包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸,其中至少一种负顺式作用信号已经被置换,而这并未改变所编码的蛋白质的序列。本发明包括的负顺式作用信号包括但不限于富含AU的RNA不稳定性基序、重复序列、二级序列段(secondary stretch)、剪接供体和受体位点,和内部poly(A)位点。
本发明还包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸分子,其中通过增加表达增强序列而增强表达。表达增强序列包括但不限于起始ATG上游的Kozak共有序列以及额外的STOP密码子。
本领域技术人员基于现有技术能够了解如何将Kozak共有序列置于合适的位置。
本发明还包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸分子,其中密码子的使用已经根据中国仓鼠(Cricetulus griseus)的偏好进行优化。
本发明还包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸分子,其中所述纯化的核酸分子的编码刺突蛋白的部分与SEQID NO:1相比,其GC含量百分比增加至少大约10%,且其中在可能的情况下已经避免出现GC含量极高(>80%)或者极低(<30%)的区域。
本发明还包括与SEQ ID NO:1相比显示出增强的刺突蛋白表达的纯化的核酸分子,其中所述至少一种负顺式作用信号的置换和其中所述至少一种额外的表达增强序列不包括:内部TATA盒、chi位点、和核糖体进入位点;富含AT或者富含GC的序列段(sequence stretches);重复序列和RNA二级结构;和剪接供体和受体位点。
本发明还包括由这些核酸分子编码的纯化的多肽,包括所述纯化的多肽的糖基化和非糖基化形式。
本发明还包括指导这些核酸分子表达的重组载体以及用这些载体转化或者转染的宿主细胞。
本发明包括与刺突多肽结合的纯化的多克隆或单克隆抗体,例如中和抗体。
本发明还包括制备刺突多肽的方法,包括在促进表达的条件下培养宿主细胞,并自培养基中收集所述多肽。本发明尤其包括在动物细胞中表达刺突多肽。
本发明还包括标记的刺突多肽。优选地,所述标记的多肽是纯化的形式。同样优选的是,未标记的或者标记的所述多肽能够被含有抗刺突多肽抗体的人的体液免疫学识别。所述多肽可以用例如选自以下一组的免疫测定标记物进行标记:放射性标记物、酶性标记物、荧光标记物、化学发光标记物、以及发色团。
本发明还提供了本发明的刺突多肽与识别所述多肽的抗体之间的免疫复合物。所述免疫复合物可以用选自以下一组的免疫测定标记物进行标记:放射性标记物、酶性标记物、荧光标记物、化学发光标记物、以及发色团。
此外,本发明提供用于检测SARS CoV感染的方法。所述方法包括提供包含疑似感染了SARS CoV的生物学材料的组合物,并测定SARSCoV刺突多肽的存在。所述多肽通常是通过电泳或者通过使用与本发明的刺突多肽具有免疫学反应性的抗体的免疫测定法进行测定。
本发明还提供体外诊断方法,其用于检测是否存在结合包含本发明的刺突多肽的抗原的抗体。所述方法包括将所述抗原与生物学液体相接触,接触的时间和条件足以使得所述抗原与生物学液体中的抗体形成抗原抗体复合物,然后检测所述复合物的形成。检测步骤可进一步包括测量所述抗原抗体复合物的形成。优选地通过基于蛋白印迹技术、ELISA(酶联免疫吸附测定法)、FACS、间接免疫荧光测定法、或免疫沉淀测定法的免疫测定法测量抗原抗体复合物的形成。
本发明还包括诊断试剂盒,其用于检测是否存在与本发明的刺突多肽结合的抗体,所述试剂盒含有包含所述刺突多肽的抗原,以及用于检测所述抗原与抗体之间形成免疫复合物的试剂。其中所述抗原和所述试剂的量足以进行所述检测。
本发明还提供一种免疫原性组合物,其包含本发明的刺突多肽或其混合物以及药用可接受的载体,所述刺突多肽或其混合物的量足以在体内诱导免疫原性或保护性应答。免疫原性组合物可含有Alum佐剂。本发明的疫苗组合物包含中和量的刺突多肽以及药用可接受的载体。
因此,本发明的多肽可作为诊断组合物的一部分,以检测是否存在抗与SARS CoV相关的抗原性蛋白质的抗体。
此外,刺突多肽还可用于产生检测是否存在与SARS CoV相关的抗原性蛋白质的抗体。
本发明的多肽还可用于产生中和抗体,这些中和抗体要么灭活病毒,要么降低病毒在体内的活力,要么抑制或者阻断病毒的复制。当将本发明的多肽用于免疫组合物或者预防接种组合物以便在受者宿主体内激活免疫应答的B细胞分支或者诱导细胞毒T淋巴细胞应答(CTL)时,这种引发病毒中和抗体的能力是特别重要的。
本发明还涉及用于对人和哺乳动物进行抗SARS CoV免疫接种的疫苗组合物,其包含上述免疫原性组合物并组合一种或者多种药用可接受的赋形剂(例如盐水缓冲液),并任选地组合至少一种佐剂,例如氢氧化铝或者属于胞壁酰肽家族的化合物。
本发明还包括用于检测是否存在SARS CoV的方法,包括:
(1)将疑似含有SARS CoV的病毒遗传物质的样品与至少一种核苷酸探针相接触,和
(2)检测所述核苷酸探针与所述样品中的病毒遗传物质之间的杂交,
其中所述核苷酸探针互补于本发明的纯化的刺突核酸的全长序列。
本发明的其他特征和优势,其部分内容将在随后的说明书中进行阐述,而部分内容基于说明书将是显而易见的,或者可通过实践本发明而得知。本发明的目的和优越之处可通过如所附权利要求书中所指出的那些元素和组合而实现或获得。
应当理解的是,无论是前面的一般性描述还是随后的详细描述,均仅用于示例和解释本发明,而无意于对要求保护的发明进行限制。
附图说明
所附附图作为说明书的一部分,其举例说明了本发明的一些实施方式,这些附图与文字描述共同用于解释本发明的原则。
图1所示为Spike-HKU-PRC在转染的293T细胞中的表达。泳道1代表以pcDNA-Spike-Pasteur转染的细胞,泳道2代表以pcDNA-HKU-PRC转染的细胞,泳道3代表以SFV-Spike-Pasteur-modif转染的细胞,泳道4是空的,泳道5代表来自转染的BHK细胞的纯化的刺突(Spike)。
图2所示为用于RNA和蛋白质免疫接种的、具有Flag肽序列的SARSCoV刺突蛋白序列(SEQ ID NO:5),以标准的单字母缩写表示。阴影部分为相应于SARS CoV刺突蛋白的序列,下划线部分是包括Flag肽的序列。该代表序列在Semliki Forest Virus(SFV)载体中表达。
图3是以标记的SFV-Spike脉冲-追加式(pulse-chase)感染的BHK细胞经M2(Flag)抗体免疫沉淀后的SDS-PAGE图。在追加后的指定时间点收集细胞。“*”代表高甘露糖N-聚糖EndoH敏感性刺突,“O”代表复合N-聚糖EndoH抵抗性刺突,而“#”高甘露糖N-聚糖EndoH敏感性去糖基化的刺突。
图4所示为感染了SFV Spike的BHK细胞质膜上的Spike的表达情况。以M2抗体对刺突蛋白进行标记,同时以Erp72单克隆抗体对内质网(ER)进行染色。
图5是Western印迹分析,其显示SARS CoV蛋白结合sACE2受体。将以Spike(泳道1和4)包被的M2珠或作为对照的以BAP包被的M2珠(泳道3和6)与sACE2进行温育并进行SDS凝胶电泳,然后以抗ACE2抗体或者作为对照以Mab M2进行Western印迹。尽管反应中既存在Spike也存在BAP蛋白(泳道4和6),但仅有Spike结合ACE2(泳道1和3)。
图6显示以重组的免疫纯化的SARS CoV刺突蛋白进行免疫接种的小鼠产生抗重组Spike的抗体。使用1∶100稀释的混和小鼠血清(n=5)进行Western印迹。泳道1和2分别代表使用来自对照动物(CTRL)和接种Spike的动物(VACC)的免疫前血清进行的Western印迹。泳道3和4分别代表使用来自CTRL和VACC组的第34天的血清进行的Western印迹,而泳道5和6分别代表使用来自CTRL和VACC组的第42天的血清进行的Western印迹。泳道7代表人SARS患者的血清,泳道8代表一种商品化的来自以刺突蛋白免疫的兔的血清(1∶50稀释)。
图7显示以重组的免疫纯化的SARS CoV刺突蛋白进行免疫接种的小鼠产生抗重组Spike的抗体。使用1∶50稀释的混和小鼠血清(n=5)进行FACS分析。右侧是作为对照的SARS病人血清。
图8显示以重组的免疫纯化的SARS CoV刺突蛋白进行免疫接种的小鼠产生抗SARS CoV的抗体。使用1∶50稀释的混和小鼠血清(n=5)在感染了SARS CoV的FRHK4细胞或者假感染的FRHK4细胞上进行免疫荧光分析。
图9(A)、9(B)、和9(C)显示了Spike-Pasteur的核酸序列(SEQ IDNO:1)。各个Spe I位点以下划线标示,阴影标示的是进行取代以形成Spike-Pasteur-modif的核酸残基。
图10(A)、10(B)、和10(C)显示了Spike-Pasteur-modif的核酸序列(SEQ ID NO:2)。阴影标示的突变造成Spe I位点自Spike-Pasteur中消除。
图11(A)、11(B)、11(C)、11(D)、11(E)、和11(F)显示了Spike-HKU-PRC的核酸序列(SEQ ID NO:3)及其互补链。阴影标示的核酸序列编码刺突多肽。图11(A)、11(B)、11(C)、11(D)、11(E)、和11(F)还显示了融合于Flag肽的Spike的氨基酸序列(SEQ ID NO:4)。STOP密码子以星号标示。
图12(A)和12(B)显示了Spike-HKU-PRC内的编码SARS CoV刺突多肽的优化的核酸序列(SEQ ID NO:6)。SEQ ID NO:6与SEQ ID NO:3的不同之处在于其不含编码Flag肽或上游或者下游序列的序列。
图13所示为由Spike-HKU-PRC编码的SARS CoV刺突多肽(SEQID NO:7)的序列。
图14所示为本发明的质粒,即标记的040078pPCR-Script,其含有编码Spike-HKU-PRC的序列。从合成的寡核苷酸组装成合成基因040078。通过KpnI和SacI限制性位点将该片段克隆入pPCR-Script Amp(Stratagene,LaJolla,CA,USA)。
图15所示为本发明的质粒,即标记的040086pcDNA3.1(+),也称为040078pcDNA3.1(+),其含有克隆入pcDNA3.1(Invitrogen)的BamHI限制性位点的编码Spike-HKU-PRC的序列。
图16所示为用于免疫接种的刺突蛋白的纯度,并显示了银染着色的SDS-PAGE凝胶。样品包括:(M)分子量标准;(1)720ng S蛋白;(2)360ng S蛋白;(3)180ng S蛋白;和(4)90ng S蛋白。标示了分子量,箭头所示为复合糖基化单体刺突蛋白的位置(上方箭头)和高甘露糖单体刺突蛋白的位置(下方箭头)。
图17显示在以TriSpike+Alum免疫的动物中血清抗体应答增强。分析了来自免疫接种的小鼠的血清与TriSpike的反应性。(A)对照为SARS患者的高滴度中和抗血清、抗S1的兔血清、和抗FLAG肽的M2单克隆抗体。对来自以TriSpike加Alum佐剂(组A)或者以TriSpike不加Alum佐剂(组B)免疫的小鼠(n=3)的混和血清进行Western印迹分析。在所指定的时间点收集血清并以1∶1000稀释,用于Western印迹分析。所有血清均与FLAG标记的对照蛋白(BAP-FLAG)进行反应以评估针对FLAG标签的抗体产生。使用HRP缀合的山羊抗小鼠、人、或兔的IgG多克隆抗体来检测免疫复合物。(B)以FRhk4细胞在体外分析来自免疫接种的小鼠的血清的抗SARS CoV感染的中和活性。来自仅接种了TriSpike的小鼠的血清的中和活性(自第49天至第87天)迅速降低,但来自接种了TriSpike+Alum的小鼠的血清的中和活性在同一对比时间内保持稳定。
图18显示以TriSpike+Alum免疫接种小鼠诱导粘膜免疫应答。收集来自免疫小鼠(TriSpike或者TriSpike+Alum)的排泄物和鼻灌洗液样品并分析其与TriSpike的反应性(A-B)。以抗FLAG肽的M2单克隆抗体作为对照。(A)在第44天收集免疫接种小鼠的排泄物样品并按照1∶500进行稀释,用于Western印迹分析。以HRP缀合的山羊抗小鼠IgG或IgA多克隆抗体检测免疫复合物。(B)所示为与(A)基本相同的实验,不同之处仅在于以在第65天收集自免疫接种小鼠的混合鼻灌洗液样品进行Western印迹分析。将鼻灌洗液样品按照1∶25稀释,用于Western印迹分析。(C)收集来自免疫接种小鼠的排泄物样品,并以FRhk4细胞在体外分析抗SARSCoV感染的中和活性。仅在第三次免疫接种之后检测到弱中和活性。分析了来自免疫接种小鼠的鼻灌洗液样品,但在体外没有发现可观测到的中和活性水平。
图19显示了TriSpike在Golden Syrian仓鼠中的免疫原性。分析来自接种了所示浓度的TriSpike+Alum的仓鼠和来自对照仓鼠的血清与TriSpike的反应性和中和情况。(A)使用FACS来分析免疫血清与天然的TriSpike蛋白的反应性。将来自以2、10、或者20μg的TriSpike皮下免疫的仓鼠的血清(第0、21和42天)按照1∶100稀释,与在质膜上表达TriSpike的活BHK-21细胞反应。使用FITC缀合的山羊抗仓鼠IgG多克隆抗体来鉴别免疫复合物。结果以MFI(平均荧光强度)值表示。MFI值在第二次免疫后(剂量2之后)达到最大,并在第三次免疫后(剂量3之后)保持稳定。(B)中和活性得自在FRhk4细胞上进行的SARS CoV微中和测定(microneutralization assay)(100TCID50/孔终末)。
发明详述
已经发现了用于增强SARS CoV刺突蛋白表达的优化DNA序列,包括Spike-Pasteur-modif(SEQ ID NO:2)和Spike-HKU-PRC(SEQ ID NO:3和6)。
本发明的核酸序列包括分离的DNA和RNA序列,所述DNA和RNA序列在中等或者高严格性条件下与在此所述的SEQ ID NO:2、3和6杂交,并编码刺突多肽。在此,中等严格性条件是本领域人员已知的且记载在Sambrook et al.Molecular Cloning:A Laboratory Manual,2ed.Vol.1,pp.1.101-104,Cold Spring Harbor Laboratory Press,(1989),其包括对硝酸纤维素滤膜使用预洗涤溶液5X SSC、0.5%SDS、1.0mM EDTA(pH 8.0),杂交条件为50%甲酰胺、6X SSC、42EC(或者其他类似的杂交溶液,例如Stark′s溶液、50%甲酰胺,42EC),且洗涤条件为大约60EC、0.5X SSC、0.1%SDS。高严格性条件被定义为:杂交条件如上所述,而洗涤条件为68EC、0.2XSSC、0.1%SDS。本领域人员能够理解,必要时可根据各种因素例如探针的长度来调整温度和洗涤溶液的盐浓度。
由这些新的核酸所编码的多肽在此称为“刺突多肽(Spike多肽)”或者“刺突蛋白(Spike蛋白)”。在此,这些术语指的是一类多肽,它们还包括具有SEQ ID NO:4或SEQ ID NO:7的氨基酸序列的蛋白质,以及那些与此类氨基酸序列具有高度相似性(至少90%相似性)的蛋白质和多肽,并且所述的蛋白质和多肽具有免疫反应性。此外,“刺突多肽”和“刺突蛋白”还指在高严格性条件下与SEQ ID NO:3或SEQ ID NO:6的编码序列互补的核酸链杂交的核酸分子所编码的那些蛋白质。
术语“纯化的”在此是指刺突多肽基本上不与其他蛋白质或者多肽相结合,例如是作为重组宿主细胞培养物的纯化产物,或是作为非重组来源的纯化产物。术语“实质上纯化的”在此是指一种混合物,其含有刺突多肽,且若非存在能够使用特异性抗体而去除的已知的蛋白质,其基本上不与其他蛋白质或者多肽相结合,且所述实质上纯化的刺突多肽可用作抗原。
刺突多肽“变体”在此是指与天然的刺突多肽实质上同源的多肽,但由于一或多个缺失、插入或者取代而具有不同于天然刺突多肽的氨基酸序列。变体氨基酸序列优选地与天然刺突多肽的氨基酸序列具有至少80%的相同性,更加优选地至少90%的相同性。相同性百分比是可以确定的,例如可使用Devereux et al.(Nucl.Acids Res.12:387,1984)所述的GAP计算机程序6.0版比较序列信息而确定,该程序可自University ofWisconsin Genetics Computer Group(UWGCG)获得。GAP程序使用Needleman和Wunsch(J.Mol.Biol.48:443,1970)的比对方法,Smith和Waterman(Adv.Appl.Math2:482,1981)对该方法进行了修改。GAP程序的优选默认参数包括:(1)用于核苷酸的一元比较矩阵(相同的值为1,不相同的值为0),以及Gribskov和Burgess,Nucl.Acids Res.14:6745,1986所述的加权比较矩阵,参见Schwartz和Dayhoff,eds.,Atlas of ProteinSequence and Structure,National Biomedical Research Foundation,pp.353-358,1979;(2)每一缺口的罚分为3.0,且每一缺口中的每一符号有额外的0.10的罚分;以及(3)末端缺口无罚分。
变体可包含保守性取代的序列,保守性取代是指一种给定的氨基酸残基被具有相似生化特性的残基取代。保守性取代的实例包括脂肪族残基彼此间的置换,例如Ile、Val、Leu、或Ala彼此之间的取代;或者是极性残基彼此之间的置换,例如Lys与Arg之间;Glu与Asp之间;和Gln与Asn之间。其他此类保守性置换是已知的,例如具有类似疏水特性的整个区域的置换。本发明也包括天然存在的刺突多肽变体。此类变体的实例是因替代性mRNA剪接事件或因刺突多肽的蛋白酶裂解而产生的蛋白质。可归因于蛋白水解作用的变异包括例如在不同类型的宿主细胞内表达后出现的末端的差异,这是由于自刺突多肽蛋白水解去除了一或多个末端氨基酸所致。可归因于移码的变异包括例如在不同类型的宿主细胞内表达后出现的末端的差异,这是由于不同的氨基酸所致。
如上所述,本发明提供分离并纯化的、或者均质的刺突多肽,可以是重组的也可以是非重组的。可用作抗原的天然刺突多肽的变体和衍生物可通过对编码天然刺突多肽的核苷酸序列进行突变而获得。可通过多种常规方法实现对天然氨基酸序列的改变。通过合成含有突变序列的寡核苷酸,其中突变序列两侧具有能够实现与天然序列的片段相连接的限制性位点,由此将突变引入特定的基因座。经连接后,所得到的重建序列编码具有所需氨基酸插入、取代或者缺失的类似物。
或者,可使用寡核苷酸指导的位点特异性诱变方法来提供一种改变的基因,其中可通过取代、缺失或者插入而改变其中预先确定的密码子。实现上述改变的示例性方法可参见Walder et al.(Gene 42:133,1986);Bauer et al.(Gene 37:73,1985);Craik(BioTechniques,January 1985,12-19);Smith et al.(Genetic Engineering:Principles and Methods,PlenumPress,1981);Kunkel(Proc.Natl.Acad.Sci.USA 82:488,1985);Kunkel et al.(Methods in Enzymol.154:367,1987);和美国专利4,518,584和4,737,462,所有这些文献均通过引用并入本申请。
在本发明的一个方面,刺突多肽可用于制备特异性结合刺突多肽的抗体。术语“抗体”包括多克隆抗体、单克隆抗体、其片段例如F(ab′)2和Fab片段、以及任何重组方法产生的结合配偶体(binding partner)。如果抗体以高于或者等于大约107M-1的Ka值结合于刺突多肽,则所述抗体被认为能够发生特异性结合。可采用常规技术容易地确定结合配偶体或者抗体的亲和力,例如采用Scatchard et al.,Ann.N.YAcad.Sci.,51:660(1949)所述的方法。可采用现有技术已知的方法从多种来源容易地产生多克隆抗体,例如来自马、牛、山羊、绵羊、狗、鸡、兔、小鼠或者大鼠。
本发明还包括衍生自SEQ ID NO:2-3和6的核苷酸序列的分离的片段和寡核苷酸。本发明还包括由这些片段和寡核苷酸所编码的多肽。
由于已知遗传密码具有简并性,其中可有一个以上的密码子编码同一个氨基酸,因此不同于SEQ ID NO:2-3和6所示序列的DNA序列仍可编码具有SEQ ID NO:7的氨基酸序列的刺突多肽。此类变体DNA序列可通过沉默突变产生(例如,在PCR扩增过程中发生),或者可以是对天然序列进行有目的的诱变的产物。
因此,本发明提供等价的分离的DNA序列,其编码刺突多肽,所述选自DNA序列:(a)包含SEQ ID NO:2-3和6的核酸分子;(b)能够在高严格性条件下与SEQ ID NO:3或6杂交的DNA;(c)包含SEQ ID NO:2-3和6的片段的核酸分子;和(d)因遗传密码子简并性而由(a)、(b)、或(c)的DNA产生的、且编码刺突多肽和刺突多肽片段的核酸分子。由此类核酸等价序列所编码的刺突多肽也属于本发明的范围内。
由与SEQ ID NO:3或6等价的DNA编码的刺突多肽的实例包括但不限于上述包含灭活的N-糖基化位点、蛋白酶加工位点、或者保守性氨基酸取代的刺突多肽片段和刺突多肽。
可采用熟知的方法制备含有编码刺突多肽的核酸序列的重组表达载体。表达载体包括可操纵地连接于合适的转录或者翻译调节核苷酸序列的Spike DNA序列,例如那些衍生自哺乳动物、微生物、病毒或者昆虫基因的调节核苷酸序列。调节序列的实例包括转录启动子、操纵子、或增强子、mRNA核糖体结合位点、以及控制转录和翻译的起始和终止的适当序列。当调节序列与Spike DNA序列在功能上相关联时,则核苷酸序列是“可操纵地连接的”。因此,如果启动子核苷酸序列控制Spike DNA序列的转录,则启动子核苷酸序列是可操纵地连接于Spike DNA序列的。复制起始点通常赋予在所需宿主细胞中的复制能力,并可将用于鉴定转化体的选择基因掺入表达载体。
此外,还可将编码通常不与刺突多肽天然相关的合适的信号肽的序列掺入表达载体。
用于原核宿主细胞的表达载体通常包括一或多个可选择性表型标记基因。可选择性表型标记基因例如是一种编码赋予抗生素抗性的蛋白质的基因或者是一种编码提供自养需求的蛋白质的基因。可用于原核宿主细胞的表达载体的实例包括那些来自已经商品化的质粒的表达载体。商品化的载体包括那些为表达蛋白质而特别设计的载体,包括pMAL-p2和pMAL-c2载体,它们用于表达融合于麦芽糖结合蛋白的蛋白质(NewEngland Biolabs,Beverly,MA,USA)。
包含优化的SARS CoV Spike基因的质粒的具体实例包括以下质粒:
pPCR-Script-040078         2004年6月8日保藏于C.N.C.M.,保藏号为I-3221;
pcDNA-Spike-HKUPRC-040086  2004年6月8日保藏于C.N.C.M.,保藏号为I-3222;
pcSFV-HKUPRC-040091        2004年6月8日保藏于C.N.C.M.,保藏号为I-3223。
常用于重组原核宿主细胞表达载体的启动子序列包括β-内酰胺酶(青霉素酶)、乳糖启动子系统(Chang et al.,Nature 275:615,1978;和Goeddel et al.,Nature 281:544,1979)、色氨酸(trp)启动子系统(Goeddel etal.,Nucl.Acids Res.8:4057,1980;和EP-A-36776)、tac启动子(Maniatis,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,p.412,1982)。
用于表达刺突多肽的合适的宿主细胞包括原核细胞、酵母或者高等真核细胞。用于细菌、真菌、酵母、和哺乳动物细胞宿主的合适的克隆和表达载体可参见例如Pouwels et al.Cloning Vectors:A LaboratoryManual,Elsevier,New York,(1985)。也可采用无细胞翻译系统,使用衍生自在此所述的DNA构建体的RNA来产生刺突多肽。
可以理解,本发明旨在包括上述蛋白质的分离的或者纯化的形式,无论其是使用在此所述的技术还是采用其他方法而获得的。在本发明的一个优选的实施方式中,刺突多肽基本上不含人体组织和人体组织成分、核酸、无关蛋白质和脂质、以及外来微生物例如细菌和病毒。可以理解,本发明还包括基本上具有所述同样生物学特性和免疫原性的等价蛋白质。因此,本发明旨在包括本发明的蛋白质的各种血清型变体。
根据本发明的刺突多肽的用途,可以对其进行标记。合适的标记物的实例为放射性标记物、酶标记物、荧光标记物、化学发光标记物、和发色团。用于标记本发明的蛋白质和糖蛋白的方法与标记免疫球蛋白所广泛采用的方法没有实质上的不同。如果采用针对本发明的抗原的标记的抗体,或者使用抗针对所述抗原的抗体的抗免疫球蛋白作为间接标记物,则无需再标记本发明的抗原。
获得本发明的刺突多肽之后,可用其产生与其具有反应性的多克隆和单克隆抗体。因此,可通过本领域已知的技术用本发明的蛋白质或者多肽来免疫动物。此类技术包括接种,不过也可包括其他的施用方式。要施用足量的蛋白质或者多肽以便在动物宿主中产生免疫应答。可使用能够产生针对本发明的抗原的抗体的任何宿主。在动物被免疫并经过足够常的时间以使其开始产生针对所述抗原的抗体后,即可收集多克隆抗体。常规的方法包括自动物采血,并自血液分离血清。含有针对所述抗原的抗体的血清可用作针对抗原的抗血清。或者,可自血清收集抗体。自血清收集纯化的针对抗原的多克隆抗体的优选技术是亲和纯化法。
也可以制备针对本发明的抗原的单克隆抗体。产生与所述抗原具有反应性的单克隆抗体的一种方法的步骤包括以抗原免疫动物;自宿主的脾脏收集产生抗体的细胞;将产生抗体的细胞与具有次黄嘌呤-鸟嘌呤磷酸核糖基转移酶缺陷的骨髓瘤细胞融合以形成杂交瘤;通过在包含次黄嘌呤、氨基蝶呤、和胸腺嘧啶的培养基中生长而选择出至少一种杂交瘤;鉴定出至少一种产生针对所述抗原的抗体的杂交瘤,培养所鉴定的杂交瘤以产生可回收量的抗体;以及收集由所述培养的杂交瘤所产生的抗体。
多克隆或者单克隆抗体可具有多种用途,其中之一是中和相应的蛋白质。它们也可用于检测生物制品中的病毒抗原,或者用于纯化相应的蛋白质、糖蛋白、或其混合物,例如使用亲和层析柱进行。
刺突多肽可用作抗原来鉴定生物学材料中的针对SARS CoV的抗体,并用来确定所述材料中抗体的浓度。因此,所述抗原可用于定性或者定量确定材料中的病毒。此类材料包括人体组织和人体细胞、以及生物学液体,例如人的体液,包括人的血清。当作为试剂用于确定是否存在抗SARS CoV的抗体或其浓度的免疫测定法中时,本发明的抗原提供了一种简单、快捷、敏感、并且特异的测定法。
更具体地,本发明的抗原可用于通过免疫测定法检测SARS CoV,这些免疫测定法已知可用于测定或者定量液体中的体液成分(humoralcomponents in fluids)。这样,可以直接观察或者通过第二反应例如沉淀或者凝集来测定抗原抗体相互作用。此外,也可使用免疫电泳技术。例如,可以使用琼脂糖电泳继而与抗血清反应这种经典组合,以及双向电泳、火箭电泳、和聚丙烯酰胺凝胶电泳的免疫标记(Western印迹或者免疫印迹)。可以使用本发明的抗原的其他免疫测定法包括但不限于放射免疫测定法、竞争免疫沉淀测定法、酶免疫测定法、和免疫荧光测定法。可以理解,还可使用比浊法、比色法、和浊度分析技术。优选基于蛋白印迹技术的免疫测定法。
进行免疫测定法时可将免疫试剂之一(本发明的抗原或者针对所述抗原的本发明的抗体)固定化于一种载体表面而仍然保留该试剂的免疫反应性。另一方免疫试剂可以是非标记的或者标记后还仍然保留其免疫反应性。这些技术特别适合用于酶免疫测定法,例如酶联免疫吸附测定法(ELISA)竞争性抑制酶免疫测定法(CIEIA)。
如果将本发明的抗原或者针对抗原的抗体附着于固相支持物,所述固相支持物通常是玻璃或者塑料材料。优选地将塑料材料成型为板型、管型、珠或者盘的形式。合适的塑料材料的形式为聚苯乙烯和聚氯乙烯。如果免疫试剂不易结合于固相支持物,则可在试剂与固相支持物之间设置一种载体材料。合适的载体材料的实例为蛋白质例如牛血清白蛋白,或者化学试剂例如戊二醛(gluteraldehyde)或者尿素。可采用常规技术包被固相支持物。
本发明提供免疫原性刺突多肽,更具体地是用于制备抗SARS CoV的疫苗组合物的保护性多肽。因此可将所述多肽作为病毒疫苗施用于对SARS CoV感染具有易感性的哺乳动物。可采用常规的施用方式。例如,可通过口服、呼吸道、或者胃肠外途径施用。当采用胃肠外施用时,优选地为皮内、皮下、和肌肉途径施用。
实现疫苗佐剂效应的各种方法包括使用例如氧化铝或者磷酸铝(alum),通常使用0.05%-0.1%的溶液,溶于磷酸缓冲盐中,并混和糖的合成聚合物(Carbopol),其使用0.25%的溶液。另一种合适的佐剂化合物包含DDA(溴化二甲基双十八烷基铵(dimethyldioctadecyl-ammoniumbromide)),以及免疫调节物例如淋巴因子(如IFN-γ、IL-1、IL-2、和IL-12)或者IFN-γ诱导剂化合物如poly I:C。
本发明的疫苗组合物优选地制备为可注射的形式(液态的溶液或者悬液)。不过,也可制备为适合在注射前在液体中配制成溶液或者悬液的固相形式。
此外,如果需要,疫苗组合物可含有少量的补充物质,例如湿化剂或者乳化剂、pH缓冲剂、或者佐剂,以增强疫苗的效力。
本发明的疫苗组合物的施用方式与其剂量配制形式相适合,且其量能够产生治疗效果和免疫原性。施用的量取决于待治疗的个体,包括例如个体的免疫系统诱导产生免疫应答的能力。
疫苗的剂量取决于施用途径,且随着待接种的患者的年龄而变化,在较小程度上,随着待接种者的个头大小而变化。
感染SARS CoV的哺乳动物体内的免疫应答的主要目的是灭活游离SARS CoV并清除因感染SARS CoV而可能释放感染性病毒的细胞。B细胞方面的免疫应答主要责任灭活SARS CoV病毒。实现这一目的的主要方式是对感染性进行中和。破坏感染SARS CoV的细胞的另一个重要机制是由细胞毒性T淋巴细胞(CTL)提供的,CTL识别细胞表面上与I类组织相容性抗原联合表达的病毒Spike抗原。CTL识别细胞内从刺突蛋白加工而来的刺突多肽,所述刺突蛋白例如是由感染的细胞所产生的,或者是由吞噬细胞内在化的。因此,本发明可用于刺激抗刺突多肽的B细胞应答,以及病毒感染后由CTL介导的免疫。CTL应答在介导原发SARS CoV感染的康复以及在随后的感染过程中加速康复等方面发挥重要作用。
可通过与佐剂进行乳化作用、掺入脂质体、偶联于适当载体、或者通过这些技术的组合,可增强本发明的刺突多肽和疫苗在宿主体内诱导保护性水平的中和抗体的能力。例如,本发明的刺突多肽可与常规佐剂一起施用,这些佐剂例如为磷酸铝和氧化铝凝胶,其量足以在宿主体内加强体液或细胞介导的免疫应答。类似地,可将刺突多肽结合于脂质膜或者掺入脂质膜以形成脂质体。为此可使用不含核酸和其他无关物质的非热源性脂质。
免疫接种方案取决于多种因素,例如宿主对感染的易感性以及宿主的年龄。可给宿主施用单一剂量的本发明的疫苗,或者先进行初始免疫接种,继而以一定时间间隔施用数个剂量。在初始接种后,根据需要将随后的剂量作为加强接种而施用。
施用于宿主的本发明的刺突蛋白、多肽、和疫苗的量要足以预防或者抑制SARS CoV的感染或体内复制。在任何情况下,施用的量都应该至少足以保护宿主免于出现明显的免疫抑制,即使无法完全防止发生SARS CoV感染。可通过给宿主施用本发明的刺突蛋白或者糖蛋白而产生免疫原性应答,施用的量为大约10至大约500微克抗原/公斤体重,优选地为大约50至大约100微克抗原/公斤体重。本发明的蛋白质和疫苗可与生理学可接受的载体一起施用。例如,可使用稀释剂,例如水或者盐溶液。
本发明的另一个方面提供了RNA和/或DNA免疫接种的方法。该方法还包括给个体施用编码刺突多肽的核酸、所述蛋白质和多肽本身的任意组合,加或不加载体分子。在具体实施方式中,所述个体是动物,且优选地是哺乳动物。更优选地,哺乳动物选自人、小鼠、大鼠、兔、绵羊、狗、猫、牛、猪、和马。在特别优选的实施方式中,哺乳动物是人。
治疗方法包括施用包含刺突多肽的免疫原性组合物,施用编码刺突多肽的核酸的组合物也可。本领域技术人员熟知核酸疫苗和核酸疫苗技术以及基于蛋白质和多肽的技术的概念、应用、以及有效性。基于核酸的技术能够将裸露的或者包囊化的编码刺突多肽的核酸直接施用至组织和细胞,而不需要在施用前产生所编码的蛋白质。该技术是基于这些核酸能够被受者生物体的细胞摄取并表达以产生免疫原性决定簇,而受者的免疫系统会对其产生应答。典型地,所表达的抗原展示于摄取并表达了所述核酸的细胞表面,但本发明也包括将所编码的抗原表达并输出至受者个体的循环系统中。此类核酸疫苗技术包括但不限于输送裸DNA和RNA以及输送编码刺突多肽的表达载体。尽管这种技术称为“疫苗”,但其也同等适用于并不产生保护性应答的免疫原性组合物。此类不诱导保护性的组合物和方法也属于本发明的范围。
尽管将编码刺突多肽的核酸和载体分子作为裸核酸而输送属于本发明的范围,但本发明也包括将核酸作为更大或者更复杂的组合物的一部分进行输送。这些输送系统包括含有编码刺突多肽的核酸的病毒、病毒样颗粒、或者细菌。同样,本发明的核酸和载体分子与细胞透过性化合物(cell permeabilizing compounds)如脂质体所形成的复合体也属于本发明的范围。用于核酸疫苗的其他化合物例如分子载体(EP 696,191,Samain etal.)和输送系统是本领域人员已知的,例如参见WO 93 06223和WO 9011092、U.S.5,580,859、和U.S.5,589,466(Vical的专利),通过引用将这些文献并入本文,上述这些均不需进行过多的实验即可制备并使用。
在单次或者两次注射刺突蛋白后,这种基于蛋白质的SARS疫苗可诱导中和性和保护性抗体依赖性免疫应答。基于蛋白质的疫苗与载体表达的病毒疫苗(即,质粒、MVA、Adeno)或者灭活全病毒疫苗相比表现出相当的安全性的优点。
为了进一步实现本发明的目的并与本发明的目的相一致,提供了一种用于诊断SARS CoV感染的试剂盒。在一个实施方式中,所述试剂盒含有本发明的抗体,所述抗体能够结合SARS CoV刺突多肽。在另一个实施方式中,所述试剂盒含有本发明的多肽,所述多肽能够检测是否存在能够与刺突多肽相结合的抗体。在另一个实施方式中,所述试剂盒含有本发明的核酸分子,所述核酸分子能够与提示存在SARS CoV感染的病毒RNA或者类似的DNA序列杂交。可使用的各种不同的诊断技术包括但不限于:(1)用于鉴定可被或者不被限制性酶消化的细胞DNA的Southern印迹方法;(2)用于鉴定提取自细胞的RNA的Northern印迹;和(3)斑点杂交技术,即无需提前在琼脂糖凝胶上进行分离,直接将样品滤过通过Ad Hoc膜,例如硝酸纤维素膜或者尼龙膜;(4)基于蛋白印迹技术的免疫测定法;(5)ELISA(酶联免疫吸附测定法);(6)FACS;(7)间接免疫荧光测定法;或(8)免疫沉淀测定法。用于斑点杂交技术的合适的材料可得自体液,包括但不限于,血清和血浆、培养细胞的上清液、或细胞裂解并通过离心去除细胞的膜和细胞核之后的胞浆提取物。
以下结合实施例进一步阐述本发明。
实施例1
获得了来自感染SARS CoV的患者的刺突基因(Spike gene),称为Spike-Pasteur(SEQ ID NO:1)。将Spike-Pasteur克隆入pcDNA真核表达载体并转染入293T细胞。转染了pcDNA-Spike-Pasteur的细胞不表达Spike-Pasteur多肽,因为通过FACS或者Western印迹均没有观察到可检测水平的刺突蛋白。
随后在SFV病毒表达载体中表达Spike-Pasteur,所述表达载体在转染的BHK细胞中能够有效地表达。不过,SFV病毒颗粒的产率较低,这是因为在刺突基因中存在2个Spe I位点。Spe I通常用于将质粒在SFV编码序列的末端进行线性化。由于不能使用Spe I,因此使用了Sph I对PSFV-Spike-Pasteur进行线性化,这产生了>2000个碱基的载体RNA的额外的3′RNA序列。来自感染了SFV-Spike-Pasteur的细胞的代表表达水平很弱。
为了增强Spike-Pasteur的表达,将Spike-Pasteur序列中的两个Spe I位点消除,产生了Spike-Pasteur-modif(SEQ ID NO:2)。Spike-Pasteur-modif使得能够以Spe I对pSFV进行标准的线性化,并发现其将SFV颗粒的产率最大提高了100倍。来自Sph I线性化的pSFV-Spike-Pasteur的RNA转染通常产生的SFV滴度为2×107IP/ml。来自Spe I线性化的pSFV-Spike-Pasteur-modif的RNA转染通常产生的SFV滴度为1-2×109IP/ml。
实施例2
进一步对Spike-Pasteur序列进行生物信息学分析。Spike-Pasteur的cDNA含有许多顺式作用位点,这些位点可对表达造成负面影响。为了进一步增强表达,自Spike-Pasteur中消除了所鉴定的33个负顺式作用信号中的32个,并添加了刺激基因表达的额外的信号,由此产生了Spike-HKU-PRC(SEQ ID NO:3)。将Spike-HKU-PRC克隆入pSC、pcDNA、和pSFV载体。
如表1所示,Spike-Pasteur的19个富含AU的RNA不稳定性基序均被消除以产生Spike-HKU-PRC。此外还去除了12个推定的剪接供体和受体位点中的11个、以及内部的poly(A)和重复序列和二级序列段。
表1.与优化的Spike-HKU-PRC相比,Spike-Pasteur中的负顺式作用信号。
  Spike-Pasteur   Spike-HKU-PRC
 富含AU的RNA不稳定性基序   19   0
 重复序列和二级序列段   1   0
 剪接供体和受体位点   12   1
 内部poly(A)位点   1   0
添加到Spike-HKU-PRC上的额外的表达增强序列包括引入到起始ATG上游的Kozak共有序列以增强翻译的起始,并添加了2个STOP密码子以确保有效的终止。为了增加mRNA的半衰期,将Spike-HKU-PRC的GC含量由38%提高至49%,同时避免出现GC含量极高(>80%)或者极低(<30%)的区域。此外,使用的密码子偏向于中国仓鼠以提高翻译效率。表2所示为中国仓鼠的密码子使用,每一密码子的频率表示为数量/一千个密码子。
以下序列避免出现在Spike-HKU-PRC中:内部TATA盒、chi位点、和核糖体进入位点;富含AT或者富含GC的序列段;重复序列和RNA二级结构;和剪接供体和受体位点以及剪接分枝点(splice branch points)。
表2.中国仓鼠的密码子使用,见https://www.kazusa.or.ip/codon/)。频率表示为数量/一千个密码子。
  UUUUUCUUAUUG   19.322.06.114.1   UCUUCCUCAUCG   16.116.510.13.5   UAUUACUAAUAG   12.816.30.60.6   UGUUGCUGAUGG   8.910.31.113.3
  CUUCUCCUACUG   12.918.17.538.6   CCUCCCCCACCG   17.317.415.54.3   CAUCACCAACAG   10.113.010.233.8   CGUCGCCGACGG   5.89.27.110.2
  AUUAUCAUAAUG   17.425.06.822.8   ACUACCACAACG   14.220.515.74.3   AAUAACAAAAAG   17.321.124.338.4   AGUAGCAGAAGG   11.616.39.910.2
  GUUGUCGUAGUG   11.615.97.930.2   GCUGCCGCAGCG   22.725.816.54.8   GAUGACGAAGAG   24.727.927.640.9   GGUGGCGGAGGG   13.221.816.313.7
实施例3
通过使用磷酸钙方法将质粒转染入293T细胞来比较pcDNA-Spike-Pasteur与pcDNA-Spike-HKU-PRC的刺突蛋白表达。转染了pcDNA-Spike-Pasteur的细胞中没有观察到刺突蛋白。相反,在转染了pcDNA-Spike-HKU-PRC的293T细胞中检测到高水平的刺突蛋白(图1)。刺突蛋白的迁移和寡聚化方式与以往得到的结果一致,提示这种质粒能够表达全长的、天然构象的SARS CoV蛋白质。这些结果证实,Spike编码序列的密码子优化使得表达结果发生戏剧性的改善。
实施例4
以C端Flag肽标记刺突蛋白,如图2所示。在先前所述的SFV载体系统中(参见Staropoli et al.,Lozach et al.,和Chanel et al.,均通过引用在此并入本文),刺突蛋白表达为全长蛋白质,包括C端和跨膜结构域以及C端Flag标记物。
或者自转染了SFV-Spike-RNA的细胞或是感染了编码SFV-Spike-RNA的SFV颗粒的细胞制备刺突蛋白。制备SFV表达载体RNA
通过一系列生化和免疫细胞化学分析法来分析刺突蛋白的正确折叠和预期特性。该蛋白质在进入内质网(ER)发生糖基化,获得高甘露糖EndoH敏感性N-聚糖(图3)。通过ER quality control exit、质膜表达(图4)、可溶性ACE2受体结合(图5)、和在Western印迹中被SARS患者血清所识别以及通过FACS分析(图6-7)证实,刺突蛋白的折叠是正确的,即为其天然构象。
实施例5
为进行RNA免疫接种,根据已公开的标准程序体外转录RNA。
在BHK细胞中产生刺突蛋白,并使用抗FLAG M2抗体通过免疫亲和在天然条件下进行纯化。使用Flag肽在天然条件下洗脱结合M2的刺突蛋白。通过透析除去肽和残留的去垢剂。
肌肉注射SFV Spike RNA免疫小鼠,随后在第14天和第35天腹腔内(IP)注射刺突蛋白。在第34、42、和55天自免疫的小鼠取得血清,所述血清在Western印迹(图6)和FACS(图7)中显示存在重组Spike特异性抗体,且在感染了SARS CoV的FRHK4细胞上进行免疫荧光检测发现所述血清存在SARS CoV特异性抗体(图8)。这些数据表明,SFV载体中表达的刺突蛋白可以其天然构象而成功进行免疫纯化,并且这种纯化的蛋白质可在小鼠诱导产生高滴度的抗SARS抗体。
实施例6
以下试剂和方法可用于实施本发明。
产生SARS CoV Spike亚单位疫苗
1/制备SFV表达载体RNA
注:刺突蛋白可产生自,例如,转染了SFV-Spike-RNA的细胞或者以编码SFV-Spike-RNA的SFV颗粒感染的细胞。在此详细描述一种Electroporaton方法。
制备1.2×107细胞/ml悬液,用于无菌条件下进行电穿孔(Electroporation)
1.制备无血清培养基,混和以下成分并滤过/除菌:
i.Hepes 5%10mL
ii.胰蛋白月示-磷酸盐肉汤(Tryptose-phosphate broth)50mL
iii.青霉素100U/mL,链霉素100μg/mL:5mL
iv.GMEM QSP 500mL
2.预热试剂(GMEM、胰蛋白酶、PBS,不含Ca2+或Mg2+)至37℃;
3.轻柔地吸除原培养基,不要接触壁;
4.以10ml PBS冲洗细胞一次,弃洗液;
5.加入3ml胰蛋白酶并将平底培养瓶在罩(hood)中放置4-5分钟;
6.加入17ml新鲜完全培养基(GMEM 5%FCS)并悬浮细胞,转移至50ml管中;
7.细胞计数;取相当于107的细胞并在1500rpm离心5分钟;
8.将细胞重悬于1ml PBS(得到107细胞/ml);
9.将悬液置于冰上。
2/转染SFV表达载体RNA
应当对样品和未转染的对照细胞均进行电穿孔。
1.准备2个75ml培养瓶,其中一个含有20ml GMEM,适当标记;
2.使用无菌P1000滤器吸头转移800μl细胞悬液(悬于无Ca2+或Mg2+的PBS中)至含有RNA的管中,用移液器吸打两次;
3.将混合物迅速转移至已经放置在电穿孔室中的电穿孔管(Electroporator cuvette)中;
4.将电穿孔仪设定在830伏,25μFd,并将阻抗设定在无限大,施加2个脉冲,各脉冲之间有2-3秒的延迟(注:为达到合适的时间常数,在施加脉冲时保持电穿孔室是被遮蔽的);
5.注意电穿孔时间(应当在0.4ms之内);
6.将细胞转移至含有20ml GMEM的75ml培养瓶中,轻柔地吸打以重悬细胞;
7.在未转染的细胞上进行同样的操作;
8.将细胞在37℃,5%CO2条件下温育过夜(约16小时)。
3/裂解细胞并制备蛋白
制备用于Western印迹和免疫纯化的蛋白裂解物
Figure A20058002609000331
裂解缓冲液
Triton X-100          1%
Tris-HCI,pH 7.5       20mM
NaCl                   150mM
EDTA                   1mM
PMSF                   50mg/ml
1×PBS,不含Ca2+、Mg2+
Figure A20058002609000342
蛋白样品缓冲液,不含DTT
Figure A20058002609000343
DTT,1M,-20℃
Figure A20058002609000344
细胞刮刀
制备新鲜的20ml裂解缓冲液
1.除去培养瓶中的培养基;
2.以10ml 1×PBS洗涤细胞(1瓶);
3.加入500μl裂解液,利用细胞刮刀自培养瓶中取出细胞;
4.小心地将细胞裂解液转移至1.5ml的eppendorf管中;
5.以额外的300μl裂解缓冲液尽可能多地取出残留细胞;
6.将管在冰上放置15分钟;
7.将管在4℃以13,000rpm离心15分钟以去除细胞核物质;
8.将上清液转移至置于冰上的新管中;
9.将裂解液提取物放置于冰上。
4/自细胞裂解液中免疫亲和纯化S-Flag蛋白质
Triton X 100裂解缓冲液(Triton X 100 1%,Tris HCl pH7.5 20mM,NaCl 150mM,EGTA 1mM,PMSF 50μg/ml)
1.使用200μl阔口移液头将100μl的抗flag M2琼脂糖珠置于1.5mleppendorf中用于各个细胞裂解样品;
2.用1ml裂解缓冲液平衡各管的珠,洗涤3次(全速离心15秒将珠甩至底部,轻柔地移去90%的PBS,注意避免将珠吸起);
3.保存50μl的细胞裂解物,备用;
4.充分混和(轻柔旋转)珠-裂解物混合物,由此将洗涤后的珠与剩余的细胞裂解物一起在4℃温育4小时;
5.将珠甩至底部,并自各样品管去除上清液;
6.用0.5ml 1X洗涤缓冲液洗涤珠3次(甩至底部,并添加新的洗涤缓冲液);
7.将珠甩至底部,并去除绝大部分上清液,使得各个样品管中的残留体积是大约100μl;
8.将20μl的各个珠样品分配至新的1.5ml eppendorf管中,用于Western印迹检测;
9.将剩余的珠样品管存放于-20℃,准备以后用于洗脱。
自免疫沉淀物中洗脱蛋白质
1.方法参照FLAGIPT-1使用说明书;
2.以3XFLAG肽洗脱;
3.通过将3μl浓度为5μg/μl的3X FLAG肽添加至100μl的1X洗涤缓冲液制备3X FLAG肽工作液;
4.将100μl的3X FLAG工作洗脱液加至树脂上;
5.将混合物在4℃温育1小时,轻柔旋转;
6.将树脂在13000rpm离心10秒;
7.保留上清液,并将步骤4-6再重复3次。
用Amicon滤器装置浓缩和纯化蛋白质
1.温育后将各培养瓶的上清液收集至50mL管中;
2. 2000rpm离心5分钟以去除细胞沉淀;
3.将15mL上清液转移至另一50mL管中(含有57μL的100mM的PMSF,溶于iPrOH)任选
4.置于冰上;
5.将20ml样品加至Amicon Ultra-15滤器装置;
6.将盖好的滤器装置置于离心转子内,将体积刻度朝向上方,以类似的装置进行配重;
7.在水平转子(swinging bucket rotor)中以最大4000xg离心20分钟;
8.通过自滤器装置吸取样品回收浓缩的溶质(500μl)。
实施例7
经测定,候选疫苗制剂,即三聚体S蛋白(TriSpike,与所述Spike-HKU-PRC相同的蛋白质),纯度>90%。将用于对小鼠和仓鼠进行免疫接种研究的纯化TriSpike样品在SDS/DTT缓冲液(50mM DDT)中进行变性以使得三聚体蛋白质完全解离成为单体。以4-12%SDS-PAGE进行分离,对凝胶进行银染(Current Protocols in Immunology Chapter 8,9.1-9.10)以显示样品中所含有的所有蛋白质。图16显示只能够检测到单体S蛋白,以其复合的糖基化和高甘露糖形式存在,纯度>90%。
实施例8
以TriSpike加Alum佐剂免疫的动物产生了增强的血清IgG应答。以往对来自牙龈卟啉菌(Porphyromonas gingivalis)的重组HagB的粘膜和全身应答的研究显示,与不加佐剂的HagB免疫相比,以HagB+Alum免疫在Balb/c小鼠中诱导了更高的血清IgG应答和粘膜IgA应答(Vaccine,2003,21,4459-4471)。对TriSpike候选疫苗进行分析以确定其是否不仅能够诱导血清IgG,而且能够诱导对SARS CoV具有中和能力的粘膜IgA。比较了PBS中的TriSpike制剂和Alum佐剂中的TriSpike制剂在诱导SARS CoV特异性血清IgG方面的能力。通过腹腔内途径对两组小鼠进行免疫:A组代表单独接受3个剂量的20μg TriSpike蛋白的小鼠,而B组代表接受3个剂量的预先混和了1mg Alum佐剂的20μg TriSpike的小鼠。Western印迹分析显示,与单独使用TriSpike进行免疫的小鼠相比,以TriSpike+Alum进行免疫的小鼠产生了更强的抗体应答(图17)。TriSpike+Alum组还显示出更高的中和滴度(图17)。TriSpike+Alum佐剂诱导了强烈的中和性和持久的血清IgG应答。
实施例9
TriSpike+Alum佐剂诱导了增强的粘膜IgG和IgA应答。在人类和实验性感染动物的上呼吸道和下呼吸道能够检测到SARS CoV。除了呼吸道,在死亡病例的肠组织中也能检测到SARS CoV(AJG,2005,100,169-176)。为了研究TriSpike候选疫苗在粘膜部位诱导产生SARS CoV特异性IgG和IgA抗体的能力,发明人收集了来自以TriSpike+/-Alum佐剂通过腹腔内途径进行免疫的小鼠的粪便和鼻灌洗液样品。如前所述制备粪便样品(PNAS,2004,101,13584-13589)。简言之,在指定日收集粪块(-100mg)。在40℃加入0.5ml的含有0.02%Na-azide的PBS轻柔旋转30分钟,并离心(13,000rpm),由此制备到粪便提取物。通常,自一管粪块悬液能够制备到0.2ml的上清液。Western印迹分析(图18)显示,仅在以TriSpike+Alum免疫的小鼠的粪便样品中存在粘膜IgG和IgA应答,而在单独以TriSpike免疫的小鼠中则没有。类似地,仅有来自以TriSpike+Alum免疫的小鼠的粪便样品中所含的Ig在微中和分析中显示出具有抗SARS CoV的中和活性。在来自以TriSpike+Alum免疫的小鼠的粪便样品中检测到了IgG和IgA,这说明以TriSpike免疫的动物在胃肠道系统内建立了抗SARS CoV感染的第一线防御机制。
如Current Protocols in Immunology(Chapter 19,11.15-16)所述制备鼻灌洗液样品。简言之,在指定日收集鼻灌洗液样品。给原初小鼠和免疫的小鼠腹腔内注射两倍体积的氯胺酮/甲苯噻嗪溶液对小鼠实施麻醉。打开胸腔,插入25G针头,将0.5ml PBS/抑肽酶注射至阻塞部头部的气管腔内。可自各只小鼠收集大约0.5ml的鼻清洗液样品。
对收集的鼻灌洗液样品(n=3)进行Western印迹分析发现,在用TriSpike+Alum免疫的小鼠的鼻灌洗液样品中存在粘膜IgG,而单独以TriSpike免疫的小鼠则没有。不过,在用TriSpike+Alum免疫的小鼠或单独以TriSpike免疫的小鼠的鼻灌洗液样品中都没有检测到IgA应答,这可能是由抗原施用途径所致。根据微中和分析结果,来自鼻部样品的粘膜IgG应答在体外没有产生任何抗SARS CoV感染的保护作用。
                             序列表
<110>INSTITUT PASTEUR
     HONG KONG PASTEUR RESEARCH CENTRE LIMITED
<120>与SARS冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物
<130>B6401AA朅D/CAL
<140>PCT/EP 2005/006512
<141>2005-06-03
<150>10/860,641
<151>2004-06-04
<150>60/578,348
<151>2004-06-10
<160>7
<170>PatentIn Ver.3.3
<210>1
<211>3795
<212>DNA
<213>SARS Coronavirus
<400>1
atgtttattt tcttattatt tcttactctc actagtggta gtgaccttga ccggtgcacc  60
acttttgatg atgttcaagc tcctaattac actcaacata cttcatctat gaggggggtt  120
tactatcctg atgaaatttt tagatcagac actctttatt taactcagga tttatttctt  180
ccattttatt ctaatgttac agggtttcat actattaatc atacgtttgg caaccctgtc  240
atacctttta aggatggtat ttattttgct gccacagaga aatcaaatgt tgtccgtggt  300
tgggtttttg gttctaccat gaacaacaag tcacagtcgg tgattattat taacaattct  360
actaatgttg ttatacgagc atgtaacttt gaattgtgtg acaacccttt ctttgctgtt  420
tctaaaccca tgggtacaca gacacatact atgatattcg ataatgcatt taattgcact  480
ttcgagtaca tatctgatgc cttttcgctt gatgtttcag aaaagtcagg taattttaaa  540
cacttacgag agtttgtgtt taaaaataaa gatgggtttc tctatgttta taagggctat  600
caacctatag atgtagttcg tgatctacct tctggtttta acactttgaa acctattttt  660
aagttgcctc ttggtattaa cattacaaat tttagagcca ttcttacagc cttttcacct  720
gctcaagaca tttggggcac gtcagctgca gcctattttg ttggctattt aaagccaact  780
acatttatgc tcaagtatga tgaaaatggt acaatcacag atgctgttga ttgttctcaa  840
aatccacttg ctgaactcaa atgctctgtt aagagctttg agattgacaa aggaatttac  900
cagacctcta atttcagggt tgttccctca ggagatgttg tgagattccc taatattaca  960
aacttgtgtc cttttggaga ggtttttaat gctactaaat tcccttctgt ctatgcatgg  1020
gagagaaaaa aaatttctaa ttgtgttgct gattactctg tgctctacaa ctcaacattt  1080
ttttcaacct ttaagtgcta tggcgtttct gccactaagt tgaatgatct ttgcttctcc  1140
aatgtctatg cagattcttt tgtagtcaag ggagatgatg taagacaaat agcgccagga  1200
caaactggtg ttattgctga ttataattat aaattgccag atgatttcat gggttgtgtc  1260
cttgcttgga atactaggaa cattgatgct acttcaactg gtaattataa ttataaatat  1320
aggtatctta gacatggcaa gcttaggccc tttgagagag acatatctaa tgtgcctttc  1380
tcccctgatg gcaaaccttg caccccacct gctcttaatt gttattggcc attaaatgat  1440
tatggttttt acaccactac tggcattggc taccaacctt acagagttgt agtactttct  1500
tttgaacttt taaatgcacc ggccacggtt tgtggaccaa aattatccac tgaccttatt  1560
aagaaccagt gtgtcaattt taattttaat ggactcactg gtactggtgt gttaactcct  1620
tcttcaaaga gatttcaacc atttcaacaa tttggccgtg atgtctctga tttcactgat  1680
tccgttcgag atcctaaaac atctgaaata ttagacattt caccttgctc ttttgggggt  1740
gtaagtgtaa ttacacctgg aacaaatgct tcatctgaag ttgctgttct atatcaagat  1800
gttaactgca ctgatgtttc tacagcaatc catgcagatc aactcacacc agcttggcgc  1860
atatattcta ctggaaacaa tgtattccag actcaagcag gctgtcttat aggagctgag  1920
catgtcgaca cttcttatga gtgcgacatt cctattggag ctggcatttg tgctagttac  1980
catacagttt ctttattacg tagtactagc caaaaatcta ttgtggctta tactatgtct  2040
ttaggtgctg atagttcaat tgcttactct aataacacca ttgctatacc tactaacttt  2100
tcaattagca ttactacaga agtaatgcct gtttctatgg ctaaaacctc cgtagattgt  2160
aatatgtaca tctgcggaga ttctactgaa tgtgctaatt tgcttctcca atatggtagc  2220
ttttgcacac aactaaatcg tgcactctca ggtattgctg ctgaacagga tcgcaacaca  2280
cgtgaagtgt tcgctcaagt caaacaaatg tacaaaaccc caactttgaa atattttggt  2340
ggttttaatt tttcacaaat attacctgac cctctaaagc caactaagag gtcttttatt  2400
gaggacttgc tctttaataa ggtgacactc gctgatgctg gcttcatgaa gcaatatggc  2460
gaatgcctag gtgatattaa tgctagagat ctcatttgtg cgcagaagtt caatgggctt  2520
acagtgttgc cacctctgct cactgatgat atgattgctg cctacactgc tgctctagtt  2580
agtggtactg ccactgctgg atggacattt ggtgctggcg ctgctcttca aatacctttt  2640
gctatgcaaa tggcatatag gttcaatggc attggagtta cccaaaatgt tctctatgag  2700
aaccaaaaac aaatcgccaa ccaatttaac aaggcgatta gtcaaattca agaatcactt  2760
acaacaacat caactgcatt gggcaagctg caagacgttg ttaaccagaa tgctcaagca  2820
ttaaacacac ttgttaaaca acttagctct aattttggtg caatttcaag tgtgctaaat  2880
gatatccttt cgcgacttga taaagtcgag gcggaggtac aaattgacag gctaattaca  2940
ggcagacttc aaagccttca aacctatgta acacaacaac taatcagggc tgctgaaatc  3000
agggcttctg ctaatcttgc tgctactaaa atgtctgagt gtgttcttgg acaatcaaaa  3060
agagttgact tttgtggaaa gggctaccac cttatgtcct tcccacaagc agccccgcat  3120
ggtgttgtct tcctacatgt cacgtatgtg ccatcccagg agaggaactt caccacagcg  3180
ccagcaattt gtcatgaagg caaagcatac ttccctcgtg aaggtgtttt tgtgtttaat  3240
ggcacttctt ggtttattac acagaggaac ttcttttctc cacaaataat tactacagac  3300
aatacatttg tctcaggaaa ttgtgatgtc gttattggca tcattaacaa cacagtttat  3360
gatcctctgc aacctgagct tgactcattc aaagaagagc tggacaagta cttcaaaaat  3420
catacatcac cagatgttga tcttggcgac atttcaggca ttaacgcttc tgtcgtcaac  3480
attcaaaaag aaattgaccg cctcaatgag gtcgctaaaa atttaaatga atcactcatt  3540
gaccttcaag aattgggaaa atatgagcaa tatattaaat ggccttggta tgtttggctc  3600
ggcttcattg ctggactaat tgccatcgtc atggttacaa tcttgctttg ttgcatgact  3660
agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt cttgctgcaa gtttgatgag  3720
gatgacgctg agccagttct caagggtgtc aaattacatt acacagacta caaggatgac  3780
gatgacaata agtaa                                                   3795
<210>2
<211>3795
<212>DNA
<213>SARS Coronavirus
<400>2
atgtttattt tcttattatt tcttactctc acgagtggta gtgaccttga ccggtgcacc  60
acttttgatg atgttcaagc tcctaattac actcaacata cttcatctat gaggggggtt  120
tactatcctg atgaaatttt tagatcagac actctttatt taactcagga tttatttctt  180
ccattttatt ctaatgttac agggtttcat actattaatc atacgtttgg caaccctgtc  240
atacctttta aggatggtat ttattttgct gccacagaga aatcaaatgt tgtccgtggt  300
tgggtttttg gttctaccat gaacaacaag tcacagtcgg tgattattat taacaattct  360
actaatgttg ttatacgagc atgtaacttt gaattgtgtg acaacccttt ctttgctgtt  420
tctaaaccca tgggtacaca gacacatact atgatattcg ataatgcatt taattgcact  480
ttcgagtaca tatctgatgc cttttcgctt gatgtttcag aaaagtcagg taattttaaa  540
cacttacgag agtttgtgtt taaaaataaa gatgggtttc tctatgttta taagggctat  600
caacctatag atgtagttcg tgatctacct tctggtttta acactttgaa acctattttt  660
aagttgcctc ttggtattaa cattacaaat tttagagcca ttcttacagc cttttcacct  720
gctcaagaca tttggggcac gtcagctgca gcctattttg ttggctattt aaagccaact  780
acatttatgc tcaagtatga tgaaaatggt acaatcacag atgctgttga ttgttctcaa  840
aatccacttg ctgaactcaa atgctctgtt aagagctttg agattgacaa aggaatttac  900
cagacctcta atttcagggt tgttccctca ggagatgttg tgagattccc taatattaca  960
aacttgtgtc cttttggaga ggtttttaat gctactaaat tcccttctgt ctatgcatgg  1020
gagagaaaaa aaatttctaa ttgtgttgct gattactctg tgctctacaa ctcaacattt  1080
ttttcaacct ttaagtgcta tggcgtttct gccactaagt tgaatgatct ttgcttctcc  1140
aatgtctatg cagattcttt tgtagtcaag ggagatgatg taagacaaat agcgccagga  1200
caaactggtg ttattgctga ttataattat aaattgccag atgatttcat gggttgtgtc  1260
cttgcttgga atactaggaa cattgatgct acttcaactg gtaattataa ttataaatat  1320
aggtatctta gacatggcaa gcttaggccc tttgagagag acatatctaa tgtgcctttc  1380
tcccctgatg gcaaaccttg caccccacct gctcttaatt gttattggcc attaaatgat  1440
tatggttttt acaccactac tggcattggc taccaacctt acagagttgt agtactttct  1500
tttgaacttt taaatgcacc ggccacggtt tgtggaccaa aattatccac tgaccttatt  1560
aagaaccagt gtgtcaattt taattttaat ggactcactg gtactggtgt gttaactcct  1620
tcttcaaaga gatttcaacc atttcaacaa tttggccgtg atgtctctga tttcactgat  1680
tccgttcgag atcctaaaac atctgaaata ttagacattt caccttgctc ttttgggggt  1740
gtaagtgtaa ttacacctgg aacaaatgct tcatctgaag ttgctgttct atatcaagat  1800
gttaactgca ctgatgtttc tacagcaatc catgcagatc aactcacacc agcttggcgc  1860
atatattcta ctggaaacaa tgtattccag actcaagcag gctgtcttat aggagctgag  1920
catgtcgaca cttcttatga gtgcgacatt cctattggag ctggcatttg tgctagttac  1980
catacagttt ctttattacg tagtactagc caaaaatcta ttgtggctta tactatgtct  2040
ttaggtgctg atagttcaat tgcttactct aataacacca ttgctatacc tactaacttt  2100
tcaattagca ttactacaga agtaatgcct gtttctatgg ctaaaacctc cgtagattgt  2160
aatatgtaca tctgcggaga ttctactgaa tgtgctaatt tgcttctcca atatggtagc  2220
ttttgcacac aactaaatcg tgcactctca ggtattgctg ctgaacagga tcgcaacaca  2280
cgtgaagtgt tcgctcaagt caaacaaatg tacaaaaccc caactttgaa atattttggt  2340
ggttttaatt tttcacaaat attacctgac cctctaaagc caactaagag gtcttttatt  2400
gaggacttgc tctttaataa ggtgacactc gctgatgctg gcttcatgaa gcaatatggc  2460
gaatgcctag gtgatattaa tgctagagat ctcatttgtg cgcagaagtt caatgggctt  2520
acagtgttgc cacctctgct cactgatgat atgattgctg cctacactgc tgctctagtt  2580
agtggtactg ccactgctgg atggacattt ggtgctggcg ctgctcttca aatacctttt  2640
gctatgcaaa tggcatatag gttcaatggc attggagtta cccaaaatgt tctctatgag  2700
aaccaaaaac aaatcgccaa ccaatttaac aaggcgatta gtcaaattca agaatcactt  2760
acaacaacat caactgcatt gggcaagctg caagacgttg ttaaccagaa tgctcaagca  2820
ttaaacacac ttgttaaaca acttagctct aattttggtg caatttcaag tgtgctaaat  2880
gatatccttt cgcgacttga taaagtcgag gcggaggtac aaattgacag gctaattaca  2940
ggcagacttc aaagccttca aacctatgta acacaacaac taatcagggc tgctgaaatc  3000
agggcttctg ctaatcttgc tgctactaaa atgtctgagt gtgttcttgg acaatcaaaa  3060
agagttgact tttgtggaaa gggctaccac cttatgtcct tcccacaagc agccccgcat  3120
ggtgttgtct tcctacatgt cacgtatgtg ccatcccagg agaggaactt caccacagcg  3180
ccagcaattt gtcatgaagg caaagcatac ttccctcgtg aaggtgtttt tgtgtttaat  3240
ggcacttctt ggtttattac acagaggaac ttcttttctc cacaaataat tactacagac  3300
aatacatttg tctcaggaaa ttgtgatgtc gttattggca tcattaacaa cacagtttat  3360
gatcctctgc aacctgagct tgactcattc aaagaagagc tggacaagta cttcaaaaat  3420
catacatcac cagatgttga tcttggcgac atttcaggca ttaacgcttc tgtcgtcaac  3480
attcaaaaag aaattgaccg cctcaatgag gtcgctaaaa atttaaatga atcactcatt  3540
gaccttcaag aattgggaaa atatgagcaa tatattaaat ggccttggta tgtttggctc  3600
ggcttcattg ctggactaat tgccatcgtc atggttacaa tcttgctttg ttgcatgacg  3660
agttgttgca gttgcctcaa gggtgcatgc tcttgtggtt cttgctgcaa gtttgatgag  3720
gatgacgctg agccagttct caagggtgtc aaattacatt acacagacta caaggatgac  3780
gatgacaata agtaa                                                   3795
<210>3
<211>3897
<212>DNA
<213>SARS Coronavirus
<220>
<221>CDS
<222>(44)..(3844)
<400>3
ctatagggcg aattgggtac cgctagcgga tccgcgcgcc acc atg ttt att ttc    55
                                                Met Phe Ile Phe
                                                  1
ctg ctg ttt ctg act ctg acc agc ggc agt gac ctg gac cgg tgc acc    103
Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu Asp Arg Cys Thr
  5                  10                  15                  20
act ttt gat gat gtg cag gct cct aat tac act cag cat act tcc tct    151
Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln His Thr Ser Ser
                 25                  30                  35
atg agg ggc gtg tac tat cct gat gaa att ttt aga tcc gac act ctg    199
Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg Ser Asp Thr Leu
             40                  45                  50
tat ctg act cag gat ctg ttt ctg cca ttc tat tct aat gtg aca ggc    247
Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser Asn Val Thr Gly
         55                  60                  65
ttt cat act att aat cat acc ttt ggc aac cct gtg atc cct ttt aag    295
Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val Ile Pro Phe Lys
     70                  75                  80
gat ggc atc tat ttt gct gcc aca gag aag tcc aat gtg gtg cgg gga    343
Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn Val Val Arg Gly
 85                  90                  95                 100
tgg gtg ttc ggc tct acc atg aac aac aag tcc cag tcc gtg att att    391
Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln Ser Val Ile Ile
                105                 110                 115
att aac aat tct act aat gtg gtg atc cga gcc tgt aac ttt gaa ctg    439
Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys Asn Phe Glu Leu
            120                 125                 130
tgt gac aac cca ttc ttt gct gtg tct aag ccc atg ggc aca cag aca    487
Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met Gly Thr Gln Thr
        135                 140                 145
cat act atg atc ttc gat aat gcc ttt aat tgc act ttc gag tac atc    535
His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr Phe Glu Tyr Ile
        150                 155                 160
tct gat gcc ttt tcc ctg gat gtg tcc gaa aag tcc ggc aac ttt aag    583
Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser Gly Asn Phe Lys
165                 170                 175                 180
cac ctg cga gag ttt gtg ttt aag aat aag gat ggc ttt ctg tat gtg    631
His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly Phe Leu Tyr Val
                185                 190                 195
tat aag ggc tat cag cct atc gac gtg gtg cgc gat ctg cct tct ggc    679
Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp Leu Pro Ser Gly
            200                 205                 210
ttt aac act ctg aag cct att ttt aag ctg cct ctg ggc att aac att    727
Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu Gly Ile Asn Ile
        215                 220                 225
aca aat ttt cgg gcc att ctg aca gcc ttt agc cct gct cag gac att    775
Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro Ala Gln Asp Ile
    230                 235                 240
tgg ggc acc tct gct gcc gcc tat ttt gtg ggc tat ctg aag cca act    823
Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr Leu Lys Pro Thr
245                 250                 255                 260
acc ttt atg ctg aag tat gat gaa aat ggc aca atc aca gat gct gtg    871
Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile Thr Asp Ala Val
                265                 270                 275
gat tgt tct cag aat cca ctg gct gaa ctg aag tgc tct gtg aag agc    919
Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys Ser Val Lys Ser
            280                 285                 290
ttt gag att gac aag gga atc tac cag acc tct aat ttc cgc gtg gtg    967
Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn Phe Arg Val Val
        295                 300                 305
ccc tct gga gat gtg gtg aga ttc cct aat att aca aac ctg tgt cct    1015
Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr Asn Leu Cys Pro
    310                 315                 320
ttt gga gaa gtg ttt aat gct act aag ttc cct tct gtg tat gcc tgg    1063
Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser Val Tyr Ala Trp
325                 330                 335                 340
gag aga aag aag att tct aat tgt gtg gct gat tac tct gtg ctg tac    1111
Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr Ser Val Leu Tyr
                345                 350                 355
aac tcc aca ttt ttt agc acc ttt aag tgc tat ggc gtg tct gcc act    1159
Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly Val Ser Ala Thr
            360                 365                 370
aag ctg aat gat ctg tgc ttc tcc aat gtg tat gcc gat tct ttt gtg    1207
Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala Asp Ser Phe Val
        375                 380                 385
gtg aag gga gat gat gtg aga cag atc gcc cca gga cag act ggc gtg    1255
Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly Gln Thr Gly Val
    390                 395                 400
att gct gat tac aat tat aag ctg cca gat gat ttc atg ggc tgt gtg    1303
Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe Met Gly Cys Val
405                 410                 415                 420
ctg gct tgg aat act agg aac att gat gct act tcc act ggc aat tat    1351
Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser Thr Gly Asn Tyr
                425                 430                 435
aat tac aag tat cgg tat ctg aga cat ggc aag ctg agg ccc ttt gag    1399
Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu Arg Pro Phe Glu
            440                 445                 450
aga gac atc tct aac gtg cct ttc agc cct gat ggc aag cct tgc acc    1447
Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly Lys Pro Cys Thr
        455                 460                 465
cca cct gct ctg aat tgt tat tgg cca ctg aat gat tat ggc ttt tac    1495
Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp Tyr Gly Phe Tyr
    470                 475                 480
acc act act ggc att ggc tac cag cct tac aga gtg gtg gtg ctg tct    1543
Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val Val Val Leu Ser
485                 490                 495                 500
ttt gaa ctg ctg aat gcc cct gcc aca gtg tgt gga cca aag ctg tcc    1591
Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly Pro Lys Leu Ser
                505                 510                 515
act gac ctg att aag aac cag tgt gtg aac ttt aac ttt aat gga ctg    1639
Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn Phe Asn Gly Leu
            520                 525                 530
act ggc act ggc gtg ctg act cct tct agc aag aga ttt cag cca ttt    1687
Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg Phe Gln Pro Phe
        535                 540                 545
cag cag ttt ggc cgg gat gtg tct gat ttc act gat tcc gtg cga gat    1735
Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp Ser Val Arg Asp
    550                 555                 560
cct aag aca tct gaa atc ctg gac att tcc cct tgc tct ttt ggc ggc    1783
Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys Ser Phe Gly Gly
565                 570                 575                 580
gtg agc gtg att aca cct gga aca aat gct tcc tct gaa gtg gct gtg    1831
Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser Glu Val Ala Val
                585                 590                 595
ctg tat cag gat gtg aac tgc act gat gtg tct aca gcc atc cat gcc    1879
Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr Ala Ile His Ala
            600                 605                 610
gat cag ctg aca cca gct tgg cgc atc tat tct act gga aac aat gtg    1927
Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr Gly Asn Asn Val
        615                 620                 625
ttc cag act cag gcc ggc tgt ctg atc gga gct gag cat gtg gac act    1975
Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu His Val Asp Thr
    630                 635                 640
tct tat gag tgc gac att cct att gga gct ggc att tgt gct agt tac    2023
Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile Cys Ala Ser Tyr
645                 650                 655                 660
cat aca gtg tct ctg ctg cgg agt act agc cag aag tct att gtg gct    2071
His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys Ser Ile Val Ala
                665                 670                 675
tat act atg tct ctg ggc gct gat agt tcc att gct tac tct aat aac    2119
Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala Tyr Ser Asn Asn
            680                 685                 690
acc att gct atc cct act aac ttt tcc att agc att act aca gaa gtg    2167
Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile Thr Thr Glu Val
        695                 700                 705
atg cct gtg tct atg gct aag acc tcc gtg gat tgt aat atg tac atc    2215
Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys Asn Met Tyr Ile
    710                 715                 720
tgc gga gat tct acc gaa tgt gct aat ctg ctg ctg cag tat ggc agc    2263
Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu Gln Tyr Gly Ser
725                 730                 735                 740
ttt tgc aca cag ctg aat cgg gct ctg tct ggc att gct gct gaa cag    2311
Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile Ala Ala Glu Gln
                745                 750                 755
gat cgc aac aca cgg gaa gtg ttc gct caa gtg aag cag atg tat aag    2359
Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys Gln Met Tyr Lys
            760                 765                 770
acc cca act ctg aag tat ttt ggc ggc ttt aat ttt tcc cag atc ctg    2407
Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe Ser Gln Ile Leu
        775                 780                 785
cct gac cct ctg aag ccc act aag cgg tct ttt att gag gac ctg ctg    2455
Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile Glu Asp Leu Leu
    790                 795                 800
ttt aac aaa gtg aca ctg gct gat gct ggc ttt atg aag cag tat ggc    2503
Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met Lys Gln Tyr Gly
805                 810                 815                 820
gaa tgc ctg ggc gat att aat gct aga gat ctg att tgt gcc cag aag    2551
Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile Cys Ala Gln Lys
                825                 830                 835
ttc aat ggc ctg aca gtg ctg cct cct ctg ctg act gat gat atg att    2599
Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr Asp Asp Met Ile
            840                 845                 850
gct gcc tac act gct gct ctg gtg tct ggc act gcc act gct gga tgg    2647
Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala Thr Ala Gly Trp
       855                 860                 865
aca ttt ggc gct ggc gct gct ctg cag atc cct ttt gct atg cag atg    2695
Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe Ala Met Gln Met
    870                 875                 880
gcc tat cgg ttc aat ggc att gga gtg acc cag aat gtg ctg tat gag    2743
Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn Val Leu Tyr Glu
885                 890                 895                 900
aac cag aag cag att gcc aac cag ttt aac aag gcc att agt cag att    2791
Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala Ile Ser Gln Ile
                905                 910                 915
cag gaa tcc ctg aca aca aca tcc act gcc ctg ggc aag ctg cag gac    2839
Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly Lys Leu Gln Asp
            920                 925                 930
gtg gtg aac cag aat gct cag gcc ctg aac aca ctg gtg aag cag ctg    2887
Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu Val Lys Gln Leu
        935                 940                 945
agc agc aat ttt ggc gcc att tcc agt gtg ctg aat gat atc ctg tcc    2935
Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn Asp Ile Leu Ser
    950                 955                 960
cga ctg gat aaa gtg gag gcc gaa gtg cag att gac agg ctg att aca    2983
Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp Arg Leu Ile Thr
965                 970                 975                 980
ggc aga ctg cag agc ctg cag acc tat gtg aca cag cag ctg atc agg    3031
Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln Gln Leu Ile Arg
                985                 990                 995
gct gct gaa atc agg gct tct gcc aat ctg gct gct act aag atg tct    3079
Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala Thr Lys Met Ser
           1000                1005                1010
gag tgt gtg ctg gga cag tcc aag aga gtg gac ttt tgt gga aag ggc    3127
Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe Cys Gly Lys Gly
       1015                1020                1025
tac cac ctg atg tcc ttc cca cag gct gcc cct cat gga gtg gtg ttc    3175
Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His Gly Val Val Phe
   1030                1035                1040
ctg cat gtg acc tat gtg cca tcc cag gag agg aac ttc acc aca gcc    3223
Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn Phe Thr Thr Ala
1045               1050                1055                1060
cca gcc att tgt cat gaa ggc aag gcc tac ttc cct cgg gaa ggc gtg    3271
Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro Arg Glu Gly Val
               1065                1070                1075
ttc gtg ttt aat ggc act tct tgg ttt att aca cag cgg aac ttc ttt    3319
Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln Arg Asn Phe Phe
           1080                1085                1090
agc cca cag atc atc act aca gac aat aca ttt gtg tcc gga aat tgt    3367
Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val Ser Gly Asn Cys
       1095                1100                1105
gat gtg gtg att ggc atc att aac aac aca gtg tat gat cct ctg cag    3415
Asp Val Val Ile Gly Ile Ile Asn Asn Thr Val Tyr Asp Pro Leu Gln
   1110                1115                1120
cct gag ctg gac tcc ttc aag gaa gag ctg gac aag tac ttc aag aat    3463
Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys Tyr Phe Lys Asn
1125               1130                1135                1140
cat aca tcc cca gat gtg gat ctg ggc gac att tcc ggc att aac gct    3511
His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser Gly Ile Asn Ala
               1145                1150                1155
tct gtg gtg aac att cag aag gaa att gac cgc ctg aat gaa gtg gct    3559
Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu Asn Glu Val Ala
           1160                1165                1170
aag aat ctg aat gaa tcc ctg att gac ctg cag gaa ctg ggc aag tat    3607
Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu Leu Gly Lys Tyr
       1175                1180                1185
gag cag tat att aag tgg cct tgg tat gtg tgg ctg ggc ttc att gct    3655
Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu Gly Phe Ile Ala
   1190                1195                1200
gga ctg att gcc atc gtg atg gtg aca atc ctg ctg tgt tgc atg acc    3703
Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu Cys Cys Met Thr
1205               1210                1215                1220
tcc tgt tgc agt tgc ctg aag ggc gct tgc tct tgt gga tct tgc tgc    3751
Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys Gly Ser Cys Cys
               1225                1230                1235
aag ttt gat gag gat gac tct gag cca gtg ctg aag ggc gtg aag ctg    3799
Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys Gly Val Lys Leu
           1240                1245                1250
cat tac aca ggg ccc ggc ggc gac tac aag gac gat gac gac aag        3844
His Tyr Thr Gly Pro Gly Gly Asp Tyr Lys Asp Asp Asp Asp Lys
           1255                1260                1265
tgatagatcg atgcatggat ccgtttaaac cgagctccag ctttgttccc tta         3897
<210>4
<211>1267
<212>PRT
<213>SARS Coronavirus
<400>4
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
  1               5                  10                  15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
             20                  25                  30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
         35                  40                  45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
     50                  55                  60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
 65                  70                  75                  80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
                 85                  90                  95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
            100                 105                 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
        115                 120                 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
    130                 135                 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145                 150                 155                 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
                165                 170                 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
            180                 185                 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
        195                 200                 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
    210                 215                 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225                 230                 235                 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
                245                 250                 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
            260                 265                 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
        275                 280                 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
    290                 295                 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305                 310                 315                 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
                325                 330                 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
            340                 345                 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
        355                 360                 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
    370                 375                 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385                 390                 395                 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
                405                 410                 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
            420                 425                 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
        435                 440                 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
    450                 455                 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465                 470                 475                 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
                485                 490                 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
            500                 505                 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
        515                 520                 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
    530                 535                 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545                 550                 555                 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
                565                 570                 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
            580                 585                 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
        595                 600                 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
    610                 615                 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625                 630                 635                 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
                645                 650                 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
            660                 665                 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
        675                 680                 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
    690                 695                 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705                 710                 715                 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
                725                 730                 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
            740                 745                 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val  Phe Ala Gln Val Lys
        755                 760                 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
    770                 775                 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785                 790                 795                 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
                805                 810                 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
            820                 825                 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
        835                 840                 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
    850                 855                 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865                 870                 875                 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
                885                 890                 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
            900                 905                 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
        915                 920                 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
    930                 935                 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945                 950                 955                 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
                965                 970                 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
            980                 985                 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
        995                1000                1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
   1010                1015                1020
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His
1025              1030                 1035                1040
Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn
               1045                1050                1055
Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro
           1060                1065                1070
Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln
       1075                1080                1085
Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val
   1090                1095                1100
Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr Val Tyr
1105               1110                1115                1120
Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
               1125                1130                1135
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
           1140                1145                1150
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu
       1155                1160                1165
Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
   1170                1175                1180
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu
1185               1190                1195                1200
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu
               1205                1210                1215
Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys
           1220                1225                1230
Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
       1235                1240                1245
Gly Val Lys Leu His Tyr Thr Gly Pro Gly Gly Asp Tyr Lys Asp Asp
   1250                1255                1260
Asp Asp Lys
1265
<210>5
<211>1267
<212>PRT
<213>SARS Coronavirus
<400>5
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
  1               5                  10                  15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
             20                  25                  30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
         35                  40                  45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
     50                  55                  60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
 65                  70                  75                  80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
                 85                  90                  95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
            100                 105                 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
        115                 120                 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
    130                 135                 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145                 150                 155                 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
                165                 170                 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
            180                 185                 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
        195                 200                 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
    210                 215                 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225                 230                 235                 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
                245                 250                 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
            260                 265                 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
        275                 280                 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
    290                 295                 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305                 310                 315                 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
                325                 330                 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
            340                 345                 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
        355                 360                 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
    370                 375                 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385                 390                 395                 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
                405                 410                 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
            420                 425                 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
        435                 440                 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
    450                 455                 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465                 470                 475                 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
                485                 490                 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
            500                 505                 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
        515                 520                 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
    530                 535                 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545                 550                 555                 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
                565                 570                 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
            580                 585                 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
        595                 600                 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
    610                 615                 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625                 630                 635                 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
                645                 650                 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
            660                 665                 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
        675                 680                 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
    690                 695                 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705                 710                 715                 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
                725                 730                 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
            740                 745                 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
        755                 760                 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
    770                 775                 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785                 790                 795                 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
                805                 810                 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
            820                 825                 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
        835                 840                 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
    850                 855                 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865                 870                 875                 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
                885                 890                 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
            900                 905                 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
        915                 920                 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
    930                 935                 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945                 950                 955                 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
                965                 970                 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
            980                 985                 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
        995                1000                1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
    1010               1015                1020
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His
1025               1030                1035                1040
Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn
               1045                1050                1055
Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro
           1060                1065                1070
Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln
       1075                1080                1085
Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val
   1090                1095                1100
Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr Val Tyr
1105               1110                1115                1120
Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
               1125                1130                1135
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
           1140                1145                1150
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu
       1155                1160                1165
Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
   1170                1175                1180
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu
1185               1190                1195                1200
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu
               1205                1210                1215
Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys
           1220                1225                1230
Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
       1235                1240                1245
Gly Val Lys Leu His Tyr Thr Gly Pro Gly Gly Asp Tyr Lys Asp Asp
   1250                1255                1260
Asp Asp Lys
1265
<210>6
<211>3765
<212>DNA
<213>SARS Coronavirus
<400>6
atgtttattt tcctgctgtt tctgactctg accagcggca gtgacctgga ccggtgcacc  60
acttttgatg atgtgcaggc tcctaattac actcagcata cttcctctat gaggggcgtg  120
tactatcctg atgaaatttt tagatccgac actctgtatc tgactcagga tctgtttctg  180
ccattctatt ctaatgtgac aggctttcat actattaatc atacctttgg caaccctgtg  240
atccctttta aggatggcat ctattttgct gccacagaga agtccaatgt ggtgcgggga  300
tgggtgttcg gctctaccat gaacaacaag tcccagtccg tgattattat taacaattct  360
actaatgtgg tgatccgagc ctgtaacttt gaactgtgtg acaacccatt ctttgctgtg  420
tctaagccca tgggcacaca gacacatact atgatcttcg ataatgcctt taattgcact  480
ttcgagtaca tctctgatgc cttttccctg gatgtgtccg aaaagtccgg caactttaag  540
cacctgcgag agtttgtgtt taagaataag gatggctttc tgtatgtgta taagggctat  600
cagcctatcg acgtggtgcg cgatctgcct tctggcttta acactctgaa gcctattttt  660
aagctgcctc tgggcattaa cattacaaat tttcgggcca ttctgacagc ctttagccct  720
gctcaggaca tttggggcac ctctgctgcc gcctattttg tgggctatct gaagccaact  780
acctttatgc tgaagtatga tgaaaatggc acaatcacag atgctgtgga ttgttctcag  840
aatccactgg ctgaactgaa gtgctctgtg aagagctttg agattgacaa gggaatctac  900
cagacctcta atttccgcgt ggtgccctct ggagatgtgg tgagattccc taatattaca  960
aacctgtgtc cttttggaga agtgtttaat gctactaagt tcccttctgt gtatgcctgg  1020
gagagaaaga agatttctaa ttgtgtggct gattactctg tgctgtacaa ctccacattt  1080
tttagcacct ttaagtgcta tggcgtgtct gccactaagc tgaatgatct gtgcttctcc  1140
aatgtgtatg ccgattcttt tgtggtgaag ggagatgatg tgagacagat cgccccagga  1200
cagactggcg tgattgctga ttacaattat aagctgccag atgatttcat gggctgtgtg  1260
ctggcttgga atactaggaa cattgatgct acttccactg gcaattataa ttacaagtat  1320
cggtatctga gacatggcaa gctgaggccc tttgagagag acatctctaa cgtgcctttc  1380
agccctgatg gcaagccttg caccccacct gctctgaatt gttattggcc actgaatgat  1440
tatggctttt acaccactac tggcattggc taccagcctt acagagtggt ggtgctgtct  1500
tttgaactgc tgaatgcccc tgccacagtg tgtggaccaa agctgtccac tgacctgatt  1560
aagaaccagt gtgtgaactt taactttaat ggactgactg gcactggcgt gctgactcct  1620
tctagcaaga gatttcagcc atttcagcag tttggccggg atgtgtctga tttcactgat  1680
tccgtgcgag atcctaagac atctgaaatc ctggacattt ccccttgctc ttttggcggc  1740
gtgagcgtga ttacacctgg aacaaatgct tcctctgaag tggctgtgct gtatcaggat  1800
gtgaactgca ctgatgtgtc tacagccatc catgccgatc agctgacacc agcttggcgc  1860
atctattcta ctggaaacaa tgtgttccag actcaggccg gctgtctgat cggagctgag  1920
catgtggaca cttcttatga gtgcgacatt cctattggag ctggcatttg tgctagttac  1980
catacagtgt ctctgctgcg gagtactagc cagaagtcta ttgtggctta tactatgtct  2040
ctgggcgctg atagttccat tgcttactct aataacacca ttgctatccc tactaacttt  2100
tccattagca ttactacaga agtgatgcct gtgtctatgg ctaagacctc cgtggattgt  2160
aatatgtaca tctgcggaga ttctaccgaa tgtgctaatc tgctgctgca gtatggcagc  2220
ttttgcacac agctgaatcg ggctctgtct ggcattgctg ctgaacagga tcgcaacaca  2280
cgggaagtgt tcgctcaagt gaagcagatg tataagaccc caactctgaa gtattttggc  2340
ggctttaatt tttcccagat cctgcctgac cctctgaagc ccactaagcg gtcttttatt  2400
gaggacctgc tgtttaacaa agtgacactg gctgatgctg gctttatgaa gcagtatggc  2460
gaatgcctgg gcgatattaa tgctagagat ctgatttgtg cccagaagtt caatggcctg  2520
acagtgctgc ctcctctgct gactgatgat atgattgctg cctacactgc tgctctggtg  2580
tctggcactg ccactgctgg atggacattt ggcgctggcg ctgctctgca gatccctttt  2640
gctatgcaga tggcctatcg gttcaatggc attggagtga cccagaatgt gctgtatgag  2700
aaccagaagc agattgccaa ccagtttaac aaggccatta gtcagattca ggaatccctg  2760
acaacaacat ccactgccct gggcaagctg caggacgtgg tgaaccagaa tgctcaggcc  2820
ctgaacacac tggtgaagca gctgagcagc aattttggcg ccatttccag tgtgctgaat  2880
gatatcctgt cccgactgga taaagtggag gccgaagtgc agattgacag gctgattaca  2940
ggcagactgc agagcctgca gacctatgtg acacagcagc tgatcagggc tgctgaaatc  3000
agggcttctg ccaatctggc tgctactaag atgtctgagt gtgtgctggg acagtccaag  3060
agagtggact tttgtggaaa gggctaccac ctgatgtcct tcccacaggc tgcccctcat  3120
ggagtggtgt tcctgcatgt gacctatgtg ccatcccagg agaggaactt caccacagcc  3180
ccagccattt gtcatgaagg caaggcctac ttccctcggg aaggcgtgtt cgtgtttaat  3240
ggcacttctt ggtttattac acagcggaac ttctttagcc cacagatcat cactacagac  3300
aatacatttg tgtccggaaa ttgtgatgtg gtgattggca tcattaacaa cacagtgtat  3360
gatcctctgc agcctgagct ggactccttc aaggaagagc tggacaagta cttcaagaat  3420
catacatccc cagatgtgga tctgggcgac atttccggca ttaacgcttc tgtggtgaac  3480
attcagaagg aaattgaccg cctgaatgaa gtggctaaga atctgaatga atccctgatt  3540
gacctgcagg aactgggcaa gtatgagcag tatattaagt ggccttggta tgtgtggctg  3600
ggcttcattg ctggactgat tgccatcgtg atggtgacaa tcctgctgtg ttgcatgacc  3660
tcctgttgca gttgcctgaa gggcgcttgc tcttgtggat cttgctgcaa gtttgatgag  3720
gatgactctg agccagtgct gaagggcgtg aagctgcatt acaca                  3765
<210>7
<211>1255
<212>PRT
<213>SARS Coronavirus
<400>7
Met Phe Ile Phe Leu Leu Phe Leu Thr Leu Thr Ser Gly Ser Asp Leu
  1               5                  10                  15
Asp Arg Cys Thr Thr Phe Asp Asp Val Gln Ala Pro Asn Tyr Thr Gln
             20                  25                  30
His Thr Ser Ser Met Arg Gly Val Tyr Tyr Pro Asp Glu Ile Phe Arg
         35                  40                  45
Ser Asp Thr Leu Tyr Leu Thr Gln Asp Leu Phe Leu Pro Phe Tyr Ser
     50                  55                  60
Asn Val Thr Gly Phe His Thr Ile Asn His Thr Phe Gly Asn Pro Val
 65                  70                  75                  80
Ile Pro Phe Lys Asp Gly Ile Tyr Phe Ala Ala Thr Glu Lys Ser Asn
                 85                  90                  95
Val Val Arg Gly Trp Val Phe Gly Ser Thr Met Asn Asn Lys Ser Gln
            100                 105                 110
Ser Val Ile Ile Ile Asn Asn Ser Thr Asn Val Val Ile Arg Ala Cys
        115                 120                 125
Asn Phe Glu Leu Cys Asp Asn Pro Phe Phe Ala Val Ser Lys Pro Met
    130                 135                 140
Gly Thr Gln Thr His Thr Met Ile Phe Asp Asn Ala Phe Asn Cys Thr
145                 150                 155                 160
Phe Glu Tyr Ile Ser Asp Ala Phe Ser Leu Asp Val Ser Glu Lys Ser
                165                 170                 175
Gly Asn Phe Lys His Leu Arg Glu Phe Val Phe Lys Asn Lys Asp Gly
            180                 185                 190
Phe Leu Tyr Val Tyr Lys Gly Tyr Gln Pro Ile Asp Val Val Arg Asp
        195                 200                 205
Leu Pro Ser Gly Phe Asn Thr Leu Lys Pro Ile Phe Lys Leu Pro Leu
    210                 215                 220
Gly Ile Asn Ile Thr Asn Phe Arg Ala Ile Leu Thr Ala Phe Ser Pro
225                 230                 235                 240
Ala Gln Asp Ile Trp Gly Thr Ser Ala Ala Ala Tyr Phe Val Gly Tyr
                245                 250                 255
Leu Lys Pro Thr Thr Phe Met Leu Lys Tyr Asp Glu Asn Gly Thr Ile
            260                 265                 270
Thr Asp Ala Val Asp Cys Ser Gln Asn Pro Leu Ala Glu Leu Lys Cys
        275                 280                 285
Ser Val Lys Ser Phe Glu Ile Asp Lys Gly Ile Tyr Gln Thr Ser Asn
    290                 295                 300
Phe Arg Val Val Pro Ser Gly Asp Val Val Arg Phe Pro Asn Ile Thr
305                 310                 315                 320
Asn Leu Cys Pro Phe Gly Glu Val Phe Asn Ala Thr Lys Phe Pro Ser
                325                 330                 335
Val Tyr Ala Trp Glu Arg Lys Lys Ile Ser Asn Cys Val Ala Asp Tyr
            340                 345                 350
Ser Val Leu Tyr Asn Ser Thr Phe Phe Ser Thr Phe Lys Cys Tyr Gly
        355                 360                 365
Val Ser Ala Thr Lys Leu Asn Asp Leu Cys Phe Ser Asn Val Tyr Ala
    370                 375                 380
Asp Ser Phe Val Val Lys Gly Asp Asp Val Arg Gln Ile Ala Pro Gly
385                 390                 395                 400
Gln Thr Gly Val Ile Ala Asp Tyr Asn Tyr Lys Leu Pro Asp Asp Phe
                405                 410                 415
Met Gly Cys Val Leu Ala Trp Asn Thr Arg Asn Ile Asp Ala Thr Ser
            420                 425                 430
Thr Gly Asn Tyr Asn Tyr Lys Tyr Arg Tyr Leu Arg His Gly Lys Leu
        435                 440                 445
Arg Pro Phe Glu Arg Asp Ile Ser Asn Val Pro Phe Ser Pro Asp Gly
    450                 455                 460
Lys Pro Cys Thr Pro Pro Ala Leu Asn Cys Tyr Trp Pro Leu Asn Asp
465                 470                 475                 480
Tyr Gly Phe Tyr Thr Thr Thr Gly Ile Gly Tyr Gln Pro Tyr Arg Val
                485                 490                 495
Val Val Leu Ser Phe Glu Leu Leu Asn Ala Pro Ala Thr Val Cys Gly
            500                 505                 510
Pro Lys Leu Ser Thr Asp Leu Ile Lys Asn Gln Cys Val Asn Phe Asn
        515                 520                 525
Phe Asn Gly Leu Thr Gly Thr Gly Val Leu Thr Pro Ser Ser Lys Arg
    530                 535                 540
Phe Gln Pro Phe Gln Gln Phe Gly Arg Asp Val Ser Asp Phe Thr Asp
545                 550                 555                 560
Ser Val Arg Asp Pro Lys Thr Ser Glu Ile Leu Asp Ile Ser Pro Cys
                565                 570                 575
Ser Phe Gly Gly Val Ser Val Ile Thr Pro Gly Thr Asn Ala Ser Ser
            580                 585                 590
Glu Val Ala Val Leu Tyr Gln Asp Val Asn Cys Thr Asp Val Ser Thr
        595                 600                 605
Ala Ile His Ala Asp Gln Leu Thr Pro Ala Trp Arg Ile Tyr Ser Thr
    610                 615                 620
Gly Asn Asn Val Phe Gln Thr Gln Ala Gly Cys Leu Ile Gly Ala Glu
625                 630                 635                 640
His Val Asp Thr Ser Tyr Glu Cys Asp Ile Pro Ile Gly Ala Gly Ile
                645                 650                 655
Cys Ala Ser Tyr His Thr Val Ser Leu Leu Arg Ser Thr Ser Gln Lys
            660                 665                 670
Ser Ile Val Ala Tyr Thr Met Ser Leu Gly Ala Asp Ser Ser Ile Ala
        675                 680                 685
Tyr Ser Asn Asn Thr Ile Ala Ile Pro Thr Asn Phe Ser Ile Ser Ile
    690                 695                 700
Thr Thr Glu Val Met Pro Val Ser Met Ala Lys Thr Ser Val Asp Cys
705                 710                 715                 720
Asn Met Tyr Ile Cys Gly Asp Ser Thr Glu Cys Ala Asn Leu Leu Leu
                725                 730                 735
Gln Tyr Gly Ser Phe Cys Thr Gln Leu Asn Arg Ala Leu Ser Gly Ile
            740                 745                 750
Ala Ala Glu Gln Asp Arg Asn Thr Arg Glu Val Phe Ala Gln Val Lys
        755                 760                 765
Gln Met Tyr Lys Thr Pro Thr Leu Lys Tyr Phe Gly Gly Phe Asn Phe
    770                 775                 780
Ser Gln Ile Leu Pro Asp Pro Leu Lys Pro Thr Lys Arg Ser Phe Ile
785                 790                 795                 800
Glu Asp Leu Leu Phe Asn Lys Val Thr Leu Ala Asp Ala Gly Phe Met
                805                 810                 815
Lys Gln Tyr Gly Glu Cys Leu Gly Asp Ile Asn Ala Arg Asp Leu Ile
            820                 825                 830
Cys Ala Gln Lys Phe Asn Gly Leu Thr Val Leu Pro Pro Leu Leu Thr
        835                 840                 845
Asp Asp Met Ile Ala Ala Tyr Thr Ala Ala Leu Val Ser Gly Thr Ala
    850                 855                 860
Thr Ala Gly Trp Thr Phe Gly Ala Gly Ala Ala Leu Gln Ile Pro Phe
865                 870                 875                 880
Ala Met Gln Met Ala Tyr Arg Phe Asn Gly Ile Gly Val Thr Gln Asn
                885                 890                 895
Val Leu Tyr Glu Asn Gln Lys Gln Ile Ala Asn Gln Phe Asn Lys Ala
            900                 905                 910
Ile Ser Gln Ile Gln Glu Ser Leu Thr Thr Thr Ser Thr Ala Leu Gly
        915                 920                 925
Lys Leu Gln Asp Val Val Asn Gln Asn Ala Gln Ala Leu Asn Thr Leu
    930                 935                 940
Val Lys Gln Leu Ser Ser Asn Phe Gly Ala Ile Ser Ser Val Leu Asn
945                 950                 955                 960
Asp Ile Leu Ser Arg Leu Asp Lys Val Glu Ala Glu Val Gln Ile Asp
                965                 970                 975
Arg Leu Ile Thr Gly Arg Leu Gln Ser Leu Gln Thr Tyr Val Thr Gln
            980                 985                 990
Gln Leu Ile Arg Ala Ala Glu Ile Arg Ala Ser Ala Asn Leu Ala Ala
        995                1000                1005
Thr Lys Met Ser Glu Cys Val Leu Gly Gln Ser Lys Arg Val Asp Phe
   1010                1015                1020
Cys Gly Lys Gly Tyr His Leu Met Ser Phe Pro Gln Ala Ala Pro His
1025               1030                1035                1040
Gly Val Val Phe Leu His Val Thr Tyr Val Pro Ser Gln Glu Arg Asn
               1045                1050                1055
Phe Thr Thr Ala Pro Ala Ile Cys His Glu Gly Lys Ala Tyr Phe Pro
           1060                1065                1070
Arg Glu Gly Val Phe Val Phe Asn Gly Thr Ser Trp Phe Ile Thr Gln
        1075                1080                1085
Arg Asn Phe Phe Ser Pro Gln Ile Ile Thr Thr Asp Asn Thr Phe Val
   1090                1095                1100
Ser Gly Asn Cys Asp Val Val Ile Gly Ile Ile Asn Asn Thr Val Tyr
1105               1110                1115                1120
Asp Pro Leu Gln Pro Glu Leu Asp Ser Phe Lys Glu Glu Leu Asp Lys
               1125                1130                1135
Tyr Phe Lys Asn His Thr Ser Pro Asp Val Asp Leu Gly Asp Ile Ser
           1140                1145                1150
Gly Ile Asn Ala Ser Val Val Asn Ile Gln Lys Glu Ile Asp Arg Leu
       1155                1160                1165
Asn Glu Val Ala Lys Asn Leu Asn Glu Ser Leu Ile Asp Leu Gln Glu
   1170                1175                1180
Leu Gly Lys Tyr Glu Gln Tyr Ile Lys Trp Pro Trp Tyr Val Trp Leu
1185               1190                1195                1200
Gly Phe Ile Ala Gly Leu Ile Ala Ile Val Met Val Thr Ile Leu Leu
               1205                1210                1215
Cys Cys Met Thr Ser Cys Cys Ser Cys Leu Lys Gly Ala Cys Ser Cys
           1220                1225                1230
Gly Ser Cys Cys Lys Phe Asp Glu Asp Asp Ser Glu Pro Val Leu Lys
       1235                1240                1245
Gly Val Lys Leu His Tyr Thr
   1250                1255

Claims (57)

1.一种纯化的核酸分子,其包含SEQ ID NO:2(Spike-Pasteur-modif)、SEQ ID NO:3(Spike-HKU-PRC)、或SEQ ID NO:6。
2.一种纯化的核酸分子,其编码一种氨基酸序列,所述氨基酸序列包含SEQ ID NO:4或SEQ ID NO:7的序列,其中所述纯化的核酸分子与SEQ ID NO:1相比显示出增强的刺突蛋白的表达。
3.一种纯化的核酸分子,其与包含SEQ ID NO:3或SEQ ID NO:6的核酸序列的变性的双链DNA的任一链在高严格性条件下杂交。
4.权利要求3的纯化的核酸分子,其中所述纯化的核酸分子与SEQID NO:1相比显示出增强的刺突蛋白的表达。
5.权利要求4的纯化的核酸分子,其包含至少一种负顺式作用信号的置换,且其中所编码的所述刺突蛋白的多肽序列没有改变。
6.权利要求5的纯化的核酸分子,其中所述负顺式作用信号包含以下一组中的至少一种:
(a)富含AU的RNA不稳定性基序;
(b)重复序列;
(c)二级序列段(secondary stretch);
(d)剪接供体和受体位点;和
(e)内部poly(A)位点。
7.权利要求6的纯化的核酸分子,其中所述纯化的核酸分子还包含至少一种额外的表达增强序列。
8.权利要求7的纯化的核酸分子,其中所述额外的表达增强序列包含以下一组中的至少一种:
(a)Kozak共有序列;和
(b)额外的STOP密码子。
9.权利要求4的纯化的核酸分子,其中密码子的使用已经根据中国仓鼠(Cricetulus griseus)的偏好进行优化。
10.权利要求4的纯化的核酸分子,其中所述纯化的核酸分子的编码所述刺突蛋白的部分与SEQ ID NO:1相比,其GC含量百分比增加至少大约10%。
11.权利要求7的纯化的核酸分子,其中所述至少一种负顺式作用信号的置换和其中所述至少一种额外的表达增强序列不包括:
(a)内部TATA盒、chi位点、和核糖体进入位点;
(b)富含AT或富含GC的序列段;
(c)重复序列和RNA二级结构;和
(d)剪接供体和受体位点。
12.一种重组载体,其指导选自权利要求1至3中任一项的纯化的核酸分子的核酸分子的表达。
13.一种纯化的多肽,其包含SEQ ID NO:4、SEQ ID NO:5、或SEQID NO:7。
14.一种纯化的多肽,其由选自权利要求1至3中任一项的纯化的核酸分子的核酸分子编码。
15.权利要求14的纯化的多肽,其中所述纯化的多肽包含高甘露糖EndoH敏感性N-聚糖。
16.纯化的抗体,所述抗体结合权利要求14的多肽。
17.权利要求16的纯化的抗体,其中所述抗体是单克隆抗体。
18.权利要求16的纯化的抗体,其中所述抗体包含中和抗体。
19.用权利要求12的载体转染或者转导的宿主细胞。
20.权利要求19的宿主细胞,其中所述宿主细胞选自293T细胞、BHK细胞、和FRHK4细胞。
21.增强由核酸分子表达SARS CoV刺突多肽的方法,包括降低所述核酸分子中的负顺式作用信号的数量,其中负顺式作用信号的数量的降低不改变所述SARS CoV刺突多肽的序列。
22.权利要求21的方法,其中所述负顺式作用信号包含以下一组中的至少一种:富含AU的RNA不稳定性基序;重复序列;二级序列段;剪接供体和受体位点;和内部poly(A)位点。
23.权利要求22的方法,其中所述方法还包括引入额外的信号而不改变所述SARS CoV刺突多肽的序列。
24.权利要求23的方法,其中所述额外的信号包含Kozak共有序列和额外的STOP密码子中的至少一种。
25.权利要求24的方法,还包括根据中国仓鼠的偏好优化密码子的使用。
26.权利要求24的方法,还包括将刺突核苷酸的编码区内的GC含量增加至少大约10%。
27.一种分离的免疫复合物,其包含SARS CoV刺突多肽和特异性识别所述多肽的抗体。
28.一种分离的免疫复合物,其包含SARS CoV刺突多肽和特异性识别所述多肽的抗体,其中所述抗体是针对权利要求14的纯化的多肽产生的。
29.一种检测SARS病毒感染的方法,其中所述方法包括提供包含疑似感染了SARS病毒的生物学材料的组合物,以及测定刺突多肽的存在。
30.权利要求29的方法,其中通过电泳或者通过使用与所述刺突多肽发生免疫学反应的抗体的免疫测定来测定所述刺突多肽。
31.一种检测SARS病毒感染的方法,其中所述方法包括提供包含疑似感染了SARS病毒的生物学材料的组合物,以及测定刺突多肽的存在,其中所述抗体是针对权利要求14的纯化的多肽产生的。
32.用于检测是否存在结合包含SARS CoV刺突多肽的抗原的抗体的体外诊断方法,其中所述方法包括将所述抗原与一种生物学液体相接触,接触的时间和条件足以使得所述抗原与生物学液体中的抗体形成抗原抗体复合物,以及检测所述复合物的形成。
33.权利要求32的方法,其还包括测量所述抗原抗体复合物的形成。
34.权利要求33的方法,其中通过基于蛋白印迹技术、ELISA、间接免疫荧光测定法、或免疫沉淀测定法的免疫测定法来检测抗原抗体复合物的形成。
35.用于检测是否存在结合包含权利要求14的纯化的多肽的抗原的抗体的体外诊断方法,其中所述方法包括将所述抗原与一种生物学液体相接触,接触的时间和条件足以使得所述抗原与生物学液体中的抗体形成抗原抗体复合物,以及检测所述复合物的形成。
36.用于检测是否存在结合SARS CoV刺突多肽或其混合物的抗体的诊断试剂盒,所述试剂盒包括包含SARS CoV刺突多肽或SARS CoV刺突多肽的混合物的抗原,以及用于检测所述抗原与抗体之间形成免疫复合物的试剂,其中所述试剂的量足以进行所述检测。
37.用于检测是否存在结合SARS CoV刺突多肽或其混合物的抗体的诊断试剂盒,所述试剂盒包括包含权利要求14的纯化的多肽的抗原,以及用于检测所述抗原与抗体之间形成免疫复合物的试剂,其中所述试剂的量足以进行所述检测。
38.一种免疫原性组合物,其包含至少一种SARS CoV刺突多肽以及药用可接受的载体,所述SARS CoV刺突多肽的量足以在体内诱导免疫原性或保护性应答。
39.权利要求38的免疫原性组合物,其中所述组合物包含中和量的至少一种SARS CoV刺突多肽。
40.权利要求38的免疫原性组合物,还包含Alum佐剂。
41.一种免疫原性组合物,其包含权利要求14的纯化的多肽以及药用可接受的载体,所述多肽的量足以在体内诱导免疫原性或保护性应答。
42.用权利要求41的免疫原性组合物处理宿主的方法,包括给宿主施用所述免疫原性组合物,所施用的免疫原性组合物的量足以在体内诱导免疫原性或保护性应答。
43.权利要求42的方法,其中通过腹腔内途径施用所述免疫原性组合物。
44.权利要求42的方法,其中所述免疫原性组合物还包括Alum佐剂。
45.权利要求42的方法,其中所述免疫原性组合物按照一剂量方案施用,所述剂量方案包括两次或者多次施用2-20μg的SARS CoV刺突肽。
46.一种抗SARS CoV的疫苗组合物,其包括权利要求14的多肽。
47.一种抗SARS CoV的免疫接种方法,其包括给有需要的动物施用权利要求46的疫苗组合物。
48.权利要求47的方法,其中所述免疫接种方法诱导增强的粘膜IgA和IgG抗体。
49.权利要求48的方法,其中所述疫苗组合物还包括Alum佐剂。
50.权利要求49的方法,其中所述疫苗组合物按照一剂量方案施用,所述剂量方案包括两次或者多次施用2-20μg的SARS CoV刺突肽以及Alum佐剂。
51.一种检测是否存在SARS CoV的方法,其包括:
(1)将疑似含有SARS CoV病毒遗传物质的样品与至少一种核苷酸探针相接触,和
(2)检测所述核苷酸探针与样品中的病毒遗传物质之间的杂交,其中所述核苷酸探针互补于SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、或SEQ ID NO:6的纯化核酸的全长序列。
52.一种质粒,其保藏于C.N.C.M,保藏号为I-3221、I-3222、或I-3223。
53.由权利要求52的质粒编码的SARS CoV刺突多肽。
54.编码SARS CoV刺突多肽的片段的多核苷酸,其与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、或SEQ ID NO:6相比具有至少一种突变。
55.权利要求54的核苷酸序列或多核苷酸的片段,其包含至少10个连续的核苷酸且最多150个连续的核苷酸。
56.一种多核苷酸组合物,其至少包含权利要求54或55的核苷酸序列。
57.权利要求1-11、13-15和53-55中任一项的多肽或多核苷酸,其能够诱导抗SARS感染的T细胞应答。
CN 200580026090 2004-06-04 2005-06-03 与sars冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物 Pending CN101039955A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US86064104A 2004-06-04 2004-06-04
US10/860,641 2004-06-04
US60/578,348 2004-06-10

Publications (1)

Publication Number Publication Date
CN101039955A true CN101039955A (zh) 2007-09-19

Family

ID=38890172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200580026090 Pending CN101039955A (zh) 2004-06-04 2005-06-03 与sars冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物

Country Status (1)

Country Link
CN (1) CN101039955A (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111196857A (zh) * 2020-02-05 2020-05-26 杭州贤至生物科技有限公司 一种新型冠状病毒多表位重组抗原及其制备方法
CN111926040A (zh) * 2020-10-12 2020-11-13 天津中逸安健生物科技有限公司 一种新型冠状病毒rbd核苷酸序列、优化方法与应用
CN113336832A (zh) * 2020-03-02 2021-09-03 成都威斯克生物医药有限公司 抗SARS-CoV-2感染的蛋白以及含有该蛋白的疫苗
CN113557431A (zh) * 2020-02-19 2021-10-26 欧蒙医学实验诊断股份公司 诊断SARS-CoV-2感染的方法和试剂
WO2021254270A1 (zh) * 2020-06-15 2021-12-23 上海市公共卫生临床中心 基于细胞膜展示冠状病毒免疫原以诱导中和抗体的方法
CN113862286A (zh) * 2021-12-03 2021-12-31 艾棣维欣(苏州)生物制药有限公司 编码sars-cov-2病毒c.37突变株抗原的dna分子、dna疫苗及应用
CN115916254A (zh) * 2020-04-06 2023-04-04 卫材R&D管理有限公司 疫苗、佐剂和产生免疫应答的方法

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111196857A (zh) * 2020-02-05 2020-05-26 杭州贤至生物科技有限公司 一种新型冠状病毒多表位重组抗原及其制备方法
CN111196857B (zh) * 2020-02-05 2023-07-21 杭州贤至生物科技有限公司 一种新型冠状病毒多表位重组抗原及其制备方法
CN113557431A (zh) * 2020-02-19 2021-10-26 欧蒙医学实验诊断股份公司 诊断SARS-CoV-2感染的方法和试剂
CN113336832A (zh) * 2020-03-02 2021-09-03 成都威斯克生物医药有限公司 抗SARS-CoV-2感染的蛋白以及含有该蛋白的疫苗
CN115916254A (zh) * 2020-04-06 2023-04-04 卫材R&D管理有限公司 疫苗、佐剂和产生免疫应答的方法
WO2021254270A1 (zh) * 2020-06-15 2021-12-23 上海市公共卫生临床中心 基于细胞膜展示冠状病毒免疫原以诱导中和抗体的方法
CN111926040A (zh) * 2020-10-12 2020-11-13 天津中逸安健生物科技有限公司 一种新型冠状病毒rbd核苷酸序列、优化方法与应用
CN113862286A (zh) * 2021-12-03 2021-12-31 艾棣维欣(苏州)生物制药有限公司 编码sars-cov-2病毒c.37突变株抗原的dna分子、dna疫苗及应用
CN113862286B (zh) * 2021-12-03 2022-03-04 艾棣维欣(苏州)生物制药有限公司 编码sars-cov-2病毒c.37突变株抗原的dna分子、dna疫苗及应用

Similar Documents

Publication Publication Date Title
CN1282656C (zh) 来自gagp17和p24保守区域的HIV肽以及它们在例如疫苗中的应用
CN1205995C (zh) 具有增强药物动力特性的杂合肽
CN100339395C (zh) 戊型肝炎病毒单克隆抗体及其用途
CN1833022A (zh) 包含HCV的多蛋白NS3/NS4和多肽NS5b的组合物,包括相应核酸序列的表达载体及它们的治疗应用
CN1526020A (zh) 重组融合蛋白的二聚体、三聚体、四聚体或五聚体的二聚物或寡聚物
CN1346367A (zh) Hiv肽,抗原,疫苗组合物,检测hiv所诱导的抗体的免疫测定试剂盒及方法
CN1671423A (zh) 新型嵌合cd154
CN1884303A (zh) SARS-CoV病毒结构蛋白的融合蛋白及其高量表达与纯化和用途
CN1845995A (zh) 用于破坏宿主对外来抗原的耐受性的嵌合抗原
CN1333873A (zh) Hiv-特异的t-细胞诱导
CN1609617A (zh) 诊断与预防严重急性呼吸道综合症(sars)的组合物和方法
CN1203180C (zh) 来自脑膜炎奈瑟氏球菌的basb006多核苷酸和多肽
CN1198933C (zh) 登革病毒的前m/m蛋白的表位、合成肽
CN1798844A (zh) Sars病毒抗原的细胞表面表达载体和用该载体转化的微生物
CN1259422C (zh) 呼吸合胞病毒的吸附(g)蛋白衍生的肽
CN1151185A (zh) 瘟病毒株的核苷酸序列,由这些序列编码的多肽及其在诊断和预防瘟病毒感染中的应用
CN1738833A (zh) Hcv疫苗
CN101033468A (zh) 幽门螺杆菌尿素酶b亚单位b细胞抗原表位多肽及鉴定方法与应用
CN1678630A (zh) 具有修饰的ns3结构域的hcv融合蛋白
CN1458936A (zh) 来自Tat、Rev和Nef保守区的HIV肽以及它们作为例如疫苗组分的应用
CN1122108C (zh) 口蹄疫病毒的免疫原性肽
CN1255540C (zh) 一株疫苗诱导的乙型肝炎病毒株及其应用
CN1304452A (zh) 减毒瘟病毒
CN101039955A (zh) 与sars冠状病毒刺突蛋白相关的核酸、多肽、表达方法和免疫原性组合物
CN1856503A (zh) 来源于c型肝炎病毒的肽

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20070919