CN113436683B - 筛选候选插入片段的方法和系统 - Google Patents

筛选候选插入片段的方法和系统 Download PDF

Info

Publication number
CN113436683B
CN113436683B CN202010207885.8A CN202010207885A CN113436683B CN 113436683 B CN113436683 B CN 113436683B CN 202010207885 A CN202010207885 A CN 202010207885A CN 113436683 B CN113436683 B CN 113436683B
Authority
CN
China
Prior art keywords
sequence
coding region
candidate
sequences
uas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010207885.8A
Other languages
English (en)
Other versions
CN113436683A (zh
Inventor
黄慧雅
曹玉冰
刘乙齐
郭亚琨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Syngentech Co ltd
Original Assignee
Beijing Syngentech Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Syngentech Co ltd filed Critical Beijing Syngentech Co ltd
Priority to CN202010207885.8A priority Critical patent/CN113436683B/zh
Publication of CN113436683A publication Critical patent/CN113436683A/zh
Application granted granted Critical
Publication of CN113436683B publication Critical patent/CN113436683B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K16/00Immunoglobulins [IGs], e.g. monoclonal or polyclonal antibodies
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2317/00Immunoglobulins specific features
    • C07K2317/60Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments
    • C07K2317/62Immunoglobulins specific features characterized by non-natural combinations of immunoglobulin fragments comprising only variable region components
    • C07K2317/622Single chain antibody (scFv)

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Organic Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medical Informatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Biochemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Medicinal Chemistry (AREA)
  • Artificial Intelligence (AREA)
  • Analytical Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Plant Pathology (AREA)
  • Databases & Information Systems (AREA)
  • Epidemiology (AREA)
  • Evolutionary Computation (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明提出了一种筛选候选插入片段的方法,所述插入片段用于改造待测样本核酸序列。该方法包括:基于用于改造待测样本核酸序列的候选基因,确定初始基因编码区序列;对所述初始基因编码区序列进行同义密码子替换,以便获得由多个候选编码区序列构成的候选编码区序列集合;将所述候选编码区序列与自身、宿主基因组和病毒基因组进行比对,并确定同源性高风险区域,以便对所述候选编码区序列进行同源性风险评分;和基于所述同源性风险评分,在所述候选编码区序列集合中确定优选编码区序列子集。

Description

筛选候选插入片段的方法和系统
技术领域
本发明涉及生物信息领域,具体地,本发明涉及筛选候选插入片段的方法和系统。
背景技术
病毒往往具有稳定的结构、简单的基因组、广谱的侵染能力与高效的包装能力而成为广泛使用的工程化DNA转运表达载体。而利用病毒自身的免疫特性,研究者使用灭活、减毒或工程改造的病毒作为有效的疫苗。更进一步,利用病毒在扩增过程中裂解宿主细胞的生物特性,研究者将病毒工程改造为具有复制包装能力并特异性实现肿瘤杀伤作用的溶瘤病毒。随着病毒相关研究的逐渐深入,目前已有多种工程病毒种类成为工程改造的对象,并有多种病毒产品应用于临床治疗。腺病毒与其它病毒类型相比,由于其相对稳定的结构、约9000bp的包装容量、较低的毒副作用而备受青睐,不仅可以作为DNA转运表达的非复制型载体,也可以作为溶瘤杀伤的复制型载体。
虽然腺病毒作为工程载体具有上述优势,但即使是相对稳定的腺病毒亚型,如常用的5型腺病毒,在大规模药学生产过程中,随着培养代数增加,单核苷酸变异、小片段插入删除变异与大片段结构性变异的发生与积累也会逐渐增加。而另一方面,工程改造过程中引入的人工外源序列可能与自身及病毒基因组存在高度同源的区域,提升了由同源重组导致结构性变异的风险。这种同源性风险进一步影响了工程腺病毒基因组的稳定性。上述变异不仅影响了工程腺病毒药学生产的产量和纯度,也有可能影响工程腺病毒的功能与安全性。比如,非复制型工程腺病毒的药学生产过程中产生复制型腺病毒、受控复制型工程腺病毒的药学生产过程中产生不受控复制型腺病毒都是质量控制关注的重点。
发明内容
本申请是基于发明人对以下事实和问题的发现和认识作出的:
工程病毒的药学生产过程中,人工外源序列自身与病毒基因组可能存在高度同源的区域,提升了由同源重组导致结构性变异的风险。发明人通过对人工外源序列与病毒基因组序列特征进行信息学分析,预测分析存在同源性风险的区域,并结合同义密码子替换与同源亚型替换等方式降低序列的同源性风险,增加工程病毒基因组的稳定性。
为此,在本发明的第一方面,本发明提出了一种筛选候选插入片段的方法,所述插入片段用于改造待测样本核酸序列。根据本发明的实施例,所述方法包括:(1)基于用于改造待测样本核酸序列的候选基因,确定初始基因编码区序列;(2)对所述初始基因编码区序列进行同义密码子替换,以便获得由多个候选编码区序列构成的候选编码区序列集合;(3)将所述候选编码区序列与宿主基因组和病毒基因组进行比对,并确定同源性高风险区域,以便对所述候选编码区序列进行同源性风险评分;(4)基于所述同源性风险评分,在所述候选编码区序列集合中确定优选编码区序列子集。
根据本发明的实施例,上述方法还可以进一步包括如下附加技术特征至少之一:
根据本发明的实施例,所述方法进一步包括:
基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子对偏好性评分;或基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子偏好性评分;或基于所述候选编码区序列中的C碱基频率、G碱基频率和CpG序列频率,对所述候选编码区序列进行CpG评分;或基于所述候选编码区序列中的A碱基频率,T碱基频率和TpA序列频率,对所述候选编码区序列进行TpA评分;或基于所述候选编码区序列的编码mRNA序列,预测RNA二级结构的最小自由能;或基于所述候选编码区序列中的微卫星序列,对所述候选编码区序列进行微卫星不稳定性评分。
根据本发明的实施例,步骤(4)进一步包括:基于所述同源性风险评分以及包括下列评分的至少之一,在所述候选编码区序列集合中确定优选编码区序列子集,
所述密码子对偏好性评分、所述密码子偏好性评分、所述CpG评分、所述TpA评分、所述mRNA二级结构最小自由能和所述微卫星不稳定性评分。
其中,同源性风险评分、密码子对偏好性评分、密码子偏好性评分、CpG评分、TpA评分、mRNA二级结构最小自由能与微卫星不稳定性评分优先级逐级降低。
根据本发明实施例的上述方法可以获得基因编码区序列的候选插入片段(在本文实施例中称同源序列),该候选插入片段可以有效降低由同源重组导致的结构性变异的风险,提高待测样本核酸序列(如病毒基因组)的稳定性。
根据本发明的实施例,采用滑窗序列比对法,所述滑窗的长度为12~17bp。
根据本发明的实施例,在步骤(3)中,所述同源性风险评分是基于如下方式确定的:
通过滑窗序列比对,统计错配数分别为0~4 bp、参考序列分别为自身或病毒基因组或宿主基因组序列时的最长一致序列长度与频数,按优先级由高至低依次比较错配数、参考序列与最长一致序列,按优先级由高至低比较错配数0~4 bp,按优先级由高至低比较参考序列为自身、病毒基因组与宿主基因组序列,按优先级由高至低比较最长一致序列长度与频数,比较不同候选编码区序列的同源性风险,优先级越高、数值越大时同源性风险越高;
根据本发明的实施例,所述密码子对偏好性评分是基于下列公式确定的:
根据本发明的实施例,所述密码子偏好性评分是基于下列公式确定的:
根据本发明的实施例,所述CpG评分是基于下列公式确定的:
根据本发明的实施例,所述TpA评分是基于下列公式确定的:
根据本发明的实施例,所述RNA二级结构最小自由能预测基于软件Mfold或ViennaRNA。
根据本发明的实施例,所述微卫星不稳定性评分是基于如下方式确定的:
对于连续重复至少3次、微卫星序列长度小于同源性风险评分滑窗长度的微卫星区域,统计最长微卫星区域长度与频数,按优先级由高至低比较最长微卫星区域长度与频数,优先级越高、数值越大时微卫星不稳定性越高。
根据本发明的实施例,在步骤(1)中,进一步确定初始非编码区序列,并且进一步包括:(5)获取所述初始非编码区序列的第一同源亚型序列;(6)基于所述初始非编码区序列和所述第一同源亚型序列,分别确定各自的保守性区域和非保守性区域;(7)通过对对所述非保守性区域进行随机突变和截短处理的至少之一,获得由多个候选非编码区序列构成的候选非编码区序列集合:(8)对所述非编码区序列进行所述同源性风险评分以及任选地微卫星不稳定性评分,在所述候选非编码区序列集合中确定优选非编码区序列子集。
在本发明的第二方面,本发明提出了一种筛选候选插入片段的方法,所述插入片段用于改造待测样本核酸序列。根据本发明的实施例,所述方法包括:
(a)基于用于改造待测样本核酸序列的候选基因,确定初始非编码区序列;
(b)获取所述初始非编码区序列的第一同源亚型序列;
(c)基于所述初始非编码区序列和所述第一同源亚型序列,分别确定各自的保守性区域和非保守性区域;
(d)通过对对所述非保守性区域进行随机突变和截短处理的至少之一,获得由多个候选非编码区序列构成的候选非编码区序列集合:
(e)对所述非编码区序列进行所述同源性风险评分以及任选地所述微卫星不稳定性评分;
(f)基于所述同源性风险评分以及任选地所述微卫星不稳定性评分,在所述候选非编码区序列集合中确定优选非编码区序列子集。
根据本发明实施例的上述方法可以获得基因非编码区序列的候选插入片段(在本文实施例中称同源序列),该候选插入片段可以有效降低由同源重组导致的结构性变异的风险,提高待测样本核酸序列(如病毒基因组)的稳定性。
根据本发明的实施例,所述改造待测样本核酸序列包括病毒基因组序列。
在本发明的第三方面,本发明提出了一种计算机可读存储介质,其上存储有计算机程序。根据本发明的实施例,该程序被处理器执行时实现前面所述的筛选候选插入片段的方法。
在本发明的第四方面,本发明提出了一种电子设备。根据本发明的实施例,所述电子设备包括存储器、处理器;其中,所述处理器通过读取所述存储器中存储的可执行程序代码来运行与所述可执行程序代码对应的程序,以用于实现前面所述的筛选候选插入片段的方法。
在本发明的第五方面,本发明提出了一种筛选候选插入片段的系统,所述插入片段用于改造待测样本核酸序列。根据本发明的实施例,所述系统包括:确定初始基因编码区序列装置,所述确定初始基因编码区序列装置基于用于改造待测样本核酸序列的候选基因,确定初始基因编码区序列;确定候选编码区序列集合装置,所述确定候选编码区序列集合装置与所述确定初始基因编码区序列装置相连,用于对所述初始基因编码区序列进行同义密码子替换,以便获得由多个候选编码区序列构成的候选编码区序列集合;同源性风险评分装置,所述同源性风险评分装置与所述确定候选编码区序列集合装置相连,用于将所述候选编码区序列与宿主基因组和病毒基因组进行比对,并确定同源性高风险区域,以便对所述候选编码区序列进行同源性风险评分;以及任选地密码子对偏好性评分装置,所述密码子对偏好性评分装置与所述确定候选编码区序列集合装置相连,用于基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子对偏好性评分;或密码子偏好性评分装置,所述密码子偏好性评分装置与所述确定候选编码区序列集合装置相连,用于基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子偏好性评分;或CpG评分装置,所述CpG评分装置与所述确定候选编码区序列集合装置相连,用于基于所述候选编码区序列中的C碱基频率、G碱基频率和CpG序列频率,对所述候选编码区序列进行CpG评分;或TpA评分装置,所述TpA评分装置与所述确定候选编码区序列集合装置相连,用于基于所述候选编码区序列中的A碱基频率,T碱基频率和TpA序列频率,对所述候选编码区序列进行TpA评分;或mRNA二级结构最小自由能预测装置,所述mRNA二级结构最小自由能预测装置与所述候选编码区序列集合装置相连,用于基于所述候选编码区序列mRNA序列,对所述候选编码区序列进行mRNA二级结构最小自由能预测;或微卫星不稳定性评分装置,所述微卫星不稳定性评分装置与所述候选编码区序列集合装置相边,用于基于所述候选编码区序列中的微卫星序列,对所述候选编码区序列进行微卫星不稳定性评分;和确定优选编码区序列子集装置,所述确定优选编码区序列子集装置与所述同源性风险评分装置以及任选地密码子对偏好性评分装置、密码子偏好性评分装置、CpG评分装置、TpA评分装置、mRNA二级结构最小自由能预测装置和微卫星不稳定性评分装置相连,用于基于所述同源性风险评分以及任选地所述密码子对偏好性评分、所述密码子偏好性评分、所述CpG评分、所述TpA评分、所述mRNA二级结构最小自由能和所述微卫星不稳定性评分,在所述候选编码区序列集合中确定优选编码区序列子集。根据本发明实施例的上述系统适于执行上述筛选候选插入片段的方法,以降低序列的同源性风险,增加工程病毒基因组的稳定性。
在本发明的第六方面,本发明提出了一种筛选候选插入片段的系统,所述插入片段用于改造待测样本核酸序列,所述系统包括:确定初始非编码区序列装置;第一同源亚型序列获取装置,所述第一同源亚型序列获取装置与所述确定初始非编码区序列装置相连,用于获取所述初始非编码区序列的第一同源亚型序列;确定保守性区域和非保守性区域装置,所述确定保守性区域和非保守性区域装置与所述确定初始非编码区序列装置和所述第一同源亚型序列获取装置相连,用于基于所述初始非编码区序列和所述第一同源亚型序列,分别确定各自的保守性区域和非保守性区域;确定候选非编码区序列集合装置,所述确定候选非编码区序列集合装置与所述确定保守性区域和非保守性区域装置相连,通过对对所述非保守性区域进行随机突变和截短处理的至少之一,获得由多个候选非编码区序列构成的候选非编码区序列集合:确定优选非编码区序列子集装置,所述确定优选非编码区序列子集装置与所述确定候选非编码区序列集合装置相连,用于对所述非编码区序列进行所述同源性风险评分以及任选地所述微卫星不稳定性评分,在所述候选非编码区序列集合中确定优选非编码区序列子集。
在本发明的第七方面,本发明提出了一种UAS序列。根据本发明的实施例,所述序列具有SEQ ID NO:1、4~6、14、17、23、25、31、34所示的核苷酸序列。发明人通过前面所述的方法对UAS的同源序列进行筛选,发现,具有SEQ ID NO:1、4~6、14、17、23、25、31、34所示的核苷酸序列表达强度较强,可用于组合UAS的构建。
在发明的第八方面,本发明提出了一组UAS组合。根据本发明的实施例,所述组合包括一系列UAS序列,所述UAS序列具有SEQ ID NO:4~6以及17所示的核苷酸序列;或SEQID NO:1、23、31以及34所示的核苷酸序列;或SEQ ID NO:1、4、5、6以及14所示的核苷酸序列;或SEQ ID NO:17、23、25、31以及34所示的核苷酸序列。发明人通过前面所述的方法对UAS同源序列进行筛选,发现,具有SEQ ID NO:1、4~6、14、17、23、25、31、34所示的核苷酸序列的UAS下游启动子表达强度较强,当采用上述的UAS序列组合构建互抑制开关型基因线路,所构建的四对组合启动子对与原启动子开关型基因线路相比,开关状态间的表达差异倍数均维持10倍以上,但源于启动子的病毒15代变异率从0.1降至未检出水平,因此,可以说,根据本发明实施例的上述UAS组合在维持下游启动子表达强度的同时有效降低了同源性风险。
根据本发明的实施例,所述UAS组合从5’端到3’端具有如下所示的UAS连接顺序:
B1-A5-A6-A4(SEQ ID NO:39)、D5-A1-D2-C1(SEQ ID NO:41)、A5-A1-A6-A4-A14(SEQ ID NO:42)或B1-D5-D2-C1-C3(SEQ ID NO:44)。
在发明的第九方面,本发明提出了一种Ni-scFv基因序列。根据本发明的实施例,所述序列具有SEQ ID NO:46或47所示的核苷酸序列。发明人通过前面所述的方法对Ni-scFv基因的同源序列进行筛选,发现,具有SEQ ID NO:46或47所示的核苷酸序列的Ni-scFv基因,最长无错配同源区域长度得到降低,15代变异率从0.01降至未检出水平,而有效含量与优化前相比无显著差异,因此,具有SEQ ID NO:46或47所示的核苷酸序列的Ni-scFv基因在维持目的基因功能的同时有效降低了同源性风险。
在发明的第十方面,本发明提出了一种At-scFv基因序列。根据本发明的实施例,所述序列具有SEQ ID NO:49或50所示的核苷酸序列。发明人通过前面所述的方法对At-scFv基因的同源序列进行筛选,发现,具有SEQ ID NO:49或50所示的核苷酸序列的At-scFv基因,最长无错配同源区域长度得到降低,15代变异率从0.01降至未检出水平,而有效含量与优化前相比无显著差异,因此,具有SEQ ID NO:49或50所示的核苷酸序列的At-scFv基因在维持目的基因功能的同时有效降低了同源性风险。
附图说明
图1是病毒同源性序列分析优化流程;
图2是Gal4蛋白结合位点模式分布(引自10.1093/nar/gkl857);
图3是4x UAS与5x UAS同源亚型启动子表达强度测试;
图4是UAS同源亚型组合启动子表达强度测试;
图5是UAS同源亚型组合启动子对构建互抑制开关型基因线路开关状态间表达差异测试;
图6是UAS优化前后工程病毒功能与基因组稳定性测试;
图7是目的基因序列优化前后工程病毒功能与基因组稳定性测试;
图8是根据本发明实施例的筛选候选插入片段的系统的结构示意图;以及
图9是根据本发明另一实施例的筛选候选插入片段的系统的结构示意图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
本发明提出了一种筛选候选插入片段的系统,所述插入片段用于改造待测样本核酸序列。根据本发明的实施例,参考图8,所述系统包括:确定初始基因编码区序列装置100,所述确定初始基因编码区序列装置100基于用于改造待测样本核酸序列的候选基因,确定初始基因编码区序列;确定候选编码区序列集合装置200,所述确定候选编码区序列集合装置200与所述确定初始基因编码区序列装置100相连,用于对所述初始基因编码区序列进行同义密码子替换,以便获得由多个候选编码区序列构成的候选编码区序列集合;同源性风险评分装置300,所述同源性风险评分装置300与所述确定候选编码区序列集合装置200相连,用于将所述候选编码区序列与宿主基因组和病毒基因组进行比对,并确定同源性高风险区域,以便对所述候选编码区序列进行同源性风险评分;以及任选地密码子对偏好性评分装置,所述密码子对偏好性评分装置与所述确定候选编码区序列集合装置相连,用于基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子对偏好性评分;或密码子偏好性评分装置,所述密码子偏好性评分装置与所述确定候选编码区序列集合装置相连,用于基于所述宿主中的密码子频率,对所述候选编码区序列进行密码子偏好性评分;或CpG评分装置,所述CpG评分装置与所述确定候选编码区序列集合装置相连,用于基于所述候选编码区序列中的C碱基频率、G碱基频率和CpG序列频率,对所述候选编码区序列进行CpG评分;或TpA评分装置,所述TpA评分装置与所述确定候选编码区序列集合装置相连,用于基于所述候选编码区序列中的A碱基频率,T碱基频率和TpA序列频率,对所述候选编码区序列进行TpA评分;或mRNA二级结构最小自由能预测装置,所述mRNA二级结构最小自由能预测装置与所述候选编码区序列集合装置相连,用于基于所述候选编码区序列mRNA序列,对所述候选编码区序列进行mRNA二级结构最小自由能预测;或微卫星不稳定性评分装置,所述微卫星不稳定性评分装置与所述候选编码区序列集合装置相边,用于基于所述候选编码区序列中的微卫星序列,对所述候选编码区序列进行微卫星不稳定性评分;和确定优选编码区序列子集装置400,所述确定优选编码区序列子集装置与所述同源性风险评分装置300以及任选地密码子对偏好性评分装置、密码子偏好性评分装置、CpG评分装置、TpA评分装置、mRNA二级结构最小自由能预测装置和微卫星不稳定性评分装置相连,用于基于所述同源性风险评分以及任选地所述密码子对偏好性评分、所述密码子偏好性评分、所述CpG评分、所述TpA评分、所述mRNA二级结构最小自由能和所述微卫星不稳定性评分,在所述候选编码区序列集合中确定优选编码区序列子集。根据本发明实施例的上述系统适于执行上述筛选候选插入片段的方法,以降低序列的同源性风险,增加工程病毒基因组的稳定性。
在本发明的第六方面,本发明提出了一种筛选候选插入片段的系统,所述插入片段用于改造待测样本核酸序列,参考图9,所述系统包括:确定初始非编码区序列装置500;第一同源亚型序列获取装置600,所述第一同源亚型序列获取装置600与所述确定初始非编码区序列装置500相连,用于获取所述初始非编码区序列的第一同源亚型序列;确定保守性区域和非保守性区域装置700,所述确定保守性区域和非保守性区域装置700与所述确定初始非编码区序列装置500和所述第一同源亚型序列获取装置相连600,用于基于所述初始非编码区序列和所述第一同源亚型序列,分别确定各自的保守性区域和非保守性区域;确定候选非编码区序列集合装置800,所述确定候选非编码区序列集合装置800与所述确定保守性区域和非保守性区域装置700相连,通过对对所述非保守性区域进行随机突变和截短处理的至少之一,获得由多个候选非编码区序列构成的候选非编码区序列集合:确定优选非编码区序列子集装置900,所述确定优选非编码区序列子集装置900与所述确定候选非编码区序列集合装置相连800,用于对所述非编码区序列进行所述同源性风险评分以及任选地所述微卫星不稳定性评分,在所述候选非编码区序列集合中确定优选非编码区序列子集。
本申请是基于发明人对以下事实和问题的发现和认识作出的:
工程病毒的药学生产过程中,人工外源序列自身与病毒基因组可能存在高度同源的区域,提升了由同源重组导致结构性变异的风险。发明人通过对人工外源序列与病毒基因组序列特征进行信息学分析,预测分析存在同源性风险的区域,并结合同义密码子替换与同源亚型替换等方式降低序列的同源性风险,增加工程病毒基因组的稳定性。
实施例1
具体流程如下:
通过文献调研、一代测序等方式获得工程病毒(如腺病毒)的参考基因组序列与待优化的人工外源序列。通过数据整理等方式获得人基因组密码子频率与密码子对频率。
1)使用短序列比对软件(如Bowtie)对人工外源序列与自身、人基因组和工程腺病毒基因组序列进行滑窗序列比对,滑窗长度为12~17bp,错配数为0~4bp,输出最长一致序列长度与频数,并进行评分;按优先级由高至低依次比较错配数、参考序列与最长一致序列,按优先级由高至低比较错配数0~4bp,按优先级由高至低比较参考序列为自身、病毒基因组与宿主基因组序列,按优先级由高至低比较最长一致序列长度与频数,比较不同候选编码区序列的同源性风险,优先级越高、数值越大时同源性风险越高;根据腺病毒实验经验,最长一致序列长度15bp以上、错配0bp的区域为同源性风险高的区域。
2)对于位于基因编码区的序列,进行服从人基因组密码子频率分布的同义密码子随机替换,过滤其中包含影响序列克隆与载体构建的酶切位点序列、同源克隆序列与条形码序列的随机序列,获得编码氨基酸不变的5000条备选优化序列。
3)分别对备选序列进行步骤1)的同源性风险评分。分别对备选序列进行密码子对频率统计,并结合人基因组密码子对偏好性进行密码子对偏好性评分和密码子偏好性评分,评分方式为
分别对备选序列进行CpG与TpA序列特征频率统计并进行评分,评分方式为
使用软件Mfold或ViennaRNA分别对备选序列进行mRNA二级结构最小自由能预测。
分别对备选序列进行微卫星序列特征统计并进行评分,对于连续重复至少3次、微卫星序列长度小于同源性风险评分滑窗长度的微卫星区域,统计最长微卫星区域长度与频数,按优先级由高至低比较最长微卫星区域长度与频数,优先级越高、数值越大时微卫星不稳定性越高。
基于上述评分对备选序列进行排序,筛选各项评分均为前50的备选序列,从中选择备选序列进行生物学功能与工程腺病毒基因组稳定性实验验证。
4)对于位于其它调控区域的序列,通过文献挖掘获得生物学功能相近的同源亚型序列;通过序列相似性搜索软件(如Blast)进行分析,获得序列保守性区域;通过对非保守性区域进行随机突变、截短等方式获得其它备选同源亚型序列,并过滤其中包含影响序列克隆与载体构建的酶切位点序列、同源克隆序列与条形码序列的随机序列。
5)分别对备选序列进行步骤1)的同源性风险评分和微卫星不稳定性评分并排序,从中选择备选序列进行生物学功能与工程腺病毒基因组稳定性实验验证。
6)最终筛选出序列功能相近而病毒保持传代稳定性同源性优化序列。
根据本发明实施例的流程示意图如图1所示。
下面将进一步详细描述本发明的实施例,所述实施例的示例在附图中示出。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
Gal4/UAS是存在于酵母中的基因表达调控系统。转录调控因子Gal4的结合域可以与UAS序列(启动子上游的转录因子结合位点)结合,而激活域可以激活下游启动子。多个串联的UAS可以有效增强Gal4的结合能力以增强对于下游启动子的激活强度。在病毒载体中,UAS的同源序列可能导致重组变异而失去功能。
由此,发明人对UAS进行了同源序列优化。
实施例2UAS同源序列优化
实验一
检测4x UAS与5x UAS不同同源亚型下游启动子表达强度
通过生物信息学分析,可得Gal4蛋白结合位点的序列模式如图2所示。分别参考不同的野生型Gal4蛋白结合位点,对非保守区域进行同源亚型替换,并将过同源性风险评分,获得一系列UAS同源亚型序列如SEQ ID NO:1~37所示。
>A1
CGGAGTACTGTCCTCCG(SEQ ID NO:1)。
>A2
CGGAGGACTGTCCTCCG(SEQ ID NO:2)。
>A3
CGGAGAACTGTTCTCCG(SEQ ID NO:3)。
>A4
CGGAGCACTGTGCTCCG(SEQ ID NO:4)。
>A5
CGGACTACTGTAGTCCG(SEQ ID NO:5)。
>A6
CGGACGACTGTCGTCCG(SEQ ID NO:6)。
>A7
CGGACAACTGTTGTCCG(SEQ ID NO:7)。
>A8
CGGACCACTGTGGTCCG(SEQ ID NO:8)。
>A9
CGGAATACTGTATTCCG(SEQ ID NO:9)。
>A10
CGGAAGACTGTCTTCCG(SEQ ID NO:10)。
>A11
CGGAAAACTGTTTTCCG(SEQ ID NO:11)。
>A12
CGGAACACTGTGTTCCG(SEQ ID NO:12)。
>A13
CGGATTACTGTAATCCG(SEQ ID NO:13)。
>A14
CGGATGACTGTCATCCG(SEQ ID NO:14)。
>A15
CGGATAACTGTTATCCG(SEQ ID NO:15)。
>A16
CGGATCACTGTGATCCG(SEQ ID NO:16)。
>B1
CGGGGTGCCGCCCCCCG(SEQ ID NO:17)。
>B2
CGGGATGCCGCATCCCG(SEQ ID NO:18)。
>B3
CGGGAAGCCGCTTCCCG(SEQ ID NO:19)。
>B4
CGGGTTGCCGCAACCCG(SEQ ID NO:20)。
>B5
CGGGTAGCCGCTACCCG(SEQ ID NO:21)。
>B6
CGGGCCGCCGCGTCCCG(SEQ ID NO:22)。
>C1
CGGAGTGCCGCACTCCG(SEQ ID NO:23)。
>C2
CGGGGTACTGTACCCCG(SEQ ID NO:24)。
>C3
CGGAGTGCTGTACTCCG(SEQ ID NO:25)。
>C4
CGGAGTACCGTACTCCG(SEQ ID NO:26)。
>C5
CGGGGTGCTGCACCCCG(SEQ ID NO:27)。
>C6
CGGGGTACCGTACCCCG(SEQ ID NO:28)。
>C7
CGGGGTGCCGCACCCCG(SEQ ID NO:29)。
>D1
CGGTCCACTGTGTGCCG(SEQ ID NO:30)。
>D2
CGGGTGACAGCCCTCCG(SEQ ID NO:31)。
>D3
CGGCCATATGTCTTCCG(SEQ ID NO:32)。
>D4
CGGCGGTCTTTCGTCCG(SEQ ID NO:33)。
>D5
CGGGTGACCGCCCTCCG(SEQ ID NO:34)。
>D6
CGGTCCACAGTGTGCCG(SEQ ID NO:35)。
>D7
CGGCCATATCGCTTCCG(SEQ ID NO:36)。
>D8
CGGGTGACAGCCCTCCG(SEQ ID NO:37)。
使用UAS同源亚型A1、C3、D1~D5构建4x启动子,分别转染靶细胞测试原启动子与各亚型启动报告基因的表达强度,并以原启动子表达强度归一化为相对表达强度,比较各亚型与原启动子间的表达差异。
使用UAS同源亚型A2~A16、B1~B5、C1~C6、D1~D2构建5x启动子,分别转染靶细胞测试原启动子与各亚型启动报告基因的表达强度,并以原启动子表达强度归一化为相对表达强度,比较各亚型与原启动子间的表达差异。
检测结果如图3。各同源亚型中,A1、A4、A5、A6、A14、B1、C1、C3、D2、D5相对表达强度较强,可用于构建组合UAS启动子。
实验二
检测4x UAS与5x UAS组合不同同源亚型下游启动子表达强度
根据实验一结果与序列间同源性,构建4x UAS与5x UAS组合启动子如表2,并添加两种不同的抑制位点,分别转染靶细胞测试原启动子与各亚型组合启动子报告基因的表达强度,并以原启动子表达强度归一化为相对表达强度,比较各亚型组合启动子与原启动子间的表达差异。
表2:
组合启动子 UAS同源亚型
组合A A5-A1-A6-A4
组合B B1-A5-A6-A4
组合C B1-D5-D2-C1
组合D D5-A1-D2-C1
组合E A5-A1-A6-A4-A14
组合F B1-A5-A6-A4-A14
组合G B1-D5-D2-C1-C3
组合H D5-A1-D2-C1-C3
>A5-A1-A6-A4
CGGACTACTGTAGTCCGCGGAGTACTGTCCTCCGCGGACGACTGTCGTCCGCGGAGCACTGTGCTCCG(SEQ ID NO:38)。
>B1-A5-A6-A4
CGGGGTGCCGCCCCCCGCGGACTACTGTAGTCCGCGGACGACTGTCGTCCGCGGAGCACTGTGCTCCG(SEQ ID NO:39)。
>B1-D5-D2-C1
CGGGGTGCCGCCCCCCGCGGGTGACCGCCCTCCGCGGGTGACAGCCCTCCGCGGAGTGCCGCACTCCG(SEQ ID NO:40)。
>D5-A1-D2-C1
CGGGTGACCGCCCTCCGCGGAGTACTGTCCTCCGCGGGTGACAGCCCTCCGCGGAGTGCCGCACTCCG(SEQ ID NO:41)。
>A5-A1-A6-A4-A14
CGGACTACTGTAGTCCGCGGAGTACTGTCCTCCGCGGACGACTGTCGTCCGCGGAGCACTGTGCTCCGCGGATGACTGTCATCCG(SEQ ID NO:42)。
>B1-A5-A6-A4-A14
CGGGGTGCCGCCCCCCGCGGACTACTGTAGTCCGCGGACGACTGTCGTCCGCGGAGCACTGTGCTCCGCGGATGACTGTCATCCG(SEQ ID NO:43)。
>B1-D5-D2-C1-C3
CGGGGTGCCGCCCCCCGCGGGTGACCGCCCTCCGCGGGTGACAGCCCTCCGCGGAGTGCCGCACTCCGCGGAGTGCTGTACTCCG(SEQ ID NO:44)。
>D5-A1-D2-C1-C3
CGGGTGACCGCCCTCCGCGGAGTACTGTCCTCCGCGGGTGACAGCCCTCCGC GGAGTGCCGCACTCCGCGGAGTGCTGTACTCCG(SEQ ID NO:45)。
使用添加了不同抑制位点的组合启动子对启动相应抑制子表达,构建互抑制开关型基因线路(构建方法参考专利PCT/CN2017/096043),分别转染靶细胞测试原启动子对与各亚型组合启动子对开关型基因线路中报告基因开关状态的表达差异倍数,比较各亚型组合启动子对与原启动子对开关型基因线路开关状态间的表达差异倍数。
检测结果如图4~5。各同源亚型组合启动子中,组合B、组合D、组合E、组合G表达强度较强,用于构建互抑制开关型基因线路。所构建的四对组合启动子对与原启动子开关型基因线路相比,开关状态间的表达差异倍数均维持10倍以上。
实验三
检测启动子优化前后工程病毒功能与稳定性差异
装载原启动子开关型基因线路的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;装载组合B-组合D启动子对开关型基因线路的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;等量的两种工程病毒侵染靶细胞后,测定启动子启动的目的基因产物功能性有效含量,并以启动子优化前水平归一化为相对表达强度;比较序列同源性优化前后启动子表达强度与病毒基因组稳定性。
检测结果如图6。通过启动子序列优化,源于启动子的病毒15代变异率从0.1降至未检出水平,而表达的目的基因有效含量与优化前相比无显著差异。可见通过同源性序列优化,在维持启动子表达强度的同时有效降低了同源性风险。
程序性死亡受体1(PD-1)与其配体(PD-L1)是重要的免疫检查点分子,T细胞表面的PD-1分子与配体PD-L1(常见于肿瘤表面)结合后会抑制T细胞活化与增殖并诱导T细胞凋亡,是肿瘤微环境免疫抑制性的重要机制。使用单链抗体(scFv)结合PD-1或PD-L1以阻止二者结合可以有效增强肿瘤微环境中的免疫作用,可单独作为小分子靶向药物或装载于其它靶向药物载体。在病毒载体中,scFv中的同源序列可能导致重组变异而失去功能。在本申请中,靶向PD-1的单链抗体被称为Ni-scFv,靶向PD-L1的被称为At-scFv。
由此,发明人对Ni-scFv基因和At-scFv基因进行了同源序列优化。
实施例3目的基因同源序列优化
分别对靶向PD-L1的At-scFv与靶向PD-1的Ni-scFv基因进行同源序列优化。
实验一
Ni-scFv基因同源序列优化
通过同义密码子替换,并依据实施例1的方式获得的Ni-scFv基因同源亚型序列如SEQ ID NO:46~48所示
>Ni-scFv-a
ATGTCCGTTCCAACCCAGGTTCTCGGCCTCCTACTGCTGTGGCTCACCGATGCCAGATGCCAGGTGCAATTGGTAGAGTCCGGGGGCGGGGTGGTGCAGCCAGGGCGATCTTTGCGGTTAGACTGCAAGGCATCCGGAATAACCTTTTCTAATAGCGGGATGCATTGGGTGAGACAAGCACCCGGAAAAGGCCTTGAATGGGTAGCAGTCATATGGTATGACGGTAGCAAACGCTACTATGCAGACTCGGTCAAGGGTCGATTCACTATTAGTCGCGATAACAGCAAGAATACCTTGTTCCTGCAGATGAACTCACTACGGGCTGAAGACACAGCTGTCTATTACTGTGCAACCAACGACGATTATTGGGGACAGGGGACCTTGGTCACCGTCAGTTCCGGGGGAGGGGGATCCGGAGGCGGCGGCTCAGGAGGAGGTGGCTCCGAGATCGTACTGACTCAGAGCCCGGCAACTTTGTCTCTGTCGCCTGGCGAGCGGGCCACACTGTCCTGTAGGGCCTCACAGAGCGTGAGTTCATATCTAGCTTGGTATCAACAGAAGCCGGGGCAGGCCCCTAGATTGCTAATCTACGATGCAAGTAACAGAGCAACTGGCATCCCCGCGAGATTTAGCGGATCCGGTTCCGGAACCGACTTTACACTCACTATCTCCTCCCTAGAACCAGAAGATTTTGCAGTCTACTATTGCCAACAGTCGTCCAACTGGCCTCGCACATTTGGGCAGGGAACCAAGGTTGAAATTAAA(SEQ ID NO:46)。
>Ni-scFv-b
ATGTCCGTTCCCACCCAGGTGCTCGGCCTCCTATTACTCTGGCTAACTGATGCCCGGTGTCAGGTGCAGCTCGTGGAGAGTGGAGGGGGTGTGGTTCAGCCGGGTCGGTCACTGCGGCTGGACTGTAAAGCTAGCGGTATCACGTTCAGTAACTCAGGTATGCACTGGGTACGGCAGGCCCCCGGCAAAGGCTTGGAGTGGGTTGCTGTGATATGGTACGATGGTTCTAAAAGGTATTATGCTGATTCCGTGAAGGGCCGGTTTACCATATCACGCGACAACTCCAAGAACACGCTCTTCCTCCAGATGAATTCACTCCGAGCGGAAGACACCGCGGTTTATTATTGCGCCACCAATGATGACTACTGGGGCCAGGGCACCTTGGTTACCGTGTCTAGCGGAGGGGGGGGCTCGGGGGGCGGCGGTAGCGGTGGAGGTGGGTCCGAGATCGTCCTCACGCAATCCCCCGCCACCCTTAGTCTCAGCCCTGGGGAGCGGGCAACCCTTAGCTGCCGGGCGTCCCAGTCAGTCAGTTCCTACCTTGCCTGGTACCAGCAAAAGCCCGGCCAGGCACCTCGCCTCCTTATTTATGATGCATCGAACCGAGCAACCGGAATTCCTGCGCGGTTCAGTGGTTCTGGTAGCGGGACCGACTTCACACTTACAATATCTAGCCTAGAACCAGAAGACTTCGCTGTCTACTACTGCCAACAGAGCTCGAACTGGCCTAGAACATTCGGGCAGGGCACCAAGGTAGAAATCAAA(SEQ ID NO:47)。
>Ni-scFv-c
ATGAGCGTGCCCACCCAGGTGCTGGGCCTGCTGCTGCTGTGGCTGACCGACGCCAGGTGCCAGGTGCAGCTGGTGGAGAGCGGCGGCGGCGTGGTGCAGCCCGGCAGGAGCCTGAGGCTGGACTGCAAGGCCAGCGGCATCACCTTCAGCAACAGCGGCATGCACTGGGTGAGGCAGGCCCCCGGCAAGGGCCTGGAGTGGGTGGCCGTGATCTGGTACGACGGCAGCAAGAGGTACTACGCCGACAGCGTGAAGGGCAGGTTCACCATCAGCAGGGACAACAGCAAGAACACCCTGTTCCTGCAGATGAACAGCCTGAGGGCCGAGGACACCGCCGTGTACTACTGCGCCACCAACGACGACTACTGGGGCCAGGGCACCCTGGTGACCGTGAGCAGCGGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGAGATCGTGCTGACCCAGAGCCCCGCCACCCTGAGCCTGAGCCCCGGCGAGAGGGCCACCCTGAGCTGCAGGGCCAGCCAGAGCGTGAGCAGCTACCTGGCCTGGTACCAGCAGAAGCCCGGCCAGGCCCCCAGGCTGCTGATCTACGACGCCAGCAACAGGGCCACCGGCATCCCCGCCAGGTTCAGCGGCAGCGGCAGCGGCACCGACTTCACCCTGACCATCAGCAGCCTGGAGCCCGAGGACTTCGCCGTGTACTACTGCCAGCAGAGCAGCAACTGGCCCAGGACCTTCGGCCAGGGCACCAAGGTGGAGATCAAG(SEQ ID NO:48)。
装载目的基因的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;装载同源性优化后的目的基因的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;等量的两种工程病毒侵染靶细胞后,测定目的基因产物功能性有效含量,并以目的基因优化前水平归一化为相对有效含量;比较序列同源性优化前后目的基因功能与病毒基因组稳定性。
检测结果见表3与图7。目的基因序列优化前,与自身序列最长无错配同源区域为16bp,为高同源性风险区域,传代15代后可检出变异率达0.01;与病毒骨架序列最长无错配同源区域为14bp,未达到高同源性风险,传代15代后未检出变异;通过目的基因序列优化,获得的最优Ni-scFv基因同源亚型序列Ni-scFv-a与Ni-scFv-b,最长无错配同源区域长度得到降低,15代变异率从0.01降至未检出水平,而有效含量与优化前相比无显著差异。可见通过同源性序列优化,在维持目的基因功能的同时有效降低了同源性风险。
表3:
实验二
通过同义密码子替换,并依据实施例1的方法获得的At-scFv基因同源亚型序列如SEQ ID NO:49~51所示。
>At-scFv-a
ATGTCCGTCCCTACTCAGGTACTAGGCCTCCTCTTGCTATGGCTGACCGACGCTAGATGCGAAGTGCAACTGGTCGAATCCGGCGGTGGCTTGGTCCAGCCAGGCGGATCATTACGCCTGTCTTGTGCAGCATCAGGCTTCACCTTTAGTGACAGTTGGATCCATTGGGTCCGGCAAGCCCCAGGCAAAGGGCTGGAATGGGTCGCCTGGATTAGCCCATATGGCGGCAGCACCTATTACGCCGACAGCGTCAAGGGGCGCTTTACCATTAGTGCTGACACAAGTAAGAATACCGCTTATCTGCAGATGAATAGCCTGCGGGCCGAAGACACGGCTGTTTACTACTGTGCACGACGCCACTGGCCGGGCGGTTTTGACTATTGGGGACAAGGAACTCTCGTGACAGTCTCGTCGGGAGGCGGCGGTTCAGGTGGCGGCGGCTCAGGAGGGGGGGGTTCTGATATACAGATGACACAATCCCCTTCTTCTCTGAGCGCAAGTGTGGGCGATCGGGTAACCATCACCTGTCGGGCTTCCCAGGACGTGAGTACAGCCGTGGCTTGGTATCAACAGAAGCCAGGCAAGGCCCCGAAGCTGCTAATCTACAGCGCTAGTTTCCTGTACTCAGGGGTGCCGAGCCGCTTTAGCGGAAGTGGATCTGGTACTGACTTCACACTTACTATCAGTTCTCTACAGCCGGAAGACTTCGCTACATATTACTGCCAGCAGTATCTCTATCACCCCGCTACTTTTGGACAAGGAACAAAAGTTGAGATCAAG(SEQ ID NO:49)。
>At-scFv-b
ATGTCAGTCCCCACCCAGGTCCTTGGACTACTCCTTCTATGGTTGACAGATGCCCGCTGCGAAGTCCAGTTGGTGGAATCCGGGGGCGGCCTTGTACAGCCCGGGGGGAGCCTGAGACTCAGCTGTGCCGCTTCAGGATTTACCTTCTCTGATTCCTGGATACATTGGGTACGTCAGGCCCCTGGGAAGGGATTGGAGTGGGTGGCCTGGATCAGTCCATACGGTGGCTCTACGTACTATGCGGACAGCGTCAAAGGGCGCTTTACTATTAGTGCAGATACATCGAAGAATACAGCCTACCTGCAGATGAATTCATTGAGGGCAGAGGACACTGCCGTCTATTACTGTGCAAGAAGGCACTGGCCCGGCGGCTTCGACTATTGGGGACAGGGCACCCTGGTCACAGTATCTTCAGGCGGAGGAGGTTCCGGGGGCGGCGGCTCCGGCGGTGGAGGCTCAGATATCCAGATGACACAGAGCCCCAGCTCTTTATCAGCTTCAGTGGGCGATCGGGTCACCATCACTTGTCGTGCCTCTCAGGATGTGTCTACCGCCGTGGCCTGGTATCAACAGAAACCCGGCAAGGCCCCAAAATTACTGATATATAGTGCAAGCTTCCTGTACTCAGGAGTCCCTTCACGCTTCTCCGGCTCGGGCAGTGGGACCGACTTTACTCTGACGATATCCAGTCTGCAGCCTGAAGATTTCGCTACCTACTACTGTCAACAGTACTTGTACCACCCCGCAACATTCGGACAGGGGACCAAAGTAGAAATTAAA(SEQ ID NO:50)。
>At-scFv-c
ATGAGCGTGCCCACCCAGGTGCTGGGCCTGCTGCTGCTGTGGCTGACCGACGCCAGGTGCGAGGTGCAGCTGGTGGAGAGCGGCGGCGGCCTGGTGCAGCCCGGCGGCAGCCTGAGGCTGAGCTGCGCCGCCAGCGGCTTCACCTTCAGCGACAGCTGGATCCACTGGGTGAGGCAGGCCCCCGGCAAGGGCCTGGAGTGGGTGGCCTGGATCAGCCCCTACGGCGGCAGCACCTACTACGCCGACAGCGTGAAGGGCAGGTTCACCATCAGCGCCGACACCAGCAAGAACACCGCCTACCTGCAGATGAACAGCCTGAGGGCCGAGGACACCGCCGTGTACTACTGCGCCAGGAGGCACTGGCCCGGCGGCTTCGACTACTGGGGCCAGGGCACCCTGGTGACCGTGAGCAGCGGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGGCGGCGGCGGCAGCGACATCCAGATGACCCAGAGCCCCAGCAGCCTGAGCGCCAGCGTGGGCGACAGGGTGACCATCACCTGCAGGGCCAGCCAGGACGTGAGCACCGCCGTGGCCTGGTACCAGCAGAAGCCCGGCAAGGCCCCCAAGCTGCTGATCTACAGCGCCAGCTTCCTGTACAGCGGCGTGCCCAGCAGGTTCAGCGGCAGCGGCAGCGGCACCGACTTCACCCTGACCATCAGCAGCCTGCAGCCCGAGGACTTCGCCACCTACTACTGCCAGCAGTACCTGTACCACCCCGCCACCTTCGGCCAGGGCACCAAGGTGGAGATCAAG(SEQ ID NO:51)。
装载目的基因的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;装载同源性优化后的目的基因的工程病毒传代15代,以测序深度1G的深度测序检测变异情况,变异率检测极限为0.001;等量的两种工程病毒侵染靶细胞后,测定目的基因产物功能性有效含量,并以目的基因优化前水平归一化为相对有效含量;比较序列同源性优化前后目的基因功能与病毒基因组稳定性。
通过目的基因序列优化,获得的最优At-scFv基因同源亚型序列At-scFv-a与At-scFv-b,最长无错配同源区域长度得到降低,15代变异率降低,而有效含量与优化前相比无显著差异。可见通过同源性序列优化,在维持目的基因功能的同时有效降低了同源性风险。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
SEQUENCE LISTING
<110> 北京合生基因科技有限公司
<120> 筛选候选插入片段的方法和系统
<130> PIDC3193676
<160> 51
<170> PatentIn version 3.5
<210> 1
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 1
cggagtactg tcctccg 17
<210> 2
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 2
cggaggactg tcctccg 17
<210> 3
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 3
cggagaactg ttctccg 17
<210> 4
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 4
cggagcactg tgctccg 17
<210> 5
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 5
cggactactg tagtccg 17
<210> 6
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 6
cggacgactg tcgtccg 17
<210> 7
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 7
cggacaactg ttgtccg 17
<210> 8
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 8
cggaccactg tggtccg 17
<210> 9
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 9
cggaatactg tattccg 17
<210> 10
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 10
cggaagactg tcttccg 17
<210> 11
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 11
cggaaaactg ttttccg 17
<210> 12
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 12
cggaacactg tgttccg 17
<210> 13
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 13
cggattactg taatccg 17
<210> 14
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 14
cggatgactg tcatccg 17
<210> 15
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 15
cggataactg ttatccg 17
<210> 16
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 16
cggatcactg tgatccg 17
<210> 17
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 17
cggggtgccg ccccccg 17
<210> 18
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 18
cgggatgccg catcccg 17
<210> 19
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 19
cgggaagccg cttcccg 17
<210> 20
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 20
cgggttgccg caacccg 17
<210> 21
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 21
cgggtagccg ctacccg 17
<210> 22
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 22
cgggccgccg cgtcccg 17
<210> 23
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 23
cggagtgccg cactccg 17
<210> 24
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 24
cggggtactg taccccg 17
<210> 25
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 25
cggagtgctg tactccg 17
<210> 26
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 26
cggagtaccg tactccg 17
<210> 27
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 27
cggggtgctg caccccg 17
<210> 28
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 28
cggggtaccg taccccg 17
<210> 29
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 29
cggggtgccg caccccg 17
<210> 30
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 30
cggtccactg tgtgccg 17
<210> 31
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 31
cgggtgacag ccctccg 17
<210> 32
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 32
cggccatatg tcttccg 17
<210> 33
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 33
cggcggtctt tcgtccg 17
<210> 34
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 34
cgggtgaccg ccctccg 17
<210> 35
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 35
cggtccacag tgtgccg 17
<210> 36
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 36
cggccatatc gcttccg 17
<210> 37
<211> 17
<212> DNA
<213> Artificial Sequence
<220>
<223> UAS同源亚型序列
<400> 37
cgggtgacag ccctccg 17
<210> 38
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子A5-A1-A6-A4序列
<400> 38
cggactactg tagtccgcgg agtactgtcc tccgcggacg actgtcgtcc gcggagcact 60
gtgctccg 68
<210> 39
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子B1-A5-A6-A4序列
<400> 39
cggggtgccg ccccccgcgg actactgtag tccgcggacg actgtcgtcc gcggagcact 60
gtgctccg 68
<210> 40
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子B1-D5-D2-C1序列
<400> 40
cggggtgccg ccccccgcgg gtgaccgccc tccgcgggtg acagccctcc gcggagtgcc 60
gcactccg 68
<210> 41
<211> 68
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子D5-A1-D2-C1序列
<400> 41
cgggtgaccg ccctccgcgg agtactgtcc tccgcgggtg acagccctcc gcggagtgcc 60
gcactccg 68
<210> 42
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子A5-A1-A6-A4-A14序列
<400> 42
cggactactg tagtccgcgg agtactgtcc tccgcggacg actgtcgtcc gcggagcact 60
gtgctccgcg gatgactgtc atccg 85
<210> 43
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子B1-A5-A6-A4-A14序列
<400> 43
cggggtgccg ccccccgcgg actactgtag tccgcggacg actgtcgtcc gcggagcact 60
gtgctccgcg gatgactgtc atccg 85
<210> 44
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子B1-D5-D2-C1-C3序列
<400> 44
cggggtgccg ccccccgcgg gtgaccgccc tccgcgggtg acagccctcc gcggagtgcc 60
gcactccgcg gagtgctgta ctccg 85
<210> 45
<211> 85
<212> DNA
<213> Artificial Sequence
<220>
<223> 组合启动子 D5-A1-D2-C1-C3序列
<400> 45
cgggtgaccg ccctccgcgg agtactgtcc tccgcgggtg acagccctcc gcggagtgcc 60
gcactccgcg gagtgctgta ctccg 85
<210> 46
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Ni-scFv基因同源亚型序列
<400> 46
atgtccgttc caacccaggt tctcggcctc ctactgctgt ggctcaccga tgccagatgc 60
caggtgcaat tggtagagtc cgggggcggg gtggtgcagc cagggcgatc tttgcggtta 120
gactgcaagg catccggaat aaccttttct aatagcggga tgcattgggt gagacaagca 180
cccggaaaag gccttgaatg ggtagcagtc atatggtatg acggtagcaa acgctactat 240
gcagactcgg tcaagggtcg attcactatt agtcgcgata acagcaagaa taccttgttc 300
ctgcagatga actcactacg ggctgaagac acagctgtct attactgtgc aaccaacgac 360
gattattggg gacaggggac cttggtcacc gtcagttccg ggggaggggg atccggaggc 420
ggcggctcag gaggaggtgg ctccgagatc gtactgactc agagcccggc aactttgtct 480
ctgtcgcctg gcgagcgggc cacactgtcc tgtagggcct cacagagcgt gagttcatat 540
ctagcttggt atcaacagaa gccggggcag gcccctagat tgctaatcta cgatgcaagt 600
aacagagcaa ctggcatccc cgcgagattt agcggatccg gttccggaac cgactttaca 660
ctcactatct cctccctaga accagaagat tttgcagtct actattgcca acagtcgtcc 720
aactggcctc gcacatttgg gcagggaacc aaggttgaaa ttaaa 765
<210> 47
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Ni-scFv基因同源亚型序列
<400> 47
atgtccgttc ccacccaggt gctcggcctc ctattactct ggctaactga tgcccggtgt 60
caggtgcagc tcgtggagag tggagggggt gtggttcagc cgggtcggtc actgcggctg 120
gactgtaaag ctagcggtat cacgttcagt aactcaggta tgcactgggt acggcaggcc 180
cccggcaaag gcttggagtg ggttgctgtg atatggtacg atggttctaa aaggtattat 240
gctgattccg tgaagggccg gtttaccata tcacgcgaca actccaagaa cacgctcttc 300
ctccagatga attcactccg agcggaagac accgcggttt attattgcgc caccaatgat 360
gactactggg gccagggcac cttggttacc gtgtctagcg gagggggggg ctcggggggc 420
ggcggtagcg gtggaggtgg gtccgagatc gtcctcacgc aatcccccgc cacccttagt 480
ctcagccctg gggagcgggc aacccttagc tgccgggcgt cccagtcagt cagttcctac 540
cttgcctggt accagcaaaa gcccggccag gcacctcgcc tccttattta tgatgcatcg 600
aaccgagcaa ccggaattcc tgcgcggttc agtggttctg gtagcgggac cgacttcaca 660
cttacaatat ctagcctaga accagaagac ttcgctgtct actactgcca acagagctcg 720
aactggccta gaacattcgg gcagggcacc aaggtagaaa tcaaa 765
<210> 48
<211> 765
<212> DNA
<213> Artificial Sequence
<220>
<223> Ni-scFv基因同源亚型序列
<400> 48
atgagcgtgc ccacccaggt gctgggcctg ctgctgctgt ggctgaccga cgccaggtgc 60
caggtgcagc tggtggagag cggcggcggc gtggtgcagc ccggcaggag cctgaggctg 120
gactgcaagg ccagcggcat caccttcagc aacagcggca tgcactgggt gaggcaggcc 180
cccggcaagg gcctggagtg ggtggccgtg atctggtacg acggcagcaa gaggtactac 240
gccgacagcg tgaagggcag gttcaccatc agcagggaca acagcaagaa caccctgttc 300
ctgcagatga acagcctgag ggccgaggac accgccgtgt actactgcgc caccaacgac 360
gactactggg gccagggcac cctggtgacc gtgagcagcg gcggcggcgg cagcggcggc 420
ggcggcagcg gcggcggcgg cagcgagatc gtgctgaccc agagccccgc caccctgagc 480
ctgagccccg gcgagagggc caccctgagc tgcagggcca gccagagcgt gagcagctac 540
ctggcctggt accagcagaa gcccggccag gcccccaggc tgctgatcta cgacgccagc 600
aacagggcca ccggcatccc cgccaggttc agcggcagcg gcagcggcac cgacttcacc 660
ctgaccatca gcagcctgga gcccgaggac ttcgccgtgt actactgcca gcagagcagc 720
aactggccca ggaccttcgg ccagggcacc aaggtggaga tcaag 765
<210> 49
<211> 780
<212> DNA
<213> Artificial Sequence
<220>
<223> At-scFv基因同源亚型序列
<400> 49
atgtccgtcc ctactcaggt actaggcctc ctcttgctat ggctgaccga cgctagatgc 60
gaagtgcaac tggtcgaatc cggcggtggc ttggtccagc caggcggatc attacgcctg 120
tcttgtgcag catcaggctt cacctttagt gacagttgga tccattgggt ccggcaagcc 180
ccaggcaaag ggctggaatg ggtcgcctgg attagcccat atggcggcag cacctattac 240
gccgacagcg tcaaggggcg ctttaccatt agtgctgaca caagtaagaa taccgcttat 300
ctgcagatga atagcctgcg ggccgaagac acggctgttt actactgtgc acgacgccac 360
tggccgggcg gttttgacta ttggggacaa ggaactctcg tgacagtctc gtcgggaggc 420
ggcggttcag gtggcggcgg ctcaggaggg gggggttctg atatacagat gacacaatcc 480
ccttcttctc tgagcgcaag tgtgggcgat cgggtaacca tcacctgtcg ggcttcccag 540
gacgtgagta cagccgtggc ttggtatcaa cagaagccag gcaaggcccc gaagctgcta 600
atctacagcg ctagtttcct gtactcaggg gtgccgagcc gctttagcgg aagtggatct 660
ggtactgact tcacacttac tatcagttct ctacagccgg aagacttcgc tacatattac 720
tgccagcagt atctctatca ccccgctact tttggacaag gaacaaaagt tgagatcaag 780
<210> 50
<211> 780
<212> DNA
<213> Artificial Sequence
<220>
<223> At-scFv基因同源亚型序列
<400> 50
atgtcagtcc ccacccaggt ccttggacta ctccttctat ggttgacaga tgcccgctgc 60
gaagtccagt tggtggaatc cgggggcggc cttgtacagc ccggggggag cctgagactc 120
agctgtgccg cttcaggatt taccttctct gattcctgga tacattgggt acgtcaggcc 180
cctgggaagg gattggagtg ggtggcctgg atcagtccat acggtggctc tacgtactat 240
gcggacagcg tcaaagggcg ctttactatt agtgcagata catcgaagaa tacagcctac 300
ctgcagatga attcattgag ggcagaggac actgccgtct attactgtgc aagaaggcac 360
tggcccggcg gcttcgacta ttggggacag ggcaccctgg tcacagtatc ttcaggcgga 420
ggaggttccg ggggcggcgg ctccggcggt ggaggctcag atatccagat gacacagagc 480
cccagctctt tatcagcttc agtgggcgat cgggtcacca tcacttgtcg tgcctctcag 540
gatgtgtcta ccgccgtggc ctggtatcaa cagaaacccg gcaaggcccc aaaattactg 600
atatatagtg caagcttcct gtactcagga gtcccttcac gcttctccgg ctcgggcagt 660
gggaccgact ttactctgac gatatccagt ctgcagcctg aagatttcgc tacctactac 720
tgtcaacagt acttgtacca ccccgcaaca ttcggacagg ggaccaaagt agaaattaaa 780
<210> 51
<211> 780
<212> DNA
<213> Artificial Sequence
<220>
<223> At-scFv基因同源亚型序列
<400> 51
atgagcgtgc ccacccaggt gctgggcctg ctgctgctgt ggctgaccga cgccaggtgc 60
gaggtgcagc tggtggagag cggcggcggc ctggtgcagc ccggcggcag cctgaggctg 120
agctgcgccg ccagcggctt caccttcagc gacagctgga tccactgggt gaggcaggcc 180
cccggcaagg gcctggagtg ggtggcctgg atcagcccct acggcggcag cacctactac 240
gccgacagcg tgaagggcag gttcaccatc agcgccgaca ccagcaagaa caccgcctac 300
ctgcagatga acagcctgag ggccgaggac accgccgtgt actactgcgc caggaggcac 360
tggcccggcg gcttcgacta ctggggccag ggcaccctgg tgaccgtgag cagcggcggc 420
ggcggcagcg gcggcggcgg cagcggcggc ggcggcagcg acatccagat gacccagagc 480
cccagcagcc tgagcgccag cgtgggcgac agggtgacca tcacctgcag ggccagccag 540
gacgtgagca ccgccgtggc ctggtaccag cagaagcccg gcaaggcccc caagctgctg 600
atctacagcg ccagcttcct gtacagcggc gtgcccagca ggttcagcgg cagcggcagc 660
ggcaccgact tcaccctgac catcagcagc ctgcagcccg aggacttcgc cacctactac 720
tgccagcagt acctgtacca ccccgccacc ttcggccagg gcaccaaggt ggagatcaag 780

Claims (2)

1.一组UAS组合,其特征在于,包括一系列UAS序列,
所述UAS序列具有SEQ ID NO:4~6以及17所示的核苷酸序列;或
SEQ ID NO:1、23、31以及34所示的核苷酸序列;或
SEQ ID NO:1、4、5、6以及14所示的核苷酸序列;或
SEQ ID NO:17、23、25、31以及34所示的核苷酸序列;
其中,所述UAS组合从5’端到3’端具有如下所示的UAS连接顺序:
B1-A5-A6-A4、D5-A1-D2-C1、A5-A1-A6-A4-A14或B1-D5-D2-C1-C3。
2.根据权利要求1所述的UAS组合,其特征在于,所述UAS组合具有SEQ ID NO:39、41、42或44所示的核苷酸序列。
CN202010207885.8A 2020-03-23 2020-03-23 筛选候选插入片段的方法和系统 Active CN113436683B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010207885.8A CN113436683B (zh) 2020-03-23 2020-03-23 筛选候选插入片段的方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010207885.8A CN113436683B (zh) 2020-03-23 2020-03-23 筛选候选插入片段的方法和系统

Publications (2)

Publication Number Publication Date
CN113436683A CN113436683A (zh) 2021-09-24
CN113436683B true CN113436683B (zh) 2024-08-16

Family

ID=77753299

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010207885.8A Active CN113436683B (zh) 2020-03-23 2020-03-23 筛选候选插入片段的方法和系统

Country Status (1)

Country Link
CN (1) CN113436683B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115602244B (zh) * 2022-10-24 2023-04-28 哈尔滨工业大学 一种基于序列比对骨架的基因组变异检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204220A (zh) * 2011-12-31 2014-12-10 深圳华大基因医学有限公司 一种遗传变异检测方法
CN105886616A (zh) * 2016-04-20 2016-08-24 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19831420A1 (de) * 1998-07-14 2000-01-20 Hoechst Marion Roussel De Gmbh Expressionssysteme enthaltend chimäre Promotoren mit Bindungsstellen für rekombinante Transkriptionsfaktoren
CN1147587C (zh) * 2001-05-30 2004-04-28 方炳良 一种增强细胞特异性目的基因表达的方法
WO2005116204A1 (ja) * 2004-05-11 2005-12-08 Rnai Co., Ltd. Rna干渉を生じさせるポリヌクレオチド、および、これを用いた遺伝子発現抑制方法
MY193917A (en) * 2016-10-07 2022-11-01 Illumina Inc System and method for secondary analysis of nucleotide sequencing data
WO2018132518A1 (en) * 2017-01-10 2018-07-19 Juno Therapeutics, Inc. Epigenetic analysis of cell therapy and related methods
CN108221058A (zh) * 2017-12-29 2018-06-29 苏州金唯智生物科技有限公司 一种猪全基因组sgRNA文库及其构建方法和应用
WO2019169117A1 (en) * 2018-02-28 2019-09-06 Cornell University Detecting variant alleles in complex, repetitive sequences within whole genome sequencing data sets
WO2019213478A1 (en) * 2018-05-04 2019-11-07 Nanostring Technologies, Inc. Gene expression assay for measurement of dna mismatch repair deficiency

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104204220A (zh) * 2011-12-31 2014-12-10 深圳华大基因医学有限公司 一种遗传变异检测方法
CN105886616A (zh) * 2016-04-20 2016-08-24 广东省农业科学院农业生物基因研究中心 一种用于猪基因编辑的高效特异性sgRNA识别位点引导序列及其筛选方法

Also Published As

Publication number Publication date
CN113436683A (zh) 2021-09-24

Similar Documents

Publication Publication Date Title
Li et al. Translation of noncoding RNAs: Focus on lncRNAs, pri-miRNAs, and circRNAs
US11667904B2 (en) CRISPR-associated systems and components
Choulet et al. Megabase level sequencing reveals contrasted organization and evolution patterns of the wheat gene and transposable element spaces
Nagaki et al. Structure, divergence, and distribution of the CRR centromeric retrotransposon family in rice
JP2019519233A5 (zh)
CN113136376B (zh) 一种Cas12a变体及其在基因编辑中的应用
CN112384620B (zh) 用于筛选和鉴定功能性lncRNA的方法
CN115087750B (zh) 基于全基因组分析的真核生物物种鉴定方法及应用
Bellutti et al. Identification of RISC-associated adenoviral microRNAs, a subset of their direct targets, and global changes in the targetome upon lytic adenovirus 5 infection
Tan et al. Novel bat adenoviruses with low G+ C content shed new light on the evolution of adenoviruses
JP2024054252A (ja) Aavベクター及びプロモーターの単一細胞トランスクリプトームベースの開発のための方法及び材料
CN114921424B (zh) 一种重组猫传染性腹膜炎病毒及其应用
CN110853708B (zh) 用于hla分型的核酸捕获探针的设计方法
CN113436683B (zh) 筛选候选插入片段的方法和系统
AU2020291467A1 (en) Novel crispr DNA targeting enzymes and systems
WO2021167672A2 (en) Methods and compositions involving crispr class 2, type vi guides
US20230016656A1 (en) Novel crispr dna targeting enzymes and systems
Costa et al. High-throughput detection of a large set of viruses and viroids of pome and stone fruit trees by multiplex PCR-based amplicon sequencing
Pulido-Quetglas et al. Designing libraries for pooled CRISPR functional screens of long noncoding RNAs
CN116949011A (zh) 经分离的Cas13蛋白、基于它的基因编辑系统及其用途
Kalokhoran et al. Co-circulation of three clusters of 793/B-like avian infectious bronchitis virus genotypes in Iranian chicken flocks
Cejnar et al. Two mutations in the truncated Rep gene RBR domain delayed the Wheat dwarf virus infection in transgenic barley plants
Lee et al. A comprehensive analysis of chimpanzee (Pan troglodytes)-specific LINE-1 retrotransposons
Chen et al. Plant noncoding RNA gene discovery by “single-genome comparative genomics”
CN118389599B (zh) 一种利用鸡全基因组crispr高通量技术筛选呕吐毒素抗性基因的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant