CN113993994A - 用于多肽表达的多核苷酸、组合物和方法 - Google Patents
用于多肽表达的多核苷酸、组合物和方法 Download PDFInfo
- Publication number
- CN113993994A CN113993994A CN202080035742.1A CN202080035742A CN113993994A CN 113993994 A CN113993994 A CN 113993994A CN 202080035742 A CN202080035742 A CN 202080035742A CN 113993994 A CN113993994 A CN 113993994A
- Authority
- CN
- China
- Prior art keywords
- orf
- polynucleotide
- codons
- content
- codon
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- A—HUMAN NECESSITIES
- A61—MEDICAL OR VETERINARY SCIENCE; HYGIENE
- A61K—PREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
- A61K48/00—Medicinal preparations containing genetic material which is inserted into cells of the living body to treat genetic diseases; Gene therapy
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/85—Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/88—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation using microencapsulation, e.g. using amphiphile liposome vesicle
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/87—Introduction of foreign genetic material using processes not otherwise provided for, e.g. co-transformation
- C12N15/90—Stable introduction of foreign DNA into chromosome
- C12N15/902—Stable introduction of foreign DNA into chromosome using homologous recombination
- C12N15/907—Stable introduction of foreign DNA into chromosome using homologous recombination in mammalian cells
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/22—Ribonucleases RNAses, DNAses
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P19/00—Preparation of compounds containing saccharide radicals
- C12P19/26—Preparation of nitrogen-containing carbohydrates
- C12P19/28—N-glycosides
- C12P19/30—Nucleotides
- C12P19/34—Polynucleotides, e.g. nucleic acids, oligoribonucleotides
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2310/00—Structure or type of the nucleic acid
- C12N2310/10—Type of nucleic acid
- C12N2310/20—Type of nucleic acid involving clustered regularly interspaced short palindromic repeats [CRISPRs]
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2800/00—Nucleic acids vectors
- C12N2800/22—Vectors comprising a coding region that has been codon optimised for expression in a respective host
Landscapes
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- Plant Pathology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Medicinal Chemistry (AREA)
- Mycology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Animal Behavior & Ethology (AREA)
- Epidemiology (AREA)
- Pharmacology & Pharmacy (AREA)
- Public Health (AREA)
- Veterinary Medicine (AREA)
- Cell Biology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
- Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
用于基因编辑的组合物和方法。在一些实施例中,提供了一种对Cas9进行编码的多核苷酸,所述多核苷酸可以提供经改进的编辑效率、降低的免疫原性或其它益处中的一种或多种。
Description
本专利申请要求于2019年3月28日提交的美国临时申请62/825,656的优先权,所述美国临时申请的内容出于所有目的以全文引用的方式并入本文中。
本申请含有序列表,所述序列表已经以ASCII格式电子提交,并且特此以全文引用的方式并入。创建于2020年3月27日的所述ASCII副本命名为01155-0027-00PCT_ST25.txt并且大小为967KB。
本公开涉及用于多肽表达的多核苷酸、组合物和方法,包含来自mRNA的表达和来自表达构建体的表达。
背景技术和发明内容
可以通过与多核苷酸(如mRNA或表达构建体)接触的细胞原位产生有用的多肽。然而,现有方法例如在某些细胞类型或生物体(如哺乳动物)中可能提供不如期望的稳健表达,或者可能具有不期望的免疫原性,例如可能引起细胞因子水平的不期望的升高。
因此,需要改进用于多肽表达的多核苷酸、组合物和方法。本公开旨在提供用于多肽表达的组合物和方法,所述组合物和方法提供一个或多个益处,如改进表达水平、增加经编码的多肽的活性或降低免疫原性(例如,施用后减少细胞因子升高)中的至少一项,或者至少为公众提供有用的选择。在一些实施例中,提供了一种对多肽进行编码的多核苷酸,其中其编码序列或密码子对含量中的一个或多个以本文公开的方式不同于现有的多核苷酸。已经发现,此类特征可以提供如上所述的益处。在一些实施例中,经改进的表达发生在哺乳动物的器官或细胞类型(如肝脏或肝细胞)中或对所述器官或细胞类型具有特异性。
本公开提供了以下实施例。
实施例1是一种多核苷酸,其包括:(i)对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对;或者(ii)对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1%的密码子对是表1中所示的密码子对,并且所述ORF不对RNA引导的DNA结合剂进行编码。
实施例2是一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF包括与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143中的任一个具有至少95%同一性的序列,任选地其中在不考虑所述ORF的起始密码子和终止密码子的情况下测定同一性。
实施例3是一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少75%、80%、85%、90%、95%、98%、99%或100%的密码子是(i)表5中列出的密码子或(ii)表6中列出的密码子,并且其中所述多肽不是RNA引导的DNA结合剂。
实施例4是根据实施例1到3中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.3%。
实施例5是根据实施例1到4中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于55%。
实施例6是一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF的重复序列含量小于或等于23.3%,并且所述ORF的GC含量大于或等于55%。
实施例7是根据实施例2到6中任一项所述的多核苷酸,其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。
实施例8是根据实施例1到7中任一项所述的多核苷酸,其中所述ORF中小于或等于0.9%的密码子对是表2中所示的密码子对。
实施例9是根据实施例1到8中任一项所述的多核苷酸,其中所述ORF中至少60%、65%、70%或75%的密码子是表3中所示的密码子。
实施例10是根据实施例1到9中任一项所述的多核苷酸,其中所述ORF中小于或等于20%的密码子是表4中所示的密码子。
实施例11是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.05%的密码子对是表1中所示的密码子对。
实施例12是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.1%的密码子对是表1中所示的密码子对。
实施例13是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.2%的密码子对是表1中所示的密码子对。
实施例14是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.3%的密码子对是表1中所示的密码子对。
实施例15是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.4%的密码子对是表1中所示的密码子对。
实施例16是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.5%的密码子对是表1中所示的密码子对。
实施例17是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.6%的密码子对是表1中所示的密码子对。
实施例18是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.7%的密码子对是表1中所示的密码子对。
实施例19是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.8%的密码子对是表1中所示的密码子对。
实施例20是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少1.9%的密码子对是表1中所示的密码子对。
实施例21是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.0%的密码子对是表1中所示的密码子对。
实施例22是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.1%的密码子对是表1中所示的密码子对。
实施例23是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.3%的密码子对是表1中所示的密码子对。
实施例24是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.4%的密码子对是表1中所示的密码子对。
实施例25是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.5%的密码子对是表1中所示的密码子对。
实施例26是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.6%的密码子对是表1中所示的密码子对。
实施例27是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.7%的密码子对是表1中所示的密码子对。
实施例28是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.8%的密码子对是表1中所示的密码子对。
实施例29是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少2.9%的密码子对是表1中所示的密码子对。
实施例30是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.0%的密码子对是表1中所示的密码子对。
实施例31是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.1%的密码子对是表1中所示的密码子对。
实施例32是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.2%的密码子对是表1中所示的密码子对。
实施例33是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.3%的密码子对是表1中所示的密码子对。
实施例34是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.4%的密码子对是表1中所示的密码子对。
实施例35是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.5%的密码子对是表1中所示的密码子对。
实施例36是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.6%的密码子对是表1中所示的密码子对。
实施例37是根据实施例1到10中任一项所述的多核苷酸,其中所述ORF中至少3.7%的密码子对是表1中所示的密码子对。
实施例38是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于10%的密码子对是表1中所示的密码子对。
实施例39是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.9%的密码子对是表1中所示的密码子对。
实施例40是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.8%的密码子对是表1中所示的密码子对。
实施例41是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.7%的密码子对是表1中所示的密码子对。
实施例42是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.6%的密码子对是表1中所示的密码子对。
实施例43是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.5%的密码子对是表1中所示的密码子对。
实施例44是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.4%的密码子对是表1中所示的密码子对。
实施例45是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.3%的密码子对是表1中所示的密码子对。
实施例46是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.2%的密码子对是表1中所示的密码子对。
实施例47是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.1%的密码子对是表1中所示的密码子对。
实施例48是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于9.0%的密码子对是表1中所示的密码子对。
实施例49是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.9%的密码子对是表1中所示的密码子对。
实施例50是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.8%的密码子对是表1中所示的密码子对。
实施例51是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.7%的密码子对是表1中所示的密码子对。
实施例52是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.6%的密码子对是表1中所示的密码子对。
实施例53是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.5%的密码子对是表1中所示的密码子对。
实施例54是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.4%的密码子对是表1中所示的密码子对。
实施例55是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.3%的密码子对是表1中所示的密码子对。
实施例56是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.2%的密码子对是表1中所示的密码子对。
实施例57是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.1%的密码子对是表1中所示的密码子对。
实施例58是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于8.0%的密码子对是表1中所示的密码子对。
实施例59是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.9%的密码子对是表1中所示的密码子对。
实施例60是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.8%的密码子对是表1中所示的密码子对。
实施例61是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.7%的密码子对是表1中所示的密码子对。
实施例62是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.6%的密码子对是表1中所示的密码子对。
实施例63是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.5%的密码子对是表1中所示的密码子对。
实施例64是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.4%的密码子对是表1中所示的密码子对。
实施例65是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.3%的密码子对是表1中所示的密码子对。
实施例66是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.2%的密码子对是表1中所示的密码子对。
实施例67是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.1%的密码子对是表1中所示的密码子对。
实施例68是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于7.0%的密码子对是表1中所示的密码子对。
实施例69是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.9%的密码子对是表1中所示的密码子对。
实施例70是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.8%的密码子对是表1中所示的密码子对。
实施例71是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.7%的密码子对是表1中所示的密码子对。
实施例72是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.6%的密码子对是表1中所示的密码子对。
实施例73是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.5%的密码子对是表1中所示的密码子对。
实施例74是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.4%的密码子对是表1中所示的密码子对。
实施例75是根据实施例1到37中任一项所述的多核苷酸,其中所述ORF中小于或等于6.32%的密码子对是表1中所示的密码子对。
实施例76是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.9%的密码子对是表2中所示的密码子对。
实施例77是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.8%的密码子对是表2中所示的密码子对。
实施例78是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.7%的密码子对是表2中所示的密码子对。
实施例79是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.6%的密码子对是表2中所示的密码子对。
实施例80是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.5%的密码子对是表2中所示的密码子对。
实施例81是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.45%的密码子对是表2中所示的密码子对。
实施例82是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.4%的密码子对是表2中所示的密码子对。
实施例83是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.3%的密码子对是表2中所示的密码子对。
实施例84是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.2%的密码子对是表2中所示的密码子对。
实施例85是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF中小于或等于0.1%的密码子对是表2中所示的密码子对。
实施例86是根据实施例1到75中任一项所述的多核苷酸,其中所述ORF不包括表2中所示的密码子对。
实施例87是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于56%。
实施例88是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于56.5%。
实施例89是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于57%。
实施例90是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于57.5%。
实施例91是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于58%。
实施例92是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于58.5%。
实施例93是根据实施例1到86中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于59%。
实施例94是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于63%。
实施例95是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于62.6%。
实施例96是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于62.1%。
实施例97是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于61.6%。
实施例98是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于61.1%。
实施例99是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于60.6%。
实施例100是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于60.1%。
实施例101是根据实施例1到93中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于59.6%。
实施例102是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.2%。
实施例103是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.1%。
实施例104是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.0%。
实施例105是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.9%。
实施例106是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.8%。
实施例107是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.7%。
实施例108是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.6%。
实施例109是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.5%。
实施例110是根据实施例1到101中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于22.4%。
实施例111是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于20%。
实施例112是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于20.5%。
实施例113是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于21%。
实施例114是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于21.5%。
实施例115是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于21.7%。
实施例116是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于21.9%。
实施例117是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于22.1%。
实施例118是根据实施例1到110中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于22.2%。
实施例119是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于15%的密码子是表4中所示的密码子。
实施例120是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于14.5%的密码子是表4中所示的密码子。
实施例121是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于14%的密码子是表4中所示的密码子。
实施例122是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于13.5%的密码子是表4中所示的密码子。
实施例123是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于13%的密码子是表4中所示的密码子。
实施例124是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于12.5%的密码子是表4中所示的密码子。
实施例125是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于12%的密码子是表4中所示的密码子。
实施例126是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于11.5%的密码子是表4中所示的密码子。
实施例127是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于11%的密码子是表4中所示的密码子。
实施例128是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于10.5%的密码子是表4中所示的密码子。
实施例129是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于10%的密码子是表4中所示的密码子。
实施例130是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于9.5%的密码子是表4中所示的密码子。
实施例131是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于9%的密码子是表4中所示的密码子。
实施例132是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于8.5%的密码子是表4中所示的密码子。
实施例133是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于8%的密码子是表4中所示的密码子。
实施例134是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于7.5%的密码子是表4中所示的密码子。
实施例135是根据实施例1到118中任一项所述的多核苷酸,其中所述ORF中小于或等于7%的密码子是表4中所示的密码子。
实施例136是根据实施例1到135中任一项所述的多核苷酸,其中所述ORF中至少76%的密码子是表3中所示的密码子。
实施例137是根据实施例1到135中任一项所述的多核苷酸,其中所述ORF中至少77%的密码子是表3中所示的密码子。
实施例138是根据实施例1到135中任一项所述的多核苷酸,其中所述ORF中至少78%的密码子是表3中所示的密码子。
实施例139是根据实施例1到135中任一项所述的多核苷酸,其中所述ORF中至少79%的密码子是表3中所示的密码子。
实施例140是根据实施例1到135中任一项所述的多核苷酸,其中所述ORF中至少80%的密码子是表3中所示的密码子。
实施例141是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于87%的密码子是表3中所示的密码子。
实施例142是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于86%的密码子是表3中所示的密码子。
实施例143是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于85%的密码子是表3中所示的密码子。
实施例144是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于84%的密码子是表3中所示的密码子。
实施例145是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于83%的密码子是表3中所示的密码子。
实施例146是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于82%的密码子是表3中所示的密码子。
实施例147是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于81%的密码子是表3中所示的密码子。
实施例148是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于80%的密码子是表3中所示的密码子。
实施例149是根据实施例1到140中任一项所述的多核苷酸,其中所述ORF中小于或等于79%的密码子是表3中所示的密码子。
实施例150是根据实施例1到149中任一项所述的多核苷酸,其中所述ORF的尿苷含量的范围为所述ORF的最低尿苷含量到所述最低尿苷含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
实施例151是根据实施例1到150中任一项所述的多核苷酸,其中所述ORF的A+U含量的范围为所述ORF的最低A+U含量到所述最低A+U含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
实施例152是根据实施例1到151中任一项所述的多核苷酸,其中所述ORF的GC含量的范围为55%-65%,如55%-57%、57%-59%、59-61%、61-63%或63-65%。
实施例153是根据实施例1到152中任一项所述的多核苷酸,其中所述ORF的重复序列含量的范围为所述ORF的最低重复序列含量到所述最低重复序列含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
实施例154是根据实施例1到153中任一项所述的多核苷酸,其中所述ORF的重复序列含量为22%-27%,如22%-23%、22.3%-23%、23%-24%、24%-25%、25%-26%或26%-27%。
实施例155是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为30个氨基酸,任选地其中所述多肽的长度为至少50个氨基酸。
实施例156是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少100个氨基酸。
实施例157是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少200个氨基酸。
实施例158是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少300个氨基酸。
实施例159是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少400个氨基酸。
实施例160是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少500个氨基酸。
实施例161是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少600个氨基酸。
实施例162是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少700个氨基酸。
实施例163是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少800个氨基酸。
实施例164是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少900个氨基酸。
实施例165是根据实施例1到154中任一项所述的多核苷酸,其中所述多肽的长度为至少1000个氨基酸。
实施例166是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于5000个氨基酸。
实施例167是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于4500个氨基酸。
实施例168是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于4000个氨基酸。
实施例169是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于3500个氨基酸。
实施例170是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于3000个氨基酸。
实施例171是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于2500个氨基酸。
实施例172是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于2000个氨基酸。
实施例173是根据实施例1到165中任一项所述的多核苷酸,其中所述多肽的长度小于或等于1500个氨基酸。
实施例174是根据实施例1到173中任一项所述的多核苷酸,其中所述多肽包括与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或134-143中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175a是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:16中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175b是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:17中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175c是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:18中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175d是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:19中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175e是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:20中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175f是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:78中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175g是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:79中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175h是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:80中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175i是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:194中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175j是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:195中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175l是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:196中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175m是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:197中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175n是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:200中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例175o是根据实施例1到174中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ ID NO:201中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
实施例176是根据实施例1到175o中任一项所述的多核苷酸,其中所述ORF对RNA引导的DNA结合剂进行编码。
实施例177是根据实施例176所述的多核苷酸,其中所述RNA引导的DNA结合剂具有双链核酸内切酶活性。
实施例178是根据实施例177所述的多核苷酸,其中所述RNA引导的DNA结合剂包括Cas切割酶。
实施例179是根据实施例176所述的多核苷酸,其中所述RNA引导的DNA结合剂具有切口酶活性。
实施例180是根据实施例179所述的多核苷酸,其中所述RNA引导的DNA结合剂包括Cas切口酶。
实施例181是根据实施例176所述的多核苷酸,其中所述RNA引导的DNA结合剂包括dCas DNA结合结构域。
实施例182是根据实施例178、180或181中任一项所述的多核苷酸,其中所述Cas切割酶、Cas切口酶或dCas DNA结合结构域是Cas9切割酶、Cas9切口酶或dCas9 DNA结合结构域。
实施例183是根据实施例1到182中任一项所述的多核苷酸,其中所述ORF对酿脓链球菌(S.pyogenes)Cas9进行编码。
实施例184是根据实施例1到183中任一项所述的多核苷酸,其中所述ORF对核酸内切酶进行编码。
实施例185是根据实施例1到175中任一项所述的多核苷酸,其中所述ORF对丝氨酸蛋白酶抑制剂或Serpin家族成员进行编码。
实施例186是根据实施例185所述的多核苷酸,其中所述ORF对Serpin家族A成员1进行编码。
实施例187是根据实施例1到175中任一项所述的多核苷酸,其中所述ORF对以下进行编码:羟化酶;氨甲酰转移酶;葡糖神经酰胺酶;半乳糖苷酶;脱氢酶;受体;或神经递质受体。
实施例188是根据实施例1到175中任一项所述的多核苷酸,其中所述ORF对以下进行编码:苯丙氨酸羟化酶;鸟氨酸氨甲酰转移酶;延胡索酰乙酰乙酸水解酶;葡糖神经酰胺酶β;α-半乳糖苷酶;运甲状腺素蛋白;甘油醛-3-磷酸脱氢酶;γ-氨基丁酸(GABA)受体亚基(如GABA A型受体δ亚基)。
实施例189是根据实施例1到188中任一项所述的多核苷酸,其中所述多核苷酸进一步包括与SEQ ID NO:177-181或190-192中的任一个具有至少90%同一性的5'UTR。
实施例190是根据实施例1到189中任一项所述的多肽,其中所述多核苷酸进一步包括与SEQ ID NO:182-186或202-204中的任一个具有至少90%同一性的3'UTR。
实施例191是根据实施例189或190所述的多核苷酸,其中所述多核苷酸进一步包括来自相同来源的5'UTR和3'UTR。
实施例192是根据实施例1到191中任一项所述的多核苷酸,其中所述多核苷酸进一步包括选自帽0、帽1和帽2的5'帽。
实施例193是根据实施例1到192中任一项所述的多核苷酸,其中所述开放阅读框具有增加所述多核苷酸在哺乳动物中的翻译的密码子。
实施例194是根据实施例1到193中任一项所述的多核苷酸,其中经编码的多肽包括核定位信号(NLS)。
实施例195是根据实施例194所述的多核苷酸,其中所述NLS连接到所述多肽的C端。
实施例196是根据实施例194所述的多核苷酸,其中所述NLS连接到所述多肽的N端。
实施例197是根据实施例194到196中任一项所述的多核苷酸,其中所述NLS包括与SEQ ID NO:163-176中的任一个具有至少80%、85%、90%或95%同一性的序列。
实施例198是根据实施例194到196中任一项所述的多核苷酸,其中所述NLS包括SEQ ID NO:163-176中的任一个的序列。
实施例199是根据实施例1到198中任一项所述的多核苷酸,其中所述多肽对RNA引导的DNA结合剂进行编码,并且所述RNA引导的DNA结合剂进一步包括异源功能结构域。
实施例200是根据实施例199所述的多核苷酸,其中所述异源功能结构域是FokI核酸酶。
实施例201是根据实施例199所述的多核苷酸,其中所述异源功能结构域是转录调节结构域。
实施例202是根据实施例1到201中任一项所述的多核苷酸,其中至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或100%的所述尿苷被经修饰的尿苷取代。
实施例203是根据实施例202所述的多核苷酸,其中所述经修饰的尿苷是以下中的一种或多种:N1-甲基假尿苷、假尿苷、5-甲氧基尿苷或5-碘尿苷。
实施例204是根据实施例202所述的多核苷酸,其中所述经修饰的尿苷是N1-甲基假尿苷或5-甲氧基尿苷中的一者或两者。
实施例205是根据实施例202所述的多核苷酸,其中所述经修饰的尿苷是N1-甲基假尿苷。
实施例206是根据实施例202所述的多核苷酸,其中所述经修饰的尿苷是5-甲氧基尿苷。
实施例207是根据实施例202到206中任一项所述的多核苷酸,其中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的所述尿苷被所述经修饰的尿苷取代,任选地其中所述经修饰的尿苷为N1-甲基假尿苷。
实施例208是根据实施例202到207中任一项所述的多核苷酸,其中至少20%或至少30%的所述尿苷被所述经修饰的尿苷取代。
实施例209是根据实施例208所述的多核苷酸,其中至少80%或至少90%的所述尿苷被所述经修饰的尿苷取代。
实施例210是根据实施例208所述的多核苷酸,其中100%的尿苷被所述经修饰的尿苷取代。
实施例211是根据实施例1到210中任一项所述的多核苷酸,其中所述多核苷酸是mRNA。
实施例212是根据实施例1到211中任一项所述的多核苷酸,其中所述多核苷酸是表达构建体,所述表达构建体包括可操作地连接到所述ORF的启动子。
实施例213是一种质粒,其包括根据实施例212所述的表达构建体。
实施例214是一种宿主细胞,其包括根据实施例212所述的表达构建体或根据实施例213所述的质粒。
实施例215是一种制备mRNA的方法,所述方法包括在允许所述mRNA转录的条件下使根据实施例212所述的表达构建体或根据实施例213所述的质粒与RNA聚合酶接触。
实施例216是根据实施例215所述的方法,其中所述接触步骤在体外进行。
实施例217是一种表达多肽的方法,所述方法包括使细胞与根据实施例1到212中任一项所述的多核苷酸接触。
实施例218是根据实施例217所述的方法,其中所述细胞在哺乳动物受试者中,任选地其中所述受试者是人。
实施例219是根据实施例217所述的方法,其中所述细胞是培养细胞和/或所述接触在体外进行。
实施例220是根据实施例217到219中任一项所述的方法,其中所述细胞是人细胞。
实施例221是一种组合物,其包括根据实施例1到212中任一项所述的多核苷酸以及和至少一种向导RNA,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
实施例222是一种脂质纳米颗粒,其包括根据实施例1到212中任一项所述的多核苷酸。
实施例223是一种药物组合物,其包括根据实施例1到212中任一项所述的多核苷酸以及药学上可接受的载剂。
实施例224是根据实施例222所述的脂质纳米颗粒或根据实施例223所述的药物组合物,其中所述多核苷酸对RNA引导的DNA结合剂进行编码,并且所述脂质纳米颗粒或所述药物组合物进一步包括至少一种向导RNA。
实施例225是一种对靶基因进行基因组编辑或修饰的方法,所述方法包括使细胞与根据实施例1到212或222到224中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒接触,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
实施例226是一种根据实施例1到212或222到224中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒的用途,其用于对靶基因进行基因组编辑或修饰,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
实施例227是一种根据实施例1到212或222到224中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒的用途,其用于制备用于对靶基因进行基因组编辑或修饰的药物,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
实施例228是根据实施例225到227中任一项所述的方法或用途,其中所述靶基因的所述基因组编辑或修饰发生在肝脏细胞中。
实施例229是根据实施例228所述的方法或用途,其中所述肝脏细胞是肝细胞。
实施例230是根据实施例225到227中任一项所述的方法或用途,其中所述靶基因的所述基因组编辑或修饰在体内进行。
实施例231是根据实施例225到227中任一项所述的方法或用途,其中所述靶基因的所述基因组编辑或修饰在分离或培养的细胞中进行。
实施例232是一种产生对多肽进行编码的开放阅读框(ORF)序列的方法,所述方法包括:
a)提供所关注的多肽序列;
b)为所述多肽序列的每个氨基酸位置指配密码子,其中如果所述氨基酸位置是表1中所示的二肽的成员,那么使用所述二肽的密码子对,但如果所述氨基酸位置是表1中所示的多于一个二肽的成员并且这些二肽的密码子对为所述位置提供不同的密码子,或者所述氨基酸位置不是表1中所示的二肽的成员,那么执行以下中的一项或多项:
i.如果对天然存在的多肽进行编码,则从对所述多肽进行编码的野生型序列中选择密码子;
ii.如果所述氨基酸是表1中所示的多于一种二肽的成员,并且那些二肽的密码子对为所述位置提供不同的密码子,则消除表4中出现和/或将导致表2中所示的密码子对存在的密码子,和/或选择表3中出现的密码子;
iii.使用表5、6或7的密码子集合向所述氨基酸位置供应所述密码子,任选地其中如果执行步骤(i)和/或(ii),那么在尚未提供所述氨基酸位置的独特密码子的情况下执行步骤(iii);和/或
iv.选择以下密码子:(1)使尿苷含量最小化的密码子;(2)使重复序列含量最小化的密码子;和/或(3)使GC含量最大化的密码子。
实施例233是根据实施例232所述的方法,其中对于至少一个氨基酸,表1未提供给定氨基酸位置处的独特密码子,任选地其中(1)重叠二肽中存在冲突密码子;(2)存在对应于给定二肽的多个可能的密码子;或者(3)没有对应于给定二肽的密码子。
实施例234是根据实施例232或233所述的方法,其中步骤(b)(ii)包括执行以下中的一项或多项:
a.选择表3中出现的密码子;和/或
b.消除将导致表2中存在密码子对的密码子和/或出现在表4中的密码子,
其中以任何顺序执行上述步骤中的一个或多个步骤,并且当提供所述氨基酸的单个密码子时,终止所述步骤。
实施例235是根据实施例232到234中任一项所述的方法,其中步骤(b)(ii)包括选择出现在表3中的密码子,任选地其中如果执行实施例234的一个或多个步骤,则实施例234的所述一个或多个步骤以相对于选择出现在表3中的密码子的任何顺序执行。
实施例236是根据实施例232到235中任一项所述的方法,其中步骤(b)(ii)进一步包括:
a.消除将导致表2中存在密码子对的密码子;以及
b.如果在步骤(a)之后仍保留多于一个可能的密码子,则消除未出现在表3中的密码子和/或消除出现在表4中的密码子。
实施例237是根据实施例232到236中任一项所述的方法,其中步骤(b)(ii)进一步包括:
a.消除未出现在表3中的密码子和/或消除出现在表4中的密码子;以及
b.如果在步骤(a)之后仍保留多于一个可能的密码子,则消除将导致表2中存在密码子对的密码子。
实施例238是根据实施例232到237中任一项所述的方法,其中步骤(b)包括执行以下中的一项或多项:
a.选择所述使尿苷含量最小化的密码子;
b.选择所述使重复序列含量最小化的密码子;
c.选择所述使GC含量最大化的密码子;
其中以任何顺序执行上述步骤中的一个或多个步骤,任选地其中当提供所述氨基酸的单个密码子时,终止所述步骤。
实施例239是根据实施例238所述的方法,其中步骤(b)包括执行以下中的至少一项并继续执行以下步骤,任选地其中执行以下步骤(i)-(iii)中的每个步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(a)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(b)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
实施例240是根据实施例232到239中任一项所述的方法,其中在对至少一个可由多于一个密码子编码的位置执行步骤(b)(ii)之后没有密码子,并且对在所述位置处对所述氨基酸进行编码的多个密码子执行以下步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(i)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(ii)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
实施例241是根据实施例232到240中任一项所述的方法,其中在对至少一个可由多于一个密码子编码的位置执行步骤(b)(ii)之后保留多个密码子,并且对所述多个密码子执行以下步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(i)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(ii)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
实施例242是根据实施例240或241所述的方法,其中所述方法包括选择在至少一个位置处所述使GC含量最大化的密码子。
实施例243是根据实施例232到243中任一项所述的方法,其进一步包括选择表5、6或7中所示的一对一密码子集合,并为来自所述集合的至少一个位置指配密码子。
实施例244是根据实施例232到243中任一项所述的方法,其进一步包括:
a.为由至少一个位置编码的所述氨基酸生成所有可用密码子的集合;
b.应用实施例233到243所述的步骤中的一个或多个步骤。
实施例245是根据实施例232到244中任一项所述的方法,其中所述方法的至少步骤(b)是计算机实施的。
实施例246是根据实施例232到245中任一项所述的方法,其进一步包括合成包括所述ORF的多核苷酸,任选地其中所述多核苷酸是mRNA。
实施例247是根据实施例232到246中任一项所述的方法,其中所述RNA引导的DNA结合剂具有双链核酸内切酶活性。
实施例248是根据实施例247所述的方法,其中所述RNA引导的DNA结合剂包括Cas切割酶。
实施例249是根据实施例247或248所述的方法,其中所述RNA引导的DNA结合剂具有切口酶活性。
实施例250是根据实施例249所述的方法,其中所述RNA引导的DNA结合剂包括Cas切口酶。
实施例251是根据实施例247到250中任一项所述的方法,其中所述RNA引导的DNA结合剂包括dCas DNA结合结构域。
实施例252是根据实施例247到251中任一项所述的方法,其中所述Cas切割酶、Cas切口酶或dCas DNA结合结构域是Cas9切割酶、Cas9切口酶或dCas9 DNA结合结构域。
实施例253是根据实施例247到252中任一项所述的方法,其中所述ORF对酿脓链球菌Cas9进行编码。
实施例254是根据实施例232到253中任一项所述的方法,其中所述ORF对核酸内切酶进行编码。
实施例255是根据实施例232到246中任一项所述的方法,其中所述ORF对丝氨酸蛋白酶抑制剂或Serpin家族成员进行编码。
实施例256是根据实施例255所述的方法,其中所述ORF对Serpin家族A成员1进行编码。
实施例257是根据实施例232到246中任一项所述的方法,其中所述ORF对以下进行编码:羟化酶;氨甲酰转移酶;葡糖神经酰胺酶;半乳糖苷酶;脱氢酶;受体;或神经递质受体。
实施例258是根据实施例232到246中任一项所述的方法,其中所述ORF对以下进行编码:苯丙氨酸羟化酶;鸟氨酸氨甲酰转移酶;延胡索酰乙酰乙酸水解酶;葡糖神经酰胺酶β;α-半乳糖苷酶;运甲状腺素蛋白;甘油醛-3-磷酸脱氢酶;γ-氨基丁酸(GABA)受体亚基(如GABA A型受体δ亚基)。
实施例259是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少90%同一性。
实施例260是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少95%同一性。
实施例261是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少97%同一性。
实施例262是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少98%同一性。
实施例263是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少99%同一性。
实施例264是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少99.5%同一性。
实施例265是根据实施例232到246中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有100%同一性。
附图说明
图1示出了在使HepG2细胞与包括指定序列的mRNA接触后2、6和24小时,Cas9在所述细胞中的表达。
图2示出了使用包括指定序列的mRNA在体内Cas9的表达。
图3示出了在施用后1、3和6小时,使用包括指定序列的mRNA在体内Cas9的表达。
图4A-4B示出了在以指定剂量施用包括指定序列的mRNA后在体内TTR基因和血清TTR水平的编辑%。
图5A-5B示出了使用指定hSERPINA1 mRNA序列在转染后6小时和24小时在原代小鼠肝细胞(PMH)(图5A)和原代Cyno肝细胞(PCH)(图5B)中hA1AT表达的比较。
图6示出了在转染后6小时使用包括指定序列的mRNA在原代人肝细胞中Cas9的表达。
图7A-7B示出了在转染后6小时使用包括指定序列的mRNA在原代人肝细胞中Cas9的表达。
具体实施方式
现在将详细参照本发明的某些实施例,在附图中展示所述实施例的实例。尽管将结合所展示的实施例描述本发明,但应当理解,其并不旨在将本发明限制于那些实施例。相反,本发明旨在覆盖可以包含在由所附权利要求书限定的本发明内的所有替代方案、修改和等效物。
在详细描述本发明的教导之前,应理解,本公开不限于具体的组合物或工艺步骤,因为此类组合物或工艺步骤可以变化。应注意的是,除非上下文另外明确指示,否则如在本说明书和所附权利要求中所使用的,单数形式“一个(a/an)”以及“所述(the)”均包含复数指代物。因此,例如,对“缀合物(conjugate)”的引用包含多个缀合物,并且对“单元(cell)”的引用包含多个单元等。
数值范围包含定义所述范围的数字。考虑到有效数字和与测量相关的误差,测得值和可测量值被理解为近似值。因此,除非有相反的指示,否则以下说明书和所附权利要求中列出的数字参数是近似值,所述近似值可以根据试图获得的期望特性而变化。至少,并且并非试图将等效原则的应用限制于权利要求的范围,每个数值参数应该至少根据所报告的有效数字的数量并且通过应用常规的舍入技术来解释。术语“约”或“大约”意指如本领域的普通技术人员确定的特定值的可接受误差,这部分取决于如何测量或确定值,或者基本上不影响所述主题的性质的变化程度,例如在10%、5%、2%或1%内。而且,“包括(comprise或comprises或comprising)”、“含有(contain或contains或containing)”和“包含(include或includes或including)”的使用不旨在是限制性的。应当理解,上述的一般描述和详细描述两者均仅是示例性和解释性的,并且不限制本教导。
除非说明书中特别指出,否则说明书中叙述“包括”各个组分的实施例也被考虑是“由所述组分组成”或“基本上由所述组分组成”;说明书中叙述“由各个组分组成”的实施例也被认为是“包括所述组分”或“基本上由所述组分组成”;并且说明书中叙述“基本上由各个组分组成”的实施例也被认为是“由所述组分组成”或“包括所述组分”(这种可互换性不适用于这些术语在权利要求书中的使用)。
本文所使用的章节标题仅仅是出于组织的目的并且不应被解释为以任何方式限制期望的主题。如果通过引用并入的任何文献与本说明书的明示内容(包含但不限于定义)相矛盾,则以本说明书的明示内容为准。虽然结合各个实施例对本发明教导进行了描述,但是本发明教导不旨在受限于这种实施例。相反,本发明教导涵盖各种替代方案、修改和等同物,如本领域的技术人员将理解的。
定义
除非另有说明,否则如本文中所使用的以下术语和短语旨在具有以下含义:
如本文所使用的,术语“或其组合”是指在所述术语之前列出的术语的所有排列和组合。例如,“A、B、C或其组合”旨在包含以下中的至少一种:A、B、C、AB、AC、BC或ABC,并且如果顺序在特定背景下是重要的,则还包含BA、CA、CB、ACB、CBA、BCA、BAC或CAB。继续此实例,明确地包含的是含有一个或多个项目或术语的重复的组合,如BB、AAA、AAB、BBC、AAABCCCC、CBBAAA、CABABB等。熟练的技术人员将理解,除非另外从上下文显而易见,否则通常不限制任何组合中的项目或术语的数量。
如本文所使用的,术语“试剂盒”是指相关组分的包装集合,如一种或多种多核苷酸或组合物,以及一种或多种相关材料,如递送装置(例如,注射器)、溶剂、溶液、缓冲液、说明书或干燥剂。
“或”以开放性意义使用,也就是说,相当于“和/或”,除非上下文另有要求。
本文中使用“多核苷酸”和“核酸”指代包括核苷或核苷类似物的多聚体化合物,所述核苷或核苷类似物具有沿骨架连接在一起的含氮杂环碱基或碱基类似物,所述骨架包含常规RNA、DNA、混合的RNA-DNA和其类似物的聚合物。核酸“骨架”可以由多种连接构成,包含以下中的一个或多个:糖-磷酸二酯连接、肽-核酸键(“肽核酸”或PNA;PCT号:WO 95/32305)、硫代磷酸酯连接、甲基膦酸酯连接或其组合。核酸的糖部分可以是核糖、脱氧核糖,或具有取代(例如,2'甲氧基和/或2'卤化物取代)的类似化合物。含氮碱基可以是常规碱基(A、G、C、T、U),其类似物(例如,经修饰的尿苷,如5-甲氧基尿苷、假尿苷或N1-甲基假尿苷等等);肌苷;嘌呤或嘧啶的衍生物(例如,N4-甲基脱氧鸟苷、脱氮-或氮杂-嘌呤、脱氮-或氮杂-嘧啶、在5或6位置具有取代基的嘧啶碱基(例如,5-甲基胞嘧啶)、在2、6或8位置具有取代基的嘌呤碱基、2-氨基-6-甲基氨基嘌呤、O6-甲基鸟嘌呤、4-硫代-嘧啶、4-氨基-嘧啶、4-二甲基肼-嘧啶和O4-烷基-嘧啶;美国专利第5,378,825号和PCT第WO 93/13121号)。有关一般讨论,参见《核酸的生物化学(The Biochemistry of the Nucleic Acids)》5-36,Adams等人,编辑,第11版,1992。核酸可以包含一个或多个“无碱基”残基,其中骨架不包含聚合物的一个或多个位置的含氮碱基(美国专利第5,585,481号)。核酸可以仅包括常规的RNA或DNA糖、碱基和键,或可以包含常规的组分和取代(例如,具有2'甲氧基键的常规碱基,或含有常规碱基和一种或多种碱基类似物两者的聚合物)。核酸包含“锁定核酸”(LNA),一种含有一种或多种LNA核苷酸单体的类似物,其中二环呋喃糖单元被锁定在模拟糖构型的RNA中,这增强了对互补RNA和DNA序列的杂交亲和力(Vester和Wengel,2004,《生物化学(Biochemistry)》43(42):13233-41)。RNA和DNA具有不同的糖部分并且可以通过其尿嘧啶或类似物在RNA中的存在以及其胸腺嘧啶或类似物在DNA中的存在进行区分。
如本文所使用的,“多肽”是指包括可以采用三维构象的氨基酸残基的多聚体化合物。多肽包含但不限于酶、酶前体蛋白、调节蛋白、结构蛋白、受体、核酸结合蛋白、抗体等。多肽可以但不一定包括翻译后修饰、非天然氨基酸、辅基等。
“经修饰的尿苷”在本文中用于指具有与尿苷相同的氢键受体以及与尿苷的一个或多个结构差异的除胸苷外的核苷。在一些实施例中,经修饰的尿苷是经取代的尿苷,即其中一个或多个非质子取代基(例如,烷氧基,如甲氧基)代替质子的尿苷。在一些实施例中,经修饰的尿苷是假尿苷。在一些实施例中,经修饰的尿苷是经取代的假尿苷,即其中一个或多个非质子取代基(例如,烷基,如甲基)代替质子的假尿苷。在一些实施例中,经修饰的尿苷是经取代的尿苷、假尿苷或经取代的假尿苷中的任何一种。
如本文所使用的,“尿苷位置”是指多核苷酸中被尿苷或经修饰的尿苷占据的位置。因此,例如,其中“100%的尿苷位置是经修饰的尿苷”的多核苷酸在每个位置处都含有经修饰的尿苷,所述经修饰的尿苷将是相同序列的常规RNA中的尿苷(其中所有碱基均为标准A、U、C或G碱基)。除非另有说明,本公开中列出或随附的序列表或序列的多核苷酸序列中的U可以是尿苷或经修饰的尿苷。
如本文所使用的,如果第一序列与第二序列的比对表明第二序列的X%或更多的位置整体上与第一序列匹配,则第一序列被认为“包括与第二序列具有至少X%同一性的序列”。例如,序列AAGA包括与序列AAG具有100%同一性的序列,因为比对将给出100%同一性,因为存在与第二序列的所有三个位置的匹配。只要相关核苷酸(如胸苷、尿苷或经修饰的尿苷)具有相同的互补物(例如,胸苷、尿苷或经修饰的尿苷的全部的腺苷;另一个实例是胞嘧啶和5-甲基胞嘧啶,两者均具有鸟苷或经修饰的鸟苷作为互补物),RNA与DNA之间的差异(通常是尿苷代替胸苷或反之亦然)以及如经修饰的尿苷等核苷类似物的存在就不会对多核苷酸之间的同一性或互补性差异有贡献。因此,例如,序列5'-AXG(其中X为任何经修饰的尿苷,如假尿苷、N1-甲基假尿苷或5-甲氧基尿苷)被认为与AUG 100%相同,因为两者与同一序列(5'-CAU)完全互补。示例性的比对算法是本领域众所周知的史密斯-沃特曼(Smith-Waterman)算法和尼德曼-翁施(Needleman-Wunsch)算法。本领域的技术人员将理解,对于要比对的给定的序列对,适当的算法和参数设置选择是什么;对于长度通常类似并且氨基酸的预期同一性>50%或核苷酸的预期同一性>75%的序列,具有EBI在www.ebi.ac.uk网站服务器上提供的尼德曼-翁施算法的默认设置的尼德曼-翁施算法通常是适当的。
“mRNA”在本文中用于指代为RNA或经修饰的RNA的多核苷酸并且包括可以被翻译成多肽的开放阅读框(也就是说,可以充当用于由核糖体和氨基酰化的tRNA翻译的底物)。mRNA可以包括包含核糖残基或其类似物(例如,2'-甲氧基核糖残基)的磷酸糖骨架。在一些实施例中,mRNA磷酸-糖骨架的糖基本上由核糖残基、2'-甲氧基核糖残基或其组合组成。一般来说,mRNA不含大量的胸苷残基(例如,0个残基或少于30、20、10、5、4、3或2个胸苷残基;或小于10%、9%、8%、7%、6%、5%、4%、4%、3%、2%、1%、0.5%、0.2%或0.1%的胸苷含量)。mRNA可以在其尿苷位置中的一些或全部处含有经修饰的尿苷。
如本文所使用的,“RNA引导的DNA结合剂”意指具有RNA和DNA结合活性的多肽或多肽复合物,或此类复合物的DNA结合亚基,其中DNA结合活性是序列特异性的并取决于RNA的序列。示例性RNA引导的DNA结合剂包含Cas切割酶/切口酶及其失活形式(“dCas DNA结合剂”)。如本文所使用的,“Cas核酸酶”,也称为“Cas蛋白”涵盖Cas切割酶、Cas切口酶和dCasDNA结合剂。Cas切割酶/切口酶和dCas DNA结合剂包含III型CRISPR系统的Csm或Cmr复合物、其Cas10、Csm1或Cmr2亚基、I型CRISPR系统的级联复合物、其Cas3亚基和第2类Cas核酸酶。如本文所使用的,“第2类Cas核酸酶”是具有RNA引导的DNA结合活性的单链多肽,如Cas9核酸酶或Cpf1核酸酶。第2类Cas核酸酶包含第2类Cas切割酶和第2类Cas切口酶(例如,H840A、D10A或N863A变体),所述切割酶/切口酶进一步具有RNA引导的DNA切割酶/切口酶活性,以及第2类dCas DNA结合剂,其中切割酶/切口酶活性失活。第2类Cas核酸酶包含例如,Cas9、Cpf1、C2c1、C2c2、C2c3、HF Cas9(例如,N497A、R661A、Q695A、Q926A变体)、HypaCas9(例如,N692A、M694A、Q695A、H698A变体)、eSPCas9(1.0)(例如,K810A、K1003A、R1060A变体)和eSPCas9(1.1)(例如,K848A、K1003A、R1060A变体)蛋白和其修饰。Cpf1蛋白,Zetsche等人,《细胞(Cell)》,163:1-13(2015),与Cas9同源并且含有RuvC样核酸酶结构域。Zetsche的Cpf1序列以全文引用的方式并入。参见例如Zetsche,表S1和S3。“Cas9”涵盖Spy Cas9、本文列出的Cas9变体以及其等效物。参见例如Makarova等人,《自然综述:微生物学(Nat RevMicrobiol)》,13(11):722-36(2015);Shmakov等人,《分子细胞(Molecular Cell)》,60:385-397(2015)。
如本文所使用的,给定开放阅读框(ORF)的“最小尿苷含量”是ORF的尿苷含量,所述ORF(a)在每个位置处使用最小尿苷密码子并且(b)对与给定ORF相同的氨基酸序列进行编码。给定氨基酸的最小尿苷密码子是具有最少尿苷的密码子(通常为0或1,苯丙氨酸密码子除外,其中最小尿苷密码子具有2个尿苷)。为了评估最小尿苷含量,经修饰的尿苷残基被认为等同于尿苷。
如本文所使用的,给定开放阅读框(ORF)的“最小尿苷二核苷酸含量”是ORF的最低可能尿苷二核尿苷(UU)含量,所述ORF(a)在每个位置处使用最小尿苷密码子(如上所述)并且(b)对与给定ORF相同的氨基酸序列进行编码。尿苷二核苷酸(UU)含量可以用绝对项表示为ORF中UU二核苷酸的枚举,或者以比率为基础表示为尿苷二核苷酸的尿苷占据的位置百分比(例如,AUUAU的尿苷二核苷酸含量将为40%,因为尿苷二核苷酸的尿苷占据了5个位置中的2个位置)。为了评估最小尿苷二核苷酸含量,经修饰的尿苷残基被认为等同于尿苷。
如本文所使用的,给定开放阅读框(ORF)的“最小腺嘌呤含量”是ORF的腺嘌呤含量,所述ORF(a)在每个位置处使用最小腺嘌呤密码子并且(b)对与给定ORF相同的氨基酸序列进行编码。给定氨基酸的最小腺嘌呤密码子是具有最少腺嘌呤的密码子(通常为0或1,赖氨酸和天冬酰胺密码子除外,其中最小腺嘌呤密码子具有2个腺嘌呤)。为了评估最小腺嘌呤含量,经修饰的腺嘌呤残基被认为等同于腺嘌呤。
如本文所使用的,给定开放阅读框(ORF)的“最小腺嘌呤二核苷酸含量”是ORF的最低可能腺嘌呤二核尿苷(AA)含量,所述ORF(a)在每个位置处使用最小腺嘌呤密码子(如上所述)并且(b)对与给定ORF相同的氨基酸序列进行编码。腺嘌呤二核苷酸(AA)含量可以用绝对项表示为ORF中AA二核苷酸的枚举,或者以比率为基础表示为腺嘌呤二核苷酸的腺嘌呤占据的位置百分比(例如,UAAUA的腺嘌呤二核苷酸含量将为40%,因为腺嘌呤二核苷酸的腺嘌呤占据了5个位置中的2个位置)。为了评估最小腺嘌呤二核苷酸含量,经修饰的腺嘌呤残基被认为等同于腺嘌呤。
如本文所使用的,给定开放阅读框(ORF)的“最小重复序列含量”是对与给定ORF相同的氨基酸序列进行编码的ORF中AA、CC、GG和TT(或TU、UT或UU)二核苷酸出现的最小可能总和。重复序列含量可以用绝对项表示为ORF中AA、CC、GG和TT(或TU、UT或UU)二核苷酸的枚举,或者以比率为基础表示为ORF中AA、CC、GG和TT(或TU、UT或UU)二核苷酸的枚举除以ORF的核苷酸长度(例如,UAAUA的重复序列含量将为20%,因为5个核苷酸的序列中出现一个重复序列)。为了评估最小重复序列含量,经修饰的腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶残基被认为等同于腺嘌呤、鸟嘌呤、胞嘧啶、胸腺嘧啶和尿嘧啶残基。
“向导RNA”、“gRNA”和“向导”在本文中可互换使用以指代crRNA(也被称为CRISPRRNA)或crRNA和trRNA的组合(也被称为tracrRNA)。crRNA和trRNA可以作为单个RNA分子(单向导RNA、sgRNA)或在两个单独的RNA分子(双向导RNA、dgRNA)中缔合。“向导RNA”或“gRNA”是指每种类型。trRNA可以是天然存在的序列,或与天然存在的序列相比具有修饰或变异的trRNA序列。向导RNA可以包含如本文所述的经修饰的RNA。
如本文所使用的,“向导序列”是指在向导RNA内与靶序列互补并且用作将向导RNA引导到靶序列以通过RNA引导的DNA结合剂进行结合或修饰(例如,切割)的序列。“向导序列”也可以被称为“靶向序列”或“间隔序列”。向导序列的长度可以是20个碱基对,例如,在酿脓链球菌(即Spy Cas9)和相关的Cas9同源物/直系同源物的情况下。较短或较长的序列还可以用作向导,例如,长度为15个、16个、17个、18个、19个、21个、22个、23个、24个或25个核苷酸。在一些实施例中,靶序列例如在基因中或在染色体上,并且与向导序列互补。在一些实施例中,向导序列与其对应靶序列之间的互补性或同一性程度可以为约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%。在一些实施例中,向导序列和靶区可以100%互补或相同。在其它实施例中,向导序列和靶区可以含有至少一个错配。例如,向导序列和靶序列可以含有1个、2个、3个或4个错配,其中靶序列的总长度为至少17个、18个、19个、20个或更多个碱基对。在一些实施例中,向导序列和靶区可以含有1-4个错配,其中向导序列包括至少17个、18个、19个、20个或更多个核苷酸。在一些实施例中,向导序列和靶区可以含有1个、2个、3个或4个错配,其中向导序列包括20个核苷酸。
Cas蛋白的靶序列包含基因组DNA的正链和负链两者(也就是说,给定的序列和序列的反向互补物),因为Cas蛋白的核酸底物是双链核酸。因此,在向导序列被称为“与靶序列互补”的情况下,应当理解,向导序列可以将向导RNA引导为与靶序列的反向互补物结合。因此,在一些实施例中,在向导序列结合靶序列的反向互补物的情况下,除了向导序列中的U代替T之外,向导序列与靶序列的某些核苷酸(例如,不包含PAM的靶序列)相同。
如本文所使用的,“插入缺失”是指由在核酸中的双链断裂(DSB)位点处插入或缺失的许多核苷酸组成的插入/缺失突变。
如本文所使用的,“敲低”是指特定基因产物(例如,蛋白质、mRNA或两者)表达的降低。可以通过检测组织或细胞群(例如,在血清或细胞培养基中)分泌的蛋白质或通过检测来自所关注的组织或细胞群的蛋白质的总细胞量来测量蛋白质的敲低。用于测量mRNA敲低的方法是已知的并且包含对从所关注的组织或细胞群中分离的mRNA进行测序。在一些实施例中,“敲低”可以是指特定基因产物表达的一些丧失,例如转录的mRNA量的减少或细胞群(包含体内群体,如组织中发现的那些群体)表达或分泌的蛋白质量的减少。
如本文所使用的,“敲除”是指细胞中特定蛋白质表达的丧失。可以通过检测来自组织或细胞群(例如,在血清或细胞培养基中)分泌的蛋白质的量或通过检测组织或细胞群的蛋白质的总细胞量来测量敲除。在一些实施例中,本公开的方法“敲除”一个或多个细胞中(例如,包含体内群体的细胞群中,如在组织中发现的那些细胞群中)的靶蛋白。在一些实施例中,敲除不是形成例如通过插入缺失产生的靶蛋白的突变体,而是所述靶蛋白在细胞中表达的完全丧失。
如本文所使用的,“核糖核蛋白”(RNP)或“RNP复合物”是指向导RNA以及RNA引导的DNA结合剂,如Cas切割酶、切口酶或dCas DNA结合剂(例如,Cas9)。在一些实施例中,向导RNA将如Cas9等RNA引导的DNA结合剂引导到靶序列,并且向导RNA与靶序列杂交并且所述试剂与靶序列结合;在试剂是切割酶或切口酶的情况下,结合之后可以是切割或切口。
如本文所使用的,“靶序列”是指靶基因中的与gRNA的向导序列互补的核酸序列。靶序列和向导序列的相互作用引导RNA引导的DNA结合剂在靶序列内结合并潜在地切口或切割(取决于试剂的活性)。
如本文所使用的,“治疗”是指针对受试者的疾病或病症的治疗剂的任何施用或应用,并且包含抑制疾病、阻止其发展、缓解疾病的一种或多种症状、治愈疾病或预防疾病的一种或多种症状的复发。
如本文所使用的,术语“脂质纳米颗粒”(LNP)是指包括多个(即,多于一个)通过分子间作用力物理地相互关联的脂质分子的颗粒。所述LNP可以是例如微球(包含单层和多层囊泡,例如“脂质体”-层状相脂质双层,所述层状相脂质双层在一些实施例中基本上是球形的,并且在更具体的实施例中可以包括水核,例如包括RNA分子的很大一部分)、乳液中的分散相、胶束或悬浮液中的内相。乳液、胶束和悬浮液可以是适合于局部(local/topical)递送的组合物。也参见例如WO2017173054A1,其内容特此以全文引用的方式并入。本领域技术人员已知能够向受试者递送核苷酸的任何LNP可以与本文所述的向导RNA和对RNA引导的DNA结合剂进行编码的核酸一起使用。
如本文所使用的,术语“核定位信号”(NLS)或“核定位序列”是指诱导包括此类序列或与此类序列连接的分子转运到真核细胞的细胞核中的氨基酸序列。核定位信号可以形成待转运的分子的一部分。在一些实施例中,NLS可以通过共价键、氢键或离子相互作用连接到分子的其余部分。
如本文所使用的,短语“药学上可接受的”意指在制备通常无毒且在生物学上期望的并且在其它方面可用于药物用途的药物组合物中有用的。
A.示例性多核苷酸和组合物
1.ORF密码子对、密码子和重复序列含量
就每个mRNA分子产生的多肽分子而言,某些ORF在体内的翻译效率高于其它ORF。据推测,此类高效翻译的ORF的密码子对的使用可能有助于翻译效率。
因此,通过比较来自人细胞的mRNA和蛋白质丰度数据并选择具有高蛋白质与mRNA丰度比率的基因,鉴定出高效翻译的ORF的集合。作为陪衬,除了选择了具有低蛋白质与mRNA比率的基因之外,以类似方式鉴定出低效翻译的ORF的集合。分析这些集合以确定高效和低效翻译的ORF中显著富集的密码子对。
表1和表2分别示出了在高效和低效翻译的ORF中被鉴定为富集的密码子对。进一步分析相同集合以确定在高效和低效翻译的ORF中显著富集的单独密码子。表3和表4分别示出了在高效和低效翻译的ORF中被鉴定为富集的密码子。
表1.在高效翻译的ORF中富集的密码子对
表2.在低效翻译的ORF中富集的密码子对
第一氨基酸 | 第二氨基酸 | 密码子对 | 第一氨基酸 | 第二氨基酸 | 密码子对 |
A | A | GCUGCU | W | H | UGGCAU |
G | A | GGUGCU | E | L | GAGCUA |
K | A | AAGGCU | Q | L | CAGUUG |
P | A | CCAGCU | R | L | CGUCUU |
Q | A | CAGGCU | V | L | GUGCUA |
P | D | CCUGAU | A | P | GCACCA |
Q | D | CAAGAU | G | P | GGACCA |
R | D | CGAGAU | I | P | AUCCCU |
A | E | GCGGAA | L | P | CUUCCU |
A | E | GCAGAA | T | P | ACUCCA |
G | E | GGUGAA | W | P | UGGCCU |
P | E | CCAGAA | T | Q | ACUCAG |
Q | E | CAGGAA | E | R | GAGAGA |
R | E | AGGGAA | L | R | CUGAGA |
T | E | ACAGAA | P | R | CCAAGA |
W | E | UGGGAA | P | R | CCCAGA |
A | G | GCUGGA | S | S | AGCUCU |
G | G | GGUGGU | R | T | CGCACU |
K | G | AAGGGU | E | V | GAGGUU |
P | G | CCUGGU | P | V | CCUGUU |
P | G | CCAGGA | Q | V | CAGGUU |
P | G | CCUGGA | V | V | GUGGUU |
V | G | GUAGGA | T | Y | ACCUAU |
表3.在高效翻译的ORF中富集的密码子
表4.在低效翻译的ORF中富集的密码子
氨基酸 | 密码子 |
[终止密码子] | UAA |
A | GCA |
A | GCU |
C | UGU |
D | GAU |
E | GAA |
F | UUU |
G | GGA |
G | GGU |
H | CAU |
I | AUU |
L | CUA |
L | CUU |
L | UUA |
L | UUG |
N | AAU |
P | CCA |
P | CCU |
Q | CAA |
R | AGA |
R | CGA |
R | CGU |
S | AGU |
S | UCU |
T | ACA |
T | ACU |
V | GUA |
V | GUU |
Y | UAU |
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中小于或等于1%的密码子对是表2中所示的密码子对,任选地进一步其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中小于或等于0.9%的密码子对是表2中所示的密码子对,任选地进一步其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中至少75%、至少76%、至少77%、至少78%、至少79%、至少80%的密码子是表3所示的密码子,任选地进一步其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度以及密码子和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中至少60%、65%、70%、75%或76%的密码子是表3中所示的密码子,任选地进一步其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对,或者其中所述ORF中至少1%的密码子对是表1中所示的密码子对,并且所述ORF不对RNA引导的DNA结合剂进行编码。在一些实施例中,多肽长度以及密码子和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中小于或等于20%、小于或等于15%、小于或等于10%、小于或等于5%的密码子是表4中所示的密码子,任选地进一步其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度以及密码子和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF中小于或等于15%的密码子是表4中所示的密码子,任选地进一步其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度以及密码子和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,所述ORF中至少1.05%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.2%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少1.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.0%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少2.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.0%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.2%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中至少3.7%的密码子对是表1中所示的密码子对。
在一些实施例中,所述ORF中小于或等于10%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.2%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于9.0%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.2%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于8.0%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.3%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.2%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.1%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于7.0%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.9%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.8%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.7%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.6%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.5%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.4%的密码子对是表1中所示的密码子对。在一些实施例中,所述ORF中小于或等于6.32%的密码子对是表1中所示的密码子对。
在一些实施例中,所述ORF中小于或等于0.8%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.7%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.6%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.5%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.45%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.4%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.3%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.2%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF中小于或等于0.1%的密码子对是表2中所示的密码子对。在一些实施例中,所述ORF不包括表2中所示的密码子对。
在一些实施例中,所述ORF中小于或等于15%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于14.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于14%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于13.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于13%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于12.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于12%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于11.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于11%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于10.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于10%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于9.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于9%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于8.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于8%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于7.5%的密码子是表4中所示的密码子。在一些实施例中,所述ORF中小于或等于7%的密码子是表4中所示的密码子。
在一些实施例中,所述ORF中至少77%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中至少78%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中至少79%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中至少80%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于87%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于86%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于85%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于84%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于83%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于82%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于81%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于80%的密码子是表3中所示的密码子。在一些实施例中,所述ORF中小于或等于79%的密码子是表3中所示的密码子。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF的重复序列含量为22%-27%、22%-23%、22.3%-23%、23%-24%、24%-25%、25%-26%或26%-27%;大于或等于20%、21%或22%;小于或等于20%、21%或22%,任选地进一步其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度、重复序列和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF的重复序列含量小于或等于23.3%,任选地进一步其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度、重复序列和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF的GC含量大于或等于54%、55%、56%、56%、57%、58%、59%、60%或61%;小于或等于64%、63%、62%、61%、60%或59%,任选地进一步其中所述ORF中至少1%、至少2%、至少3%或至少4%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度、重复序列和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,提供了一种多核苷酸,所述多核苷酸包括对长度为至少30个氨基酸的多肽进行编码的开放阅读框(ORF),其中所述ORF的GC含量大于或等于55%,任选地进一步其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。在一些实施例中,多肽长度、重复序列和密码子对含量如本文其它地方所述,例如在上文的介绍和发明内容部分所述。
在一些实施例中,所述ORF的重复序列含量大于或等于20%。在一些实施例中,所述ORF的重复序列含量大于或等于20.5%。在一些实施例中,所述ORF的重复序列含量大于或等于21%。在一些实施例中,所述ORF的重复序列含量大于或等于21.5%。在一些实施例中,所述ORF的重复序列含量大于或等于21.7%。在一些实施例中,所述ORF的重复序列含量大于或等于21.9%。在一些实施例中,所述ORF的重复序列含量大于或等于22.1%。在一些实施例中,所述ORF的重复序列含量大于或等于22.2%。
在一些实施例中,所述ORF的GC含量大于或等于56%。在一些实施例中,所述ORF的GC含量大于或等于56.5%。在一些实施例中,所述ORF的GC含量大于或等于57%。在一些实施例中,所述ORF的GC含量大于或等于57.5%。在一些实施例中,所述ORF的GC含量大于或等于58%。在一些实施例中,所述ORF的GC含量大于或等于58.5%。在一些实施例中,所述ORF的GC含量大于或等于59%。在一些实施例中,所述ORF的GC含量小于或等于63%。在一些实施例中,所述ORF的GC含量小于或等于62.6%。在一些实施例中,所述ORF的GC含量小于或等于62.1%。在一些实施例中,所述ORF的GC含量小于或等于61.6%。在一些实施例中,所述ORF的GC含量小于或等于61.1%。在一些实施例中,所述ORF的GC含量小于或等于60.6%。在一些实施例中,所述ORF的GC含量小于或等于60.1%。
在一些实施例中,所述ORF的重复序列含量小于或等于59.6%。在一些实施例中,所述ORF的重复序列含量小于或等于23.2%。在一些实施例中,所述ORF的重复序列含量小于或等于23.1%。在一些实施例中,所述ORF的重复序列含量小于或等于23.0%。在一些实施例中,所述ORF的重复序列含量小于或等于22.9%。在一些实施例中,所述ORF的重复序列含量小于或等于22.8%。在一些实施例中,所述ORF的重复序列含量小于或等于22.7%。在一些实施例中,所述ORF的重复序列含量小于或等于22.6%。在一些实施例中,所述ORF的重复序列含量小于或等于22.5%。在一些实施例中,所述ORF的重复序列含量小于或等于22.4%。
应理解,总的来说,第一氨基酸和第二氨基酸有400种可能的配对,并且未鉴定出所有配对的显著富集的密码子对。此外,在一些情况下,对于应在第一二肽片段的C端位置还是在第二二肽片段的N端片段的位置处使用哪种氨基酸,重叠的二肽片段之间可能存在冲突,或者可能有对应于给定二肽片段的多于一个可能的富集密码子对。因此,为了设计完整的ORF,采用一种或多种另外的方法对没有富集对或重叠的二肽之间有冲突的成对氨基酸进行编码通常将是有用的。在此类情况下,提供了多种用于测定合适密码子的方法。例如,一种此类方法是使用来自野生型序列的密码子,其中对天然存在的多肽进行编码。另一种方法是使用一个或多个算法步骤来缩小每个氨基酸的可能密码子。第三种方法是使用为每个氨基酸提供特定密码子的密码子集合。
关于缩小每个氨基酸的可能密码子的算法步骤,以下步骤中的一个或多个步骤可以应用于表1的密码子对未给出密码子或给出冲突或多个密码子的一个或多个(例如,所有)位置。
在一些实施例中,在给出冲突或多个密码子的情况下,表3中未出现的密码子被消除,即不再另外考虑包含在所述ORF中。在一些实施例中,在给出冲突或多个密码子的情况下,消除表4中出现的密码子。在一些实施例中,在给出冲突或多个密码子的情况下,消除将导致表2中存在密码子对的密码子。这些可以以任何顺序组合。例如,首先消除将导致表2中存在密码子对的密码子,然后如果存在多于一种可能性,则消除表3中未出现的密码子和/或表4中出现的密码子。如果这些方法中的任何一种方法消除了所有可能的密码子,那么就可以像没有给出所述位置的密码子一样继续进行。
在一些实施例中,在给出冲突或多个密码子的情况下,使用使尿苷含量最小化的密码子。在一些实施例中,在给出冲突或多个密码子的情况下,使用使重复序列含量最小化的密码子。在一些实施例中,在给出冲突或多个密码子的情况下,使用使GC含量最大化的密码子。在第一步没有提供要使用的单个密码子的情况下,这些步骤的任何组合都可以分层应用。例如,首先基于尿苷的最小化进行选择;然后基于重复序列的最小化进行选择;然后基于GC含量的最大化进行选择。上述缩小每个氨基酸的可能密码子的步骤通常足以将每个位置解析为单个密码子;然而,如果仍然存在多于一种可能性,则可以基本上随机地选择一种,例如使用伪随机数发生器,或者通过求助于一对一密码子集合,如本文中所述的那些密码子集合中的任何一种。
在一些实施例中,在给出冲突或多个密码子的情况下,消除表3中未出现的密码子,并且任选地消除表4中出现的密码子和/或消除将导致表2中存在密码子对的密码子,并且然后应用以下中的至少一项:使用使尿苷含量最小化的密码子;使用使重复序列含量最小化的密码子;和/或使用使GC含量最大化的密码子。在第一步没有提供要使用的单个密码子的情况下,这些步骤的任何组合都可以分层应用。例如,首先基于尿苷的最小化进行选择;然后基于重复序列的最小化进行选择;然后基于GC含量的最大化进行选择。上述缩小每个氨基酸的可能密码子的步骤通常足以将每个位置解析为单个密码子;然而,如果仍然存在多于一种可能性,则可以基本上随机地选择一种,例如使用伪随机数发生器,或者通过求助于一对一密码子集合,如本文中所述的那些密码子集合中的任何一种。
在一些实施例中,在给出冲突或多个密码子的情况下,消除表4中出现的密码子,并且任选地消除表3中未出现的密码子和/或消除将导致表2中存在密码子对的密码子,并且然后应用以下中的至少一项:使用使尿苷含量最小化的密码子;使用使重复序列含量最小化的密码子;和/或使用使GC含量最大化的密码子。在第一步没有提供要使用的单个密码子的情况下,这些步骤的任何组合都可以分层应用。例如,首先基于尿苷的最小化进行选择;然后基于重复序列的最小化进行选择;然后基于GC含量的最大化进行选择。上述缩小每个氨基酸的可能密码子的步骤通常足以将每个位置解析为单个密码子;然而,如果仍然存在多于一种可能性,则可以基本上随机地选择一种,例如使用伪随机数发生器,或者通过求助于一对一密码子集合,如本文中所述的那些密码子集合中的任何一种。
在一些实施例中,在给出冲突或多个密码子的情况下,消除将导致表2中存在密码子对的密码子,并且任选地消除表3中未出现的密码子和/或消除表4中出现的密码子,并且然后应用以下中的至少一项:使用使尿苷含量最小化的密码子;使用使重复序列含量最小化的密码子;和/或使用使GC含量最大化的密码子。在第一步没有提供要使用的单个密码子的情况下,这些步骤的任何组合都可以分层应用。例如,首先基于尿苷的最小化进行选择;然后基于重复序列的最小化进行选择;然后基于GC含量的最大化进行选择。上述缩小每个氨基酸的可能密码子的步骤通常足以将每个位置解析为单个密码子;然而,如果仍然存在多于一种可能性,则可以基本上随机地选择一种,例如使用伪随机数发生器,或者通过求助于一对一密码子集合,如本文中所述的那些密码子集合中的任何一种。
在没有给出密码子的情况下(并且任选地在给出冲突或多个密码子的情况下),可以从以下开始:待编码的氨基酸的所有可用密码子集合;待编码的氨基酸的所有可用密码子集合,除了表4中出现的那些密码子之外;待编码的氨基酸的所有可用密码子集合,除了将导致表2中存在密码子对的密码子之外;待编码的氨基酸的所有可用密码子集合,除了出现在表4中或将导致表2中存在密码子对的密码子之外;并且然后应用上述方法或其组合,如首先基于尿苷的最小化进行选择;然后基于重复序列的最小化进行选择;然后基于GC含量的最大化进行选择。可替代地,可以简单地求助于一对一密码子集合,如本文所述的任何密码子集合。示例性密码子集合出现在下表中。这些集合也可以用于实施上述第三种选择,即,当从表1中选择的密码子对未提供给定位置处的单个密码子时,使用为每个氨基酸提供特定密码子的密码子集合。
表5.与长mRNA半衰期相关的密码子
氨基酸 | 密码子 |
Gly | GGT |
Glu | GAA |
Asp | GAC |
Val | GTC |
Ala | GCC |
Arg | AGA |
Ser | TCT |
Lys | AAG |
Asn | AAC |
Met | ATG |
Ile | ATC |
Thr | ACC |
Trp | TGG |
Cys | TGC |
Tyr | TAC |
Leu | TTG |
Phe | TTC |
Gln | CAA |
His | CAC |
表6.与高肝脏表达和最低尿苷含量相关的密码子
表7.另外的示例性密码子集合:
氨基酸 | 低U | 高U | 低G | 低C | 低A | 低A/U |
Gly | GGC | GGT | GGC | GGA | GGC | GGC |
Glu | GAG | GAA | GAA | GAG | GAG | GAG |
Asp | GAC | GAT | GAC | GAT | GAC | GAC |
Val | GTG | GTT | GTC | GTG | GTG | GTG |
Ala | GCC | GCT | GCC | GCT | GCC | GCC |
Arg | AGA | CGT | AGA | AGA | CGG | CGG |
Ser | AGC | TCT | TCC | AGT | TCC | AGC |
Lys | AAG | AAA | AAA | AAG | AAG | AAG |
Asn | AAC | AAT | AAC | AAT | AAC | AAC |
Met | ATG | ATG | ATG | AGT | ATG | ATG |
Ile | ATC | ATT | ATC | ATT | ATC | ATC |
Thr | ACC | ACT | ACC | ACA | ACC | ACC |
Trp | TGG | TGG | TGG | TGG | TGG | TGG |
Cys | TGC | TGT | TGC | TGT | TGC | TGC |
Tyr | TAC | TAT | TAC | TAT | TAC | TAC |
Leu | CTG | TTA | CTC | TTG | CTG | CTG |
Phe | TTC | TTT | TTC | TTT | TTC | TTC |
Gln | CAG | CAA | CAA | CAG | CAG | CAG |
His | CAC | CAT | CAC | CAT | CAC | CAC |
在使用来自表7的集合的情况下,在一些实施例中,所述集合是低U、低A或低A/U集合。
对Cas9核酸酶进行编码并且富集或耗竭不同密码子集合和密码子对的示例性ORF序列在本文中提供为根据本文公开的方法生成的SEQ ID NO:5-14。如表8所示,ORF序列的集合在密码子对中提供不同的富集或耗竭。
表8.示例性ORF序列的特性:
在表8中,E-对、I-对、E-单独和I-单独分别指表1-4中的密码子对或密码子。除了简要说明栏中所示的富集或耗竭之外,所有SEQ ID NO:5-10进一步经受使尿苷最小化、使重复序列最小化和使GC含量最大化的步骤。SEQ ID NO:29和46在未使用表1的密码子对的位置处分别使用了表6的密码子和表7的低A集合。括号中所示的富集或耗竭是可有可无的,因为与不在括号中的富集/耗竭步骤加上使尿苷最小化、使重复序列最小化和使GC含量最大化的步骤产生的序列相比,所述富集或耗竭没有进一步修饰序列。除了简要说明栏中所示的富集或耗竭之外,所有SEQ ID NO:11-14进一步经受使尿苷最大化、使重复序列最大化和使GC含量最小化的步骤。在所有情况下,富集/耗竭步骤(在使用的情况下)均按以下顺序执行:E-对;I-对;E-单独;I-单独;尿苷;重复序列;GC含量。一旦给定位置收敛到单个密码子而没有因重叠对产生冲突,就不会对所述位置应用另外的步骤。
在本文所述的任何实施例中,包括对多肽进行编码的开放阅读框(ORF)的多核苷酸可以是mRNA。在本文所述的任何实施例中,包括对多肽进行编码的开放阅读框(ORF)的多核苷酸可以是包括可操作地连接到所述ORF的启动子的表达构建体。
2.尿苷含量低的ORF
在一些实施例中,对多肽进行编码的所述ORF的尿苷含量的范围为所述ORF的最小尿苷含量到所述ORF的最小尿苷含量的约150%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%。在一些实施例中,所述ORF的尿苷含量等于所述ORF的最小尿苷含量。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约150%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约145%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约140%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约135%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约130%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约125%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约120%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约115%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约110%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约105%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约104%。
在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约103%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约102%。在一些实施例中,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约101%。
在一些实施例中,所述ORF的尿苷二核苷酸含量的范围为所述ORF的最小尿苷二核苷酸含量到所述ORF的最小尿苷二核苷酸含量的200%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约195%、190%、185%、180%、175%、170%、165%、160%、155%、150%、145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%。在一些实施例中,所述ORF的尿苷二核苷酸含量等于所述ORF的最小尿苷二核苷酸含量。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约200%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约195%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约190%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约185%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约180%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约175%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约170%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约165%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约160%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约155%。在一些实施例中,所述ORF的尿苷二核苷酸含量等于所述ORF的最小尿苷二核苷酸含量。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约150%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约145%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约140%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约135%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约130%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约125%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约120%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约115%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约110%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约105%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约104%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约103%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约102%。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于所述ORF的最小尿苷二核苷酸含量的约101%。
在一些实施例中,所述ORF的尿苷二核苷酸含量的范围为所述ORF的最小尿苷二核苷酸含量到尿苷二核苷酸含量,所述尿苷二核苷酸含量为对与所讨论的mRNA相同的蛋白质进行编码的参考序列的最大尿苷二核苷酸含量的90%或更低。在一些实施例中,所述ORF的尿苷二核苷酸含量小于或等于对与所讨论的mRNA相同的蛋白质进行编码的参考序列的最大尿苷二核苷酸含量的约85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。
在一些实施例中,所述ORF的尿苷三核苷酸含量的范围为0个尿苷三核苷酸到1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个或50个尿苷三核苷酸(其中尿苷的较长运行按其内独特的三个尿苷片段的数量计数,例如,一个尿苷四核苷酸含有两个尿苷三核苷酸,一个尿苷五核苷酸含有三个尿苷三核苷酸等)。在一些实施例中,所述ORF的尿苷三核苷酸含量的范围为0%尿苷三核苷酸到0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%或2%尿苷三核苷酸,其中尿苷三核苷酸的含量百分比被计算为形成尿苷三核苷酸的一部分(或尿苷的较长运行)的尿苷在序列中占据的位置的百分比,使得序列UUUAAA和UUUUAAAA各自将具有50%的尿苷三核苷酸含量。例如,在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于2%。例如,在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于1.5%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于1%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.9%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.8%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.7%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.6%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.5%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.4%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.3%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.2%。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于0.1%。在一些实施例中,所述ORF不含尿苷三核苷酸。
在一些实施例中,所述ORF的尿苷三核苷酸含量的范围为所述ORF的最小尿苷三核苷酸含量到尿苷三核苷酸含量,所述尿苷三核苷酸含量为对与所讨论的多核苷酸相同的蛋白质进行编码的参考序列的最大尿苷三核苷酸含量的90%或更低。在一些实施例中,所述ORF的尿苷三核苷酸含量小于或等于对与所讨论的多核苷酸相同的蛋白质进行编码的参考序列的最大尿苷三核苷酸含量的约85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。
在一些实施例中,所述ORF具有最小核苷酸均聚物,例如相同核苷酸的重复串。例如,在一些实施例中,当从表9中列出的密码子中选择最小尿苷密码子时,通过选择减少核苷酸均聚物的数量和长度的最小尿苷密码子来构建多核苷酸,例如选择GCA而不是GCC用于丙氨酸、或选择GGA而不是GGG用于甘氨酸或选择AAG而不是AAA用于赖氨酸。
给定ORF可以降低尿苷含量或尿苷二核苷酸含量或尿苷三核苷酸含量,例如通过在所述ORF的足够部分中使用最小尿苷密码子。例如,由本文所述的ORF编码的多肽的氨基酸序列可以通过将氨基酸转化为密码子而反向翻译成ORF序列,其中所述ORF中的一些或全部使用如下所示的示例性最小尿苷密码子。在一些实施例中,所述ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子是表9中列出的密码子。
表9.示例性最小尿苷密码子
氨基酸 | 最小尿苷密码子 | |
A | 丙氨酸 | GCA或GCC或GCG |
G | 甘氨酸 | GGA或GGC或GGG |
V | 缬氨酸 | GUC或GUA或GUG |
D | 天冬氨酸 | GAC |
E | 谷氨酸 | GAA或GAG |
I | 异亮氨酸 | AUC或AUA |
T | 苏氨酸 | ACA或ACC或ACG |
N | 天冬酰胺 | AAC |
K | 赖氨酸 | AAG或AAA |
S | 丝氨酸 | AGC |
R | 精氨酸 | AGA或AGG |
L | 亮氨酸 | CUG或CUA或CUC |
P | 脯氨酸 | CCG或CCA或CCC |
H | 组氨酸 | CAC |
Q | 谷氨酰胺 | CAG或CAA |
F | 苯丙氨酸 | UUC |
Y | 酪氨酸 | UAC |
C | 半胱氨酸 | UGC |
W | 色氨酸 | UGG |
M | 甲硫氨酸 | AUG |
在一些实施例中,所述ORF由密码子的集合组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子是表9中列出的密码子。
3.腺嘌呤含量低的ORF
在一些实施例中,所述ORF的腺嘌呤含量的范围为所述ORF的最小腺嘌呤含量到所述ORF的最小腺嘌呤含量的约150%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%。在一些实施例中,所述ORF的腺嘌呤含量等于所述ORF的最小腺嘌呤含量。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约150%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约145%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约140%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约135%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约130%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约125%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约120%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约115%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约110%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约105%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约104%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约103%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约102%。在一些实施例中,所述ORF的腺嘌呤含量小于或等于所述ORF的最小腺嘌呤含量的约101%。
在一些实施例中,所述ORF的腺嘌呤二核苷酸含量的范围为所述ORF的最小腺嘌呤二核苷酸含量到所述ORF的最小腺嘌呤二核苷酸含量的200%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约195%、190%、185%、180%、175%、170%、165%、160%、155%、150%、145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量等于所述ORF的最小腺嘌呤二核苷酸含量。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约200%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约195%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约190%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约185%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约180%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约175%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约170%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约165%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约160%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约155%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量等于所述ORF的最小腺嘌呤二核苷酸含量。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约150%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约145%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约140%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约135%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约130%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约125%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约120%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约115%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约110%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约105%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约104%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约103%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约102%。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于所述ORF的最小腺嘌呤二核苷酸含量的约101%。
在一些实施例中,所述ORF的腺嘌呤二核苷酸含量的范围为所述ORF的最小腺嘌呤二核苷酸含量到腺嘌呤二核苷酸含量,所述腺嘌呤二核苷酸含量为对与所讨论的多核苷酸相同的蛋白质进行编码的参考序列的最大腺嘌呤二核苷酸含量的90%或更低。在一些实施例中,所述ORF的腺嘌呤二核苷酸含量小于或等于对与所讨论的多核苷酸相同的蛋白质进行的参考序列的最大腺嘌呤二核苷酸含量的约85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。
在一些实施例中,所述ORF的腺嘌呤三核苷酸含量的范围为0个腺嘌呤三核苷酸到1个、2个、3个、4个、5个、6个、7个、8个、9个、10个、20个、30个、40个或50个腺嘌呤三核苷酸(其中腺嘌呤的较长运行按其内独特的三个腺嘌呤片段的数量计数,例如,一个腺嘌呤四核苷酸含有两个腺嘌呤三核苷酸,一个腺嘌呤五核苷酸含有三个腺嘌呤三核苷酸等)。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量的范围为0%腺嘌呤三核苷酸到0.1%、0.2%、0.3%、0.4%、0.5%、0.6%、0.7%、0.8%、0.9%、1%、1.5%或2%腺嘌呤三核苷酸,其中腺嘌呤三核苷酸的含量百分比被计算为形成腺嘌呤三核苷酸的一部分(或腺嘌呤的较长运行)的腺嘌呤在序列中占据的位置的百分比,使得序列UUUAAA和UUUUAAAA各自将具有50%的腺嘌呤三核苷酸含量。例如,在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于2%。例如,在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于1.5%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于1%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.9%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.8%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.7%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.6%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.5%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.4%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.3%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.2%。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于0.1%。在一些实施例中,所述ORF不含腺嘌呤三核苷酸。
在一些实施例中,所述ORF的腺嘌呤三核苷酸含量的范围为所述ORF的最小腺嘌呤三核苷酸含量到腺嘌呤三核苷酸含量,所述腺嘌呤三核苷酸含量为对与所讨论的多核苷酸相同的蛋白质进行编码的参考序列的最大腺嘌呤三核苷酸含量的90%或更低。在一些实施例中,所述ORF的腺嘌呤三核苷酸含量小于或等于对与所讨论的多核苷酸相同的蛋白质进行的参考序列的最大腺嘌呤三核苷酸含量的约85%、80%、75%、70%、65%、60%、55%、50%、45%、40%、35%、30%、25%、20%、15%、10%或5%。在一些实施例中,所述ORF具有最小核苷酸均聚物,例如相同核苷酸的重复串。例如,在一些实施例中,当从表10中列出的密码子中选择最小腺嘌呤密码子时,通过选择减少核苷酸均聚物的数量和长度的最小腺嘌呤密码子来构建多核苷酸,例如选择GCA而不是GCC用于丙氨酸、或选择GGA而不是GGG用于甘氨酸或选择AAG而不是AAA用于赖氨酸。给定ORF可以降低腺嘌呤含量或腺嘌呤二核苷酸含量或腺嘌呤三核苷酸含量,例如通过在所述ORF的足够部分中使用最小腺嘌呤密码子。例如,由本文所述的ORF编码的多肽的氨基酸序列可以通过将氨基酸转化为密码子而反向翻译成ORF序列,其中所述ORF中的一些或全部使用如下所示的示例性最小腺嘌呤密码子。在一些实施例中,所述ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子是表10中列出的密码子。
表10.示例性最小腺嘌呤密码子
氨基酸 | 最小腺嘌呤密码子 | |
A | 丙氨酸 | GCU或GCC或GCG |
G | 甘氨酸 | GGU或GGC或GGG |
V | 缬氨酸 | GUC或GUU或GUG |
D | 天冬氨酸 | GAC或GAU |
E | 谷氨酸 | GAG |
I | 异亮氨酸 | AUC或AUU |
T | 苏氨酸 | ACU或ACC或ACG |
N | 天冬酰胺 | AAC或AAU |
K | 赖氨酸 | AAG |
S | 丝氨酸 | UCU或UCC或UCG |
R | 精氨酸 | CGU或CGC或CGG |
L | 亮氨酸 | CUG或CUC或CUU |
P | 脯氨酸 | CCG或CCU或CCC |
H | 组氨酸 | CAC或CAU |
Q | 谷氨酰胺 | CAG |
F | 苯丙氨酸 | UUC或UUU |
Y | 酪氨酸 | UAC或UAU |
C | 半胱氨酸 | UGC或UGU |
W | 色氨酸 | UGG |
M | 甲硫氨酸 | AUG |
在一些实施例中,所述ORF由密码子的集合组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子是表10中列出的密码子。
4.具有低腺嘌呤和低尿苷含量的ORF
在可行的范围内,上述关于低腺嘌呤含量的任何特征可以与上述关于低尿苷含量的任何特征组合。例如,所述ORF的尿苷含量的范围为所述ORF的最小尿苷含量到所述ORF的最小尿苷含量的约150%(例如,所述ORF的尿苷含量小于或等于所述ORF的最小尿苷含量的约145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%),并且所述ORF的腺嘌呤含量的范围为所述ORF的最小腺嘌呤含量到所述ORF的最小腺嘌呤含量的约150%(例如,小于或等于所述ORF的最小腺嘌呤含量的约145%、140%、135%、130%、125%、120%、115%、110%、105%、104%、103%、102%或101%)。尿苷和腺嘌呤二核苷酸也是如此。类似地,所述ORF中尿苷核苷酸和腺嘌呤二核苷酸的含量可以如上所述。类似地,所述ORF中尿苷二核苷酸和腺嘌呤核苷酸的含量可以如上所述。
给定ORF可以降低尿苷和腺嘌呤核苷酸和/或二核苷酸含量,例如通过在所述ORF的足够部分中使用最小尿苷和腺嘌呤密码子。例如,由本文所述的ORF编码的多肽的氨基酸序列可以通过将氨基酸转化为密码子而反向翻译成ORF序列,其中所述ORF中的一些或全部使用如下所示的示例性最小尿苷和腺嘌呤密码子。在一些实施例中,所述ORF中至少约50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的密码子是表11中列出的密码子。
表11.示例性最小尿苷和腺嘌呤密码子
氨基酸 | 最小尿苷密码子 | |
A | 丙氨酸 | GCC或GCG |
G | 甘氨酸 | GGC或GGG |
V | 缬氨酸 | GUC或GUG |
D | 天冬氨酸 | GAC |
E | 谷氨酸 | GAG |
I | 异亮氨酸 | AUC |
T | 苏氨酸 | ACC或ACG |
N | 天冬酰胺 | AAC |
K | 赖氨酸 | AAG |
S | 丝氨酸 | AGC或UCC或UCG |
R | 精氨酸 | CGC或CGG |
L | 亮氨酸 | CUG或CUC |
P | 脯氨酸 | CCG或CCC |
H | 组氨酸 | CAC |
Q | 谷氨酰胺 | CAG |
F | 苯丙氨酸 | UUC |
Y | 酪氨酸 | UAC |
C | 半胱氨酸 | UGC |
W | 色氨酸 | UGG |
M | 甲硫氨酸 | AUG |
在一些实施例中,所述ORF由密码子的集合组成,其中至少约75%、80%、85%、90%、95%、98%、99%或100%的密码子是表11中列出的密码子。从表11中可以看出,三个所列丝氨酸密码子中的每一个都含有一个A或一个U。在一些实施例中,通过使用丝氨酸的AGC密码子来优先化尿苷最小化。在一些实施例中,通过使用丝氨酸的UCC和/或UCG密码子来优先化腺嘌呤最小化。
5.增加翻译和/或对应于高表达tRNA的密码子;示例性密码子集合
在一些实施例中,所述ORF的密码子增加在哺乳动物(如人类)中的翻译。在另外的实施例中,所述ORF的密码子增加在哺乳动物(例如人类)的器官(如肝脏)中的翻译。在另外的实施例中,所述ORF的密码子增加在哺乳动物(例如人类)的细胞类型(如肝细胞)中的翻译。可以相对于所述ORF的野生型序列的翻译程度或相对于密码子分布与所述ORF源自的生物体或在氨基酸水平上含有最类似ORF的生物体的密码子分布相匹配的ORF来确定哺乳动物、细胞类型、哺乳动物器官、人类、人类器官等中翻译的增加。
在一些实施例中,由所述ORF编码的多肽是源自下文所述的原核生物的Cas9核酸酶,并且可以相对于所述ORF的野生型序列的翻译程度(例如,序列表中列出的野生型ORF,如SEQ ID NO:67(Cas9)、68(SerpinA1)、89(FAH)、95(GABRD)、101(GAPDH)、107(GBA1)、113(GLA)、119(OTC)、125(PAH)或131(TTR)或相对于所关注的ORF(如对在人细胞中表达的人蛋白或转基因进行编码的ORF)确定哺乳动物、细胞类型、哺乳动物器官、人类、人类器官等中翻译的增加。例如,所述ORF可以是密码子分布与所述ORF源自的生物体或在氨基酸水平上含有最类似ORF的生物体(如酿脓链球菌、金黄色葡萄球菌(S.aureus)或Cas蛋白的另一个原核生物)的密码子分布相匹配或相对于包含在其它所有相等的SEQ ID NO:2、3或67中的Cas9 ORF的翻译(包含任何适用的点突变、异源结构域等)的ORF。可用于增加人类(包含人类肝脏和人类肝细胞)表达的密码子可以是与人类肝脏/肝细胞中高表达的tRNA相对应的密码子,这在Dittmar KA,《公共科学图书馆遗传学(PLos Genetics)》2(12):e221(2006)中有所讨论。在一些实施例中,ORF中至少约75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子是与哺乳动物(如人类)中高表达的tRNA(例如,每个氨基酸的最高表达的tRNA)相对应的密码子。在一些实施例中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子是与哺乳动物器官(如人类器官)中高表达的tRNA(例如,每个氨基酸的最高表达的tRNA)相对应的密码子。在一些实施例中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子是与哺乳动物肝脏(如人类肝脏)中高表达的tRNA(例如,每个氨基酸的最高表达的tRNA)相对应的密码子。在一些实施例中,ORF中至少75%、80%、85%、90%、95%、96%、97%、98%、99%或100%的密码子是与哺乳动物肝细胞(如人类肝细胞)中高表达的tRNA(例如,每个氨基酸的最高表达的tRNA)相对应的密码子。
可替代地,通常可以使用与生物体(例如,人类)中高表达的tRNA相对应的密码子。
上述密码子选择方法中的任何一种方法都可以与以下组合:选择表1中所示的密码子对;和/或消除表4中出现、将导致存在表2中所示的密码子对和/或将有助于提高重复序列含量的密码子;和/或选择表3中出现的和/或有助于降低重复序列含量的密码子;和/或使用表5、6或7的密码子集合,如上所示;使用上文(例如,表9、10或11)所示的最小尿苷和/或腺嘌呤密码子,并且然后在多于一个选项可用的情况下,使用对应于更高表达的tRNA的密码子,无论是在生物体(例如,人类)中,还是在所关注的器官或细胞类型(如肝脏或肝细胞)中(例如,人类肝脏或人类肝细胞)。
6.由所述ORF编码的多肽;示例性序列
在一些实施例中,所述多核苷酸是包括对所关注的多肽进行编码的ORF的mRNA。
在一些实施例中,所述多核苷酸是包括对上文公开的RNA引导的DNA结合剂进行编码的ORF的mRNA。
在一些实施例中,所述ORF包括与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143中的任一个具有至少90%同一性的序列,任选地其中在不考虑所述ORF的起始密码子和终止密码子的情况下测定同一性。“在不考虑所述ORF的起始密码子和终止密码子的情况下”通过比对没有起始密码子和终止密码子的序列来测定同一性;所述起始密码子和终止密码子通常分别出现在位置1到3和N-2到N(其中N是所述ORF中的核苷酸的数量)处;并且所述起始密码子和终止密码子通常分别是ATG(或者有时是GTG)以及TAA、TGA和TAG中的一个(其中所述起始密码子和终止密码子中的Ts可能被U取代)。在一些实施例中,与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143的序列的同一性程度为至少95%。在一些实施例中,与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143的序列的同一性程度为至少98%。在一些实施例中,与SEQ IDNO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143的序列的同一性程度为至少99%。在一些实施例中,与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143的序列的同一性程度为100%。
在一些实施例中,所述多核苷酸包括与SEQ ID NO:16-20、76-80、193-197或199-201中的任一个具有至少90%同一性的序列。在一些实施例中,与SEQ ID NO:16-20、76-80、193-197或199-201的序列的同一性程度为至少95%。在一些实施例中,与SEQ ID NO:16-20、76-80、193-197或199-201的序列的同一性程度为至少98%。在一些实施例中,与SEQ IDNO:16-20、76-80、193-197或199-201的序列的同一性程度为至少99%。在一些实施例中,与SEQ ID NO:16-20、76-80、193-197或199-201的序列的同一性程度为100%。在一些实施例中,所述多核苷酸包括与SEQ ID NO:16-20、76-80、194-197或200-201中的任一个具有至少90%同一性的序列。在一些实施例中,与SEQ ID NO:16-20、76-80、194-197或200-201的序列的同一性程度为至少95%。在一些实施例中,与SEQ ID NO:16-20、76-80、194-197或200-201的序列的同一性程度为至少98%。在一些实施例中,与SEQ ID NO:16-20、76-80、194-197或200-201的序列的同一性程度为至少99%。在一些实施例中,与SEQ ID NO:16-20、76-80、194-197或200-201的序列的同一性程度为100%。
在一些实施例中,由本文所述的ORF编码的多肽是RNA引导的DNA结合剂,下文将进一步描述所述RNA引导的DNA结合剂。在一些实施例中,由本文所述的ORF编码的多肽是核酸内切酶。在一些实施例中,由本文所述的ORF编码的多肽是丝氨酸蛋白酶抑制剂或Serpin家族成员。在一些实施例中,由本文所述的ORF编码的多肽是羟化酶;氨甲酰转移酶;葡糖神经酰胺酶;半乳糖苷酶;脱氢酶;受体;或神经递质受体。在一些实施例中,由本文所述的ORF编码的多肽是苯丙氨酸羟化酶;鸟氨酸氨甲酰转移酶;延胡索酰乙酰乙酸水解酶;葡糖神经酰胺酶β;α-半乳糖苷酶;运甲状腺素蛋白;甘油醛-3-磷酸脱氢酶;γ-氨基丁酸(GABA)受体亚基(如GABA A型受体δ亚基)。在一些实施例中,由本文所述的ORF编码的多肽是Serpin家族A成员1。
示例性苯丙氨酸羟化酶氨基酸序列是SEQ ID NO:124。对苯丙氨酸羟化酶进行编码的示例性序列是SEQ ID NO:126-129和142。
示例性鸟氨酸氨甲酰转移酶氨基酸序列是SEQ ID NO:118。对鸟氨酸氨甲酰转移酶进行编码的示例性序列是SEQ ID NO:120-123和141。
示例性葡糖神经酰胺酶β氨基酸序列是SEQ ID NO:106。对葡糖神经酰胺酶β进行编码的示例性序列是SEQ ID NO:108-111和139。
示例性α-半乳糖苷酶氨基酸序列是SEQ ID NO:112。对α-半乳糖苷酶进行编码的示例性序列是SEQ ID NO:114-117和140。
示例性甘油醛-3-磷酸脱氢酶氨基酸序列是SEQ ID NO:100。对甘油醛-3-磷酸脱氢酶进行编码的示例性序列是SEQ ID NO:102-105和138。
示例性GABA A型受体δ亚基氨基酸序列是SEQ ID NO:94。对GABA A型受体δ亚基进行编码的示例性序列是SEQ ID NO:96-99和137。
示例性延胡索酰乙酰乙酸水解酶氨基酸序列是SEQ ID NO:88。对延胡索酰乙酰乙酸水解酶进行编码的示例性序列是SEQ ID NO:89-93和136。
示例性运甲状腺素蛋白氨基酸序列是SEQ ID NO:130。对运甲状腺素蛋白进行编码的示例性序列是SEQ ID NO:132-135和143。
示例性Serpin家族A成员1氨基酸序列是SEQ ID NO:74。对Serpin家族A成员1进行编码的示例性序列是SEQ ID NO:76-80。
a)经编码的RNA引导的DNA结合剂
在一些实施例中,由本文所述的ORF编码的多核苷酸是RNA引导的DNA结合剂。在一些实施例中,所述RNA引导的DNA结合剂是第2类Cas核酸酶。在一些实施例中,RNA引导的DNA结合剂具有也可以被称为双链核酸内切酶活性的切割酶活性。在一些实施例中,所述RNA引导的DNA结合剂包括Cas核酸酶,如第2类Cas核酸酶(其可以是例如II、V或VI型Cas核酸酶)。第2类Cas核酸酶包含例如Cas9、Cpf1、C2c1、C2c2和C2c3蛋白及其修饰。Cas9核酸酶的实例包含酿脓链球菌、金黄色葡萄球菌和其它原核生物的II型CRISPR系统(参见例如,下一段中的列表)及其经修饰(例如,工程化或突变型)型式中的那些实例。参见,例如US 2016/0312198 A1;US 2016/0312199A1。Cas核酸酶的其它实例包含III型CRISPR系统的Csm或Cmr复合物或其Cas10、Csm1或Cmr2亚基;以及I型CRISPR系统的级联复合物或其Cas3亚基。在一些实施例中,Cas核酸酶可以来自IIA型、IIB型或IIC型系统。关于各种CRISPR系统和Cas核酸酶的讨论,参见例如Makarova等人,《自然综述:微生物学(NAT.REV.MICROBIOL.)》9:467-477(2011);Makarova等人,《自然通讯(REV.MICROBIOL.)》,13:722-36(2015);Shmakov等人,《分子细胞(MOLECULARCELL)》,60:385-397(2015)。
Cas核酸酶可以源自的非限制性示例性物种包含酿脓链球菌、嗜热链球菌(Streptococcus thermophilus)、链球菌(Streptococcus sp.)、金黄色葡萄球菌、无害利斯特菌(Listeria innocua)、加氏乳杆菌(Lactobacillus gasseri)、新凶手弗朗西丝菌(Francisella novicida)、产琥珀酸沃廉菌(Wolinella succinogenes)、华德萨特菌(Sutterella wadsworthensis)、γ-变形杆菌(Gammaproteobacterium)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、空肠弯曲菌(Campylobacter jejuni)、多杀巴斯德菌(Pasteurella multocida)、产琥珀酸丝状杆菌(Fibrobacter succinogene)、深红红螺菌(Rhodospirillum rubrum)、达松维尔拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿产色链霉菌(Streptomycesviridochromogenes)、绿产色链霉菌(Streptomyces viridochromogenes)、链孢囊菌(Streptosporangium roseum)、链孢囊菌、酸热脂环酸芽孢杆菌(Alicyclobacillusacidocaldarius)、假蕈状芽孢杆菌(Bacillus pseudomycoides)、硒化芽孢杆菌(Bacillusselenitireducens)、戟叶鹅绒藤微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillus delbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、布氏乳杆菌(Lactobacillus buchneri)、齿垢密螺旋体(Treponema denticola)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌(Burkholderiales bacterium)、萘降解极地单胞菌(Polaromonas naphthalenivorans)、单胞菌(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaera watsonii)、蓝丝菌(Cyanothece sp.)、铜绿微囊藻(Microcystisaeruginosa)、聚球藻(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobiumarabaticum)、丹氏制氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptorbecscii)、金矿菌(Candidatus Desulforudis)、肉毒梭菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、丙酸降解菌(Pelotomaculum thermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、嗜酸氧化亚铁硫杆菌(Acidithiobacillusferrooxidans)、酒色异着色菌(Allochromatium vinosum)、海杆菌(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcuswatsoni)、假交替单胞菌(Pseudoalteromonas haloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、甲烷盐菌(Methanohalobium evestigatum)、鱼腥藻(Anabaena variabilis)、泡沫节球藻(Nodularia spumigena)、念珠藻(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、最大节螺藻(Arthrospira maxima)、节旋藻(Arthrospirasp.)、林氏藻(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻(Oscillatoria sp.)、移动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosiphoafricanus)、巴氏链球菌(Streptococcus pasteurianus)、灰色奈瑟球菌(Neisseriacinerea)、拉里弯曲杆菌(Campylobacter lari)、食清洁剂细小棒菌(Parvibaculumlavamentivorans)、白喉棒状杆菌(Corynebacterium diphtheriae)、氨基酸球菌(Acidaminococcus sp.)、毛螺菌科细菌(Lachnospiraceae bacterium)ND2006和深海单细胞蓝细菌(Acaryochloris marina)。
在一些实施例中,Cas核酸酶是来自酿脓链球菌的Cas9核酸酶。在一些实施例中,Cas核酸酶是来自嗜热链球菌的Cas9核酸酶。在一些实施例中,Cas核酸酶是来自脑膜炎奈瑟氏球菌的Cas9核酸酶。在一些实施例中,Cas核酸酶是来自金黄色葡萄球菌的Cas9核酸酶。在一些实施例中,Cas核酸酶是来自新凶手弗朗西丝菌的Cpf1核酸酶。在一些实施例中,Cas核酸酶是来自氨基酸球菌的Cpf1核酸酶在一些实施例中,Cas核酸酶是来自毛螺菌科细菌ND2006的Cpf1核酸酶。在另外的实施例中,Cas核酸酶是来自以下的Cpf1核酸酶:土拉热弗朗西丝菌(Francisella tularensis)、毛螺菌科细菌、解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门细菌(Peregrinibacteria bacterium)、俭菌超门细菌(Parcubacteria bacterium)、丙酸氧化菌(Smithella)、氨基酸球菌(Acidaminococcus)、候选白蚁甲烷枝原体(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacteriumeligens)、牛眼莫拉氏菌(Moraxella bovoculi)、良吉氏钩端螺旋体(Leptospirainadai)、牙龈卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃菌(Prevotelladisiens)或猕猴卟啉单胞菌(Porphyromonas macacae)。在某些实施例中,Cas核酸酶是来自氨基酸球菌属或毛螺菌科的Cpf1核酸酶。
野生型Cas9有两个核酸酶结构域:RuvC和HNH。RuvC结构域切割非靶DNA链,并且HNH结构域切割靶DNA链。在一些实施例中,Cas9核酸酶包括多于一个RuvC结构域和/或多于一个HNH结构域。在一些实施例中,Cas9核酸酶是野生型Cas9。在一些实施例中,Cas9能够在靶DNA中诱导双链断裂。在某些实施例中,Cas核酸酶可以切割dsDNA,所述Cas核酸酶可以切割一条dsDNA链,或者所述Cas核酸酶可能不具有DNA切割酶或切口酶活性。示例性Cas9氨基酸序列被提供为SEQ ID NO:1。示例性Cas9 mRNA ORF序列被提供为SEQ ID NO:5-10。
在一些实施例中,使用嵌合型Cas核酸酶,其中蛋白质的一个结构域或区被不同蛋白质的部分替代。在一些实施例中,Cas核酸酶结构域可以被来自如Fok1等不同核酸酶的结构域替代。在一些实施例中,Cas核酸酶可以是经修饰的核酸酶。
在其它实施例中,Cas核酸酶可以来自I型CRISPR/Cas系统。在一些实施例中,Cas核酸酶可以是I型CRISPR/Cas系统的级联复合物的组分。在一些实施例中,Cas核酸酶可以是Cas3蛋白。在一些实施例中,Cas核酸酶可以来自III型CRISPR/Cas系统。在一些实施例中,Cas核酸酶可以具有RNA切割活性。
在一些实施例中,RNA引导的DNA结合剂具有单链切口酶活性,也就是说,可以切割一条DNA链以产生单链断裂,也被称为“切口”。在一些实施例中,RNA引导的DNA结合剂包括Cas切口酶。切口酶是在dsDNA中产生切口的酶,也就是说,切割DNA双螺旋的一条链而不是另一条链。在一些实施例中,Cas切口酶是Cas核酸酶(例如,上文讨论的Cas核酸酶)的型式,其中核酸内切酶活性位点例如通过催化结构域中的一种或多种改变(例如,点突变)而失活。参见例如美国专利第8,889,356号有关Cas切口酶和示例性催化结构域改变的讨论。在一些实施例中,Cas切口酶(如Cas9切口酶)具有失活的RuvC或HNH结构域。示例性Cas9切口酶氨基酸序列被提供为SEQ ID NO:161。
在一些实施例中,RNA引导的DNA结合剂被修饰为仅含有一个功能性核酸酶结构域。例如,可以修饰试剂蛋白,使得核酸酶结构域之一发生突变或完全或部分缺失,以降低其核酸切割活性。在一些实施例中,使用具有降低活性的RuvC结构域的切口酶。在一些实施例中,使用具有非活性RuvC结构域的切口酶。在一些实施例中,使用具有降低活性的HNH结构域的切口酶。在一些实施例中,使用具有非活性HNH结构域的切口酶。
在一些实施例中,Cas蛋白核酸酶结构域内的保守氨基酸被取代以降低或改变核酸酶活性。在一些实施例中,Cas核酸酶可以包括RuvC或RuvC样核酸酶结构域中的氨基酸取代。RuvC或RuvC样核酸酶结构域中的示例性氨基酸取代包含D10A(基于酿脓链球菌Cas9蛋白)。参见例如Zetsche等人,(2015)《细胞(Cell)》10月22:163(3):759-771。在一些实施例中,Cas核酸酶可以包括HNH或HNH样核酸酶结构域中的氨基酸取代。HNH或HNH样核酸酶结构域中的示例性氨基酸取代包含E762A、H840A、N863A、H983A和D986A(基于酿脓链球菌Cas9蛋白)。参见例如Zetsche等人,(2015)。另外的示例性氨基酸取代包含D917A、E1006A和D1255A(基于新凶手弗朗西丝菌U112 Cpf1(FnCpf1)序列(UniProtKB-A0Q7Q2(CPF1_FRATN))。
在一些实施例中,结合分别与靶序列的有义链和反义链互补的一对向导RNA提供对切口酶进行编码的mRNA。在此实施例中,引导RNA将切口酶引导到靶序列并且通过在靶序列的相反链上产生切口(也就是说,双切口)引入DSB。在一些实施例中,使用双切口可以改善特异性并减少脱靶效应。在一些实施例中,切口酶与两个单独的靶向DNA的相反链的向导RNA一起使用以在靶DNA中产生双切口。在一些实施例中,切口酶与两个单独的被选择成非常接近的向导RNA一起使用以在靶DNA中产生双切口。
在一些实施例中,RNA引导的DNA结合剂缺少切割酶和切口酶活性。在一些实施例中,RNA引导的DNA结合剂包括dCas DNA结合多肽。dCas多肽具有DNA结合活性,但基本上缺少催化(切割酶/切口酶)活性。在一些实施例中,dCas多肽是dCas9多肽。在一些实施例中,缺少切割酶和切口酶活性的RNA引导的DNA结合剂或dCas DNA结合多肽是Cas核酸酶(例如,上文讨论的Cas核酸酶)的型式,其中所述核酸酶的核酸内切酶活性位点例如通过其催化结构域中的一种或多种改变(例如,点突变)而失活。参见例如US 2014/0186958 A1;US 2015/0166980 A1。示例性dCas9氨基酸序列被提供为SEQ ID NO:162。
b)异源功能性结构域;核定位信号
在一些实施例中,由本文所述的ORF编码的RNA引导的DNA结合剂包括一个或多个异源功能性结构域(例如,是或包括融合多肽)。
在一些实施例中,异源功能性结构域可以促进RNA引导的DNA结合剂运输到细胞核中。例如,异源功能性结构域可以是核定位信号(NLS)。在一些实施例中,RNA引导的DNA结合剂可以与1-10个NLS融合。在一些实施例中,RNA引导的DNA结合剂可以与1-5个NLS融合。在一些实施例中,RNA引导的DNA结合剂可以与一个NLS融合。当使用一个NLS时,NLS可以连接在RNA引导的DNA结合剂序列的N末端或C末端处。在一些实施例中,所述RNA引导的DNA结合剂可以在C末端与至少一个NLS融合。NLS还可以插在RNA引导的DNA结合剂序列中。在其它实施例中,RNA引导的DNA结合剂可以与多于一个NLS融合。在一些实施例中,RNA引导的DNA结合剂可以与2个、3个、4个或5个NLS融合。在一些实施例中,RNA引导的DNA结合剂可以与两个NLS融合。在某些情况下,所述两个NLS可以是相同的(例如,两个SV40 NLS)或不同的。在一些实施例中,RNA引导的DNA结合剂与羧基末端处连接的两个SV40 NLS序列融合。在一些实施例中,RNA引导的DNA结合剂可以与两个NLS融合,一个在N末端处连接并且一个在C末端处连接。在一些实施例中,RNA引导的DNA结合剂可以与3个NLS融合。在一些实施例中,RNA引导的DNA结合剂可以不与NLS融合。在一些实施例中,NLS可以是单分序列,例如SV40 NLS、PKKKRKV(SEQ ID NO:163)或PKKKRRV(SEQ ID NO:175)。在一些实施例中,NLS可以是二分序列,如核质蛋白的NLS,KRPAATKKAGQAKKKK(SEQ ID NO:176)。在一些实施例中,所述NLS序列可以包括LAAKRSRTT(SEQ ID NO:164)、QAAKRSRTT(SEQ ID NO:165)、PAPAKRERTT(SEQ IDNO:166)、QAAKRPRTT(SEQ ID NO:167)、RAAKRPRTT(SEQ ID NO:168)、AAAKRSWSMAA(SEQ IDNO:169)、AAAKRVWSMAF(SEQ ID NO:170)、AAAKRSWSMAF(SEQ ID NO:171)、AAAKRKYFAA(SEQID NO:172)、RAAKRKAFAA(SEQ ID NO:173)或RAAKRKYFAV(SEQ ID NO:174)。所述NLS可能是snurportin-1内输蛋白-β(IBB结构域,例如SPN1-impβ序列)。参见Huber等人,2002,《细胞生物学杂志(J.Cell Bio.)》,156,467-479。在具体实施例中,单个PKKKRKV(SEQ ID NO:163)NLS可以在RNA引导的DNA结合剂的C末端处连接。在融合位点处任选地包含一个或多个连接子。在一些实施例中,根据前述实施例中任一项所述的一个或多个NLS与一个或多个另外的异源功能性结构域(如下文所述的任何异源功能性结构域)组合存在于RNA引导的DNA结合剂中。
在一些实施例中,异源功能性结构域能够修饰RNA引导的DNA结合剂的细胞内半衰期。在一些实施例中,可以增加RNA引导的DNA结合剂的半衰期。在一些实施例中,可以减少RNA引导的DNA结合剂的半衰期。在一些实施例中,异源功能性结构域能够增加RNA引导的DNA结合剂的稳定性。在一些实施例中,异源功能性结构域能够减少RNA引导的DNA结合剂的稳定性。在一些实施例中,异源功能性结构域可以充当蛋白质降解的信号肽。在一些实施例中,蛋白质降解可以由蛋白水解酶介导,所述蛋白水解酶例如蛋白酶体、溶酶体蛋白酶或钙蛋白酶。在一些实施例中,异源功能性结构域可以包括PEST序列。在一些实施例中,可以通过添加泛素或多泛素链来修饰RNA引导的DNA结合剂。在一些实施例中,泛素可以是泛素样蛋白(UBL)。泛素样蛋白的非限制性实例包含小泛素样修饰物(SUMO)、泛素交叉反应型蛋白(UCRP,也称为干扰素刺激基因-15(ISG15))、泛素相关修饰物-1(URM1)、神经元前体细胞表达的发育下调蛋白-8(NEDD8,在酿酒酵母中也称为Rub1)、人白细胞抗原F相关(FAT10)、自噬-8(ATG8)和-12(ATG12)、Fau泛素样蛋白(FUB1)、膜锚定UBL(MUB)、泛素折叠修饰物-1(UFM1)和泛素样蛋白-5(UBL5)。
在一些实施例中,异源功能性结构域可以是标志物结构域。标志物结构域的非限制性实例包含荧光蛋白、纯化标签、表位标签和报告基因序列。在一些实施例中,标志物结构域可以是荧光蛋白。合适的荧光蛋白的非限制性实例包含绿色荧光蛋白(例如,GFP、GFP-2、tagGFP、turboGFP、sfGFP、EGFP、祖母绿、Azami绿、单体Azami绿、CopGFP、AceGFP、ZsGreen1)、黄色荧光蛋白(例如,YFP、EYFP、柠檬黄、Venus、YPet、PhiYFP、ZsYellow1)、蓝色荧光蛋白(例如,EBFP、EBFP2、石青、mKalamal、GFPuv、天蓝色、T-天蓝色(T-sapphire))、青色荧光蛋白(例如,ECFP、蔚蓝色(Cerulean)、CyPet、AmCyan1、Midoriishi-青色)、红色荧光蛋白(例如,mKate、mKate2、mPlum、DsRed单体、mCherry、mRFP1、DsRed-表达、DsRed2、DsRed-单体、HcRed-Tandem、HcRed1、AsRed2、eqFP611、mRasberry、mStrawberry、Jred)和橙色荧光蛋白(例如,mOrange、mKO、Kusabira-橙色、单体Kusabira-橙色、mTangerine、tdTomato)或任何其它合适的荧光蛋白。在其它实施例中,标志物结构域可以是纯化标签和/或表位标签。非限制性示例性标签包含谷胱甘肽-S-转移酶(GST)、几丁质结合蛋白(CBP)、麦芽糖结合蛋白(MBP)、硫氧还蛋白(TRX)、poly(NANP)、串联亲和纯化(TAP)标签、myc、AcV5、AU1、AU5、E、ECS、E2、FLAG、HA、nus、Softag 1、Softag 3、Strep、SBP、Glu-Glu、HSV、KT3、S、S1、T7、V5、VSV-G、6xHis、8xHis、生物素羧基载体蛋白(BCCP)、多His和钙调蛋白。非限制性示例性报告基因包含谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸苷酶、荧光素酶或荧光蛋白。
在另外的实施例中,异源功能性结构域可以将RNA引导的DNA结合剂靶向特定细胞器、细胞类型、组织或器官。在一些实施例中,异源功能性结构域可以将RNA引导的DNA结合剂靶向线粒体。
在另外的实施例中,异源功能性结构域可以是效应结构域。当将RNA引导的DNA结合剂引导到其靶序列时,例如,当通过gRNA将Cas核酸酶引导到靶序列时,效应结构域可以修饰或影响靶序列。在一些实施例中,效应结构域可以选自核酸结合结构域、核酸酶结构域(例如,非Cas核酸酶结构域)、表观遗传修饰结构域、转录激活结构域或转录阻遏物结构域。在一些实施例中,异源功能性结构域是核酸酶,如FokI核酸酶。参见例如美国专利第9,023,649号。在一些实施例中,异源功能性结构域是转录活化剂或阻遏物。参见例如Qi等人,“改变CRISPR用途作为用于基因表达的序列特异性控制的RNA引导的平台(RepurposingCRISPR as an RNA-guided platform for sequence-specific control of geneexpression)”,《细胞》152:1173-83(2013);Perez-Pinera等人,“通过基于CRISPR-Cas9的转录因子的RNA引导的基因激活(RNA-guided gene activation by CRISPR-Cas9-basedtranscription factors)”《自然方法(Nat.Methods)》10:973-6(2013);Mali等人,“用于靶特异性筛选的CAS9转录激活因子和用于合作基因组工程的配对切口酶(CAS9transcriptional activators for target specificity screening and pairednickases for cooperative genome engineering)”,《自然生物技术(Nat.Biotechnol.)》31:833-8(2013);Gilbert等人,“真核生物中CRISPR介导的模块化RNA引导的转录调节(CRISPR-mediated modular RNA-guided regulation of transcription ineukaryotes)”,《细胞》154:442-51(2013)。如此,RNA引导的DNA结合剂基本上成为可以使用向导RNA引导以结合期望的靶序列的转录因子。在某些实施例中,DNA修饰结构域是甲基化结构域,如去甲基化或甲基转移酶结构域。在某些实施例中,效应子结构域是DNA修饰结构域,如碱基编辑结构域。在具体实施例中,所述DNA修饰结构域是将特定修饰引入到DNA中的核酸编辑结构域,例如脱氨酶结构域。参见例如WO 2015/089406;US2016/0304846。WO2015/089406和US 2016/0304846中描述的核酸编辑结构域、脱氨酶结构域和Cas9变体特此通过引用并入。包括任何此类结构域的RNA引导的DNA结合剂可以由本文公开的ORF编码,例如,具有任选地与本文所述的其它特征组合的本文所述的表1的一定量的密码子对。
7.UTR;Kozak序列
在一些实施例中,所述多核苷酸包括至少一个来自羟基类固醇17-β脱氢酶4(HSD17B4或HSD)的UTR,例如,来自HSD的5'UTR。在一些实施例中,所述多核苷酸包括至少一个来自珠蛋白mRNA(例如,人α珠蛋白(HBA)mRNA、人β珠蛋白(HBB)mRNA或非洲爪蟾β珠蛋白(XBG)mRNA)的UTR。在一些实施例中,所述多核苷酸包括来自珠蛋白mRNA(如HBA、HBB或XBG)的5'UTR、3'UTR或5'和3'UTR。在一些实施例中,所述多核苷酸包括来自牛生长激素、巨细胞病毒(CMV)、小鼠Hba-a1、HSD、白蛋白基因、HBA、HBB或XBG的5'UTR。在一些实施例中,所述多核苷酸包括来自牛生长激素、巨细胞病毒、小鼠Hba-a1、HSD、白蛋白基因、HBA、HBB或XBG的3'UTR。在一些实施例中,所述多核苷酸包括来自牛生长激素、巨细胞病毒、小鼠Hba-a1、HSD、白蛋白基因、HBA、HBB、XBG、热休克蛋白90(Hsp90)、甘油醛3-磷酸脱氢酶(GAPDH)、β肌动蛋白、α微管蛋白、肿瘤蛋白(p53)或表皮生长因子受体(EGFR)的5'和3'UTR。
在一些实施例中,所述多核苷酸包括来自相同来源(例如,组成性表达的mRNA,如肌动蛋白、白蛋白或珠蛋白,如HBA、HBB或XBG)的5'和3'UTR。
在一些实施例中,本文公开的mRNA包括与SEQ ID NO:177-181或190-192中的任一个具有至少90%同一性的5'UTR。在一些实施例中,本文公开的mRNA包括与SEQ ID NO:182-186或202-204中的任一个具有至少90%同一性的3'UTR。在一些实施例中,上述同一性水平中的任一个为至少95%、至少98%、至少99%或100%。在一些实施例中,本文公开的mRNA包括具有SEQ ID NO:177-181或190-192中的任一个的序列的5'UTR。在一些实施例中,本文公开的mRNA包括具有SEQ ID NO:182-186或202-204中的任一个的序列的3'UTR。
在一些实施例中,所述mRNA不包括5'UTR,例如,在5'帽与起始密码子之间不存在另外的核苷酸。在一些实施例中,所述mRNA包括在5'帽与起始密码子之间的Kozak序列(如下所述),但是不具有任何另外的5'UTR。在一些实施例中,所述mRNA不包括3'UTR,例如,在终止密码子与poly-A尾之间不存在另外的核苷酸。
在一些实施例中,mRNA包括Kozak序列。Kozak序列可能影响翻译起始和从mRNA翻译的多肽的总产率。Kozak序列包含可以作为起始密码子的甲硫氨酸密码子。最小Kozak序列为NNNRUGN,其中以下中的至少一项为真:第一个N是A或G,并且第二个N是G。在核苷酸序列的上下文中,R表示嘌呤(A或G)。在一些实施例中,Kozak序列为RNNRUGN、NNNRUGG、RNNRUGG、RNNAUGN、NNNAUGG或RNNAUGG。在一些实施例中,Kozak序列是具有零个错配或具有最多一个或两个错配到小写位置的rccRUGg。在一些实施例中,Kozak序列是具有零个错配或具有最多一个或两个错配到小写位置的rccAUGg。在一些实施例中,Kozak序列是具有零个错配或具有最多一个、两个或三个错配到小写位置的gccRccAUGG(SEQ ID NO:187的核苷酸4-13)。在一些实施例中,Kozak序列是具有零个错配或具有最多一个、两个、三个或四个错配到小写位置的gccAccAUG。在一些实施例中,Kozak序列是GCCACCAUG。在一些实施例中,Kozak序列是具有零个错配或具有最多一个、两个、三个或四个错配到小写位置的gccgccRccAUGG(SEQ ID NO:187)。
8.Poly-A尾
在一些实施例中,所述多核苷酸是对包括ORF的所关注多肽进行编码的mRNA,并且所述mRNA进一步包括多腺苷酸化(poly-A)尾。在一些情况下,poly-A尾在poly-A尾内的一个或多个位置处被一个或多个非腺嘌呤核苷酸“锚定”所“中断”。poly-A尾可以包括至少8个连续的腺嘌呤核苷酸,但也包括一个或多个非腺嘌呤核苷酸。如本文所使用的,“非腺嘌呤核苷酸”指代不包括腺嘌呤的任何天然或非天然核苷酸。鸟嘌呤、胸腺嘧啶和胞嘧啶核苷酸是示例性非腺嘌呤核苷酸。因此,本文所述的mRNA上的poly-A尾可以包括位于对所关注多肽进行编码的核苷酸的3'处的连续腺嘌呤核苷酸。在一些情况下,mRNA上的poly-A尾包括位于对RNA引导的DNA结合剂或所关注的序列进行编码的核苷酸的3'处的非连续腺嘌呤核苷酸,其中非腺嘌呤核苷酸以规则或不规则间隔开的间隔中断腺嘌呤核苷酸。
在一些实施例中,poly-A尾在用于对mRNA进行体外转录的质粒中编码并成为转录物的一部分。在质粒中编码的poly-A序列,即poly-A序列中连续腺嘌呤核苷酸的数量可能不准确,例如,质粒中的100个poly-A序列可能不会导致转录的mRNA中精确的100个poly-A序列。在一些实施例中,poly-A尾不在质粒中编码,而是通过PCR加尾或酶加尾(例如,使用大肠杆菌(E.coli)poly(A)聚合酶)添加。
在一些实施例中,所述一个或多个非腺嘌呤核苷酸被定位成中断连续腺嘌呤核苷酸,使得poly(A)结合蛋白可以与一段连续的腺嘌呤核苷酸结合。在一些实施例中,所述一个或多个非腺嘌呤核苷酸位于至少8个、9个、10个、11个或12个连续腺嘌呤核苷酸之后。在一些实施例中,所述一个或多个非腺嘌呤核苷酸位于至少8-50个连续腺嘌呤核苷酸之后。在一些实施例中,所述一个或多个非腺嘌呤核苷酸位于至少8-100个连续腺嘌呤核苷酸之后。在一些实施例中,所述非腺嘌呤核苷酸在一个、两个、三个、四个、五个、六个或七个腺嘌呤核苷酸之后,并且随后是至少8个连续腺嘌呤核苷酸。
本公开的poly-A尾可以包括一个连续腺嘌呤核苷酸序列,随后是一个或多个非腺嘌呤核苷酸,任选地随后是另外的腺嘌呤核苷酸。
在一些实施例中,poly-A尾包括或含有一个非腺嘌呤核苷酸或一段连续的2-10个非腺嘌呤核苷酸。在一些实施例中,所述非腺嘌呤核苷酸位于至少8个、9个、10个、11个或12个连续腺嘌呤核苷酸之后。在一些情况下,所述一个或多个非腺嘌呤核苷酸位于至少8-50个连续腺嘌呤核苷酸之后。在一些实施例中,所述一个或多个非腺嘌呤核苷酸位于至少8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个或50个连续腺嘌呤核苷酸之后。
在一些实施例中,所述非腺嘌呤核苷酸为鸟嘌呤、胞嘧啶或胸腺嘧啶。在一些情况下,所述非腺嘌呤核苷酸是鸟嘌呤核苷酸。在一些实施例中,所述非腺嘌呤核苷酸是胞嘧啶核苷酸。在一些实施例中,所述非腺嘌呤核苷酸是胸腺嘧啶核苷酸。在一些情况下,当存在多于一个非腺嘌呤核苷酸时,所述非腺嘌呤核苷酸可以选自:a)鸟嘌呤和胸腺嘧啶核苷酸;b)鸟嘌呤和胞嘧啶核苷酸;c)胸腺嘧啶和胞嘧啶核苷酸;或d)鸟嘌呤、胸腺嘧啶和胞嘧啶核苷酸。包括非腺嘌呤核苷酸的示例性poly-A尾提供为SEQ ID NO:188。
9.经修饰的核苷酸
在一些实施例中,包括对所关注的多肽进行编码的ORF的核酸在一些或所有尿苷位置处包括经修饰的尿苷。在一些实施例中,经修饰的尿苷是在5位置处例如用卤素或C1-C3烷氧基修饰的尿苷。在一些实施例中,经修饰的尿苷是在1位置处例如用C1-C3烷基修饰的假尿苷。经修饰的尿苷可以是例如假尿苷、N1-甲基假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。在一些实施例中,经修饰的尿苷是5-甲氧基尿苷。在一些实施例中,经修饰的尿苷是5-碘尿苷。在一些实施例中,经修饰的尿苷是假尿苷。在一些实施例中,经修饰的尿苷是N1-甲基假尿苷。在一些实施例中,经修饰的尿苷是假尿苷和N1-甲基假尿苷的组合。在一些实施例中,经修饰的尿苷是假尿苷和5-甲氧基尿苷的组合。在一些实施例中,经修饰的尿苷是N1-甲基假尿苷和5-甲氧基尿苷的组合。在一些实施例中,经修饰的尿苷是5-碘尿苷和N1-甲基假尿苷的组合。在一些实施例中,经修饰的尿苷是假尿苷和5-碘尿苷的组合。在一些实施例中,经修饰的尿苷是5-碘尿苷和5-甲氧基尿苷的组合。
在一些实施例中,根据本公开的多核苷酸中至少10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%或100%的尿苷位置是经修饰的尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是经修饰的尿苷,例如,5-甲氧基尿苷、5-碘尿苷、N1-甲基假尿苷、假尿苷或其组合。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是5-甲氧基尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是假尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是N1-甲基假尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是5-碘尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是5-甲氧基尿苷,并且其余是N1-甲基假尿苷。在一些实施例中,根据本公开的多核苷酸中10%-25%、15-25%、25-35%、35-45%、45-55%、55-65%、65-75%、75-85%、85-95%或90-100%的尿苷位置是5-碘尿苷,并且其余是N1-甲基假尿苷。在一些实施例中,根据本公开的多核苷酸中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的尿苷位置被经修饰的尿苷取代,任选地其中所述经修饰的尿苷是N1-甲基假尿苷。在一些实施例中,根据本公开的多核苷酸中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的尿苷位置被N1-甲基假尿苷取代。在一些实施例中,根据本公开的多核苷酸中85%、90%、95%或100%的尿苷位置被N1-甲基假尿苷取代。在一些实施例中,100%的尿苷被N1-甲基假尿苷取代。在一些实施例中,根据本公开的多核苷酸中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的尿苷位置被经修饰的尿苷取代,任选地其中所述经修饰的尿苷是假尿苷。在一些实施例中,根据本公开的多核苷酸中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的尿苷位置被假尿苷取代。在一些实施例中,根据本公开的多核苷酸中85%、90%、95%或100%的尿苷位置被假尿苷取代。在一些实施例中,100%的尿苷被假尿苷取代。
10.5'帽
在一些实施例中,本文公开的核酸(例如,mRNA)包括5'帽,如帽0、帽1或帽2。5'帽通常是通过5'-三磷酸与核酸的5'到3'链的第一核苷酸(也就是说,第一帽近端核苷酸)的5'位置连接的7-甲基鸟嘌呤核糖核苷酸(其可以被进一步修饰,如下文例如关于ARCA所讨论的)。在帽0中,mRNA的第一帽近端核苷酸和第二帽近端核苷酸的核糖两者均包括2'-羟基。在帽1中,mRNA的第一转录核苷酸和第二转录核苷酸的核糖分别包括2'-甲氧基和2'-羟基。在帽2中,mRNA的第一帽近端核苷酸和第二帽近端核苷酸的核糖两者均包括2'-甲氧基。参见例如Katibah等人,(2014)《美国国家科学院院刊(Proc Natl Acad Sci USA)》111(33):12025-30;Abbas等人,(2017)《美国国家科学院院刊》114(11):E2106-E2115。大多数内源性高等真核核酸(包含哺乳动物核酸,如人核酸)包括帽1或帽2。帽0和其它不同于帽1和帽2的帽结构在如人等哺乳动物中可能是免疫原性的,因为先天免疫系统的组分(如IFIT-1和IFIT-5)将其识别为“非自身”,这可能导致包含I型干扰素的细胞因子水平升高。先天免疫系统的组分,如IFIT-1和IFIT-5还可以与eIF4E竞争以与除了帽1或帽2之外的帽结合核酸,从而潜在地抑制核酸的翻译。
可以共转录地包含帽。例如,ARCA(抗反向帽类似物;赛默飞世尔科技公司(ThermoFisher Scientific),目录号:AM8045)是包括与可以在开始时在体外掺入转录物中的鸟嘌呤核糖核苷酸的5'位置连接的7-甲基鸟嘌呤3'-甲氧基-5'-三磷酸的帽类似物。ARCA产生帽0帽或帽0样帽,其中第一帽近端核苷酸的2'位置是羟基。参见例如,Stepinski等人,(2001)“含有新颖“抗反向”帽类似物7-甲基(3'-O-甲基)GpppG和7-甲基(3'脱氧)GpppG的mRNA的合成和性质(Synthesis and properties of mRNAs containing the novel‘anti-reverse’cap analogs 7-methyl(3'-O-methyl)GpppG and7-methyl(3'deoxy)GpppG)”,RNA 7:1486-1495。ARCA结构如下所示。
CleanCapTM AG(m7G(5')ppp(5')(2'OMeA)pG;TriLink生物技术有限公司(TriLinkBiotechnologies),目录号:N-7113或CleanCapTM GG(m7G(5')ppp(5')(2'OMeG)pG;TriLink生物技术有限公司,目录号:N-7133可以用于共转录地提供帽1结构。CleanCapTM AG和CleanCapTM GG的3'-O-甲基化型式还可以分别从TriLink生物技术有限公司,目录号N-7413和N-7433获得。CleanCapTM AG结构如下所示。CleanCapTM结构有时在本文中使用上面列出的目录号的最后三位数字来表示(例如,“CleanCapTM 113”代表TriLink生物技术有限公司,目录号:N-7113)。
可替代地,可以在转录后向RNA添加帽。例如,牛痘封端酶可商购(新英格兰生物实验室(New England Biolabs),目录号:M2080S)并且具有由其D1亚基提供的RNA三磷酸酶和尿苷转移酶活性及其D12亚基提供的鸟嘌呤甲基转移酶。如此,所述牛痘封端酶可以在存在S-腺苷甲硫氨酸和GTP的情况下向RNA添加7-甲基鸟嘌呤,以提供帽0。参见例如:Guo,P.和Moss,B.(1990)《美国国家科学院院刊》,87,4023-4027;Mao,X.和Shuman,S.(1994)《生物化学杂志(J.Biol.Chem.)》269,24472-24479。有关帽和封端方法的另外讨论,参见例如WO2017/053297和Ishikawa等人,《核酸研讨会系列(Nucl.Acid.Symp.Ser.)》(2009)第53期,129-130。
11.向导RNA
在一些实施例中,结合本文公开的多核苷酸(如对RNA引导的DNA结合剂进行编码的多核苷酸)提供至少一个向导RNA。在一些实施例中,向导RNA作为与多核苷酸分开的分子提供。在一些实施例中,向导RNA作为本文公开的多核苷酸的一部分(如UTR的一部分)提供。在一些实施例中,至少一个向导RNA靶向TTR。
在一些实施例中,向导RNA包括经修饰的sgRNA。可以对sgRNA进行修饰以提高所述sgRNA的体内稳定性。在一些实施例中,所述sgRNA包括SEQ ID NO:189中所示的修饰模式,其中N是任何天然或非天然核苷酸,并且其中N的全部包括向导序列。尽管用N取代了向导的核苷酸,但所述修饰如SEQ ID NO:189中所示。也就是说,尽管向导的核苷酸置换“N”,但前三个核苷酸是经2'OMe修饰的,并且在第一核苷酸与第二核苷酸、第二核苷酸与第三核苷酸以及第三核苷酸与第四核苷酸之间存在硫代磷酸酯键。
12.脂质;调配物;递送
在一些实施例中,本文所述的多核苷酸在脂质纳米颗粒中调配或通过脂质纳米颗粒施用;参见例如于2017年10月5日出版的WO2017173054A1,其内容特此以全文引用的方式并入。本领域技术人员已知的能够将核苷酸递送到受试者的任何脂质纳米颗粒(LNP)可以用于施用本文所述的多核苷酸,在一些实施例中,任选地伴随其它核酸组分,如向导RNA。在一些实施例中,本文所述的多核苷酸单独地或任选地与其它核酸组分一起被调配在脂质体、纳米颗粒、外来体或微囊泡中或通过脂质体、纳米颗粒、外来体或微囊泡施用。乳液、胶束和悬浮液可以是适合于局部递送的组合物。
本文公开了核酸的LNP调配物的各个实施例。此类LNP调配物可以包含可生物降解的可电离脂质。调配物可以包含例如(i)CCD脂质,如胺脂质,任选地包含以下中的一种或多种:(ii)中性脂质;(iii)辅助脂质;以及(iv)隐形脂质,如PEG脂质。LNP调配物的一些实施例包含“胺脂质”以及辅助脂质、中性脂质和隐形脂质(如PEG脂质)。“脂质纳米颗粒”意指包括多个(即,多于一个)通过分子间作用力物理地相互关联的脂质分子的颗粒。
CCD脂质
用于将多核苷酸组分递送到肝脏细胞的脂质组合物可以包括CCD脂质,或者例如另一种可生物降解的脂质。
在一些实施例中,CCD脂质是脂质A,所述脂质A为十八烷基-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八烷基-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯。脂质A可以描述为:
可以根据WO2015/095340(例如,第84-86页)合成脂质A。
在一些实施例中,CCD脂质为脂质B,所述脂质B为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯),也被称为((5-((二甲基氨基)甲基)-1,3-亚苯基)双(氧基))双(辛烷-8,1-二基)双(癸酸酯)。脂质B可以描述为:
可以根据WO2014/136086(例如,第107-09页)合成脂质B。
在一些实施例中,CCD脂质为脂质C,所述脂质C为2-((4-(((3-(二甲基氨基)丙氧基)羰基)氧基)十六酰基)氧基)丙烷-1,3-二基(9Z,9'Z,12Z,12'Z)-双(十八烷基-9,12-二烯酸酯)。
在一些实施例中,CCD脂质为脂质D,所述脂质D为3-辛基十一烷酸3-(((3-(二甲基氨基)丙氧基)羰基)氧基)-13-(辛酰氧基)十三烷基酯。
脂质D可以描述为:
可以根据WO2015/095340合成脂质C和脂质D。
CCD脂质也可以是脂质A、脂质B、脂质C或脂质D的等效物。在某些实施例中,CCD脂质是脂质A的等效物、脂质B的等效物、脂质C的等效物或脂质D的等效物。
胺脂质
在一些实施例中,用于递送生物活性剂的LNP组合物包括“胺脂质”,所述胺脂质被定义为脂质A或其等效物,包含脂质A的缩醛类似物。
在一些实施例中,胺脂质是脂质A,所述脂质A为十八烷基-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯,也称为(9Z,12Z)-十八烷基-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯。脂质A可以描述为:
可以根据WO2015/095340(例如,第84-86页)合成脂质A。在某些实施例中,所述胺脂质是脂质A的等效物。
在某些实施例中,胺脂质是脂质A的类似物。在某些实施例中,脂质A类似物是脂质A的缩醛类似物。在特定的LNP组合物中,所述缩醛类似物是C4-C12缩醛类似物。在一些实施例中,所述缩醛类似物是C5-C12缩醛类似物。在另外的实施例中,所述缩醛类似物是C5-C10缩醛类似物。在另外的实施例中,所述缩醛类似物选自C4、C5、C6、C7、C9、C10、C11和C12缩醛类似物。
适用于本文所述的LNP的胺脂质在体内是可生物降解的。所述胺脂质具有低毒性(例如,在动物模型中可耐受,在量大于或等于10mg/kg时无副作用)。在某些实施例中,包括胺脂质的LNP包含其中至少75%的胺脂质在8、10、12、24或48小时内或3、4、5、6、7或10天内从血浆中清除的LNP。在某些实施例中,包括胺脂质的LNP包含其中至少50%的多核苷酸或其它组分在8、10、12、24或48小时内或3、4、5、6、7或10天内从血浆中清除的LNP。在某些实施例中,包括胺脂质的LNP包含其中至少50%的LNP在8、10、12、24或48小时内或3、4、5、6、7或10天内从血浆中清除的LNP,例如通过测量脂质(例如,胺脂质)、多核苷酸(例如,mRNA)或其它组分。在某些实施例中,测量LNP的脂质包封相对于游离脂质、多核苷酸或其它核酸组分。
脂质清除率可以按文献所述进行测量。参见Maier,M.A.等人,可生物降解的脂质使得能够快速消除脂质纳米颗粒以进行RNAi治疗剂的全身递送(Biodegradable LipidsEnabling Rapidly Eliminated Lipid Nanoparticles for Systemic Delivery of RNAiTherapeutics),《分子疗法(Mol.Ther.)》2013,21(8),1570-78(“Maier”)。例如,在Maier中,含有荧光素酶靶向性siRNA的LNP-siRNA系统以0.3mg/kg通过侧尾静脉以静脉内团注注射的方式施用于六到八周大的雄性C57Bl/6小鼠。在给药后0.083小时、0.25小时、0.5小时、1小时、2小时、4小时、8小时、24小时、48小时、96小时和168小时采集血液、肝脏和脾脏样品。在组织采集前向小鼠灌注生理盐水,并处理血液样品以获得血浆。所有样品均通过LC-MS进行处理和分析。此外,Maier描述了评估LNP-siRNA调配物施用后毒性的程序。例如,以0、1、3、5和10mg/kg(5只动物/组)通过单次静脉内团注注射向雄性斯普拉-道来氏大鼠(Sprague-Dawley rat)施用剂量体积为5mL/kg的荧光素酶靶向性siRNA。24小时后,从有意识的动物的颈静脉抽取约1mL血液并分离血清。在给药后72小时,对所有动物实施安乐死以进行尸检。执行对临床体征、体重、血清化学、器官重量和组织病理学的评估。尽管Maier描述了用于评估siRNA LNP调配物的方法,但这些方法可以用于评估本公开的LNP组合物的清除率、药代动力学和施用毒性。
所述胺脂质导致清除率增加。在一些实施例中,所述清除率是脂质清除率,例如从血液、血清或血浆中清除胺脂质的速率。在一些实施例中,所述清除率是多核苷酸清除率,例如从血液、血清或血浆中清除多核苷酸的速率。在一些实施例中,所述清除率是从血液、血清或血浆中清除LNP的速率。在一些实施例中,所述清除率是从组织(如肝脏组织或脾脏组织)中清除LNP的速率。在某些实施例中,高清除率导致没有实质性不良影响的安全特性。所述胺脂质减少循环和组织中LNP的累积。在一些实施例中,循环和组织中LNP累积的减少导致没有实质性不良影响的安全特性。
本公开的胺脂质可以根据所述胺脂质所处介质的pH值进行电离。例如,在微酸介质中,所述胺脂质可能被质子化并且因此带正电荷。相反,在弱碱性介质中,例如在pH为大约7.35的血液中,所述胺脂质可能不会被质子化并且因此不带电荷。在一些实施例中,本公开的胺脂质可以在至少约9的pH下质子化。在一些实施例中,本公开的胺脂质可以在至少约9的pH下质子化。在一些实施例中,本公开的胺脂质可以在至少约10的pH下质子化。
胺脂质带电荷的能力与所述胺脂质固有的pKa有关。例如,本公开的胺脂质各自pKa的范围独立地为约5.8到约6.2。例如,本公开的胺脂质各自pKa的范围独立地为约5.8到约6.5。这可能是有利的,因为已经发现范围为约5.1到约7.4的pKa的阳离子脂质可以有效地在体内递送货物,例如递送到肝脏。另外,已经发现,范围为约5.3到约6.4的pKa的阳离子脂质可以有效地在体内递送,例如递送到肿瘤。参见例如WO2014/136086。
另外的脂质
适用于本公开的脂质组合物的“中性脂质”包含例如多种中性、不带电荷或两性离子脂质。适用于本公开的中性磷脂的实例包含但不限于5-十七烷基苯-1,3-二醇(间苯二酚)、二棕榈酰磷脂酰胆碱(DPPC)、二硬脂酰磷脂酰胆碱(DSPC)、二油酰磷酸酰胆碱(DOPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、磷脂酰胆碱(PLPC)、1,2-二硬脂酰-sn-甘油-3-磷酸胆碱(DAPC)、磷脂酰乙醇胺(PE)、卵磷脂酰胆碱(EPC)、二月桂酰磷脂酰胆碱(DLPC)、二肉豆蔻酰磷脂酰胆碱(DMPC)、1-肉豆蔻酰-2-棕榈酰磷脂酰胆碱(MPPC)、1-棕榈酰-2-肉豆蔻酰磷脂酰胆碱(PMPC)、1-棕榈酰-2-硬脂酰磷脂酰胆碱(PSPC)、1,2-二花生酰-sn-甘油-3-磷酸胆碱(DBPC)、1-硬脂酰-2-棕榈酰磷脂酰胆碱(SPPC)、1,2-二二十碳烯酰-sn-甘油-3-磷酸胆碱(DEPC)、棕榈酰油酰磷脂酰胆碱(POPC)、溶血磷脂酰胆碱、二油酰磷脂酰乙醇胺(DOPE)、二亚油酰磷脂酰胆碱、二硬脂酰磷脂酰乙醇胺(DSPE)、二肉豆蔻酰磷脂酰乙醇胺(DMPE)、二棕榈酰磷脂酰乙醇胺(DPPE)、棕榈酰油酰磷脂酰乙醇胺(POPE)、溶血磷脂酰乙醇胺和其组合。在一个实施例中,中性磷脂可以选自由二硬脂酰磷脂酰胆碱(DSPC)和二肉豆蔻酰磷脂酰乙醇胺(DMPE)组成的组。在另一个实施例中,中性磷脂可以是二硬脂酰磷脂酰胆碱(DSPC)。
“辅助脂质”包含类固醇、甾醇和烷基间苯二酚。适用于本公开的辅助脂质包含但不限于胆固醇、5-十七烷基间苯二酚和胆固醇半琥珀酸酯。在一个实施例中,所述辅助脂质可以是胆固醇。在一个实施例中,辅助脂质可以是胆固醇半琥珀酸酯。
“隐形脂质”是改变纳米颗粒在体内(例如在血液中)存在的时间长度的脂质。隐形脂质可以通过例如减少颗粒聚集和控制粒度来帮助调配过程。本文所使用的隐形脂质可以调节LNP的药代动力学性质。适用于本公开的脂质组合物的隐形脂质包含但不限于具有连接到脂质部分的亲水性头基的隐形脂质。可以在Romberg等人,《药学研究(PharmaceuticalResearch)》,第25卷第1期,2008,第55-71页以及Hoekstra等人,《生物化学与生物物理学学报(Biochimica et Biophysica Acta)》1660(2004)41-52中找到适用于本公开的脂质组合物的隐形脂质以及关于此类脂质的生物化学的信息。例如,在WO 2006/007712中公开了另外的合适的PEG脂质。
在一个实施例中,所述隐形脂质的亲水性头基包括选自基于PEG的聚合物的聚合物部分。隐形脂质可以包括脂质部分。在一些实施例中,所述隐形脂质是PEG脂质。
在一个实施例中,隐形脂质包括选自以下的聚合物部分:基于PEG(有时称为聚(环氧乙烷))的聚合物、聚(噁唑啉)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯基吡咯烷酮)、聚氨基酸和聚[N-(2-羟丙基)甲基丙烯酰胺]。
在一个实施例中,所述PEG脂质包括基于PEG(有时称为聚(环氧乙烷))的聚合物部分。
所述PEG脂质进一步包括脂质部分。在一些实施例中,脂质部分可以源自二酰基甘油或二烷基甘酰胺,其包含包括二烷基甘油或二烷基甘酰胺基团的那些,所述二烷基甘油或二烷基甘酰胺基团具有独立地包括约C4到约C40个饱和或不饱和碳原子的烷基链长度,其中链可以包括一个或多个官能团,例如酰胺或酯。在一些实施例中,烷基链长度包括约C10到C20。二酰基甘油或二烷基甘酰胺基团可以进一步包括一个或多个经取代的烷基。链长度可以是对称的或不对称的。
除非另有说明,本文所使用的,术语“PEG”意指任何聚乙二醇或其它聚亚烷基醚聚合物。在一个实施例中,PEG是乙二醇或环氧乙烷的任选地经取代的线性或支化聚合物。在一个实施例中,PEG是未经取代的。在一个实施例中,所述PEG例如被一个或多个烷基、烷氧基、酰基、羟基或芳基取代。在一个实施例中,所述术语包含PEG共聚物,如PEG-聚氨酯或PEG-聚丙烯(参见例如J.Milton Harris,聚(乙二醇)化学:生物技术和生物医学应用(Poly(ethylene glycol)chemistry:biotechnical and biomedical applications)(1992));在另一个实施例中,所述术语不包含PEG共聚物。在一个实施例中,所述PEG的分子量为约130到约50,000,在子实施例中为约150到约30,000,在子实施例中为约150到约20,000,在子实施例中为约150到约15,000,在子实施例中为约150到约10,000,在子实施例中为约150到约6,000,在子实施例中为约150到约5,000,在子实施例中为约150到约4,000,在子实施例中为约150到约3,000,在子实施例中为约300到约3,000,在子实施例中为约1,000到约3,000,并且在子实施例中为约1,500到约2,500。
在某些实施例中,所述PEG(其例如与脂质部分或脂质,如隐形脂质缀合)是“PEG-2K”,也称为“PEG 2000”,所述PEG的平均分子量为约2,000道尔顿。PEG-2K在本文中由下式(I)表示,其中n为45,这意味着数均聚合度包括约45个亚基。然而,可以使用本领域已知的其它PEG实施例,包含例如其中数均聚合度包括约23个亚基(n=23)和/或68个亚基(n=68)的那些实施例。在一些实施例中,n可以在约30到约60的范围内。在一些实施例中,n可以在约35到约55的范围内。在一些实施例中,n可以在约40到约50的范围内。在一些实施例中,n可以在约42到约48的范围内。在一些实施例中,n可以为45。在一些实施例中,R可以选自H、经取代的烷基和未经取代的烷基。在一些实施例中,R可以是未经取代的烷基。在一些实施例中,R可以是甲基。
在本文所述的任一实施例中,所述PEG脂质可以选自PEG-二月桂酰甘油、PEG-二豆蔻酰甘油(PEG-DMG)(来自日本东京NOF的目录号GM-020)、PEG-二棕榈酰甘油、PEG-二硬脂酰甘油(PEG-DSPE)(日本东京NOF的目录号DSPE-020CN)、PEG-二月桂酰甘氨酰胺、PEG-二肉豆蔻酰甘氨酰胺、PEG-二棕榈甘氨酰胺和PEG-二硬脂酰甘氨酰胺、PEG-胆固醇(1-[8'-(胆甾-5-烯-3[β]-氧基)甲酰胺-3',6'-二氧杂辛酰]氨甲酰-[Ω]-甲基-聚(乙二醇)、PEG-DMB(3,4-二十四碳烯氧基苄基-[Ω]-甲基-聚(乙二醇)醚)、1,2-二肉豆蔻酰基-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DMG)、1,2-二硬脂酰-sn-甘油-3-磷酸乙醇胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSPE)(来自美国阿拉巴马州阿拉巴斯特AvantiPolar Lipids公司(Avanti Polar Lipids,Alabaster,Alabama,USA)的目录号880120C)、1,2-二硬脂酰-sn-甘油、甲氧基聚乙二醇(PEG2k-DSG;GS-020,日本东京NOF)、聚(乙二醇)-2000-二甲基丙烯酸酯(PEG2k-DMA)和1,2-二硬脂酰氧基丙基-3-胺-N-[甲氧基(聚乙二醇)-2000](PEG2k-DSA)。在一个实施例中,所述PEG脂质可以是PEG2k-DMG。在一些实施例中,所述PEG脂质可以是PEG2k-DSG。在一个实施例中,所述PEG脂质可以是PEG2k-DSPE。在一个实施例中,所述PEG脂质可以是PEG2k-DMA。在一个实施例中,所述PEG脂质可以是PEG2k-C-DMA。在一个实施例中,所述PEG脂质可以是在WO2016/010840(第[00240]段到[00244]段)中公开的化合物S027。在一个实施例中,所述PEG脂质可以是PEG2k-DSA。在一个实施例中,所述PEG脂质可以是PEG2k-C11。在一些实施例中,所述PEG脂质可以是PEG2k-C14。在一些实施例中,所述PEG脂质可以是PEG2k-C16。在一些实施例中,所述PEG脂质可以是PEG2k-C18。
LNP调配物
所述LNP可以含有可电离脂质,例如适合于递送核酸货物的可生物降解的可电离脂质。所述LNP可以含有(i)用于包封和内体逃逸的CCD或胺脂质。此类组分可以任选地与以下中的一种或多种组合包含在LNP中:(ii)用于稳定的中性脂质;(iii)也用于稳定的辅助脂质;以及(iv)隐形脂质,如PEG脂质。
在一些实施例中,LNP组合物可以包括一种或多种核酸组分,所述一种或多种核酸组分包含多核苷酸,所述多核苷酸包括对所关注的多肽(如本文所述的任何多肽)进行编码的开放阅读框(ORF),例如RNA引导的DNA结合剂。在一些实施例中,所述核酸组分可以包含包括对所关注的多肽进行编码的开放阅读框(ORF)的mRNA,如RNA引导的DNA结合剂(例如,第2类Cas核酸酶)以及任选地gRNA。在某些实施例中,LNP组合物可以包括核酸组分、胺脂质、辅助脂质、中性脂质和隐形脂质。在某些LNP组合物中,所述辅助脂质是胆固醇。在其它组合物中,所述中性脂质是DSPC。在另外的实施例中,所述隐形脂质是PEG2k-DMG或PEG2k-C11。在某些实施例中,所述LNP组合物包括脂质A或脂质A的等效物;辅助脂质;中性脂质;隐形脂质;以及核酸组分。在某些组合物中,所述胺脂质是脂质A。在某些组合物中,所述胺脂质是脂质A或其缩醛类似物;所述辅助脂质是胆固醇;所述中性脂质是DSPC;并且所述隐形脂质是PEG2k-DMG。
在某些实施例中,所述核酸组分包含包括对所关注的多肽进行编码的开放阅读框(ORF)的多核苷酸。在一些实施例中,所述核酸组分包含RNA引导的DNA结合剂(例如,Cas核酸酶、第2类Cas核酸酶或Cas9)。在一些实施例中,所述核酸组分包含gRNA或对gRNA进行编码的核酸。在一些实施例中,所述核酸组分包含mRNA和gRNA的组合。在一个实施例中,LNP组合物可以包括脂质A或其等效物。在一些方面,所述胺脂质是脂质A。在一些方面,所述胺脂质是脂质A等效物,例如脂质A的类似物。在某些方面,所述胺脂质是脂质A的缩醛类似物。在各个实施例中,所述LNP组合物包括胺脂质、中性脂质、辅助脂质和PEG脂质。在某些实施例中,所述辅助脂质是胆固醇。在某些实施例中,所述中性脂质是DSPC。在一些实施例中,所述PEG脂质是PEG2k-DMG。在一些实施例中,LNP组合物可以包括脂质A、辅助脂质、中性脂质和PEG脂质。在一些实施例中,LNP组合物包括胺脂质、DSPC、胆固醇和PEG脂质。在一些实施例中,LNP组合物包括包含DMG的PEG脂质。在某些实施例中,所述胺脂质选自脂质A和脂质A的等效物,包含脂质A的缩醛类似物。在另外的实施例中,LNP组合物包括脂质A、胆固醇、DSPC和PEG2k-DMG。
本公开的实施例还提供了根据胺脂质的带正电荷的胺基团(N)与待包封的核酸的带负电荷的磷酸酯基团(P)之间的摩尔比描述的脂质组合物。这可以由等式N/P在数学上表示。在一些实施例中,LNP组合物可以包括:脂质组分,所述脂质组分包括胺脂质、辅助脂质、中性脂质和辅助脂质;以及核酸组分,其中所述N/P比率为约3到10。在一些实施例中,LNP组合物可以包括:脂质组分,所述脂质组分包括胺脂质、辅助脂质、中性脂质和辅助脂质;以及RNA组分,其中所述N/P比率为约3到10。在一个实施例中,所述N/P比率可以为约5-7。在一个实施例中,所述N/P比率可以为约4.5-8。在一个实施例中,所述N/P比率可以为约6。在一个实施例中,所述N/P比率可以为约6±1。在一个实施例中,所述N/P比率可以为约6±0.5。在一些实施例中,所述N/P比率将为目标N/P比率的±30%、±25%、±20%、±15%、±10%、±5%或±2.5%。在某些实施例中,LNP批次间变异性将小于15%、小于10%或小于5%。在某些实施例中,所述LNP组合物包含包括对所关注的多肽进行编码的开放阅读框(ORF)的多核苷酸以及另外核酸组分,如gRNA。在某些实施例中,所述LNP组合物的多核苷酸组分与其它核酸组分的比率为约25:1到约1:25。在某些实施例中,LNP调配物的多核苷酸组分与其它核酸组分的比率为约10:1到约1:10。在某些实施例中,LNP调配物的多核苷酸组分与其它核酸组分的比率为约8:1到约1:8。如本文所测量的,所述比率是按重量计算的。在一些实施例中,比率范围为约5:1到约1:5、约3:1到1:3、约2:1到1:2、约5:1到1:2、约5:1到1:1、约3:1到1:2、约3:1到1:1、约3:1、约2:1到1:1。比率可以为25:1、10:1、5:1、3:1、1:1、1:3、1:5、1:10或1:25。
任选地,本文公开的LNP组合物可以包含模板核酸。所述模板核酸可以与对Cas核酸酶进行编码的mRNA,如第2类Cas核酸酶mRNA共同调配。在一些实施例中,所述模板核酸可以与向导RNA共同调配。在一些实施例中,所述模板核酸可以与对Cas核酸酶进行编码的mRNA和向导RNA两者共同调配。在一些实施例中,所述模板核酸可以与对Cas核酸酶进行编码的mRNA或向导RNA分开调配。所述模板核酸可以与LNP组合物一起递送,或与LNP组合物分开递送。在一些实施例中,所述模板核酸可以是单链或双链的,这取决于期望的修复机制。所述模板可以具有与靶DNA或与靶DNA相邻的序列同源的区。
本文所述的LNP和LNP调配物中的任一种都适合于单独或与其它核酸组分一起递送本文公开的多核苷酸。在一些实施例中,涵盖一种LNP组合物,其包括:核酸组分和脂质组分,其中所述脂质组分包括胺脂质、中性脂质、辅助脂质和隐形脂质;并且其中核酸与脂质(N/P)的比率为约1-10。在任何上述实施例中,所述多核苷酸可以是mRNA。
在一些实施例中,通过将核酸水溶液与基于有机溶剂的脂质溶液(例如,100%乙醇)混合来形成LNP。合适的溶液或溶剂包含或可能含有:水、PBS、Tris缓冲液、NaCl、柠檬酸盐缓冲液、乙醇、氯仿、二乙醚、环己烷、四氢呋喃、甲醇、异丙醇。可以使用药学上可接受的缓冲液,例如用于体内施用LNP。在某些实施例中,缓冲液用于将包括LNP的组合物的pH维持处于或高于pH 6.5。在某些实施例中,缓冲液用于将包括LNP的组合物的pH维持处于或高于pH 7.0。在某些实施例中,所述组合物的pH的范围为约7.2到约7.7。在另外的实施例中,所述组合物的pH的范围为约7.3到约7.7或约7.4到约7.6。在另外的实施例中,所述组合物的pH为约7.2、7.3、7.4、7.5、7.6或7.7。可以使用微型pH探针测量组合物的pH。在某些实施例中,所述组合物中包含冷冻保护剂。冷冻保护剂的非限制性实例包含蔗糖、海藻糖、甘油、DMSO和乙二醇。示例性组合物可以包含高达10%的冷冻保护剂,例如蔗糖。在某些实施例中,所述LNP组合物可以包含约1、2、3、4、5、6、7、8、9或10%的冷冻保护剂。在某些实施例中,所述LNP组合物可以包含约1、2、3、4、5、6、7、8、9或10%的蔗糖。在一些实施例中,所述LNP组合物可以包含缓冲液。在一些实施例中,所述缓冲液可以包括磷酸盐缓冲液(PBS)、Tris缓冲液、柠檬酸盐缓冲液以及其混合物。在某些示例性实施例中,所述缓冲液包括NaCl。在某些实施例中,省略了NaCl。NaCl的示例性量可以在约20mM到约45mM的范围内。NaCl的示例性量可以在约40mM到约50mM的范围内。在一些实施例中,NaCl的量为约45mM。在一些实施例中,所述缓冲液是Tris缓冲液。Tris的示例性量可以在约20mM到约60mM的范围内。Tris的示例性量可以在约40mM到约60mM的范围内。在一些实施例中,Tris的量为约50mM。在一些实施例中,所述缓冲液包括NaCl和Tris。所述LNP组合物的某些示例性实施例含有含5%蔗糖和45mM NaCl的Tris缓冲液。在其它示例性实施例中,组合物含有在pH 7.5下量为约5%w/v的蔗糖、约45mM NaCl和约50mM Tris。盐、缓冲液和冷冻保护剂的量可以改变,使得维持整体调配物的渗透压。例如,最终渗透压可以维持在450mOsm/L以下。在另外的实施例中,渗透压介于350与250mOsm/L之间。某些实施例具有300+/-20mOsm/L的最终渗透压。
在一些实施例中,使用微流体混合、T混合或交叉混合。在某些方面,流速、结尺寸、结几何形状、结形状、管直径、溶液和/或核酸和脂质浓度可以变化。LNP或LNP组合物可以被浓缩或纯化,例如通过透析、切向流过滤或色谱法。例如,所述LNP可以以悬浮液、乳液或冻干粉的形式储存。在一些实施例中,所述LNP组合物储存在2-8℃下,在某些方面,所述LNP组合物储存在室温下。在另外的实施例中,LNP组合物被冷冻储存,例如储存在-20℃或-80℃下。在其它实施例中,LNP组合物储存在范围为约0℃到约-80℃的温度下。冷冻的LNP组合物可以在使用前解冻,例如在冰上、4℃、室温或25℃下解冻。冷冻的LNP组合物可以维持在各种温度下,例如在冰上、4℃、室温、25℃或37℃下。
在一些实施例中,LNP组合物的包封大于约80%。在一些实施例中,LNP组合物的粒径小于约120nm。在一些实施例中,LNP组合物的pdi小于约0.2。在一些实施例中,存在这些特征中的至少两个特征。在一些实施例中,存在这三个特征中的每个特征。将在下文的通用试剂和方法部分讨论用于测定这些参数的分析方法。
在一些实施例中,与本文公开的多核苷酸相关的LNP用于制备药物。
电穿孔也是众所周知的用于递送核酸组分的方法,并且可以使用任何电穿孔方法来递送本文公开的核酸组分中的任何一种。在一些实施例中,电穿孔可以用于递送多核苷酸以及任选的一种或多种核酸组分。
在一些实施例中,提供了一种用于将本文公开的多核苷酸递送到离体细胞的方法,其中所述多核苷酸与LNP相关或不与LNP相关。在一些实施例中,所述多核苷酸/LNP或多核苷酸还与任选的一种或多种核酸组分相关。
在一些实施例中,提供了包括根据本公开的多核苷酸的药物调配物。在一些实施例中,提供了包括至少一种脂质的药物调配物,例如包括根据本公开的多核苷酸的LNP。可以使用适合于递送多核苷酸的任何LNP,如上文所述的LNP;于2017年10月5日公开的WO2017173054A1中描述了另外的示例性LNP。药物调配物可以进一步包括药学上可接受的载体,例如水或缓冲液。药物调配物可以进一步包括一种或多种药学上可接受的赋形剂,如稳定剂、防腐剂、填充剂等。药物调配物可以进一步包括一种或多种药学上可接受的盐,如氯化钠。在一些实施例中,所述药物调配物被调配用于静脉内施用。在一些实施例中,所述药物调配物被调配用于递送到肝循环中。
B.测定ORF的功效
包括对所关注的多肽进行编码的ORF的多核苷酸的功效可以在所述多肽与靶功能或系统的其它组分一起表达时测定,例如使用本领域公认的用于检测特定多肽的存在、表达水平或活性的方法,例如通过酶联免疫吸附测定(ELISA)、其它免疫学方法、免疫印迹法、液相色谱-质谱法(LC-MS)、FACS分析或本文所述的其它测定;或者用于测定生物样品(例如,细胞裂解物或提取物、条件培养基、全血、血清、血浆、尿液或组织)中酶活性水平的方法,如体外活性测定。本文所述的各种经编码的多肽活性的示例性测定包含针对以下的测定:苯丙氨酸羟化酶酶活性;鸟氨酸氨甲酰转移酶酶活性;延胡索酰乙酰乙酸水解酶酶活性;葡糖神经酰胺酶β酶活性;α-半乳糖苷酶酶活性;运甲状腺素蛋白;甘油醛-3-磷酸脱氢酶酶活性;丝氨酸蛋白酶抑制;神经递质结合(例如,GABA结合)。在一些实施例中,基于体外模型测定包括对所关注的多肽进行编码的ORF的多核苷酸的功效。
1.测定对RNA引导的DNA结合剂进行编码的ORF的功效
在一些实施例中,当与RNP的其它组分(例如至少一个gRNA,如靶向TTR的gRNA)一起表达时,测定mRNA的功效。
具有裂解酶活性的RNA引导的DNA结合剂可能导致DNA中的双链断裂。非同源末端接合(NHEJ)是一种通过重新连接断裂末端来修复DNA中的双链断裂(DSB)的过程,所述过程可能产生呈插入/缺失(插入缺失)突变形式的错误。DSB的DNA末端经常经受酶处理,从而导致在末端重新接合之前在一条或两条链处添加或去除核苷酸。这些在重新接合之前的添加或去除导致在NHEJ修复位点处的DNA序列中存在插入或缺失(插入缺失)突变。许多由于插入缺失造成的突变改变开放阅读框或引入提前终止密码子,并且因此产生非功能性蛋白。
在一些实施例中,基于体外模型测定对核酸酶进行编码的mRNA的功效。在一些实施例中,所述体外模型是HEK293细胞。在一些实施例中,所述体外模型是HUH7人肝癌细胞。在一些实施例中,所述体外模型是原代肝细胞,如原代人或小鼠肝细胞。
在一些实施例中,RNA的功效是通过TTR的编辑百分比来测量的。下面的实例中给出了用于测定编辑百分比的示例性程序。在一些实施例中,将TTR的编辑百分比与当mRNA包括具有未经修饰的尿苷的SEQ ID NO:2或3的ORF并且其它所有均相等时获得的编辑百分比进行比较。
在一些实施例中,通过测量蛋白质表达水平(例如通过MSD技术或通过量化与蛋白质相关的可检测标志物)来测定mRNA的功效。在一些实施例中,在施用包括mRNA和靶向TTR的gRNA的LNP(例如,SEQ ID NO:4)后,使用小鼠中的血清TTR浓度来测定mRNA的功效。血清TTR浓度可以用绝对项或相对于假手术处理的对照的敲低%表示。在一些实施例中,在施用包括mRNA和靶向TTR的gRNA的LNP(例如,SEQ ID NO:4)后,使用小鼠肝脏中的编辑百分比来测定mRNA的功效。在一些实施例中,有效量能够实现血清TTR的至少50%编辑或50%敲低。示例性有效量在0.1到10mg/kg(mpk)范围内,例如0.1到0.3mpk、0.3到0.5mpk、0.5到1mpk、1到2mpk、2到3mpk、3到5mpk、5到10mpk或者为0.1、0.2、0.3、0.5、1、2、3、5或10mpk。
在一些实施例中,检测基因编辑事件(如在靶DNA中形成插入/缺失(“插入缺失”)突变和同源性定向修复(HDR)事件)利用使用标记引物进行的线性扩增并使标记的扩增产物分离(本文此后称为“LAM-PCR”,或“线性扩增(LA)”方法),如WO2018/067447或者Schmidt等人,《自然方法(Nature Methods)》4:1051-1057(2007)中所述,或者如下文所述的下一代测序(“NGS”;例如,使用Illumina NGS平台)或本领域已知的用于检测插入缺失突变的其它方法。
例如,为了定量地测定基因组中靶位置处的编辑效率,在NGS方法中,分离基因组DNA并利用深度测序来鉴别通过基因编辑引入的插入和缺失的存在。在靶位点(例如,TTR)周围设计PCR引物,并扩增所关注的基因组区。根据制造商的方案(Illumina)执行另外的PCR以添加所需的化学物质进行测序。在Illumina MiSeq仪器上对扩增子进行测序。在消除具有低质量评分的读段后,将读段与参考基因组(例如,mm10)进行比对。将含有读段的所得文件映射到参考基因组(BAM文件),其中选择与所关注的靶区重叠的读段,并且计算野生型读段数相对于含有插入、取代或缺失的读段数。将编辑百分比(例如,“编辑效率编辑百分比”)定义为具有插入或缺失的序列读段的总数占序列读段的总数(包含野生型)。
C.示例性用途、方法和治疗
在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于例如靶基因的基因疗法中。在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于基因组编辑,例如编辑靶基因,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。在一些实施例中,本文公开的对所关注的多肽进行编码的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于在异源细胞(例如,人细胞或小鼠细胞)中表达所关注的多肽。在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于修饰靶基因,例如改变其序列或表观遗传状态,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于在靶基因内诱导双链断裂(DSB)。在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于在靶基因内诱导插入缺失。在一些实施例中,提供了本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物的用途,其用于制备用于基因组编辑(例如,编辑靶基因)的药物,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。在一些实施例中,提供了本文公开的对所关注的多肽进行编码的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物的用途,其用于制备在异源细胞中表达所关注的多肽或增加所关注的多肽(例如,人细胞或小鼠细胞)的表达的药物。在一些实施例中,提供了本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物的用途,其用于制备用于修饰靶基因(例如,改变所述靶基因的序列或表观遗传状态)的药物。在一些实施例中,提供了本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物的用途,其用于制备用于在靶基因内诱导双链断裂(DSB)的药物。在一些实施例中,提供了本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物的用途,其用于制备用于在靶基因内诱导插入缺失的药物。
在一些实施例中,所述靶基因是转基因。在一些实施例中,所述靶基因是内源基因。所述靶基因可以在受试者中,如哺乳动物,如人类。在一些实施例中,所述靶基因在器官中,如肝脏,如哺乳动物肝脏,如人肝脏。在一些实施例中,所述靶基因在肝脏细胞中,如哺乳动物肝脏细胞,如人肝脏细胞。在一些实施例中,所述靶基因在肝细胞中,如哺乳动物肝细胞,如人肝细胞。在一些实施例中,所述肝脏细胞或肝细胞是原位的。在一些实施例中,所述肝脏细胞或肝细胞是分离的,例如在培养物中,例如在原代培养物中。
还提供了对应于本文公开的用途的方法,所述方法包括向受试者施用本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物或使如上文所述的细胞与本文公开的多核苷酸、LNP或药物组合物接触,以例如表达所关注的多肽或增加所关注的多肽的表达,例如在异源细胞中,如人细胞或小鼠细胞。
在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物用于疗法中或用于治疗疾病,例如与TTR相关的淀粉样变性(ATTR)或α-1抗胰蛋白酶病症;苯丙酮尿症(PKU)或苯丙氨酸羟化酶缺乏症;鸟氨酸氨甲酰转移酶(OTC)缺乏症或高氨血症;葡糖神经酰胺酶缺乏症或葡糖脑苷脂贮积病或戈谢病(Gaucher disease);α-半乳糖苷酶A(GLA)缺乏症或法布里病(Fabry disease);延胡索酰乙酰(FAH)缺乏症或I型酪氨酸血症。在一些情况下,所述疾病与ORF或所关注的多肽相关。在一些实施例中,提供了本文公开的多核苷酸(例如,在本文提供的组合物中)的用途,其用于制备药物,例如用于治疗患有以下的受试者:与TTR相关的淀粉样变性(ATTR);α-1抗胰蛋白酶病症;苯丙酮尿症(PKU)或苯丙氨酸羟化酶缺乏症;鸟氨酸氨甲酰转移酶(OTC)缺乏症或高氨血症;葡糖神经酰胺酶缺乏症或葡糖脑苷脂贮积病或戈谢病;α-半乳糖苷酶A(GLA)缺乏症或法布里病;延胡索酰乙酰(FAH)缺乏症或I型酪氨酸血症。
在一些实施例中,静脉内施用多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物以用于上文讨论的关于生物体、器官或原位细胞的任何用途。在一些实施例中,多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物以范围为0.01到10mg/kg(mpk)的剂量施用,例如0.01到0.1mpk、0.1到0.3mpk、0.3到0.5mpk、0.5到1mpk、1到2mpk、2到3mpk、3到5mpk、5到10mpk或0.1、0.2、0.3、0.5、1、2、3、5或10mpk。
在涉及受试者的任何前述实施例中,所述受试者可以是哺乳动物。在涉及受试者的任何前述实施例中,所述受试者可以是人。在涉及受试者的任何前述实施例中,所述受试者可以是牛、猪、猴、羊、狗、猫、鱼或家禽。
在一些实施例中,本文公开的多核苷酸、表达构建体、组合物、脂质纳米颗粒(LNP)或药物组合物被静脉内施用或用于静脉内施用。在一些实施例中,本文公开的多核苷酸、LNP或药物组合物被施用到肝循环中或用于施用到肝循环中。
在一些实施例中,单次施用本文公开的多核苷酸、LNP或药物组合物足以敲低靶基因产物的表达。在一些实施例中,单次施用本文公开的多核苷酸、LNP或药物组合物足以敲除靶基因产物的表达。在其它实施例中,本文公开的多核苷酸、LNP或药物组合物的多于一次施用可能有益于通过累积效应使编辑、修饰、插入缺失形成、DSB形成等最大化。
在一些实施例中,在递送后1年、2年、3年、4年、5年或10年看到用本文公开的多核苷酸、LNP或药物组合物治疗的功效。
在一些实施例中,治疗减缓或停止疾病进展。
在一些实施例中,治疗导致改善、稳定或减缓器官功能变化或器官(如肝脏)的疾病症状。
在一些实施例中,治疗功效是通过增加受试者的存活时间来测量的。
D.示例性DNA分子、载体、表达构建体、宿主细胞和产生方法
在某些实施例中,本公开提供了包括对编码所关注的多肽进行的ORF进行编码的序列的DNA分子。在一些实施例中,除了ORF序列之外,所述DNA分子进一步包括不对所述多肽进行编码的核酸。不对所述多肽进行编码的核酸包含但不限于启动子、增强子、调节序列和对向导RNA进行编码的核酸。
在一些实施例中,所述DNA分子进一步包括对crRNA、trRNA或crRNA和trRNA进行编码的核苷酸序列。在一些实施例中,对crRNA、trRNA或crRNA和trRNA进行编码的核苷酸序列包括或由两侧是来自天然存在的CRISPR/Cas系统的重复序列的全部或部分的引导序列组成。包括或由crRNA、trRNA或crRNA和trRNA组成的核酸可以进一步包括载体序列,其中载体序列包括或由与crRNA、trRNA或crRNA和trRNA一起的非天然发现的核酸组成。在一些实施例中,所述crRNA和所述trRNA由一个载体内的非连续核酸编码。在一些实施例中,所述crRNA和所述trRNA可以由连续核酸编码。在一些实施例中,所述crRNA和所述trRNA由单个核酸的相反链编码。在一些实施例中,所述crRNA和所述trRNA由单个核酸的相同链编码。
在一些实施例中,所述DNA分子进一步包括与对编码所关注的多肽的任何ORF进行编码的序列可操作地连接的启动子。在一些实施例中,所述DNA分子是适合于在哺乳动物细胞(例如人细胞或小鼠细胞,如人肝细胞或啮齿动物(例如小鼠)肝细胞)中表达的表达构建体。在一些实施例中,所述DNA分子是适合于在哺乳动物器官(例如,人肝脏或啮齿动物(例如小鼠)肝脏)的细胞中表达的表达构建体。在一些实施例中,所述DNA分子是质粒或附加体。在一些实施例中,所述DNA分子包含在宿主细胞,如细菌或经培养的真核细胞中。示例性细菌包含变形菌门,如大肠杆菌。示例性经培养的真核细胞包含原代肝细胞,包含啮齿动物(例如小鼠)或人类来源的肝细胞;肝细胞系,包含啮齿动物(例如小鼠)或人类来源的肝细胞;人细胞系;啮齿动物(例如小鼠)细胞系;CHO细胞;微生物真菌,如裂殖酵母或芽殖酵母,例如酵母属,如酿酒酵母(S.cerevisiae);以及昆虫细胞。
在一些实施例中,提供了产生本文公开的mRNA的方法。在一些实施例中,此方法包括在允许转录的条件下使本文所述的DNA分子与RNA聚合酶接触。在一些实施例中,所述接触在体外进行,例如在无细胞系统中。在一些实施例中,所述RNA聚合酶是噬菌体来源的RNA聚合酶,如T7 RNA聚合酶。在一些实施例中,提供了包含至少一种如上文所讨论的经修饰的核苷酸的NTP。在一些实施例中,所述NTP包含至少一种如上文所讨论的经修饰的核苷酸并且不包括UTP。
在一些实施例中,本文公开的多核苷酸可以包括在一个或多个载体的载体系统内或由所述载体系统递送。在一些实施例中,所述载体中的一个或多个载体或所有载体可以是DNA载体。在一些实施例中,所述载体中的一个或多个载体或所有载体可以是RNA载体。在一些实施例中,所述载体中的一个或多个载体或所有载体可以是圆形的。在其它实施例中,所述载体中的一个或多个载体或所有载体可以是线性的。在一些实施例中,所述载体中的一个或多个载体或所有载体可以被包裹在脂质纳米颗粒、脂质体、非脂质纳米颗粒或病毒衣壳中。非限制性示例性载体包含质粒、噬菌粒、粘粒、人工染色体、微染色体、转座子、病毒载体和表达载体。
非限制性示例性病毒载体包含腺相关病毒(AAV)载体、慢病毒载体、腺病毒载体、辅助依赖性腺病毒载体(HDAd)、单纯疱疹病毒(HSV-1)载体、噬菌体T4、杆状病毒载体和逆转录病毒载体。在一些实施例中,所述病毒载体可以是AAV载体。在其它实施例中,所述病毒载体可以是慢病毒载体。在一些实施例中,所述慢病毒可以是非整合的。在一些实施例中,所述病毒载体可以是腺病毒载体。在一些实施例中,所述腺病毒可以是高克隆能力或“无肠”腺病毒,其中除5'和3'反向末端重复序列(ITR)和包装信号(“I”)之外的所有编码病毒区都从病毒中缺失,以提高其包装能力。在又其它实施例中,所述病毒载体可以是HSV-1载体。在一些实施例中,基于HSV-1的载体是辅助依赖性的,并且在其它实施例中其是辅助非依赖性的。例如,仅保留包装序列的扩增子载体需要具有用于包装的结构组分的辅助病毒,而去除非必需病毒功能的30kb-缺失HSV-1载体则不需要辅助病毒。在另外的实施例中,所述病毒载体可以是噬菌体T4。在一些实施例中,当病毒头部被清空时,所述噬菌体T4可能能够包装任何线性或圆形DNA或RNA分子。在另外的实施例中,所述病毒载体可以是杆状病毒载体。在又另外的实施例中,所述病毒载体可以是逆转录病毒载体。在使用具有较小克隆能力的AAV或慢病毒载体的实施例中,可能需要使用多于一种载体来递送本文公开的载体系统的所有组分。例如,一个AAV载体可能含有对Cas蛋白进行编码的序列,而第二个AAV载体可能含有一个或多个向导序列。
在一些实施例中,所述载体可能能够驱动一个或多个编码序列(如本文公开的mRNA的编码序列)在细胞中的表达。在一些实施例中,所述细胞可以是原核细胞,例如细菌细胞。在一些实施例中,所述细胞可以是真核细胞,例如酵母、植物、昆虫或哺乳动物细胞。在一些实施例中,所述真核细胞可以是哺乳动物细胞。在一些实施例中,所述真核细胞可以是啮齿动物细胞。在一些实施例中,所述真核细胞可以是人细胞。驱动在不同类型的细胞中表达的合适启动子是本领域已知的。在一些实施例中,所述启动子可以是野生型的。在其它实施例中,所述启动子可以被修饰以进行更有效或更高效的表达。在又其它实施例中,所述启动子可以被截短但仍保留其功能。例如,所述启动子可以具有适合于将所述载体适当包装到病毒中的正常大小或减小的大小。
在一些实施例中,所述载体系统可以包括对所关注的多肽进行编码的ORF的核苷酸序列的一个拷贝。在其它实施例中,所述载体系统可以包括对所关注的多肽进行编码的核苷酸序列的多于一个拷贝。在一些实施例中,对所关注的多肽进行编码的核苷酸序列可以可操作地连接到至少一个转录或翻译控制序列。在一些实施例中,对核酸酶进行编码的核苷酸序列可以可操作地连接到至少一个启动子。
在一些实施例中,所述启动子可以是组成型的、诱导型的或组织特异型的。在一些情况下,所述启动子可以是组成型启动子。非限制性示例性组成型启动子包含巨细胞病毒立即早期启动子(CMV)、猿猴病毒(SV40)启动子、腺病毒主要晚期(MLP)启动子、劳斯肉瘤病毒(RSV)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、磷酸甘油酸激酶(PGK)启动子、延伸因子-α(EF1a)启动子、泛素启动子、肌动蛋白启动子、微管蛋白启动子、免疫球蛋白启动子、其功能片段或上述任何一种的组合。在一些实施例中,所述启动子可以是CMV启动子。在一些实施例中,所述启动子可以是截短的CMV启动子。在其它实施例中,所述启动子可以是EF1a启动子。在一些实施例中,所述启动子可以是诱导型启动子。非限制性示例性诱导型启动子包含可通过热休克、光、化学品、肽、金属、类固醇、抗生素或酒精诱导的启动子。在一些实施例中,所述诱导型启动子可以是具有低基础(非诱导)表达水平的启动子,例如启动子(Clontech)。
在一些实施例中,所述启动子可以是组织特异型启动子,例如对在肝脏中表达具有特异性的启动子。
所述载体可以进一步包括对至少一个向导RNA进行编码的核苷酸序列。在一些实施例中,所述载体包括所述向导RNA的一个拷贝。在一些实施例中,所述载体包括所述向导RNA的多于一个拷贝。在具有多于一个向导RNA的实施例中,所述向导RNA可以是不同的,使得所述向导RNA靶向不同的靶序列,或者可以是相同,因为所述向导RNA靶向相同的靶序列。在所述载体包括多于一个向导RNA的一些实施例中,每个向导RNA可以具有其它不同的特性,如在具有RNA引导的DNA结合剂的核糖核蛋白复合物中的活性或稳定性。在一些实施例中,对向导RNA进行编码的核苷酸序列可以可操作地连接到至少一个转录或翻译控制序列,如启动子、3'UTR或5'UTR。在一个实施例中,所述启动子可以是tRNA启动子(例如,tRNALys3)或tRNA嵌合体。参见Mefferd等人,《RNA》2015 21:1683-9;Scherer等人,《核酸研究(Nucleic Acids Res.)》200735:2620-2628。在一些实施例中,所述启动子可以由RNA聚合酶III(Pol III)识别。Pol III启动子的非限制性实例包含U6和H1启动子。在一些实施例中,对所述向导RNA进行编码的核苷酸序列可以可操作地连接到小鼠或人U6启动子。在其它实施例中,对所述向导RNA进行编码的核苷酸序列可以可操作地连接到小鼠或人H1启动子。在具有多于一个向导RNA的实施例中,用于驱动表达的启动子可以相同或不同。在一些实施例中,对向导RNA的crRNA进行编码的核苷酸和对向导RNA的trRNA进行编码的核苷酸可以提供在同一载体上。在一些实施例中,对crRNA进行编码的核苷酸和对trRNA进行编码的核苷酸可以由相同的启动子驱动。在一些实施例中,所述crRNA和所述trRNA可以转录成单一转录物。例如,所述crRNA和所述trRNA可以由单一转录物加工以形成双分子向导RNA。可替代地,所述crRNA和所述trRNA可以转录成单分子向导RNA。在其它实施例中,所述crRNA和所述trRNA可以由其在同一载体上的对应启动子驱动。在又其它实施例中,所述crRNA和所述trRNA可以由不同的载体编码。
在一些实施例中,所述组合物包括载体系统,其中所述系统包括多于一个载体。在一些实施例中,所述载体系统可以包括一个单一载体。在其它实施例中,所述载体系统可以包括两个载体。在另外的实施例中,所述载体系统可以包括三个载体。当不同的多核苷酸用于多路复用时,或者当所述多核苷酸的多个拷贝被使用时,所述载体系统可以包括多于三个载体。
在一些实施例中,所述载体系统可以包括诱导型启动子,以仅在将其递送到靶细胞后才开始表达。非限制性示例性诱导型启动子包含可通过热休克、光、化学品、肽、金属、类固醇、抗生素或酒精诱导的启动子。在一些实施例中,所述诱导型启动子可以是具有低基础(非诱导)表达水平的启动子,例如启动子(Clontech)。
在另外的实施例中,所述载体系统可以包括组织特异型启动子,以仅在将其递送到特定组织中之后才开始表达。
实例
提供以下实例以说明某些公开的实施例,并且不应被解释为以任何方式限制本公开的范围。
实例1-通用试剂和方法:
LNP调配物
将脂质组分溶解在100%乙醇中,其中脂质组分摩尔比如下所述。将经化学修饰的sgRNA和Cas9 mRNA组合并溶解在pH为5.0的25mM柠檬酸盐、100mM NaCl中,从而导致总RNA货物的浓度为约0.45mg/mL。调配的LNP的N/P比率为约6,其中经化学修饰的sgRNA:Cas9mRNA的比率为1:1或1:2w/w,如下所述。除非另有说明,用50%脂质A、9%DSPC、38%胆固醇和3%PEG2k-DMG调配LNP。
所述LNP是通过将乙醇中的脂质与两个体积的RNA溶液和一个体积的水的冲击射流混合而形成的。通过混合交叉将乙醇中的脂质与所述两个体积的RNA溶液混合。通过内联三通将第四水流与交叉的出口流混合。(参见例如WO2016010840,图2。)在混合过程中,使用不同的流速维持水与有机溶剂的2:1比率。将LNP在室温下保持1小时,并用水进一步稀释(大约1:1v/v)在平板盒(赛多利斯(Sartorius),100kD MWCO)上使用切向流过滤将经稀释的LNP浓缩,并且然后通过渗滤将缓冲液交换到pH为7.5的50mM Tris、45mM NaCl、5%(w/v)蔗糖(TSS)中。可替代地,使用PD-10脱盐柱(GE)将最终缓冲液交换到TSS中。如果需要,通过使用Amicon 100kDa离心过滤器(密理博(Millipore))离心浓缩组合物。然后使用0.2μm无菌过滤器过滤所得混合物。将最终LNP储存在4℃或-80℃下直到进一步使用。
LNP组合物分析
动态光散射(“DLS”)用于表征本公开的LNP的多分散性指数(“pdi”)和尺寸。DLS测量使样品经受光源产生的光散射。如根据DLS测量结果测定的,PDI代表群体中粒径(围绕平均粒径)的分布,其中完全均匀群体的PDI为零。
电泳光散射用于表征所述LNP在特定pH值下的表面电荷。表面电荷或ζ电位是LNP悬浮液中颗粒之间静电排斥/吸引力的量值。
非对称流场流动分级-多角度光散射(AF4-MALS)用于通过流体动力学半径分离组合物中的颗粒,并且然后测量碎裂颗粒的分子量、流体动力学半径和均方根半径。这允许能够评估分子量和尺寸分布以及次级特性,如Burchard-Stockmeyer图(随时间推移变化的均方根(“rms”)半径与流体动力学半径之比表明颗粒的内部核密度)和rms构象图(rms半径对数对分子量对数,其中所得线性拟合的斜率给出一定程度的紧密度对伸长率)。
纳米颗粒跟踪分析(NTA,Malvern Nanosight)可以用于测定颗粒大小分布以及颗粒浓度。适当地稀释LNP样品并将其注射到显微镜载玻片上。当颗粒缓慢地注入视野时,相机会记录所散射的光。在捕捉到影片后,纳米颗粒跟踪分析通过跟踪像素和计算扩散系数来处理影片。此扩散系数可以转化为颗粒的流体动力学半径。仪器还对在分析中计数的单独颗粒的数量进行计数以给出颗粒浓度。
低温电子显微镜(“cryo-EM”)可以用于测定LNP的粒径、形态和结构特性。
LNP的脂质成分分析可以通过液相色谱法,随后是带电气溶胶检测(LC-CAD)测定。此分析可以提供实际脂质含量与理论脂质含量的比较。
分析LNP组合物的平均粒径、多分散性指数(pdi)、总RNA含量、RNA的包封效率和ζ电位。LNP组合物可以进一步通过脂质分析、AF4-MALS、NTA和/或cryo-EM表征。使用MalvernZetasizer DLS仪器通过动态光散射(DLS)测量平均粒径和多分散性。LNP样品在通过DLS测量之前用PBS缓冲液稀释。Z-平均直径(即平均粒径的基于强度的测量结果)与数均直径和pdi一起报告。Malvern Zetasizer仪器也用于测量所述LNP的ζ电位。测量前,将样品在pH为7.4的0.1×PBS中按1:17(50μL至800μL)稀释。
基于荧光的测定(赛默飞世尔科技公司)用于测定总RNA浓度和游离RNA。包封效率计算为(总RNA-游离RNA)/总RNA。用含有0.2%Triton-X 100的1×TE缓冲液适当稀释LNP样品,以测定总RNA,或者用1×TE缓冲液稀释以测定游离RNA。通过利用用于制备组合物的起始RNA溶液制备标准曲线,并在1×TE缓冲液+/-0.2%Triton-X 100中稀释。然后将稀释的染料(根据制造商的说明)添加到标准品和样品中的每一个中,并允许在室温下在无光的情况下温育大约10分钟。使用SpectraMax M5酶标仪(分子装置)读取样品,其中激发、自动截止和发射波长分别设置为488nm、515nm和525nm。根据适当的标准曲线测定总RNA和游离RNA。
包封效率计算为(总RNA-游离RNA)/总RNA。相同的程序可以用于测定基于DNA的货物组分的包封效率。在基于荧光的测定中,对于单链DNA,可以使用Oligreen染料,对于双链DNA,可以使用Picogreen染料。可替代地,所述总RNA浓度可以通过反相离子配对(RP-IP)HPLC方法测定。Triton X-100用于分裂所述LNP,从而释放所述RNA。然后通过RP-IP HPLC色谱法将RNA与脂质组分分离,并使用260nm处的UV吸光度对标准曲线进行定量。
AF4-MALS用于查看分子量和尺寸分布以及从这些计算得出的次级统计数据。适当稀释LNP,并且使用HPLC自动进样器注入到AF4分离通道中,在所述通道中聚焦所述LNP,并且然后通过通道交叉流的指数梯度进行洗脱。所有流体均由HPLC泵和Wyatt Eclipse仪器驱动。从AF4通道洗脱的颗粒流经紫外检测器、多角度光散射检测器、准弹性光散射检测器和示差折光率检测器。通过使用Debeye模型处理原始数据,以根据检测器信号测定分子量和rms半径。
LNP中的脂质组分通过与带电气溶胶检测器(CAD)耦合的HPLC进行定量分析。4种脂质组分的色谱分离是通过反相HPLC实现的。CAD是一种基于质量的破坏性检测器,所述检测器可以检测所有非挥发性化合物,并且无论分析物结构如何,信号都是一致的。
mRNA和gRNA产生
使用线性化质粒DNA模板和T7 RNA聚合酶,通过体外转录产生加帽和聚腺苷酸化mRNA。通常,含有T7启动子和介于90-100nt之间的poly(A/T)区的质粒DNA通过在37℃下与XbaI一起温育至完成而线性化。线性化质粒从酶和缓冲盐中纯化。产生经Cas9修饰的mRNA的IVT反应通过在以下条件下在37℃下温育持续1.5或2小时进行:50ng/μL线性化质粒;GTP、ATP、CTP和N1-甲基假-UTP(Trilink)中的每一种各5mM;25mM ARCA(Trilink);5U/μLT7 RNA聚合酶;1U/μL鼠类RNase抑制剂;0.004U/μL无机大肠杆菌焦磷酸酶;以及1×反应缓冲液。然后添加TURBO DNase(赛默飞世尔科技公司)以去除DNA模板。
根据制造商的方案,使用RNeasy Maxi试剂盒(凯杰公司(Qiagen))从酶和核苷酸中纯化mRNA。交替地,根据制造商的方案,使用MEGAclear试剂盒(英杰公司(Invitrogen))纯化mRNA。可替代地,使用LiCl沉淀、乙酸铵沉淀和乙酸钠沉淀纯化mRNA。可替代地,用LiCl沉淀纯化mRNA,随后通过切向流过滤进一步纯化。可替代地,通过LiCl沉淀结合切向流过滤纯化RNA。通过测量260nm(纳米滴(Nanodrop))处的吸光度来测定转录物浓度,并通过借助于片段分析仪(安捷伦(Agilent))的毛细管电泳来分析转录物。
所述sgRNA是通过已知方法使用亚磷酰胺化学合成的。
Cas9 mRNA和向导RNA在体外递送到原代肝细胞
将原代小鼠肝细胞(PMH)和原代cyno肝细胞(PCH)解冻,并重新悬浮于具有补充剂的肝细胞解冻培养基(英杰公司,目录CM7000)中,随后进行离心。丢弃上清液,并且将沉淀的细胞重新悬浮于William培养基E(Gibco(吉博公司),目录A12176)平板培养基加上补充剂包(吉博公司,目录A15563)和5%FBS(吉博公司)中。对细胞进行计数并以50,000个细胞/孔的PCH密度和15,000个细胞/孔的PMH密度平板接种于生物涂层胶原蛋白I涂覆的96孔板(赛默飞世尔科技公司,目录877272)上。使平板接种的细胞在37℃和5%CO2气氛下在组织温育箱中沉淀和粘附持续5小时。温育后,检查细胞是否形成单层,并且然后用具有细胞维持补充剂(吉博公司,目录A15564)的William培养基E洗涤三次,并在37℃温育箱中温育。
每孔分别使用0.6或0.3ul的MessengerMAX,用200ng的mRNA转染PMH和PCH。根据制造商的方案(赛默飞世尔科技公司,目录号LMRN003)进行转染。在处理后6、24和48小时收集培养基以测定hA1AT表达。
使用50μL/孔BuccalAmp DNA提取溶液(Epicentre,目录QE09050)从96孔板中的每个孔中提取基因组DNA。如本文所述,使所有DNA样品经受PCR和后续NGS分析。
LNP在体内的递送
在每项研究中使用范围为6-10周龄的CD-1雌性小鼠。根据体重对动物进行称重和分组,以制备基于组平均重量的给药溶液。以每只动物0.2mL的量(每千克体重大约10mL)通过侧尾静脉给药LNP。在第6天或第7天,在异氟醚麻醉下通过心脏穿刺放血对动物实施安乐死。如果需要,将血液收集到血清分离管中或收集到如本文所述的含有用于血浆的缓冲柠檬酸钠的管中。对于涉及体内编辑或蛋白质水平测量的研究,从每只动物身上收集肝脏组织以进行DNA或蛋白质提取和分析。通过下一代测序(NGS)测量小鼠队列的肝脏编辑。对于Cas9蛋白分析,使用1×完整蛋白酶抑制剂片剂(罗氏公司(Roche)),目录11836170001)通过珠磨机使大约30-80mg肝脏组织在RIPA缓冲液(Boston生物产物BP-115)中均质化。
NGS测序
简而言之,为了定量地测定基因组中靶位置的编辑效率,分离基因组DNA并利用深度测序来鉴别通过基因编辑引入的插入和缺失的存在。
在靶位点(例如,TTR)周围设计PCR引物,并扩增所关注的基因组区。引物序列如下所示。根据制造商的方案(Illumina)执行另外的PCR以添加所需的化学物质进行测序。在Illumina MiSeq仪器上对扩增子进行测序。在消除具有低质量评分的读段后,将读段与参考基因组(例如,mm10)进行比对。将含有读段的所得文件映射到参考基因组(BAM文件),其中选择与所关注的靶区重叠的读段,并且计算野生型读段数相对于含有插入、取代或缺失的读段数。
将编辑百分比(例如,“编辑效率编辑百分比”)定义为具有插入或缺失的序列读段的总数占序列读段的总数(包含野生型)。
Cas9蛋白测量
通过ELISA测定确定Cas9蛋白水平。简而言之,总蛋白质浓度任选地通过二辛可宁酸测定确定。根据制造商的方案,使用Cas9小鼠抗体(傲锐东源公司(Origene),目录CF811179)作为捕获抗体并且使用Cas9(7A9-3A3)小鼠mAb(细胞信号传导技术公司(CellSignaling Technology),目录14697)作为检测抗体来制备MSD GOLD 96孔链霉亲和素SECTOR板(美索规模发现公司(Meso Scale Diagnostics),目录L15SA-1)。重组Cas9蛋白用作稀释剂39(美索规模发现公司)中的校准标准品,所述校准标准品具有1X HaltTM不含EDTA的蛋白酶抑制剂混合物(赛默飞世尔科技公司,目录78437)。使用Meso Quickplex SQ120仪器(美索规模发现公司)读取ELISA板,并且使用Discovery Workbench 4.0软件包(美索规模发现公司)分析数据。
血清TTR测量
使用小鼠前白蛋白(转甲状腺素蛋白)ELISA试剂盒(奥维亚系统生物公司(AvivaSystems Biology),目录OKIA00111)测定小鼠TTR血清总水平。简而言之,用试剂盒样品稀释剂连续稀释血清达到0.1mpk剂量的10,000倍和0.3mpk的2,500倍的最终稀释度。然后将经稀释的样品添加到ELISA板中,并且然后根据指示进行测定。
人α1-抗胰蛋白酶(hA1AT)测量
从体外研究的培养基中测量人hA1AT水平。根据制造商的方案,使用α1-抗胰蛋白酶ELISA试剂盒(人)(奥维亚系统生物公司,目录号OKIA00048)测定人α1-抗胰蛋白酶总水平。血清hA1AT水平使用4参数逻辑拟合的标准曲线进行定量,并以μg/mL的血清表示。
实例2-体外Cas9表达的表征
如表8所述,使用不同密码子方案的Cas9序列被设计用于测试经改进的蛋白质表达。具体地,测试分别包括SEQ ID No.5、6、7、8、9、10、11、12、13和14的ORF的SEQ ID No:3和SEQ ID NO:15、16、17、18、19、20、21、22、23和24。
通过将mRNA转染到HepG2细胞中并通过ELISA测量Cas9蛋白表达水平来在体外评估翻译效率。使用LipofectamineTMMessengerMAXTM转染试剂(赛默飞世尔科技公司),用800ng的每种Cas9 mRNA转染HepG2细胞。转染后,通过冻融裂解细胞并通过离心清除。
转染后两、六或二十四小时,通过冻融裂解细胞并通过离心清除。使用实例1中所述的美索规模发现公司ELISA测定测量这些样品中的Cas9蛋白表达。表12和图1示出了不同密码子方案对Cas9蛋白表达的影响。
表12.具有不同密码子集合的ORF的体外表达:
实例3-体内Cas9表达的表征
为了测定密码子方案在体内的有效性,当使用表8中所述的密码子方案由对Cas9进行编码的mRNA在体内表达时,测量Cas9蛋白表达。信使RNA以经化学修饰的sgRNA:Cas9mRNA的1:2w/w比率产生和调配,如实例1所述。所述LNP含有靶向TTR的向导RNA(G000502;SEQ ID NO:4)。CD-1雌性小鼠(每组n=5只)以0.3mpk静脉内给药。给药后3小时,处死动物,收集肝脏。使用实例1中所述的美索规模发现公司ELISA测定测量肝脏中的Cas9蛋白表达。表13和图2示出了Cas9在肝脏中的表达结果。Cas9 mRNA SEQ ID NO:18和20示出了被测ORF的最高Cas9表达,并且与其它被测ORF(SEQ ID NO:3)相比,表达有所改进。SEQ ID NO:23和24的ORF的Cas9蛋白表达低于定量下限(LLOQ)。
表13.Cas 9蛋白在肝脏中的表达
实例4-Cas9蛋白在体内表达的时间进程
在施用后的不同时间评估来自SEQ ID NO:18和SEQ ID No.20的Cas9蛋白表达的持久性。信使RNA以经化学修饰的sgRNA:Cas9 mRNA的1:2w/w比率产生和调配,如实例1所述。所述LNP含有靶向TTR的向导RNA(G000502;SEQ ID NO:4)。所述CD-1雌性小鼠(每组n=5只或n=4只,表14)以0.3mpk静脉内给药。给药后一、三和六小时,处死动物,收集肝脏。使用实例1中所述的美索规模发现公司ELISA测定测量肝脏样品中的Cas9蛋白表达。表14和图3示出了Cas9在肝脏中的表达结果。SEQ ID No.20示出在转染后3小时和6小时被测ORF的最高Cas9表达,并且与其它被测Cas9 ORF相比表达有所改进。
表14.Cas9蛋白在体内表达的时间进程
实例5-Cas9蛋白在体内表达的剂量反应
为了测定SEQ ID No.18和SEQ ID No.20的编辑效率,进行体内剂量反应实验。信使RNA以经化学修饰的sgRNA:Cas9 mRNA的1:2w/w比率产生和调配,如实例1所述。所述LNP含有靶向TTR的向导RNA(G000502;SEQ ID NO:4)。CD-1雌性小鼠(每组n=5只)以0.03、0.1或0.3mpk静脉内给药。在给药后6天,处死动物,并且收集血液和肝脏。测量了血清TTR和肝脏编辑。表15和图4A示出了体内编辑结果。表15和图4B示出了血清TTR水平。
表15-Cas9蛋白在体内表达的剂量反应
实例6-体外hSERPINA1 mRNA表达的表征
通过转染测试各种密码子优化的hSERPINA1 mRNA在肝细胞中的蛋白表达水平。通过体外转录产生加帽和聚腺苷酸化密码子优化的SERPINA1 mRNA。如实例1所述,使质粒DNA模板线性化。产生mRNA的IVT反应通过在以下条件下在37℃下温育持续4小时进行:50ng/μL线性化质粒;GTP、ATP、CTP和N1-甲基假-UTP中的每一种各5mM;25mM ARCA(Trilink);7.5U/μL T7 RNA聚合酶(罗氏公司);1U/μL鼠类RNase抑制剂(罗氏公司);0.004U/μL无机大肠杆菌焦磷酸酶(罗氏公司);以及1×反应缓冲液。添加TURBO DNase(赛默飞世尔科技公司)到最终浓度为0.01U/μL,并且使反应温育另外的30分钟以去除DNA模板。
使用LiCl沉淀、乙酸铵沉淀和乙酸钠沉淀从酶和核苷酸中纯化信使RNA。通过测量260nm(纳米滴)处的吸光度来测定转录物浓度,并通过借助于生物分析仪(安捷伦)的毛细管电泳来分析转录物。
如实例1所述培养原代小鼠肝细胞(PMH)和原代cyno肝细胞(PCH)。每孔使用0.6或0.3ul的MessengerMAX,用200ng的mRNA转染PMH和PCH。根据制造商的方案(赛默飞世尔科技公司,目录号LMRN003)进行转染。如表16和17所示,在处理后时间点收集培养基以测定hA1AT表达。
图5A和表16(PMH)以及图5B和表17(PCH)中示出了本实验中密码子优化的hSERPINA1的hA1AT表达水平。SEQ ID NO:76、77、78、79和80的转录物分别含有SEQ ID NO:70、69、71、72和73的SERPINA1 ORF。
表16.原代小鼠肝细胞中的hA1AT表达
表17.原代Cyno肝细胞中的hA1AT表达
实例7-Cas9在原代人肝细胞中表达的表征
如表8所述,使用不同密码子方案的Cas9序列被设计用于测试经改进的蛋白质表达。具体地,与具有SEQ ID NO:3的序列的mRNA相比,测试了具有SEQ ID NO:193和194的序列的mRNA,所述mRNA含有根据SEQ ID NO:29和46的ORF。
通过将mRNA转染到原代人肝细胞中并通过ELISA测量Cas9蛋白表达水平在体外评估翻译效率。按照标准方案培养原代人肝脏肝细胞(PHH)(赛默飞世尔科技公司)。简言之,将细胞解冻并重新悬浮于肝细胞解冻培养基(赛默飞世尔科技公司,目录CM7000)中,随后以100g离心10分钟。丢弃上清液,并且将沉淀的细胞重新悬浮于肝细胞平板接种培养基加补充剂包(英杰公司,目录A1217601和CM3000)中。对细胞进行计数并以30,000-35,000个细胞/孔的密度平板接种于生物涂层胶原蛋白I涂覆的96孔板(赛默飞世尔科技公司,目录877272)上。使平板接种的细胞在37℃和5%CO2气氛下在组织温育箱中沉淀和粘附持续4到6小时。温育后,检查细胞是否形成单层。然后用肝细胞维持培养基/具有无血清补充剂包(英杰公司,目录A1217601和CM4000)的培养基洗涤细胞,并且然后将新鲜肝细胞维持培养基添加到细胞上。
在平板接种后24小时,使用Lipofectamine RNAiMAX(飞世尔科技公司,目录13778500),用150ng每种Cas9 mRNA转染PHH细胞。六小时转染后,通过冻融裂解细胞并通过离心清除。使用实例1中所述的美索规模发现公司ELISA测定测量这些样品中的Cas9蛋白表达。在清除的PHH细胞裂解物中稀释重组Cas9蛋白以产生标准曲线。表18和图6示出了不同密码子方案对Cas9蛋白表达的影响。
表18-来自具有不同密码子组的ORF的Cas9蛋白的体外表达
实例8-具有各种UTR的Cas9表达的表征
如表19A-B所述,结合各种3'UTR测定选择的Cas9 ORF的蛋白质表达。通过如实例7所示将mRNA转染到原代人肝细胞中并如实例1所示通过ELISA测量Cas9蛋白表达水平在体外评估翻译效率。表19A-B和图7A-B示出了Cas9蛋白表达结果。
表19A-具有不同3'UTR的Cas9蛋白的体外表达
*此mRNA的ORF是SEQ ID No.3的Cas9 ORF
表19B-具有不同3'UTR的Cas9蛋白的体外表达
*此mRNA的ORF是SEQ ID No.3的Cas9 ORF
序列表
以下序列表提供了本文公开的序列列表。应理解的是,如果DNA序列(包括Ts)是相对于RNA引用的,那么Ts应被Us替换(可以根据上下文修改或不修改),反之亦然。*=PS连接;‘m’=2'-O-Me核苷酸。对于ORF描述,BP=I-对耗竭的;GP=E-对富集的;BS=I-单独耗竭的;GS=E-单独富集的;GCU=经受使尿苷最小化、使重复序列最小化和使GC含量最大化的步骤。E-对、I-对、E-单独和I-单独分别指表1-4中的密码子对或密码子。
Claims (81)
1.一种多核苷酸,其包括:(i)对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对;或者(ii)对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少1%的密码子对是表1中所示的密码子对,并且所述ORF不对RNA引导的DNA结合剂进行编码。
2.一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF包括与SEQID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或132-143中的任一个具有至少95%同一性的序列,任选地其中在不考虑所述ORF的起始密码子和终止密码子的情况下测定同一性。
3.一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF中至少75%、80%、85%、90%、95%、98%、99%或100%的密码子是(i)表5中列出的密码子或(ii)表6中列出的密码子,并且其中所述多肽不是RNA引导的DNA结合剂。
4.根据权利要求1到3中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.3%。
5.根据权利要求1到4中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于55%。
6.一种多核苷酸,其包括对多肽进行编码的开放阅读框(ORF),其中所述ORF的重复序列含量小于或等于23.3%,并且所述ORF的GC含量大于或等于55%。
7.根据权利要求2到6中任一项所述的多核苷酸,其中所述ORF中至少1.03%的密码子对是表1中所示的密码子对。
8.根据权利要求1到7中任一项所述的多核苷酸,其中所述ORF中小于或等于0.9%的密码子对是表2中所示的密码子对。
9.根据权利要求1到8中任一项所述的多核苷酸,其中所述ORF中至少60%、65%、70%或75%的密码子是表3中所示的密码子。
10.根据权利要求1到9中任一项所述的多核苷酸,其中所述ORF中小于或等于20%的密码子是表4中所示的密码子。
11.根据权利要求1到10中任一项所述的多核苷酸,其中所述ORF中至少1.05%的密码子对是表1中所示的密码子对。
12.根据权利要求1到11中任一项所述的多核苷酸,其中所述ORF中小于或等于10%的密码子对是表1中所示的密码子对。
13.根据权利要求1到12中任一项所述的多核苷酸,其中所述ORF中小于或等于0.9%的密码子对是表2中所示的密码子对。
14.根据权利要求1到13中任一项所述的多核苷酸,其中所述ORF的GC含量大于或等于56%。
15.根据权利要求1到14中任一项所述的多核苷酸,其中所述ORF的GC含量小于或等于63%。
16.根据权利要求1到15中任一项所述的多核苷酸,其中所述ORF的重复序列含量小于或等于23.2%。
17.根据权利要求1到16中任一项所述的多核苷酸,其中所述ORF的重复序列含量大于或等于20%。
18.根据权利要求1到17中任一项所述的多核苷酸,其中所述ORF中小于或等于15%的密码子是表4中所示的密码子。
19.根据权利要求1到18中任一项所述的多核苷酸,其中所述ORF中至少76%的密码子是表3中所示的密码子。
20.根据权利要求1到19中任一项所述的多核苷酸,其中所述ORF中小于或等于87%的密码子是表3中所示的密码子。
21.根据权利要求1到20中任一项所述的多核苷酸,其中所述ORF的尿苷含量的范围为所述ORF的最低尿苷含量到所述最低尿苷含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
22.根据权利要求1到21中任一项所述的多核苷酸,其中所述ORF的A+U含量的范围为所述ORF的最低A+U含量到所述最低A+U含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
23.根据权利要求1到22中任一项所述的多核苷酸,其中所述ORF的GC含量的范围为55%-65%,如55%-57%、57%-59%、59-61%、61-63%或63-65%。
24.根据权利要求1到23中任一项所述的多核苷酸,其中所述ORF的重复序列含量的范围为所述ORF的最低重复序列含量到所述最低重复序列含量的101%、102%、103%、105%、110%、115%、120%、125%、130%、135%、140%、145%或150%。
25.根据权利要求1到24中任一项所述的多核苷酸,其中所述ORF的重复序列含量为22%-27%,如22%-23%、22.3%-23%、23%-24%、24%-25%、25%-26%或26%-27%。
26.根据权利要求1到25中任一项所述的多核苷酸,其中所述多肽的长度为30个氨基酸,任选地其中所述多肽的长度为至少50个氨基酸。
27.根据权利要求1到26中任一项所述的多核苷酸,其中所述多肽的长度为至少100个氨基酸。
28.根据权利要求1到27中任一项所述的多核苷酸,其中所述多肽的长度小于或等于5000个氨基酸。
29.根据权利要求1到28中任一项所述的多核苷酸,其中所述多肽包括与SEQ ID NO:6-10、29、46、69-73、90-93、96-99、102-105、108-111、114-117、120-123、126-129或134-143中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
30.根据权利要求1到29中任一项所述的多核苷酸,其中所述多核苷酸包括与SEQ IDNO:16-20、78-80、194-197或200-201中的任一个具有至少90%、95%、96%、97%、98%、99%、99.5%或100%同一性的序列。
31.根据权利要求1到30中任一项所述的多核苷酸,其中所述ORF对RNA引导的DNA结合剂进行编码。
32.根据权利要求31所述的多核苷酸,其中所述RNA引导的DNA结合剂具有双链核酸内切酶活性。
33.根据权利要求31所述的多核苷酸,其中所述RNA引导的DNA结合剂具有切口酶活性。
34.根据权利要求31所述的多核苷酸,其中所述RNA引导的DNA结合剂包括dCas DNA结合结构域。
35.根据权利要求1到34中任一项所述的多核苷酸,其中所述ORF对酿脓链球菌(S.pyogenes)Cas9进行编码。
36.根据权利要求1到35中任一项所述的多核苷酸,其中所述ORF对核酸内切酶进行编码。
37.根据权利要求1到36中任一项所述的多核苷酸,其中所述ORF对丝氨酸蛋白酶抑制剂或Serpin家族成员进行编码,任选地其中所述ORF对Serpin家族A成员1进行编码。
38.根据权利要求1到37中任一项所述的多核苷酸,其中所述ORF对以下进行编码:羟化酶;氨甲酰转移酶;葡糖神经酰胺酶;半乳糖苷酶;脱氢酶;受体;或神经递质受体。
39.根据权利要求1到38中任一项所述的多核苷酸,其中所述ORF对以下进行编码:苯丙氨酸羟化酶;鸟氨酸氨甲酰转移酶;延胡索酰乙酰乙酸水解酶;葡糖神经酰胺酶β;α-半乳糖苷酶;运甲状腺素蛋白;甘油醛-3-磷酸脱氢酶;γ-氨基丁酸(GABA)受体亚基(如GABA A型受体δ亚基)。
40.根据权利要求1到39中任一项所述的多核苷酸,其中所述多核苷酸进一步包括与SEQ ID NO:177-181或190-192中的任一个具有至少90%同一性的5'UTR;和/或与SEQ IDNO:182-186或202-204中的任一个具有至少90%同一性的3'UTR。
41.根据权利要求1到40中任一项所述的多核苷酸,其中所述多核苷酸进一步包括选自帽0、帽1和帽2的5'帽。
42.根据权利要求1到41中任一项所述的多核苷酸,其中所述开放阅读框具有增加所述多核苷酸在哺乳动物中的翻译的密码子。
43.根据权利要求1到42中任一项所述的多核苷酸,其中经编码的多肽包括核定位信号(NLS)。
44.根据权利要求43所述的多核苷酸,其中所述NLS包括与SEQ ID NO:163-176中的任一个具有至少80%、85%、90%或95%同一性的序列。
45.根据权利要求1到44中任一项所述的多核苷酸,其中所述多肽对RNA引导的DNA结合剂进行编码,并且所述RNA引导的DNA结合剂进一步包括异源功能结构域。
46.根据权利要求1到45中任一项所述的多核苷酸,其中至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、至少98%、至少99%或100%的所述尿苷被经修饰的尿苷取代,任选地其中所述经修饰的尿苷是以下中的一种或多种:N1-甲基假尿苷、假尿苷、5-甲氧基尿苷或5-碘尿苷。
47.根据权利要求46所述的多核苷酸,其中15%到45%、45%到55%、55%到65%、65%到75%、75%到85%、85%到95%或90%到100%的所述尿苷被所述经修饰的尿苷取代,任选地其中所述经修饰的尿苷为N1-甲基假尿苷。
48.根据权利要求1到47中任一项所述的多核苷酸,其中所述多核苷酸是mRNA。
49.根据权利要求1到48中任一项所述的多核苷酸,其中所述多核苷酸是表达构建体,所述表达构建体包括可操作地连接到所述ORF的启动子。
50.一种质粒,其包括根据权利要求49所述的表达构建体。
51.一种宿主细胞,其包括根据权利要求49所述的表达构建体或根据权利要求50所述的质粒。
52.一种制备mRNA的方法,所述方法包括在允许所述mRNA转录的条件下使根据权利要求49所述的表达构建体或根据权利要求50所述的质粒与RNA聚合酶接触,任选地其中所述接触步骤在体外进行。
53.一种表达多肽的方法,所述方法包括使细胞与根据权利要求1到49中任一项所述的多核苷酸接触。
54.根据权利要求53所述的方法,其中所述细胞在哺乳动物受试者中,任选地其中所述受试者是人。
55.根据权利要求53所述的方法,其中所述细胞是培养细胞和/或所述接触在体外进行。
56.根据权利要求53到55中任一项所述的方法,其中所述细胞是人细胞。
57.一种组合物,其包括根据权利要求1到49中任一项所述的多核苷酸以及至少一种向导RNA,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
58.一种脂质纳米颗粒,其包括根据权利要求1到49中任一项所述的多核苷酸。
59.一种药物组合物,其包括根据权利要求1到49中任一项所述的多核苷酸以及药学上可接受的载剂。
60.根据权利要求58所述的脂质纳米颗粒或根据权利要求59所述的药物组合物,其中所述多核苷酸对RNA引导的DNA结合剂进行编码,并且所述脂质纳米颗粒或所述药物组合物进一步包括至少一种向导RNA。
61.一种对靶基因进行基因组编辑或修饰的方法,所述方法包括使细胞与根据权利要求1到49或57到60中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒接触,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
62.一种根据权利要求1到49或57到60中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒的用途,其用于对靶基因进行基因组编辑或修饰,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
63.一种根据权利要求1到49或57到60中任一项所述的多核苷酸、表达构建体、组合物或脂质纳米颗粒的用途,其用于制备用于对靶基因进行基因组编辑或修饰的药物,其中所述多核苷酸对RNA引导的DNA结合剂进行编码。
64.根据权利要求61到63中任一项所述的方法或用途,其中所述靶基因的所述基因组编辑或修饰发生在肝脏细胞中,任选地其中所述肝脏细胞是肝细胞。
65.一种产生对多肽进行编码的开放阅读框(ORF)序列的方法,所述方法包括:
a)提供所关注的多肽序列;
b)为所述多肽序列的每个氨基酸位置指配密码子,其中如果所述氨基酸位置是表1中所示的二肽的成员,那么使用所述二肽的密码子对,但如果所述氨基酸位置是表1中所示的多于一个二肽的成员并且这些二肽的密码子对为所述位置提供不同的密码子,或者所述氨基酸位置不是表1中所示的二肽的成员,那么执行以下中的一项或多项:
i.如果对天然存在的多肽进行编码,则从对所述多肽进行编码的野生型序列中选择密码子;
ii.如果所述氨基酸是表1中所示的多于一种二肽的成员,并且那些二肽的密码子对为所述位置提供不同的密码子,则消除表4中出现和/或将导致表2中所示的密码子对存在的密码子,和/或选择表3中出现的密码子;
iii.使用表5、6或7的密码子集合向所述氨基酸位置供应所述密码子,任选地其中如果执行步骤(i)和/或(ii),那么在尚未提供所述氨基酸位置的独特密码子的情况下执行步骤(iii);和/或
iv.选择以下密码子:(1)使尿苷含量最小化的密码子;(2)使重复序列含量最小化的密码子;和/或(3)使GC含量最大化的密码子。
66.根据权利要求65所述的方法,其中对于至少一个氨基酸,表1未提供给定氨基酸位置处的独特密码子,任选地其中(1)重叠二肽中存在冲突密码子;(2)存在对应于给定二肽的多个可能的密码子;或者(3)没有对应于给定二肽的密码子。
67.根据权利要求65或66所述的方法,其中步骤(b)(ii)包括执行以下中的一项或多项:
a.选择表3中出现的密码子;和/或
b.消除将导致表2中存在密码子对的密码子和/或出现在表4中的密码子,
其中以任何顺序执行上述步骤中的一个或多个步骤,并且当提供所述氨基酸的单个密码子时,终止所述步骤。
68.根据权利要求65到67中任一项所述的方法,其中步骤(b)(ii)包括选择出现在表3中的密码子,任选地其中如果执行权利要求234的一个或多个步骤,则权利要求234的所述一个或多个步骤以相对于选择出现在表3中的密码子的任何顺序执行。
69.根据权利要求65到68中任一项所述的方法,其中步骤(b)(ii)进一步包括:
a.消除将导致表2中存在密码子对的密码子;以及
b.如果在步骤(a)之后仍保留多于一个可能的密码子,则消除未出现在表3中的密码子和/或消除出现在表4中的密码子。
70.根据权利要求65到69中任一项所述的方法,其中步骤(b)(ii)进一步包括:
a.消除未出现在表3中的密码子和/或消除出现在表4中的密码子;以及
b.如果在步骤(a)之后仍保留多于一个可能的密码子,则消除将导致表2中存在密码子对的密码子。
71.根据权利要求65到70中任一项所述的方法,其中步骤(b)包括执行以下中的一项或多项:
a.选择所述使尿苷含量最小化的密码子;
b.选择所述使重复序列含量最小化的密码子;
c.选择所述使GC含量最大化的密码子;
其中以任何顺序执行上述步骤中的一个或多个步骤,任选地其中当提供所述氨基酸的单个密码子时,终止所述步骤。
72.根据权利要求71所述的方法,其中步骤(b)包括执行以下中的至少一项并继续执行以下步骤,任选地其中执行以下步骤(i)-(iii)中的每个步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(a)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(b)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
73.根据权利要求65到72中任一项所述的方法,其中在对至少一个可由多于一个密码子编码的位置执行步骤(b)(ii)之后没有密码子,并且对在所述位置处对所述氨基酸进行编码的多个密码子执行以下步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(i)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(ii)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
74.根据权利要求65到73中任一项所述的方法,其中在对至少一个可由多于一个密码子编码的位置执行步骤(b)(ii)之后保留多个密码子,并且对所述多个密码子执行以下步骤:
i.选择所述使尿苷含量最小化的密码子;
ii.如果在步骤(i)之后仍保留多于一个可能的密码子,则选择所述使重复序列含量最小化的密码子;
iii.如果在步骤(ii)之后仍保留多于一个可能的密码子,则选择所述使GC含量最大化的密码子。
75.根据权利要求73或74所述的方法,其中所述方法包括选择在至少一个位置处所述使GC含量最大化的密码子。
76.根据权利要求65到75中任一项所述的方法,其进一步包括选择表5、6或7中所示的一对一密码子集合,并为来自所述集合的至少一个位置指配密码子。
77.根据权利要求65到76中任一项所述的方法,其进一步包括:
a.为由至少一个位置编码的所述氨基酸生成所有可用密码子的集合;
b.应用权利要求233到243所述的步骤中的一个或多个步骤。
78.根据权利要求65到77中任一项所述的方法,其中所述方法的至少步骤(b)是计算机实施的。
79.根据权利要求65到78中任一项所述的方法,其进一步包括合成包括所述ORF的多核苷酸,任选地其中所述多核苷酸是mRNA。
80.根据权利要求65到79中任一项所述的方法,其中所述RNA引导的DNA结合剂具有双链核酸内切酶活性。
81.根据权利要求65到80中任一项所述的方法,其中所述ORF对多肽进行编码,所述多肽与SEQ ID NO:1、74、88、94、100、106、112、118、124、130、161或162中的任一个的氨基酸序列具有至少90%同一性。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201962825656P | 2019-03-28 | 2019-03-28 | |
US62/825,656 | 2019-03-28 | ||
PCT/US2020/025372 WO2020198641A2 (en) | 2019-03-28 | 2020-03-27 | Polynucleotides, compositions, and methods for polypeptide expression |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113993994A true CN113993994A (zh) | 2022-01-28 |
Family
ID=70416544
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080035742.1A Pending CN113993994A (zh) | 2019-03-28 | 2020-03-27 | 用于多肽表达的多核苷酸、组合物和方法 |
Country Status (16)
Country | Link |
---|---|
US (1) | US20230012687A1 (zh) |
EP (1) | EP3947670A2 (zh) |
JP (1) | JP2022527302A (zh) |
KR (1) | KR20220004649A (zh) |
CN (1) | CN113993994A (zh) |
AU (1) | AU2020248470A1 (zh) |
BR (1) | BR112021019224A2 (zh) |
CA (1) | CA3135172A1 (zh) |
CO (1) | CO2021014400A2 (zh) |
EA (1) | EA202192637A1 (zh) |
IL (1) | IL286579A (zh) |
MA (1) | MA55527A (zh) |
MX (1) | MX2021011757A (zh) |
SG (1) | SG11202110135YA (zh) |
TW (1) | TW202102529A (zh) |
WO (1) | WO2020198641A2 (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3714047A2 (en) | 2017-11-22 | 2020-09-30 | ModernaTX, Inc. | Polynucleotides encoding phenylalanine hydroxylase for the treatment of phenylketonuria |
AU2022382975A1 (en) | 2021-11-03 | 2024-05-02 | Intellia Therapeutics, Inc. | Polynucleotides, compositions, and methods for genome editing |
WO2023133525A1 (en) * | 2022-01-07 | 2023-07-13 | Precision Biosciences, Inc. | Optimized polynucleotides for protein expression |
WO2023154749A2 (en) * | 2022-02-09 | 2023-08-17 | The Regents Of The University Of California | In vitro and in vivo protein translation via in situ circularized rnas |
WO2024044697A2 (en) * | 2022-08-24 | 2024-02-29 | Walking Fish Therapeutics, Inc. | Compositions and methods for treatment of fabry disease |
Family Cites Families (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5585481A (en) | 1987-09-21 | 1996-12-17 | Gen-Probe Incorporated | Linking reagents for nucleotide probes |
US5378825A (en) | 1990-07-27 | 1995-01-03 | Isis Pharmaceuticals, Inc. | Backbone modified oligonucleotide analogs |
EP1695979B1 (en) | 1991-12-24 | 2011-07-06 | Isis Pharmaceuticals, Inc. | Gapped modified oligonucleotides |
JPH10500310A (ja) | 1994-05-19 | 1998-01-13 | ダコ アクティーゼルスカブ | 淋菌及びトラコーマ クラミジアの検出のためのpna プローブ |
WO2006007712A1 (en) | 2004-07-19 | 2006-01-26 | Protiva Biotherapeutics, Inc. | Methods comprising polyethylene glycol-lipid conjugates for delivery of therapeutic agents |
ES2534282T3 (es) * | 2006-06-29 | 2015-04-21 | Dsm Ip Assets B.V. | Un método para lograr la expresión polipeptídica mejorada |
DK2931898T3 (en) | 2012-12-12 | 2016-06-20 | Massachusetts Inst Technology | CONSTRUCTION AND OPTIMIZATION OF SYSTEMS, PROCEDURES AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH FUNCTIONAL DOMAINS |
US20140310830A1 (en) | 2012-12-12 | 2014-10-16 | Feng Zhang | CRISPR-Cas Nickase Systems, Methods And Compositions For Sequence Manipulation in Eukaryotes |
MY170059A (en) | 2012-12-17 | 2019-07-02 | Harvard College | Rna-guided human genome engineering |
CN105164102B (zh) | 2013-03-08 | 2017-12-15 | 诺华股份有限公司 | 用于传递活性成分的脂质和脂质组合物 |
US9840699B2 (en) | 2013-12-12 | 2017-12-12 | President And Fellows Of Harvard College | Methods for nucleic acid editing |
PT3083556T (pt) | 2013-12-19 | 2020-03-05 | Novartis Ag | Lípidos e composições lipídicas para a entrega de agentes ativos |
EP4223285A3 (en) | 2014-07-16 | 2023-11-22 | Novartis AG | Method of encapsulating a nucleic acid in a lipid nanoparticle host |
US9944912B2 (en) | 2015-03-03 | 2018-04-17 | The General Hospital Corporation | Engineered CRISPR-Cas9 nucleases with altered PAM specificity |
CN108366604A (zh) | 2015-09-21 | 2018-08-03 | 垂林克生物技术公司 | 用于合成5’-加帽rna的组合物和方法 |
US20210206818A1 (en) * | 2016-01-22 | 2021-07-08 | Modernatx, Inc. | Messenger ribonucleic acids for the production of intracellular binding polypeptides and methods of use thereof |
CN117731805A (zh) | 2016-03-30 | 2024-03-22 | 因特利亚治疗公司 | 用于crispr/cas成分的脂质纳米颗粒制剂 |
EP3516056A1 (en) * | 2016-09-23 | 2019-07-31 | DSM IP Assets B.V. | A guide-rna expression system for a host cell |
WO2018067447A1 (en) | 2016-10-03 | 2018-04-12 | Itellia Therapeutics, Inc. | Improved methods for identifying double strand break sites |
KR20200058508A (ko) * | 2017-09-29 | 2020-05-27 | 인텔리아 테라퓨틱스, 인크. | 게놈 편집을 위한 폴리뉴클레오티드, 조성물 및 방법 |
-
2020
- 2020-03-27 MA MA055527A patent/MA55527A/fr unknown
- 2020-03-27 AU AU2020248470A patent/AU2020248470A1/en active Pending
- 2020-03-27 SG SG11202110135YA patent/SG11202110135YA/en unknown
- 2020-03-27 CA CA3135172A patent/CA3135172A1/en active Pending
- 2020-03-27 WO PCT/US2020/025372 patent/WO2020198641A2/en active Application Filing
- 2020-03-27 MX MX2021011757A patent/MX2021011757A/es unknown
- 2020-03-27 KR KR1020217035006A patent/KR20220004649A/ko unknown
- 2020-03-27 JP JP2021557641A patent/JP2022527302A/ja active Pending
- 2020-03-27 CN CN202080035742.1A patent/CN113993994A/zh active Pending
- 2020-03-27 EA EA202192637A patent/EA202192637A1/ru unknown
- 2020-03-27 EP EP20721030.3A patent/EP3947670A2/en active Pending
- 2020-03-27 BR BR112021019224A patent/BR112021019224A2/pt unknown
- 2020-03-27 TW TW109110727A patent/TW202102529A/zh unknown
-
2021
- 2021-09-22 IL IL286579A patent/IL286579A/en unknown
- 2021-09-27 US US17/486,039 patent/US20230012687A1/en active Pending
- 2021-10-27 CO CONC2021/0014400A patent/CO2021014400A2/es unknown
Also Published As
Publication number | Publication date |
---|---|
EA202192637A1 (ru) | 2022-03-18 |
EP3947670A2 (en) | 2022-02-09 |
CO2021014400A2 (es) | 2021-11-19 |
CA3135172A1 (en) | 2020-10-01 |
US20230012687A1 (en) | 2023-01-19 |
WO2020198641A2 (en) | 2020-10-01 |
SG11202110135YA (en) | 2021-10-28 |
IL286579A (en) | 2021-10-31 |
KR20220004649A (ko) | 2022-01-11 |
AU2020248470A1 (en) | 2021-11-11 |
TW202102529A (zh) | 2021-01-16 |
BR112021019224A2 (pt) | 2021-11-30 |
MA55527A (fr) | 2022-02-09 |
MX2021011757A (es) | 2021-12-10 |
WO2020198641A3 (en) | 2020-11-05 |
JP2022527302A (ja) | 2022-06-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11697806B2 (en) | Polynucleotides, compositions, and methods for genome editing | |
EP3688162B1 (en) | Formulations | |
US20230203480A1 (en) | Lipid nanoparticle formulations for crispr/cas components | |
US11795460B2 (en) | Compositions and methods for TTR gene editing and treating ATTR amyloidosis | |
CN113993994A (zh) | 用于多肽表达的多核苷酸、组合物和方法 | |
US20240124897A1 (en) | Compositions and Methods Comprising a TTR Guide RNA and a Polynucleotide Encoding an RNA-Guided DNA Binding Agent | |
CA3205000A1 (en) | Polynucleotides, compositions, and methods for genome editing involving deamination | |
CN118660960A (zh) | 用于基因组编辑的多核苷酸、组合物和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40067192 Country of ref document: HK |