JP7212982B1 - Cell library and its production method - Google Patents
Cell library and its production method Download PDFInfo
- Publication number
- JP7212982B1 JP7212982B1 JP2022161024A JP2022161024A JP7212982B1 JP 7212982 B1 JP7212982 B1 JP 7212982B1 JP 2022161024 A JP2022161024 A JP 2022161024A JP 2022161024 A JP2022161024 A JP 2022161024A JP 7212982 B1 JP7212982 B1 JP 7212982B1
- Authority
- JP
- Japan
- Prior art keywords
- sequence
- modified
- allele
- cells
- cell
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000004519 manufacturing process Methods 0.000 title abstract description 17
- 108700028369 Alleles Proteins 0.000 claims abstract description 202
- 108091028043 Nucleic acid sequence Proteins 0.000 claims abstract description 55
- 239000000203 mixture Substances 0.000 claims abstract description 38
- 230000035772 mutation Effects 0.000 claims abstract description 21
- 210000004027 cell Anatomy 0.000 claims description 428
- 108090000623 proteins and genes Proteins 0.000 claims description 237
- 239000003550 marker Substances 0.000 claims description 212
- 108020004414 DNA Proteins 0.000 claims description 152
- 238000011144 upstream manufacturing Methods 0.000 claims description 79
- 150000007523 nucleic acids Chemical group 0.000 claims description 78
- 230000004048 modification Effects 0.000 claims description 70
- 238000012986 modification Methods 0.000 claims description 70
- 238000000034 method Methods 0.000 claims description 67
- 125000003729 nucleotide group Chemical group 0.000 claims description 61
- 238000012217 deletion Methods 0.000 claims description 55
- 230000037430 deletion Effects 0.000 claims description 55
- 102000039446 nucleic acids Human genes 0.000 claims description 31
- 108020004707 nucleic acids Proteins 0.000 claims description 31
- 239000002773 nucleotide Substances 0.000 claims description 30
- 230000006798 recombination Effects 0.000 claims description 26
- 238000005215 recombination Methods 0.000 claims description 26
- 102000040430 polynucleotide Human genes 0.000 claims description 19
- 108091033319 polynucleotide Proteins 0.000 claims description 19
- 239000002157 polynucleotide Substances 0.000 claims description 19
- 238000003780 insertion Methods 0.000 claims description 17
- 230000037431 insertion Effects 0.000 claims description 17
- 108090000790 Enzymes Proteins 0.000 claims description 13
- 102000004190 Enzymes Human genes 0.000 claims description 9
- 238000006467 substitution reaction Methods 0.000 claims description 9
- 238000007792 addition Methods 0.000 claims description 8
- 239000012634 fragment Substances 0.000 claims description 8
- 230000002068 genetic effect Effects 0.000 claims description 7
- 210000002230 centromere Anatomy 0.000 claims description 6
- 108091035539 telomere Proteins 0.000 claims description 5
- 210000003411 telomere Anatomy 0.000 claims description 5
- 102000055501 telomere Human genes 0.000 claims description 5
- 108700026244 Open Reading Frames Proteins 0.000 claims description 3
- 230000008685 targeting Effects 0.000 claims description 3
- 102000004169 proteins and genes Human genes 0.000 description 62
- 108091033409 CRISPR Proteins 0.000 description 33
- 230000006801 homologous recombination Effects 0.000 description 28
- 238000002744 homologous recombination Methods 0.000 description 28
- 108020005004 Guide RNA Proteins 0.000 description 26
- 230000014509 gene expression Effects 0.000 description 22
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 21
- 230000000694 effects Effects 0.000 description 20
- 108010042407 Endonucleases Proteins 0.000 description 16
- 238000003776 cleavage reaction Methods 0.000 description 16
- 230000007017 scission Effects 0.000 description 16
- 102000004533 Endonucleases Human genes 0.000 description 15
- 230000002759 chromosomal effect Effects 0.000 description 15
- 108091079001 CRISPR RNA Proteins 0.000 description 13
- 238000010276 construction Methods 0.000 description 12
- 125000006850 spacer group Chemical group 0.000 description 12
- 238000010362 genome editing Methods 0.000 description 10
- 150000001413 amino acids Chemical class 0.000 description 9
- 230000001939 inductive effect Effects 0.000 description 9
- 238000002715 modification method Methods 0.000 description 9
- 206010059866 Drug resistance Diseases 0.000 description 8
- 101710163270 Nuclease Proteins 0.000 description 8
- 125000003275 alpha amino acid group Chemical group 0.000 description 8
- 229940079593 drug Drugs 0.000 description 8
- 239000003814 drug Substances 0.000 description 8
- 239000013604 expression vector Substances 0.000 description 8
- 229920000642 polymer Polymers 0.000 description 8
- 108091008146 restriction endonucleases Proteins 0.000 description 8
- 230000035899 viability Effects 0.000 description 8
- 238000010453 CRISPR/Cas method Methods 0.000 description 7
- 239000012212 insulator Substances 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000010370 cell cloning Methods 0.000 description 6
- 238000012258 culturing Methods 0.000 description 6
- 108091006047 fluorescent proteins Proteins 0.000 description 6
- 241000894007 species Species 0.000 description 6
- 108091026890 Coding region Proteins 0.000 description 5
- 108060001084 Luciferase Proteins 0.000 description 5
- 239000004098 Tetracycline Substances 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000013461 design Methods 0.000 description 5
- 230000005782 double-strand break Effects 0.000 description 5
- 102000042567 non-coding RNA Human genes 0.000 description 5
- 230000002062 proliferating effect Effects 0.000 description 5
- 230000008439 repair process Effects 0.000 description 5
- 229960002180 tetracycline Drugs 0.000 description 5
- 229930101283 tetracycline Natural products 0.000 description 5
- 235000019364 tetracycline Nutrition 0.000 description 5
- 150000003522 tetracyclines Chemical class 0.000 description 5
- 102000053602 DNA Human genes 0.000 description 4
- 108010017070 Zinc Finger Nucleases Proteins 0.000 description 4
- 230000001580 bacterial effect Effects 0.000 description 4
- 230000027455 binding Effects 0.000 description 4
- 239000003623 enhancer Substances 0.000 description 4
- 238000013411 master cell bank Methods 0.000 description 4
- 230000008774 maternal effect Effects 0.000 description 4
- 230000008775 paternal effect Effects 0.000 description 4
- 238000002360 preparation method Methods 0.000 description 4
- 108090000765 processed proteins & peptides Proteins 0.000 description 4
- 230000035755 proliferation Effects 0.000 description 4
- 230000001105 regulatory effect Effects 0.000 description 4
- 238000012216 screening Methods 0.000 description 4
- 238000012800 visualization Methods 0.000 description 4
- 238000010354 CRISPR gene editing Methods 0.000 description 3
- 241000701022 Cytomegalovirus Species 0.000 description 3
- 108010043121 Green Fluorescent Proteins Proteins 0.000 description 3
- 102000004144 Green Fluorescent Proteins Human genes 0.000 description 3
- 108010021466 Mutant Proteins Proteins 0.000 description 3
- 102000008300 Mutant Proteins Human genes 0.000 description 3
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 3
- 235000014680 Saccharomyces cerevisiae Nutrition 0.000 description 3
- 108091081021 Sense strand Proteins 0.000 description 3
- 108010052160 Site-specific recombinase Proteins 0.000 description 3
- 102000006601 Thymidine Kinase Human genes 0.000 description 3
- 108020004440 Thymidine kinase Proteins 0.000 description 3
- 208000026487 Triploidy Diseases 0.000 description 3
- 210000004102 animal cell Anatomy 0.000 description 3
- 239000011575 calcium Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 239000002577 cryoprotective agent Substances 0.000 description 3
- 239000005090 green fluorescent protein Substances 0.000 description 3
- 108020004999 messenger RNA Proteins 0.000 description 3
- 108091027963 non-coding RNA Proteins 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000022532 regulation of transcription, DNA-dependent Effects 0.000 description 3
- 210000001082 somatic cell Anatomy 0.000 description 3
- 230000004083 survival effect Effects 0.000 description 3
- 102100035875 C-C chemokine receptor type 5 Human genes 0.000 description 2
- 101710149870 C-C chemokine receptor type 5 Proteins 0.000 description 2
- 102100031650 C-X-C chemokine receptor type 4 Human genes 0.000 description 2
- 108010051219 Cre recombinase Proteins 0.000 description 2
- 241000235646 Cyberlindnera jadinii Species 0.000 description 2
- 101710177611 DNA polymerase II large subunit Proteins 0.000 description 2
- 101710184669 DNA polymerase II small subunit Proteins 0.000 description 2
- 108010008532 Deoxyribonuclease I Proteins 0.000 description 2
- 102000007260 Deoxyribonuclease I Human genes 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- 101000922348 Homo sapiens C-X-C chemokine receptor type 4 Proteins 0.000 description 2
- 101001000998 Homo sapiens Protein phosphatase 1 regulatory subunit 12C Proteins 0.000 description 2
- 108091092195 Intron Proteins 0.000 description 2
- 108700011259 MicroRNAs Proteins 0.000 description 2
- 206010028980 Neoplasm Diseases 0.000 description 2
- 241000235648 Pichia Species 0.000 description 2
- 102100035620 Protein phosphatase 1 regulatory subunit 12C Human genes 0.000 description 2
- 108010091086 Recombinases Proteins 0.000 description 2
- 102000018120 Recombinases Human genes 0.000 description 2
- 241000714474 Rous sarcoma virus Species 0.000 description 2
- 235000018368 Saccharomyces fragilis Nutrition 0.000 description 2
- 244000253911 Saccharomyces fragilis Species 0.000 description 2
- 241000700584 Simplexvirus Species 0.000 description 2
- 241000193996 Streptococcus pyogenes Species 0.000 description 2
- 238000010459 TALEN Methods 0.000 description 2
- 108010043645 Transcription Activator-Like Effector Nucleases Proteins 0.000 description 2
- 108700019146 Transgenes Proteins 0.000 description 2
- 108091023045 Untranslated Region Proteins 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 230000001594 aberrant effect Effects 0.000 description 2
- 101150063416 add gene Proteins 0.000 description 2
- 230000000692 anti-sense effect Effects 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 201000011510 cancer Diseases 0.000 description 2
- -1 chemical analogues Chemical class 0.000 description 2
- 210000004978 chinese hamster ovary cell Anatomy 0.000 description 2
- 238000010367 cloning Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000011559 double-strand break repair via nonhomologous end joining Effects 0.000 description 2
- 210000001671 embryonic stem cell Anatomy 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 102000034287 fluorescent proteins Human genes 0.000 description 2
- BRZYSWJRSDMWLG-CAXSIQPQSA-N geneticin Chemical compound O1C[C@@](O)(C)[C@H](NC)[C@@H](O)[C@H]1O[C@@H]1[C@@H](O)[C@H](O[C@@H]2[C@@H]([C@@H](O)[C@H](O)[C@@H](C(C)O)O2)N)[C@@H](N)C[C@H]1N BRZYSWJRSDMWLG-CAXSIQPQSA-N 0.000 description 2
- 210000004602 germ cell Anatomy 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 2
- 210000005260 human cell Anatomy 0.000 description 2
- 210000004263 induced pluripotent stem cell Anatomy 0.000 description 2
- 239000000411 inducer Substances 0.000 description 2
- 230000006780 non-homologous end joining Effects 0.000 description 2
- 239000013612 plasmid Substances 0.000 description 2
- 210000001778 pluripotent stem cell Anatomy 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- RXWNCPJZOCPEPQ-NVWDDTSBSA-N puromycin Chemical compound C1=CC(OC)=CC=C1C[C@H](N)C(=O)N[C@H]1[C@@H](O)[C@H](N2C3=NC=NC(=C3N=C2)N(C)C)O[C@@H]1CO RXWNCPJZOCPEPQ-NVWDDTSBSA-N 0.000 description 2
- 108010054624 red fluorescent protein Proteins 0.000 description 2
- 230000008263 repair mechanism Effects 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 150000003839 salts Chemical class 0.000 description 2
- 230000035939 shock Effects 0.000 description 2
- 239000000126 substance Substances 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 108091005957 yellow fluorescent proteins Proteins 0.000 description 2
- DIGQNXIGRZPYDK-WKSCXVIASA-N (2R)-6-amino-2-[[2-[[(2S)-2-[[2-[[(2R)-2-[[(2S)-2-[[(2R,3S)-2-[[2-[[(2S)-2-[[2-[[(2S)-2-[[(2S)-2-[[(2R)-2-[[(2S,3S)-2-[[(2R)-2-[[(2S)-2-[[(2S)-2-[[(2S)-2-[[2-[[(2S)-2-[[(2R)-2-[[2-[[2-[[2-[(2-amino-1-hydroxyethylidene)amino]-3-carboxy-1-hydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxypropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1,5-dihydroxy-5-iminopentylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxybutylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1,3-dihydroxypropylidene]amino]-1-hydroxyethylidene]amino]-1-hydroxy-3-sulfanylpropylidene]amino]-1-hydroxyethylidene]amino]hexanoic acid Chemical compound C[C@@H]([C@@H](C(=N[C@@H](CS)C(=N[C@@H](C)C(=N[C@@H](CO)C(=NCC(=N[C@@H](CCC(=N)O)C(=NC(CS)C(=N[C@H]([C@H](C)O)C(=N[C@H](CS)C(=N[C@H](CO)C(=NCC(=N[C@H](CS)C(=NCC(=N[C@H](CCCCN)C(=O)O)O)O)O)O)O)O)O)O)O)O)O)O)O)N=C([C@H](CS)N=C([C@H](CO)N=C([C@H](CO)N=C([C@H](C)N=C(CN=C([C@H](CO)N=C([C@H](CS)N=C(CN=C(C(CS)N=C(C(CC(=O)O)N=C(CN)O)O)O)O)O)O)O)O)O)O)O)O DIGQNXIGRZPYDK-WKSCXVIASA-N 0.000 description 1
- SGKRLCUYIXIAHR-AKNGSSGZSA-N (4s,4ar,5s,5ar,6r,12ar)-4-(dimethylamino)-1,5,10,11,12a-pentahydroxy-6-methyl-3,12-dioxo-4a,5,5a,6-tetrahydro-4h-tetracene-2-carboxamide Chemical compound C1=CC=C2[C@H](C)[C@@H]([C@H](O)[C@@H]3[C@](C(O)=C(C(N)=O)C(=O)[C@H]3N(C)C)(O)C3=O)C3=C(O)C2=C1O SGKRLCUYIXIAHR-AKNGSSGZSA-N 0.000 description 1
- UHPMCKVQTMMPCG-UHFFFAOYSA-N 5,8-dihydroxy-2-methoxy-6-methyl-7-(2-oxopropyl)naphthalene-1,4-dione Chemical compound CC1=C(CC(C)=O)C(O)=C2C(=O)C(OC)=CC(=O)C2=C1O UHPMCKVQTMMPCG-UHFFFAOYSA-N 0.000 description 1
- 241001019659 Acremonium <Plectosphaerellaceae> Species 0.000 description 1
- 241000251468 Actinopterygii Species 0.000 description 1
- 102000007469 Actins Human genes 0.000 description 1
- 108010085238 Actins Proteins 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 108020004774 Alkaline Phosphatase Proteins 0.000 description 1
- 235000002198 Annona diversifolia Nutrition 0.000 description 1
- 241000228212 Aspergillus Species 0.000 description 1
- 210000002237 B-cell of pancreatic islet Anatomy 0.000 description 1
- 241000255789 Bombyx mori Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- 101000909256 Caldicellulosiruptor bescii (strain ATCC BAA-1888 / DSM 6725 / Z-1320) DNA polymerase I Proteins 0.000 description 1
- 241000222178 Candida tropicalis Species 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 241000283707 Capra Species 0.000 description 1
- 102000004039 Caspase-9 Human genes 0.000 description 1
- 108090000566 Caspase-9 Proteins 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 230000007018 DNA scission Effects 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- 229920002307 Dextran Polymers 0.000 description 1
- 101100162704 Emericella nidulans I-AniI gene Proteins 0.000 description 1
- 241000178951 Endomyces Species 0.000 description 1
- 101000889905 Enterobacteria phage RB3 Intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889904 Enterobacteria phage T4 Defective intron-associated endonuclease 3 Proteins 0.000 description 1
- 101000889899 Enterobacteria phage T4 Intron-associated endonuclease 2 Proteins 0.000 description 1
- YQYJSBFKSSDGFO-UHFFFAOYSA-N Epihygromycin Natural products OC1C(O)C(C(=O)C)OC1OC(C(=C1)O)=CC=C1C=C(C)C(=O)NC1C(O)C(O)C2OCOC2C1O YQYJSBFKSSDGFO-UHFFFAOYSA-N 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 241000223218 Fusarium Species 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010060309 Glucuronidase Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 241000223198 Humicola Species 0.000 description 1
- 206010021143 Hypoxia Diseases 0.000 description 1
- 241000235649 Kluyveromyces Species 0.000 description 1
- 241000282838 Lama Species 0.000 description 1
- 108091026898 Leader sequence (mRNA) Proteins 0.000 description 1
- 239000005089 Luciferase Substances 0.000 description 1
- 102000003792 Metallothionein Human genes 0.000 description 1
- 108090000157 Metallothionein Proteins 0.000 description 1
- 244000097806 Narcissus tazetta subsp aureus Species 0.000 description 1
- 241000588653 Neisseria Species 0.000 description 1
- 241000588650 Neisseria meningitidis Species 0.000 description 1
- 229930193140 Neomycin Natural products 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- 241000228143 Penicillium Species 0.000 description 1
- 101000902592 Pyrococcus furiosus (strain ATCC 43587 / DSM 3638 / JCM 8422 / Vc1) DNA polymerase Proteins 0.000 description 1
- 108091034057 RNA (poly(A)) Proteins 0.000 description 1
- 108091081062 Repeated sequence (DNA) Proteins 0.000 description 1
- 241000283984 Rodentia Species 0.000 description 1
- 241000235070 Saccharomyces Species 0.000 description 1
- 235000003534 Saccharomyces carlsbergensis Nutrition 0.000 description 1
- 241001123227 Saccharomyces pastorianus Species 0.000 description 1
- 241000235343 Saccharomycetales Species 0.000 description 1
- 241000235347 Schizosaccharomyces pombe Species 0.000 description 1
- 241000191940 Staphylococcus Species 0.000 description 1
- 241000194017 Streptococcus Species 0.000 description 1
- 108091027544 Subgenomic mRNA Proteins 0.000 description 1
- 210000001744 T-lymphocyte Anatomy 0.000 description 1
- 208000035199 Tetraploidy Diseases 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 108091023040 Transcription factor Proteins 0.000 description 1
- 102000040945 Transcription factor Human genes 0.000 description 1
- 241000589886 Treponema Species 0.000 description 1
- 241000223259 Trichoderma Species 0.000 description 1
- 108091026822 U6 spliceosomal RNA Proteins 0.000 description 1
- 241000251539 Vertebrata <Metazoa> Species 0.000 description 1
- 241000700605 Viruses Species 0.000 description 1
- 241000235013 Yarrowia Species 0.000 description 1
- 108010084455 Zeocin Proteins 0.000 description 1
- HCHKCACWOHOZIP-UHFFFAOYSA-N Zinc Chemical compound [Zn] HCHKCACWOHOZIP-UHFFFAOYSA-N 0.000 description 1
- 241000235033 Zygosaccharomyces rouxii Species 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 210000001789 adipocyte Anatomy 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 239000003242 anti bacterial agent Substances 0.000 description 1
- 229940088710 antibiotic agent Drugs 0.000 description 1
- 210000001130 astrocyte Anatomy 0.000 description 1
- 210000003719 b-lymphocyte Anatomy 0.000 description 1
- 210000003651 basophil Anatomy 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 108010005774 beta-Galactosidase Proteins 0.000 description 1
- 230000000975 bioactive effect Effects 0.000 description 1
- 229920001222 biopolymer Polymers 0.000 description 1
- 229930189065 blasticidin Natural products 0.000 description 1
- 230000000903 blocking effect Effects 0.000 description 1
- 210000001185 bone marrow Anatomy 0.000 description 1
- 210000002798 bone marrow cell Anatomy 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 229910000389 calcium phosphate Inorganic materials 0.000 description 1
- 239000001506 calcium phosphate Substances 0.000 description 1
- 235000011010 calcium phosphates Nutrition 0.000 description 1
- 210000001054 cardiac fibroblast Anatomy 0.000 description 1
- 210000004413 cardiac myocyte Anatomy 0.000 description 1
- 238000004113 cell culture Methods 0.000 description 1
- 210000003855 cell nucleus Anatomy 0.000 description 1
- 230000004663 cell proliferation Effects 0.000 description 1
- 230000003833 cell viability Effects 0.000 description 1
- 229960005091 chloramphenicol Drugs 0.000 description 1
- WIIZWVCIJKGZOK-RKDXNWHRSA-N chloramphenicol Chemical compound ClC(Cl)C(=O)N[C@H](CO)[C@H](O)C1=CC=C([N+]([O-])=O)C=C1 WIIZWVCIJKGZOK-RKDXNWHRSA-N 0.000 description 1
- 210000001612 chondrocyte Anatomy 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 210000000399 corneal endothelial cell Anatomy 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 230000006378 damage Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 210000001968 dental pulp cell Anatomy 0.000 description 1
- 230000001419 dependent effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 210000001840 diploid cell Anatomy 0.000 description 1
- 229960003722 doxycycline Drugs 0.000 description 1
- 230000002900 effect on cell Effects 0.000 description 1
- 239000012636 effector Substances 0.000 description 1
- 238000004520 electroporation Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
- 108010050663 endodeoxyribonuclease CreI Proteins 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 210000003979 eosinophil Anatomy 0.000 description 1
- 210000001339 epidermal cell Anatomy 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 230000001747 exhibiting effect Effects 0.000 description 1
- 230000002538 fungal effect Effects 0.000 description 1
- 230000004545 gene duplication Effects 0.000 description 1
- 238000003198 gene knock in Methods 0.000 description 1
- 238000003209 gene knockout Methods 0.000 description 1
- 210000004565 granule cell Anatomy 0.000 description 1
- 210000002064 heart cell Anatomy 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 230000007954 hypoxia Effects 0.000 description 1
- 210000002865 immune cell Anatomy 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 229960000318 kanamycin Drugs 0.000 description 1
- 229930027917 kanamycin Natural products 0.000 description 1
- SBUJHOSQTJFQJX-NOAMYHISSA-N kanamycin Chemical compound O[C@@H]1[C@@H](O)[C@H](O)[C@@H](CN)O[C@@H]1O[C@H]1[C@H](O)[C@@H](O[C@@H]2[C@@H]([C@@H](N)[C@H](O)[C@@H](CO)O2)O)[C@H](N)C[C@@H]1N SBUJHOSQTJFQJX-NOAMYHISSA-N 0.000 description 1
- 229930182823 kanamycin A Natural products 0.000 description 1
- 210000004523 ligament cell Anatomy 0.000 description 1
- 238000001638 lipofection Methods 0.000 description 1
- 238000004020 luminiscence type Methods 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 210000003593 megakaryocyte Anatomy 0.000 description 1
- 210000002901 mesenchymal stem cell Anatomy 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000000520 microinjection Methods 0.000 description 1
- 230000009456 molecular mechanism Effects 0.000 description 1
- 210000001616 monocyte Anatomy 0.000 description 1
- 230000000869 mutational effect Effects 0.000 description 1
- 210000003643 myeloid progenitor cell Anatomy 0.000 description 1
- 210000000822 natural killer cell Anatomy 0.000 description 1
- 229960004927 neomycin Drugs 0.000 description 1
- 210000001178 neural stem cell Anatomy 0.000 description 1
- 210000004498 neuroglial cell Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 210000000440 neutrophil Anatomy 0.000 description 1
- 230000001293 nucleolytic effect Effects 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 210000000963 osteoblast Anatomy 0.000 description 1
- 210000002997 osteoclast Anatomy 0.000 description 1
- 210000004409 osteocyte Anatomy 0.000 description 1
- 239000002245 particle Substances 0.000 description 1
- CWCMIVBLVUHDHK-ZSNHEYEWSA-N phleomycin D1 Chemical compound N([C@H](C(=O)N[C@H](C)[C@@H](O)[C@H](C)C(=O)N[C@@H]([C@H](O)C)C(=O)NCCC=1SC[C@@H](N=1)C=1SC=C(N=1)C(=O)NCCCCNC(N)=N)[C@@H](O[C@H]1[C@H]([C@@H](O)[C@H](O)[C@H](CO)O1)O[C@@H]1[C@H]([C@@H](OC(N)=O)[C@H](O)[C@@H](CO)O1)O)C=1N=CNC=1)C(=O)C1=NC([C@H](CC(N)=O)NC[C@H](N)C(N)=O)=NC(N)=C1C CWCMIVBLVUHDHK-ZSNHEYEWSA-N 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical group [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 239000013600 plasmid vector Substances 0.000 description 1
- 231100000614 poison Toxicity 0.000 description 1
- 235000003784 poor nutrition Nutrition 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 210000000449 purkinje cell Anatomy 0.000 description 1
- 229950010131 puromycin Drugs 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000002207 retinal effect Effects 0.000 description 1
- 210000003994 retinal ganglion cell Anatomy 0.000 description 1
- 230000001177 retroviral effect Effects 0.000 description 1
- 238000012163 sequencing technique Methods 0.000 description 1
- 230000005783 single-strand break Effects 0.000 description 1
- 210000004927 skin cell Anatomy 0.000 description 1
- 210000000952 spleen Anatomy 0.000 description 1
- 210000000130 stem cell Anatomy 0.000 description 1
- 210000002435 tendon Anatomy 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical group [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 210000001519 tissue Anatomy 0.000 description 1
- 239000003440 toxic substance Substances 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- QORWJWZARLRLPR-UHFFFAOYSA-H tricalcium bis(phosphate) Chemical compound [Ca+2].[Ca+2].[Ca+2].[O-]P([O-])([O-])=O.[O-]P([O-])([O-])=O QORWJWZARLRLPR-UHFFFAOYSA-H 0.000 description 1
- 210000003954 umbilical cord Anatomy 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 230000009385 viral infection Effects 0.000 description 1
- 239000011701 zinc Substances 0.000 description 1
- 229910052725 zinc Inorganic materials 0.000 description 1
Images
Landscapes
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
【課題】遺伝子改変細胞を含むライブラリーの製造方法を提供する。
【解決手段】複数のアレルを有する細胞においてその1アレルの特定部位の塩基配列に豊富な種類の多様性を有する複数の改変細胞を含む細胞ライブラリーを開示する。細胞ライブラリーは、1種類の改変細胞を含む水性組成物の組合せであり得る。このライブラリーは、ゲノムの特定領域の機能性評価、ゲノムの特定領域への様々な種類の変異(例えば、SNP)導入等において有用である。
【選択図】図2
A method for producing a library containing genetically modified cells is provided.
Kind Code: A1 Disclosed is a cell library containing a plurality of modified cells having a wide variety of types of nucleotide sequences at a specific site of one allele in cells having a plurality of alleles. A cell library can be a combination of aqueous compositions containing one type of modified cell. This library is useful in evaluating the functionality of specific regions of the genome, introducing various types of mutations (eg, SNPs) into specific regions of the genome, and the like.
[Selection drawing] Fig. 2
Description
本発明は、細胞ライブラリおよびその製造方法に関する。 TECHNICAL FIELD The present invention relates to a cell library and its production method.
新規ゲノム編集ツールとしてCRISPR/Casシステムが報告されてから、CRI
SPR/Casシステムを利用した様々な研究が行われている(例えば、特許文献1)。
CRISPR/Casシステムを利用したゲノム編集では、ガイドRNAにより標的化さ
れた標的領域がCas9ヌクレアーゼにより二本鎖切断される。二本鎖切断されたDNA
は、相同組み換え修復(Homologous Directed Repair:HD
R)又は非相同末端再結合(Non-Homologous End-Joining
Repair:NHEJ)により修復されることが知られている。HDRでは、標的領域
の周辺領域と相同な配列を有するドナーDNAをCRISPR/Casシステムと共に細
胞に導入することにより、任意の配列を標的領域に組み込むことができる。
Since the CRISPR/Cas system was reported as a novel genome editing tool, CRI
Various studies using the SPR/Cas system are being conducted (for example, Patent Document 1).
In genome editing using the CRISPR/Cas system, the target region targeted by the guide RNA is double-strand cleaved by Cas9 nuclease. double-strand broken DNA
Homologous Directed Repair: HD
R) or Non-Homologous End-Joining
Repair: NHEJ) is known to be repaired. In HDR, any sequence can be incorporated into the target region by introducing donor DNA having sequences homologous to the regions surrounding the target region into cells with the CRISPR/Cas system.
ゲノム改変技術を用いて、HDRにより2以上のアレルを同時に効率よく改変する技術
が開発されている(例えば、特許文献2)。特許文献2では、数百kbの大規模欠失を2
以上のアレルを同時に効率よく改変することができたことが開示されている。
Techniques for simultaneously and efficiently modifying two or more alleles by HDR have been developed using genome modification techniques (eg, Patent Document 2). In
It is disclosed that the above alleles could be modified simultaneously and efficiently.
本開示は、細胞ライブラリーおよびその製造方法を提供する。より具体的には、本開示
は、複数のアレルを有する細胞においてその1アレルの特定部位の塩基配列に豊富な種類
の多様性を有する複数の改変細胞を含む細胞ライブラリーを提供する。細胞ライブラリー
は、1種類の改変細胞を含む水性組成物の組合せであり得る。
The present disclosure provides cell libraries and methods for their production. More specifically, the present disclosure provides a cell library containing a plurality of modified cells having a rich variety of nucleotide sequences at a specific site of one allele in cells having multiple alleles. A cell library can be a combination of aqueous compositions containing one type of modified cell.
(1)改変細胞のライブラリーであって、
ライブラリーは、複数の水性組成物の組合せを含み、
各水性組成物はそれぞれ1種類の改変細胞を含み、
改変細胞はそれぞれ、改変対象である遺伝子座に第一のアレルと第二のアレルを有し、
改変細胞はそれぞれ第一のアレルの同一位置に、水性組成物間で相互に異なるDNA断
片を含むカセットを有する、
ライブラリー。
(2)各改変細胞は、第二のアレルは、その一部または全部の破壊または欠失を有する、
請求項1または2に記載のライブラリー。
(3)第二のアレルは、シームレスに前記一部または全部を欠失している、上記(2)に
記載のライブラリー。
(4)改変細胞それぞれのDNA断片を含むカセット以外の配列は、改変前後で実質的に
同一である、上記(1)~(3)のいずれかに記載のライブラリー。
(5)前記カセットの配列のそれぞれは、1以上の改変部分(A)と1以上の非改変部分
(B)とからなり、前記改変部分(A)はそれぞれ、配列の挿入、欠失、および置換から
なる群から選択される1以上の改変を有し、前記1以上の改変部分の改変は、改変の位置
または内容に関して各水性組成物間で異なり、前記1以上の非改変部分(B)はそれぞれ
、改変前の対応する部位の配列と同一であり、前記カセット中のセントロメア側の非改変
部分(B1)は、前記カセットのセントロメア側の隣接配列(C1)とシームレスに連結
しており、前記カセットのテロメア側の非改変部分(Bt)は、前記カセットのテロメア
側の隣接配列(C2)とシームレスに連結しており、記隣接配列(C1)および非改変部
分(B1)が連結した領域、並びに非改変部分(Bt)および上記隣接配列(C2)が連
結した領域は、改変前の対応する領域の配列と同一の配列を構成している、上記(1)~
(4)のいずれかに記載のライブラリー。
(6)前記改変細胞は、部位特異的組換え酵素の標的配列を含まない、上記(1)~(5
)のいずれかに記載のライブラリー。
(7)ライブラリーに含まれる前記水性組成物の種類は、50種類以上である、上記(1
)~(6)のいずれかに記載のライブライリー。
(8)改変細胞のライブラリーを製造する方法であって、
(α)改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲノムを有する細胞
において、前記第一のアレルと第二のアレルそれぞれに選択マーカー遺伝子と標的核酸配
列を含むカセットを有する細胞の群を提供することと、
ここで、第一のアレルが有する選択マーカー遺伝子と第二のアレルが有する選択マーカ
ー遺伝子とは区別可能に異なり、前記標的核酸配列は、ゲノム改変システムの標的であり
、ゲノム改変システムにより第一のアレルと第二のアレルとを区別可能に切断できるよう
に設計されており、各選択マーカー遺伝子はネガティブ選択に用いることができるネガテ
ィブ選択用マーカー遺伝子であり、
(β)提供された細胞の群に下記(x)及び(y)を導入する工程と、
(x)第一のアレルに含まれる前記固有の塩基配列を標的とする配列特異的核酸切断分子
、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変シス
テム、
(y)複数種類の第2の組換え用ドナーDNA{ここで、複数種類の第2の組換え用ドナ
ーDNAはそれぞれ、上記(x)の前記標的部位の上流側に隣接する塩基配列と相同な塩
基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相
同な塩基配列を有する下流ホモロジーアームを有し、前記上流ホモロジーアームと前記下
流ホモロジーアームとの間に改変塩基配列を含み、改変塩基配列は、第2の組換え用ドナ
ーDNA毎に異なり、第2の組換え用ドナーDNAそれぞれに固有である}、
(γ)前記工程(β)の後、第一のアレルに含まれる選択マーカー遺伝子を発現しない細
胞を選択する工程と、
を含み、
これにより、複数の細胞を含む改変細胞のライブラリー得ることができ、ここで、得ら
れた複数の細胞において、第一のアレルは各細胞に固有の改変塩基配列を有し、第二のア
レルは細胞間で共通の配列を有する、
方法。
(9)上記(8)に記載の方法であって、工程(α)の前に、
改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲノムを有する細胞にお
いて、第一のアレルおよび第二のアレルに含まれる被置換配列を選択マーカー遺伝子と標
的核酸配列を含むカセットにより置換し、これにより被置換配列を第一のアレルおよび第
二のアレルから除去することと、
をさらに含む、方法。
(10)上記(9)に記載の方法であって、
第一のアレルの改変塩基配列はそれぞれ、第一のアレルの被置換配列に対して、塩基の
付加、挿入、置換、欠失、および削除からなる群から選択される1以上の変異を有する、
方法。
(11)上記(9)または(10)に記載の方法であって、
被改変配列は、タンパク質のコード領域であり、
第一のアレルの改変塩基配列は、第一のアレルの被置換配列に対して、塩基の付加、挿
入、置換、欠失、および削除からなる群から選択される1以上の変異を有する、方法
(12)改変塩基配列は、被改変配列と80%以上の配列同一性を有する、上記(10)
または(11)に記載の方法。
(13)上記(8)~(12)のいずれかに記載の方法であって、工程(α)と工程(β
)の間に、
第二のアレルからカセットを除去すること
をさらに含む、方法。
(14)カセットがシームレスに除去される、上記(13)に記載の方法。
(15)上記(8)~(14)のいずれかに記載の方法により作製される、複数の改変細
胞を含む改変細胞のライブラリー。
(1) a library of modified cells,
the library comprises combinations of a plurality of aqueous compositions;
each aqueous composition comprising one type of modified cell;
Each modified cell has a first allele and a second allele at the locus to be modified,
each of the modified cells has a cassette at the same position of the first allele and containing DNA fragments that differ from each other between the aqueous compositions;
Library.
(2) each modified cell has a second allele that is partially or wholly disrupted or deleted;
3. A library according to
(3) The library according to (2) above, wherein the second allele is seamlessly deleted in part or in whole.
(4) The library according to any one of (1) to (3) above, wherein the sequences other than the cassette containing the DNA fragment of each modified cell are substantially the same before and after modification.
(5) Each of the sequences of the cassette consists of one or more modified portions (A) and one or more unmodified portions (B), and the modified portions (A) are sequence insertions, deletions, and sequences, respectively. having one or more modifications selected from the group consisting of substitutions, the modifications of the one or more modified portions differing between each aqueous composition with respect to the location or content of the modifications, and the one or more unmodified portions (B) is the same as the sequence of the corresponding site before modification, and the unmodified portion (B1) on the centromere side of the cassette is seamlessly linked to the adjacent sequence (C1) on the centromere side of the cassette, The unmodified portion (Bt) on the telomere side of the cassette is seamlessly linked to the flanking sequence (C2) on the telomere side of the cassette, and the region where the flanking sequence (C1) and the unmodified portion (B1) are linked , and the region where the unmodified portion (Bt) and the adjacent sequence (C2) are linked constitutes the same sequence as the sequence of the corresponding region before modification, (1) to
The library according to any one of (4).
(6) The modified cell does not contain the target sequence of the site-specific recombination enzyme, (1) to (5) above
).
(7) The number of types of the aqueous composition contained in the library is 50 or more, the above (1
) to (6).
(8) A method for producing a library of modified cells, comprising:
(α) in a cell having a genome containing a first allele and a second allele at the genetic locus to be modified, a cassette containing a selection marker gene and a target nucleic acid sequence for each of the first allele and the second allele; providing a population of cells having
Here, the selectable marker gene possessed by the first allele and the selectable marker gene possessed by the second allele are distinguishably different, the target nucleic acid sequence is the target of the genome modification system, and the genome modification system selects the first marker gene. each selectable marker gene is a negative selectable marker gene that can be used for negative selection, and is designed so that the allele and the second allele can be distinguished from each other;
(β) introducing the following (x) and (y) into the provided group of cells;
(x) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule targeting the unique base sequence contained in the first allele, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule;
(y) a plurality of types of second recombination donor DNA {wherein the plurality of types of second recombination donor DNA are homologous to the base sequence adjacent to the upstream side of the target site in (x) above, respectively; and a downstream homology arm having a nucleotide sequence homologous to the nucleotide sequence adjacent to the target region downstream, and a modified base between the upstream homology arm and the downstream homology arm sequence, wherein the modified nucleotide sequence is different for each second recombination donor DNA and unique to each second recombination donor DNA},
(γ) selecting cells that do not express the selectable marker gene contained in the first allele after the step (β);
including
Thereby, a library of modified cells comprising a plurality of cells can be obtained, wherein in the plurality of cells obtained, the first allele has a modified nucleotide sequence unique to each cell, and the second allele has a common sequence between cells,
Method.
(9) The method according to (8) above, wherein, before step (α),
In a cell having a genome containing a first allele and a second allele at a genetic locus to be modified, a cassette containing a selection marker gene and a target nucleic acid sequence for the substituted sequences contained in the first allele and the second allele thereby removing the substituted sequence from the first allele and the second allele;
The method further comprising:
(10) The method according to (9) above,
Each modified nucleotide sequence of the first allele has one or more mutations selected from the group consisting of addition, insertion, substitution, deletion, and deletion of bases relative to the substituted sequence of the first allele,
Method.
(11) The method according to (9) or (10) above,
The sequence to be modified is a protein coding region,
The modified base sequence of the first allele has one or more mutations selected from the group consisting of base additions, insertions, substitutions, deletions, and deletions with respect to the substituted sequence of the first allele. (12) The modified base sequence has 80% or more sequence identity with the modified sequence (10)
Or the method according to (11).
(13) The method according to any one of (8) to (12) above, wherein step (α) and step (β)
)Between,
The method further comprising removing the cassette from the second allele.
(14) The method according to (13) above, wherein the cassette is seamlessly removed.
(15) A modified cell library containing a plurality of modified cells prepared by the method according to any one of (8) to (14) above.
[定義]
「ポリヌクレオチド」及び「核酸」という用語は、相互に互換的に使用され、ヌクレオ
チドがホスホジエステル結合によって結合したヌクレオチドポリマーを指す。「ポリヌク
レオチド」及び「核酸」は、DNAであってもよく、RNAであってもよく、DNAとR
NAとの組み合わせから構成されてもよい。また、「ポリヌクレオチド」及び「核酸」は
、天然ヌクレオチドのポリマーであってもよく、天然ヌクレオチドと非天然ヌクレオチド
(天然ヌクレオチドの類似体、塩基部分、糖部分及びリン酸部分のうち少なくとも一つの
部分が修飾されているヌクレオチド(例えば、ホスホロチオエート骨格)等)とのポリマ
ーであってもよく、非天然ヌクレオチドのポリマーであってもよい。
[definition]
The terms "polynucleotide" and "nucleic acid" are used interchangeably and refer to a nucleotide polymer in which the nucleotides are linked by phosphodiester bonds. "Polynucleotide" and "nucleic acid" may be DNA or RNA, and DNA and R
It may be configured from a combination with NA. "Polynucleotides" and "nucleic acids" may also be polymers of natural nucleotides, including natural nucleotides and non-natural nucleotides (analogs of natural nucleotides, base moieties, sugar moieties and phosphate moieties). may be a polymer with modified nucleotides (eg, phosphorothioate backbone), or may be a polymer of non-natural nucleotides.
「ポリヌクレオチド」又は「核酸」の塩基配列は、特に明示しない限り、一般的に認め
られている1文字コードで記載される。特に明示しない限り、塩基配列は、5’側から3
’側に向かって記載する。「ポリヌクレオチド」又は「核酸」を構成するヌクレオチド残
基は、単に、アデニン、チミン、シトシン、グアニン、又はウラシル等、あるいはそれら
の1文字コードで記載される場合がある。
Base sequences of "polynucleotides" or "nucleic acids" are described in the generally accepted one-letter code unless otherwise specified. Unless otherwise specified, nucleotide sequences are 3
' is written towards the side. Nucleotide residues constituting a “polynucleotide” or “nucleic acid” may simply be described as adenine, thymine, cytosine, guanine, uracil, etc., or their one-letter codes.
「遺伝子」という用語は、特定のタンパク質をコードする少なくとも1つのオープンリ
ーディングフレームを含むポリヌクレオチドを指す。遺伝子は、エクソン及びイントロン
の両方を含み得る。
The term "gene" refers to a polynucleotide containing at least one open reading frame that encodes a particular protein. A gene may contain both exons and introns.
「ポリペプチド」、「ペプチド」及び「タンパク質」という用語は、相互に互換的に使
用され、アミド結合によって結合したアミノ酸のポリマーを指す。「ポリペプチド」、「
ペプチド」又は「タンパク質」は、天然アミノ酸のポリマーであってもよく、天然アミノ
酸と非天然アミノ酸(天然アミノ酸の化学的類似体、修飾誘導体等)とのポリマーであっ
てもよく、非天然アミノ酸のポリマーであってもよい。特に明示しない限り、アミノ酸配
列は、N末端側からC末端側に向かって記載する。
The terms "polypeptide", "peptide" and "protein" are used interchangeably to refer to a polymer of amino acids joined by amide bonds. "polypeptide", "
A "peptide" or "protein" may be a polymer of natural amino acids, a polymer of natural amino acids and non-natural amino acids (such as chemical analogues, modified derivatives of natural amino acids), or non-natural amino acids. It may be a polymer. Unless otherwise specified, amino acid sequences are written from the N-terminal side to the C-terminal side.
「アレル」という用語は、染色体ゲノム上の同一座位に存在する塩基配列のセットを指
す。ある態様では、2倍体の細胞では同一座位に2アレル存在し、3倍体の細胞では同一
座位に3アレル存在する。また、ある態様では、染色体の異常なコピーまたは当該座位の
異常な追加のコピーによって追加のアレルが形成されている場合がある。
The term "allele" refers to a set of base sequences present at the same locus on the chromosomal genome. In some embodiments, diploid cells have 2 alleles at the same locus and triploid cells have 3 alleles at the same locus. Also, in some embodiments, additional alleles may be formed by aberrant copies of the chromosome or aberrant additional copies of the locus.
「ゲノム改変」又は「ゲノム編集」という用語は、相互に互換的に用いられ、ゲノム上
の所望の位置(標的領域)に変異を誘導することを指す。ゲノム改変は、標的領域DNA
を切断するように設計された配列特異的核酸切断分子の使用を含み得る。好ましい実施形
態において、ゲノム改変は、標的領域のDNAを切断するように操作されたヌクレアーゼ
の使用、を含み得る。好ましい実施形態において、ゲノム改変は、標的領域中の特定の塩
基配列を有する標的配列を切断するように操作されたヌクレアーゼ(例えば、TALEN
やZFN)の使用を含み得る。好ましい実施形態において、ゲノム改変は、標的領域中の
特定の塩基配列を有する標的配列を切断するように、メガヌクレアーゼなどのゲノムに1
つしか切断部位を有しない制限酵素(例えば、16ベースの配列特異性を有する制限酵素
(理論上は416塩基に1つの割合で存在する)、17ベースの配列特異性を有する制限酵
素(理論上は417塩基に1つの割合で存在する)、および18ベースの配列特異性を有す
る制限酵素(理論上は418塩基に1つの割合で存在する))などの配列特異的エンドヌク
レアーゼを用いることができる場合もある。典型的には、部位特異的ヌクレアーゼの使用
により、標的領域のDNAに二本鎖切断(DSB)が誘導され、その後、相同組み換え修
復(Homologous Directed Repair:HDR)及び非相同末端
再結合(Non-Homologous End-Joining Repair:NH
EJ)のような、細胞の内因性プロセスによってゲノムが修復される。NHEJは、ドナ
ーDNAを用いずに二本鎖切断された末端を連結する修復方法であり、修復の際に挿入及
び/又は欠失(indel)が高頻度で誘導される。HDRは、ドナーDNAを用いた修
復機構であり、標的領域に所望の変異を導入することも可能である。ゲノム改変技術とし
ては、例えば、CRISPR/Casシステムが好ましく例示される。メガヌクレアーゼ
としては、例えば、I-SceI、I-SceII、I-SceIII、I-SceIV
、I-SceV、I-SceVI、I-SceVII、I-CeuI、I-CeuAII
P、I-CreI、I-CrepsbIP、I-CrepsbIIP、I-Crepsb
IIIP、I-CrepsbIVP、I-TliI、I-PpoI、PI-PspI、F
-SceI、F-SceII、F-SuvI、F-TevI、F-TevII、I-Am
aI、I-AniI、I-ChuI、I-CmoeI、I-CpaI、I-CpaII、
I-CsmI、I-CvuI、I-CvuAIP、I-DdiI、I-DdiII、I-
DirI、I-DmoI、I-HmuI、I-HmuII、I-HsNIP、I-Lla
I、I-MsoI、I-NaaI、I-NanI、I-NclIP、I-NgrIP、I
-NitI、I-NjaI、I-Nsp236IP、I-PakI、I-PboIP、I
-PcuIP、I-PcuAI、I-PcuVI、I-PgrIP、I-PobIP、I
-PorI、I-PorIIP、I-PbpIP、I-SpBetaIP、I-ScaI
、I-SexIP、I-SneIP、I-SpomI、I-SpomCP、I-Spom
IP、I-SpomIIP、I-SquIP、I-Ssp68031、I-SthPhi
JP、I-SthPhiST3P、I-SthPhiSTe3bP、I-TdeIP、I
-TevI、I-TevII、I-TevIII、I-UarAP、I-UarHGPA
IP、I-UarHGPA13P、I-VinIP、I-ZbiIP、PI-Mtul、
PI-MtuHIP PI-MtuHIIP、PI-PfuI、PI-PfuII、PI
-PkoI、PI-PkoII、PI-Rma43812IP、PI-SpBetaIP
、PI-SceI、PI-TfuI、PI-TfuII、PI-ThyI、PI-Tli
I、およびPI-TliII、並びにこれらの機能的な誘導体制限酵素からなる群から選
択されるメガヌクレアーゼおよびその切断部位(または認識部位)、好ましくは、18塩
基以上の配列特異性を有する制限酵素であるメガヌクレアーゼおよびその切断部位(また
は認識部位)、特に細胞のゲノムを1箇所または複数箇所以上切断しないメガヌクレアー
ゼおよびその切断部位を用いることができる。
The terms "genome modification" or "genome editing" are used interchangeably and refer to the introduction of mutations at desired locations (target regions) on the genome. Genome modification is targeted region DNA
can include the use of sequence-specific nucleic acid cleaving molecules designed to cleave the In preferred embodiments, genomic modification may involve the use of nucleases engineered to cleave the DNA of the target region. In a preferred embodiment, genomic modification involves nucleases (e.g., TALENs) engineered to cleave target sequences with specific base sequences in the target region.
or ZFN). In a preferred embodiment, the genome modification involves the addition of 1 to the genome, such as a meganuclease, to cleave a target sequence having a specific base sequence in the target region.
Restriction enzymes with only one cleavage site (e.g., restriction enzymes with 16-base sequence specificity (theoretically, one in 4 16 bases exists), restriction enzymes with 17-base sequence specificity (theoretically using sequence-specific endonucleases such as 1 in 4 17 bases above) and restriction enzymes with 18-base sequence specificity (theoretically 1 in 4 18 bases) sometimes it is possible. Typically, the use of site-specific nucleases induces double-strand breaks (DSBs) in the DNA of the target region, followed by homologous directed repair (HDR) and non-homologous end recombination (Non- Homologous End-Joining Repair: NH
The genome is repaired by endogenous processes of the cell, such as EJ). NHEJ is a repair method that joins the ends of double-strand breaks without using donor DNA, and insertions and/or deletions (indels) are frequently induced during repair. HDR is a repair mechanism using donor DNA, and it is also possible to introduce desired mutations into target regions. As a genome modification technology, for example, the CRISPR/Cas system is preferably exemplified. Examples of meganucleases include I-SceI, I-SceII, I-SceIII, I-SceIV
, I-SceV, I-SceVI, I-SceVII, I-CeuI, I-CeuAII
P, I-CreI, I-CrepsbIP, I-CrepsbIIP, I-Crepsb
IIP, I-CrepsbIVP, I-TliI, I-PpoI, PI-PspI, F
- SceI, F-SceII, F-SuvI, F-TevI, F-TevII, I-Am
aI, I-AniI, I-ChuI, I-CmoeI, I-CpaI, I-CpaII,
I-CsmI, I-CvuI, I-CvuAIP, I-DdiI, I-DdiII, I-
DirI, I-DmoI, I-HmuI, I-HmuII, I-HsNIP, I-Lla
I, I-MsoI, I-NaaI, I-NanI, I-NclIP, I-NgrIP, I
- NitI, I - NjaI, I - Nsp236IP, I - PakI, I - PboIP, I
-PcuIP, I-PcuAI, I-PcuVI, I-PgrIP, I-PobIP, I
-PorI, I-PorIIP, I-PbpIP, I-SpBetaIP, I-ScaI
, I-SexIP, I-SneIP, I-SpomI, I-SpomCP, I-Spom
IP, I-SpomIIP, I-SquiIP, I-Ssp68031, I-SthPhi
JP, I-SthPhiST3P, I-SthPhiSTe3bP, I-TdeIP, I
-TevI, I-TevII, I-TevIII, I-UarAP, I-UarHGPA
IP, I-UarHGPA13P, I-VinIP, I-ZbiIP, PI-Mtul,
PI-MtuHIP PI-MtuHIIP, PI-PfuI, PI-PfuII, PI
-PkoI, PI-PkoII, PI-Rma43812IP, PI-SpBetaIP
, PI-SceI, PI-TfuI, PI-TfuII, PI-ThyI, PI-Tli
A meganuclease and its cleavage site (or recognition site) selected from the group consisting of I, and PI-TliII, and functional derivative restriction enzymes thereof, preferably a restriction enzyme having a sequence specificity of 18 bases or more Certain meganucleases and their cleavage sites (or recognition sites) can be used, particularly meganucleases and their cleavage sites that do not cut one or more of the genome of the cell.
「標的領域」という用語は、ゲノム改変の対象となるゲノム領域を指す。「欠失」は、
リファレンスゲノムに対する1塩基以上の欠失、および1遺伝子以上の欠失を含む。欠失
は、100bp以上の欠失、200bp以上の欠失、300bp以上の欠失、400bp
以上の欠失、500bp以上の欠失、600bp以上の欠失、700bp以上の欠失、8
00bp以上の欠失、900bp以上の欠失、1kbp以上の欠失、10kbp以上の欠
失、50kbp以上の欠失、100kbp以上の欠失、200kbp以上の欠失、300
kbp以上の欠失、400kbp以上の欠失、500kbp以上の欠失、または1Mbp
以上の欠失またはそれ以下の欠失であり得る。欠失は、1Mbp以下の欠失であり得る。
欠失は、700kbp以下の欠失であり得る。欠失は、600kbp以下の欠失であり得
る。欠失は、500kbp以下の欠失であり得る。欠失は、10kbp以上600kbp
以下の欠失であり得る。欠失は、100kbp以上600kbp以下の欠失であり得る。
欠失は、100kbp以上500kbp以下の欠失であり得る。
The term "target region" refers to the genomic region targeted for genomic modification. A "deletion" is
Including deletions of one or more bases relative to the reference genome, and deletions of one or more genes. Deletion is 100 bp or more deletion, 200 bp or more deletion, 300 bp or more deletion, 400 bp
≥ 500 bp deletion ≥ 600 bp deletion ≥ 700 bp deletion 8
00 bp or more deletion, 900 bp or more deletion, 1 kbp or more deletion, 10 kbp or more deletion, 50 kbp or more deletion, 100 kbp or more deletion, 200 kbp or more deletion, 300
kbp or greater deletion, 400 kbp or greater deletion, 500 kbp or greater deletion, or 1 Mbp
There can be more or less deletions. Deletions can be deletions of 1 Mbp or less.
Deletions can be deletions of 700 kbp or less. Deletions can be deletions of 600 kbp or less. Deletions can be deletions of 500 kbp or less. Deletion ≥ 10 kbp and 600 kbp
The deletion can be: Deletions can be deletions of 100 kbp or more and 600 kbp or less.
Deletions can be deletions of 100 kbp or more and 500 kbp or less.
「ドナーDNA」という用語は、DNAの二本鎖切断の修復に用いられるDNAであっ
て、標的領域周辺のDNAと相同組換え可能なDNAを指す。ドナーDNAは、ホモロジ
ーアームとして標的領域の上流の塩基配列および下流の塩基配列(例えば、標的領域に隣
接する塩基配列)を含む。本明細書においては、標的領域の上流側の塩基配列(例えば、
上流側に隣接する塩基配列)からなるホモロジーアームを「上流ホモロジーアーム」、標
的配列の下流側の塩基配列(例えば、下流側に隣接する塩基配列)からなるホモロジーア
ームを「下流ホモロジーアーム」と記載する場合がある。ドナーDNAは、上流ホモロジ
ーアームと下流ホモロジーアームとの間に、所望の塩基配列を含むことができる。各ホモ
ロジーアームの長さは、300bp以上が好ましく、通常500~3000bp程度であ
る。上流ホモロジーアーム及び下流ホモロジーアームの長さは、互いに同じであってもよ
く、異なっていてもよい。標的領域は、配列依存的な切断後にドナーDNAとの間で相同
組換えの誘発に成功すると、標的領域の上流の塩基配列および下流の塩基配列の間の配列
が、ドナーDNAの上流の塩基配列および下流の塩基配列に挟まれている配列と置き換わ
ることとなる。
The term "donor DNA" refers to DNA used to repair double-strand breaks in DNA that is capable of homologous recombination with the DNA surrounding the target region. The donor DNA contains a base sequence upstream of the target region and a base sequence downstream of the target region (eg, a base sequence flanking the target region) as homology arms. In the present specification, the nucleotide sequence upstream of the target region (e.g.,
A homology arm consisting of a nucleotide sequence adjacent to the upstream side is described as an "upstream homology arm", and a homology arm consisting of a nucleotide sequence downstream of the target sequence (for example, a nucleotide sequence adjacent to the downstream side) is described as a "downstream homology arm". sometimes. The donor DNA can contain the desired nucleotide sequence between the upstream homology arm and the downstream homology arm. The length of each homology arm is preferably 300 bp or more, and usually about 500 to 3000 bp. The lengths of the upstream homology arm and the downstream homology arm may be the same or different. When the target region successfully induces homologous recombination with the donor DNA after sequence-dependent cleavage, the sequence between the upstream and downstream sequences of the target region is the upstream sequence of the donor DNA. and the sequence flanked by the downstream nucleotide sequence.
標的領域の「上流」とは、標的領域の2本鎖DNAにおいて、基準となるヌクレオチド
鎖の5’側に位置するDNA領域を意味する。標的領域の「下流」とは、当該基準となる
ヌクレオチド鎖の3’側に位置するDNAを意味する。2本鎖のいずれの鎖を基準となる
ヌクレオチド鎖とするかは任意である。但し、便宜的に、標的領域がタンパク質コード配
列を含む場合、基準となるヌクレオチド鎖は、通常、センス鎖である。一般的に、プロモ
ーターは、タンパク質コード配列の上流に位置する。ターミネーターは、タンパク質コー
ド配列の下流に位置する。
“Upstream” of the target region means the DNA region located on the 5′ side of the reference nucleotide strand in the double-stranded DNA of the target region. "Downstream" of the target region means DNA located 3' to the reference nucleotide strand. It is arbitrary which strand of the double strand is used as the reference nucleotide strand. Conveniently, however, when the target region comprises a protein-coding sequence, the reference nucleotide strand is usually the sense strand. Generally, the promoter is positioned upstream from the protein-coding sequence. A terminator is located downstream of the protein-coding sequence.
「配列特異的核酸切断分子」という用語は、特定の核酸配列を認識し、前記特定の核酸
配列で核酸を切断することができる分子を指す。配列特異的核酸切断分子は、配列特異的
に核酸切断する活性(配列特異的核酸切断活性)を有する分子である。
The term "sequence-specific nucleic acid cleaving molecule" refers to a molecule capable of recognizing a specific nucleic acid sequence and cleaving nucleic acid at said specific nucleic acid sequence. A sequence-specific nucleic acid cleaving molecule is a molecule having a sequence-specific nucleic acid cleaving activity (sequence-specific nucleic acid cleaving activity).
「標的配列」という用語は、配列特異的核酸切断分子による切断の対象となるゲノム中
のDNA配列を指す。配列特異的核酸切断分子がCasタンパク質である場合、標的配列
は、Casタンパク質による切断の対象となるゲノム中のDNA配列を指す。Casタン
パク質としてCas9タンパク質を用いる場合、標的配列は、プロトスペーサー隣接モチ
ーフ(PAM)の5’側に隣接する配列である必要がある。標的配列は、通常、PAMの
5’側直前に隣接する17~30塩基(好ましくは18~25塩基、より好ましくは19
~22塩基、さらに好ましくは20塩基)の配列が選択される。標的配列の設計には、C
RISPR DESIGN(crispr.mit.edu/)等の公知のデザインツー
ルを利用することができる。
The term "target sequence" refers to a DNA sequence in the genome that is targeted for cleavage by a sequence-specific nucleolytic molecule. When the sequence-specific nucleic acid cleaving molecule is a Cas protein, the target sequence refers to the DNA sequence in the genome to be cleaved by the Cas protein. When using the Cas9 protein as the Cas protein, the target sequence should be the sequence flanking the 5' side of the protospacer adjacent motif (PAM). The target sequence is usually 17 to 30 bases (preferably 18 to 25 bases, more preferably 19 bases) immediately preceding the 5′ side of PAM.
A sequence of ~22 bases, more preferably 20 bases) is selected. For the design of target sequences, C
A known design tool such as RISPR DESIGN (crispr.mit.edu/) can be used.
「Casタンパク質」という用語は、CRISPR関連(CRISPR-associ
ated)タンパク質を指す。好ましい態様において、Casタンパク質は、ガイドRN
Aと複合体を形成し、エンドヌクレアーゼ活性又はニッカーゼ活性を示す。Casタンパ
ク質としては、特に限定されないが、例えば、Cas9タンパク質、Cpf1タンパク質
、C2c1タンパク質、C2c2タンパク質、及びC2c3タンパク質等が挙げられる。
Casタンパク質は、ガイドRNAと協働してエンドヌクレアーゼ活性又はニッカーゼ活
性を示す限り、野生型Casタンパク質及びそのホモログ(パラログ及びオーソログ)、
並びにそれらの変異体を包含する。
好ましい態様において、Casタンパク質は、クラス2のCRISPR/Cas系に関
与するものであり、より好ましくはII型のCRISPR/Cas系に関与するものであ
る。Casタンパク質の好ましい例としては、Cas9タンパク質が例示される。Cas
タンパク質の好ましい例としては、Cas3タンパク質が例示される。
The term "Cas protein" refers to the CRISPR-associated
ated) refers to proteins. In a preferred embodiment, the Cas protein is a guide RN
It forms a complex with A and exhibits endonuclease activity or nickase activity. Examples of Cas proteins include, but are not limited to, Cas9 protein, Cpf1 protein, C2c1 protein, C2c2 protein, and C2c3 protein.
the wild-type Cas protein and its homologs (paralogs and orthologs), as long as the Cas protein exhibits endonuclease activity or nickase activity in cooperation with the guide RNA;
and variants thereof.
In preferred embodiments, the Cas protein is involved in a
A preferred example of the protein is Cas3 protein.
「Cas9タンパク質」という用語は、II型のCRISPR/Cas系に関与するC
asタンパク質を指す。Cas9タンパク質は、ガイドRNAと複合体を形成し、ガイド
RNAと協働して標的領域のDNAを切断する活性を示す。Cas9タンパク質は、前記
の活性を有する限り、野生型Cas9タンパク質及びそのホモログ(パラログ及びオーソ
ログ)、並びにそれらの変異体を包含する。野生型Cas9タンパク質は、ヌクレアーゼ
ドメインとしてRuvCドメイン及びHNHドメインを有するが、本明細書におけるCa
s9タンパク質は、RuvCドメイン及びHNHドメインのいずれか一方が不活性化され
たものであってもよい。RuvCドメイン及びHNHドメインのいずれか一方が不活性化
されたCas9は、二本鎖DNAに対して一本鎖切断(ニック)を導入する。そのため、
RuvCドメイン及びHNHドメインのいずれか一方が不活性化されたCas9を二本鎖
DNAの切断に用いる場合には、センス鎖とアンチセンス鎖それぞれに対してCas9の
標的配列を設定し、センス鎖およびアンチセンス差のニックが十分に近い位置で生じ、そ
れにより二本鎖切断が誘発されるように、改変システムを構成することができる。
Cas9タンパク質が由来する生物種は特に限定されないが、ストレプトコッカス(S
treptococcus)属、スタフィロコッカス(Staphylococcus)
属、ナイセリア(Neisseria)属、又はトレポネーマ(Treponema)属
に属する細菌等が好ましく例示される。より具体的には、S.pyogenes、S.t
hermophilus、S.aureus、N.meningitidis、又はT.
denticola等に由来するCas9タンパク質が好ましく例示される。好ましい態
様において、Cas9タンパク質は、S.pyogenes由来のCas9タンパク質で
ある。
The term "Cas9 protein" refers to the C
refers to the as protein. The Cas9 protein forms a complex with the guide RNA and exhibits the activity of cleaving the DNA of the target region in cooperation with the guide RNA. Cas9 proteins include wild-type Cas9 proteins and their homologues (paralogs and orthologs), and variants thereof, as long as they have the above activity. The wild-type Cas9 protein has the RuvC and HNH domains as nuclease domains, whereas the Ca
The s9 protein may have either one of the RuvC domain and the HNH domain inactivated. Cas9 with either one of the RuvC domain and HNH domain inactivated introduces a single-strand break (nick) into the double-stranded DNA. for that reason,
When one of the RuvC domain and HNH domain is inactivated Cas9 is used for cleaving double-stranded DNA, the target sequence of Cas9 is set for each of the sense strand and the antisense strand, and the sense strand and Modified systems can be constructed such that the antisense differential nicks occur in sufficiently close positions to induce a double-strand break.
The biological species from which the Cas9 protein is derived is not particularly limited, but Streptococcus (S
treptococcus) genus, Staphylococcus
Bacteria belonging to the genus Neisseria or Treponema are preferably exemplified. More specifically, S. pyogenes, S.; t
hermophilus, S. aureus, N. meningitidis, or T.
Cas9 protein derived from denticola and the like is preferably exemplified. In preferred embodiments, the Cas9 protein is derived from S. cerevisiae. pyogenes Cas9 protein.
各種Casタンパク質のアミノ酸配列、及びそのコード配列の情報は、GenBank
、UniProt、Addgene等の各種データベース上で得ることができる。例えば
、S.pyogenesのCas9タンパク質のアミノ酸配列は、プラスミド番号422
30としてAddgeneに登録されたもの等を用いることができる。S.pyogen
esのCas9タンパク質のアミノ酸配列の一例を配列番号1に示す。
Amino acid sequences of various Cas proteins and information on their coding sequences are available at GenBank
, UniProt, and Addgene. For example, S. The amino acid sequence of the Cas9 protein of pyogenes is plasmid number 422
30 registered with Addgene can be used. S. pyogen
An example of the amino acid sequence of the Cas9 protein of es is shown in SEQ ID NO:1.
「ガイドRNA」及び「gRNA」という用語は、相互に互換的に使用され、Casタ
ンパク質と複合体を形成し、Casタンパク質を標的領域に誘導することができるRNA
を指す。好ましい態様において、ガイドRNAは、CRISPR RNA(crRNA)
及びトランス活性化型CRISPR RNA(tracrRNA)を含む。crRNAは
、ゲノム上の標的領域への結合に関与し、tracrRNAは、Casタンパク質との結
合に関与する。好ましい態様において、crRNAは、スペーサー配列とリピート配列と
を含み、スペーサー配列が標的領域において標的配列の相補鎖と結合する。好ましい態様
において、tracrRNAは、アンチリピート配列と3’テイル配列とを含む。アンチ
リピート配列はcrRNAのリピート配列と相補的な配列を有し、リピート配列と塩基対
を形成し、3’テイル配列は通常3つのステムループを形成する。
ガイドRNAは、crRNAの3’末端にtracrRNAの5’末端を連結した単一
ガイドRNA(sgRNA)であってもよく、crRNA及びtracrRNAを別々の
RNA分子とし、リピート配列及びアンチリピート配列で塩基対を形成させたものであっ
てもよい。好ましい態様において、ガイドRNAはsgRNAである。
The terms "guide RNA" and "gRNA" are used interchangeably and refer to an RNA capable of forming a complex with a Cas protein and directing the Cas protein to a target region.
point to In a preferred embodiment, the guide RNA is CRISPR RNA (crRNA)
and transactivating CRISPR RNA (tracrRNA). crRNA is involved in binding to target regions on the genome, and tracrRNA is involved in binding to Cas proteins. In preferred embodiments, the crRNA comprises a spacer sequence and a repeat sequence, and the spacer sequence binds to the complementary strand of the target sequence in the target region. In preferred embodiments, the tracrRNA comprises an anti-repeat sequence and a 3' tail sequence. The anti-repeat sequence has a sequence complementary to the repeat sequence of crRNA, forms a base pair with the repeat sequence, and the 3' tail sequence usually forms three stem loops.
The guide RNA may be a single guide RNA (sgRNA) in which the 5' end of tracrRNA is ligated to the 3' end of crRNA, wherein crRNA and tracrRNA are separate RNA molecules, and the repeat and anti-repeat sequences are base-paired. may be formed. In preferred embodiments, the guide RNA is an sgRNA.
crRNAのリピート配列及びtracrRNAの配列は、Casタンパク質の種類に
応じて適宜選択することができ、Casタンパク質と同じ細菌種に由来するものを用いる
ことができる。
例えば、S.pyogenes由来のCas9タンパク質を用いる場合、sgRNAの
長さは、50~220ヌクレオチド(nt)程度とすることができ、60~180nt程
度が好ましく、80~120nt程度がより好ましい。crRNAの長さは、スペーサー
配列を含めて約25~70塩基長とすることができ、25~50nt程度が好ましい。t
racrRNAの長さは10~130nt程度とすることができ、30~80nt程度が
好ましい。
crRNAのリピート配列は、Casタンパク質が由来する細菌種におけるものと同じ
であってもよく、3’末端の一部を削除したものであってもよい。tracrRNAは、
Casタンパク質が由来する細菌種における成熟tracrRNAと同じで配列を有して
いてもよく、当該成熟tracrRNAの5’末端及び/又は3’末端を切断した末端切
断型であってもよい。例えば、tracrRNAは、成熟tracrRNAの3’末端か
ら1~40個程度のヌクレオチド残基を除去した末端切断型であり得る。また、trac
rRNAは、成熟tracrRNAの5’末端から1~80個程度のヌクレオチド残基を
除去した末端切断型であり得る。また、tracrRNAは、例えば、5’末端から1~
20程度のヌクレオチド残基を除去し、かつ3’末端から1~40個程度のヌクレオチド
残基を除去した末端切断型であり得る。
sgRNA設計のためのcrRNAリピート配列及びtracrRNAの配列は、種々
提案されており、当業者は、公知技術に基づいてsgRNAを設計することができる(例
えば、Jinek et al. (2012) Science, 337, 816
-21; Mali et al. (2013) Science, 339: 61
21, 823-6; Cong et al. (2013) Science, 3
39: 6121, 819-23; Hwang et al. (2013) Na
t. Biotechnol. 31: 3, 227-9; Jinek et al
. (2013) eLife, 2, e00471)。
The repeat sequence of crRNA and the sequence of tracrRNA can be appropriately selected according to the type of Cas protein, and those derived from the same bacterial species as the Cas protein can be used.
For example, S. When using a Cas9 protein derived from pyogenes, the length of the sgRNA can be about 50 to 220 nucleotides (nt), preferably about 60 to 180 nt, more preferably about 80 to 120 nt. The length of the crRNA can be about 25-70 bases including the spacer sequence, preferably about 25-50 nt. t
The length of the racrRNA can be about 10-130 nt, preferably about 30-80 nt.
The repeat sequence of the crRNA may be the same as in the bacterial species from which the Cas protein is derived, or may be partially truncated at the 3' end. tracrRNA is
It may have the same sequence as the mature tracrRNA in the bacterial species from which the Cas protein is derived, or may be a truncated form obtained by truncating the 5'-end and/or 3'-end of the mature tracrRNA. For example, the tracrRNA can be truncated by removing as many as 1-40 nucleotide residues from the 3' end of the mature tracrRNA. Also, trac
The rRNA can be truncated by removing as many as 1-80 nucleotide residues from the 5' end of the mature tracrRNA. In addition, tracrRNA is, for example, 1 to
It may be a truncated form with as many as 20 nucleotide residues removed and as many as 1-40 nucleotide residues removed from the 3' end.
Various crRNA repeat sequences and tracrRNA sequences for sgRNA design have been proposed, and those skilled in the art can design sgRNAs based on known techniques (for example, Jinek et al. (2012) Science, 337, 816
-21; Mali et al. (2013) Science, 339: 61
21, 823-6; Cong et al. (2013) Science, 3
39: 6121, 819-23; Hwang et al. (2013) Na
t. Biotechnol. 31: 3, 227-9; Jinek et al.
. (2013) eLife, 2, e00471).
「プロトスペーサー隣接モチーフ」及び「PAM」という用語は、相互に互換的に使用
され、Casタンパク質によるDNA切断の際に、Casタンパク質に認識される配列を
指す。PAMの配列及び位置は、Casタンパク質の種類によって異なる。例えば、Ca
s9タンパク質の場合、PAMは標的配列の3’側直後に隣接する必要がある。Cas9
タンパク質に対応するPAMの配列は、Cas9タンパク質が由来する細菌種によって異
なっている。例えば、S.pyogenesのCas9タンパク質に対応するPAMは「
NGG」であり、S.thermophilusのCas9タンパク質に対応するPAM
は「NNAGAA」であり、S.aureusのCas9タンパク質に対応するPAMは
「NNGRRT」又は「NNGRR(N)」であり、N.meningitidisのC
as9タンパク質に対応するPAMは「NNNNGATT」であり、T.dentico
laのCas9タンパク質に対応する「NAAAAC」である(「R」はA又はG;「N
」は、A、T、G又はC)。
The terms "protospacer adjacent motif" and "PAM" are used interchangeably and refer to sequences recognized by Cas proteins upon DNA cleavage by the Cas proteins. The sequence and position of PAM differ depending on the type of Cas protein. For example, Ca
For s9 proteins, the PAM should immediately flank the 3' side of the target sequence. Cas9
The PAM sequence corresponding to the protein varies depending on the bacterial species from which the Cas9 protein is derived. For example, S. The PAM corresponding to the Cas9 protein of pyogenes is "
NGG", and S. PAM corresponding to thermophilus Cas9 protein
is "NNAGAA"; The PAM corresponding to the Cas9 protein of N. aureus is "NNGRRT" or "NNGRR(N)"; C for meningitidis
The PAM corresponding to the as9 protein is "NNNNGATT"; dentico
"NAAAC" corresponding to the Cas9 protein of Cas9 ("R" is A or G; "N
' is A, T, G or C).
「スペーサー配列」及び「ガイド配列」という用語は、相互に互換的に使用され、ガイ
ドRNAに含まれる配列であって、標的配列の相補鎖と結合し得る配列を指す。通常、ス
ペーサー配列は、標的配列と同一の配列である(但し、標的配列中のTは、スペーサー配
列ではUとなる)。本発明の実施態様において、スペーサー配列は、標的配列に対して1
塩基又は複数塩基のミスマッチを含むことができる。複数塩基のミスマッチを含む場合、
隣接した位置にミスマッチを有していてもよく、離れた位置にミスマッチを有していても
よい。好ましい態様において、スペーサー配列は、標的配列に対して1~5塩基のミスマ
ッチを含み得る。特に好ましい態様において、スペーサー配列は、標的配列に対して1塩
基のミスマッチを含み得る。
ガイドRNAにおいて、スペーサー配列は、crRNAの5’側に配置される。
The terms "spacer sequence" and "guide sequence" are used interchangeably and refer to a sequence contained in a guide RNA that is capable of binding a complementary strand of a target sequence. The spacer sequence is usually the same sequence as the target sequence (provided that T in the target sequence becomes U in the spacer sequence). In an embodiment of the invention, the spacer sequence is 1
It can contain mismatches of a base or multiple bases. If it contains multiple base mismatches,
There may be mismatches at adjacent positions or mismatches at distant positions. In preferred embodiments, the spacer sequence may contain 1-5 base mismatches to the target sequence. In particularly preferred embodiments, the spacer sequence may contain a single base mismatch to the target sequence.
In the guide RNA, the spacer sequence is placed 5' to the crRNA.
ポリヌクレオチドに関して用いる「機能的に連結」という用語は、第一の塩基配列が第
二の塩基配列に十分に近くに配置され、第一の塩基配列が第二の塩基配列又は第二の塩基
配列の制御下の領域に影響を及ぼしうることを意味する。例えば、ポリヌクレオチドがプ
ロモーターに機能的に連結するとは、当該ポリヌクレオチドが、当該プロモーターの制御
下で発現するように連結されていることを意味する。
The term "operably linked" as used in reference to polynucleotides means that a first base sequence is positioned sufficiently close to a second base sequence such that the first base sequence is either the second base sequence or the second base sequence. means that it can affect areas under the control of For example, that a polynucleotide is operably linked to a promoter means that the polynucleotide is linked so that it is expressed under the control of the promoter.
「発現可能な状態」という用語は、ポリヌクレオチドが導入された細胞内で、該ポリヌ
クレオチドが転写され得る状態にあることを指す。
「発現ベクター」という用語は、対象ポリヌクレオチドを含むベクターであって、該ベ
クターを導入した細胞内で、対象ポリヌクレオチドを発現可能な状態にするシステムを備
えたベクターを指す。例えば、「Casタンパク質の発現ベクター」とは、該ベクターを
導入した細胞内で、Casタンパク質を発現可能なベクターを意味する。また、例えば、
「ガイドRNAの発現ベクター」とは、該ベクターを導入した細胞内で、ガイドRNAを
発現可能なベクターを意味する。
The term "expressible state" refers to a state in which a polynucleotide can be transcribed in a cell into which the polynucleotide has been introduced.
The term "expression vector" refers to a vector that contains a polynucleotide of interest and is equipped with a system that renders the polynucleotide of interest expressible in a cell into which the vector is introduced. For example, "expression vector for Cas protein" means a vector capable of expressing Cas protein in cells introduced with the vector. Also, for example,
“Guide RNA expression vector” means a vector capable of expressing a guide RNA in a cell into which the vector has been introduced.
本明細明細書において、塩基配列どうし又はアミノ酸配列どうしの配列同一性(又は相
同性)は、2つの塩基配列又はアミノ酸配列を、対応する塩基又はアミノ酸が最も多く一
致するように、挿入及び欠失に当たる部分にギャップを入れながら並置し、得られたアラ
インメント中のギャップを除く、塩基配列全体又はアミノ酸配列全体に対する一致した塩
基又はアミノ酸の割合として求められる。塩基配列又はアミノ酸配列どうしの配列同一性
は、当該技術分野で公知の各種相同性検索ソフトウェアを用いて求めることができる。塩
基配列の配列同一性の値(Identity値)は、特に限定されないが例えば、公知の
相同性検索ソフトウェアUCSC Genome Browserに搭載されているBL
AT検索により得ることができる。
As used herein, sequence identity (or homology) between base sequences or between amino acid sequences refers to insertions and deletions of two base sequences or amino acid sequences such that the corresponding bases or amino acids match the most. The ratio of matching bases or amino acids to the entire base sequence or the entire amino acid sequence excluding the gaps in the resulting alignment is calculated. Sequence identity between nucleotide sequences or amino acid sequences can be determined using various homology search software known in the art. The sequence identity value (Identity value) of the base sequence is not particularly limited, but for example, BL installed in the known homology search software UCSC Genome Browser
Can be obtained by AT search.
本明細書では、便宜的にヒトゲノムの位置を参照するときに、リファレンスゲノムとし
てhg38ゲノム配列における位置を用いる。hg38は、カリフォルニア大学サンタク
ルーズ校(UCSC)により2013年12月にリリースされたリファレンスゲノムであ
る。リファレンスゲノムは、様々なゲノムを組み合わせて作成された参照用のゲノムであ
り、このゲノムを有するヒトが存在するというわけではない。しかし、ヒト個体のゲノム
DNAから解読された断片的な配列情報をリファレンスゲノムに照らすことによって解読
された断片的な配列情報を連結してコンピュータ上で一つながりの配列を構築し、これに
より当該ヒト個体のゲノムDNAの配列を推定することができる。このようにして、リフ
ァレンスゲノムにヒト個体のゲノムDNAの配列を対応付けることによって、ヒト個体等
の個体のゲノムDNAを解読することが通常なされている。そして、hg38ゲノム配列
の特定位置または特定領域に対応する位置または領域とは、具体的な配列の異なる別個体
のゲノムにおいて、当該特定位置または特定領域に紐付けられる位置または領域を意味す
る。具体的には、配列の同一性に基づき、当該位置または領域に特徴的な配列を有する位
置または領域が、hg38ゲノム配列の特定位置または特定領域に対応する位置または領
域である。対応する位置は、2つのゲノムDNAの部分配列のアラインメントにより決定
することができる。具体的な配列に相違がある場合であっても、オーソログの関係を有し
ていたり、配列同一性を有していてアラインメントをすることによって、2つのゲノムD
NAの対応関係を決定することができる。遺伝子重複により生じたパラログが豊富な領域
では、単純な個別の配列に基づく配列の対応関係を決定するだけでは、2つのゲノム間の
真の対応関係を決定するには十分でない場合がある。このことが類似配列が集積した領域
の配列解読の難易度を増加させる。対応する配列の決定に際して、高い配列同一性を求め
ることで2つのゲノム間の対応関係を明らかにすることができる。また、特定領域が、複
数遺伝子を含む大きな領域である場合には、シンテニーを考慮することができる。シンテ
ニーとは、ゲノム上でのオーソログの物理的位置的関係が保存されていることをいう。個
人間および生物間でシンテニーを有し得る。したがって、シンテニーを考慮して特定領域
を決定することができる。
For convenience herein, locations in the hg38 genome sequence are used as reference genomes when referring to locations in the human genome. hg38 is a reference genome released in December 2013 by the University of California, Santa Cruz (UCSC). A reference genome is a reference genome created by combining various genomes, and it does not mean that a human having this genome exists. However, the fragmentary sequence information decoded from the genomic DNA of the human individual is linked to the reference genome, and the fragmentary sequence information decoded is linked to construct a series of sequences on a computer. The sequence of an individual's genomic DNA can be deduced. In this way, it is common practice to decode the genomic DNA of an individual such as a human individual by associating the sequence of the genomic DNA of the human individual with the reference genome. Further, the position or region corresponding to the specific position or specific region of the hg38 genome sequence means the position or region linked to the specific position or specific region in separate genomes with different specific sequences. Specifically, a position or region having a sequence characteristic of that position or region based on sequence identity is a position or region corresponding to a specific position or region of the hg38 genome sequence. Corresponding positions can be determined by alignment of the partial sequences of the two genomic DNAs. Even if there are differences in the specific sequences, the two genomes D can be aligned by having an orthologous relationship or having sequence identity.
NA correspondences can be determined. In regions rich in paralogs generated by gene duplication, determining sequence correspondences based on simple individual sequences may not be sufficient to determine true correspondences between two genomes. This increases the difficulty of sequence decoding in regions where similar sequences accumulate. When determining the corresponding sequences, the correspondence between the two genomes can be clarified by seeking high sequence identity. Synteny can also be considered when the specified region is a large region containing multiple genes. Synteny means preservation of the physical positional relationship of orthologs on the genome. Can have synteny between individuals and between organisms. Therefore, the specific region can be determined in consideration of synteny.
[ライブラリの作製方法]
ライブラリの作製方法は、細胞を用意することを含み得る。用意する細胞は、本開示の
改変前の細胞であり、改変後の細胞と比較する際の参照となり得ることから「リファレン
ス細胞」ということがある。細胞は、好ましくは、クローン化された細胞、株化された細
胞、または不死化細胞であり得る。ある好ましい態様では、細胞は、単一種類を含み得る
。本開示のライブラリーでは、特定遺伝子座の特定領域のみが目的配列に置き換わった細
胞のライブラリーが提供される。目的配列以外の配列を統一すると目的配列に置き換わる
ことの技術的意義を明らかにできるという観点で、細胞は単一種類の細胞からなることが
好ましい。単一種類の細胞は、クローン化された細胞である。
[Method for preparing a library]
A method of making a library can include providing a cell. The cells to be prepared are cells before the modification of the present disclosure, and can be used as a reference for comparison with cells after modification, so they are sometimes referred to as “reference cells”. Cells may preferably be cloned, established or immortalized cells. In some preferred embodiments, cells may comprise a single type. The library of the present disclosure provides a library of cells in which only specific regions of specific loci have been replaced with sequences of interest. From the viewpoint that the technical significance of substituting the target sequence can be clarified by unifying the sequences other than the target sequence, the cells are preferably composed of a single type of cell. A single type of cell is a cloned cell.
第一の作製形態の概要
概要は、図1に示される。
ライブラリの作製方法は、細胞対して下記ゲノム改変方法を用いて、第一の中間体細胞
を得ることを含み得る。第一の中間体細胞は、改変対象である遺伝子座に第一のアレルと
第二のアレルを含むゲノムを有する細胞において、前記第一のアレルと第二のアレルそれ
ぞれに選択マーカー遺伝子と標的核酸配列を含むカセットを有する細胞である。第一の中
間体細胞では、第一のアレルが有する選択マーカー遺伝子と第二のアレルが有する選択マ
ーカー遺伝子とは区別可能に異なり、前記標的核酸配列は、ゲノム改変システムの標的で
あり、ゲノム改変システムにより第一のアレルと第二のアレルとを区別可能に切断できる
ように設計されており、各選択マーカー遺伝子はネガティブ選択に用いることができるネ
ガティブ選択用マーカー遺伝子である。ネガティブ選択用マーカー遺伝子は、ポジティブ
選択用にも用いることができるもの(例えば、可視化マーカー遺伝子等)であってよい。
ライブラリの作製方法は、第一の中間体細胞から、改変細胞のライブラリー(「第一の改
変細胞のライブラリー」または単に「第一のライブラリー」ということがある)を得るこ
とを含み得る。第一のライブラリーに含まれる改変細胞を「第一の改変細胞」ということ
がある。
第一の中間体細胞は、当業者であれば適宜得ることができる。特に限定されないが、以
下に説明するゲノム改変方法を用いることにより、簡便に作製することができる。中間体
細胞からの改変細胞の取得は、改変塩基配列導入用ドナーDNAの存在下で、第一のカセ
ット内またはその近傍を切断することにより達成され得る。
A schematic overview of the first fabrication mode is shown in FIG.
A method of making a library may comprise using the genome modification method described below on a cell to obtain a first intermediate cell. The first intermediate cell is a cell having a genome containing a first allele and a second allele at the genetic locus to be modified, wherein each of the first allele and the second allele contains a selectable marker gene and a target nucleic acid. A cell with a cassette containing the sequence. In the first intermediate cell, the selectable marker gene possessed by the first allele and the selectable marker gene possessed by the second allele are distinguishably different, the target nucleic acid sequence is a target of a genome modification system, and genome modification is performed. Each selection marker gene is a negative selection marker gene that can be used for negative selection, and is designed so that the system can distinguishably cleave the first allele and the second allele. A marker gene for negative selection may be one that can also be used for positive selection (eg, a visualization marker gene, etc.).
A method of making a library can include obtaining a library of modified cells (sometimes referred to as a "first modified cell library" or simply a "first library") from a first intermediate cell. . The modified cells contained in the first library are sometimes referred to as "first modified cells".
The first intermediate cell can be appropriately obtained by those skilled in the art. Although not particularly limited, it can be easily produced by using the genome modification method described below. Obtaining a modified cell from an intermediate cell can be achieved by cleaving within or near the first cassette in the presence of the donor DNA for introducing the modified nucleotide sequence.
第二の作製形態の概要
概要は、図1に示される。
ライブラリの作製方法は、細胞に対して下記ゲノム改変方法を用いて、第一の中間体細
胞を得ることを含み得る。ライブラリの作製方法は、第一の中間体細胞から第二の中間体
細胞を得ることを含みうる。ライブラリの作製方法は、第二の中間体細胞からライブラリ
を得ることを含みうる。ここで、第一の中間体細胞は、上述の通りである。第二の中間体
細胞は、改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲノムを有する細
胞において、前記第一のアレルに選択マーカー遺伝子と標的核酸配列を含むカセットを有
し、第二のアレルには当該カセットを含まない、細胞である。第二の中間体細胞は、第一
の中間体細胞の第二のアレルから前記カセットを除去することにより作製することができ
る。カセットの除去は、ゲノム改変方法により当業者でれあれば適宜実施することができ
る。具体的には、切断時にカセットの上流と相同組換え可能な上流ホモロジーアームと当
該カセットの下流と相同組換え可能な下流ホモロジーアームとを有するドナーDNAの存
在下で、第二のアレルに含まれる標的配列を切断することができるゲノム改変システムを
第一の中間体細胞に適用することにより、第一の中間体細胞から第二の中間体細胞を得る
ことができる。ライブラリの作製方法は、第二の中間体細胞から、改変細胞のライブラリ
ー(「第二の改変細胞のライブラリー」または単に「第二のライブラリー」ということが
ある)を得ることを含み得る。第二のライブラリーに含まれる改変細胞を「第二の改変細
胞」ということがある。第一の中間体細胞からの第二の中間体細胞の取得は、カセット除
去用ドナーDNAの存在下で、第二のカセット内またはその近傍の配列を切断することに
よって達成され得る。第二の中間体細胞からの改変細胞の取得は、改変塩基配列導入用ド
ナーDNAの存在下で、第一のカセットを切断することにより達成され得る。
A schematic overview of the second fabrication mode is shown in FIG.
A method of making a library may comprise using the genome modification method described below on a cell to obtain a first intermediate cell. A method of making a library can include obtaining a second intermediate cell from a first intermediate cell. A method of making a library can include obtaining a library from a second intermediate cell. Here, the first intermediate cell is as described above. The second intermediate cell is a cell having a genome containing a first allele and a second allele at the genetic locus to be modified, and has a cassette containing a selection marker gene and a target nucleic acid sequence at the first allele. However, the second allele is a cell that does not contain the cassette. A second intermediate cell can be made by removing the cassette from the second allele of the first intermediate cell. Removal of the cassette can be appropriately carried out by those skilled in the art by a genome modification method. Specifically, in the presence of a donor DNA having an upstream homology arm capable of homologous recombination upstream of the cassette and a downstream homology arm capable of homologous recombination downstream of the cassette at the time of cleavage, included in the second allele A second intermediate cell can be obtained from the first intermediate cell by applying a genome modification system capable of cleaving the target sequence to the first intermediate cell. A method of making a library can include obtaining a library of modified cells (sometimes referred to as a "second modified cell library" or simply a "second library") from a second intermediate cell. . The modified cells contained in the second library are sometimes referred to as "second modified cells". Obtaining a second intermediate cell from a first intermediate cell can be accomplished by cleaving sequences in or near the second cassette in the presence of cassette removal donor DNA. Obtaining the modified cell from the second intermediate cell can be achieved by cleaving the first cassette in the presence of the donor DNA for introducing the modified nucleotide sequence.
第二の作製形態の変形例
第二の作製形態では、第二の中間体細胞を第一の中間体細胞の第二のアレルから前記カ
セットを除去することにより作製した。第二の作製形態の変形例では、第一の中間体細胞
の第二のアレルにおけるカセットを除去して、第二のアレルを改変前の配列に戻す操作を
行い、前記第一のアレルに選択マーカー遺伝子と標的核酸配列を含むカセットを有し、第
二のアレルは、改変前の配列を有する第三の中間体細胞を得る。第二の作製形態の変形例
では、その後、第三の中間体細胞の第一のアレルに対してライブラリ作製用ドナーDNA
を適用して改変細胞のライブラリーを得る。この態様では、改変細胞のライブラリーに含
まれる改変細胞は、第一のアレルに改変塩基配列を含み、第二のアレルは改変前の配列を
有する。第一の中間体細胞の第二のアレルを改変前の配列に戻す操作は、第二のカセット
の上流と相同組換え可能な上流ホモロジーアームと当該カセットの下流と相同組換え可能
な下流ホモロジーアームとからなるドナーDNAの存在下で、第二のカセット内またはそ
の近傍を切断することにより達成され得る。
Variations of Second Modification of Construction In a second modification of construction , a second intermediate cell was generated by removing the cassette from the second allele of the first intermediate cell. In a modification of the second production mode, the cassette in the second allele of the first intermediate cell is removed, and the second allele is returned to the sequence before modification, and the first allele is selected. A third intermediate cell is obtained having a cassette containing a marker gene and a target nucleic acid sequence, the second allele having the sequence prior to modification. In a variation of the second production mode, then donor DNA for library production against the first allele of the third intermediate cell
is applied to obtain a library of modified cells. In this embodiment, the modified cells contained in the library of modified cells contain the modified base sequence in the first allele and the second allele has the sequence before modification. The operation of returning the second allele of the first intermediate cell to the sequence before modification includes an upstream homology arm capable of homologous recombination upstream of the second cassette and a downstream homology arm capable of homologous recombination downstream of the cassette can be achieved by cleaving within or near the second cassette in the presence of donor DNA consisting of:
本開示では、第一の中間体細胞、第二の中間体細胞、これらの中間体細胞を含む組成物
、第一の改変細胞、第一のライブラリー、第二の改変細胞、および第二のライブラリーが
提供される。
The present disclosure provides a first intermediate cell, a second intermediate cell, a composition comprising these intermediate cells, a first modified cell, a first library, a second modified cell, and a second A library is provided.
一般的に、ゲノム編集においては、標的領域を有するゲノムに対して、標的領域の上流
と相同組換え可能な上流ホモロジーアーム(例えば、相補的配列を有する)と当該標的領
域の下流と相同組換え可能な下流ホモロジーアーム(例えば、相補的配列を有する)を有
するドナーDNAの存在下で、典型的には当該標的領域内に切断を生じさせることにより
、標的領域がドナーDNA中の上流ホモロジーアームと下流ホモロジーアームで挟まれた
配列に置き換わる。上流ホモロジーアームと下流ホモロジーアームで挟まれた配列が存在
しない場合には、標的領域が欠失する(またはシームレスに欠失する)。ゲノム編集にお
いては、標的領域内に複数箇所の切断を生じさせてもよい。典型的には、上流ホモロジー
アームに近接した標的領域内と下流ホモロジーアームに近接した標的領域内のそれぞれに
切断を生じさせることが有益である。
Generally, in genome editing, for a genome having a target region, an upstream homology arm (for example, having a complementary sequence) capable of homologous recombination upstream of the target region and a homologous recombination downstream of the target region In the presence of donor DNA that has a possible downstream homology arm (e.g., has a complementary sequence), the target region is isolated from the upstream homology arm in the donor DNA, typically by causing cleavage within the target region. It replaces the sequence flanked by the downstream homology arms. If the sequence flanked by the upstream homology arm and the downstream homology arm is absent, the target region is deleted (or seamlessly deleted). In genome editing, multiple cuts may be generated within the target region. Typically, it is beneficial to have the cleavage occur within the target region adjacent to the upstream homology arm and within the target region adjacent to the downstream homology arm, respectively.
ある好ましい態様では、第一の中間体細胞においては、第一のアレルおよび第二のアレ
ルは、標的領域のカセットによる置換がそれぞれなされ、第一のアレルおよび第二のアレ
ルは、当該標的領域の欠失を有していてもよい。また、ある好ましい態様では、第一のア
レルおよび第二のアレルは、標的領域へのカセットの挿入がなされ、第一のアレルおよび
第二のアレルは、当該標的領域の欠失を有しなくてもよい。ある好ましい態様では、標的
領域のカセットの挿入は、機能を有しない標的領域中になされ、したがって、当該標的領
域の破壊に伴う機能低下または欠損を伴わない。
In one preferred embodiment, in the first intermediate cell, the first allele and the second allele are each replaced by a cassette of the target region, and the first allele and the second allele are It may have deletions. Also, in certain preferred embodiments, the first allele and the second allele have an insertion of the cassette into the target region, and the first allele and the second allele have no deletion of the target region. good too. In certain preferred embodiments, the insertion of the target region cassette is into a non-functional target region, and thus is not accompanied by loss of function or loss associated with disruption of the target region.
本実施形態のゲノム改変方法に用いる細胞は、特に限定されず、1倍体または2倍体以
上の染色体ゲノムを有する細胞であればよい。細胞は、2倍体であってもよく、3倍体で
あってもよく、4倍体以上であってもよい。細胞としては、特に限定されないが、真核生
物の細胞が挙げられる。細胞は、植物細胞であってもよく、動物細胞であってもよく、真
菌細胞であってもよい。動物細胞は、特に限定されないが、ヒト、ヒト以外の哺乳動物(
例えば、サルなどの非ヒト霊長類、イヌ、ネコ、ウシ、ウマ、ヒツジ、ヤギ、ラマ、齧歯
類などの非ヒト哺乳類)、鳥類、爬虫類、両生類、魚類、その他の脊椎動物のいずれの細
胞であってもよい。
Cells used in the genome modification method of the present embodiment are not particularly limited as long as they have a haploid, diploid or higher chromosomal genome. The cells may be diploid, triploid, tetraploid or higher. Cells include, but are not limited to, eukaryotic cells. The cells may be plant cells, animal cells, or fungal cells. Animal cells include, but are not limited to, humans, non-human mammals (
non-human primates such as monkeys, non-human mammals such as dogs, cats, cows, horses, sheep, goats, llamas, rodents), birds, reptiles, amphibians, fish, and other vertebrate cells may be
前記細胞としては、例えば、多能性細胞(例えば、胚性幹細胞(ES細胞)および誘導
多能性幹細胞(iPS細胞)などの多能性幹細胞)、造血幹細胞、造血前駆細胞、骨髄細
胞、脾臓細胞、骨髄系共通前駆細胞、免疫細胞(例えば、T細胞、B細胞、NK細胞、N
KT細胞、マクロファージ、単球、好中球、好酸球、好塩基球)、赤血球、巨核球、心臓
細胞、心筋細胞、心臓線維芽細胞、膵β細胞、角膜細胞(例えば、角膜上皮細胞、および
角膜内皮細胞)、表皮細胞、真皮細胞、脂肪細胞、軟骨細胞、骨細胞、破骨細胞、骨芽細
胞、間葉系幹細胞(例えば、脂肪由来、骨髄由来、胎盤由来および臍帯由来)、歯髄細胞
、腱細胞、靭帯細胞、神経細胞(例えば、錐体細胞、星状細胞、および顆粒細胞)、グリ
ア細胞、プルキンエ細胞、網膜神経節細胞、網膜細胞、視神経細胞、および神経幹細胞が
挙げられる。ある好ましい態様では、細胞は初代細胞であり得る。ある好ましい態様では
、細胞は不死化された細胞、または細胞株であり得る。ある好ましい態様では、細胞はヒ
トの細胞である。
Examples of the cells include pluripotent cells (e.g., pluripotent stem cells such as embryonic stem cells (ES cells) and induced pluripotent stem cells (iPS cells)), hematopoietic stem cells, hematopoietic progenitor cells, bone marrow cells, and spleen. cells, common myeloid progenitor cells, immune cells (e.g., T cells, B cells, NK cells, N
KT cells, macrophages, monocytes, neutrophils, eosinophils, basophils), erythrocytes, megakaryocytes, cardiac cells, cardiomyocytes, cardiac fibroblasts, pancreatic β cells, corneal cells (e.g., corneal epithelial cells, and corneal endothelial cells), epidermal cells, dermal cells, adipocytes, chondrocytes, osteocytes, osteoclasts, osteoblasts, mesenchymal stem cells (e.g., adipose-derived, bone marrow-derived, placental- and umbilical cord-derived), dental pulp cells, tendon cells, ligament cells, nerve cells (eg, cone cells, astrocytes, and granule cells), glial cells, Purkinje cells, retinal ganglion cells, retinal cells, optic nerve cells, and neural stem cells. In some preferred embodiments, the cells can be primary cells. In some preferred embodiments, the cells can be immortalized cells, or cell lines. In one preferred embodiment, the cells are human cells.
ある態様では、細胞は、単離された細胞、クローン化された細胞、または細胞株であり
得る。細胞は不死化された細胞であってもよい。ある好ましい態様では、細胞は、クロー
ン化された細胞である。ある好ましい態様では、細胞は、細胞株である。ある好ましい態
様では、細胞は不死化された細胞である。ある態様では、細胞は、初代体細胞である。細
胞は、その使用目的に応じて適宜選択されることを当業者は理解する。
In some aspects, the cells can be isolated cells, cloned cells, or cell lines. The cells may be immortalized cells. In one preferred aspect, the cell is a cloned cell. In one preferred aspect, the cell is a cell line. In one preferred embodiment, the cells are immortalized cells. In one aspect, the cell is a primary somatic cell. Those skilled in the art will understand that cells are appropriately selected according to their intended use.
ある態様では、細胞(またはライブラリー)は、細胞凍結保護液中で凍結されうる。あ
る態様では、前記細胞を含む細胞凍結保護液は、非凍結状態または好ましくは凍結状態で
提供され得る。凍結状態の前記細胞を含む細胞凍結保護液(「フリーズストック」ともい
う)は、リサーチセルバンク(RCB)、マスターセルバンク(MCB)、またはワーキ
ングセルバンク(WCB)として用いることができる。したがって、本発明では、上記フ
リーズストックを含む、リサーチセルバンク(RCB)、マスターセルバンク(MCB)
、またはワーキングセルバンク(WCB)が提供される。
In some embodiments, cells (or libraries) can be frozen in a cell cryoprotectant. In some embodiments, the cell cryoprotectant containing said cells may be provided in an unfrozen or preferably frozen state. A cell cryoprotectant (also referred to as a "freeze stock") containing the cells in a frozen state can be used as a research cell bank (RCB), master cell bank (MCB), or working cell bank (WCB). Therefore, in the present invention, a research cell bank (RCB), a master cell bank (MCB) containing the freeze stock
, or a working cell bank (WCB) is provided.
[ゲノム改変方法]
以下に記載する方法(例えば、UKiS;国際公開第2021/206054号参照)
は、上記細胞の作製に好ましく用いることができる。この方法は、特に図1に示される工
程S1において、細胞から第一の中間体細胞を作製する際に好ましく用いられる。
[Genome modification method]
Methods described below (e.g. UKiS; see WO2021/206054)
can be preferably used for producing the above cells. This method is preferably used when producing a first intermediate cell from the cell, particularly in step S1 shown in FIG.
1実施態様において、本発明では、第一の中間体細胞の作製に、以下(a)及び(b)
を含む方法を用いることができる。
(a)下記(i)及び(ii)を、2つ以上のアレルを含む細胞に導入して、前記2つ以
上のアレルそれぞれに選択マーカー遺伝子を導入する工程と、
(i)前記染色体ゲノムの2つ以上のアレル中の標的領域を標的とし、当該標的領域を切
断することができる配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコード
するポリヌクレオチドを含むゲノム改変システム、
(ii)2種以上の選択マーカー用ドナーDNAであって、それぞれが前記標的領域の上
流側の塩基配列と相同組換え可能な塩基配列を有する上流ホモロジーアームと、前記標的
領域の下流側の塩基配列と相同組換え可能な塩基配列を有する下流ホモロジーアームとを
有し、かつ、上流ホモロジーアームと下流ホモロジーアームの間に、選択マーカー遺伝子
の塩基配列を含み、前記2種以上の選択マーカー用ドナーDNAは、相互に区別可能に異
なる選択マーカー遺伝子をそれぞれ有し、前記選択マーカー遺伝子は、選択マーカー用ド
ナーDNAの種類毎に固有であり、前記選択マーカー用ドナーDNAの種類数は、ゲノム
改変の対象とする前記アレルの数と同数以上である、2種以上の選択マーカー用ドナーD
NA、
(b)前記工程(a)の後、前記2以上のアレルに対して異なる種類の選択マーカー用ド
ナーDNAがそれぞれ相同組み換えすることによって、当該2以上のアレルにそれぞれ区
別可能に異なる固有の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる
選択マーカー遺伝子のすべてを発現する細胞を選択する工程(ポジティブ選択のための工
程)と、
を含む、方法であり得る。
In one embodiment, in the present invention, the following (a) and (b) are used to prepare the first intermediate cell
can be used.
(a) introducing the following (i) and (ii) into a cell containing two or more alleles to introduce a selectable marker gene into each of the two or more alleles;
(i) a sequence-specific nucleic acid cleaving molecule capable of targeting and cleaving a target region in two or more alleles of said chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule; genome modification system, including
(ii) two or more selection marker donor DNAs, each of which has an upstream homology arm having a base sequence capable of homologous recombination with the base sequence upstream of the target region; and bases downstream of the target region. a sequence and a downstream homology arm having a base sequence capable of homologous recombination, and comprising a base sequence of a selectable marker gene between the upstream homology arm and the downstream homology arm, wherein the two or more types of selectable marker donors Each of the DNAs has a selectable marker gene that is distinguishably different from each other, the selectable marker gene is unique for each type of selectable marker donor DNA, and the number of types of the selectable marker donor DNA is determined by genome modification. Two or more selectable marker donors D, which are the same or more than the number of target alleles
NA,
(b) after the step (a), by homologous recombination of different types of donor DNAs for selection markers with respect to the two or more alleles, unique selection markers that are distinguishably different from each other for the two or more alleles; selecting cells into which the gene has been introduced and expressing all of the introduced distinctly different selectable marker genes (a step for positive selection);
can be a method comprising:
(工程(a))
工程(a)では、前記(i)及び(ii)を、染色体を含む細胞に導入する。
(Step (a))
In step (a), the above (i) and (ii) are introduced into cells containing chromosomes.
<(i)ゲノム改変システム>
「ゲノム改変システム」とは、所望の標的領域を改変することが可能な分子機構を意味
する。ゲノム改変システムは、染色体ゲノムの標的領域を標的とする配列特異的核酸切断
分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含む。より具体
的には、ゲノム改変システムは、標的領域中あるいは近傍の少なくとも1つ、好ましくは
2つを切断することができる。
<(i) genome modification system>
By "genomic modification system" is meant a molecular mechanism capable of modifying a desired target region. The genome modification system comprises a sequence-specific nucleic acid cleaving molecule targeted to a target region of the chromosomal genome, or a polynucleotide encoding said sequence-specific nucleic acid cleaving molecule. More specifically, the genome modification system can cut at least one, preferably two, in or near the target region.
ゲノム改変の対象となる標的領域は、1以上のアレルを有するゲノム上の任意の領域と
することができる。標的領域のサイズは、特に限定されない。本実施形態のゲノム改変方
法では、従来よりも大きなサイズの領域を改変することができる。標的領域は、例えば、
10kbp以上であってもよい。標的領域は、例えば、100bp以上、200bp以上
、400bp以上、800bp以上、1kbp以上、2kbp以上、3kbp以上、4k
bp以上、5kbp以上、8kbp以上、10kbp以上、20kbp以上、40kbp
以上、80kbp以上、100kbp以上、200kbp以上、300kbp、400k
bp以上、500kbp以上、600kbp以上、700kbp以上、800kbp以上
、900kbp以上、もしくは1Mbp以上、または上記のいずれかの数値以下であって
もよい。ある態様では、改変された細胞において、上記標的領域が欠失している。
A target region for genome modification can be any region on the genome having one or more alleles. The size of the target region is not particularly limited. The genome modification method of this embodiment can modify a region of a larger size than conventionally. The target region may be, for example,
It may be 10 kbp or more. The target region may be, for example, 100 bp or more, 200 bp or more, 400 bp or more, 800 bp or more, 1 kbp or more, 2 kbp or more, 3 kbp or more, 4 kbp or more.
bp or more, 5 kbp or more, 8 kbp or more, 10 kbp or more, 20 kbp or more, 40 kbp
80kbp or more, 100kbp or more, 200kbp or more, 300kbp, 400kbp
bp or more, 500 kbp or more, 600 kbp or more, 700 kbp or more, 800 kbp or more, 900 kbp or more, or 1 Mbp or more, or any of the above numbers or less. In one aspect, the target region is deleted in the modified cell.
配列特異的核酸切断分子は、配列特異的核酸切断活性を有する分子であれば、特に限定
されず、合成有機化合物であってもよく、タンパク質等の生体高分子化合物であってもよ
い。配列特異的部位切断活性を有するタンパク質としては、例えば、配列特異的エンドヌ
クレアーゼが挙げられる。
The sequence-specific nucleic acid cleaving molecule is not particularly limited as long as it is a molecule having sequence-specific nucleic acid cleaving activity, and may be a synthetic organic compound or a biopolymer such as a protein. Proteins having sequence-specific site-cleaving activity include, for example, sequence-specific endonucleases.
配列特異的エンドヌクレアーゼは、所定の配列で核酸を切断することができる酵素であ
る。配列特異的エンドヌクレアーゼは、所定の配列で、2本鎖DNAを切断することがで
きる。配列特異的エンドヌクレアーゼとしては、特に限定されないが、例えば、ジンクフ
ィンガーヌクレアーゼ(Zinc finger nuclease(ZFN))、TA
LEN(Transcription activator-like effecto
r nuclease)、Casタンパク質等が挙げられるが、これらに限定されない。
A sequence-specific endonuclease is an enzyme capable of cleaving nucleic acids at a given sequence. A sequence-specific endonuclease can cleave double-stranded DNA at a given sequence. Examples of sequence-specific endonucleases include, but are not limited to, zinc finger nuclease (ZFN), TA
LEN (Transcription activator-like effect)
r nuclease), Cas protein and the like, but are not limited to these.
ZFNは、ジンクフィンガーアレイを含む結合ドメインにコンジュゲートした核酸切断
ドメインを含む人工ヌクレアーゼである。切断ドメインとしては、II型制限酵素Fok
Iの切断ドメインが挙げられる。標的配列を切断可能なジンクフィンガーヌクレアーゼの
設計は、公知の方法で行うことができる。
ZFNs are artificial nucleases containing a nucleic acid cleaving domain conjugated to a binding domain containing a zinc finger array. As a cleavage domain, the type II restriction enzyme Fok
The cleavage domain of I. A zinc finger nuclease capable of cleaving a target sequence can be designed by a known method.
TALENは、DNA切断ドメイン(例えば、FokIドメイン)に加えて転写活性化
因子様(TAL)エフェクターのDNA結合ドメインを含む人工ヌクレアーゼである。標
的配列を切断可能なTALE構築物の設計は、公知の方法で行うことができる(例えば、
Zhang, Feng et. al. (2011) Nature Biotec
hnology 29 (2))。
TALENs are artificial nucleases that contain transcriptional activator-like (TAL) effector DNA-binding domains in addition to a DNA-cleaving domain (eg, a FokI domain). A TALE construct capable of cleaving a target sequence can be designed by a known method (e.g.,
Zhang, Feng et. al. (2011) Nature Biotec
hnology 29 (2)).
配列特異的核酸切断分子として、Casタンパク質を用いる場合、ゲノム改変システム
は、CRISPR/Casシステムを含む。すなわち、ゲノム改変システムは、Casタ
ンパク質と、標的領域内の塩基配列に相同な塩基配列を有するガイドRNAを含むことが
好ましい。ガイドRNAは、スペーサー配列として、標的領域内の配列(標的配列)と相
同な配列を含んでいればよい。ガイドRNAは、標的領域内のDNAに結合できるもので
ればよく、標的配列と完全に同一の配列を有している必要はない。この結合は、細胞核内
の生理的条件下で形成されればよい。ガイドRNAは、例えば、標的配列に対して、例え
ば、0~3塩基のミスマッチを含むことができる。前記ミスマッチの数は、0~2塩基が
好ましく、0~1がより好ましく、ミスマッチを有しないことがさらに好ましい。ガイド
RNAの設計は、公知の方法に基づいて行うことができる。ゲノム改変システムは、CR
ISPR/Casシステムであることが好ましく、Casタンパク質とガイドRNAを含
むことが好ましい。Casタンパク質は、Cas9タンパク質であることが好ましい。
When using a Cas protein as the sequence-specific nucleic acid cleaving molecule, the genome modification system includes the CRISPR/Cas system. That is, the genome modification system preferably contains a Cas protein and a guide RNA having a nucleotide sequence homologous to the nucleotide sequence in the target region. The guide RNA may contain, as a spacer sequence, a sequence homologous to the sequence in the target region (target sequence). The guide RNA only needs to be able to bind to DNA within the target region, and does not need to have a completely identical sequence to the target sequence. This bond may be formed under physiological conditions within the cell nucleus. The guide RNA can contain, eg, 0-3 base mismatches, eg, to the target sequence. The number of mismatches is preferably 0 to 2 bases, more preferably 0 to 1 bases, and more preferably no mismatches. Guide RNA can be designed based on known methods. The genome modification system is CR
It is preferably an ISPR/Cas system, preferably comprising a Cas protein and a guide RNA. Preferably, the Cas protein is the Cas9 protein.
配列特異的エンドヌクレアーゼは、タンパク質として細胞に導入してもよく、配列特異
的エンドヌクレアーゼをコードするポリヌクレオチドとして細胞に導入してもよい。例え
ば、配列特異的エンドヌクレアーゼのmRNAを導入してもよく、配列特異的エンドヌク
レアーゼの発現ベクターを導入してもよい。発現ベクターにおいて、配列特異的エンドヌ
クレアーゼのコード配列(配列特異的エンドヌクレアーゼ遺伝子)は、プロモーターに機
能的に連結されている。プロモーターは、特に限定されず、例えば、pol II系プロ
モーターを各種使用することができる。pol II系プロモーターとしては、特に制限
されないが、例えばCMVプロモーター、EF1プロモーター(EF1αプロモーター)
、SV40プロモーター、MSCVプロモーター、hTERTプロモーター、βアクチン
プロモーター、CAGプロモーター、CBhプロモーター等が挙げられる。
A sequence-specific endonuclease may be introduced into the cell as a protein or as a polynucleotide encoding the sequence-specific endonuclease. For example, a sequence-specific endonuclease mRNA may be introduced, or a sequence-specific endonuclease expression vector may be introduced. In expression vectors, a sequence-specific endonuclease coding sequence (sequence-specific endonuclease gene) is operably linked to a promoter. The promoter is not particularly limited, and for example, various pol II promoters can be used. Examples of pol II promoters include, but are not limited to, CMV promoter, EF1 promoter (EF1α promoter)
, SV40 promoter, MSCV promoter, hTERT promoter, β actin promoter, CAG promoter, CBh promoter and the like.
プロモーターは、誘導性プロモーターであってもよい。誘導性プロモーターは、プロモ
ーターを駆動する誘導因子の存在下でのみ、当該プロモーターに機能的に連結されたポリ
ヌクレオチドの発現を誘導することができるプロモーターである。誘導性プロモーターと
しては、ヒートショックプロモーターなどの加熱により遺伝子発現を誘導するプロモータ
ーが挙げられる。また、誘導性プロモーターには、プロモーターを駆動する誘導因子が薬
剤であるプロモーターが挙げられる。このような薬剤誘導性プロモーターとしては、例え
ば、Cumateオペレーター配列、λオペレーター配列(例えば、12×λOp)、テ
トラサイクリン系誘導性プロモーター等が挙げられる。テトラサイクリン系誘導性プロモ
ーターとしては、例えば、テトラサイクリンもしくはその誘導体(例えば、ドキシサイク
リン)、またはリバーステトラサイクリン制御性トランス活性化因子(rtTA)の存在
下で遺伝子発現を駆動するプロモーターが挙げられる。テトラサイクリン系誘導性プロモ
ーターとしては、例えば、TRE3Gプロモーターが挙げられる。
The promoter may be an inducible promoter. An inducible promoter is a promoter that can induce expression of a polynucleotide operably linked to it only in the presence of an inducer driving the promoter. Inducible promoters include promoters that induce gene expression by heating, such as heat shock promoters. Inducible promoters also include promoters in which the inducer driving the promoter is a drug. Such drug-inducible promoters include, for example, Cumate operator sequences, λ operator sequences (eg, 12×λOp), tetracycline system-inducible promoters, and the like. Tetracycline-based inducible promoters include, for example, promoters that drive gene expression in the presence of tetracycline or its derivatives (eg, doxycycline), or reverse tetracycline-regulated transactivator (rtTA). Examples of tetracycline-inducible promoters include the TRE3G promoter.
発現ベクターは、公知のものを特に制限なく用いることができる。発現ベクターとして
は、例えば、プラスミドベクター、ウイルスベクターが挙げられる。配列特異的エンドヌ
クレアーゼがCasタンパク質である場合、発現ベクターは、Casタンパク質のコード
配列(Casタンパク質遺伝子)に加えて、ガイドRNAコード配列(ガイドRNA遺伝
子)及びを含んでいてもよい。この場合、ガイドRNAコード配列(ガイドRNA遺伝子
)は、pol III系プロモーターに機能的にされていることが好ましい。pol I
II系プロモーターとしては、例えば、マウス及びヒトのU6-snRNAプロモーター
、ヒトH1-RNase P RNAプロモーター、ヒトバリン-tRNAプロモーター
等が挙げられる。
Any known expression vector can be used without particular limitation. Examples of expression vectors include plasmid vectors and virus vectors. When the sequence-specific endonuclease is a Cas protein, the expression vector may contain, in addition to the Cas protein coding sequence (Cas protein gene), a guide RNA coding sequence (guide RNA gene). In this case, the guide RNA coding sequence (guide RNA gene) is preferably functionalized to a pol III-based promoter. pol I
II system promoters include, for example, mouse and human U6-snRNA promoters, human H1-RNase P RNA promoters, human valine-tRNA promoters and the like.
<(ii)選択マーカー用ドナーDNA>
選択マーカー用ドナーDNAは、選択マーカーを標的領域にノックインするためのドナ
ーDNAである。選択マーカー用ドナーDNAは、標的領域の上流側に隣接する塩基配列
と相同な塩基配列を有する上流ホモロジーアームと、標的領域の下流側に隣接する塩基配
列と相同な塩基配列を有する下流ホモロジーアームとの間に、1以上の選択マーカー遺伝
子の塩基配列を含む。
<(ii) Donor DNA for selection marker>
Selectable marker donor DNA is donor DNA for knocking in a selectable marker into a target region. The donor DNA for selection marker has an upstream homology arm having a nucleotide sequence homologous to the nucleotide sequence adjacent to the upstream side of the target region, and a downstream homology arm having a nucleotide sequence homologous to the nucleotide sequence adjacent to the downstream side of the target region. contains the base sequences of one or more selectable marker genes.
選択マーカー用ドナーDNAは、特に限定されないが、例えば、1kb以上、2kb以
上、3kb以上、4kb以上、5kb以上、6kb以上、7kb以上、8kb以上、9k
b以上、9.5kb以上、または10kb以上の長さを有し得る。選択マーカー用ドナー
DNAは、特に限定されないが、例えば、50kb以下、45kb以下、40kb以下、
35kb以下、30kb以下、25kb以下、20kb以下、15kb以下、14kb以
下、13kb以下、12kb以下、11kb以下、10kb以下、9kb以下、8kb以
下、7kb以下、6kb以下、5kb以下、または4kb以下の長さを有し得る。
The donor DNA for the selection marker is not particularly limited, but is, for example, 1 kb or more, 2 kb or more, 3 kb or more, 4 kb or more, 5 kb or more, 6 kb or more, 7 kb or more, 8 kb or more, 9 kb or more.
b or longer, 9.5 kb or longer, or 10 kb or longer. The donor DNA for the selection marker is not particularly limited, but is, for example, 50 kb or less, 45 kb or less, 40 kb or less,
35 kb or less, 30 kb or less, 25 kb or less, 20 kb or less, 15 kb or less, 14 kb or less, 13 kb or less, 12 kb or less, 11 kb or less, 10 kb or less, 9 kb or less, 8 kb or less, 7 kb or less, 6 kb or less, 5 kb or less, or 4 kb or less in length can have
「選択マーカー」とは、その発現の有無に基づいて、細胞を選択することができるタン
パク質を意味する。選択マーカー遺伝子は、選択マーカーをコードする遺伝子である。選
択マーカー発現細胞及び非発現細胞が混在する細胞集団において、選択マーカー発現細胞
を選択する場合、当該選択マーカーを「ポジティブ選択マーカー」または「ポジティブ選
択用の選択マーカー」という。選択マーカー発現細胞及び非発現細胞が混在する細胞集団
において、選択マーカー非発現細胞を選択する場合、当該選択マーカーを「ネガティブ選
択マーカー」または「ネガティブ選択用の選択マーカー」という。選択マーカーが相互に
異なるとは、相互に区別できること(例えば、区別可能に異なること)を意味し、例えば
、選択マーカーが導入された細胞に付与する薬剤耐性の性質などの生理学的性質またはそ
の他の物理化学的性質において少なくとも相互に区別できることを意味する。すなわち、
選択マーカーが相互に異なるとは、異なる複数の選択マーカーが他の選択マーカーと区別
可能に検出できること、または他の選択マーカーとは区別可能に薬剤選択できることを意
味する。また、前記選択マーカー遺伝子が選択マーカー用ドナーDNAの種類毎に固有で
あるとは、選択マーカー用ドナーDNAの1種が有する選択マーカー遺伝子が、上記以外
の種類の選択マーカー用ドナーDNAには含まれないこと、または、複数種類のドナーD
NAに含まれている場合には、同時に2種類以上のドナーDNAから発現しないように構
成されていることを意味する。このとき、2種類以上のドナーDNAは、選択マーカー以
外は同一であってもよく、選択マーカー以外の配列および/または構成において相違があ
ってもよい。
By "selectable marker" is meant a protein that allows cells to be selected based on the presence or absence of its expression. A selectable marker gene is a gene that encodes a selectable marker. In a cell population in which selectable marker-expressing cells and non-expressing cells coexist, when selectable marker-expressing cells are selected, the selectable marker is referred to as a "positive selectable marker" or "selective marker for positive selection". In a cell population in which selectable marker-expressing cells and non-expressing cells coexist, when selectable marker-non-expressing cells are selected, the selectable marker is referred to as a "negative selectable marker" or "selective marker for negative selection". The selectable markers differ from each other means that they are distinguishable from each other (e.g., distinguishably different), and may have physiological or other properties such as drug resistance properties that confer on cells into which the selectable markers have been introduced. It means at least distinguishable from each other in physicochemical properties. i.e.
The selection markers being different from each other means that multiple selection markers that are different can be detected in a distinguishable manner from other selection markers, or that a drug can be selected in a manner distinguishable from other selection markers. In addition, the expression that the selectable marker gene is unique to each type of selectable marker donor DNA means that the selectable marker gene possessed by one type of selectable marker donor DNA is not included in the types of selectable marker donor DNAs other than the above. or multiple types of donor D
When it is contained in NA, it means that it is constructed so as not to be expressed from two or more donor DNAs at the same time. At this time, the two or more donor DNAs may be identical except for the selectable marker, or may differ in sequence and/or composition other than the selectable marker.
ポジティブ選択マーカーは、それを発現する細胞を選択可能なものであれば、特に限定
されない。ポジティブ選択マーカー遺伝子としては、例えば、薬剤耐性遺伝子、蛍光タン
パク質遺伝子、発光酵素遺伝子、発色酵素遺伝子等が挙げられる。
The positive selectable marker is not particularly limited as long as it can select cells expressing it. Positive selectable marker genes include, for example, drug resistance genes, fluorescent protein genes, luciferase genes, chromogenic enzyme genes and the like.
ネガティブ選択マーカーは、それを発現しない細胞を選択可能なものであれば、特に限
定されない。ネガティブ選択マーカー遺伝子としては、例えば、自殺遺伝子(チミジンカ
イネース等)、蛍光タンパク質遺伝子、発光酵素遺伝子、発色酵素遺伝子等が挙げられる
。ネガティブ選択マーカー遺伝子が、細胞の生存に負の影響を与える遺伝子(例えば、自
殺遺伝子)である場合、当該ネガティブ選択マーカー遺伝子は、誘導性プロモーターに機
能的に連結され得る。誘導性プロモーターに機能的に連結することで、ネガティブ選択マ
ーカー遺伝子を有する細胞を除去したいときにのみ、ネガティブ選択マーカー遺伝子を発
現させることができる。ネガティブ選択マーカー遺伝子が、蛍光、発光、および発色等の
光学的に検出可能なマーカー遺伝子(可視化マーカー遺伝子;visible mark
er gene)である場合など、細胞の生存に負の影響が少ない場合には、恒常的に発
現させてもよい。
The negative selectable marker is not particularly limited as long as it can select cells that do not express it. Negative selectable marker genes include, for example, suicide genes (thymidine kinase, etc.), fluorescent protein genes, luciferase genes, chromogenic enzyme genes, and the like. When the negative selectable marker gene is a gene that negatively affects cell survival (eg, a suicide gene), the negative selectable marker gene can be operably linked to an inducible promoter. By being operably linked to an inducible promoter, the negative selectable marker gene can be expressed only when it is desired to eliminate cells bearing the negative selectable marker gene. Optically detectable marker genes (visible marker genes; visible mark
If the negative effect on cell survival is small, such as when the gene is an er gene), it may be expressed constitutively.
薬剤耐性遺伝子としては、例えば、ピューロマイシン耐性遺伝子、ブラスティサイディ
ン耐性遺伝子、ジェネティシン耐性遺伝子、ネオマイシン耐性遺伝子、テトラサイクリン
耐性遺伝子、カナマイシン耐性遺伝子、ゼオシン耐性遺伝子、ハイグロマイシン耐性遺伝
子、クロラムフェニコール耐性遺伝子等が挙げられるが、これらに限定されない。
蛍光タンパク質遺伝子としては、例えば、緑色蛍光タンパク質(GFP)遺伝子、黄色
蛍光タンパク質(YFP)遺伝子、赤色蛍光タンパク質(RFP)遺伝子等が挙げられる
が、これらに限定されない。
発光酵素遺伝子としては、例えば、ルシフェラーゼ遺伝子などが挙げられるが、これら
に限定されない。
発色酵素遺伝子としては、例えば、βガラクトシターゼ遺伝子、βグルクロニダーゼ遺
伝子、アルカリフォスファターゼ遺伝子等が挙げられるが、これらに限定されない。
自殺遺伝子としては、例えば、単純ヘルペスウイルスのチミジンキナーゼ(HSV-T
K)、誘導性カスパーゼ9(inducible caspase 9)等が挙げられる
が、これらに限定されない。
Examples of drug resistance genes include puromycin resistance gene, blasticidin resistance gene, geneticin resistance gene, neomycin resistance gene, tetracycline resistance gene, kanamycin resistance gene, zeocin resistance gene, hygromycin resistance gene, chloramphenicol resistance gene, and the like. include, but are not limited to:
Examples of fluorescent protein genes include, but are not limited to, green fluorescent protein (GFP) gene, yellow fluorescent protein (YFP) gene, red fluorescent protein (RFP) gene, and the like.
Luciferase genes include, but are not limited to, luciferase genes.
Examples of the chromogenic enzyme gene include, but are not limited to, β-galactosidase gene, β-glucuronidase gene, alkaline phosphatase gene and the like.
Suicide genes include, for example, herpes simplex virus thymidine kinase (HSV-T
K), inducible caspase 9, etc., but are not limited thereto.
選択マーカー用ドナーDNAが有する選択マーカー遺伝子は、ポジティブ選択マーカー
遺伝子であることが好ましい。すなわち、選択マーカーを発現する細胞を、選択マーカー
遺伝子がノックインされた細胞として、選択することができる。
The selectable marker gene possessed by the selectable marker donor DNA is preferably a positive selectable marker gene. That is, cells expressing the selectable marker can be selected as cells in which the selectable marker gene has been knocked in.
上流ホモロジーアームは、改変対象のゲノムにおいて、標的領域の上流側の塩基配列と
相同組換え可能な塩基配列を有し、例えば、標的配列の上流側に隣接する塩基配列と相同
な塩基配列を有する。下流ホモロジーアームは、改変対象のゲノムにおいて、標的領域の
下流側の塩基配列と相同組換え可能な塩基配列を有し、例えば、標的配列の下流側に隣接
する塩基配列と相同な塩基配列を有する。上流ホモロジーアーム及び下流ホモロジーアー
ムは、標的領域の周辺領域と相同組換可能であれば、その長さ及び配列は特に限定されな
い。上流ホモロジーアーム及び下流ホモロジーアームは、相同組換え可能な限り、標的領
域の上流側配列若しくは下流側配列と必ずしも完全一致する必要はない。例えば、上流ホ
モロジーアームは、標的領域の上流側に隣接する塩基配列と90%以上の配列同一性(相
同性)を有する配列であることができ、92%以上、93%以上、94%以上、95%以
上、96%以上、97%以上、98%以上、又は99%以上の配列同一性を有することが
好ましい。例えば、下流ホモロジーアームは、標的領域の下流側に隣接する塩基配列と9
0%以上の配列同一性(相同性)を有する配列であることができ、92%以上、93%以
上、94%以上、95%以上、96%以上、97%以上、98%以上、又は99%以上の
配列同一性を有することが好ましい。また、上流ホモロジーアームと下流ホモロジーアー
ムとは、少なくともそのいずれかが標的領域中の切断箇所により近いとアレルの改変効率
をより高め得る。ここで、「近い」とは、2つの配列の距離が100bp以下、50bp
以下、40bp以下、30bp以下、20bp以下、または10bp以下であることを意
味し得る。
The upstream homology arm has a base sequence capable of homologous recombination with the base sequence upstream of the target region in the genome to be modified, for example, has a base sequence homologous to the base sequence adjacent to the upstream side of the target sequence. . The downstream homology arm has a base sequence capable of homologous recombination with the base sequence downstream of the target region in the genome to be modified, for example, has a base sequence homologous to the base sequence adjacent to the downstream side of the target sequence. . The length and sequence of the upstream homology arm and the downstream homology arm are not particularly limited as long as they are capable of homologous recombination with the region surrounding the target region. The upstream homology arm and downstream homology arm do not necessarily have to completely match the upstream or downstream sequence of the target region as long as homologous recombination is possible. For example, the upstream homology arm can be a sequence having 90% or more sequence identity (homology) with the nucleotide sequence adjacent to the upstream side of the target region, such as 92% or more, 93% or more, 94% or more, Preferably, they have a sequence identity of 95% or greater, 96% or greater, 97% or greater, 98% or greater, or 99% or greater. For example, the downstream homology arm includes the base sequence flanking the downstream side of the target region and 9
It can be a sequence having a sequence identity (homology) of 0% or more, 92% or more, 93% or more, 94% or more, 95% or more, 96% or more, 97% or more, 98% or more, or 99% % or greater sequence identity is preferred. In addition, when at least one of the upstream homology arm and the downstream homology arm is closer to the cleavage site in the target region, the efficiency of allele modification can be increased. Here, "close" means that the distance between the two sequences is 100 bp or less, 50 bp
Hereafter can mean 40 bp or less, 30 bp or less, 20 bp or less, or 10 bp or less.
選択マーカー用ドナーDNAにおいて、選択マーカー遺伝子は、上流ホモロジーアーム
と下流ホモロジーアームとの間に位置する。これにより、上記(i)のゲノム改変システ
ムと共に選択マーカー用ドナーDNAを細胞に導入した場合に、HDRにより、選択マー
カー遺伝子が標的領域に導入される(これにより遺伝子が破壊される場合、遺伝子ノック
アウトといい、これにより所望の遺伝子が導入される場合、遺伝子ノックインという、遺
伝子をノックアウトしつつ、別の遺伝子をノックインすることもできる)。
In the selectable marker donor DNA, the selectable marker gene is located between the upstream homology arm and the downstream homology arm. As a result, when donor DNA for a selection marker is introduced into cells together with the genome modification system of (i) above, a selection marker gene is introduced into the target region by HDR (when the gene is disrupted by this, gene knockout When a desired gene is introduced by this, it is possible to knock in another gene while knocking out a gene, called gene knock-in).
選択マーカー遺伝子は、適切なプロモーターの制御下で発現されるように、プロモータ
ーに機能的に連結されていることが好ましい。プロモーターは、ドナーDNAを導入する
細胞の種類に応じて適宜選択することができる。プロモーターとしては、例えば、SRα
プロモーター、SV40初期プロモーター、レトロウイルスのLTR、CMV(サイトメ
ガロウイルス)プロモーター、RSV(ラウス肉腫ウイルス)プロモーター、HSV-T
K(単純ヘルペスウイルスチミジンキナーゼ)プロモーター、EF1αプロモーター、メ
タロチオネインプロモーター、ヒートショックプロモーター等が挙げられる。選択マーカ
ー用ドナーDNAは、エンハンサー、ポリA付加シグナル、ターミネーター等の任意の制
御配列等を有していてもよい。
A selectable marker gene is preferably operably linked to a promoter so that it is expressed under the control of a suitable promoter. A promoter can be appropriately selected according to the type of cell into which the donor DNA is introduced. Examples of promoters include SRα
promoter, SV40 early promoter, retroviral LTR, CMV (cytomegalovirus) promoter, RSV (Rous sarcoma virus) promoter, HSV-T
K (herpes simplex virus thymidine kinase) promoter, EF1α promoter, metallothionein promoter, heat shock promoter and the like. The selectable marker donor DNA may have any regulatory sequences such as enhancers, poly(A) addition signals, terminators, and the like.
選択マーカー用ドナーDNAは、インスレーター配列を有していてもよい。「インスレ
ーター」とは、隣接する染色体環境の影響を遮断または緩和し、その領域に挟まれたDN
Aの転写調節の独立性を保証するまたは高める配列をいう。インスレーターは、エンハン
サー遮断効果(エンハンサーとプロモーターの間に挿入することにより、エンハンサーに
よるプロモーター活性への影響を遮断する効果)、及び位置効果の抑制作用(導入遺伝子
の両側をインスレーターで挟むことにより、導入遺伝子の発現を挿入されたゲノム上の位
置に影響されないようにする作用)により定義される。選択マーカー用ドナーDNAは、
上流アームと選択マーカー遺伝子との間(又は上流アームと選択マーカー遺伝子を制御す
るプロモーターとの間)に、インスレーター配列を有していてもよい。選択マーカー用ド
ナーDNAは、下流アームと選択マーカー遺伝子との間に、インスレーター配列を有して
いてもよい。
The selectable marker donor DNA may have an insulator sequence. An "insulator" is a DN sandwiched between regions that blocks or mitigates the influence of the adjacent chromosomal environment.
A sequence that ensures or enhances the independence of A transcriptional regulation. Insulators have both an enhancer-blocking effect (the effect of blocking the effect of the enhancer on the promoter activity by inserting it between the enhancer and the promoter) and a position-effect suppressing effect (the effect of sandwiching the transgene with insulators on both sides). , the action of rendering the expression of the transgene unaffected by the position on the genome where it was inserted). The donor DNA for the selectable marker is
An insulator sequence may be present between the upstream arm and the selectable marker gene (or between the upstream arm and the promoter controlling the selectable marker gene). The selectable marker donor DNA may have an insulator sequence between the downstream arm and the selectable marker gene.
選択マーカー用ドナーDNAは、直鎖状であってもよく、環状であってもよいが、環状
であることが好ましい。好ましくは、選択マーカー用ドナーDNAは、プラスミドである
。選択マーカー用ドナーDNAは、上記の配列に加えて、任意の配列を含み得る。例えば
、上流ホモロジーアーム、インスレーター、選択マーカー遺伝子、及び下流ホモロジーア
ームの各配列間の全て又は一部に、スペーサー配列を含んでいてもよい。
The selectable marker donor DNA may be linear or circular, but preferably circular. Preferably, the selectable marker donor DNA is a plasmid. Donor DNA for selectable markers can contain any sequence in addition to the above sequences. For example, all or part of each sequence between the upstream homology arm, the insulator, the selectable marker gene, and the downstream homology arm may contain a spacer sequence.
工程(a)では、ゲノム改変の対象とするアレルの数と同数以上の種類の選択マーカー
用ドナーDNAを細胞に導入する。異なる種類の選択マーカー用ドナーDNAは、相互に
異なる(区別可能な)種類の選択マーカー遺伝子を有する。ある態様では、異なる種類の
選択マーカー用ドナーDNAは、完全に同一の選択マーカー遺伝子またはそのセットを有
しない。つまり、第1の種類の選択マーカー用ドナーDNAは、第1の種類の選択マーカ
ー遺伝子を有し、第2の種類の選択マーカー用ドナーDNAは、第2の種類の選択マーカ
ー遺伝子を有する。第3の種類の選択マーカー用ドナーDNAは、第3の種類の選択マー
カー遺伝子を有し、それ以降の種類の選択マーカー用ドナーDNAについても同様である
。ゲノム改変の対象とするアレルが2個である場合、選択マーカー用ドナーDNAの種類
は2種類以上である。ゲノム改変の対象とするアレルが3個である場合、選択マーカー用
ドナーDNAの種類は3種類以上である。ある態様では、1つの選択マーカー用ドナーD
NAが、2種類以上の相互に異なる(区別可能な)選択マーカーを有していてもよい(こ
の場合であっても、異なる種類の選択マーカー用ドナーDNAは、相互に異なる(区別可
能な)種類(例えば、固有)の選択マーカー遺伝子を有していなければならない)。ある
態様では、選択マーカー用ドナーDNAは、部位特異的組換え酵素の組換え配列(例えば
、Creリコンビナーゼにより組換えられるloxP配列およびその変種)を有しない。
また、ある態様では、本発明の方法は、部位特異的組換え酵素及びその組換え配列(例え
ば、Creリコンビナーゼにより組換えられるloxP配列およびその変種)を用いない
。部位特異的組換え酵素を用いると、通常は、編集後のゲノムに部位特異的組換え酵素の
組換え配列が1つ残存する。これに対して、ある態様では、本発明の方法で得られる細胞
の改変ゲノムは、部位特異的組換え酵素の組換え配列(外来である)を有しない。
In step (a), the same or more types of donor DNAs for selection markers as the number of target alleles for genome modification are introduced into cells. Different types of selectable marker donor DNAs have mutually different (distinguishable) types of selectable marker genes. In certain aspects, the different types of selectable marker donor DNAs do not have the exact same selectable marker gene or set thereof. That is, the first type of selectable marker donor DNA has the first type of selectable marker gene, and the second type of selectable marker donor DNA has the second type of selectable marker gene. The third type of selectable marker donor DNA has the third type of selectable marker gene, and the same applies to subsequent types of selectable marker donor DNAs. When there are two target alleles for genome modification, there are two or more types of donor DNAs for selection markers. When there are three target alleles for genome modification, there are three or more types of selectable marker donor DNAs. In one aspect, donor D for one selectable marker
NA may have two or more mutually different (distinguishable) selection markers (even in this case, different types of donor DNA for selection markers are mutually different (distinguishable) must have a species (eg, unique) selectable marker gene). In some embodiments, the selectable marker donor DNA does not have recombination sequences for site-specific recombinase (eg, loxP sequences and variants thereof that are recombined by Cre recombinase).
Also, in certain aspects, the methods of the invention do not employ site-specific recombinases and recombination sequences thereof (eg, loxP sequences and variants thereof that are recombined by Cre recombinase). When a site-directed recombinase is used, usually one recombination sequence of the site-directed recombinase remains in the edited genome. In contrast, in one aspect, the modified genome of the cell obtained by the method of the invention does not contain the recombination sequence (which is foreign) of the site-specific recombinase.
選択マーカー用ドナーDNAの種類数は、ゲノム改変の対象とするアレルの数と同数以
上であればよく、上限は特に限定されない。ゲノム改変の対象とするアレルの数と同数以
上の種類の選択マーカー用ドナーDNAを用いることで、2つ以上のアレルを安定的に改
変することができる。選択マーカー用ドナーDNAの種類数は、後述の工程(b)での選
択操作の観点から、ゲノム改変の対象とするアレルの数と同数又は1~2多い程度が好ま
しく、ゲノム改変の対象とするアレルの数と同数であることがより好ましい。
The number of types of selectable marker donor DNAs may be equal to or greater than the number of target alleles for genome modification, and the upper limit is not particularly limited. Two or more alleles can be stably modified by using the same or more types of selective marker donor DNAs as the number of target alleles for genome modification. From the viewpoint of the selection operation in the step (b) described later, the number of types of donor DNA for selection markers is preferably the same as the number of alleles to be modified or about 1 to 2 more than the number of alleles to be modified. More preferably, the number is the same as the number of alleles.
上記(i)と(ii)を細胞に導入する方法は特に限定されず、公知の方法を特に制限
なく用いることができる。(i)及び(ii)を細胞に導入する方法としては、例えば、
ウイルス感染法、リポフェクション法、マイクロインジェクション法、カルシウムリン酸
法、DEAE-デキストラン法、エレクトロポーレーション法、パーティクルガン法等が
挙げられるが、これらに限定されない。上記(i)と(ii)とを細胞に導入することに
より、上記(i)の配列特異的核酸切断分子により、標的領域のDNAが切断された後、
HDRにより(ii)の選択マーカー用ドナーDNA中の選択マーカーが標的領域にノッ
クインされる。この際、2種以上の選択マーカー用ドナーDNAは、それぞれの上流ホモ
ロジーアームおよび下流ホモロジーアームが同一である場合には、ランダムに標的領域の
2つ以上のアレルにノックインされ得る。但し、2種以上の選択マーカー用ドナーDNA
は、2以上のアレルそれぞれの標的領域の上流配列および下流配列と相同組換え可能な塩
基配列をホモロジーアームの塩基配列をそれぞれ有している限り2以上のアレルそれぞれ
を改変できるので、完全に同一のホモロジーアームの塩基配列を有する必要はない。ある
態様では、2種以上の選択マーカー用ドナーDNAにおいては、その上流および下流ホモ
ロジーアームの塩基配列が、それぞれのアレルの標的領域の上流配列および下流配列とよ
り同一性の高い塩基配列を有していてもよい(例えば、そのように最適化されていてもよ
い)。
The method for introducing the above (i) and (ii) into cells is not particularly limited, and known methods can be used without particular limitations. Methods for introducing (i) and (ii) into cells include, for example,
Examples include, but are not limited to, virus infection method, lipofection method, microinjection method, calcium phosphate method, DEAE-dextran method, electroporation method, particle gun method and the like. By introducing (i) and (ii) above into a cell, the DNA in the target region is cleaved by the sequence-specific nucleic acid cleaving molecule of (i) above,
HDR knocks in the selectable marker in the selectable marker donor DNA of (ii) into the target region. At this time, two or more selection marker donor DNAs can be randomly knocked into two or more alleles of the target region when their respective upstream homology arms and downstream homology arms are the same. However, donor DNA for two or more selection markers
can modify each of two or more alleles as long as they have base sequences of homology arms that allow homologous recombination with the upstream and downstream sequences of the target regions of each of the two or more alleles. need not have the nucleotide sequence of the homology arms of In one aspect, in two or more types of selectable marker donor DNAs, the nucleotide sequences of the upstream and downstream homology arms have nucleotide sequences that are more identical to the upstream and downstream sequences of the target regions of the respective alleles. (eg, optimized to do so).
選択マーカー用ドナーDNAは、ある態様では、上流ホモロジーアームおよび下流ホモ
ロジーアームを有し、上流ホモロジーアームおよび下流ホモロジーアームの間に、選択マ
ーカー遺伝子を有し、好ましくは、メガヌクレアーゼの切断部位などのエンドヌクレアー
ゼ(塩基配列特異的核酸切断分子)の標的配列をさらに有し得る。この態様において、あ
る好ましい態様では、選択マーカーは、ポジティブ選択用の選択マーカー遺伝子およびネ
ガティブ選択用のマーカー遺伝子を含む。別の好ましい態様では、選択マーカーは、ポジ
ティブ選択用の選択マーカーを含むが、これとは別にネガティブ選択マーカー遺伝子を含
まなくてもよい。ある好ましい態様では、ポジティブ選択用の選択マーカー遺伝子は、ネ
ガティブ選択用にも用いられ得、そのようなマーカー遺伝子としては、可視化マーカー遺
伝子が挙げられる。
2以上の選択マーカー用ドナーDNAのセットは、上記の選択マーカー用ドナーDNA
の組合せであり、かつ、それぞれが互いに区別可能なポジティブ選択用の選択マーカー遺
伝子を有している。上記セットにおいては、メガヌクレアーゼの切断部位などのエンドヌ
クレアーゼ(塩基配列特異的核酸切断分子)の標的配列をさらに有し得、当該標的配列は
互いに異なっていてもよいが、同一である(または同一の塩基配列特異的核酸切断分子で
切断できる)ことが好ましい。選択マーカー用ドナーDNAの長さは上記の通りであるが
、例えば、5kbp以上、8kbp以上、または10kbp以上であり得る。
In one aspect, the donor DNA for the selectable marker has an upstream homology arm and a downstream homology arm, has a selectable marker gene between the upstream homology arm and the downstream homology arm, and preferably has a meganuclease cleavage site or the like. It may further have a target sequence for an endonuclease (sequence-specific nucleic acid cleaving molecule). In this aspect, in one preferred aspect, the selectable marker comprises a selectable marker gene for positive selection and a marker gene for negative selection. In another preferred embodiment, the selectable marker includes a selectable marker for positive selection, but may not separately include a negative selectable marker gene. In certain preferred embodiments, selectable marker genes for positive selection can also be used for negative selection, and such marker genes include visualization marker genes.
The set of two or more selectable marker donor DNAs includes the above selectable marker donor DNAs
and each have selectable marker genes for positive selection that are distinguishable from each other. The set may further have a target sequence for an endonuclease (base sequence-specific nucleic acid cleaving molecule), such as a cleavage site for a meganuclease, and the target sequences may be different from each other, but are identical (or is cleavable with a base sequence-specific nucleic acid cleaving molecule). The length of the donor DNA for the selectable marker is as described above, but can be, for example, 5 kbp or longer, 8 kbp or longer, or 10 kbp or longer.
(工程(b))
前記工程(a)の後、工程(b)を行う。工程(b)では、2以上のアレルにそれぞれ
区別可能に異なる選択マーカー遺伝子またはその組合せが導入された細胞を、当該区別可
能に異なる選択マーカー遺伝子の発現に基づいて、選択する。より具体的には、工程(b
)では、前記2以上のアレルに対して異なる種類の選択マーカー用ドナーDNAがそれぞ
れ相同組み換えすることによって、当該2以上のアレルにそれぞれ区別可能に異なる固有
の選択マーカー遺伝子が導入され、導入された当該区別可能に異なる選択マーカー遺伝子
のすべてを発現する細胞を選択する。ある態様では、工程(b)では、前記2種以上の選
択マーカー用ドナーDNAが有する選択マーカー遺伝子であって染色体ゲノムに組込まれ
たすべての選択マーカー遺伝子の発現に基づいて、異なる選択マーカー用ドナーDNAが
導入されたことによりそれぞれのアレルが改変された細胞を選択する。ある態様では、工
程(b)では、前記2種以上の選択マーカー用ドナーDNAが有する全ての選択マーカー
遺伝子に基づいて、細胞を選択する。ある態様では、工程(b)では、前記2種以上の選
択マーカー用ドナーDNAが有する選択マーカー遺伝子であって染色体ゲノムに組込まれ
たすべての選択マーカー遺伝子(ポジティブ選択用のマーカー遺伝子)の発現に基づいて
、区別可能な選択マーカー用ドナーDNAが導入されたことによりそれぞれのアレルが改
変された細胞を選択する。ある態様では、工程(b)で得られる細胞は、各アレルが異な
るポジティブ選択用のマーカー遺伝子を有する。ある態様では、工程(b)で得られる細
胞は、各アレルが、共通したポジティブ選択用のマーカー遺伝子をここで、ある態様では
、工程(b)では、単一細胞クローニングを行わない{但し、工程(b)で2つ以上のア
レルが改変された細胞を選択した後に単一細胞クローニングを行うことを含んでいても、
含まなくてもよい}。ある態様では、工程(b)では、細胞の選択は、各アレルに導入さ
れた区別可能なポジティブ選択用のマーカー遺伝子の複数の発現に基づいて行われる。あ
る態様では、工程(b)は、単一の選択マーカー遺伝子の発現強度(例えば、蛍光タンパ
ク質の発現強度または蛍光強度)に基づいて改変アレル数の多さを推定する方式では行わ
れない。単一の選択マーカー遺伝子の発現強度の強弱に基づいて改変アレル数の多さを推
定する方式で細胞を選択する場合、細胞毎の遺伝子発現量に変動が生じ、2以上のアレル
が改変された細胞を1つのアレルが改変された細胞から完全に分離することが困難となり
、したがって、工程(b)において単一細胞クローニングが必要となるためである。
(Step (b))
After the step (a), the step (b) is performed. In step (b), cells into which two or more alleles have been introduced with distinguishably different selectable marker genes or a combination thereof are selected based on the expression of the distinguishably different selectable marker genes. More specifically, step (b
), by homologous recombination of different types of selectable marker donor DNAs with respect to the two or more alleles, unique selectable marker genes that are distinguishably different from each other are introduced into the two or more alleles. Cells are selected that express all of the distinguishably distinct selectable marker genes. In one aspect, in step (b), different donors for selection markers are selected based on the expression of all the selection marker genes that are included in the two or more types of donor DNAs for selection markers and that are integrated into the chromosomal genome. Cells in which each allele has been modified by introduction of the DNA are selected. In one embodiment, in step (b), cells are selected based on all the selectable marker genes possessed by the two or more selectable marker donor DNAs. In one aspect, in step (b), expression of all selectable marker genes (positive selection marker genes) integrated into the chromosomal genome that are selectable marker genes possessed by the two or more selectable marker donor DNAs Based on this, cells in which each allele has been modified by introduction of a distinguishable selection marker donor DNA are selected. In one aspect, the cells obtained in step (b) have a marker gene for positive selection with each allele being different. In one embodiment, the cells obtained in step (b) each allele carries a common marker gene for positive selection, and in one embodiment, in step (b), single cell cloning is not performed {however, performing single-cell cloning after selecting cells in which two or more alleles have been modified in step (b);
may not be included}. In one aspect, in step (b), the selection of cells is based on multiple expression of the introduced distinct positive selection marker gene at each allele. In some embodiments, step (b) is not performed in a manner that estimates the abundance of modified alleles based on the expression intensity of a single selectable marker gene (eg, fluorescent protein expression intensity or fluorescence intensity). When cells are selected by a method of estimating the number of modified alleles based on the intensity of expression of a single selectable marker gene, the gene expression level of each cell fluctuates, and two or more alleles are modified. This is because it becomes difficult to completely separate the cells from the cells modified in one allele, thus necessitating single cell cloning in step (b).
工程(b)は、工程(a)で用いた選択マーカー遺伝子の種類に応じて、適宜、細胞の
選択を行えばよい。この際、工程(a)で用いた選択マーカー遺伝子の全ての発現に基づ
いて細胞を選択する。
In step (b), cells may be appropriately selected according to the type of selectable marker gene used in step (a). At this time, cells are selected based on the expression of all of the selectable marker genes used in step (a).
例えば、選択マーカー遺伝子がポジティブ選択マーカー遺伝子である場合、改変対象の
染色体ゲノムに組込まれる(または組込まれた)すべての選択マーカー遺伝子を発現する
細胞を選択することができ、例えば、改変対象のアレルの数と同数のポジティブ選択マー
カーを発現する細胞を選択することができる。ポジティブ選択マーカー遺伝子が薬剤耐性
遺伝子である場合、当該薬剤を含む培地で細胞を培養することにより、前記ポジティブ選
択マーカーを発現する細胞を選択することができる。ポジティブ選択マーカー遺伝子が蛍
光タンパク質遺伝子、発光酵素遺伝子、又は発色酵素遺伝子である場合、蛍光タンパク質
、発光酵素、又は発色酵素による蛍光、発光、又は発色を呈する細胞を選択することによ
り、前記ポジティブ選択マーカーを発現する細胞を選択することができる。本工程では、
改変されるべきアレルの数と同数の選択マーカー用ドナーDNAがゲノムに取り込まれた
場合、当該数のアレルが改変されている。n倍体の細胞においては、改変されるべきアレ
ルの数はnまたはそれ以下であり、当該数以上n以下の種類の選択マーカー用ドナーDN
Aがゲノムに取り込まれた場合には、少なくとも改変されるべきアレル(2以上のアレル
である)が改変されている。ある態様では、改変されるべきアレルの数がnであり、当該
数の種類の選択マーカー用ドナーDNAが染色体ゲノムに取り込まれ、すべてのアレルが
改変されている。ある態様では、本工程では、改変対象とするアレルの数と同数以上の種
類の選択マーカー用ドナーDNAを用いているため、細胞が発現するポジティブ選択マー
カーの数は、当該数のアレルが確実に改変されていることを意味する。工程(b)におけ
る細胞の選択効率を高める観点では、改変対象とするアレルの数は、選択マーカー用ドナ
ーDNAの種類数と同一であることが好ましい。
For example, when the selectable marker gene is a positive selectable marker gene, cells expressing all selectable marker genes integrated (or integrated) into the chromosomal genome to be modified can be selected. Cells can be selected that express as many positive selectable markers as there are. When the positive selectable marker gene is a drug resistance gene, cells expressing the positive selectable marker can be selected by culturing cells in a medium containing the drug. When the positive selectable marker gene is a fluorescent protein gene, a luciferase gene, or a chromogenic enzyme gene, the positive selectable marker is selected by selecting cells exhibiting fluorescence, luminescence, or color development by the fluorescent protein, luciferase, or chromogenic enzyme. can be selected for cells that express In this process,
When the same number of selectable marker donor DNAs as the number of alleles to be modified are incorporated into the genome, the number of alleles is modified. In nploid cells, the number of alleles to be modified is n or less, and the donor DN for selection marker of the number or more and n or less types
When A is incorporated into the genome, at least the alleles to be modified (which are two or more alleles) have been modified. In one aspect, the number of alleles to be modified is n, the number of types of donor DNAs for selection markers are incorporated into the chromosomal genome, and all alleles are modified. In one aspect, in this step, the number of types of donor DNA for selection markers equal to or more than the number of alleles to be modified is used. means modified. From the viewpoint of enhancing the cell selection efficiency in step (b), the number of alleles to be modified is preferably the same as the number of types of selectable marker donor DNAs.
上記の通り、本実施形態のゲノム改変方法では、n倍体の細胞においてn個のアレルを
改変するためにn種類の選択マーカー用ドナーDNAを用いてHDRを誘発させることに
よって、細胞が有する全てのアレルが改変された細胞を効率よく取得することができる。
また、全てのアレルが改変された細胞を確実に取得することができるため、標的領域が大
きいサイズ(例えば、10kbp以上)であっても、標的領域が改変された細胞を効率よ
く取得することができる。そのため、大規模なゲノム改変も可能となる。
As described above, in the genome modification method of the present embodiment, by inducing HDR using n types of selection marker donor DNAs to modify n alleles in n-ploid cells, all the cells have Allele-modified cells can be obtained efficiently.
In addition, since cells in which all alleles have been modified can be reliably obtained, cells in which the target region has been modified can be efficiently obtained even if the target region has a large size (eg, 10 kbp or more). can. Therefore, large-scale genome modification becomes possible.
ある好ましい態様では、選択マーカー用ドナーDNAは、上流ホモロジーアームと下流
ホモロジーアームとの間にポジティブ選択用マーカー遺伝子の他にネガティブ選択用マー
カー遺伝子を含んでいてもよい。ある好ましい態様では、選択マーカー用ドナーDNAに
おいては、前記ポジティブ選択用マーカー遺伝子は、ネガティブ選択用にも兼用できるマ
ーカー遺伝子(ポジティブ選択およびネガティブ選択に兼用可能なマーカー遺伝子)であ
ってもよい。ある好ましい態様では、ポジティブ選択用マーカー遺伝子は、薬剤耐性遺伝
子であり得る。ある好ましい態様では、ポジティブ選択用マーカー遺伝子は、ネガティブ
選択用にも兼用できる可視化マーカー遺伝子等であり得る。
In a preferred embodiment, the selectable marker donor DNA may contain a negative selectable marker gene in addition to the positive selectable marker gene between the upstream homology arm and the downstream homology arm. In a preferred embodiment, in the selection marker donor DNA, the positive selection marker gene may be a marker gene that can also be used for negative selection (a marker gene that can be used for both positive selection and negative selection). In one preferred embodiment, the positive selectable marker gene can be a drug resistance gene. In a preferred embodiment, the positive selection marker gene can be a visualization marker gene or the like that can also be used for negative selection.
選択マーカー用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間
にポジティブ選択用マーカー遺伝子の他にネガティブ選択用マーカー遺伝子を含むが、標
的核酸配列をさらに含んでいてもよい。標的核酸配列は、上記ゲノム改変システムにより
切断可能な配列である。標的核酸配列は、アレル特異的な配列であることが好ましく、こ
れにより、第一のアレルのカセット(または第一のカセット)および第二のアレルのカセ
ット(第二のカセット)のうち、第一のアレルのみを切断すること、または第二のアレル
のみを切断することができる。このように、切断をアレル特異的に誘発させることにより
、片アレルのみの選択的な編集が可能である。ある好ましい態様では、選択マーカー用ド
ナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に1つの標的核酸配
列を含む。ある好ましい態様では、選択マーカー用ドナーDNAは、上流ホモロジーアー
ムと下流ホモロジーアームとの間に第一の標的核酸配列と第二の標的核酸配列を含み、第
一の標的核酸配列と第二の標的核酸配列の間に選択マーカー遺伝子を含む。別の選択マー
カー用ドナーDNAは、上流ホモロジーアームと下流ホモロジーアームとの間に第三の標
的核酸配列と第四の標的核酸配列を含み、第三の標的核酸配列と第四の標的核酸配列の間
に選択マーカー遺伝子を含む。第一の標的核酸配列と第二の標的核酸配列は、同一配列で
も異なっていてもよく、第三の標的核酸配列と第四の標的核酸配列は、同一配列でも異な
っていてもよい。例えば、第一の標的核酸配列と第二の標的核酸配列を切断するときに、
第三の標的核酸配列と第四の標的核酸配列が切断されないように設計され、および/また
は、第三の標的核酸配列と第四の標的核酸配列を切断するときに、第一の標的核酸配列と
第二の標的核酸配列が切断されないように設計されていれば、第一のカセットおよび第二
のカセットのいずれかのみを特異的に切断し、当該カセットのうちの一方の編集を選択的
に行うことができる。第一のカセットと第二のカセットを同時に編集する場合には、第一
~第四の標的核酸配列は同一でもよいことは明らかであろう。
The selectable marker donor DNA contains a positive selectable marker gene and a negative selectable marker gene between the upstream homology arm and the downstream homology arm, but may further contain a target nucleic acid sequence. A target nucleic acid sequence is a sequence cleavable by the genome modification system described above. The target nucleic acid sequence is preferably an allele-specific sequence whereby the first of the first allele cassette (or first cassette) and the second allele cassette (second cassette) one allele or only the second allele. In this way, selective editing of only one allele is possible by allele-specific induction of cleavage. In one preferred embodiment, the selectable marker donor DNA comprises a single target nucleic acid sequence between the upstream homology arm and the downstream homology arm. In one preferred embodiment, the selectable marker donor DNA comprises a first target nucleic acid sequence and a second target nucleic acid sequence between an upstream homology arm and a downstream homology arm, wherein the first target nucleic acid sequence and the second target nucleic acid sequence are A selectable marker gene is included between the nucleic acid sequences. Another selectable marker donor DNA comprises a third target nucleic acid sequence and a fourth target nucleic acid sequence between the upstream homology arm and the downstream homology arm, wherein the third target nucleic acid sequence and the fourth target nucleic acid sequence are Including a selectable marker gene in between. The first target nucleic acid sequence and the second target nucleic acid sequence may be the same or different, and the third and fourth target nucleic acid sequences may be the same or different. For example, when cleaving a first target nucleic acid sequence and a second target nucleic acid sequence,
designed such that the third target nucleic acid sequence and the fourth target nucleic acid sequence are not cleaved and/or the first target nucleic acid sequence is cleaved when the third target nucleic acid sequence and the fourth target nucleic acid sequence are cleaved and the second target nucleic acid sequence is designed not to be cleaved, specifically cleaves only one of the first cassette and the second cassette, and selectively edits one of the cassettes It can be carried out. It will be appreciated that the first to fourth target nucleic acid sequences may be identical if the first and second cassettes are edited simultaneously.
ある態様では、工程(b)では、工程(a)によって得られた細胞を含むプールから、
細胞をクローニングすることなく、改変された細胞を選択することができる。クローニン
グの工程を省くことによって工程に必要な時間が短縮され得る。
In one aspect, in step (b), from the pool comprising the cells obtained by step (a),
Modified cells can be selected without cloning the cells. Omitting the cloning step can reduce the time required for the process.
第一の中間体細胞は、改変前細胞から上記工程(a)および(b)によって得ることが
できる(図1の工程S1参照)。工程(a)においては、選択マーカー用ドナーDNAと
して、標的配列に対する上流ホモロジーアームと下流ホモロジーアームとの間にポジティ
ブ選択用マーカー遺伝子とネガティブ選択用マーカー遺伝子、またはポジティブ選択用お
よびネガティブ選択用の両方に兼用可能なマーカー遺伝子を含む。選択マーカー用ドナー
DNAは好ましくは、標的配列に対する上流ホモロジーアームと下流ホモロジーアームと
の間に2つの標的核酸配列を含む。そして、ポジティブ選択用マーカー遺伝子とネガティ
ブ選択用マーカー遺伝子、またはポジティブ選択用およびネガティブ選択用の両方に兼用
可能なマーカー遺伝子は、好ましくは、当該2つの標的核酸配列の間に存在する。このよ
うにすることで、ポジティブ選択により第一の中間体細胞を得ることができる。
A first intermediate cell can be obtained from the pre-modification cell by steps (a) and (b) above (see step S1 in FIG. 1). In step (a), the selectable marker donor DNA is a positive selectable marker gene and a negative selectable marker gene, or both positive and negative selectable marker genes between the upstream homology arm and the downstream homology arm for the target sequence. contains a marker gene that can be used for both. Donor DNAs for selectable markers preferably contain two target nucleic acid sequences between upstream and downstream homology arms to the target sequences. A positive selection marker gene and a negative selection marker gene, or a marker gene that can be used for both positive selection and negative selection, are preferably present between the two target nucleic acid sequences. By doing so, a first intermediate cell can be obtained by positive selection.
第一の中間体細胞は、改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲ
ノムを有する細胞において、前記第一のアレルと第二のアレルそれぞれに選択マーカー遺
伝子と標的核酸配列を含むカセットを有する細胞である。ある好ましい態様では、第一の
中間体細胞では、第一のアレルが有する選択マーカー遺伝子と第二のアレルが有する選択
マーカー遺伝子とは区別可能に異なる。ある好ましい態様では、第一の中間体細胞では、
前記標的核酸配列は、ゲノム改変システムの標的であり、ゲノム改変システムにより第一
のアレルと第二のアレルとを区別可能に切断できるように設計されている。ある好ましい
態様では、第一の中間体細胞では、各選択マーカー遺伝子はネガティブ選択に用いること
ができるネガティブ選択用マーカー遺伝子である。第一の中間体細胞を取得する際にはポ
ジティブ選択用マーカー遺伝子が有用であるが、第一の中間体細胞を得た後の工程におい
ては、ポジティブ選択用マーカー遺伝子は必要ではない。したがって、ポジティブ選択用
マーカー遺伝子は、除去されてもよい。除去は、例えば、ゲノム編集技術というにより実
施することができる。このように、第一の中間体細胞は、ポジティブ選択用を有していな
くてもよい。
The first intermediate cell is a cell having a genome containing a first allele and a second allele at the genetic locus to be modified, wherein each of the first allele and the second allele contains a selectable marker gene and a target nucleic acid. A cell with a cassette containing the sequence. In a preferred embodiment, in the first intermediate cell, the selectable marker gene possessed by the first allele is distinguishably different from the selectable marker gene possessed by the second allele. In one preferred embodiment, the first intermediate cell comprises
The target nucleic acid sequence is a target of a genome modification system and is designed so that the genome modification system can cleave the first allele and the second allele in a distinguishable manner. In one preferred embodiment, in the first intermediate cell, each selectable marker gene is a negative selectable marker gene that can be used for negative selection. A positive selectable marker gene is useful when obtaining the first intermediate cell, but the positive selectable marker gene is not required in the steps after obtaining the first intermediate cell. Thus, positive selectable marker genes may be removed. Removal can be performed, for example, by what is referred to as genome editing technology. Thus, the first intermediate cell may not have a positive selection potential.
第一の中間体細胞からは、第二の中間体細胞を得てもよい(参考:図1の工程S3)。
第二の中間体細胞は、第一の中間体細胞の第二のカセットを除去して作製することができ
る。カセットの除去は、好ましくは前記第二のカセットの上流と相同組換え可能な上流ホ
モロジーアームと前記カセットの下流と相同組換え可能な下流ホモロジーアームを含むド
ナーDNA(カセット除去用ドナーDNA)存在下で、第二のカセット内部の標的核酸配
列を特異的に切断することにより行うことができる。前記カセットの上流と相同組換え可
能な上流ホモロジーアームと前記カセットの下流と相同組換え可能な下流ホモロジーアー
ムからなるドナーDNA存在下で標的核酸配列を切断することでカセットの除去の際にカ
セットの上流と下流をシームレスに連結することもできる。このようにして得られる第二
の中間体細胞は、第一のアレルには、選択マーカー遺伝子と標的核酸配列を含むカセット
を有するが、第二のカセットを含まない。
A second intermediate cell may be obtained from the first intermediate cell (see step S3 in FIG. 1).
A second intermediate cell can be made by removing the second cassette of the first intermediate cell. Cassette removal is preferably performed in the presence of a donor DNA (donor DNA for cassette removal) containing an upstream homology arm capable of homologous recombination with the upstream of the second cassette and a downstream homology arm capable of homologous recombination with the downstream of the cassette. by specifically cleaving the target nucleic acid sequence within the second cassette. By cleaving the target nucleic acid sequence in the presence of a donor DNA consisting of an upstream homology arm capable of homologous recombination with the upstream of the cassette and a downstream homology arm capable of homologous recombination with the downstream of the cassette, the cassette is removed when the cassette is removed. It is also possible to connect upstream and downstream seamlessly. The second intermediate cell thus obtained has, in the first allele, the cassette containing the selectable marker gene and the target nucleic acid sequence, but does not contain the second cassette.
第一の中間体細胞および第二の中間体細胞から本開示のライブラリーを作製することが
できる(参考:図1の工程S2およびS4)。第一の中間体細胞および第二の中間体細胞
(合わせて「中間体細胞」という)は、第一のアレルに、選択マーカー遺伝子と標的核酸
配列を含むカセットを有する。ライブラリ作製工程においては、第一のカセットを除去し
、代わりに改変塩基配列を導入することができる。すなわち、第一のカセットを改変塩基
配列で置き換えることができる。この置き換えは、ゲノム改変システムにより実施するこ
とができる。第一のカセットの上流と相同組換え可能な上流ホモロジーアームと前記カセ
ットの下流と相同組換え可能な下流ホモロジーアームを含む改変塩基配列導入用ドナーD
NA(またはライブラリ作製用ドナーDNA)存在下で、第一のカセット内部の標的核酸
配列を特異的に切断することにより行うことができる。ライブラリ作製用ドナーDNAは
、上流ホモロジーアームと下流ホモロジーアームとの間に改変塩基配列を有する。基本的
には、ライブラリ作製用ドナーDNAの上流ホモロジーアームと下流ホモロジーアームの
間に挟まれた配列へと、ゲノム上の上流ホモロジーアームが相同組換えする領域と下流ホ
モロジーアームが相同組換えする領域に挟まれた領域が置き換わるので、置き換え後の配
列を上流ホモロジーアームと下流ホモロジーアームの間に有するライブラリ作製用ドナー
DNAが好ましく用いられ得る。したがって、上記操作により、カセットを改変塩基配列
に置き換えることができる。ライブラリ作製用ドナーDNAは、種々の改変塩基配列を含
むDNA群であり得る。このようにすることで、上記操作により、各中間体細胞のカセッ
トそれぞれを様々な改変塩基配列に置き換えることができる。カセットが置き換えられる
と、カセット内のネガティブ選択用マーカー遺伝子が除去されることとなるので、ネガテ
ィブ選択用マーカー遺伝子が発現しないことを指標としてカセットが改変塩基配列に置き
換わった細胞を取得することができる。ある態様では、ライブラリ作製用ドナーDNAは
、線状である(環状ではない)。このようにすることで、ライブラリ作製用ドナーDNA
の調整の簡便性において利点を有し得る(例えば、図4の欠点2参照)。カセットの改変
塩基配列の置き換えは、当業者であれは周知慣用技術により確認でき、例えば、制限酵素
による切断の有無、PCRの増幅の有無(例えば、ジャンクションPCR)やシークエン
シングにより確認することができる。改変塩基配列は、0塩基長、すなわち存在しないで
もよいが、好ましくは、1塩基長以上であり得る。改変塩基配列は、特に限定されないが
例えば、1~100万塩基長、1~50万塩基長、1~10万塩基長、1~2万塩基長、
1~1.5万塩基長、または1~1万塩基長であり得る。改変塩基配列は、特に限定され
ないが例えば、3塩基長以上、10塩基長以上、30塩基長以上、50塩基長以上、10
0塩基長以上の長さを有し得る。各ライブラリ作製用ドナーDNAの改変塩基配列は、同
じでも異なっていてもよい。各ライブラリ作製用ドナーDNAの改変塩基配列は、それぞ
れ独立して上記の長さのいずれかを有し得る。
A library of the present disclosure can be generated from a first intermediate cell and a second intermediate cell (see steps S2 and S4 in Figure 1). The first intermediate cell and the second intermediate cell (collectively, "intermediate cells") have at the first allele a cassette comprising a selectable marker gene and a target nucleic acid sequence. In the library preparation process, the first cassette can be removed and a modified nucleotide sequence can be introduced instead. That is, the first cassette can be replaced with a modified base sequence. This replacement can be performed by a genome modification system. A donor D for introducing a modified base sequence comprising an upstream homology arm capable of homologous recombination with the upstream of the first cassette and a downstream homology arm capable of homologous recombination with the downstream of the cassette
It can be performed by specifically cleaving the target nucleic acid sequence inside the first cassette in the presence of NA (or donor DNA for library construction). The donor DNA for library construction has a modified base sequence between the upstream homology arm and the downstream homology arm. Basically, the region where the upstream homology arm on the genome undergoes homologous recombination and the region where the downstream homology arm homologously recombines into the sequence sandwiched between the upstream homology arm and the downstream homology arm of the donor DNA for library construction. Since the region sandwiched between the two is replaced, a donor DNA for library construction having the sequence after replacement between the upstream homology arm and the downstream homology arm can be preferably used. Therefore, the cassette can be replaced with the modified nucleotide sequence by the above operation. The donor DNA for library construction can be a group of DNAs containing various modified base sequences. By doing so, the cassette of each intermediate cell can be replaced with various modified base sequences by the above operation. When the cassette is replaced, the negative selectable marker gene in the cassette is removed, so that non-expression of the negative selectable marker gene can be used as an index to obtain cells in which the cassette has been replaced with the modified base sequence. . In one aspect, the donor DNA for library construction is linear (not circular). By doing so, the donor DNA for library preparation
(see, for example,
It can be 10,000 to 15,000 bases long, or 10,000 to 10,000 bases long. The modified base sequence is not particularly limited, but may be, for example, 3 bases or longer, 10 bases or longer, 30 bases or longer, 50 bases or longer, 10 bases or longer,
It can have a length of 0 bases or longer. The modified nucleotide sequences of the donor DNAs for library construction may be the same or different. The modified base sequence of each library-construction donor DNA can independently have any of the above lengths.
中間体細胞が、標的領域において3以上のアレルを有する場合には、少なくとも第一の
アレルが区別可能な固有のネガティブマーカー遺伝子をあればよい。そのようにすること
で、第一のアレル以外のカセットを除去することができる、または、第一のアレル以外の
カセットを維持したまま、第一のアレルのカセットを改変塩基配列に置き換える操作を行
うことができる。したがって、中間体細胞として、第一のアレルのみが少なくとも第一の
アレルが区別可能な固有のネガティブマーカー遺伝子を有する細胞であり、中間体細胞と
してはそのような細胞を選択して用いることができる。
If the intermediate cell has three or more alleles in the target region, at least the first allele needs to have a distinct negative marker gene. By doing so, the cassette other than the first allele can be removed, or an operation is performed to replace the cassette of the first allele with the modified base sequence while maintaining the cassette other than the first allele. be able to. Therefore, as the intermediate cells, only the first allele is a cell having a unique negative marker gene in which at least the first allele can be distinguished, and such cells can be selected and used as the intermediate cells. .
本開示の方法は、図4に示される欠点1~3のいずれも解決しなくてもよいが、好まし
くは、図4に示される欠点1~3のいずれか1以上を解決し得る。具体的には、本開示の
方法では、GateweyTM法、およびLoxP/Cre法と比較して、標的ゲノムへ
の外来遺伝子の組換え効率が高い。本開示のある好ましい態様では、改変塩基配列導入用
ドナーDNAは、線状であり、環状ではない。本開示の好ましい態様では、改変細胞は、
部位特異的組換え酵素の認識部位を有しない。本開示の方法のある好ましい態様では、G
ateweyTM法、およびLoxP/Cre法と比較して、標的ゲノムへの外来遺伝子
の組換え効率が高く、改変塩基配列導入用ドナーDNAは、線状であり、改変細胞は、部
位特異的組換え酵素の認識部位を有しない。部位特異的組換え酵素の認識部位を有しない
という特徴は、例えば、導入カセットとゲノムとをシームレスに連結する際に有益である
。
Although the method of the present disclosure may not solve any of the drawbacks 1-3 shown in FIG. 4, it may preferably solve any one or more of the drawbacks 1-3 shown in FIG. Specifically, the method of the present disclosure has a higher efficiency of recombination of a foreign gene into the target genome than the GatewayTM method and the LoxP/Cre method. In a preferred embodiment of the present disclosure, the donor DNA for introducing modified nucleotide sequences is linear and not circular. In preferred aspects of the present disclosure, the modified cell is
It does not have a site-specific recombination enzyme recognition site. In certain preferred aspects of the methods of the present disclosure, G
Compared to the atweyTM method and the LoxP/Cre method, the recombination efficiency of the foreign gene into the target genome is high, the donor DNA for introducing the modified base sequence is linear, and the modified cell is a site-specific recombination enzyme does not have a recognition site for The feature of not having a recognition site for a site-specific recombination enzyme is useful, for example, when seamlessly ligating an introduction cassette and a genome.
本開示のライブラリーは、
複数の水性組成物の組合せを含み、
各水性組成物はそれぞれ1種類の改変細胞を含み、
改変細胞はそれぞれ、改変対象である遺伝子座(標的遺伝子座または目的遺伝子座)に
第一のアレルと第二のアレルを有し、
改変細胞はそれぞれ第一のアレルの同一位置に、水性組成物間で相互に異なるDNA断
片を含むカセットを有する。このようなライブラリーは、以下のようにして得ることがで
きる。例えば、様々な改変塩基配列を含むライブラリー作製用ドナーDNAの存在下で前
記中間体細胞の第一のカセットの標的核酸配列を切断する。そうすると細胞に備わったD
NA損傷の修復機構により、中間体細胞の第一のカセットが改変塩基配列に置き換わる。
改変塩基配列を有する細胞をシングルセルクローニングに供することができる。シングル
セルクローニングは、細胞1つを含む液滴または水性組成物を多数形成し、培養に供して
、液滴または水性組成物中で、1つの細胞に由来する細胞クローンを作製することを含み
得る。このようにすると細胞クローンを含む水性組成物が複数(または多数)得られるこ
ととなる。このような複数(または多数)の水性組成物の組合せを改変細胞のライブラリ
ーとして用いることができる。
The library of the present disclosure is
comprising a combination of multiple aqueous compositions;
each aqueous composition comprising one type of modified cell;
Each modified cell has a first allele and a second allele at the locus to be modified (target locus or target locus),
Each modified cell has a cassette containing DNA fragments at the same position of the first allele that differ from each other among the aqueous compositions. Such libraries can be obtained as follows. For example, the target nucleic acid sequence of the first cassette of the intermediate cell is cleaved in the presence of library construction donor DNA containing various modified base sequences. Then the D in the cell
The NA damage repair mechanism replaces the first cassette of the intermediate cell with the modified nucleotide sequence.
Cells with altered nucleotide sequences can be subjected to single cell cloning. Single-cell cloning can involve forming multiple droplets or aqueous compositions containing a single cell and subjecting them to culture to generate cell clones derived from a single cell in the droplets or aqueous compositions. . In this way, a plurality (or a large number) of aqueous compositions containing cell clones are obtained. A combination of multiple (or multiple) such aqueous compositions can be used as a library of modified cells.
中間体細胞または改変細胞のある態様では、第一のアレルは、(当初ゲノム上の)標的
領域の一部又は全体を欠失している。中間体細胞または改変細胞のある態様では、第二の
アレルは、標的領域の一部又は全部を欠失している。中間体細胞または改変細胞のある好
ましい態様では、第一のアレルおよび第二のアレルは、標的領域の一部又は全体、より好
ましくは全部を欠失している。
In some embodiments of intermediate cells or modified cells, the first allele lacks part or all of the target region (originally genomic). In certain aspects of intermediate or modified cells, the second allele lacks part or all of the target region. In certain preferred embodiments of intermediate cells or modified cells, the first allele and the second allele lack part or all, more preferably all, of the target region.
第一の中間体細胞のある態様では、第一のアレルでは、標的領域の全体が第一のカセッ
トにより置換されている。第一の中間体細胞のある態様では、第二のアレルでは、標的領
域の全体が第二のカセットにより置換されている。第一の中間体細胞のある好ましい態様
では、第一のアレルおよび第二のアレルは、標的領域の全体がそれぞれ第一のカセットお
よび第二のカセットにより置換されている。
In some embodiments of the first intermediate cell, the first allele has the entire target region replaced by the first cassette. In some embodiments of the first intermediate cell, the second allele has the entire target region replaced by the second cassette. In one preferred embodiment of the first intermediate cell, the first and second alleles are replaced by the first and second cassettes respectively over the entire target region.
第二の中間体細胞では、第二のカセットは除去されている。ある好ましい態様では、第
二の中間体細胞では、(当初ゲノム上の)第二のアレルの標的領域の上流と下流とがシー
ムレスに連結している。シームレスに連結しているとは、新しい塩基の追加なく、上流と
下流とが連結していることを意味する。上流と下流のシームレスな連結においては、塩基
の追加の脱落なく、上流と下流とが連結していることが好ましい。
In the second intermediate cell the second cassette has been removed. In a preferred embodiment, the second intermediate cell is seamlessly linked upstream and downstream of the target region of the second allele (originally on the genome). "Seamlessly linked" means that upstream and downstream are linked without the addition of new bases. In seamless connection of upstream and downstream, it is preferable that upstream and downstream are connected without additional omission of bases.
改変細胞のある態様では、第一のアレルは、改変塩基配列を含み、改変塩基配列は、(
当初ゲノム上の)標的領域(被置換配列ともいう)に対して塩基の付加、挿入、置換、欠
失、および削除からなる群から選択される1以上の変異を有する。改変細胞は、当初の細
胞(リファレンス細胞または参照細胞)と比較をし、変異の影響を評価することに有利に
用いることができる。また、ライブラリーが、変異において異なる様々な細胞を含むこと
により、細胞間の比較により、標的領域のそれぞれの変異部位の機能を評価することに有
利である。
In some embodiments of the modified cell, the first allele comprises a modified sequence, and the modified sequence comprises (
It has one or more mutations selected from the group consisting of base additions, insertions, substitutions, deletions, and deletions in the target region (also referred to as the substituted sequence) originally on the genome. Modified cells can be advantageously used to compare with the original cells (reference cells or reference cells) and to assess the effects of mutations. Also, by including a variety of cells that differ in their mutations, it is advantageous to assess the function of each mutation site in the target region through cell-to-cell comparisons.
第一の改変細胞のある態様では、第二のアレルは、選択マーカーを含むカセットを含む
。選択マーカーは、ポジティブ選択用マーカー遺伝子を含み得る。第二の改変細胞のある
態様では、第二のアレルは、被置換配列の上流と下流とがシームレスに連結している。改
変細胞の好ましいある態様では、第一のアレルの被置換配列と第二のアレルの被置換配列
とは、対応する配列を有する。対応する配列を有するとは、配列の起点および終点がゲノ
ム上の同一位置に存在することを意味する。対応する配列は、典型的には、高い同一性(
例えば、80%以上、90%以上、または95%以上)を有し、同一の長さを有する。
In some embodiments of the first modified cell, the second allele comprises a cassette containing a selectable marker. Selectable markers can include positive selectable marker genes. In some embodiments of the second modified cell, the second allele is seamlessly linked upstream and downstream of the substituted sequence. In certain preferred embodiments of the modified cell, the substituted sequence of the first allele and the substituted sequence of the second allele have corresponding sequences. Having corresponding sequences means that the start and end of the sequences are located at the same position on the genome. Corresponding sequences typically have high identity (
for example, 80% or more, 90% or more, or 95% or more) and have the same length.
ある態様において、改変細胞におけるカセットの配列のそれぞれは、1以上の改変部分
(A)と1以上の非改変部分(B)とからなっている(例えば、図3参照)。前記改変部
分(A)はそれぞれ、配列の挿入、欠失、および置換からなる群から選択される1以上の
改変を有し、前記1以上の改変部分の改変(A)は、改変の位置または内容に関して各水
性組成物間で異なる。前記1以上の非改変部分(B)はそれぞれ、改変前の対応する部位
の配列と同一である。ここで、挿入カセットで置換される改変前の配列と、挿入カセット
内の配列とをアラインメントしたときに、同じ位置に整列される場合に、2つの核酸配列
は対応する部位の配列となる。前記カセット中のセントロメア側の非改変部分(B1)は
、前記カセットのセントロメア側の隣接配列(C1)とシームレスに連結しており、前記
カセットのテロメア側の非改変部分(Bt)は、前記カセットのテロメア側の隣接配列(
C2)とシームレスに連結しており、記隣接配列(C1)および非改変部分(B1)が連
結した領域、並びに非改変部分(Bt)および上記隣接配列(C2)が連結した領域は、
改変前の対応する領域の配列と同一の配列を構成していてもよい。このようなカセットを
DNAに組込むには、上記カセットの構造を上流ホモロジーアームと下流ホモロジーアー
ムの間に有するライブラリ作製用ドナーDNAを用いて中間体細胞を改変すればよい。あ
る好ましい態様では、改変部分(A)の長さの合計は、挿入カセットの長さの90%以下
、80%以下、70%以下、60%以下、50%以下、40%以下、30%以下、20%
以下、10%以下、または5%以下であり得る。この態様の改変細胞を含むライブラリー
は、同一領域内の異なる位置に異なる変異を有するライブラリーであり得、例えば、どの
位置のどの変異が細胞活性を変化させるかを調べることや、所望の特性を有する細胞のス
クリーニングなどに好ましく用いられ得る。改変塩基配列導入用ドナーDNAは、上流ホ
モロジーアームと下流ホモロジーアームの間に上記カセットの構造を有し得る。改変塩基
配列導入用ドナーDNAは、異なるカセットの構造を有する改変塩基配列導入用ドナーD
NAのライブラリーに含まれ得る。
In some embodiments, each sequence of the cassette in the modified cell consists of one or more modified portions (A) and one or more unmodified portions (B) (see, eg, Figure 3). Each of the modified portions (A) has one or more modifications selected from the group consisting of sequence insertions, deletions, and substitutions, and the modifications (A) of the one or more modified portions are modified positions or Content differs between each aqueous composition. Each of the one or more unmodified portions (B) is identical to the sequence of the corresponding site before modification. Here, when the sequence before modification to be replaced by the insertion cassette and the sequence in the insertion cassette are aligned and aligned at the same position, the two nucleic acid sequences are sequences at corresponding sites. The unmodified portion (B1) on the centromere side of the cassette is seamlessly linked to the adjacent sequence (C1) on the centromere side of the cassette, and the unmodified portion (Bt) on the telomere side of the cassette is the cassette. flanking sequences on the telomeric side of (
C2), and the region where the adjacent sequence (C1) and the unmodified portion (B1) are linked, and the region where the unmodified portion (Bt) and the adjacent sequence (C2) are linked,
It may constitute the same sequence as the sequence of the corresponding region before modification. In order to incorporate such a cassette into DNA, an intermediate cell may be modified using a donor DNA for library construction having the structure of the cassette between the upstream homology arm and the downstream homology arm. In one preferred embodiment, the total length of the modified portion (A) is 90% or less, 80% or less, 70% or less, 60% or less, 50% or less, 40% or less, 30% or less of the length of the insertion cassette. , 20%
or less, 10% or less, or 5% or less. A library containing modified cells of this embodiment can be a library having different mutations at different positions within the same region, for example, to investigate which mutation at which position changes cell activity, or to determine the desired property. can be preferably used for screening of cells having The donor DNA for introducing a modified nucleotide sequence may have the above cassette structure between the upstream homology arm and the downstream homology arm. The modified nucleotide sequence-introducing donor DNA is a modified nucleotide sequence-introducing donor D having a different cassette structure.
It can be included in a library of NA.
ある態様において、改変細胞における改変塩基配列は、その全体が変異からなる。 In some embodiments, the modified base sequence in the modified cell consists entirely of mutations.
ある態様において、挿入カセットの内部または外部(近辺)に部位特異的組換え酵素の
組換え配列(認識部位)は存在しない。ある態様において、挿入カセット以外は、改変が
なされていない、または、改変前の細胞と同一の塩基配列を有する。このようにすること
で、目的の改変以外の改変を含まない改変細胞を得ることができ、目的の改変以外の改変
の予期せぬ影響を除去することができる(例えば、図4の欠点3参照)。
In some embodiments, there are no recombination sequences (recognition sites) for the site-specific recombination enzyme inside or outside (near) the insertion cassette. In some embodiments, the cell is unmodified or has the same base sequence as the cell before modification, except for the insertion cassette. By doing so, it is possible to obtain a modified cell that does not contain modifications other than the desired modification, and it is possible to eliminate unexpected effects of modifications other than the desired modification (for example, see
ライブラリーは、特に限定されないが好ましくは、4種類以上、5種類以上、6種類以
上、7種類以上、8種類以上、9種類以上、10種類以上、11種類以上、12種類以上
、13種類以上、14種類以上、15種類以上、16種類以上、17種類以上、18種類
以上、19種類以上、20種類以上、25種類以上、30種類以上、35種類以上、40
種類以上、45種類以上、50種類以上、60種類以上、70種類以上、80種類以上、
90種類以上、100種類以上、150種類以上、200種類以上、300種類以上、4
00種類以上、500種類以上、600種類以上、700種類以上、800種類以上、9
00種類以上、1000種類以上、2000種類以上、3000種類以上、4000種類
以上、5000種類以上、6000種類以上、7000種類以上、8000種類以上、9
000種類以上、または10000種類以上の改変細胞(又は改変細胞を含む水性組成物
)を含んでいてもよい。
The library is not particularly limited, but is preferably 4 or more, 5 or more, 6 or more, 7 or more, 8 or more, 9 or more, 10 or more, 11 or more, 12 or more, 13 or more. , 14 or more, 15 or more, 16 or more, 17 or more, 18 or more, 19 or more, 20 or more, 25 or more, 30 or more, 35 or more, 40
types or more, 45 types or more, 50 types or more, 60 types or more, 70 types or more, 80 types or more,
90 types or more, 100 types or more, 150 types or more, 200 types or more, 300 types or more, 4
00 types or more, 500 types or more, 600 types or more, 700 types or more, 800 types or more, 9
00 types or more, 1000 types or more, 2000 types or more, 3000 types or more, 4000 types or more, 5000 types or more, 6000 types or more, 7000 types or more, 8000 types or more, 9
000 types or more, or 10000 or more types of modified cells (or aqueous compositions containing modified cells) may be included.
ライブラリーは、典型的には、複数の水性組成物の組合せを含む。各水性組成物は、1
種類の細胞を含む。ある態様では、ライブラリーは、複数の水性組成物の組合せを別々に
含む。ある態様では、ライブラリーは、目的によっては、複数の水性組成物の組合せを混
合物として含んでいてもよい。例えば、細胞の増殖力や生存力の高い細胞をスクリーニン
グする場合には、ライブラリーは、複数の水性組成物の組合せを混合物として含んでいて
もよく、このような場合であっても、培養後の細胞を分析することにより、もっとも増殖
力や生存力の高い細胞が富化され、増殖力や生存力の高い細胞を取得することができる。
A library typically contains a combination of a plurality of aqueous compositions. Each aqueous composition contains 1
Contains different types of cells. In some embodiments, the library separately comprises a plurality of combinations of aqueous compositions. In some embodiments, the library may contain combinations of multiple aqueous compositions as a mixture for some purposes. For example, when screening cells with high proliferative ability or viability of cells, the library may contain a combination of a plurality of aqueous compositions as a mixture. By analyzing the cells, cells with the highest proliferative capacity and viability are enriched, and cells with high proliferative capacity and viability can be obtained.
ある態様では、1つのライブラリーにおいて、当該ライブラリーに含まれる改変細胞そ
れぞれの改変塩基配列(またはDNA断片)以外のゲノム配列は、同一となるように設計
されている。ある態様では、1つのライブラリーにおいて、当該ライブラリーに含まれる
改変細胞それぞれの改変塩基配列(またはDNA断片)以外のゲノム配列は、実質的に同
一である。実質的に同一であるとは、細胞培養に適した環境下(通常の環境下)で、クロ
ーニングされた細胞を単に10回継代した後に細胞間に生じ得る変異に基づく相違の存在
を許容する。
In one aspect, in one library, genomic sequences other than the modified nucleotide sequence (or DNA fragment) of each modified cell contained in the library are designed to be identical. In one aspect, in one library, the genomic sequences other than the modified base sequence (or DNA fragment) of each modified cell contained in the library are substantially identical. Substantially identical allows for the existence of mutational differences that can occur between cells after only 10 passages of the cloned cells under conditions suitable for cell culture (under normal conditions). .
改変塩基配列以外が共通していることにより、例えば、改変塩基配列の影響を評価する
ことに適する。第二のアレルにおけるカセットが除去されることで、カセットによる影響
の可能性を最小に抑えることができる。第二のアレルにおけるカセットがシームレスに除
去されることで、追加の新しい塩基が第二のアレルに導入されることによる影響の可能性
を最小に抑えることができる。
Since they are common except for the modified base sequence, they are suitable for evaluating the influence of the modified base sequence, for example. Elimination of the cassette in the second allele minimizes the potential impact of the cassette. Seamless removal of the cassette in the second allele minimizes the potential impact of introducing additional new bases into the second allele.
別のある態様では、中間体細胞における第二のアレルにおけるカセット(第二のカセッ
ト)も、第二の改変塩基配列により置き換えられていてもよい。第二の改変配列は、改変
細胞に共通した配列(つまり、改変細胞にわたって同一配列)であってもよいし、水性組
成物毎に異なる配列であってもよい。場合によっては、第二の改変配列は、同一水性組成
物中においてさえ細胞毎に異なっていてもよい。また、第二の改変配列は、第一のアレル
における改変塩基配列(第一の改変塩基配列)と同一であってもよいし、異なっていても
よい。第二の改変塩基配列については、第一のアレルにおける改変塩基配列と同様に設計
し、第一のアレルへの改変塩基配列の導入と同様に導入することができる。第二のカセッ
トの第二の改変塩基配列への置換は、第二のライブラリ作製用ドナーDNAの存在下で、
第二のカセット付近(好ましくは、第二のカセット内の標的核酸配列)を特異的に切断す
ればよい。本明細書では、第二の改変塩基配列の内容やその導入方法については、第一の
改変塩基配列の説明と同様であるので、この説明を参照し、ここでは説明を省略する。
In another aspect, the cassette in the second allele in the intermediate cell (second cassette) may also be replaced by the second modified nucleotide sequence. The second modified sequence may be a sequence common to the modified cells (ie, the same sequence across the modified cells) or may be a sequence that differs from aqueous composition to aqueous composition. In some cases, the second modified sequence may differ from cell to cell even within the same aqueous composition. Also, the second modified sequence may be the same as or different from the modified base sequence (first modified base sequence) in the first allele. The second modified base sequence can be designed in the same manner as the modified base sequence in the first allele and introduced in the same manner as the modified base sequence in the first allele. Substitution of the second modified base sequence of the second cassette in the presence of the second library preparation donor DNA,
The vicinity of the second cassette (preferably, the target nucleic acid sequence within the second cassette) may be specifically cleaved. In the present specification, the content of the second modified base sequence and the method of introducing it are the same as those described for the first modified base sequence, so this description will be referred to and the description will be omitted here.
応用例1
応用例1は、ゲノムの特定領域の解析への応用例である。本開示によれば、ゲノムの特
定領域の塩基配列に様々な変異をそれぞれ導入して、変異による当該特定領域の機能の獲
得または喪失を観察することによって、当該ゲノムの特定領域における重要塩基を特定す
ることが可能である。特定領域の例としては、機能が不明な領域、プロモーター領域、エ
ンハンサー領域、イントロンに該当する領域、5’非翻訳領域(UTR)に該当する領域
、3’非翻訳領域(UTR)に該当する領域、ノンコーディングRNAをコードする領域
などが挙げられる。
Application example 1
Application 1 is an application to analysis of a specific region of the genome. According to the present disclosure, by introducing various mutations into the base sequence of a specific region of the genome and observing the gain or loss of function of the specific region due to mutation, important bases in the specific region of the genome are identified. It is possible to Examples of specific regions include regions of unknown function, promoter regions, enhancer regions, regions corresponding to introns, regions corresponding to 5′ untranslated regions (UTR), and regions corresponding to 3′ untranslated regions (UTR). , regions encoding non-coding RNAs, and the like.
応用例2
応用例2は、タンパク質またはRNAの発現レベルの調節への応用例である。この応用
例では、タンパク質またはRNAの転写制御領域(転写制御に関与していると疑われる領
域を含む)、および前記タンパク質の翻訳制御領域(翻訳制御に関与していると疑われる
領域を含む)等の前記タンパク質またはRNAの発現レベルの制御に関与する領域または
関与すると疑われる領域を改変し、当該タンパク質の発現レベルを調節する。これにより
、応用例2では、タンパク質またはRNAの発現量が調節された改変細胞を得ることがで
きる。調節は、発現量の増加または減少であり得る。RNAは、mRNA、tRNA、r
RNA、その他のノンコーディングRNA(例えば、マイクロRNA)であり得る。
Application example 2
RNA, other non-coding RNA (eg, microRNA).
応用例3
応用例3は、タンパク質またはRNAのコード領域への応用例である。本開示によれば
、タンパク質またはRNAをコードする領域に様々な変異をそれぞれ導入して、変異によ
るタンパク質またはRNAの機能改変(例えば、機能の獲得または喪失)を観察すること
によって、当該タンパク質またはRNAの機能における重要アミノ酸または重要配列を特
定することが可能である。また、例えば、変異によるタンパク質またはRNAの機能の獲
得または喪失を観察することにより、向上もしくは低減した機能または新しい機能を有す
る変異タンパク質またはRNAおよび当該変異タンパク質またはRNAを発現する改変細
胞を取得することができる。タンパク質またはRNAの一部または全部に対して多様な改
変をする場合には、改変された部位を含む一部または全部をタンパク質またはRNAをコ
ードする領域にインフレームでシームレスに連結することが望ましい。RNAは、mRN
A、tRNA、rRNA、その他のノンコーディングRNA(例えば、マイクロRNA)
であり得る。応用例3によれば、上記応用例2と組み合わせて、当該変異タンパク質また
はRNAを発現する改変細胞であって、その発現レベルが調節された改変細胞を得ること
もできる。
Application example 3
Application Example 3 is an application example to a protein or RNA coding region. According to the present disclosure, by introducing various mutations into a region encoding a protein or RNA, respectively, and observing functional alteration (e.g., gain or loss of function) of the protein or RNA due to mutation, the protein or RNA It is possible to identify key amino acids or key sequences in the function of . Also, for example, by observing gain or loss of function of protein or RNA due to mutation, obtaining mutant protein or RNA having improved or reduced function or new function and modified cells expressing the mutant protein or RNA can be done. When various modifications are made to part or all of a protein or RNA, it is desirable to seamlessly ligate the part or all containing the modified site in-frame to the region encoding the protein or RNA. RNA is mRNA
A, tRNA, rRNA, other non-coding RNAs (e.g., microRNAs)
can be According to Application Example 3, in combination with Application Example 2, it is possible to obtain a modified cell that expresses the mutant protein or RNA and whose expression level is regulated.
応用例4
応用例5は、増殖力または生存力の高い細胞のスクリーニングへの応用である。本開示
によれば、細胞の増殖力または生存力に関与する可能性のあるゲノム領域について、異な
る変異を有する多様な改変細胞を含むライブラリーを得ることができる。そのようなライ
ブラリーは、各種細胞を含む水性組成物を別々に含むものであってもよいが、各種細胞を
含む水性組成物の混合物であってもよい。混合物中では、それぞれの改変細胞が同等量含
まれていることが好ましい。混合物を、細胞の培養に適した環境下または細胞への淘汰圧
存在下で培養することによって、増殖力または生存力の高い細胞は相対濃度を高め、増殖
力または生存力の低い細胞は相対濃度を低める。したがって、培養後、増殖力または生存
力の高い細胞が濃縮され、これらの細胞を取得できることに有利である。スクリーニング
は、特定の選択圧を負荷した条件下で行うこともできる。このようにすることで、当該特
定の選択圧に対して増殖力または生存力の高い細胞をスクリーニングすることができる。
選択圧としては、特に限定されないが例えば、貧栄養、高塩濃度、低塩濃度、高温、低温
、低酸素、薬物(例えば、毒物、抗生物質等の生理活性物質)の存在などが挙げられる。
ゲノム上の既存の遺伝子の改変は、当該遺伝子の改変遺伝子への置き換えにより行うこと
ができる。あるいは、セーフハーバー領域(例えば、AAVS1遺伝子座、ROSA26
遺伝子座、CLBYL遺伝子座、CXCR4遺伝子座、およびCCR5遺伝子座など)な
どに、単純に改変塩基配列を挿入することもできる。
Application example 4
Application Example 5 is an application to screening for cells with high proliferative ability or viability. According to the present disclosure, libraries can be obtained that contain diverse modified cells with different mutations in genomic regions that may be involved in cell proliferation or viability. Such a library may contain separate aqueous compositions containing each type of cell, but may also be a mixture of aqueous compositions containing each type of cell. Preferably, the mixture contains equal amounts of each modified cell. By culturing the mixture in an environment suitable for culturing cells or in the presence of selective pressure on the cells, the relative concentration of cells with high proliferation or viability is increased, and the relative concentration of cells with low proliferation or viability is reduced. lower. Therefore, after culturing, cells with high proliferation or viability are concentrated, and it is advantageous to be able to obtain these cells. Screening can also be performed under conditions that impose a certain selective pressure. In this way, cells with high proliferative or viable viability can be screened against the particular selective pressure.
Examples of selective pressure include, but are not limited to, poor nutrition, high salt concentration, low salt concentration, high temperature, low temperature, hypoxia, and the presence of drugs (eg, bioactive substances such as toxic substances and antibiotics).
An existing gene on the genome can be modified by replacing the gene with a modified gene. Alternatively, safe harbor regions (e.g., AAVS1 locus, ROSA26
It is also possible to simply insert the modified nucleotide sequence into the gene locus, CLBYL locus, CXCR4 locus, CCR5 locus, etc.).
1実施形態において、本発明は、染色体ゲノムの2つ以上のアレルが改変された細胞で
あって、当該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な)選択マーカ
ー遺伝子を有する、細胞を提供する。ある態様では、細胞は、単細胞生物の細胞であり得
る。ある態様では、細胞は、単離された細胞であり得る。ある態様では、細胞は、多能性
細胞、および多能性幹細胞(胚性幹細胞および誘導多能性幹細胞など)からなる群から選
択される細胞であり得る。ある態様では、細胞は、組織幹細胞であり得る。ある態様では
、細胞は、体細胞であり得る。ある態様では、細胞は、生殖系列細胞(例えば、生殖細胞
)であり得る。ある態様では、細胞は、細胞株であり得る。ある態様では、細胞は不死化
細胞であり得る。ある態様では、細胞はがん細胞であり得る。ある態様では、細胞は、非
がん細胞であり得る。ある態様では、細胞は、疾患患者の細胞であり得る。ある態様では
、細胞は健常者の細胞であり得る。ある態様では、細胞は、動物細胞(例えば、ヒト細胞
)、例えば、昆虫細胞(例えば、カイコ細胞)、HEK293細胞、HEK293T細胞
、Expi293F(商標)細胞、FreeStyle(商標)293F細胞、チャイニ
ーズハムスター卵巣細胞(CHO細胞)、CHO-S細胞、CHO-K1細胞、およびE
xpiCHO細胞、ならびにこれらの細胞からの派生細胞からなる群から選択される細胞
であり得る。ある好ましい態様では、上記細胞においては、染色体ゲノムの標的領域のす
べてのアレルが改変され、改変後の領域は、それぞれ相互に異なる(区別可能な)選択マ
ーカー遺伝子を有する。
In one embodiment, the present invention provides a cell in which two or more alleles of the chromosomal genome are modified, the cell having a mutually different (distinguishable) selectable marker gene in each of the two or more alleles. offer. In some aspects, the cell can be a cell of a unicellular organism. In some aspects, the cells can be isolated cells. In some embodiments, the cells can be cells selected from the group consisting of pluripotent cells and pluripotent stem cells, such as embryonic stem cells and induced pluripotent stem cells. In some aspects, the cells can be tissue stem cells. In some aspects, the cell can be a somatic cell. In some aspects, the cells can be germline cells (eg, germ cells). In some aspects, the cell can be a cell line. In some aspects, the cells can be immortalized cells. In some embodiments, the cells can be cancer cells. In some embodiments, the cells can be non-cancer cells. In some aspects, the cells can be cells of a diseased patient. In some embodiments, the cells can be cells from healthy individuals. In some aspects, the cells are animal cells (e.g., human cells), e.g., insect cells (e.g., silkworm cells), HEK293 cells, HEK293T cells, Expi293F™ cells, FreeStyle™ 293F cells, Chinese hamster ovary cells. (CHO cells), CHO-S cells, CHO-K1 cells, and E
xpiCHO cells, as well as cells derived from these cells. In a preferred embodiment, in the cell, all alleles of the target region of the chromosomal genome are modified, and the modified regions have mutually different (distinguishable) selectable marker genes.
1実施形態において、染色体ゲノムの2つ以上のアレルが改変された細胞であって、当
該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な)選択マーカー遺伝子を
有する、細胞の培養方法が提供される。選択マーカー遺伝子が、薬剤耐性マーカー遺伝子
である場合には、培養はそれぞれの薬剤耐性マーカー遺伝子に対する薬剤の存在下で培養
され得る。培養は、細胞の維持または増殖に適した条件下で行われ得る。
In one embodiment, a method for culturing cells is provided in which two or more alleles of the chromosomal genome are modified, and the two or more alleles have mutually different (distinguishable) selectable marker genes. be done. When the selectable marker gene is a drug resistance marker gene, the culture can be grown in the presence of drugs directed against the respective drug resistance marker gene. Culturing may be performed under conditions suitable for cell maintenance or growth.
1実施形態において、本発明は、2つ以上のアレルが改変された染色体ゲノムを有する
非ヒト生物であって、当該2つ以上のアレルそれぞれにおいて相互に異なる(区別可能な
)選択マーカー遺伝子を有する、非ヒト生物が提供される。ある態様では、細胞は、単細
胞生物の細胞であり得る。ある態様では、非ヒト生物は、酵母(例えば、分裂酵母または
出芽酵母、例えば、サッカロミセス・セレビシエ(Saccharomyces cer
evisiae)、サッカロミセス・カールスベルゲンシス(Saccharomyce
s carlsbergensis)、サッカロミセス・フラギリス(Saccharo
myces fragilis)、サッカロミセス・ルーキシー(Saccharomy
ces rouxii)などのサッカロミセス属、キャンディダ・ユーティリス(Can
dida utilis)、キャンディダ・トロピカリス(Candida tropi
calis)などのキャンディダ属、ピキア(Pichia)属、クリベロマイセス(K
luyveromyces)属、ヤロイワ(Yarrowia)属、ハンゼニュラ(Ha
nsenula)属、エンドマイセス(Endomyces)属などの酵母からなる群か
ら選択される生物であり得る。ある態様では、非ヒト生物は、糸状菌(例えば、Aspe
rgillus,Trichoderma,Humicola,Acremonium,
Fusarium,及びPenicillium種)であり得る。ある態様では、非ヒト
生物は、は、多細胞生物であり得る。ある態様では、非ヒト生物は、非ヒト動物であり得
る。ある態様では、非ヒト生物は、植物であり得る。ある好ましい態様では、上記非ヒト
生物では、染色体ゲノムの標的領域のすべてのアレルが改変され、改変後の領域は、それ
ぞれ相互に異なる(区別可能な)選択マーカー遺伝子を有する。
In one embodiment, the present invention provides a non-human organism having a chromosomal genome in which two or more alleles are modified, wherein the two or more alleles each have a different (distinguishable) selectable marker gene. , a non-human organism is provided. In some aspects, the cell can be a cell of a unicellular organism. In certain aspects, the non-human organism is a yeast (e.g., fission yeast or budding yeast, e.g., Saccharomyces cerevisiae).
evisiae), Saccharomyces carlsbergensis
scarlsbergensis), Saccharomyces fragilis (Saccharo
myces fragilis), Saccharomyces rouxii (Saccharomyces)
ces rouxii), Candida utilis (Can
dida utilis, Candida tropicalis
calis), Pichia, Kluyveromyces (K
luyveromyces, Yarrowia, Hansenula (Ha
nsenula), Endomyces, etc., selected from the group consisting of yeast. In some aspects, the non-human organism is a filamentous fungus (e.g., Aspe
rgillus, Trichoderma, Humicola, Acremonium,
Fusarium, and Penicillium species). In some aspects, a non-human organism can be a multicellular organism. In some aspects, the non-human organism can be a non-human animal. In some aspects, the non-human organism can be a plant. In a preferred embodiment, in the non-human organism, all alleles of the target region of the chromosomal genome are modified, and the modified regions each have mutually different (distinguishable) selectable marker genes.
上記細胞では、細胞の生存や増殖に必要な遺伝子などの所望の遺伝子の1以上が、染色
体ゲノムの他の領域に含まれ、または集められていてもよい。他の領域は、例えば、セー
フハーバー領域(例えば、AAVS1遺伝子座、ROSA26遺伝子座、CLBYL遺伝
子座、CXCR4遺伝子座、およびCCR5遺伝子座など)であり得る。他の領域は、例
えば、欠失を有する上記(ii)の領域であり得る。
In such cells, one or more desired genes, such as genes required for cell survival or proliferation, may be contained or clustered in other regions of the chromosomal genome. Other regions can be, for example, safe harbor regions such as the AAVS1 locus, ROSA26 locus, CLBYL locus, CXCR4 locus, and CCR5 locus. The other region can be, for example, the region of (ii) above that has a deletion.
図1に示されるように、改変前細胞(リファレンス細胞という)から第一の中間体細胞
を得る。改変前細胞から第一の中間体細胞を得る工程を工程S1と呼ぶ。第一の中間体細
胞から第一の改変細胞のライブラリー(以下単に「第一のライブラリー」という)を作製
することができる。第一の中間体細胞から第一のライブラリーを得る工程を工程S2と呼
ぶ。第一の中間体細胞から第二の中間体細胞を得ることができる。第一の中間体細胞から
第二の中間体細胞を得る工程を工程S3と呼ぶ。第二の中間体細胞から第二の改変細胞の
ライブラリー(以下単に「第二のライブラリー」という)を作製することができる。第二
の中間体細胞から第二のライブラリーを得る工程を工程S4と呼ぶ。
As shown in Figure 1, a first intermediate cell is obtained from a pre-modified cell (referred to as a reference cell). The step of obtaining the first intermediate cell from the pre-modification cell is called step S1. A library of first modified cells (hereinafter simply referred to as the "first library") can be generated from the first intermediate cells. The step of obtaining the first library from the first intermediate cell is called step S2. A second intermediate cell can be obtained from the first intermediate cell. The step of obtaining the second intermediate cell from the first intermediate cell is called step S3. A second library of modified cells (hereinafter simply referred to as the "second library") can be generated from the second intermediate cells. The step of obtaining the second library from the second intermediate cells is called step S4.
リファレンス細胞を用意する。リファレンス細胞は、ライブラリー化したい細胞である
。リファレンス細胞は、例えば、真核細胞であり、本開示のライブラリーの作製に用いる
ことができる。リファレンス細胞は、天然の細胞であってもよいが、改変を有する細胞で
あってもよい。リファレンス細胞は、典型的には2倍体であるが、3倍体以上であっても
よい。
Prepare reference cells. A reference cell is a cell to be made into a library. Reference cells are eukaryotic cells, for example, and can be used to generate the libraries of the present disclosure. A reference cell may be a naturally occurring cell, but may also be a cell with modifications. Reference cells are typically diploid, but may be triploid or higher.
例えば、図2に示されるように第一の中間体細胞を作製することができる。具体的には
、リファレンス細胞のゲノム上の標的領域を、選択マーカー遺伝子を含むカセットで置換
する。図2中では、2種類のドナーDNAと標的領域とを相同組換えに供する。ドナーD
NAは、それぞれ区別可能に異なる薬剤選択マーカー遺伝子(ポジティブ選択用)と区別
可能に異なる可視化マーカー遺伝子(ネガティブ選択用)を含み、それぞれ両端にCRI
SPR/Cas9による標的配列(gRNA1~4)を有する。相同組換え後、2種類の
ドナーDNAに由来する断片がそれぞれ父由来および母由来の染色体上の標的配列を置き
換わった細胞を選択するために、2種類の薬剤により薬剤選択を行う(図2の工程(1)
参照)。選択後生存する細胞は、2アレルの標的領域にそれぞれ区別可能に異なる薬剤耐
性遺伝子を有する細胞(第一の中間体細胞)である。第一の中間体細胞は、シングルセル
クローニングに供することができる。目的の位置に選択マーカー遺伝子を含むカセットが
挿入されているかを確認しておくことができる。
For example, a first intermediate cell can be made as shown in FIG. Specifically, a target region on the genome of a reference cell is replaced with a cassette containing a selectable marker gene. In FIG. 2, two donor DNAs and a target region are subjected to homologous recombination. Donor D
NAs each contain a distinguishably different drug selectable marker gene (for positive selection) and a distinguishably different visualization marker gene (for negative selection), each flanked by a CRI
It has a target sequence (gRNA1-4) by SPR/Cas9. After homologous recombination, drug selection is performed with two drugs in order to select cells in which fragments derived from the two donor DNAs have replaced the target sequences on the paternal and maternal chromosomes, respectively (Fig. 2). Step (1)
reference). Cells that survive the selection are cells (first intermediate cells) that have distinguishably different drug resistance genes in the two alleles of the target region. A first intermediate cell can be subjected to single cell cloning. It is possible to confirm whether a cassette containing a selection marker gene has been inserted at the intended position.
次に、父由来または母由来のカセットいずれか一方を除去する。例えば、図2に示され
るように、父由来の標的領域を置き換えたカセットの両端に位置する標的配列(gRNA
1およびgRNA2)を、カセット除去用ドナーDNAの存在下で、CRISPR/Ca
s9システムにより切断することができる。カセット除去用ドナーDNAは、父由来アレ
ル上の標的領域の上流と相同組換え可能な上流ホモロジーアームと当該標的領域の下流と
組換え可能な下流ホモロジーアームからなる。その後、GFPシグナルが消失した細胞を
セルソーターで選別することで、父由来アレルにおいて標的領域の上流と下流とがシーム
レスに連結した(すなわち、標的領域の全体が脱落した)ゲノムを有する第二の中間体細
胞を得ることができる。
Either the paternal or maternal cassette is then removed. For example, as shown in FIG. 2, target sequences (gRNA
1 and gRNA 2) were subjected to CRISPR/Ca in the presence of donor DNA for cassette removal.
It can be cut by the s9 system. The donor DNA for cassette removal consists of an upstream homology arm capable of homologous recombination with the upstream of the target region on the paternal allele and a downstream homology arm capable of recombination with the downstream of the target region. Then, by sorting cells in which the GFP signal has disappeared, a second intermediate having a genome in which the upstream and downstream of the target region are seamlessly linked in the paternal allele (that is, the entire target region has been dropped) is selected by using a cell sorter. Somatic cells can be obtained.
第二の中間体細胞から第二の改変細胞のライブラリー(第二のライブラリー)を作製す
ることができる。第二の中間体細胞の母由来カセットの両端に位置する標的配列(gRN
A3およびgRNA4)を、改変塩基配列導入用ドナーDNA(ライブラリー作製用ドナ
ーDNA)の存在下で、CRISPR/Cas9システムにより切断することができる。
改変塩基配列導入用ドナーDNAは、母由来アレル上の標的領域の上流と相同組換え可能
な上流ホモロジーアームと当該標的領域の下流と組換え可能な下流ホモロジーアームを有
し、上流ホモロジーアームと下流ホモロジーアームの間に、改変塩基配列を含む。このよ
うにすることで、母由来アレルにおいて、標的配列の上流と下流との間に改変塩基配列を
含むゲノムを有する改変細胞が得られる。異なる改変塩基配列を有する改変塩基配列導入
用ドナーDNAを用意しておくことで、異なる改変塩基配列を有する改変細胞を得ること
ができ、これにより第二のライブラリーを得ることができる。
A second library of modified cells (a second library) can be generated from the second intermediate cells. The target sequences (gRN
A3 and gRNA4) can be cleaved by the CRISPR/Cas9 system in the presence of donor DNA for introducing modified nucleotide sequences (donor DNA for library preparation).
The donor DNA for introducing the modified base sequence has an upstream homology arm capable of homologous recombination with the upstream of the target region on the maternal allele and a downstream homology arm capable of recombination with the downstream of the target region, and the upstream homology arm and the downstream A modified base sequence is included between the homology arms. In this way, a modified cell is obtained that has a genome containing a modified base sequence between the upstream and downstream of the target sequence in the maternal allele. By preparing modified nucleotide sequence-introducing donor DNAs having different modified nucleotide sequences, modified cells having different modified nucleotide sequences can be obtained, thereby obtaining a second library.
改変塩基配列導入用ドナーDNAは、上述のように1以上の改変部分(A)と1以上の
非改変部分(B)とからなっており、改変部分(A)以外は、改変前のゲノムの当該領域
の配列と同じ配列を有していることができる。
The donor DNA for introducing the modified nucleotide sequence consists of one or more modified portions (A) and one or more unmodified portions (B) as described above. It can have the same sequence as the sequence of the region.
Claims (20)
ライブラリーは、複数の水性組成物の組合せを含み、
各水性組成物はそれぞれ1種類の改変細胞を含み、
改変細胞はそれぞれ、改変対象である遺伝子座に第一のアレルと第二のアレルを有し、
改変細胞はそれぞれ第一のアレルの同一位置に、水性組成物間で相互に異なるDNA断片を含むカセットを有するが、改変細胞の前記遺伝子座は部位特異的組換え酵素の認識部位または組換え配列を含まない、
ライブラリー。 A library of modified cells,
the library comprises combinations of a plurality of aqueous compositions;
each aqueous composition comprising one type of modified cell;
Each modified cell has a first allele and a second allele at the locus to be modified,
Each of the modified cells has at the same position of the first allele a cassette containing DNA fragments that differ from each other among the aqueous compositions , said locus of the modified cell being the recognition site for the site-specific recombination enzyme or the recombination sequence. does not contain
Library.
(α)改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲノムを有する細胞において、前記第一のアレルと第二のアレルそれぞれに選択マーカー遺伝子と標的核酸配列を含むカセットを有する細胞の群を提供することと、
ここで、第一のアレルが有する選択マーカー遺伝子と第二のアレルが有する選択マーカー遺伝子とは区別可能に異なり、前記標的核酸配列は、ゲノム改変システムの標的であり、ゲノム改変システムにより第一のアレルと第二のアレルとを区別可能に切断できるように設計されており、各選択マーカー遺伝子はネガティブ選択に用いることができるネガティブ選択用マーカー遺伝子であり、
(β)提供された細胞の群に下記(x)及び(y)を導入する工程と、
(x)第一のアレルに含まれる前記固有の塩基配列を標的とする配列特異的核酸切断分子、又は前記配列特異的核酸切断分子をコードするポリヌクレオチドを含むゲノム改変システム、
(y)複数種類の第2の組換え用ドナーDNA{ここで、複数種類の第2の組換え用ドナーDNAはそれぞれ、上記(x)の前記標的部位の上流側に隣接する塩基配列と相同な塩基配列を有する上流ホモロジーアームと、前記標的領域の下流側に隣接する塩基配列と相同な塩基配列を有する下流ホモロジーアームを有し、前記上流ホモロジーアームと前記下流ホモロジーアームとの間に改変塩基配列を含み、改変塩基配列は、第2の組換え用ドナーDNA毎に異なり、第2の組換え用ドナーDNAそれぞれに固有である}、
(γ)前記工程(β)の後、第一のアレルに含まれる選択マーカー遺伝子を発現しない細胞を選択する工程と、
を含み、
これにより、複数の細胞を含む改変細胞のライブラリー得ることができ、ここで、得られた複数の細胞において、第一のアレルは各細胞に固有の改変塩基配列を有し、第二のアレルは細胞間で共通の配列を有する、
方法。 A method of producing a library of modified cells, comprising:
(α) in a cell having a genome containing a first allele and a second allele at the genetic locus to be modified, a cassette containing a selection marker gene and a target nucleic acid sequence for each of the first allele and the second allele; providing a population of cells having
Here, the selectable marker gene possessed by the first allele and the selectable marker gene possessed by the second allele are distinguishably different, the target nucleic acid sequence is the target of the genome modification system, and the genome modification system selects the first marker gene. each selectable marker gene is a negative selectable marker gene that can be used for negative selection, and is designed so that the allele and the second allele can be distinguished from each other;
(β) introducing the following (x) and (y) into the provided group of cells;
(x) a genome modification system comprising a sequence-specific nucleic acid cleaving molecule targeting the unique base sequence contained in the first allele, or a polynucleotide encoding the sequence-specific nucleic acid cleaving molecule;
(y) a plurality of types of second recombination donor DNA {wherein the plurality of types of second recombination donor DNA are homologous to the base sequence adjacent to the upstream side of the target site in (x) above, respectively; and a downstream homology arm having a nucleotide sequence homologous to the nucleotide sequence adjacent to the target region downstream, and a modified base between the upstream homology arm and the downstream homology arm sequence, wherein the modified nucleotide sequence is different for each second recombination donor DNA and unique to each second recombination donor DNA},
(γ) selecting cells that do not express the selectable marker gene contained in the first allele after the step (β);
including
Thereby, a library of modified cells comprising a plurality of cells can be obtained, wherein in the plurality of cells obtained, the first allele has a modified nucleotide sequence unique to each cell, and the second allele has a common sequence between cells,
Method.
改変対象である遺伝子座に第一のアレルと第二のアレルを含むゲノムを有する細胞において、第一のアレルおよび第二のアレルに含まれる被置換配列を選択マーカー遺伝子と標的核酸配列を含むカセットにより置換し、これにより被置換配列を第一のアレルおよび第二のアレルから除去することと、
をさらに含む、方法。 8. The method of claim 7 , wherein prior to step (a),
In a cell having a genome containing a first allele and a second allele at a genetic locus to be modified, a cassette containing a selection marker gene and a target nucleic acid sequence for the substituted sequences contained in the first allele and the second allele thereby removing the substituted sequence from the first allele and the second allele;
The method further comprising:
第一のアレルの改変塩基配列はそれぞれ、第一のアレルの被置換配列に対して、塩基の付加、挿入、置換、欠失、および削除からなる群から選択される1以上の変異を有する、
方法。 9. The method of claim 8 , wherein
Each modified nucleotide sequence of the first allele has one or more mutations selected from the group consisting of addition, insertion, substitution, deletion, and deletion of bases relative to the substituted sequence of the first allele,
Method.
被改変配列は、タンパク質のコード領域であり、
第一のアレルの改変塩基配列は、第一のアレルの被置換配列に対して、塩基の付加、挿入、置換、欠失、および削除からなる群から選択される1以上の変異を有する、方法。 9. The method of claim 8 , wherein
The sequence to be modified is a protein coding region,
The modified base sequence of the first allele has one or more mutations selected from the group consisting of base additions, insertions, substitutions, deletions, and deletions with respect to the substituted sequence of the first allele. .
第二のアレルからカセットを除去すること
をさらに含む、方法。 8. The method of claim 7 , wherein between steps (α) and (β),
The method further comprising removing the cassette from the second allele.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022161024A JP7212982B1 (en) | 2022-10-05 | 2022-10-05 | Cell library and its production method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2022161024A JP7212982B1 (en) | 2022-10-05 | 2022-10-05 | Cell library and its production method |
Publications (2)
Publication Number | Publication Date |
---|---|
JP7212982B1 true JP7212982B1 (en) | 2023-01-26 |
JP2024054652A JP2024054652A (en) | 2024-04-17 |
Family
ID=85035383
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2022161024A Active JP7212982B1 (en) | 2022-10-05 | 2022-10-05 | Cell library and its production method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7212982B1 (en) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004525624A (en) | 2001-01-25 | 2004-08-26 | エボルバ バイオテック アクティーゼルスカブ | Cell collection library |
JP2005503778A (en) | 2001-05-30 | 2005-02-10 | クロモス・モレキユラー・システムズ・インコーポレーテツド | Chromosome-based platform |
JP2005503826A (en) | 2001-10-01 | 2005-02-10 | ドイチェス クレブスフォルシュンクスツェントルム スチフトゥング デス エッフェントリヒェン レヒツ | Method for producing protein library and method for selecting protein therefrom |
JP2014529998A (en) | 2011-09-19 | 2014-11-17 | カイマブ・リミテッド | Antibodies, variable domains and chains made for human use |
WO2021206054A1 (en) | 2020-04-06 | 2021-10-14 | 株式会社Logomix | Genome alteration method and genome alteration kit |
-
2022
- 2022-10-05 JP JP2022161024A patent/JP7212982B1/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004525624A (en) | 2001-01-25 | 2004-08-26 | エボルバ バイオテック アクティーゼルスカブ | Cell collection library |
JP2005503778A (en) | 2001-05-30 | 2005-02-10 | クロモス・モレキユラー・システムズ・インコーポレーテツド | Chromosome-based platform |
JP2005503826A (en) | 2001-10-01 | 2005-02-10 | ドイチェス クレブスフォルシュンクスツェントルム スチフトゥング デス エッフェントリヒェン レヒツ | Method for producing protein library and method for selecting protein therefrom |
JP2014529998A (en) | 2011-09-19 | 2014-11-17 | カイマブ・リミテッド | Antibodies, variable domains and chains made for human use |
WO2021206054A1 (en) | 2020-04-06 | 2021-10-14 | 株式会社Logomix | Genome alteration method and genome alteration kit |
Non-Patent Citations (1)
Title |
---|
Nat. Commun.,2022年07月21日,13, article number: 4219 |
Also Published As
Publication number | Publication date |
---|---|
JP2024054652A (en) | 2024-04-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20240352489A1 (en) | Methods and compositions for modifying a targeted locus | |
KR102098915B1 (en) | Chimeric genome engineering molecules and methods | |
US11071289B2 (en) | DNA knock-in system | |
KR102417127B1 (en) | Large gene excision and insertion | |
JP7212982B1 (en) | Cell library and its production method | |
EP4134431A1 (en) | Genome alteration method and genome alteration kit | |
JP6867635B1 (en) | Genome modification method and genome modification kit | |
US20240368633A1 (en) | Method for improving genome editing | |
WO2024075756A1 (en) | Cell library and method for producing same | |
EP3775201B1 (en) | Methods for scarless introduction of targeted modifications into targeting vectors | |
WO2023191063A1 (en) | Cell suitable for gene engineering, cell engineering and cellular medicine, and method for producing same | |
WO2022137760A1 (en) | Method for causing large-scale deletions in genomic dna and method for analyzing genomic dna | |
US20220372522A1 (en) | Compositions and methods for homology-directed recombination | |
US20230407278A1 (en) | Compositions and methods for cas9 molecules with improved gene editing properties | |
JP2022079062A (en) | Method for inserting exogenous gene onto chromosome of animal cell, animal cell, kit for inserting exogenous gene, vector, guide rna, and guide rna expression vector | |
da Fonseca Lopes | Easy Embryonicstem Cell: A new Tool to Manipulate Gene Expression in Embryoid Bodies | |
Lopes | Easy embryonicStem cell: a new tool to manipulate gene expression in embryoid bodies |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221006 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221006 |
|
A871 | Explanation of circumstances concerning accelerated examination |
Free format text: JAPANESE INTERMEDIATE CODE: A871 Effective date: 20221006 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20221101 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221128 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221220 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230106 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7212982 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |