CN111394426B - 用于个人表观基因组学的至天然染色质的转座 - Google Patents
用于个人表观基因组学的至天然染色质的转座 Download PDFInfo
- Publication number
- CN111394426B CN111394426B CN202010205546.6A CN202010205546A CN111394426B CN 111394426 B CN111394426 B CN 111394426B CN 202010205546 A CN202010205546 A CN 202010205546A CN 111394426 B CN111394426 B CN 111394426B
- Authority
- CN
- China
- Prior art keywords
- sequence
- sequencing
- chromatin
- nucleic acid
- nuclei
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 210000003483 chromatin Anatomy 0.000 title claims abstract description 149
- 108010077544 Chromatin Proteins 0.000 title claims abstract description 147
- 230000017105 transposition Effects 0.000 title description 25
- 210000004027 cell Anatomy 0.000 claims abstract description 267
- 238000000034 method Methods 0.000 claims abstract description 239
- 102000040430 polynucleotide Human genes 0.000 claims abstract description 126
- 108091033319 polynucleotide Proteins 0.000 claims abstract description 126
- 239000002157 polynucleotide Substances 0.000 claims abstract description 126
- 239000012634 fragment Substances 0.000 claims abstract description 122
- 102000004190 Enzymes Human genes 0.000 claims abstract description 99
- 108090000790 Enzymes Proteins 0.000 claims abstract description 99
- 238000012163 sequencing technique Methods 0.000 claims abstract description 88
- 230000001973 epigenetic effect Effects 0.000 claims abstract description 44
- 150000007523 nucleic acids Chemical class 0.000 claims description 109
- 102000039446 nucleic acids Human genes 0.000 claims description 106
- 108020004707 nucleic acids Proteins 0.000 claims description 106
- 108010047956 Nucleosomes Proteins 0.000 claims description 94
- 210000001623 nucleosome Anatomy 0.000 claims description 94
- 108010020764 Transposases Proteins 0.000 claims description 70
- 102000008579 Transposases Human genes 0.000 claims description 70
- 210000004940 nucleus Anatomy 0.000 claims description 69
- 239000002773 nucleotide Substances 0.000 claims description 47
- 125000003729 nucleotide group Chemical group 0.000 claims description 47
- 230000027455 binding Effects 0.000 claims description 42
- 238000003780 insertion Methods 0.000 claims description 41
- 230000037431 insertion Effects 0.000 claims description 41
- 238000006243 chemical reaction Methods 0.000 claims description 38
- 108090000623 proteins and genes Proteins 0.000 claims description 32
- 102000052510 DNA-Binding Proteins Human genes 0.000 claims description 30
- 108010012306 Tn5 transposase Proteins 0.000 claims description 24
- 108700009124 Transcription Initiation Site Proteins 0.000 claims description 21
- 102000004169 proteins and genes Human genes 0.000 claims description 21
- 101710096438 DNA-binding protein Proteins 0.000 claims description 20
- 238000004458 analytical method Methods 0.000 claims description 19
- 230000003321 amplification Effects 0.000 claims description 13
- 210000003855 cell nucleus Anatomy 0.000 claims description 13
- 238000003199 nucleic acid amplification method Methods 0.000 claims description 13
- 108700020911 DNA-Binding Proteins Proteins 0.000 claims description 10
- 238000004519 manufacturing process Methods 0.000 claims description 8
- 230000002934 lysing effect Effects 0.000 claims description 6
- 238000007481 next generation sequencing Methods 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 239000003550 marker Substances 0.000 claims 11
- 238000010306 acid treatment Methods 0.000 claims 2
- 238000013507 mapping Methods 0.000 abstract description 8
- 108020004414 DNA Proteins 0.000 description 101
- 239000000523 sample Substances 0.000 description 66
- 102000040945 Transcription factor Human genes 0.000 description 60
- 108091023040 Transcription factor Proteins 0.000 description 60
- 239000000203 mixture Substances 0.000 description 38
- 238000009830 intercalation Methods 0.000 description 27
- 210000004369 blood Anatomy 0.000 description 26
- 239000008280 blood Substances 0.000 description 26
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 26
- 238000009826 distribution Methods 0.000 description 24
- 230000001105 regulatory effect Effects 0.000 description 22
- 210000001744 T-lymphocyte Anatomy 0.000 description 21
- 210000001519 tissue Anatomy 0.000 description 21
- 102000016897 CCCTC-Binding Factor Human genes 0.000 description 20
- 108010014064 CCCTC-Binding Factor Proteins 0.000 description 20
- 201000010099 disease Diseases 0.000 description 20
- 230000000295 complement effect Effects 0.000 description 16
- 238000009396 hybridization Methods 0.000 description 16
- 238000001943 fluorescence-activated cell sorting Methods 0.000 description 14
- 108091034117 Oligonucleotide Proteins 0.000 description 13
- 102000016911 Deoxyribonucleases Human genes 0.000 description 12
- 108010053770 Deoxyribonucleases Proteins 0.000 description 12
- 238000003556 assay Methods 0.000 description 12
- 238000001353 Chip-sequencing Methods 0.000 description 11
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 10
- 150000001768 cations Chemical class 0.000 description 10
- 239000000463 material Substances 0.000 description 10
- 108010033040 Histones Proteins 0.000 description 9
- 241000282414 Homo sapiens Species 0.000 description 9
- 108010002350 Interleukin-2 Proteins 0.000 description 9
- 239000003795 chemical substances by application Substances 0.000 description 9
- 238000003776 cleavage reaction Methods 0.000 description 9
- 238000000338 in vitro Methods 0.000 description 9
- 238000002360 preparation method Methods 0.000 description 9
- 230000007017 scission Effects 0.000 description 9
- 238000012360 testing method Methods 0.000 description 9
- 241000124008 Mammalia Species 0.000 description 8
- 208000027418 Wounds and injury Diseases 0.000 description 8
- 230000006378 damage Effects 0.000 description 8
- 238000003745 diagnosis Methods 0.000 description 8
- 239000000975 dye Substances 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 8
- 208000014674 injury Diseases 0.000 description 8
- 108090000765 processed proteins & peptides Proteins 0.000 description 8
- 102000004196 processed proteins & peptides Human genes 0.000 description 8
- 238000011282 treatment Methods 0.000 description 8
- 108700028369 Alleles Proteins 0.000 description 7
- 241000258920 Chilopoda Species 0.000 description 7
- 230000004568 DNA-binding Effects 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 108091028043 Nucleic acid sequence Proteins 0.000 description 7
- 201000011510 cancer Diseases 0.000 description 7
- 238000012165 high-throughput sequencing Methods 0.000 description 7
- 229920001184 polypeptide Polymers 0.000 description 7
- 230000008569 process Effects 0.000 description 7
- 239000000047 product Substances 0.000 description 7
- 238000004393 prognosis Methods 0.000 description 7
- 238000000746 purification Methods 0.000 description 7
- 239000011535 reaction buffer Substances 0.000 description 7
- 208000035475 disorder Diseases 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 239000003623 enhancer Substances 0.000 description 6
- 230000004807 localization Effects 0.000 description 6
- 102000053602 DNA Human genes 0.000 description 5
- 238000011529 RT qPCR Methods 0.000 description 5
- CGNLCCVKSWNSDG-UHFFFAOYSA-N SYBR Green I Chemical compound CN(C)CCCN(CCC)C1=CC(C=C2N(C3=CC=CC=C3S2)C)=C2C=CC=CC2=[N+]1C1=CC=CC=C1 CGNLCCVKSWNSDG-UHFFFAOYSA-N 0.000 description 5
- 210000003719 b-lymphocyte Anatomy 0.000 description 5
- 230000015572 biosynthetic process Effects 0.000 description 5
- 210000000601 blood cell Anatomy 0.000 description 5
- 239000000872 buffer Substances 0.000 description 5
- 239000008004 cell lysis buffer Substances 0.000 description 5
- 239000003153 chemical reaction reagent Substances 0.000 description 5
- 230000000875 corresponding effect Effects 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 239000003814 drug Substances 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 238000011068 loading method Methods 0.000 description 5
- 210000001616 monocyte Anatomy 0.000 description 5
- 239000008188 pellet Substances 0.000 description 5
- 239000008191 permeabilizing agent Substances 0.000 description 5
- 235000000346 sugar Nutrition 0.000 description 5
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 4
- 108010077850 Nuclear Localization Signals Proteins 0.000 description 4
- 102000007079 Peptide Fragments Human genes 0.000 description 4
- 108010033276 Peptide Fragments Proteins 0.000 description 4
- 239000007983 Tris buffer Substances 0.000 description 4
- 241000607618 Vibrio harveyi Species 0.000 description 4
- 238000000137 annealing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 4
- 230000033228 biological regulation Effects 0.000 description 4
- 230000002759 chromosomal effect Effects 0.000 description 4
- 230000009089 cytolysis Effects 0.000 description 4
- 238000010790 dilution Methods 0.000 description 4
- 239000012895 dilution Substances 0.000 description 4
- 229940079593 drug Drugs 0.000 description 4
- 230000004064 dysfunction Effects 0.000 description 4
- 239000012530 fluid Substances 0.000 description 4
- 230000014509 gene expression Effects 0.000 description 4
- 239000004615 ingredient Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 238000000370 laser capture micro-dissection Methods 0.000 description 4
- 210000000265 leukocyte Anatomy 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 210000000440 neutrophil Anatomy 0.000 description 4
- 244000052769 pathogen Species 0.000 description 4
- 230000001717 pathogenic effect Effects 0.000 description 4
- 210000005259 peripheral blood Anatomy 0.000 description 4
- 239000011886 peripheral blood Substances 0.000 description 4
- 238000011002 quantification Methods 0.000 description 4
- 230000002829 reductive effect Effects 0.000 description 4
- 230000035945 sensitivity Effects 0.000 description 4
- 238000003786 synthesis reaction Methods 0.000 description 4
- LENZDBCJOHFCAS-UHFFFAOYSA-N tris Chemical compound OCC(N)(CO)CO LENZDBCJOHFCAS-UHFFFAOYSA-N 0.000 description 4
- 108091023037 Aptamer Proteins 0.000 description 3
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 3
- QRLVDLBMBULFAL-UHFFFAOYSA-N Digitonin Natural products CC1CCC2(OC1)OC3C(O)C4C5CCC6CC(OC7OC(CO)C(OC8OC(CO)C(O)C(OC9OCC(O)C(O)C9OC%10OC(CO)C(O)C(OC%11OC(CO)C(O)C(O)C%11O)C%10O)C8O)C(O)C7O)C(O)CC6(C)C5CCC4(C)C3C2C QRLVDLBMBULFAL-UHFFFAOYSA-N 0.000 description 3
- 241000196324 Embryophyta Species 0.000 description 3
- 241000725303 Human immunodeficiency virus Species 0.000 description 3
- -1 MNase and H3K27ac Proteins 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 3
- 108091028664 Ribonucleotide Proteins 0.000 description 3
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 3
- 108010011834 Streptolysins Proteins 0.000 description 3
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 3
- 238000013459 approach Methods 0.000 description 3
- 238000005119 centrifugation Methods 0.000 description 3
- 210000001175 cerebrospinal fluid Anatomy 0.000 description 3
- 239000013611 chromosomal DNA Substances 0.000 description 3
- 210000000349 chromosome Anatomy 0.000 description 3
- 230000002596 correlated effect Effects 0.000 description 3
- 238000004925 denaturation Methods 0.000 description 3
- 230000036425 denaturation Effects 0.000 description 3
- 239000005547 deoxyribonucleotide Substances 0.000 description 3
- 125000002637 deoxyribonucleotide group Chemical group 0.000 description 3
- 238000002405 diagnostic procedure Methods 0.000 description 3
- UVYVLBIGDKGWPX-KUAJCENISA-N digitonin Chemical compound O([C@@H]1[C@@H]([C@]2(CC[C@@H]3[C@@]4(C)C[C@@H](O)[C@H](O[C@H]5[C@@H]([C@@H](O)[C@@H](O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)CO7)O)[C@H](O)[C@@H](CO)O6)O[C@H]6[C@@H]([C@@H](O[C@H]7[C@@H]([C@@H](O)[C@H](O)[C@@H](CO)O7)O)[C@@H](O)[C@@H](CO)O6)O)[C@@H](CO)O5)O)C[C@@H]4CC[C@H]3[C@@H]2[C@@H]1O)C)[C@@H]1C)[C@]11CC[C@@H](C)CO1 UVYVLBIGDKGWPX-KUAJCENISA-N 0.000 description 3
- UVYVLBIGDKGWPX-UHFFFAOYSA-N digitonine Natural products CC1C(C2(CCC3C4(C)CC(O)C(OC5C(C(O)C(OC6C(C(OC7C(C(O)C(O)CO7)O)C(O)C(CO)O6)OC6C(C(OC7C(C(O)C(O)C(CO)O7)O)C(O)C(CO)O6)O)C(CO)O5)O)CC4CCC3C2C2O)C)C2OC11CCC(C)CO1 UVYVLBIGDKGWPX-UHFFFAOYSA-N 0.000 description 3
- 239000012149 elution buffer Substances 0.000 description 3
- 210000003743 erythrocyte Anatomy 0.000 description 3
- 239000000499 gel Substances 0.000 description 3
- 238000011534 incubation Methods 0.000 description 3
- 210000004698 lymphocyte Anatomy 0.000 description 3
- 239000011572 manganese Substances 0.000 description 3
- 238000004806 packaging method and process Methods 0.000 description 3
- 210000002381 plasma Anatomy 0.000 description 3
- 229920000136 polysorbate Polymers 0.000 description 3
- 239000002243 precursor Substances 0.000 description 3
- 230000002062 proliferating effect Effects 0.000 description 3
- 239000011541 reaction mixture Substances 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 239000002336 ribonucleotide Substances 0.000 description 3
- 125000002652 ribonucleotide group Chemical group 0.000 description 3
- 230000035939 shock Effects 0.000 description 3
- 238000000638 solvent extraction Methods 0.000 description 3
- 238000000527 sonication Methods 0.000 description 3
- 241000894007 species Species 0.000 description 3
- 210000000952 spleen Anatomy 0.000 description 3
- 239000007858 starting material Substances 0.000 description 3
- 210000000130 stem cell Anatomy 0.000 description 3
- 239000000126 substance Substances 0.000 description 3
- 238000011144 upstream manufacturing Methods 0.000 description 3
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 2
- JYCQQPHGFMYQCF-UHFFFAOYSA-N 4-tert-Octylphenol monoethoxylate Chemical compound CC(C)(C)CC(C)(C)C1=CC=C(OCCO)C=C1 JYCQQPHGFMYQCF-UHFFFAOYSA-N 0.000 description 2
- 241000251468 Actinopterygii Species 0.000 description 2
- 102100032187 Androgen receptor Human genes 0.000 description 2
- 241001156002 Anthonomus pomorum Species 0.000 description 2
- 102100022005 B-lymphocyte antigen CD20 Human genes 0.000 description 2
- 108090000695 Cytokines Proteins 0.000 description 2
- 102000016928 DNA-directed DNA polymerase Human genes 0.000 description 2
- 108010014303 DNA-directed DNA polymerase Proteins 0.000 description 2
- 102100038595 Estrogen receptor Human genes 0.000 description 2
- ZHNUHDYFZUAESO-UHFFFAOYSA-N Formamide Chemical compound NC=O ZHNUHDYFZUAESO-UHFFFAOYSA-N 0.000 description 2
- 108090000079 Glucocorticoid Receptors Proteins 0.000 description 2
- 102100033417 Glucocorticoid receptor Human genes 0.000 description 2
- 241000282412 Homo Species 0.000 description 2
- 101000897405 Homo sapiens B-lymphocyte antigen CD20 Proteins 0.000 description 2
- FYYHWMGAXLPEAU-UHFFFAOYSA-N Magnesium Chemical compound [Mg] FYYHWMGAXLPEAU-UHFFFAOYSA-N 0.000 description 2
- PWHULOQIROXLJO-UHFFFAOYSA-N Manganese Chemical compound [Mn] PWHULOQIROXLJO-UHFFFAOYSA-N 0.000 description 2
- 206010027476 Metastases Diseases 0.000 description 2
- 241000699670 Mus sp. Species 0.000 description 2
- 206010036790 Productive cough Diseases 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical compound O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 2
- 230000032683 aging Effects 0.000 description 2
- 125000003275 alpha amino acid group Chemical group 0.000 description 2
- 150000001413 amino acids Chemical class 0.000 description 2
- 108010080146 androgen receptors Proteins 0.000 description 2
- 210000003651 basophil Anatomy 0.000 description 2
- 210000001124 body fluid Anatomy 0.000 description 2
- 239000010839 body fluid Substances 0.000 description 2
- 210000000746 body region Anatomy 0.000 description 2
- 210000001185 bone marrow Anatomy 0.000 description 2
- 125000002091 cationic group Chemical group 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 2
- 238000004113 cell culture Methods 0.000 description 2
- 238000002512 chemotherapy Methods 0.000 description 2
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 230000029087 digestion Effects 0.000 description 2
- 239000000539 dimer Substances 0.000 description 2
- 239000003596 drug target Substances 0.000 description 2
- 230000002255 enzymatic effect Effects 0.000 description 2
- 210000003979 eosinophil Anatomy 0.000 description 2
- 108010038795 estrogen receptors Proteins 0.000 description 2
- 230000005284 excitation Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 210000003714 granulocyte Anatomy 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 125000000623 heterocyclic group Chemical group 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000001727 in vivo Methods 0.000 description 2
- 208000015181 infectious disease Diseases 0.000 description 2
- 230000000977 initiatory effect Effects 0.000 description 2
- 150000002500 ions Chemical class 0.000 description 2
- 210000004185 liver Anatomy 0.000 description 2
- 210000002751 lymph Anatomy 0.000 description 2
- 239000012139 lysis buffer Substances 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 239000011777 magnesium Substances 0.000 description 2
- 229910052749 magnesium Inorganic materials 0.000 description 2
- 238000002826 magnetic-activated cell sorting Methods 0.000 description 2
- 230000007257 malfunction Effects 0.000 description 2
- 229910052748 manganese Inorganic materials 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 238000005259 measurement Methods 0.000 description 2
- 230000003818 metabolic dysfunction Effects 0.000 description 2
- 230000009401 metastasis Effects 0.000 description 2
- 238000002156 mixing Methods 0.000 description 2
- 238000010369 molecular cloning Methods 0.000 description 2
- 210000003205 muscle Anatomy 0.000 description 2
- 210000000822 natural killer cell Anatomy 0.000 description 2
- 230000037361 pathway Effects 0.000 description 2
- 230000008823 permeabilization Effects 0.000 description 2
- 229920000642 polymer Polymers 0.000 description 2
- 102000003998 progesterone receptors Human genes 0.000 description 2
- 108090000468 progesterone receptors Proteins 0.000 description 2
- 150000003212 purines Chemical class 0.000 description 2
- 150000003230 pyrimidines Chemical class 0.000 description 2
- 230000005855 radiation Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 238000007634 remodeling Methods 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 210000003296 saliva Anatomy 0.000 description 2
- 210000003491 skin Anatomy 0.000 description 2
- 210000004872 soft tissue Anatomy 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 210000003802 sputum Anatomy 0.000 description 2
- 208000024794 sputum Diseases 0.000 description 2
- 239000000758 substrate Substances 0.000 description 2
- 238000001356 surgical procedure Methods 0.000 description 2
- 208000024891 symptom Diseases 0.000 description 2
- 210000001138 tear Anatomy 0.000 description 2
- 230000001225 therapeutic effect Effects 0.000 description 2
- 238000002560 therapeutic procedure Methods 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 238000012800 visualization Methods 0.000 description 2
- 238000005406 washing Methods 0.000 description 2
- HNXRLRRQDUXQEE-ALURDMBKSA-N (2s,3r,4s,5r,6r)-2-[[(2r,3s,4r)-4-hydroxy-2-(hydroxymethyl)-3,4-dihydro-2h-pyran-3-yl]oxy]-6-(hydroxymethyl)oxane-3,4,5-triol Chemical compound O[C@@H]1[C@@H](O)[C@@H](O)[C@@H](CO)O[C@H]1O[C@@H]1[C@@H](CO)OC=C[C@H]1O HNXRLRRQDUXQEE-ALURDMBKSA-N 0.000 description 1
- GUAHPAJOXVYFON-ZETCQYMHSA-N (8S)-8-amino-7-oxononanoic acid zwitterion Chemical compound C[C@H](N)C(=O)CCCCCC(O)=O GUAHPAJOXVYFON-ZETCQYMHSA-N 0.000 description 1
- PIINGYXNCHTJTF-UHFFFAOYSA-N 2-(2-azaniumylethylamino)acetate Chemical group NCCNCC(O)=O PIINGYXNCHTJTF-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- ASJSAQIRZKANQN-CRCLSJGQSA-N 2-deoxy-D-ribose Chemical compound OC[C@@H](O)[C@@H](O)CC=O ASJSAQIRZKANQN-CRCLSJGQSA-N 0.000 description 1
- FWBHETKCLVMNFS-UHFFFAOYSA-N 4',6-Diamino-2-phenylindol Chemical compound C1=CC(C(=N)N)=CC=C1C1=CC2=CC=C(C(N)=N)C=C2N1 FWBHETKCLVMNFS-UHFFFAOYSA-N 0.000 description 1
- 108091027075 5S-rRNA precursor Proteins 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- 208000023275 Autoimmune disease Diseases 0.000 description 1
- 238000012935 Averaging Methods 0.000 description 1
- 241000271566 Aves Species 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 206010006187 Breast cancer Diseases 0.000 description 1
- 208000026310 Breast neoplasm Diseases 0.000 description 1
- 101100167280 Caenorhabditis elegans cin-4 gene Proteins 0.000 description 1
- 244000135860 Capparis spinosa subsp spinosa Species 0.000 description 1
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 208000024172 Cardiovascular disease Diseases 0.000 description 1
- 241000282693 Cercopithecidae Species 0.000 description 1
- 102100031235 Chromodomain-helicase-DNA-binding protein 1 Human genes 0.000 description 1
- 206010009944 Colon cancer Diseases 0.000 description 1
- 108020004635 Complementary DNA Proteins 0.000 description 1
- 241000938605 Crocodylia Species 0.000 description 1
- 102000005636 Cyclic AMP Response Element-Binding Protein Human genes 0.000 description 1
- 108010045171 Cyclic AMP Response Element-Binding Protein Proteins 0.000 description 1
- 102000004127 Cytokines Human genes 0.000 description 1
- 238000001712 DNA sequencing Methods 0.000 description 1
- 230000006820 DNA synthesis Effects 0.000 description 1
- 206010012289 Dementia Diseases 0.000 description 1
- MYMOFIZGZYHOMD-UHFFFAOYSA-N Dioxygen Chemical compound O=O MYMOFIZGZYHOMD-UHFFFAOYSA-N 0.000 description 1
- 206010061819 Disease recurrence Diseases 0.000 description 1
- 102100029952 Double-strand-break repair protein rad21 homolog Human genes 0.000 description 1
- 108700024394 Exon Proteins 0.000 description 1
- 229940124602 FDA-approved drug Drugs 0.000 description 1
- 108700023863 Gene Components Proteins 0.000 description 1
- 108700039691 Genetic Promoter Regions Proteins 0.000 description 1
- 108010002459 HIV Integrase Proteins 0.000 description 1
- 206010019233 Headaches Diseases 0.000 description 1
- 241000405147 Hermes Species 0.000 description 1
- 108010034791 Heterochromatin Proteins 0.000 description 1
- 108091027305 Heteroduplex Proteins 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 102000006947 Histones Human genes 0.000 description 1
- 101100005713 Homo sapiens CD4 gene Proteins 0.000 description 1
- 101000777047 Homo sapiens Chromodomain-helicase-DNA-binding protein 1 Proteins 0.000 description 1
- 101000584942 Homo sapiens Double-strand-break repair protein rad21 homolog Proteins 0.000 description 1
- 101001053270 Homo sapiens Insulin gene enhancer protein ISL-2 Proteins 0.000 description 1
- 101001015004 Homo sapiens Integrin beta-3 Proteins 0.000 description 1
- 101001011441 Homo sapiens Interferon regulatory factor 4 Proteins 0.000 description 1
- 101000946889 Homo sapiens Monocyte differentiation antigen CD14 Proteins 0.000 description 1
- 101000934338 Homo sapiens Myeloid cell surface antigen CD33 Proteins 0.000 description 1
- 101000995046 Homo sapiens Nuclear transcription factor Y subunit alpha Proteins 0.000 description 1
- 101000622137 Homo sapiens P-selectin Proteins 0.000 description 1
- 101000651906 Homo sapiens Paired amphipathic helix protein Sin3a Proteins 0.000 description 1
- 101100523829 Homo sapiens RBPMS gene Proteins 0.000 description 1
- 101000708766 Homo sapiens Structural maintenance of chromosomes protein 3 Proteins 0.000 description 1
- 101000914514 Homo sapiens T-cell-specific surface glycoprotein CD28 Proteins 0.000 description 1
- 102000043138 IRF family Human genes 0.000 description 1
- 206010061218 Inflammation Diseases 0.000 description 1
- 102100024390 Insulin gene enhancer protein ISL-2 Human genes 0.000 description 1
- 102100032999 Integrin beta-3 Human genes 0.000 description 1
- 102100030126 Interferon regulatory factor 4 Human genes 0.000 description 1
- 108091029795 Intergenic region Proteins 0.000 description 1
- 108091092195 Intron Proteins 0.000 description 1
- XEEYBQQBJWHFJM-UHFFFAOYSA-N Iron Chemical compound [Fe] XEEYBQQBJWHFJM-UHFFFAOYSA-N 0.000 description 1
- 206010058467 Lung neoplasm malignant Diseases 0.000 description 1
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 1
- 102100035877 Monocyte differentiation antigen CD14 Human genes 0.000 description 1
- 102100025243 Myeloid cell surface antigen CD33 Human genes 0.000 description 1
- 102000007999 Nuclear Proteins Human genes 0.000 description 1
- 108010089610 Nuclear Proteins Proteins 0.000 description 1
- 102100034408 Nuclear transcription factor Y subunit alpha Human genes 0.000 description 1
- 101710163270 Nuclease Proteins 0.000 description 1
- 241000283973 Oryctolagus cuniculus Species 0.000 description 1
- 102100023472 P-selectin Human genes 0.000 description 1
- 238000012408 PCR amplification Methods 0.000 description 1
- 239000012807 PCR reagent Substances 0.000 description 1
- 102100027334 Paired amphipathic helix protein Sin3a Human genes 0.000 description 1
- 241000288906 Primates Species 0.000 description 1
- 206010060862 Prostate cancer Diseases 0.000 description 1
- 208000000236 Prostatic Neoplasms Diseases 0.000 description 1
- 102000009572 RNA Polymerase II Human genes 0.000 description 1
- 108010009460 RNA Polymerase II Proteins 0.000 description 1
- 238000003559 RNA-seq method Methods 0.000 description 1
- 241000700159 Rattus Species 0.000 description 1
- 108010017324 STAT3 Transcription Factor Proteins 0.000 description 1
- 240000004808 Saccharomyces cerevisiae Species 0.000 description 1
- 101100060558 Schizosaccharomyces pombe (strain 972 / ATCC 24843) coa3 gene Proteins 0.000 description 1
- 238000012300 Sequence Analysis Methods 0.000 description 1
- 201000001880 Sexual dysfunction Diseases 0.000 description 1
- 102100024040 Signal transducer and activator of transcription 3 Human genes 0.000 description 1
- 208000000453 Skin Neoplasms Diseases 0.000 description 1
- 102100032723 Structural maintenance of chromosomes protein 3 Human genes 0.000 description 1
- 102100027213 T-cell-specific surface glycoprotein CD28 Human genes 0.000 description 1
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 1
- 229940122954 Transcription factor inhibitor Drugs 0.000 description 1
- 108700019146 Transgenes Proteins 0.000 description 1
- 108091023045 Untranslated Region Proteins 0.000 description 1
- 230000005856 abnormality Effects 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 210000004100 adrenal gland Anatomy 0.000 description 1
- 125000001931 aliphatic group Chemical group 0.000 description 1
- 125000000304 alkynyl group Chemical group 0.000 description 1
- 150000001408 amides Chemical class 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000000692 anti-sense effect Effects 0.000 description 1
- 239000007864 aqueous solution Substances 0.000 description 1
- 238000000429 assembly Methods 0.000 description 1
- 230000000712 assembly Effects 0.000 description 1
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000001363 autoimmune Effects 0.000 description 1
- 150000001540 azides Chemical class 0.000 description 1
- 230000003542 behavioural effect Effects 0.000 description 1
- XMQFTWRPUQYINF-UHFFFAOYSA-N bensulfuron-methyl Chemical compound COC(=O)C1=CC=CC=C1CS(=O)(=O)NC(=O)NC1=NC(OC)=CC(OC)=N1 XMQFTWRPUQYINF-UHFFFAOYSA-N 0.000 description 1
- 238000004166 bioassay Methods 0.000 description 1
- 239000012620 biological material Substances 0.000 description 1
- 239000000090 biomarker Substances 0.000 description 1
- 238000001574 biopsy Methods 0.000 description 1
- 229960002685 biotin Drugs 0.000 description 1
- 235000020958 biotin Nutrition 0.000 description 1
- 239000011616 biotin Substances 0.000 description 1
- 230000017531 blood circulation Effects 0.000 description 1
- 210000000988 bone and bone Anatomy 0.000 description 1
- 210000004556 brain Anatomy 0.000 description 1
- 208000029028 brain injury Diseases 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 229910052799 carbon Inorganic materials 0.000 description 1
- 125000003178 carboxy group Chemical group [H]OC(*)=O 0.000 description 1
- 230000003915 cell function Effects 0.000 description 1
- 230000010261 cell growth Effects 0.000 description 1
- 210000000170 cell membrane Anatomy 0.000 description 1
- 230000010307 cell transformation Effects 0.000 description 1
- 230000036755 cellular response Effects 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 239000013043 chemical agent Substances 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- UHZZMRAGKVHANO-UHFFFAOYSA-M chlormequat chloride Chemical compound [Cl-].C[N+](C)(C)CCCl UHZZMRAGKVHANO-UHFFFAOYSA-M 0.000 description 1
- 210000003763 chloroplast Anatomy 0.000 description 1
- 102000022628 chromatin binding proteins Human genes 0.000 description 1
- 108091013410 chromatin binding proteins Proteins 0.000 description 1
- 208000029742 colonic neoplasm Diseases 0.000 description 1
- 238000010205 computational analysis Methods 0.000 description 1
- 210000002808 connective tissue Anatomy 0.000 description 1
- 239000000470 constituent Substances 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 229940104302 cytosine Drugs 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 230000034994 death Effects 0.000 description 1
- 210000004443 dendritic cell Anatomy 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000010494 dissociation reaction Methods 0.000 description 1
- 230000005593 dissociations Effects 0.000 description 1
- 238000002337 electrophoretic mobility shift assay Methods 0.000 description 1
- 230000007368 endocrine function Effects 0.000 description 1
- 210000002889 endothelial cell Anatomy 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 210000002919 epithelial cell Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 150000002170 ethers Chemical class 0.000 description 1
- 210000003527 eukaryotic cell Anatomy 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- GNBHRKFJIUUOQI-UHFFFAOYSA-N fluorescein Chemical compound O1C(=O)C2=CC=CC=C2C21C1=CC=C(O)C=C1OC1=CC(O)=CC=C21 GNBHRKFJIUUOQI-UHFFFAOYSA-N 0.000 description 1
- 238000007672 fourth generation sequencing Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 210000001035 gastrointestinal tract Anatomy 0.000 description 1
- 238000001502 gel electrophoresis Methods 0.000 description 1
- 238000001415 gene therapy Methods 0.000 description 1
- 210000000224 granular leucocyte Anatomy 0.000 description 1
- 230000012010 growth Effects 0.000 description 1
- 125000005843 halogen group Chemical group 0.000 description 1
- 231100000869 headache Toxicity 0.000 description 1
- 238000010438 heat treatment Methods 0.000 description 1
- 210000003958 hematopoietic stem cell Anatomy 0.000 description 1
- 210000004458 heterochromatin Anatomy 0.000 description 1
- 108010051779 histone H3 trimethyl Lys4 Proteins 0.000 description 1
- 239000005556 hormone Substances 0.000 description 1
- 229940088597 hormone Drugs 0.000 description 1
- 210000003917 human chromosome Anatomy 0.000 description 1
- 229910052739 hydrogen Inorganic materials 0.000 description 1
- 239000001257 hydrogen Substances 0.000 description 1
- 125000002887 hydroxy group Chemical group [H]O* 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 208000026278 immune system disease Diseases 0.000 description 1
- 229940124622 immune-modulator drug Drugs 0.000 description 1
- 230000003053 immunization Effects 0.000 description 1
- 238000002649 immunization Methods 0.000 description 1
- 238000009169 immunotherapy Methods 0.000 description 1
- 238000007901 in situ hybridization Methods 0.000 description 1
- 238000012606 in vitro cell culture Methods 0.000 description 1
- 238000010921 in-depth analysis Methods 0.000 description 1
- 208000027866 inflammatory disease Diseases 0.000 description 1
- 230000002757 inflammatory effect Effects 0.000 description 1
- 230000004054 inflammatory process Effects 0.000 description 1
- 230000005764 inhibitory process Effects 0.000 description 1
- 230000002687 intercalation Effects 0.000 description 1
- 210000003734 kidney Anatomy 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 210000002429 large intestine Anatomy 0.000 description 1
- 230000002045 lasting effect Effects 0.000 description 1
- 230000003902 lesion Effects 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 210000004072 lung Anatomy 0.000 description 1
- 201000005202 lung cancer Diseases 0.000 description 1
- 208000020816 lung neoplasm Diseases 0.000 description 1
- 210000001165 lymph node Anatomy 0.000 description 1
- 210000004324 lymphatic system Anatomy 0.000 description 1
- 210000002540 macrophage Anatomy 0.000 description 1
- 210000004962 mammalian cell Anatomy 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000002844 melting Methods 0.000 description 1
- 230000008018 melting Effects 0.000 description 1
- 125000006357 methylene carbonyl group Chemical group [H]C([H])([*:1])C([*:2])=O 0.000 description 1
- 208000024191 minimally invasive lung adenocarcinoma Diseases 0.000 description 1
- 210000003470 mitochondria Anatomy 0.000 description 1
- 239000003068 molecular probe Substances 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 210000002433 mononuclear leukocyte Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 210000000441 neoplastic stem cell Anatomy 0.000 description 1
- 230000001537 neural effect Effects 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000006386 neutralization reaction Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 210000000633 nuclear envelope Anatomy 0.000 description 1
- 238000001668 nucleic acid synthesis Methods 0.000 description 1
- 125000003835 nucleoside group Chemical group 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 210000004976 peripheral blood cell Anatomy 0.000 description 1
- 208000022821 personality disease Diseases 0.000 description 1
- 210000004910 pleural fluid Anatomy 0.000 description 1
- 230000002980 postoperative effect Effects 0.000 description 1
- 125000002924 primary amino group Chemical group [H]N([H])* 0.000 description 1
- 208000020016 psychiatric disease Diseases 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 239000002096 quantum dot Substances 0.000 description 1
- 210000002345 respiratory system Anatomy 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000284 resting effect Effects 0.000 description 1
- PYWVYCXTNDRMGF-UHFFFAOYSA-N rhodamine B Chemical compound [Cl-].C=12C=CC(=[N+](CC)CC)C=C2OC2=CC(N(CC)CC)=CC=C2C=1C1=CC=CC=C1C(O)=O PYWVYCXTNDRMGF-UHFFFAOYSA-N 0.000 description 1
- 150000003291 riboses Chemical class 0.000 description 1
- 125000000548 ribosyl group Chemical group C1([C@H](O)[C@H](O)[C@H](O1)CO)* 0.000 description 1
- 210000000582 semen Anatomy 0.000 description 1
- 102000023888 sequence-specific DNA binding proteins Human genes 0.000 description 1
- 108091008420 sequence-specific DNA binding proteins Proteins 0.000 description 1
- 210000002966 serum Anatomy 0.000 description 1
- 231100000872 sexual dysfunction Toxicity 0.000 description 1
- 238000007086 side reaction Methods 0.000 description 1
- 201000000849 skin cancer Diseases 0.000 description 1
- 210000000813 small intestine Anatomy 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 230000000638 stimulation Effects 0.000 description 1
- 210000002784 stomach Anatomy 0.000 description 1
- 238000003860 storage Methods 0.000 description 1
- 230000035882 stress Effects 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- 239000006228 supernatant Substances 0.000 description 1
- 230000004083 survival effect Effects 0.000 description 1
- 210000001179 synovial fluid Anatomy 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000005382 thermal cycling Methods 0.000 description 1
- ACOJCCLIDPZYJC-UHFFFAOYSA-M thiazole orange Chemical compound CC1=CC=C(S([O-])(=O)=O)C=C1.C1=CC=C2C(C=C3N(C4=CC=CC=C4S3)C)=CC=[N+](C)C2=C1 ACOJCCLIDPZYJC-UHFFFAOYSA-M 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- RYYWUUFWQRZTIU-UHFFFAOYSA-K thiophosphate Chemical compound [O-]P([O-])([O-])=S RYYWUUFWQRZTIU-UHFFFAOYSA-K 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000011269 treatment regimen Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 125000002264 triphosphate group Chemical class [H]OP(=O)(O[H])OP(=O)(O[H])OP(=O)(O[H])O* 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000003932 urinary bladder Anatomy 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 229960005486 vaccine Drugs 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003612 virological effect Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
- 239000012224 working solution Substances 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
- C12Q1/6874—Methods for sequencing involving nucleic acid arrays, e.g. sequencing by hybridisation
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6806—Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B30/00—ICT specially adapted for sequence analysis involving nucleotides or amino acids
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H50/00—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
- G16H50/20—ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2521/00—Reaction characterised by the enzymatic activity
- C12Q2521/30—Phosphoric diester hydrolysing, i.e. nuclease
- C12Q2521/301—Endonuclease
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q2537/00—Reactions characterised by the reaction format or use of a specific feature
- C12Q2537/10—Reactions characterised by the reaction format or use of a specific feature the purpose or use of
- C12Q2537/164—Methylation detection other then bisulfite or methylation sensitive restriction endonucleases
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Physics & Mathematics (AREA)
- Analytical Chemistry (AREA)
- General Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Genetics & Genomics (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Immunology (AREA)
- Medical Informatics (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Bioinformatics & Computational Biology (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Biology (AREA)
- Public Health (AREA)
- Biomedical Technology (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Pathology (AREA)
- Primary Health Care (AREA)
- Epidemiology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Enzymes And Modification Thereof (AREA)
- Apparatus Associated With Microorganisms And Enzymes (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
本文提供了用于分析多核苷酸例如基因组DNA的方法。在某些实施方案中,所述方法包括:(a)用插入酶复合物处理分离自细胞群的染色质以产生基因组DNA的标记片段;(b)测序标记片段的一部分以产生多个序列读数;和(c)通过将获自序列读数的信息映射至细胞的基因组的区域而制作所述细胞的基因组的该区域的表观遗传图谱。还提供了用于执行所述方法的试剂盒。
Description
本申请是中国专利申请CN201480028601.1的分案申请。
政府支持
本发明是在国立卫生研究院授予的合同AI057229、HG000044和NS073015下由政府支持作出的。政府具有本发明的某些权利。
交叉引用
本申请要求2013年5月23日提交的美国临时申请系列号61/826728的利益,该申请通过引用以其整体并入本文。
背景
真核生物基因组分层次地包装成染色质,并且此包装的性质在基因调控中起着中心作用。对编码在染色质的核蛋白结构中的表观遗传信息的主要认知来自于高通量的全基因组方法,其用于单独测定染色质可接近性(“开放染色质”)、核小体定位和转录因子(TF)占据。虽然存在已公开的方案,但这些方法需要数百万个细胞作为起始材料、复杂和费时的样品制备并不能同时探测核小体定位、染色质可接近性和TF结合的相互作用。这些限制在三个主要方面存在问题:第一,目前的方法可平均和“淹没”细胞群的异质性。第二,细胞通常必须离体生长以获得足够的生物材料,从而扰乱体内背景并且以未知的方式调节表观遗传状态。第三,输入要求通常会阻止这些测定应用于明确定义的临床样品,从而妨碍诊断时间尺度上“个人表观基因组学”的产生。本文提供的是可以克服这些限制的方法,其用于分析多核苷酸包括其可接近性及其结构。还提供的是单细胞方法,其可以提供较高的灵敏度和对染色质可接近性的进一步信息,包括细胞间变异性,以潜在地使其用作生物标志物。
概述
本文提供了用于分析多核苷酸例如基因组DNA的方法。在某些实施方案中,该方法包括:(a)用转座酶和分子标签处理分离自细胞群的染色质以产生多核苷酸的标记片段;(b)测序标记片段的一部分以产生多个序列读数;和(c)通过将获自序列读数的信息映射至细胞的基因组的区域而制作所述细胞的基因组的该区域的表观遗传图谱。
在一些情况下,信息通过使用在序列读数的开头的核苷酸序列和任选末端上的核苷酸序列获得。在某些情况下,在(c)中映射的信息选自下列的一种或多种:(i)转座酶的切割位点;(ii)在步骤(a)中产生的片段的大小;(iii)序列读数长度;(iii)确定长度范围的序列读数的位置;和(iv)序列读数丰度。在一些情况下,确定大小范围的片段是无核小体的片段。
在一些情况下,表观遗传图谱显示下列的一种或多种:(i)沿该区域的染色质可接近性的特征谱;(ii)该区域中结合位点的DNA结合蛋白的占据;(iii)该区域中的无核小体的DNA;(iv)沿该区域的核小体定位;和/或(v)染色质状态。在一些情况下,该方法还可包括测量DNA结合蛋白对于结合位点的总体占据。DNA结合蛋白可以例如是转录因子。
在一些情况下,细胞群可以包括约500至100,000个细胞。细胞可以分离自个体,例如分离自该个体的血液。在一些实例中,细胞可以是相同的细胞类型。在一些实例中,细胞可以是FACS选择的细胞。
在一些情况下,处理步骤(a)可以包括:从细胞群分离细胞核;和将分离的细胞核与插入酶复合物组合,其中所述组合导致细胞核裂解以释放染色质,以及导致产生基因组DNA的标记片段。在一些实例中,转座酶可来源于Tn5转座酶。在其它实例中,转座酶可来源于MuA转座酶。在进一步的实例中,转座酶可来源于Vibhar转座酶(例如来源于哈氏弧菌(Vibrio harveyi))。
本公开内容还提供了用于比较两种样品的方法,其包括:(a)分析第一细胞群以产生第一表观遗传图谱;和(b)分析第二细胞群以产生第二表观遗传图谱;以及(c)比较第一表观遗传图谱与第二表观遗传图谱。例如,第一细胞群和第二细胞群可以是从相同个体在不同的时间收集的。或者,第一细胞群和第二细胞群可以是从不同个体收集的不同细胞群。
本公开内容还提供了一种诊断方法,其包括:分析来自患者的染色质以产生表观遗传图谱;和基于表观遗传图谱提供诊断或预后。
本公开内容提供了用于测定多核苷酸在某位点的可接近性的方法,其中所述多核苷酸来自细胞样品,所述方法包括:(a)用插入酶将多个分子标签插入多核苷酸;和(b)使用所述分子标签来测定所述位点上的可接近性。该方法还可包括使用所测定的可接近性来鉴定在所述位点上结合至多核苷酸的一种或多种蛋白。在一些情况下,所述蛋白的至少一种是转录因子。该方法还可包括使用分子标签来产生多核苷酸的可接近性图。
本公开内容还提供了用于分析来自细胞样品的多核苷酸的三维结构的方法,包括:(a)用插入酶将多个分子标签插入多核苷酸;和(b)使用分子标签来分析所述多核苷酸的三维结构。在一些情况下,插入酶可包含两个或更多个酶部分,其中各个酶部分将共同的序列插入多核苷酸。酶部分可以连接在一起。共同的序列可包括共同的条形码。酶部分可包括转座酶。多核苷酸可以在步骤(a)过程中被分割成多个片段,其中包含共同的条形码的片段被测定为在多核苷酸的三维结构中是靠近的。
多核苷酸可以在插入过程中被分割成多个片段。该方法还可包括扩增所述片段。可接近性可以通过对片段测序从而产生多个测序读数来测定。片段可以例如通过高通量测序技术测序。该方法还可包括基于插入酶的序列插入偏好标准化测序读数。测序读数的长度还可用于确定染色质状态注释(chromatin stae annotation)。
细胞样品可以经透化以允许插入酶进入。在一些情况下,细胞样品中的细胞核在透化期间被最小限度地扰乱。细胞样品可以使用透化剂来透化,所述透化剂包括但不限于NP40、洋地黄皂苷、吐温、链球菌溶血素和/或阳离子脂质。细胞样品还可以使用低渗休克和/或超声处理来透化。
该方法还可包括基于特定位点的可接近性来分析受试者中的疾病状态,其中细胞样品获自所述受试者。细胞样品和/或多核苷酸还可被划分成多个部分,其可任选地基于分子标签来划分。该方法还可包括分析细胞样品的表型。在一些情况下,表型可以与位点的可接近性相关。
插入可以通过加入一种或多种二价阳离子来促进。在一些情况下,所述一种或多种二价阳离子可以包括镁。在一些情况下,所述一种或多种二价阳离子可以包括锰。
细胞样品可获自原始来源。细胞样品可以由少于约500,000个细胞组成,或甚至是单个细胞。多核苷酸可以结合至多个关联分子。关联分子可以包括蛋白质,例如组蛋白。插入酶可以是转座酶。在一些情况下,转座酶可来源于Tn5转座酶。在其它情况下,转座酶可来源于MuA转座酶。在其它情况下,转座酶可来源于Vibhar转座酶(例如来源于哈氏弧菌)。在一些情况下,分子标签可包含测序衔接子,其还可包含条形码标记。条形码标记可包括独特的序列。在其它情况下,分子标签可包括荧光标签。插入酶还可包含亲和标签,其可任选地是结合转录因子、修饰的核小体和/或修饰的核酸的抗体。修饰的核酸可以例如是甲基化或羟甲基化的DNA。亲和标签还可以是单链核酸,其可任选地结合至靶核酸。插入酶还可包含核定位信号。
本公开内容还提供了组合物。该组合物可包含多核苷酸、插入酶和插入元件,其中:插入元件包括包含预先确定的序列的核酸;并且插入酶还包含亲和标签。组合物还可包含多核苷酸、插入酶和插入元件,其中:插入酶包含两个或更多个酶部分;并且所述酶部分连接在一起。亲和标签可以是抗体,其可任选地结合至转录因子、修饰的核小体和/或修饰的核酸。修饰的核酸可以是例如甲基化或羟甲基化的DNA。亲和标签还可以是单链核酸,其可任选地结合至靶核酸。插入元件可以结合至插入酶并且插入酶结合至多核苷酸。多核苷酸还可结合至多个关联分子。关联分子可以包括蛋白质,例如组蛋白。
本公开还提供了试剂盒。该试剂盒可包含:(a)用于从细胞群分离细胞核的试剂;(b)插入酶复合物,和(c)转座酶反应缓冲液,在一些情况下,试剂盒的组分可以被配置为使得反应缓冲液、转座子标签和衔接子与细胞核的体外组合导致细胞核裂解以释放染色质,以及导致产生基因组DNA的标记片段。试剂盒还可包含:细胞裂解缓冲液;包含亲和标签的插入酶;和包含核酸的插入元件,其中所述核酸包含预先确定的序列。试剂盒还可包含:细胞裂解缓冲液;包含两个或更多个酶部分的插入酶,其中所述酶部分连接在一起;和(c)插入元件。亲和标签可以是抗体,其可任选地结合至转录因子、修饰的核小体和/或修饰的核酸。修饰的核酸可以是例如甲基化或羟甲基化的DNA。亲和标签还可以是单链核酸,其可任选地结合至靶核酸。
本教导内容的这些和其它特征示于本文中。
通过引用并入
在本说明书中提及的所有出版物、专利和专利申请均通过引用并入本文,其程度如同每个单独的出版物、专利或专利申请被明确地和单独地指明通过引用并入。
附图简述
本领域技术人员将理解下文描述的附图仅用于举例说明的目的。附图并不意图以任何方式限制本教导内容的范围。
图1A-1C:ATAC-seq是开放染色质状态的灵敏的、准确的探针。(a)ATAC-seq反应原理图。装载有测序衔接子(红色和蓝色)的转座酶(绿色)仅插入开放染色质(灰色的核小体)的区域,并生成可PCR扩增的测序文库片段。(b)开放染色质分析的全基因组方法的近似报告输入材料和样品制备时间要求。(c)在GM12878淋巴母细胞样细胞中的基因座上ATAC-seq与其它开放染色质测定的比较,显示高度一致性。靠下的ATAC-seq轨迹由500个FACS分选的细胞产生。
图2A-2B:ATAC-seq提供染色质紧密态的全基因组信息。(a)从GM12878细胞核(红色)产生的ATAC-seq片段大小指示具有与核小体一致的空间频率的染色质依赖的周期性,以及与小于200bp片段的DNA螺旋螺距一致的高频率周期性。(插图)对数转换的直方图显示出明显的持续至6个核小体的周期性。(b)之前确定的7类染色质状态的标准化读数富集。
图3A-3E:ATAC-seq提供了关于调节区域中核小体定位的全基因组信息。(a)含有两个转录起始位点(TSS)的示例基因座,显示无核小体读数轨迹、计算的核小体轨迹(“方法”)、以及用于比较的DNase、MNase和H3K27ac、H3K4me3以及H2A.Z轨迹。(b)针对所有活性TSS(n=64,836)所显示的ATAC-seq(1.98x 106个配对读数)和MNase-seq(来自ref 23的4x109个单末端读数)核小体信号,TSS通过CAGE表达分选。(c)TSS针对无核小体的片段富集,并且在-2、-1、+1、+2、+3和+4位置上显示与MNase-seq所见的相似的定相核小体。(d)TSS和远端位点中核小体关联的相对于无核小体的(NFR)碱基的相对分数(见“方法”)。(e)可接近的染色质内相对于最近的核小体二分体的DNA结合因子位置的层次聚类揭示了不同类别的DNA结合因子。与核小体强烈关联的因子针对染色质重塑体富集。
图4A-4C:ATAC-seq测定全基因组因子占据。(a)在chr1上的特定基因座上,在ATAC-seq和DNase-seq数据中观察到的CTCF足迹。(b)在基因组中的结合位点上产生的针对CTCF(所显示的基序)的集合ATAC-seq足迹。(c)从ATAC-seq数据、针对CTCF基序的位置权重矩阵(PWM)得分和进化保守性(PhyloP)推断的CTCF预测结合概率。最右边的列是针对该GM12878细胞系的CTCF ChIP-seq数据(ENCODE),显示出与预测的结合概率的高度一致性。
图5A-5D:ATAC-seq实现实时的个人表观基因组学。(a)从标准抽血的工作流。(b)来自先证者T细胞的三天内连续ATAC-seq数据。(c)ATAC-seq数据(绿色轨迹)用于对候选TF药物靶标区分优先次序的应用实例。在鉴定的靠近细胞因子基因IL2(可以由FDA批准的药物靶向)的TF结合位点中,仅NFAT结合先证者T细胞。ATAC-seq足迹预测通过与公开的NFATChIP-seq数据(蓝色轨迹,来自ref35的数据)比对来确认。(d)与GM 12878B细胞系比较的来自先证者T细胞的细胞类型特异性调节网络。每行或列是TF相对于相同细胞类型中的所有其它TF的足迹特征谱。颜色表示T相对于B细胞的相对相似性(黄色)或差异性(蓝色)。NFAT是一个最高差异调节的TF(红色框),而典型CTCF结合在T细胞和B细胞中基本相似。
图6:ATAC-seq峰强度与DNase-seq峰强度良好相关。Duke DNase-seq(向下采样至60x 106个读数)、UW DNase-seq(40x 106个读数)和ATAC-seq数据(60x 106个配对末端读数)中的峰使用ZINBA(Rashid等人Genome Biol.2011 12:R67)来调用。由于每个数据集有不同的读数长度,我们选择过滤可映射区域内的峰(Duke DNase-seq=20bp读数,UWDNase-Seq=36bp读数,ATAC-Seq=配对末端50bp读数)。对于(A)Duke DNase-seq和ATAC-seq,(B)UW DNase-seq和ATAC-seq,以及(C)UW DNAse-seq和Duke DNase-seq比较log10(读数强度)。ATAC-seq数据的技术重现性显示于D中。
图7:ATAC-seq捕获DNase识别峰的很大一部分。对于所有数据集使用ZINBA调用峰。维恩图显示每个方法之间的峰调用重叠。下图:大多数ATAC-seq读数在与Duke和UWDNase-seq峰相交的强峰中。显示了从ATAC-seq、UW DNase-seq和Duke DNase-seq调用的峰内的读数的总分数,以及这些数据的交集。所有三种方法中超过65%的读数被发现在三种方法的峰的交集中,提示通过所有方法检测到良好定型的峰。表单元格颜色与读数的分数成比例。
图8:相对于一组背景区域,与GM12878细胞中通过Duke DNase、UW DNase和FAIRE鉴定的一组开放染色质区域重叠的读数数量的图,其中对于检测开放染色质位点灵敏性和特异性所需的读数深度的测定在不同的读数深度上评估,包括50k、100k、500k、1x 107和5x107个读数。底部图显示ATAC-seq在GM12878细胞中的表现通过使用500、5,000或50,000个细胞作为起始材料来进行评估。
图9:基因组DNA和染色质中的Tn5插入偏好。核苷酸频率得分代表针对每个碱基所观察到的核苷酸频率,将核苷酸频率针对1进行标准化。x=0的位置表示读数开始,虚线表示Tn5二聚体的对称轴。我们在纯化的基因组DNA和人染色质之间没有看到Tn5插入偏好之间的实质性差别,这表明染色质中的局部插入偏好与裸基因组DNA中所发现的相同。所报告的这些序列偏好类似于以前报道过的那些(ref.11的正文)。
图10:在每个ATAC-seq峰上各特征的每碱基平均强度的图;所有ENCODE ChIP数据针对输入进行标准化;数据已使用200个峰的滑动窗口进行了处理。
图11:各种细胞数量的ATAC-seq。对于ATAC-seq来自不同起始数量细胞的数据的代表性UCSC基因组浏览器轨迹。此相同的基因组还显示于正文的图1b中。按顺序:使用FACS分离500个细胞,和通过从细胞培养物的简单稀释实现500个细胞和5,000个细胞的一式两份重复。为了比较,底部轨迹代表50,000个细胞,还显示于图1b中。此图证实,我们能够从少至500个细胞捕获开放染色质位点。
图12:将核小体峰拟合至ATAC-seq片段大小分布以实现核小体占据测量。所观察到的片段分布被划分为四个读数群-预期源自开放DNA的读数,和跨越1、2或3个推定核小体的读数。为了实现数据的这种划分,将ATAC-seq片段分布拟合至下列的总和:1)低于1个核小体的插入片段大小上片段分布模式的指数函数和2)从一、二、三、四和五个核小体的保护产生的分布的5个高斯。所显示的这些拟合的总和(黑色虚线)类似于所观察到的片段分布(蓝线)。垂直虚线是鉴定为源自无核小体(<100bp)、1-核小体、2-核小体和3-核小体区域的片段的边界。虚线被设置为确保<10%的片段从邻近起源,如由我们的拟合所限定的。
图13:GM 12878细胞中通过ATAC-seq检测的转录因子足迹的选择组。对于所指示的转录因子,使用CENTIPEDE在匹配对应基序的全基因组位点集上计算ATAC-seq读数的集合信号。在基序边界的区域+/-100bp中计算读数。垂直虚线指示基序的边界。
图14:使用ATAC-seq和DNase足迹利用CENTIPEDE预测CTCF结合位点。CTCF结合位点的预测使用通过由CENTIPEDE报告的后验概率分选的全基因组CTCF基序集来评估。那些重叠CTCF ChIP-seq峰用作阳性集并且所有其它的被认为是阴性集。这产生0.92的曲线下面积(AUC),其提示CTCF的特异性和灵敏性结合推断。Duke DNase和UW DNase数据在相同的CENTIPEDE设置下使用,并显示了ROC图。ATAC-seq数据由198x 106个配对读数组成,DukeDNase包含245x 106个读数并且UW DNase包含48x 106个读数。
图15:T细胞特异性NFAT调节:通过ATAC-seq预测并通过与NFAT ChIP-seq(来自ref 35正文的数据)比对确认的T细胞特异性NFAT靶基因的实例。
图16:来自人血的FACS纯化的细胞群的ATAC-seq。(A)从标准抽血,我们使用荧光激活细胞分选(FACS)纯化CD4+T细胞、CD8+T细胞和CD14+单核细胞。每个群体产生成功的ATAC-seq数据(B)并揭示了已知的谱系特异性基因上的细胞类型特异性染色质开放位点。
图17:使用ATAC-seq检测GM12878细胞中的等位基因特异性开放染色质。通过可公开获得的变体数据,我们测量了假定的杂合基因座上开放染色质区域中的等位基因频率。由于潜在的虚假杂合位点,我们需要多于两个读数来验证等位基因的杂合性。红点(n=167)是p<10-5的候选等位基因特异性开放染色质位点,而灰色(n=900)代表P<0.01的候选物。使用由Audic等人(Genome Research 1997 7,986–995)开发的贝叶斯模型来计算P值。
图18:转座酶可用作开放染色质染料。通过用荧光标记的DNA衔接子装载Tn5转座酶,以绿色显示的转座事件主要定位于细胞核,并表现出与高阶组织一致的点状图案。
图19:相较于50,000个细胞,来自单个细胞核的单细胞ATAC-seq数据(蓝色)在全基因组开放染色质的预期位置上显示明显的峰。
图20:单细胞插入片段长度分布与来自50,000个细胞的分布相匹配,显示因核小体存在的周期性。
定义
除非本文另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域中普通技术人员所通常理解的相同的含义。虽然类似或等同于本文描述的方法和材料的任何方法和材料可用于本发明的实践或测试,但对优选的方法和材料进行了描述。
本文引用的所有专利和出版物,包括这些专利和出版物中公开的所有序列,明确地通过引用并入。
数字范围包括限定该范围的数字。除非另外指出,否则分别地,核酸以5'至3'方向从左到右书写;氨基酸序列以氨基至羧基方向从左至右书写。
本文提供的标题不是对本发明的各个方面或实施方案的限制。因此,下文即将定义的术语通过参考整个说明书会更加充分地定义。
除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域中普通技术人员所通常理解的相同的含义。Singleton等人,DICTIONARY OF MICROBIOLOGY ANDMOLECULAR BIOLOGY,2D ED.,John Wiley and Sons,New York(1994)以及Hale&Markham,THE HARPER COLLINS DICTIONARY OF BIOLOGY,Harper Perennial,N.Y.(1991)为技术人员提供了本文所用的许多术语的一般含义。尽管如此,为了清楚和便于参考的目的,在下文定义了某些术语。
如本文所用的术语“样品”涉及材料或材料的混合物,其通常含有一种或多种目标分析物。在一个实施方案中,如在其最广泛的意义上使用该术语,是指含有DNA或RNA的任何植物、动物或病毒材料,例如,从个体分离的组织或液体(包括但不限于血浆,血清,脑脊髓液,淋巴,泪液,唾液和组织切片)或从体外细胞培养成分分离的组织或液体,以及来自环境的样品。
如本文所用的术语“核酸样品”表示含有核酸的样品。本文所用的核酸样品可以是复杂的,因为它们包含多个不同的包含序列的分子。来自哺乳动物(例如小鼠或人)的基因组DNA样品是复杂样品的类型。复杂样品可具有超过约104、105、106或107、108、109或1010个不同的核酸分子。DNA靶可源自任何来源例如基因组DNA或人工DNA构建体。本文可使用含有核酸的任何样品,例如来自组织培养细胞的基因组DNA或组织样品。
如本文所用的术语“混合物”是指元素的组合,所述元素是散布的并且不处于任何特定的次序。混合物是异质性的并且不可空间分离成其不同的成分。元素的混合物的实例包括溶解于相同水溶液中的许多不同元素以及在随机位置上(即没有特定的次序)连接至固体支持物的许多不同的元素。混合物是不可寻址的。为了通过实例说明,如在本领域中通常已知的在空间上分离的表面结合的多核苷酸的阵列不是表面结合的多核苷酸的混合物,因为表面结合的多核苷酸的种类是空间上独特的并且阵列是可寻址的。
术语“核苷酸”意欲包括不仅包含已知的嘌呤和嘧啶碱基还包含已被修饰的其它杂环碱基的那些部分。这样的修饰包括甲基化的嘌呤或嘧啶、酰化的嘌呤或嘧啶、烷基化的核糖或其它杂环。此外,术语“核苷酸”包括含有半抗原或荧光标记的那些部分并且可不仅包含常规的核糖和脱氧核糖糖类还包含其它糖类。修饰的核苷或核苷酸还包括在糖部分上的修饰,例如其中一个或多个羟基被替换成卤素原子或脂族基团,或被官能化为醚、胺或类似的。
术语“核酸”和“多核苷酸”在本文可互换使用来描述任何长度的聚合物,例如大于约2个碱基、大于约10个碱基、大于约100个碱基、大于约500个碱基、大于1000个碱基、大于10,000个碱基、大于100,000个碱基、大于约1,000,000、多至约1010或更多碱基组成的核苷酸,例如脱氧核糖核苷酸或核糖核苷酸,并且可以酶促或合成产生(例如,如在美国专利号5,948,902和其中引用的参考文献中描述的PNA),其可以与天然存在的核酸以序列特异性方式(类似于两个天然存在的核酸的方式)杂交,例如可以参与Watson-Crick碱基配对相互作用。天然存在的核苷酸包括鸟嘌呤、胞嘧啶、腺嘌呤、胸腺嘧啶、尿嘧啶(分别地G、C、A、T和U)。DNA和RNA分别具有脱氧核糖和核糖的糖主链,而PNA的主链包括通过肽键连接的N-(2-氨基乙基)-甘氨酸重复单元。在PNA中各种嘌呤和嘧啶碱基通过亚甲基羰基键连接至主链。通常被称为不可接近RNA的锁核酸(LNA)是一种修饰的RNA核苷酸。LNA核苷酸的核糖部分被连接2'氧和4'碳的额外桥修饰。该桥将核糖“锁定”在3'-内型(North)构象,其常见于A-型双链体中。当需要时,可将LNA核苷酸与寡核苷酸中的DNA或RNA残基混合。术语“非结构化核酸”或“UNA”是包含以降低的稳定性彼此结合的非天然核苷酸的核酸。例如,非结构化核酸可以含有G'残基和C'残基,其中这些残基对应于非天然存在的形式,即G和C的类似物,其以降低的稳定性彼此碱基配对但保留分别与天然存在的C和G残基碱基配对的能力。非结构化核酸描述于US20050233340中,其对于UNA的公开内容通过引用并入本文。
如本文所用的术语“寡核苷酸”表示约2至200个核苷酸、多至500个核苷酸长的核苷酸单链多聚体。寡核苷酸可以是合成的或者可以酶促制备,并且在一些实施方案中,为30至150个核苷酸长。寡核苷酸可以包含核糖核苷酸单体(即,可以是寡核糖核苷酸)或脱氧核糖核苷酸单体或核糖核苷酸单体和脱氧核糖核苷酸单体两者。例如,寡核苷酸可以是10至20、21至30、31至40、41至50、51至60、61至70、71至80、80至100、100至150或150至200个核苷酸长。
“引物”意指天然或合成的寡核苷酸,其能够在与多核苷酸模板形成双链体后用作核酸合成的起始点并从其3'末端沿着模板延伸以使得形成延伸的双链体。在延长过程中添加的核苷酸的序列由模板多核苷酸的序列确定。通常引物通过DNA聚合酶延伸。引物的长度通常与其在引物延伸产物合成中的使用兼容,并且通常在8至100个核苷酸的范围内,例如10至75、15至60、15至40、18至30、20至40、21至50、22至45、25至40等。典型的引物可以在10-50个核苷酸长的范围内,例如15-45、18-40、20-30、21-25等以及在所述范围之间的任何长度。在一些实施方案中,引物通常不超过约10,12,15,20,21,22,23,24,25,26,27,28,29,30,35,40,45,50,55,60,65或70个核苷酸长。
引物通常是单链的以用于最大效率的扩增,但可选择地可以是双链的。如果是双链的,引物通常首先在用于制备延伸产物之前进行处理以分开其链。此变性步骤通常通过加热实现,但可选择地可以使用碱来进行,随后进行中和。因此,“引物”与模板互补,并通过氢键合或杂交与模板复合以产生引物/模板复合物用于起始通过聚合酶的合成,其通过在其3'末端于DNA合成过程中互补于模板连接的共价键合的碱基的添加来延伸。
术语“杂交”或“使杂交”是指其中核酸链的区域在正常杂交条件下退火并与第二互补核酸链形成稳定的双链体(无论是同源双链体或异源双链体),并且在相同的正常杂交条件下与不相关的核酸分子不形成稳定的双链体的过程。双链体的形成通过在杂交反应中退火两个互补核酸链区域来完成。杂交反应可以通过调整在其下发生杂交反应的杂交条件(通常称为杂交严格性)而成为高度特异性的,使得两条核酸链不会形成稳定的双链体,例如在正常严格条件下保持双链型区域的双链体,除非这两条核酸链包含基本上或完全互补的特定序列中的一定数量的核苷酸。“正常杂交或正常严格条件”对于任何给定的杂交反应可容易地确定。参见例如,Ausubel等人,Current Protocols in Molecular Biology,JohnWiley&Sons,Inc.,New York或Sambrook等人,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory Press。如本文所用,术语“杂交的”或“杂交”是指核酸链通过碱基配对与互补链结合的任何过程。
如果两个序列在中等至高严格性杂交和洗涤条件下彼此特异性杂交,则核酸被认为是与参考核酸序列“可选择性杂交的”。中等和高严格性杂交条件是已知的(参见例如,Ausubel等人,Short Protocols in Molecular Biology,3rd ed.,Wiley&Sons 1995以及Sambrook等人,Molecular Cloning:A Laboratory Manual,Third Edition,2001ColdSpring Harbor,N.Y.)。高严格条件的一个实例包括在约42℃在50%甲酰胺、5×SSC、5×Denhardt溶液、0.5%SDS和100μg/ml变性载体DNA中杂交随后在2X SSC和0.5%SDS中于室温洗涤两次和在0.1×SSC和0.5%SDS中在42℃下洗涤额外两次。
如本文所用的术语“双链体”或“双链的”描述碱基配对即杂交在一起的两个互补的多核苷酸区域。
如本文所用的术语“扩增”是指合成与模板核酸的一条或两条链互补的核酸分子的过程。扩增核酸分子可包括使模板核酸变性,在低于引物的解链温度的温度下将引物退火至模板核酸,以及从引物酶促延伸以产生扩增产物。变性、退火和延伸步骤各自可进行一次或多次。在某些情况下,变性、退火和延伸步骤进行多次,使得扩增产物的量增加,常常指数倍增,尽管指数扩增不是本方法所需的。扩增通常需要存在脱氧核苷三磷酸、DNA聚合酶和合适的缓冲液和/或用于聚合酶的最佳活性的辅因子。术语“扩增产物”是指从如本文所定义的扩增过程产生的核酸。
术语“确定”、“测量”、“评估”、“评价”、“测定”和“分析”在本文可互换使用,其指任何形式的测量并且包括确定元素是否存在。这些术语包括定量和/或定性测定。评估可以是相对或绝对的。“评估…的存在”包括测定某物质的存在量以及确定其是存在或不存在。
术语“使用”具有其常规含义,并因此,意指采用(例如使投入使用)方法或组合物以实现目的。例如,如果使用程序来创建文件,则执行程序以制作文件,该文件通常是该程序的输出。在另一个实例中,如果使用计算机文件,则其通常被存取、读取并且存储在该文件中的信息被用来实现目的。类似地,如果使用独特的标识符,例如条形码,则该独特的标识符通常被读取以鉴定例如与该独特的标识符相关联的对象或文件。
如本文所用的术语“连接(ligating)”是指第一DNA分子的5'末端上的末端核苷酸与第二DNA分子的3'末端上的末端核苷酸的酶促催化连接。
“多个”包含至少2个成员。在某些情况下,“多个”可具有至少2个、至少5个、至少10个、至少100个、至少100个、至少10,000个、至少100,000个、至少106个、至少107个、至少108个或至少109个或更多个成员。
如果两个核酸是“互补的”,则它们在高严格条件下彼此杂交。术语“完全互补”用于描述其中一个核酸的每个碱基与另一个核酸中的互补核苷酸碱基配对的双链体。在许多情况下,互补的两个序列具有互补的至少10个例如至少12个或15个核苷酸。
“寡核苷酸结合位点”是指寡核苷酸在靶多核苷酸中杂交的位点。如果寡核苷酸“提供”针对引物的结合位点,则该引物可以杂交至该寡核苷酸或其互补体。
如本文所用的术语“链”是指由通过共价键(例如磷酸二酯键)共价连接在一起的核苷酸构成的核酸。在细胞中,DNA通常以双链形式存在,并因此具有核酸的两条互补链,其在本文中称为“顶部”和“底部”链。在某些情况下,染色体区域的互补链可以被称为“正”和“负”链、“第一”和“第二”链、“编码”和“非编码”链、“沃森”和“克里克”链或“有义”和“反义”链。链作为顶部或底部链的分配是任意的,并不意味着任何特定的方向、功能或结构。几个示例性哺乳动物染色体区域(例如,BAC、组装体、染色体等)的第一链的核苷酸序列是已知的,并且可见于例如NCBI’s Genbank数据库。
如本文所用的术语“顶部链”是指核酸的任一链但不是核酸的两条链。当寡核苷酸或引物结合或退火至“仅顶部链”时,其仅结合至一条链而不结合至另一条链。如本文所用的术语“底部链”是指与“顶部链”互补的链。当寡核苷酸结合或退火至“仅一条链”时,其仅结合至一条链例如第一或第二链,但不结合至另一条链。
如本文所用的术语“测序”是指通过其获得对多核苷酸的至少10个连续核苷酸的识别(例如,识别至少20、至少50、至少100或至少200个或更多个连续核苷酸)的方法。
术语“下一代测序”或“高通量测序”是指目前由Illumina、Life Technologies和Roche等采用的所谓并行合成测序或连接测序平台。下一代测序方法还可包括纳米孔测序方法或基于电子检测的方法,例如由Life Technologies商业化的Ion Torrent技术或由Pacific Biosciences商业化的基于单分子荧光的方法。
如本文所用的术语“条形码序列”或“分子条形码”是指用于a)鉴定和/或示踪反应中多核苷酸的来源和/或b)对初始分子被测序的次数进行计数(例如,在其中样品中的基本上每个分子用不同的序列标记,然后将样品扩增的情况下)的核苷酸的独特序列。条形码序列可以是在寡核苷酸的5'末端、3'末端或在中间。条形码序列可在大小和组成上差别很大;下面的参考文献提供了用于选择适合用于具体实施方案的条形码序列集的指导:Brenner,美国专利号5,635,400;Brenner等人,Proc.Natl.Acad.Sci.,97:1665-1670(2000);Shoemaker等人,Nature Genetics,14:450-456(1996);Morris等人,欧洲专利申请0799897A1;Wallace,美国专利号5,981,179等。在具体的实施方案中,条形码序列可具有4至36个核苷酸或6至30个核苷酸或8至20个核苷酸范围内的长度。
术语“体外”是指在具有分离的部件的容器中而不是在细胞中发生的反应。
在沿着靶核酸分子的长度上分布的切割位点的上下文中,术语“分布”是指沿着靶核酸分子的长度上彼此间隔的插入。不需要所有插入以相同的量间隔开。相反,插入之间的间距可以是随机的、半随机的或不是随机的。
如本文所用的术语“染色质”是指包含蛋白质和多核苷酸(例如DNA、RNA)的分子的复合物,如发现于真核细胞的细胞核中的。染色质部分地由形成核小体的组蛋白、基因组DNA和通常结合至基因组DNA的其它DNA结合蛋白(例如转录因子)组成。
如本文所用的术语“处理”是指在导致反应(例如切割)的条件(例如,合适的温度、时间和条件)下的组合。
如本文所用的术语“分离自细胞群的染色质”是指被使得成为可用的染色质的来源。分离的细胞核(其可被裂解以产生染色质)以及分离的染色质(即,裂解的细胞核的产物)均被认为是分离自细胞群的染色质类型。
如本文所用的术语“转录因子”是指可以自身地或与至少一种其它多肽组合地起作用以调节基因表达水平的任何多肽。该术语包括但不限于,直接结合DNA序列的多肽。转录因子可以增加或抑制表达水平。转录因子的实例包括但不限于Myc/Max,AP-1(Jun,Fos,ATF)CREB,SMAD,HIF,ETS,ERG,ELK,STAT,雌激素受体(ER),雄激素受体(AR),糖皮质激素受体(GR),孕激素受体(PR),NFκB,p53,OCT,SOX和PAX。转录因子可以是通过序列分析鉴定的转录因子,或是先前未被表征为转录因子的天然存在的阅读框序列。多肽还可以是人工产生的或经化学或酶修饰的多肽。
如本文所用的术语“插入酶复合物(insertional enzyme complex)”是指包含插入酶和两个衔接分子(“转座子标签”)的复合物,其与多核苷酸组合以分割多核苷酸并将衔接子添加至多核苷酸。这样的系统描述于各种出版物中,包括Caruccio(MethodsMol.Biol.2011 733:241-55)和US20100120098,其以引用的方式并入本文。
如本文所用的术语“标记片段”是指连接至标签的多核苷酸片段。
如本文所用的术语“区域”是指生物体基因组中连续长度的核苷酸。染色体区域可以在1bp至整个染色体长度的范围内。在一些情况下,区域可具有至少200bp、至少500bp、至少为1kb、至少10kb或至少100kb或更多(例如,多至1Mb或10Mb或更多)的长度。基因组可来自任何真核生物,例如动物或植物基因组,例如人、猴、大鼠、鱼或昆虫的基因组。
如本文所用的术语“表观遗传图谱”是指表观遗传特征的任何表示法,所述特征为例如核小体、无核小体区域的位点、转录因子的结合位点等。图谱可以物理展示在例如计算机显示器上。示例性表观遗传图谱显示于图1C、3A、4A、4B、5B和5C中。
如本文所用的术语“映射信息”是指将实验获得的关于区域的信息组装至该区域的物理图谱。
如本文所用的术语“序列读数丰度”是指特定序列或核苷酸在一批序列读数中观察到的次数。
如本文所用的术语“无核小体的片段”是指相对贫乏或缺乏核小体(即核小体之间)的基因组DNA的片段。
如本文所用的术语“染色质可接近性(chromatin accessibility)”是指多核苷酸例如基因组DNA内的核酸位点可接近的程度,即染色质“开放”的程度。与多肽关联的核酸位点,例如核小体中的基因组DNA,通常是不可接近的。未与多肽复合的核酸位点通常是可接近的,例如核小体之间的基因组DNA(除与转录因子和其它DNA结合蛋白复合的核酸位点以外)。
如本文所用的术语“DNA结合蛋白的占据”是指针对序列特异性DNA结合蛋白的结合位点(例如,针对转录因子的结合位点)是否由DNA结合蛋白占据。DNA结合蛋白的占据可以定量或定性测量。
如本文所用的术语“总体占据”是指是否有多个分布在整个基因组中的针对DNA结合蛋白的不同结合位点(例如,针对转录因子的结合位点)被DNA结合蛋白结合。DNA结合蛋白的占据可以定量或定性测量。
如本文所用的术语“诊断”是指测定受试者是否患有特定疾病或病状。
如本文所用的术语“预后”是指预测临床结果例如疾病复发、从疾病恢复、死亡,以及预测患有特定疾病或病状的受试者如何响应特定治疗。
术语的其它定义可以出现在整个说明书中。
示例性实施方案的描述
在一个方面,提供了用于分析染色质的方法。在某些实施方案中,该方法包括:(a)用插入酶复合物处理分离自细胞群的染色质以产生基因组DNA的标记片段。在该步骤中,染色质通过使用插入酶来标签片段化(tagmented)(即,在相同的反应中切割和标记),所述插入酶为例如Tn5或MuA,其在染色质的开放区域中切割基因组DNA并将衔接子添加至片段的两个末端。用于标签片段化分离的基因组DNA的方法是本领域已知的(参见例如,CaruccioMethods Mol.Biol.2011 733:241-55;Kaper等人,Proc.Natl.Acad.Sci.2013110:5552-7;Marine等人,Appl.Environ.Microbiol.2011 77:8071-9和US20100120098)并且可商购自Illumina(San Diego,CA)及其它供应商。这样的系统可容易地适用于本发明。在一些情况下,可以调整条件以获得染色质中插入的期望水平(例如,插入在开放区域中以平均每50至200个碱基对出现)。在该方法中使用的染色质可以通过任何合适的方法来制备。在一些实施方案中,可分离、裂解细胞核,并可进一步例如从核膜纯化染色质。在其它实施方案中,染色质可以通过将分离的细胞核与反应缓冲液接触来分离。在这些实施方案中,分离的细胞核在与反应缓冲液(其包含插入酶复合物和其它必需的试剂)接触时可裂解,这允许插入酶复合物接近染色质。在这些实施方案中,该方法可以包括从细胞群中分离细胞核;并将分离的细胞核与转座酶和衔接子组合,其中所述组合导致细胞核裂解以释放所述染色质,以及产生基因组DNA的加衔接子标签的片段。染色质不需要如其它方法(例如ChIP-SEQ方法)中的交联。
在染色质已被分割和标记以产生基因组DNA的标记片段后,对至少一些加衔接子标签的片段进行测序以产生多个序列读数。所述片段可以使用任何方便的方法进行测序。例如,片段可以使用Illumina可逆终止法、Roche焦磷酸测序法(454)、Life Technologies连接测序(SOLiD平台)或Life Technologies Ion Torrent平台来进行测序。这样的方法的实例描述于下列参考文献中:Margulies等人(Nature 2005 437:376-80);Ronaghi等人(Analytical Biochemistry 1996 242:84–9);Shendure等人(Science 2005 309:1728-32);Imelfort等人(Brief Bioinform.2009 10:609-18);Fox等人(Methods MolBiol.2009;553:79-108);Appleby等人(Methods Mol Biol.2009;513:19-39)和Morozova等人(Genomics.2008 92:255-64),其通过引用并入方法的一般描述和方法的具体步骤,包括所有的起始产物、文库制备的方法、试剂、以及每个步骤的最终产物。如将是显而易见的,与所选的下一代测序平台兼容的正向和反向测序引物位点可在扩增步骤中被添加至片段的末端。在某些实施方案中,片段可以使用杂交至已被添加至所述片段的标签的PCR引物来扩增,其中用于PCR的引物具有与特定测序平台兼容的5'尾。在某些情况下,所使用的引物可以含有分子条形码(“索引”),使得不同的库可以在测序之前合并在一起,并且序列读数可以用该条形码序列追溯至特定样品。
在另一个方面,本公开内容提供了用于测定多核苷酸在某位点的可接近性的方法,其中所述多核苷酸来自细胞样品,所述方法包括:用插入酶将多个分子标签插入多核苷酸和使用所述分子标签来测定所述位点上的可接近性。细胞样品可以来自原始来源。细胞样品可以由单个细胞组成。细胞样品可以由有限数量的细胞(例如少于约500,000个细胞)组成。
该方法还可包括使用所测定的可接近性来鉴定在该位点结合至多核苷酸的一种或多种蛋白。在一些情况下,蛋白的至少一种是转录因子。此外,该方法可以包括使用分子标签来产生多核苷酸的可接近性图谱。
多核苷酸在分子标签的插入过程中可被分割成多个片段。在一些情况下,片段可被扩增。在某些情况下,片段可被测序以产生多个测序读数。这可用来测定任何给定多核苷酸在某位点的可接近性。片段可以使用高通量测序技术进行测序。在一些情况下,测序读数可基于插入酶的序列插入偏好来标准化。测序读数的长度用于确定染色质状态注释。
多核苷酸可结合至多个关联分子。关联分子可以是例如蛋白质、核酸或糖。在一些情况下,关联分子可包括组蛋白。在其它情况下,关联分子可包括适体。
插入酶可以是能够将核酸序列插入多核苷酸的任何酶。在一些情况下,插入酶可以以基本上序列非依赖性方式将核酸序列插入多核苷酸。插入酶可以是原核生物的或真核生物的。插入酶的实例包括但不限于转座酶、HERMES和HIV整合酶。转座酶可以是Tn转座酶(例如Tn3,Tn5,Tn7,Tn10,Tn552,Tn903)、MuA转座酶、Vibhar转座酶(例如来自哈氏弧菌)、Ac-Ds、Ascot-1、Bs1、Cin4、Copia、En/Spm、F因子、hobo、Hsmar1、Hsmar2、IN(HIV)、IS1、IS2、IS3、IS4、IS5、IS6、IS10、IS21、IS30、IS50、IS51、IS150、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS1031、ISL2、L1、Mariner、P因子、Tam3、Tc1、Tc3、Tel、THE-1、Tn/O、TnA、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903、Tol1、Tol2、TnlO、Tyl、任何原核转座酶或与上面所列的那些相关的和/或来源于其的任何转座酶。在某些情况下,与亲代转座酶相关的和/或来源于其的转座酶可以包括与亲代转座酶的相应肽片段具有至少约50%、约55%、约60%、约65%、约70%、约75%、约80%、约85%、约90%、约91%、约92%、约93%、约94%、约95%、约96%、约97%、约98%、或约99%氨基酸序列同源性的肽片段。肽片段的长度可以是至少约10、约15、约20、约25、约30、约35、约40、约45、约50、约60、约70、约80、约90、约100、约150、约200、约250、约300、约400、或约500个氨基酸。例如,来源于Tn5的转座酶可包含长度为50个氨基酸并且与亲代Tn5转座酶的相应片段约80%同源的肽片段。在一些情况下,插入可以通过添加一种或多种阳离子来促进和/或触发。阳离子可以是二价阳离子,例如,Ca2+、Mg2+和Mn2+。
分子标签可以包括测序衔接子、锁核酸(LNA)、拉链核酸(ZNA)、RNA、亲和反应分子(例如生物素、dig)、自身互补分子、硫代磷酸修饰、叠氮化物或炔基。在一些情况下,测序衔接子还可包括条形码标记。此外,条形码标记可包含独特的序列。独特的序列可用于鉴定个体插入事件。任何所述标签还可包括荧光标签(例如荧光素、罗丹明、Cy3、Cy5、噻唑橙等)。
此外,插入酶还可包含亲和标签。在一些情况下,亲和标签可以是抗体。抗体可以结合至例如转录因子、修饰的核小体或修饰的核酸。修饰的核酸的实例包括但不限于甲基化或羟甲基化的DNA。在另一些情况下,亲和标签可以是单链核酸(例如ssDNA、ssRNA)。在一些实例中,单链核酸可结合于靶核酸。在其它情况下,插入酶还可包含核定位信号。
在一些情况下,细胞样品可以经透化以允许插入酶进入。可以以最小限度地扰乱细胞样品中的细胞核的方式来进行透化。在一些情况下,细胞样品可以使用透剂来透化。透化剂的实例包括但不限于NP40、洋地黄皂苷、吐温、链球菌溶血素和阳离子脂质。在其它情况下,细胞样品可以使用低渗休克和/或超声处理来透化。在其它情况下,插入酶可以是带高电荷的,这可允许其通过细胞膜渗透化。
在另一个方面,本公开内容提供了用于分析来自细胞样品的多核苷酸的三维结构的方法,包括:用插入酶将多个分子标签插入多核苷酸;和使用分子标签来分析所述多核苷酸的三维结构。插入酶可包含包含两个或更多个酶部分,其可任选地连接在一起。酶部分可以通过使用任何合适的化学合成或生物缀合方法来连接。例如,酶部分可以通过酯/酰胺键、巯基至马来酰亚胺的添加、天然化学连接(NCL)技术、点击化学(即炔-叠氮化物对)、或生物素-抗生蛋白链菌素对。在一些情况下,每个酶部分可将共同的序列插入多核苷酸。共同的序列可包含共同的条形码。酶部分可包括转座酶或其衍生物。在一些实施方案中,多核苷酸可在插入过程中被分割成多个片段。包含共同的条形码的片段可被测定为在多核苷酸的三维结构中是靠近的。
多核苷酸可以是基因组DNA。多核苷酸还可结合至蛋白质例如组蛋白,并且可任选地包装在染色质的形式中。在特定情况下,对应于基因组的一个或多个区域(例如2个或更多、10个或更多、50个或更多、100个或更多、多至1000个或更多个区域)的DNA片段可以在测序之前通过杂交富集(即选择)。在这些实施方案中,不需要对整个文库测序。取决于所期望的结果和所选择的区域的长度(如果已进行了选择步骤),该方法的此步骤可导致至少1000个测序(例如,至少10,000、至少100,000、至少500,000、至少106、至少5x106、多至107或更多个测序读数)。序列读数通常存储在计算机存储器中。
方法的一些实施方案包括制作细胞基因组的区域的表观遗传图谱。此步骤可通过将获自序列读数的信息映射至该区域来完成。在这些实施方案中,对序列读数进行计算分析以产生许多被映射到目标区域的表示法(例如,图形表示法)的数值输出。如将在下文更详细地解释的,可对许多类型的信息进行映射,包括但不限于:(i)转座酶的切割位点;(ii)在步骤a)中产生的片段的大小;(iii)片段长度;(iii)确定长度范围的序列读数的位置;和(iv)序列读数丰度。
例如,可以对序列读数进行计算分析以鉴定片段的末端(从其可推断转座子切割位点)。在这些实施方案中,片段的一个末端可以通过位于测序读数的开头的序列限定并且片段的另一末端可以通过位于第二测序读数的开头的序列限定,其中第一和第二测序读数通过配对末端测序(例如,使用Illumina的测序平台)获得。相同的信息可以从检查较长序列读数的开头和末端(其理论上应具有两个衔接子的序列;一个在一个末端上,另一个在另一末端上)获得。在这些实施方案中,单个序列读数可包括两个衔接子序列,在此情况下可以从单个序列读数来推断片段的两个末端(其对应于两个单独的转座酶的两个切割位点)。片段的长度可以通过例如将片段末端映射至目标区域的核苷酸序列并对那些位置之间的碱基对数目计数来计算。信息可以通过使用在序列读数的开头和/或末端上的核苷酸序列获得。
在某些情况下,可以将序列读数按长度分组。在一些实施方案中,一些序列可基于其大小被注释为无核小体的序列(即,被预测为在核小体之间的片段的序列)。还可鉴定与单核小体、双核小体和三核小体关联的读数。这些截断值可使用图12中所示的数据来确定。片段长度(其提供与序列读数长度相同的信息)也可以以同样的方式处理。在某些情况下,可以计算序列读数丰度,即,基因组区域中的特定序列被表示在序列读数中的次数。
所得的表观遗传图谱可提供目标区域中的染色质的分析。例如,取决于所映射的信息,图谱可以显示以下的一种或多种:沿区域的染色质可接近性的特征谱;区域中位点的DNA结合蛋白(例如,转录因子)占据;区域中的无核小体的DNA;沿区域的核小体定位;以及沿着区域的染色质状态的特征谱。在一些实施方案中,方法还可包括例如通过综合一个DNA结合蛋白在该蛋白结合的多个位点上的数据来测量DNA结合蛋白的结合位点的总体占据。在某些情况下,图谱还可以用序列信息以及关于该序列的信息(例如,启动子、内含子、外显子、已知的增强子、转录起始位点、非翻译区、终止子等的位置)来注释,以使得表观遗传信息可以在该注释的情境下查看。
在某些实施方案中,表观遗传图谱可以提供关于活性调节区和/或结合至调节区的转录因子的信息。例如,核小体位置可以从所产生的测序读数的长度来推断。可选择地,转录因子结合位点可以从所产生的测序读数的大小、分布和/或位置来推断。在一些情况下,新的转录因子结合位点可以从所产生的测序读数推断。在其它情况下,新的转录因子可以从所产生的测序读数推断。
在测定中使用的细胞群可以包括任何数目的细胞,例如约500至约106或更多的细胞、约500至约100,000个细胞、约500至约50,000个细胞、约500至约10,000个细胞、约50至1000个细胞、约1至500个细胞、约1至100个细胞、约1至50个细胞、或单个细胞。在一些情况下,细胞样品可以由少于约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10,000、约15,000、约20,000、约25,000、约30,000、约40,000、约50,000、约60,000、约70,000、约80,000、约90,000、约100,000、约120,000、约140,000、约160,000、约180,000、约200,000、约250,000、约300,000、约350,000、约400,000、约450,000、约500,000、约600,000、约700,000、约800,000、约900,000、或约1,000,000个细胞组成。在其它情况下,细胞样品可以由多于约1000、约2000、约3000、约4000、约5000、约6000、约7000、约8000、约9000、约10,000、约15,000、约20,000、约25,000、约30,000、约40,000、约50,000、约60,000、约70,000、约80,000、约90,000、约100,000、约120,000、约140,000、约160,000、约180,000、约200,000、约250,000、约300,000、约350,000、约400,000、约450,000、约500,000、约600,000、约700,000、约800,000、约900,000、或约1,000,000个细胞组成。
细胞可以来自任何来源。在某些情况下,细胞可以获自细胞的培养物,例如细胞系。在其它情况下,细胞可以分离自个体(例如,患者或类似的)。细胞可以分离自软组织或体液或体外生长的细胞培养物。在具体的实施方案中,染色质可以分离自软组织,例如脑、肾上腺、皮肤、肺、脾、肾、肝、脾、淋巴结、骨髓、膀胱胃、小肠、大肠或肌肉等。体液包括血液、血浆、唾液、粘液、痰、脑脊髓液、胸膜液、泪液、阴道管液(lactal duct fluid)、淋巴液、痰液、脑脊液、滑膜液、尿液、羊水和精液等。
在一些实施方案中,在方法中使用的多核苷酸(例如基因组DNA,染色体DNA)可以来自血细胞,其中血细胞是指全血样品或全血中的细胞亚群。全血中的细胞亚群包括血小板、红血细胞(红细胞)、血小板和白血细胞(即外周血白细胞,其由嗜中性粒细胞、淋巴细胞、嗜酸性粒细胞、嗜碱性粒细胞和单核细胞构成)。这五种类型的白血细胞可以被进一步分为两组:粒细胞(也称为多形核白细胞并且包括嗜中性粒细胞、嗜酸性粒细胞和嗜碱性粒细胞)和单核白细胞(其包括单核细胞和淋巴细胞)。淋巴细胞可进一步分为T细胞、B细胞和NK细胞。外周血细胞发现于血液循环池并且不隔离在淋巴系统、脾、肝或骨髓内。可分离存在于血液中的其它细胞。如果血液首先与试剂接触,然后将血液样品用于测定,那么部分或全部的接触血液可用于测定。
在某些实施方案中,细胞样品可以直接分离自原始来源。例如,细胞样品可以直接分离自新鲜组织。在其它情况下,细胞样品可以直接分离自冷冻组织。在另一些情况下,细胞样品可以直接分离自经固定的组织。细胞样品的原始来源的其它实例包括但不限于,从组织解离的细胞、血液细胞、FFPE组织、细菌、病毒、线粒体、叶绿体、体外组装的蛋白DNA复合物、嗜中性粒细胞胞外陷阱(neutrophil extracellular trap)。
通过使用本公开内容中提供的方法,可以基于获自受试者的细胞样品中的多核苷酸位点的可接近性来分析该受试者的疾病状态。例如,任何给定位点上的转录因子占据可导致位点上可接近性的缺乏。基于转录因子占据,受试者随后可以用合适的试剂(例如转录因子抑制剂)治疗。
在某些情况下,细胞样品可进一步进行表型分析。例如,细胞样品可以使用荧光激活细胞分选(FACS)和/或激光捕获显微切割(LCM)来分析。在一些情况下,细胞样品和/或多核苷酸可以被划分成多个部分。可以基于分子标签(例如荧光标签)划分部分。在一些情况下,细胞样品和/或多核苷酸可以进行分选。分选可以在分子标签被插入多核苷酸之后进行。分选可以在片段测序之前进行。还可以用技术例如荧光原位杂交(FISH)分析细胞样品的基因转录。染色质可接近性可与表型、转录或翻译分析相关联。
在一些实施方案中,细胞是相同的细胞类型。在这些实施方案中,细胞群可以通过MACS或FACS使用针对细胞表面标志物的标记抗体经由已知的方法从细胞的异质群体例如血液中选择。使用这些方法可以分离广泛多样的细胞,包括干细胞、癌症干细胞和血细胞的子集。在具体的实施方案中,可以从血液通过FACS或MACS分离下列细胞;T细胞(CD3+CD4+CD8+),B细胞(CD19+CD20+),树突状细胞(CD11c+CD20+),NK细胞(CD56+),干细胞/前体细胞(CD34+;仅造血干细胞),巨噬细胞/单核细胞(CD14+CD33+),粒细胞(CD66b+),血小板(CD41+CD61+CD62+),红细胞(CD235a+),内皮细胞(CD146+)和上皮细胞(CD326+)。这些细胞的子集可以使用针对其它细胞表面标志物的抗体来分离。
在一些实施方案中,方法可以用来比较两种样品。在这些实施方案中,方法可以包括使用上文所述方法分析第一细胞群,以产生第一表观遗传图谱;和使用上文所述方法分析第二细胞群,以产生第二表观遗传图谱;以及比较第一表观遗传图谱与第二表观遗传图谱,例如,以查看例如染色质开放性或转录因子占据是否有任何变化。
在一些实施方案中,第一细胞群和第二细胞群是从相同个体在不同的时间收集的。在其它实施方案中,第一细胞群和第二细胞群是从组织或不同个体收集的不同细胞群。
可用于所述方法的示例性细胞类型包括,例如分离自组织活检的细胞(例如来自具有疾病例如结肠癌、乳腺癌、前列腺癌、肺癌、皮肤癌或受病原体感染的组织等),以及来自相同组织例如来自同一患者的正常细胞;在组织培养物中生长的细胞,其是永生的(例如,具有增殖性突变或永生化转基因的细胞)、受病原体感染的、或经处理的(例如,用环境或化学剂如肽、激素,改变的温度、生长条件、物理应激、细胞转化等处理),以及正常细胞(例如,除它们不是永生化的、未经感染或处理等之外,在其它方面与实验细胞相同的细胞);分离自患有癌症、疾病的哺乳动物、衰老的哺乳动物、或暴露于条件的哺乳动物的细胞,和来自相同物种例如来自同一家族的健康或年轻哺乳动物的细胞;以及来自相同哺乳动物的分化的细胞和未分化的细胞(例如,作为例如哺乳动物中其它细胞的祖先的一个细胞)。在一个实施方案中,可比较不同类型的细胞例如神经元和非神经元细胞,或不同状态的细胞(例如,在对细胞刺激之前和之后)。在另一个实施方案中,实验材料是易受病原体(例如病毒,例如人类免疫缺陷病毒(HIV)等)感染的细胞,并且对照材料是耐病原体感染的细胞。在本发明的另一个实施方案中,未分化的细胞例如干细胞和分化的细胞代表样品对。来自酵母、植物和动物例如鱼类、鸟类、爬行类、两栖类和哺乳动物的细胞用于本发明的方法。在某些实施方案中,可使用哺乳动物细胞,即来自小鼠、兔、灵长类动物、或人类、或其培养的衍生物的细胞。
在一些示例性实施方案中,方法可用于鉴定测试试剂例如药物的效应,或者用于测定两种或更多种不同的测试试剂的效应是否存在差异。在这些实施方案中,可以制备两个或更多个相同的细胞群,并且取决于如何进行实验,细胞群的一个或多个可以用测试试剂温育确定的时期。在用测试试剂温育后,可使用上文所示的方法分析细胞群的染色质,并可对结果进行比较。在具体的实施方案中,细胞可以是血细胞,并且细胞可以用测试试剂离体温育。这些方法可用于确定测试试剂的作用方式,例如以鉴定染色质结构或转录因子占据响应于药物的变化。
上文所述方法还可用作诊断法(该术语意欲包括提供诊断的方法以及提供预后的方法)。这些方法可以包括例如使用上文所述方法分析来自患者的染色质,以产生表观遗传图谱;和基于表观遗传图谱提供诊断或预后。
本文所示的方法可用于提供针对与改变的染色质或DNA结合蛋白的占据相关的任何病况的可靠诊断。该方法可以应用于由表观遗传模式(例如,染色质可接近性或DNA结合蛋白的占据的模式)表征的病状的表征、分类、区分、分级、分期、诊断或预后。例如,该方法可用于确定来自怀疑受疾病或病状影响的个体的样品的表观遗传图谱相较于关于该疾病或病状被认为是“正常”的样品是否是相同或不同的。在具体的实施方案中,该方法可涉及诊断具有由测试样品中特定基因座上的表观遗传模式表征的病状的个体,其中该模式与病状相关联。该方法还可用于预测个体对病状的易感性。
适合于使用本文所示的方法分析的示例性病状可以是例如,细胞增殖性病症或对细胞增殖病症的倾向;代谢功能失常或障碍;免疫功能失常、损伤或障碍;CNS功能失常、损伤或疾病;攻击症状或行为障碍;脑损伤的临床、心理和社会结果;精神障碍和人格障碍;痴呆或相关症状;心血管疾病、功能失常和损伤;胃肠道的功能失常、损伤或疾病;呼吸系统的功能失常、损伤或疾病;病变、炎症、感染、免疫和/或恢复期;作为发育过程中的异常的身体功能失常、损伤或疾病;皮肤、肌肉、结缔组织或骨的功能失常、损伤或疾病;内分泌和代谢功能失常、损伤或疾病;头痛或性功能失常,以及它们的组合。
在一些实施方案中,该方法可以提供预后,例如以确定患者是否处于发生复发的风险。癌症复发是关于多种类型的癌症的担忧。预后方法可用于鉴定可能经历癌症复发的经手术治疗的患者,以便可给他们提供另外的治疗选择,包括术前或术后辅助系统,例如化学疗法、放射、生物调节剂和其它合适的疗法。该方法对于确定在检查或手术时没有显示可测量的转移的患者的转移风险是特别有效的。
该方法还可用于确定针对患有疾病或病状的患者(例如患有癌症的患者)的适当治疗过程。治疗过程是指在诊断后或在治疗后采取的针对患者的治疗措施。例如,对于复发、扩散或患者存活的可能性的确定可帮助确定是否应采取更保守或更激进的方法来治疗,或者治疗方式是否应组合。例如,当癌症可能复发时,可有利的是在手术治疗之前或之后进行化学疗法、放射、免疫疗法、生物调节剂疗法、基因疗法、疫苗等,或者调整患者治疗的时间跨度。
在具体的实施方案中,实验室将接收来自远程位置(例如,医师办公室或医院)的样品(例如,血液),该实验室将如上所述分析样品中的细胞以产生数据,并且该数据可转移至远程位置用于分析。
组合物
在一个方面,本公开内容提供了与本文提供的方法相关的组合物。组合物可以包含多核苷酸、插入酶和插入元件,其中:插入元件可包括包含预先确定的序列的核酸并且插入酶还可包含亲和标签。多核苷酸还可结合至多个关联分子。关联分子可以是蛋白质(例如组蛋白)或核酸(例如适体)。亲和标签可以是抗体。在一些情况下,抗体可以结合至转录因子。在其它情况下,抗体可以结合至修饰的核小体。在其它情况下,抗体可以结合至修饰的核酸。修饰的核酸的实例包括但不限于甲基化或羟甲基化的DNA。亲和标签还可以是单链核酸(例如ssDNA,ssRNA)。在一些情况下,单链核酸可结合于靶核酸。在一些情况下,插入酶还可包含核定位信号。
组合物可以包含多核苷酸、插入酶和插入元件,其中:插入酶包含两个或更多个酶部分并且酶部分连接在一起。插入元件可以结合至插入酶。插入酶还可结合至多核苷酸。在一些情况下,多核苷酸还可结合至多个关联分子。关联分子可以是蛋白质(例如组蛋白)或核酸(例如适体)。
试剂盒
在另一个方面,本公开内容提供了包含如上所述的用于实施本发明方法的试剂的试剂盒。本发明的试剂盒可以包含:(a)用于从细胞群分离细胞核的试剂;(b)转座酶和转座子标签,和(c)转座酶反应缓冲液,其中试剂盒的组分被配置为使得反应缓冲液、转座酶和衔接子与细胞核的体外组合导致细胞核裂解以释放染色质,以及产生基因组DNA的加衔接子标签的片段。
在一些情况下,试剂盒可以包含:(a)细胞裂解缓冲液;(b)包含亲和标签的插入酶;和(c)包含核酸的插入元件,其中所述核酸包含预先确定的序列。插入酶可以是例如转座酶。插入酶还可包含连接在一起的两个或更多个酶部分。在一些情况下,亲和标签可以是抗体。抗体可结合至转录因子、修饰的核小体或修饰的核酸。修饰的核酸的实例包括但不限于甲基化或羟甲基化的DNA。在另一些情况下,亲和标签可以是单链核酸(例如ssDNA,ssRNA)。
试剂盒可任选地含有其它成分,例如:如上所述的PCR引物、PCR试剂如聚合酶、缓冲液、核苷酸等。根据需要,试剂盒的各个组分可以存在于分开的容器中或者某些相容成分可以预组合在单个容器中。
除了上述组分,本发明的试剂盒还可包含使用试剂盒组分以实施本发明方法的说明书,即样品分析说明书。用于实施本发明方法的说明书通常记录在合适的记录介质上。例如,说明书可以被打印在基质上,例如纸或塑料等。如此,说明书可存在于试剂盒中作为包装说明书,存在于试剂盒或其组分的容器的标记中(即与包装或分装关联)等。在其它实施方案中,说明书以存在于合适的计算机可读存储介质(例如,CD-ROM、磁盘等)上的电子存储数据文件存在。在其它实施方案中,实际的说明书不存在于试剂盒中,但提供用于从远程来源例如经由互联网获得说明书的装置。此实施方案的实例是包含网址的试剂盒,通过该网址可以查看说明书和/或下载说明书。与说明书一样,用于获得说明书的该装置被记录在合适的基质上。
实施方案
提供了映射染色质的方法。在一些实施方案中,该方法包括以下步骤:用将测序衔接子插入染色质内的多核苷酸中的转座酶分割稀少或大量细胞的染色质,和扩增并测序所述片段以产生细胞特异性图谱。
在某些实施方案中,细胞特异性图谱提供关于活性调节区和结合至所述调节区的转录因子的信息。
在某些实施方案中,所述稀少细胞的数目介于1和100,000之间。
在某些实施方案中,转座酶来源于Tn5转座酶。
在某些实施方案中,转座酶来源于MuA转座酶。
在某些实施方案中,从所产生的测序读数的长度推断核小体位置。
在某些实施方案中,从所产生的测序读数的长度推断转录因子结合位点。
在某些实施方案中,染色质直接分离自新鲜组织。
在某些实施方案中,染色质直接分离自冷冻组织。
在某些实施方案中,染色质直接分离自经固定的组织。
在某些实施方案中,对于多路复用,将序列添加至测序衔接子以独特地鉴定片段(加条形码)。
在某些实施方案中,将亲和标签用于将转座酶靶向至特定的目标大分子。
在某些实施方案中,对于多路复用,将序列添加至测序衔接子以独特地鉴定片段(加条形码),并且将亲和标签用于将转座酶靶向至特定的目标大分子。
在某些实施方案中,亲和标签是靶向至转录因子的抗体。
在某些实施方案中,亲和标签是靶向至修饰的核小体的抗体。
在某些实施方案中,特定基因组基因座上的插入片段大小分布用于推断染色质开放性。
在某些实施方案中,插入片段大小分布和插入的位置用于推断转录因子结合。
在某些实施方案中,获得的测序读数的数量通过所测量的转座酶的序列插入偏好标准化。
在某些实施方案中,新的转录因子结合位点从所产生的测序读数推断。
在某些实施方案中,新的转录因子从所产生的测序读数推断。
在某些实施方案中,因果性变体可以通过查看测序读数的等位基因特异性产生来推断。
在某些实施方案中,染色质状态注释从测序读数长度的分布推断。
实施例
本教导内容的各方面可根据下列实施例进一步理解,下列实施例不应被解释为以任何方式限制本教导内容的范围。
实施例1:使用测序对转座酶可接近的染色质的测定(ATAC-seq)
本文描述了使用测序对转座酶可接近的染色质的测定(ATAC-seq)-基于测序衔接子向天然染色质中的直接体外转座-作为用于综合表观基因组分析的快速和灵敏的方法。ATAC-seq使用简单的2步方案从500至50,000个细胞捕获开放染色质位点,并揭示开放染色质的基因组位置、DNA结合蛋白、个体核小体以及调节区域上的高阶紧密态与核苷酸解析之间的相互作用。发现了严格避免、可容忍或倾向于与核小体重叠的DNA结合因子种类。通过使用ATAC-seq,从先证者经由标准抽血对静息人T细胞的连续每日表观基因组进行了测量和评价,显示出在临床时间尺度上阅读个人表观基因组用于监测健康和疾病的可行性。
材料和方法
ATAC-seq方案的示例性实现具有三个主要步骤:
1)制备细胞核:为了制备细胞核,将50,000个细胞在500x g下离心5分钟,随后使用50μL冷的1x PBS洗涤并在500x g下离心5分钟。将细胞用冷的裂解缓冲液(10mM Tris-Cl,pH 7.4,10mMNaCl,3mM MgCl2和0.1%IGEPAL CA-630)裂解。裂解后立即使用冷冻离心机将细胞核在500x g下离心10分钟。为了避免在细胞核制备过程中丢失细胞,使用固定角离心机并且在离心后将它们从沉淀物小心地吸出。
2)转座和纯化:在细胞核制备后立即将沉淀重悬于转座酶反应混合物(25μL 2xTD缓冲液,2.5μL转座酶(Illumina)和22.5μL不含核酸酶的水)。转座反应在37℃下进行30分钟。在转座后直接使用QiagenMinelute试剂盒纯化样品。
3)PCR:在纯化后,我们使用1x NEBnext PCR预混物和1.25μΜ的定制Nextera PCR引物1和2(见下表)来扩增文库片段,使用下面的PCR条件:72℃下5分钟,98℃下30秒,随后在98℃下10秒、63℃下30秒和72℃下1分钟进行热循环。为了减少PCR中的GC和大小偏倚,使用qPCR监测PCR反应以在饱和之前停止扩增。为此,将整个文库扩增5个循环,在5个循环之后取出PCR反应的等分试样并以0.6x的终浓度加入至具有Sybr Green的10μl PCR混合物。我们将该反应运行20个循环,以测定其余45μL反应所需的额外循环数。使用Qiagen PCR净化试剂盒纯化文库,产生在20μL中~30nM的最终文库浓度。将文库扩增总共10-12个循环。
低细胞数目的方案:为了制备500和5,000细胞反应,使用相同的方案,除了一些显著的例外:转座反应在5μL而非50μL的反应物中进行。另外,不进行PCR之前的QiagenMinelute纯化而替代地在转座后立即取出该5μL反应物直接加入50μL PCR。
文库QC和定量:在ATAC-seq方案中,避免了大小选择步骤以最大化文库复杂性。测序的插入片段大小分布在40bp至1kb之间,平均值为~120bp。从生物分析仪和凝胶,我们观察到>2kb的片段,这会使得Qubit和其它基于质量的定量方法难以解释。为此,我们使用基于qPCR的方法定量我们的文库。
从外周血富集CD4+:在斯坦福大学IRB批准的协议下从1个正常志愿者在72小时的时间内三次获得一绿顶管的全血。获得了知情同意书。使用RosetteSep人CD4+T细胞富集混合物(StemCell Technology),对每个时间点的5mL血液针对CD4+细胞进行阴性选择。将RosetteSep混合物与血液在50μL/mL下温育20分钟,在等体积的具有2%FBS的PBS中稀释,并置于15mL Ficol-PaquePlus(GE)上。将血液在1200x g下不间断地离心20分钟,从密度介质:血浆界面移出阴性选择的细胞,并将细胞在具有2%FBS的PBS中洗涤2次。
FACS分选外周血白细胞和GM细胞:将GM 12878细胞用DAPI NucBlue固定细胞染料(分子探针)染色并使用FACSAria(BD Biosciences)使用100μm管口分选活细胞。一个外周血样品(血沉棕黄层)用BD Bioscience抗体CD14-A-488(M5E2,1:20)、CD3-PE-Cy7(SK7,1:20)、CD4-APC-Cy7的(RPA-T4,1:20)和CD8(RPA-T8,1:20)在室温下于黑暗中染色20分钟。将细胞用以1:10稀释于diH2O中的BDpharmLyse(BD)裂解15分钟,离心5分钟,用PBS 2%FBS洗涤两次,并重悬于具有2%FBS的PBS中。将50,000个CD3+CD8+、CD3+CD4+和CD14+细胞群分选至具有10%FBS的PBS中。
数据分析
原始数据处理:使用来自MiSeq的34×8×34读数或HiSeq上的50×8×50读数收集数据。使用BOWTIE(Langmead等人Genome Biol.2009 10,R25)采用参数–X2000和–m1将读数比对至hg19。这些参数确保允许比对多至2kb的片段(-X2000)并且仅收集独特的比对读数(-m1)。对于所有的数据文件使用Picard去除重复项。
对于峰识别和足迹法,将读数起始位点调整为表示转座子结合事件的中心。Tn5转座酶的先前描述显示转座子以二聚体结合并插入间隔9bp的两个衔接子(Adey,A.等人Genome Biol201011:R119)。因此,比对至+链的所有读数偏移+4bp,并且比对至-链的所有读数偏移-5bp。
ATAC-seq峰识别:我们使用ZINBA来调用本文中所报告的所有ATAC-seq峰。ZINBA使用300bp的窗口大小和75bp偏移来运行。将可比对性用于对背景和富集组分的零膨胀组分和ATAC-seq读数计数进行建模。富集区域被鉴定为具有后验概率>0.8的那些区域。
染色质注解内的ATAC-seq插入片段大小富集分析:首先计算重叠每个染色质状态的配对末端测序片段大小的分布(参见ensemble.org网站)。随后将分布标准化至每个状态内的最大百分比并相对于全基因组的片段大小集合计算富集。
核小体定位:为了产生核小体位置数据轨迹,我们选择将读数分解为多个箱(bin)。低于100bp的读数被认为是无核小体的,180和247bp之间的读数被认为是单核小体,315和473bp之间的读数被认为是双核小体并且558和615bp之间的读数被认为是三核小体(测定截断值见图12)。双核小体读数被分解为两个读数,三核小体读数被分解为三个读数。读数使用Danpos和Dantools利用参数-p 1、-a 1、-d 20、-clonalcut 0进行分析。所用的背景是无核小体读数(小于100bp的读数),从而允许这些读数的有效负加权。此分析允许调用多个重叠核小体。虽然使用简单的插入片段大小截断值来产生核小体轨迹可能因其它的核小体大小特征即增强体(enhanaceosome)而产生假阳性,但我们观察到我们如实地概括了全基因组核小体位置的总体特征。
ChIP-seq峰调用和聚类:ChIP-seq数据下载自UCSC ENCODE库。使用GEM调用峰(Guo等人,PLoSComput.Biol.2012 8:e1002638),所用的参数是-k_min 6-k_max 20。输入用作峰调用的对照。结合事件通过与10bp箱中最近的二分体的距离来注释。随后使用欧几里得距离法对因子层次聚类,并通过基因标准化和通过平均值集中。(Eisen等人Proc.Natl.Acad.Sci.1998 95:14863–14868)。
使用CENTIPEDE的足迹法:全基因组基序集获自ENCODE基序库(在broadinstitute.org的网站上)。针对CENTIPEDE的输入包括匹配基序的每个基因组区域的+/-100bp内的PWM得分、保守性(PhyloP)和ATAC-seq计数。ChIP-seq数据获自UCSC ENCODE库。
转录因子调节网的比较:通过比较GENCODE v14基因与通过CENTIPEDE对于各细胞类型评估的全基因组后验概率集来构建转录因子调节网。转录因子调节每个基因的程度通过对映射至相同染色体的给定转录因子的加权后验概率取总和来确定。对于每个映射的基序,基于与每个基因的转录起始位点的距离来加权后验概率。转录因子调节网的比较被计算为给定细胞类型中的每个转录因子与另一细胞类型中的所有转录因子的关联性。所得的关联矩阵使用Pearson相关系数和完全连锁来层次聚类。
候选IL2增强子分析:对UCSC基因组浏览器上的ENCODE数据进行检查以鉴定可响应于FDA批准的免疫调节药物的一种或多种细胞类型中的推定IL2增强子。针对(i)增强子相关的组蛋白标记(H3K4me1和H3K27ac)、(ii)如通过ChIP-seq确认的一种或多种TF的结合、和(iii)可由人治疗剂靶向的TF途径,我们扫描了hg19中IL2上游的基因间区域。此分析鉴定了IRF4和STAT3结合位点以及已知的NFAT响应性元件。
结果
ATAC-seq用转座子探测染色质可接近性
体外装载了用于高通量DNA测序的衔接子的高活性的Tn5转座酶(Goryshin,JBiol Chem.1998 273:7367–7374;Adey,A.等人GenomeBiol 2010 11:R119)可以同时分割基因组并用测序衔接子标记基因组(前文描述为“标签片段化”)。据推测,在少量未固定的真核细胞核上通过纯化的Tn5(一种原核转座酶)的转座会询问可接近的染色质的区域。描述了对于转座酶可接近的染色质的测定和随后的高通量测序(ATAC-seq)。ATAC-seq使用Tn5转座酶来将其衔接子负载整合至可接近的染色质的区域,而空间位阻较不可接近的染色质使得转座较不可能发生。因此,适合于高通量测序的可扩增DNA片段优选在开放染色质的位置上产生(图1a)。整个测定和文库构建可以在包括Tn5插入和PCR的简单两步过程中进行。与此相反,公开的用于测定染色质可接近性的DNase-和FAIRE-seq方案包括多步骤方案和许多潜在的损失多发步骤,例如衔接子连接、凝胶纯化和交联逆转。例如,公开的DNase-seq方案要求约44个步骤和两次过夜温育,而公开的FAIRE-seq方案需要在至少3天内进行两次过夜温育。此外,这些方案需要1-50x 106个细胞(FAIRE)或5x 107个细胞(DNase-seq),可能是因为这些复杂的工作流(图1b)。相较于已建立的方法,ATAC-seq能够实现快速和有效的文库生成,因为测定和文库制备在单个酶促步骤中进行。
深入的分析表明,ATAC-seq提供了全基因组染色质可接近性的准确和灵敏测量。ATAC-seq在分离自GM12878淋巴母细胞系的50,000和500个未经固定的细胞核上进行(ENCODE Tier 1)用于与染色质可接近性数据集(包括DNase-seq和FAIRE-seq)比较和验证。在先前由他人着重标示的基因座上(图1c),ATAC-seq具有类似于从多约3至5个数量级的细胞产生的DNase-seq的信噪比。峰强度在技术性重复之间是高度可重现的(R=0.98),并且在ATAC-seq和DNase-seq之间是高度相关的(R=0.79和R=0.83,图6),并且注意到大部分的峰内读数来自DNase和ATAC-seq峰的交集(图7)。通过将我们的数据与ENCODEDNase-seq数据中鉴定的DHS进行比较,受试者工作特征(ROC)曲线显示与DNase-seq相似的灵敏度和特异度(图8)。还注意到,ATAC-seq峰强度与活性染色质的标志物良好相关,但不与转座酶序列偏好良好相关(图9和10)。高度灵敏的开放染色质检测即使在使用5,000或500个人细胞核作为起始材料时仍得到维持(图8和图11),尽管在所用的条件下对于较少量的输入材料灵敏度减小,如可见于图1c。
ATAC-seq插入片段大小揭示核小体位置
发现ATAC-seq配对末端读数产生关于核小体包装和定位的详细信息。来自人类染色体的测序片段的插入片段大小分布具有约200碱基对的明显周期性,提示许多片段受到整数倍核小体的保护(图2a)。该片段大小分布还显示出等于DNA的螺旋间距的明显周期性。通过根据由以前的模型(Hoffman等人Nucleic Acids Res.2013 41:827–841)所定义的染色质功能种类划分插入片段大小分布,并标准化至总体插入片段分布,我们观察在此插入片段大小分布上明显的种类特异性富集(图2b),这表明染色质的这些功能状态具有可以用ATAC-seq读出的可接近性“指纹”。这些差异性分割模式与这些种类的推定功能状态是一致的,因为CTCF结合的区域针对DNA的短片段富集,而转录起始位点对于单-、双-和三-核小体关联的片段是差异性贫乏的。转录的和启动子侧翼区域针对较长的多核小体片段富集,这表明它们可能代表更紧密形式的染色质。最后,先前的研究已经表明,某些DNA序列耐核酸酶消化并被释放为大型的、多核小体大小的片段;随后的研究表明,这样的片段是浓缩的异染色质。事实上,被抑制的区域被发现对于短片段贫乏并且对于定相的多核小体插入片段富集,与其预期的不可接近的状态一致。这些数据表明,ATAC-seq揭示了染色质的差异性可接近形式,其已被长期推测在体内存在。
为了探索GM 12878细胞系中可接近的染色质内的核小体定位,数据被划分为从DNA的推定无核小体区域产生的读数和可能来源于核小体关联的DNA的读数(见图12)。通过使用对核小体关联的片段正向加权并对无核小体的片段负向加权的简单启发法(见“方法”),我们计算了用于调用可接近的染色质的区域内的核小体位置的数据轨迹(Chen,K.等人Genome Research 2013 23,341–351)。示例基因座(图3a)含有推定的双向启动子,其中CAGE数据显示间隔~700bp的两个转录起始位点(TSS)。事实上ATAC-seq揭示了两个不同的无核小体区域,其由单个良好定位的单核小体隔开(图3a)。相较于MNase-seq,ATAC-seq数据更适合于检测推定的调节区内的核小体,因为大多数读数集中在染色质的可接近区域内(图3b)。通过平均所有活性TSS上的信号,注意到无核小体的片段富集在重叠TSS的典型无核小体启动子区域上,而核小体信号富集在活性TSS的上游和下游,并显示上游和下游核小体的特征性定相(图3c)。由于ATAC-seq读数集中在开放染色质的区域,因而强烈的核小体信号见于+1核小体,其在+2、+3和+4核小体上减弱,与此相反,MNase-seq核小体信号在离TSS较远的距离上增加,可能是由于更可接近的核小体的过度消化。此外,MNase-seq(4x109个读数)测定所有的核小体,而从ATAC-seq产生的读数(1.98x108个配对读数)集中于调节性核小体(图3b,c)。通过使用核小体识别,推定的远端调节区域和TSS被进一步划分成无核小体的区域和被预测为是核小体结合的区域。注意到当与倾向于保持丰富的核小体的远端元件相比较时,TSS针对无核小体区域富集(图3d)。这些数据表明ATAC-seq可以提供全基因组调节元件中核小体关联的和无核小体的区域的高分辨率读出。
ATAC-seq揭示核小体-TF间隔的模式
ATAC-seq高分辨率调节核小体图谱可以用来理解核小体和DNA结合因子之间的关系。通过使用ChIP-seq数据,我们绘制了各种DNA结合因子相对于最近的核小体的二分体的位置。无监督层次聚类(图3e)揭示了相对于邻近核小体的结合的主要种类,包括1)在离最近的核小体二分体~180碱基处发生结合事件的因子的强核小体避开组(包括C-FOS,NFYA和IRF3),2)精确地“依偎”核小体DNA接触的预期末端的因子种类,其主要包括染色质循环因子CTCF和凝聚复杂亚基RAD21和SMC3;3)具有分级的核小体避开或核小体重叠结合行为的一大类主要转录因子,以及4)其结合位点趋于重叠核小体关联的DNA的种类。有趣的是,该最后一类包括染色质重塑因子例如CHD1和SIN3A以及RNA聚合酶II,其似乎富集在核小体边界上。精确核小体定位和DNA结合因子的位置之间的相互作用立即提示机理研究的特定假设,这是ATAC-seq的潜在优势。
ATAC-seq足迹推断全基因组因子占据
ATAC-seq使得能够准确推断全基因组DNA结合因子占据。由DNA结合蛋白直接占据的DNA序列应受到保护而避免转座;所得的序列“足迹”揭示了每个位点上DNA结合蛋白的存在,类似于DNase消化足迹。在染色体1的特异性CTCF结合位点上,我们在CTCF基序的精确位置上观察到明显的足迹(ATAC-seq信号的深凹口),类似于通过DNase-seq所见的足迹,所述CTCF基序的精确位置与GM12878细胞中CTCF ChIP-seq信号的最高峰相同(图4a)。ATAC-seq信号在基因组内的所有预期的CTCF位置上进行平均并观察到良好定型的“足迹”(图4b)。对于各种常见的TF获得了类似的结果(例如参见图13)。我们从基序一致得分、进化保守性和ATAC-seq插入数据推断CTCF结合概率以产生所有基因座上的CTCF的后验概率(图4c)(Pique-Regi等人Genome Research 2011 21 447–455)。使用ATAC-seq的结果接近地概括此细胞系中的ChIP-seq结合数据并且有利地相比于基于DNase的因子占据推断(见图14),表明可从这些ATAC-seq数据提取因子占据数据从而允许重建调节网络。
ATAC-seq实现临床时间尺度上的表观基因组分析
ATAC-seq是快速的、信息丰富的且兼容于小数量的细胞,并且可以作为强大的工具用于临床的个性表观基因组学。具体而言,可以设想“个人表观基因组学”为在临床时间尺度上从来自标准临床样品的个体产生的关于染色质的基因组范围的信息。ATAC-seq被应用于经由标准连续抽血测定健康志愿者的个人T细胞表观基因组,以证明能够在临床时间尺度上产生ATAC-seq文库的工作流。通过使用快速的T细胞富集和样品处理方案,从抽血到测序所需的总时间为约275分钟(图5a)。当结合对测序和分析周转时间的持续改进时,ATAC-seq可以提供个人表观基因组图谱的每日周转时间可能性。为了探索这种可能性,连续三天通过从单一个体的标准抽血来进行ATAC-seq(图5b)。作为考虑个人表观基因组图谱可如何包含个性化调节信息的训练,我们研究了IL2基因座上的ATAC-seq特征谱。IL-2是驱动T细胞生长并在炎症和自身免疫疾病中发挥功能的关键细胞因子。此外,不同的药物抑制不同转录因子的活性,所述转录因子以背景依赖性方式结合推定的IL2增强子。原则上,可能希望鉴定因果性转录因子途径以合理靶向抑制而不使患者暴露于不太可能实现IL-2阻断的治疗目标的药物。ATAC-seq显示,在先证者的T细胞中,仅NFAT而非其它两种药物靶标结合IL2(图5c),从而提供了关于该个体的调节状态的临床相关信息。
通过使用ATAC-seq足迹,产生了先证者T细胞中89个转录因子的占据特征谱,使得能够系统性重建调节网络。通过利用此个性化调节图谱,我们比较了相同的89个转录因子在GM 12878和先证者CD4+T细胞之间的基因组分布。在T细胞和B细胞之间的分布上表现出较大变化的转录因子针对T细胞特异性因子富集(图5d)。该分析显示NFAT被差异调节,而典型的CTCF占据在这两个细胞类型中高度相关(图5d)。支持这种解释的是,注意到其中NFAT位于已知的T细胞特异性基因例如CD28和新型lincRNA RP11-229C3.2附近的特定基因座(图15)。此外,CD4+和CD8+T细胞以及通过荧光激活细胞分选(FACS)从单个抽血样品分离的单核细胞的ATAC-seq生成了个人表观基因组的解释框架,并证明了ATAC-seq与使用表面标志物的细胞富集兼容(图16)。单独地,等位基因特异性染色质可接近性已被显示与我们对人类疾病的理解特别相关。作为原理的证明,我们还使用ATAC-seq来鉴定GM12878细胞系内的候选等位基因特异性开放染色质区域(图17)。这些结果表明从临床样品产生详细的个性化基因调节网络的可行性,从而为未来的诊断应用打开大门。
染色质可接近性的表观基因组研究已产生了非常多的生物学见解,但目前受到其复杂工作流和大细胞数量要求的应用的限制。虽然现有方法的改进可以使它们能够达到类似的表现,但在某些情况下ATAC-seq可因其快速性、简单性和低输入细胞数要求而提供优于现有技术的显著优势。ATAC-seq是信息丰富的测定,允许同时询问因子占据、调节位点中的核小体位置和全基因组染色质可接近性。这些见解来源于转座反应中插入的位置和插入片段长度的分布。虽然现存的方法如DNase-和MNase-seq可以提供ATAC-seq中的一些信息子集,但它们各自需要具有大细胞数量的单独测定,其增加了时间、成本并限制对许多系统的适用性。ATAC-seq还提供了生物学相关的基因组区域的插入片段大小“指纹”,提示其捕获了关于染色质紧密态的信息。ATAC-seq可具有广泛的适用性,显著添加至基因组学工具包,并改善我们对基因调控的理解,特别是当与其它强大的稀少细胞技术结合时,例如FACS、激光捕获显微切割(LCM)和最近RNA-seq的进展。
ATAC-seq可用于在与临床决策兼容的时间尺度上产生“个人基因组”特征谱。优化的程序可以在275分钟内将临床血液样品转化为完成的测序文库。减少的输入要求和快速的工作流,当结合最近引入的快速周转高通量测序仪器例如MiSeq和HiSeq2500时,应使得能够在实验室和临床上研究所选择的组织的个性化表观遗传景观。ATAC-seq与FACS兼容,从而可实现对来自原始组织的经仔细分选且稀少的亚群的研究。在发育和衰老以及人类疾病包括癌症、自身免疫和神经精神障碍的不同点上选择的细胞亚群是可行的应用。
实施例2:单细胞ATAC-seq
单细胞染色质可接近性数据集通过使用ATAC-seq方案获得。为了确保转座酶分子对开放染色质位点的比率几乎保持恒定,在初始转座反应后通过操作个体细胞来进行单细胞ATAC-seq测定。
转座酶可用作开放染色质染色
观察到在体外插入测序衔接子后,Tn5转座酶保持与DNA的紧密结合并形成高亲和力大分子复合物,其阻止所产生的ATAC-seq DNA片段的解离。为了支持此观察结果,用荧光标记的DNA衔接子装载Tn5的转座酶,并允许个体细胞的细胞核内的开放染色质区域的可视化(图18)。另外的电泳迁移率变动测定也表明转座酶在转座后保持与DNA关联。
单细胞ATAC-seq提供了染色体DNA的独特读数特征
由于该荧光信号定位于细胞核并且即使在转座后仍是可检测的,因而通过在随后的分选和细胞选择步骤中将转座的片段保持在细胞核中来进行单细胞ATAC-seq实验。将一组细胞透化,并用Tn5转座酶使染色体DNA转座。细胞被保持在阻止所得的ATAC-seq片段离开细胞核的条件下,(即二价阳离子未螯合),并且如上所述,将个体细胞分选至独立的PCR反应中用于文库制备。此工作流显著简化了单细胞分析的工作流并且提供了两个额外的优势。首先,这消除了分选过程对染色质状态的任何效应,因为转座在分选前进行。其次,它提供了更强健的ATAC-seq信号,因为细胞被直接分选至PCR预混合物中并进行扩增。通过使用此工作流,产生了每细胞~2,000-5,000个独特的ATAC-seq读数。这些读数针对GM 12878细胞中已知的开放染色质位点富集(图19)并且展示出指示核小体的特征周期性富集(图20)。
实施例3:质量控制
转座酶可接近染色质的测定(ATAC-seq)已显示与用于细胞收集的许多方法兼容,并且还在许多细胞类型和物种上有效地运行。然而,下列方案针对人类淋巴母细胞样细胞进行了优化。较小的变化(即细胞数、离心速度和裂解条件)可以针对特定的应用进行优化。
I.细胞制备
1.收获细胞(无固定),方案由用户定义。
2.离心50,000个细胞,在500×g下5分钟,4℃。
3.用50μL冷的1x PBS缓冲液洗涤一次,在500×g 4℃下离心5分钟。
4.轻轻吸取以将细胞沉淀重悬于50μL冷的裂解缓冲液(10mM Tris-HCl,pH 7.4,10mMNaCl,3mM MgCl2和0.1%IGEPAL CA-630)。立即在500×g 4℃下离心10分钟。
5.弃去上清液,并立即进行转座反应。
II.转座反应和纯化
1.确保细胞沉淀置于冰上。
2.为了制备转座反应混合物,组合以下成分:
25μL 2x TD缓冲区(Illumina Cat#FC-121-1030)
2.5μL Tn5转座(Illumina Cat#FC-121-1030)
22.5μL不含核酸酶的H2O
总计50μl
3.轻轻吸取以将细胞核重悬于转座反应混合物。
4.在37℃下温育转座反应物30分钟。
5.在转座后立即使用Qiagen MinElute试剂盒纯化。
6.将转座的DNA洗脱在10μL洗脱缓冲液(10mM Tris缓冲液,pH 8)中。
7.纯化的DNA可储存在-20℃。
III.PCR扩增
1.为了扩增转座的DNA片段,将以下成分组合在PCR管中:
10μL转座的DNA
9.7μL不含核酸酶的H2O
2.5μL 25μM的定制Nextera PCR引物1*
2.5μL 25μM的定制Nexttera PCR引物2*[条形码]
0.3μL 100x SYBR Green I**(Invitrogen Cat#S-7563)
25μL NEBNext高保真2x PCR预混合物(New England Labs Cat#M0541)
总计50μl
*引物的完整列表如上文所示。
**10,000x SYBR Green I稀释在10mM Tris缓冲液,pH 8中以制备100x工作溶液。
2.循环如下:
(1)72℃,5分钟
(2)98℃,30秒
(3)98℃,10秒
(4)63℃,30秒
(5)72℃,1分钟
(6)重复步骤3-5,4x
(7)保持在4℃
3.为了减少PCR中的GC和大小偏倚,使用qPCR监测PCR反应以在饱和之前停止扩增。为了运行qPCR副反应,组合以下成分:
5μL 5个循环PCR扩增的DNA
4.44μL不含核酸酶的H2O
0.25μL 25μΜ的定制Nextera PCR引物1*
0.25μL 25μΜ的定制Nextera PCR引物2*
0.06μL 100x SYBR Green I
5μL NEBNext高保真2X PCR预混合物
总计15μl
*引物的完整列表可在本方案的第VI部分获得
4.qPCR循环如下:
(1)98℃,30秒
(2)98℃,10秒
(3)63℃,30秒
(4)72℃,1分钟
(5)重复步骤2-4,19x
(6)保持在4℃下。
5.其余45μL PCR反应物所需的额外循环数量如下确定:
(1)对线性Rn相对于循环映射
(2)设置5000RF阈值
(3)计算对应于四分之一最大荧光强度的
如果待增加的循环#介于两个循环之间,则该#通过采取待增加的循环#的较小整数(即,蓝色和粉红色样品)来确定
如果两个样品具有相似的Ct值但荧光强度不同,则使用具有较低荧光强度的样品(即,红色和蓝色的样品)计算循环#
6.运行其余45μL PCR反应物以校正循环#。循环如下:
(1)98℃,30秒
(2)98℃,10秒
(3)63℃,30秒
(4)72℃,1分钟
(5)重复步骤2-4,x次
(6)保持在4℃
7.使用Qiagen PCR Cleanup试剂盒纯化文库。将纯化的文库洗脱在20μL洗脱缓冲液(10mM Tris缓冲液,pH 8)中。确保在添加洗脱缓冲液之前柱是干燥的。
IV.使用凝胶电泳的文库QC
1.用10mM Tris缓冲液,pH8以1:20稀释100bp NEB DNA梯度液。
2.每5μL的稀释梯度液加入0.6μL 10×SYBR Green I。
3.用2x DNA上样染料以1:1混合稀释梯度液。
4.用2x DNA上样染料以1:1混合扩增的文库。
5.将扩增的文库在5%Bio-Rad Mini-Protean TBE预制胶(保存在4℃)上运行。加载5μL稀释梯度液/DNA上样染料混合物。加载10μL扩增文库/DNA上样染料混合物。
6.在~100mV运行45分钟。
7.SYBR Green I染料在~488nm上具有最大激发并且在~520nm上具有最大发射。用SYBR Green I染料染色的DNA可以使用蓝光源或装备有在488nm下发射的激光的成像系统来可视化。我们通常使用来自Amersham Biosciences的Typhoon TRIO可变模式成像仪来进行可视化。图像通过利用520nm带通发射滤光器以筛除反射和散射激发光和背景荧光在100微米像素大小分辨率下进行数字化来最佳获得。
V.文库定量
我们使用基于qPCR的方法来定量我们的ATAC-seq文库。我们已发现其它方法例如生物分析仪和Qubit,可以因插入片段大小的较大分布而产生误导性和不准确的结果。我们推荐使用用于Illumina测序平台的KAPA Library Quant试剂盒(KAPABiosystems)来定量文库。
虽然前述实施方案已以举例说明和实例的方式为了清楚理解的目的在一定细节上进行了描述,但根据上述教导对于本领域普通技术人员显而易见的是可对其进行某些变化和修改而不脱离所附权利要求的精神或范围。
本发明还涉及以下实施方案。
1.用于分析染色质的方法,包括:
(a)用插入酶复合物处理分离自细胞群的染色质以产生基因组DNA的标记片段;
(b)测序至少一些标记片段以产生多个序列读数;和
(c)通过将获自序列读数的信息映射至细胞的基因组的区域而制作所述细胞的基因组的该区域的表观遗传图谱。
2.实施方案1的方法,其中所述信息通过使用在序列读数的开头的核苷酸序列和任选末端的核苷酸序列获得。
3.实施方案1-2之任一项的方法,其中在(c)中映射的所述信息选自下列的一种或多种:
(i)转座酶的切割位点;
(ii)在步骤(a)中产生的片段的大小;
(iii)序列读数长度;
(iii)确定长度范围的序列读数的位置;和
(iv)序列读数丰度。
4.实施方案3的方法,其中确定大小范围的片段是无核小体的片段。
5.实施方案1-4之任一项的方法,其中所述表观遗传图谱显示下列的一项或多项:
(i)沿所述区域的染色质可接近性的特征谱;
(ii)针对所述区域中结合位点的DNA结合蛋白的占据;
(iii)所述区域中的无核小体的DNA;
(iv)沿所述区域的核小体定位;
(v)染色质状态。
6.实施方案5的方法,其还包括测量所述DNA结合蛋白对结合位点的总体占据。
7.实施方案5的方法,其中所述DNA结合蛋白是转录因子。
8.实施方案1-7之任一项的方法,其中所述细胞群包括500至100,000个细胞。
9.实施方案1-8之任一项的方法,其中所述细胞分离自个体。
10.实施方案1-9之任一项的方法,其中所述细胞分离自所述个体的血液。
11.实施方案1-10的方法,其中所述细胞是相同的细胞类型。
12.实施方案11的方法,其中所述细胞是FACS选择的细胞。
13.实施方案1-12之任一项的方法,其中所述处理步骤(a)包括:
从细胞群分离细胞核;和
将分离的细胞核与所述插入酶复合物组合,其中所述组合导致细胞核裂解以释放所述染色质,以及导致产生基因组DNA的所述标记片段。
14.实施方案1-13之任一项的方法,其中所述转座酶来源于Tn5转座酶。
15.实施方案1-14之任一项的方法,其中所述转座酶来源于MuA转座酶。
16.用于比较两种样品的方法,包括:
(a)使用实施方案1的方法分析第一细胞群,以产生第一表观遗传图谱;和
(b)使用实施方案1的方法分析第二细胞群,以产生第二表观遗传图谱;和
(c)比较所述第一表观遗传图谱与所述第二表观遗传图谱。
17.实施方案16的方法,其中所述第一细胞群和所述第二细胞群是在不同的时间从相同个体收集的。
18.实施方案16的方法,其中所述第一细胞群和所述第二细胞群是从不同个体收集的不同细胞群。
19.诊断方法,其包括:
使用实施方案1的方法分析来自患者的染色质,以产生表观遗传图谱;和
基于所述表观遗传图谱提供诊断或预后。
20.试剂盒,其包含:
(a)用于从细胞群分离细胞核的试剂;
(b)插入酶复合物,和
(c)转座酶反应缓冲液,
其中所述试剂盒的组分被配置为使得反应缓冲液、转座子标签和衔接子与细胞核的体外组合导致细胞核裂解以释放染色质,以及导致产生基因组DNA的标记片段。
21.用于测定多核苷酸在某位点上的可接近性的方法,其中所述多核苷酸来自细胞样品,所述方法包括:
(a)用插入酶将多个分子标签插入所述多核苷酸;和
(b)使用所述分子标签来测定所述位点上的可接近性。
22.实施方案21的方法,其还包括使用所测定的所述可接近性来鉴定在所述位点上结合至所述多核苷酸的一种或多种蛋白。
23.实施方案22的方法,其中至少一种所述蛋白是转录因子。
24.实施方案21的方法,其还包括使用所述分子标签来产生所述多核苷酸的可接近性图谱。
25.用于分析来自细胞样品的多核苷酸的三维结构的方法,包括:
(a)用插入酶将多个分子标签插入所述多核苷酸;和
(b)使用所述分子标签来分析述多核苷酸的三维结构。
26.实施方案21或25的方法,其中所述细胞样品获自原始来源。
27.实施方案21或25的方法,其中所述细胞样品由少于约500,000个细胞组成。
28.实施方案27的方法,其中所述细胞样品是单个细胞。
29.实施方案21或25的方法,其中所述多核苷酸在步骤(a)过程中被分割成多个片段。
30.实施方案29的方法,其还包括扩增所述片段。
31.实施方案29的方法,其中通过对所述片段测序从而产生多个测序读数来测定所述可接近性或分析所述三维结构。
32.实施方案31的方法,其中所述片段通过高通量测序技术测序。
33.实施方案31的方法,其还包括基于所述插入酶的序列插入偏好标准化所述测序读数。
34.实施方案31的方法,其中所述测序读数的长度用于确定染色质状态注释。
35.实施方案21或25的方法,其还包括透化所述细胞样品以允许所述插入酶进入。
36.实施方案35的方法,其中所述细胞样品中的细胞核在所述透化期间被最小限度地扰乱。
37.实施方案35的方法,其中所述细胞样品使用透化剂来透化。
38.实施方案37的方法,其中所述透化剂选自NP40、洋地黄皂苷、吐温、链球菌溶血素和阳离子脂质。
39.实施方案35的方法,其中所述细胞样品使用低渗休克和/或超声处理来透化。
40.实施方案21或25的方法,其中所述插入酶还包含核定位信号。
41.实施方案21或25的方法,其中所述插入通过加入一种或多种二价阳离子来促进。
42.实施方案41的方法,其中所述一种或多种二价阳离子包括镁。
43.实施方案41的方法,其中所述一种或多种二价阳离子包括锰。
44.实施方案21或25的方法,其还包括基于所述特定位点的所述可接近性或所述多核苷酸的所述三维结构来分析受试者的疾病状态,其中所述细胞样品获自所述受试者。
45.实施方案21或25的方法,其还包括将所述细胞样品或所述多核苷酸划分成多个部分。
46.实施方案45的方法,其中基于所述分子标签划分所述部分。
47.实施方案21或25的方法,其还包括分析所述细胞样品的表型。
48.实施方案47的方法,其中所述表型与所述位点的所述可接近性或所述多核苷酸的所述三维结构相关。
49.实施方案21或25的方法,其中所述插入酶包含两个或更多个酶部分。
50.实施方案49的方法,其中每一个所述酶部分将共同的序列插入所述多核苷酸。
51.实施方案50的方法,其中所述共同的序列包括共同的条形码。
52.实施方案49的方法,其中所述酶部分连接在一起。
53.实施方案49的方法,其中所述酶部分包括转座酶。
54.实施方案21或25的方法,其中所述多核苷酸在步骤(a)过程中被分割成多个片段,并且其中包含所述共同的条形码的所述片段被测定为在所述多核苷酸的三维结构中是靠近的。
55.实施方案21或25的方法,其中所述分子标签包含测序衔接子。
56.实施方案55的方法,其中所述测序衔接子还包含条形码标记。
57.实施方案55的方法,其中所述条形码标记包括单一序列。
58.实施方案21或25的方法,其中所述分子标签包括荧光标签。
59.组合物,其包含多核苷酸、插入酶和插入元件,其中:
(a)所述插入元件包括包含预先确定的序列的核酸;和
(b)所述插入酶还包含亲和标签。
60.组合物,其包含多核苷酸、插入酶和插入元件,其中:
(a)所述插入酶包含两个或更多个酶部分;和
(b)所述酶部分连接在一起。
61.试剂盒,其包含:
(a)细胞裂解缓冲液;
(b)包含亲和标签的插入酶;和
(c)包含核酸的插入元件,其中所述核酸包含预先确定的序列。
62.试剂盒,其包含:
(a)细胞裂解缓冲液;
(b)包含两个或更多个酶部分的插入酶,其中所述酶部分连接在一起;和
(c)插入元件。
63.实施方案21、25、59、60、61或62的方法、组合物或试剂盒,其中所述多核苷酸结合至多个关联分子。
64.实施方案63的方法、组合物或试剂盒,其中所述关联分子是蛋白质。
65.实施方案64的方法、组合物或试剂盒,其中所述蛋白质包括组蛋白。
66.实施方案21、25、59、60、61或62的方法、组合物或试剂盒,其中所述插入酶是转座酶。
67.实施方案66的方法、组合物或试剂盒,其中所述转座酶来源于Tn5转座酶。
68.实施方案66的方法、组合物或试剂盒,其中所述转座酶来源于MuA转座酶。
69.实施方案66的方法、组合物或试剂盒,其中所述转座酶来源于Vibhar转座酶。
70.实施方案21、25、59、60、61或62的方法、组合物或试剂盒,其中所述插入酶还包含亲和标签。
71.实施方案70的方法、组合物或试剂盒,其中所述亲和标签是抗体。
72.实施方案71的方法、组合物或试剂盒,其中所述抗体结合至转录因子。
73.实施方案71的方法、组合物或试剂盒,其中所述抗体结合至修饰的核小体。
74.实施方案71的方法、组合物或试剂盒,其中所述抗体结合至修饰的核酸。
75.实施方案74的方法、组合物或试剂盒,其中所述修饰的核酸是甲基化或羟甲基化的DNA。
76.实施方案70的方法、组合物或试剂盒,其中所述亲和标签是单链核酸。
77.实施方案76的方法、组合物或试剂盒,其中所述单链核酸结合至靶核酸。
序列表
<110> Buenrostro, Jason
Chang, Howard Y
Greenleaf, William J
Giresi, Paul
<120> 用于个人表观基因组学的至天然染色质中的转座
<130> STAN-1111WO
<150> US 61/826,728
<151> 2013-05-23
<160> 25
<170> PatentIn version 3.5
<210> 1
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 1
aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg 50
<210> 2
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 2
caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggaga tgt 53
<210> 3
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 3
caagcagaag acggcatacg agatctagta cggtctcgtg ggctcggaga tgt 53
<210> 4
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 4
caagcagaag acggcatacg agatttctgc ctgtctcgtg ggctcggaga tgt 53
<210> 5
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 5
caagcagaag acggcatacg agatgctcag gagtctcgtg ggctcggaga tgt 53
<210> 6
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 6
caagcagaag acggcatacg agataggagt ccgtctcgtg ggctcggaga tgt 53
<210> 7
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 7
caagcagaag acggcatacg agatcatgcc tagtctcgtg ggctcggaga tgt 53
<210> 8
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 8
caagcagaag acggcatacg agatgtagag aggtctcgtg ggctcggaga tgt 53
<210> 9
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 9
caagcagaag acggcatacg agatcctctc tggtctcgtg ggctcggaga tgt 53
<210> 10
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 10
caagcagaag acggcatacg agatagcgta gcgtctcgtg ggctcggaga tgt 53
<210> 11
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 11
caagcagaag acggcatacg agatcagcct cggtctcgtg ggctcggaga tgt 53
<210> 12
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 12
caagcagaag acggcatacg agattgcctc ttgtctcgtg ggctcggaga tgt 53
<210> 13
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 13
caagcagaag acggcatacg agattcctct acgtctcgtg ggctcggaga tgt 53
<210> 14
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 14
caagcagaag acggcatacg agatatcacg acgtctcgtg ggctcggaga tgt 53
<210> 15
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 15
caagcagaag acggcatacg agatacagtg gtgtctcgtg ggctcggaga tgt 53
<210> 16
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 16
caagcagaag acggcatacg agatcagatc cagtctcgtg ggctcggaga tgt 53
<210> 17
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 17
caagcagaag acggcatacg agatacaaac gggtctcgtg ggctcggaga tgt 53
<210> 18
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 18
caagcagaag acggcatacg agatacccag cagtctcgtg ggctcggaga tgt 53
<210> 19
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 19
caagcagaag acggcatacg agataacccc tcgtctcgtg ggctcggaga tgt 53
<210> 20
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 20
caagcagaag acggcatacg agatcccaac ctgtctcgtg ggctcggaga tgt 53
<210> 21
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 21
caagcagaag acggcatacg agatcaccac acgtctcgtg ggctcggaga tgt 53
<210> 22
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 22
caagcagaag acggcatacg agatgaaacc cagtctcgtg ggctcggaga tgt 53
<210> 23
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 23
caagcagaag acggcatacg agattgtgac cagtctcgtg ggctcggaga tgt 53
<210> 24
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 24
caagcagaag acggcatacg agatagggtc aagtctcgtg ggctcggaga tgt 53
<210> 25
<211> 53
<212> DNA
<213> 人工序列
<220>
<223> 合成的多核苷酸
<400> 25
caagcagaag acggcatacg agataggagt gggtctcgtg ggctcggaga tgt 53
Claims (56)
1.用于核酸处理或分析的非诊断目的的方法,其包括:
(a)裂解多个细胞以提供多个细胞核,其中所述多个细胞核包含染色质;及
(b)将所述多个细胞核的细胞核与插入酶复合物接触,使得所述细胞核的多核苷酸在开放染色质区域标签片段化,以产生多个标记片段,
其中所述插入酶复合物包含:
转座酶,
第一核酸插入元件,所述第一核酸插入元件包含第一衔接子序列,和
第二核酸插入元件,所述第二核酸插入元件包含第二衔接子序列,并且
其中所述标记片段中的一个或多个包含:
所述第一衔接子序列,和
所述第二衔接子序列。
2.根据权利要求1所述的方法,其还包括对所述标记片段进行一个或多个核酸反应以产生测序文库。
3.根据权利要求2所述的方法,其还包括对所述测序文库进行测序以产生多个序列读数。
4.根据权利要求2所述的方法,其中所述一个或多个核酸反应包括核酸扩增反应。
5.根据权利要求4所述的方法,
其中所述核酸扩增反应经配置以将一个或多个功能性序列添加至所述标记的核酸分子或其衍生物,
其中所述一个或多个功能性序列与所选的下一代测序平台兼容。
6.根据权利要求1所述的方法,其中所述多个标记片段中的标记片段包含对应于所述标记片段的核苷酸序列。
7.根据权利要求6所述的方法,其中所述标记片段还包含引物序列。
8.根据权利要求1所述的方法,其中所述插入酶复合物包含Tn5转座酶或来源于Tn5转座酶的转座酶。
9.根据权利要求1所述的方法,其中所述第一衔接子序列包含第一测序衔接子序列。
10.根据权利要求1所述的方法,其中所述第一衔接子序列包含条形码序列。
11.根据权利要求1所述的方法,其中所述第一衔接子序列包含第一引物序列。
12.根据权利要求1所述的方法,其中所述第二衔接子序列包含第二测序衔接子序列。
13.根据权利要求1所述的方法,其中所述第二衔接子序列包含条形码序列。
14.根据权利要求1所述的方法,其中所述第二衔接子序列包含第二引物序列。
15.根据权利要求3所述的方法,其还包括分析所述序列读数以产生沿所述细胞核的染色质可接近性的特征谱。
16.根据权利要求3所述的方法,其还包括分析所述序列读数以确定针对所述细胞核的核苷酸中一个或多个DNA结合蛋白结合位点的DNA结合蛋白的占据。
17.根据权利要求3所述的方法,其还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个转录起始位点的位置。
18.根据权利要求1所述的方法,其中所述插入酶复合物不含特异性针对作为染色质的一部分的蛋白的抗体。
19.根据权利要求3和15~17之任一项所述的方法,其还包括分析所述序列读数以产生代表所述细胞核的多核苷酸的一个或多个表观遗传特征的表观遗传图谱。
20.根据权利要求3和15~17之任一项所述的方法,其还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个核小体的位置。
21.用于核酸处理或分析的非诊断目的的方法,其包括:
(a)裂解多个细胞以分离多个细胞核,其中所述多个细胞核包含染色质;及
(b)将所述多个细胞核的细胞核与Tn5转座酶复合物接触,使得所述细胞核的多核苷酸在开放染色质区域标签片段化,以产生多个标记片段,
其中所述Tn5转座酶复合物包含第一测序衔接子序列和第二测序衔接子序列,
其中所述Tn5转座酶复合物不含特异性针对作为染色质的一部分的蛋白的抗体,并且
其中所述多个标记片段中的标记片段包含:
(i)对应于开放染色质区域的核苷酸序列,
(ii)所述第一测序衔接子序列,和
(iii)所述第二测序衔接子序列。
22.根据权利要求21所述的方法,其还包括对所述标记片段进行一个或多个核酸反应以产生测序文库。
23.根据权利要求22所述的方法,其还包括对所述测序文库进行测序以产生多个序列读数。
24.根据权利要求23所述的方法,其还包括分析所述序列读数以产生沿所述细胞核的染色质可接近性的特征谱。
25.根据权利要求23所述的方法,其还包括分析所述序列读数以确定针对所述细胞核的核苷酸中一个或多个DNA结合蛋白结合位点的DNA结合蛋白的占据。
26.根据权利要求23所述的方法,其还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个转录起始位点的位置。
27.根据权利要求23~26之任一项所述的方法,其还包括分析所述序列读数以产生代表所述细胞核的多核苷酸的一个或多个表观遗传特征的表观遗传图谱。
28.根据权利要求23~26之任一项所述的方法,其还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个核小体的位置。
29.插入酶复合物在制造用于核酸处理或分析的试剂盒中的用途,所述核酸处理或分析通过包括下列步骤的方法实施:
(a)裂解多个细胞以提供多个细胞核,其中所述多个细胞核包含染色质;及
(b)将所述多个细胞核的细胞核与插入酶复合物接触,使得所述细胞核的多核苷酸在开放染色质区域标签片段化,以产生多个标记片段,
其中所述插入酶复合物包含:
转座酶,
第一核酸插入元件,所述第一核酸插入元件包含第一衔接子序列,和
第二核酸插入元件,所述第二核酸插入元件包含第二衔接子序列,并且
其中所述标记片段中的一个或多个包含:
所述第一衔接子序列,和
所述第二衔接子序列。
30.根据权利要求29所述的用途,其中所述方法还包括对所述标记片段进行一个或多个核酸反应以产生测序文库。
31.根据权利要求30所述的用途,其中所述方法还包括对所述测序文库进行测序以产生多个序列读数。
32.根据权利要求30所述的用途,其中所述一个或多个核酸反应包括核酸扩增反应。
33.根据权利要求32的用途,
其中所述核酸扩增反应经配置以将一个或多个功能性序列添加至所述标记的核酸分子或其衍生物,
其中所述一个或多个功能性序列与所选的下一代测序平台兼容。
34.根据权利要求29所述的用途,其中所述多个标记片段中的标记片段包含对应于所述标记片段的核苷酸序列。
35.根据权利要求34所述的用途,其中所述标记片段还包含引物序列。
36.根据权利要求29所述的用途,其中所述插入酶复合物包含Tn5转座酶或来源于Tn5转座酶的转座酶。
37.根据权利要求29所述的用途,其中所述第一衔接子序列包含第一测序衔接子序列。
38.根据权利要求29所述的用途,其中所述第一衔接子序列包含条形码序列。
39.根据权利要求29所述的用途,其中所述第一衔接子序列包含第一引物序列。
40.根据权利要求29所述的用途,其中所述第二衔接子序列包含第二测序衔接子序列。
41.根据权利要求29所述的用途,其中所述第二衔接子序列包含条形码序列。
42.根据权利要求29所述的用途,其中所述第二衔接子序列包含第二引物序列。
43.根据权利要求31所述的用途,其中所述方法还包括分析所述序列读数以产生沿所述细胞核的染色质可接近性的特征谱。
44.根据权利要求31所述的用途,其中所述方法还包括分析所述序列读数以确定针对所述细胞核的核苷酸中一个或多个DNA结合蛋白结合位点的DNA结合蛋白的占据。
45.根据权利要求31所述的用途,其中所述方法还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个转录起始位点的位置。
46.根据权利要求29所述的用途,其中所述插入酶复合物不含特异性针对作为染色质的一部分的蛋白的抗体。
47.根据权利要求31和43~45之任一项所述的用途,其中所述方法还包括分析所述序列读数以产生代表所述细胞核的多核苷酸的一个或多个表观遗传特征的表观遗传图谱。
48.根据权利要求31和43~45之任一项所述的用途,其中所述方法还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个核小体的位置。
49.Tn5转座酶复合物在制造用于核酸处理或分析的试剂盒中的用途,所述核酸处理或分析通过包括下列步骤的方法实施:
(a)裂解多个细胞以分离多个细胞核,其中所述多个细胞核包含染色质;及
(b)将所述多个细胞核的细胞核与Tn5转座酶复合物接触,使得所述细胞核的多核苷酸在开放染色质区域标签片段化,以产生多个标记片段,
其中所述Tn5转座酶复合物包含第一测序衔接子序列和第二测序衔接子序列,
其中所述Tn5转座酶复合物不含特异性针对作为染色质的一部分的蛋白的抗体,并且
其中所述多个标记片段中的标记片段包含:
(i)对应于开放染色质区域的核苷酸序列,
(ii)所述第一测序衔接子序列,和
(iii)所述第二测序衔接子序列。
50.根据权利要求49所述的用途,其中所述方法还包括对所述标记片段进行一个或多个核酸反应以产生测序文库。
51.根据权利要求50所述的用途,其中所述方法还包括对所述测序文库进行测序以产生多个序列读数。
52.根据权利要求51所述的用途,其中所述方法还包括分析所述序列读数以产生沿所述细胞核的染色质可接近性的特征谱。
53.根据权利要求51所述的用途,其中所述方法还包括分析所述序列读数以确定针对所述细胞核的核苷酸中一个或多个DNA结合蛋白结合位点的DNA结合蛋白的占据。
54.根据权利要求51所述的用途,其中所述方法还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个转录起始位点的位置。
55.根据权利要求51~54之任一项所述的用途,其中所述方法还包括分析所述序列读数以产生代表所述细胞核的多核苷酸的一个或多个表观遗传特征的表观遗传图谱。
56.根据权利要求51~54之任一项所述的用途,其中所述方法还包括分析所述序列读数以确定所述细胞核的多核苷酸中的一个或多个核小体的位置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010205546.6A CN111394426B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201361826728P | 2013-05-23 | 2013-05-23 | |
US61/826,728 | 2013-05-23 | ||
PCT/US2014/038825 WO2014189957A2 (en) | 2013-05-23 | 2014-05-20 | Transposition into native chromatin for personal epigenomics |
CN202010205546.6A CN111394426B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
CN201480028601.1A CN105339503B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480028601.1A Division CN105339503B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111394426A CN111394426A (zh) | 2020-07-10 |
CN111394426B true CN111394426B (zh) | 2024-05-10 |
Family
ID=51934332
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010205546.6A Active CN111394426B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
CN201480028601.1A Active CN105339503B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201480028601.1A Active CN105339503B (zh) | 2013-05-23 | 2014-05-20 | 用于个人表观基因组学的至天然染色质的转座 |
Country Status (9)
Country | Link |
---|---|
US (12) | US10059989B2 (zh) |
EP (4) | EP4321628A3 (zh) |
JP (3) | JP6618894B2 (zh) |
CN (2) | CN111394426B (zh) |
AU (4) | AU2014268710B2 (zh) |
CA (1) | CA2909972A1 (zh) |
HK (1) | HK1222416A1 (zh) |
SG (1) | SG11201508985VA (zh) |
WO (1) | WO2014189957A2 (zh) |
Families Citing this family (191)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9074251B2 (en) | 2011-02-10 | 2015-07-07 | Illumina, Inc. | Linking sequence reads using paired code tags |
AU2012212148B8 (en) | 2011-02-02 | 2017-07-06 | University Of Washington Through Its Center For Commercialization | Massively parallel contiguity mapping |
WO2012129363A2 (en) | 2011-03-24 | 2012-09-27 | President And Fellows Of Harvard College | Single cell nucleic acid detection and analysis |
US9938524B2 (en) | 2011-11-22 | 2018-04-10 | Active Motif, Inc. | Multiplex isolation of protein-associated nucleic acids |
US10689643B2 (en) | 2011-11-22 | 2020-06-23 | Active Motif, Inc. | Targeted transposition for use in epigenetic studies |
US11591637B2 (en) | 2012-08-14 | 2023-02-28 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US9951386B2 (en) | 2014-06-26 | 2018-04-24 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10273541B2 (en) | 2012-08-14 | 2019-04-30 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9567631B2 (en) | 2012-12-14 | 2017-02-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9701998B2 (en) | 2012-12-14 | 2017-07-11 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10752949B2 (en) | 2012-08-14 | 2020-08-25 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
EP3901273A1 (en) | 2012-08-14 | 2021-10-27 | 10X Genomics, Inc. | Microcapsule compositions and methods |
US10323279B2 (en) | 2012-08-14 | 2019-06-18 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10584381B2 (en) | 2012-08-14 | 2020-03-10 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10221442B2 (en) | 2012-08-14 | 2019-03-05 | 10X Genomics, Inc. | Compositions and methods for sample processing |
US20160040229A1 (en) | 2013-08-16 | 2016-02-11 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US10876152B2 (en) | 2012-09-04 | 2020-12-29 | Guardant Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
US11913065B2 (en) | 2012-09-04 | 2024-02-27 | Guardent Health, Inc. | Systems and methods to detect rare mutations and copy number variation |
PL3591073T3 (pl) | 2012-09-04 | 2022-03-28 | Guardant Health, Inc. | Sposoby wykrywania rzadkich mutacji i zmienności liczby kopii |
EP3901280A1 (en) | 2012-10-17 | 2021-10-27 | Spatial Transcriptomics AB | Methods and product for optimising localised or spatial detection of gene expression in a tissue sample |
US10533221B2 (en) | 2012-12-14 | 2020-01-14 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
US9644204B2 (en) | 2013-02-08 | 2017-05-09 | 10X Genomics, Inc. | Partitioning and processing of analytes and other species |
AU2013382098B2 (en) * | 2013-03-13 | 2019-02-07 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
CN111394426B (zh) | 2013-05-23 | 2024-05-10 | 斯坦福大学托管董事会 | 用于个人表观基因组学的至天然染色质的转座 |
US20160208323A1 (en) * | 2013-06-21 | 2016-07-21 | The Broad Institute, Inc. | Methods for Shearing and Tagging DNA for Chromatin Immunoprecipitation and Sequencing |
EP3013984B1 (en) | 2013-06-25 | 2023-03-22 | Prognosys Biosciences, Inc. | Methods for determining spatial patterns of biological targets in a sample |
US10395758B2 (en) | 2013-08-30 | 2019-08-27 | 10X Genomics, Inc. | Sequencing methods |
US9824068B2 (en) | 2013-12-16 | 2017-11-21 | 10X Genomics, Inc. | Methods and apparatus for sorting data |
EP3378952B1 (en) | 2013-12-28 | 2020-02-05 | Guardant Health, Inc. | Methods and systems for detecting genetic variants |
EP3129143B1 (en) | 2014-04-10 | 2022-11-23 | 10X Genomics, Inc. | Method for partitioning microcapsules |
CN106795553B (zh) | 2014-06-26 | 2021-06-04 | 10X基因组学有限公司 | 分析来自单个细胞或细胞群体的核酸的方法 |
CA2964472A1 (en) | 2014-10-29 | 2016-05-06 | 10X Genomics, Inc. | Methods and compositions for targeted nucleic acid sequencing |
US9975122B2 (en) | 2014-11-05 | 2018-05-22 | 10X Genomics, Inc. | Instrument systems for integrated sample processing |
US10900065B2 (en) | 2014-11-14 | 2021-01-26 | University Of Washington | Methods and kits for labeling cellular molecules |
EP3031929A1 (en) * | 2014-12-11 | 2016-06-15 | Mdc Max-Delbrück-Centrum Für Molekulare Medizin Berlin - Buch | Genome architecture mapping |
AU2015364286B2 (en) | 2014-12-20 | 2021-11-04 | Arc Bio, Llc | Compositions and methods for targeted depletion, enrichment, and partitioning of nucleic acids using CRISPR/Cas system proteins |
CN112126675B (zh) | 2015-01-12 | 2022-09-09 | 10X基因组学有限公司 | 用于制备核酸测序文库的方法和系统以及用其制备的文库 |
US10697000B2 (en) | 2015-02-24 | 2020-06-30 | 10X Genomics, Inc. | Partition processing methods and systems |
WO2016138148A1 (en) | 2015-02-24 | 2016-09-01 | 10X Genomics, Inc. | Methods for targeted nucleic acid sequence coverage |
EP4151748B1 (en) | 2015-04-10 | 2023-12-20 | 10x Genomics Sweden AB | Spatially distinguished, multiplex nucleic acid analysis of biological specimens |
AU2016308283B2 (en) | 2015-08-19 | 2022-04-21 | Arc Bio, Llc | Capture of nucleic acids using a nucleic acid-guided nuclease-based system |
CA3004527A1 (en) * | 2015-11-09 | 2017-05-18 | Progenity, Inc. | Methods for determining the origin of dna molecules |
US11371094B2 (en) | 2015-11-19 | 2022-06-28 | 10X Genomics, Inc. | Systems and methods for nucleic acid processing using degenerate nucleotides |
WO2017096158A1 (en) | 2015-12-04 | 2017-06-08 | 10X Genomics, Inc. | Methods and compositions for nucleic acid analysis |
EP3390668A4 (en) | 2015-12-17 | 2020-04-01 | Guardant Health, Inc. | METHODS OF DETERMINING THE NUMBER OF TUMOR GENE COPIES BY ACELLULAR DNA ANALYSIS |
CN105463089A (zh) * | 2015-12-21 | 2016-04-06 | 同济大学 | 应用于斑马鱼胚胎的易接近转座酶核染色质高通量测序实验的方法 |
CN108779491B (zh) | 2016-02-11 | 2021-03-09 | 10X基因组学有限公司 | 用于全基因组序列数据的从头组装的系统、方法和介质 |
CN109072206A (zh) * | 2016-03-10 | 2018-12-21 | 斯坦福大学托管董事会 | 转座酶介导的对可接近基因组的成像 |
US11384382B2 (en) | 2016-04-14 | 2022-07-12 | Guardant Health, Inc. | Methods of attaching adapters to sample nucleic acids |
EP3443066B1 (en) | 2016-04-14 | 2024-10-02 | Guardant Health, Inc. | Methods for early detection of cancer |
US11932847B2 (en) | 2016-04-19 | 2024-03-19 | Kapa Biosystems, Inc. | Transposase competitor control system |
WO2017197338A1 (en) | 2016-05-13 | 2017-11-16 | 10X Genomics, Inc. | Microfluidic systems and methods of use |
JP7155021B2 (ja) * | 2016-07-22 | 2022-10-18 | オレゴン ヘルス アンド サイエンス ユニヴァーシティ | 単細胞全ゲノムライブラリおよびそれを作成する組み合わせインデックス付加方法 |
US11352647B2 (en) | 2016-08-17 | 2022-06-07 | The Broad Institute, Inc. | Crispr enzymes and systems |
EP3508574B1 (en) * | 2016-08-30 | 2024-10-09 | Kyushu University, National University Corporation | Method for inserting desired dna fragment into site located adjacent to binding domain of dna-binding protein |
US9850523B1 (en) | 2016-09-30 | 2017-12-26 | Guardant Health, Inc. | Methods for multi-resolution analysis of cell-free nucleic acids |
CN118460676A (zh) | 2016-09-30 | 2024-08-09 | 夸登特健康公司 | 用于无细胞核酸的多分辨率分析的方法 |
CN110087772B (zh) * | 2016-11-17 | 2022-07-19 | 克利夫兰州立大学 | 用于微阵列3d生物打印的芯片平台 |
JP2020501240A (ja) * | 2016-11-18 | 2020-01-16 | ナントミクス,エルエルシー | 汎がんゲノムにおけるdnaアクセシビリティを予測するための方法及びシステム |
ES2922281T3 (es) * | 2016-12-07 | 2022-09-12 | Mgi Tech Co Ltd | Método para construir una biblioteca de secuenciación de una célula individual y uso del mismo |
US10550429B2 (en) | 2016-12-22 | 2020-02-04 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10815525B2 (en) | 2016-12-22 | 2020-10-27 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
US10011872B1 (en) | 2016-12-22 | 2018-07-03 | 10X Genomics, Inc. | Methods and systems for processing polynucleotides |
AU2017386533B2 (en) * | 2016-12-29 | 2024-05-09 | Illumina, Inc. | Analysis system for orthogonal access to and tagging of biomolecules in cellular compartments |
WO2018132518A1 (en) | 2017-01-10 | 2018-07-19 | Juno Therapeutics, Inc. | Epigenetic analysis of cell therapy and related methods |
EP4310183A3 (en) | 2017-01-30 | 2024-02-21 | 10X Genomics, Inc. | Methods and systems for droplet-based single cell barcoding |
US10995333B2 (en) | 2017-02-06 | 2021-05-04 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation |
WO2018152244A1 (en) * | 2017-02-14 | 2018-08-23 | Seqwell, Inc. | Compositions and methods for sequencing nucleic acids |
AU2018262331A1 (en) | 2017-05-05 | 2019-11-21 | Scipio Bioscience | Methods for trapping and barcoding discrete biological units in hydrogel |
US10914729B2 (en) | 2017-05-22 | 2021-02-09 | The Trustees Of Princeton University | Methods for detecting protein binding sequences and tagging nucleic acids |
EP3445876B1 (en) | 2017-05-26 | 2023-07-05 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
US20180340169A1 (en) | 2017-05-26 | 2018-11-29 | 10X Genomics, Inc. | Single cell analysis of transposase accessible chromatin |
WO2018226546A1 (en) | 2017-06-05 | 2018-12-13 | 10X Genomics, Inc. | Gaskets for the distribution of pressures in a microfluidic system |
US11180804B2 (en) | 2017-07-25 | 2021-11-23 | Massachusetts Institute Of Technology | In situ ATAC sequencing |
WO2019046564A1 (en) * | 2017-08-30 | 2019-03-07 | Kapa Biosystems, Inc. | TRANSPOSASE COMPOSITIONS, PREPARATION METHODS, AND SCREENING METHODS |
AU2018335575B2 (en) * | 2017-09-25 | 2024-07-04 | Fred Hutchinson Cancer Center | High efficiency targeted in situ genome-wide profiling |
US10590244B2 (en) | 2017-10-04 | 2020-03-17 | 10X Genomics, Inc. | Compositions, methods, and systems for bead formation using improved polymers |
WO2019071054A1 (en) | 2017-10-04 | 2019-04-11 | The Broad Institute, Inc. | METHODS AND COMPOSITIONS FOR MODIFYING THE FUNCTION AND STRUCTURE OF BUCKLES AND / OR CHROMATIN DOMAINS |
US10837047B2 (en) | 2017-10-04 | 2020-11-17 | 10X Genomics, Inc. | Compositions, methods, and systems for bead formation using improved polymers |
US11732257B2 (en) | 2017-10-23 | 2023-08-22 | Massachusetts Institute Of Technology | Single cell sequencing libraries of genomic transcript regions of interest in proximity to barcodes, and genotyping of said libraries |
WO2019084043A1 (en) * | 2017-10-26 | 2019-05-02 | 10X Genomics, Inc. | METHODS AND SYSTEMS FOR NUCLEIC ACID PREPARATION AND CHROMATIN ANALYSIS |
CN111479631B (zh) | 2017-10-27 | 2022-02-22 | 10X基因组学有限公司 | 用于样品制备和分析的方法和系统 |
WO2019089959A1 (en) | 2017-11-02 | 2019-05-09 | Bio-Rad Laboratories, Inc. | Transposase-based genomic analysis |
CN111051523B (zh) | 2017-11-15 | 2024-03-19 | 10X基因组学有限公司 | 功能化凝胶珠 |
US10829815B2 (en) | 2017-11-17 | 2020-11-10 | 10X Genomics, Inc. | Methods and systems for associating physical and genetic properties of biological particles |
WO2019108851A1 (en) | 2017-11-30 | 2019-06-06 | 10X Genomics, Inc. | Systems and methods for nucleic acid preparation and analysis |
WO2019113506A1 (en) | 2017-12-07 | 2019-06-13 | The Broad Institute, Inc. | Methods and compositions for multiplexing single cell and single nuclei sequencing |
CN118547046A (zh) | 2017-12-22 | 2024-08-27 | 10X基因组学有限公司 | 用于处理来自一个或多个细胞的核酸分子的系统和方法 |
CN108085379A (zh) * | 2017-12-28 | 2018-05-29 | 上海嘉因生物科技有限公司 | 应用于组织样本中染色体开放结合区域定位的ATAC-seq方法 |
EP3749740B1 (en) * | 2018-02-05 | 2023-08-30 | The Board Of Trustees Of The Leland Stanford Junior University | Systems and methods for multiplexed measurements in single and ensemble cells |
CN108360074B (zh) * | 2018-02-11 | 2022-01-18 | 奥明(杭州)基因科技有限公司 | 一种组织淋巴细胞转座酶可接近性染色质分析的建库方法 |
SG11202007686VA (en) | 2018-02-12 | 2020-09-29 | 10X Genomics Inc | Methods characterizing multiple analytes from individual cells or cell populations |
EP3752634B8 (en) | 2018-02-13 | 2023-10-11 | Illumina, Inc. | Dna sequencing using hydrogel beads |
US11639928B2 (en) | 2018-02-22 | 2023-05-02 | 10X Genomics, Inc. | Methods and systems for characterizing analytes from individual cells or cell populations |
WO2019169028A1 (en) | 2018-02-28 | 2019-09-06 | 10X Genomics, Inc. | Transcriptome sequencing through random ligation |
US11841371B2 (en) | 2018-03-13 | 2023-12-12 | The Broad Institute, Inc. | Proteomics and spatial patterning using antenna networks |
EP3775271A1 (en) | 2018-04-06 | 2021-02-17 | 10X Genomics, Inc. | Systems and methods for quality control in single cell processing |
KR20240052875A (ko) | 2018-04-20 | 2024-04-23 | 일루미나, 인코포레이티드 | 단일 세포를 캡슐화하는 방법, 캡슐화된 세포 및 이의 용도 |
US11957695B2 (en) | 2018-04-26 | 2024-04-16 | The Broad Institute, Inc. | Methods and compositions targeting glucocorticoid signaling for modulating immune responses |
US11773441B2 (en) | 2018-05-03 | 2023-10-03 | Becton, Dickinson And Company | High throughput multiomics sample analysis |
US20210386829A1 (en) | 2018-05-04 | 2021-12-16 | The Broad Institute, Inc. | Compositions and methods for modulating cgrp signaling to regulate innate lymphoid cell inflammatory responses |
WO2019217758A1 (en) | 2018-05-10 | 2019-11-14 | 10X Genomics, Inc. | Methods and systems for molecular library generation |
RU2021102869A (ru) | 2018-05-17 | 2022-04-07 | Иллумина, Инк. | Высокопроизводительное секвенирование одиночной клетки со сниженной ошибкой амплификации |
US11414701B2 (en) | 2018-05-24 | 2022-08-16 | The Broad Institute, Inc. | Multimodal readouts for quantifying and sequencing nucleic acids in single cells |
US11932899B2 (en) | 2018-06-07 | 2024-03-19 | 10X Genomics, Inc. | Methods and systems for characterizing nucleic acid molecules |
WO2019241273A1 (en) | 2018-06-11 | 2019-12-19 | The Broad Institute, Inc. | Lineage tracing using mitochondrial genome mutations and single cell genomics |
US11703427B2 (en) | 2018-06-25 | 2023-07-18 | 10X Genomics, Inc. | Methods and systems for cell and bead processing |
US20200032335A1 (en) | 2018-07-27 | 2020-01-30 | 10X Genomics, Inc. | Systems and methods for metabolome analysis |
WO2020041148A1 (en) * | 2018-08-20 | 2020-02-27 | 10X Genomics, Inc. | Methods and systems for detection of protein-dna interactions using proximity ligation |
US12065688B2 (en) | 2018-08-20 | 2024-08-20 | 10X Genomics, Inc. | Compositions and methods for cellular processing |
EP4249651A3 (en) | 2018-08-20 | 2023-10-18 | Bio-Rad Laboratories, Inc. | Nucleotide sequence generation by barcode bead-colocalization in partitions |
US11519033B2 (en) | 2018-08-28 | 2022-12-06 | 10X Genomics, Inc. | Method for transposase-mediated spatial tagging and analyzing genomic DNA in a biological sample |
US20220049275A1 (en) | 2018-10-01 | 2022-02-17 | Lonza, Ltd. | Ssi cells with predictable and stable transgene expression and methods of formation |
US20220411783A1 (en) | 2018-10-12 | 2022-12-29 | The Broad Institute, Inc. | Method for extracting nuclei or whole cells from formalin-fixed paraffin-embedded tissues |
CN113272449B (zh) | 2018-10-26 | 2024-03-12 | Illumina公司 | 调整聚合物小珠以进行dna处理 |
BR112021006183A2 (pt) | 2018-11-30 | 2021-06-29 | Illumina, Inc. | análise de múltiplos analitos com o uso de um único ensaio |
US11459607B1 (en) | 2018-12-10 | 2022-10-04 | 10X Genomics, Inc. | Systems and methods for processing-nucleic acid molecules from a single cell using sequential co-partitioning and composite barcodes |
WO2020123319A2 (en) | 2018-12-10 | 2020-06-18 | 10X Genomics, Inc. | Methods of using master / copy arrays for spatial detection |
KR20210104650A (ko) * | 2018-12-17 | 2021-08-25 | 일루미나, 인코포레이티드 | 서열분석용 라이브러리를 제작하기 위한 방법 및 수단 |
US11657897B2 (en) | 2018-12-31 | 2023-05-23 | Nvidia Corporation | Denoising ATAC-seq data with deep learning |
US11649485B2 (en) | 2019-01-06 | 2023-05-16 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
US11926867B2 (en) | 2019-01-06 | 2024-03-12 | 10X Genomics, Inc. | Generating capture probes for spatial analysis |
WO2020142779A1 (en) | 2019-01-06 | 2020-07-09 | 10X Genomics, Inc. | Methods and systems for enrichment of barcodes |
US11845983B1 (en) | 2019-01-09 | 2023-12-19 | 10X Genomics, Inc. | Methods and systems for multiplexing of droplet based assays |
US20220119871A1 (en) | 2019-01-28 | 2022-04-21 | The Broad Institute, Inc. | In-situ spatial transcriptomics |
AU2020216438A1 (en) | 2019-01-31 | 2021-07-29 | Guardant Health, Inc. | Compositions and methods for isolating cell-free DNA |
JP2022521708A (ja) * | 2019-02-11 | 2022-04-12 | エピサイファー,インコーポレイテッド | ロングリードシーケンシングを使用するクロマチンマッピングアッセイおよびキット |
SG11202108788TA (en) | 2019-02-12 | 2021-09-29 | 10X Genomics Inc | Methods for processing nucleic acid molecules |
US11851683B1 (en) | 2019-02-12 | 2023-12-26 | 10X Genomics, Inc. | Methods and systems for selective analysis of cellular samples |
US11467153B2 (en) | 2019-02-12 | 2022-10-11 | 10X Genomics, Inc. | Methods for processing nucleic acid molecules |
US11655499B1 (en) | 2019-02-25 | 2023-05-23 | 10X Genomics, Inc. | Detection of sequence elements in nucleic acid molecules |
CA3113841A1 (en) | 2019-03-01 | 2020-09-10 | Illumina, Inc. | High-throughput single-nuclei and single-cell libraries and methods of making and of using |
WO2020185791A1 (en) | 2019-03-11 | 2020-09-17 | 10X Genomics, Inc. | Systems and methods for processing optically tagged beads |
WO2020186101A1 (en) | 2019-03-12 | 2020-09-17 | The Broad Institute, Inc. | Detection means, compositions and methods for modulating synovial sarcoma cells |
WO2020186235A1 (en) | 2019-03-14 | 2020-09-17 | The Broad Institute, Inc. | Compositions and methods for modulating cgrp signaling to regulate intestinal innate lymphoid cells |
US20220152148A1 (en) | 2019-03-18 | 2022-05-19 | The Broad Institute, Inc. | Modulation of type 2 immunity by targeting clec-2 signaling |
EP3942023A1 (en) | 2019-03-18 | 2022-01-26 | The Broad Institute, Inc. | Compositions and methods for modulating metabolic regulators of t cell pathogenicity |
CN111755071B (zh) * | 2019-03-29 | 2023-04-21 | 中国科学技术大学 | 基于峰聚类的单细胞染色质可及性测序数据分析方法和系统 |
WO2020205807A1 (en) * | 2019-03-29 | 2020-10-08 | The Board Of Trustees Of The Leland Stanford Junior University | Methods of treatments based upon anthracycline responsiveness |
WO2020204297A1 (ko) * | 2019-04-05 | 2020-10-08 | 한국과학기술원 | 개인의 전이효소-접근가능한 염색질 시퀀싱 정보를 이용한 암 진단 마커 및 이의 용도 |
KR102192455B1 (ko) * | 2019-04-05 | 2020-12-17 | 한국과학기술원 | 개인의 전이효소-접근가능한 염색질 시퀀싱 정보를 이용한 암 진단 마커 및 이의 용도 |
US20230242989A1 (en) * | 2019-04-11 | 2023-08-03 | University Of Virginia Patent Foundation | Tagmentation to open up circles of dna and detect extrachromosomal circles of dna for diagnosis |
WO2020243579A1 (en) | 2019-05-30 | 2020-12-03 | 10X Genomics, Inc. | Methods of detecting spatial heterogeneity of a biological sample |
CN112176041A (zh) * | 2019-07-01 | 2021-01-05 | 深圳华大生命科学研究院 | 一种表观遗传修饰的检测方法、试剂和应用 |
WO2021030627A1 (en) | 2019-08-13 | 2021-02-18 | The General Hospital Corporation | Methods for predicting outcomes of checkpoint inhibition and treatment thereof |
US11793787B2 (en) | 2019-10-07 | 2023-10-24 | The Broad Institute, Inc. | Methods and compositions for enhancing anti-tumor immunity by targeting steroidogenesis |
EP4025711A2 (en) | 2019-11-08 | 2022-07-13 | 10X Genomics, Inc. | Enhancing specificity of analyte binding |
US20220356461A1 (en) | 2019-12-19 | 2022-11-10 | Illumina, Inc. | High-throughput single-cell libraries and methods of making and of using |
US20230044602A1 (en) | 2019-12-20 | 2023-02-09 | EDWARD Via COLLEGE OF OSTEOPATHIC MEDICINE | Cancer signatures, methods of generating cancer signatures, and uses thereof |
EP3891300B1 (en) | 2019-12-23 | 2023-03-29 | 10X Genomics, Inc. | Methods for spatial analysis using rna-templated ligation |
CN115038794A (zh) | 2019-12-23 | 2022-09-09 | 10X基因组学有限公司 | 在基于分区的测定中使用固定生物样品的组合物和方法 |
WO2021128034A1 (zh) * | 2019-12-25 | 2021-07-01 | 苏州绘真生物科技有限公司 | 高通量单细胞染色质可及性的测序方法 |
CN111172257A (zh) * | 2020-01-16 | 2020-05-19 | 南方科技大学 | 一种带编码的凝胶微粒及其制备方法和应用 |
US11732299B2 (en) | 2020-01-21 | 2023-08-22 | 10X Genomics, Inc. | Spatial assays with perturbed cells |
US11702693B2 (en) | 2020-01-21 | 2023-07-18 | 10X Genomics, Inc. | Methods for printing cells and generating arrays of barcoded cells |
US12076701B2 (en) | 2020-01-31 | 2024-09-03 | 10X Genomics, Inc. | Capturing oligonucleotides in spatial transcriptomics |
US11898205B2 (en) | 2020-02-03 | 2024-02-13 | 10X Genomics, Inc. | Increasing capture efficiency of spatial assays |
US12110541B2 (en) | 2020-02-03 | 2024-10-08 | 10X Genomics, Inc. | Methods for preparing high-resolution spatial arrays |
US12112833B2 (en) | 2020-02-04 | 2024-10-08 | 10X Genomics, Inc. | Systems and methods for index hopping filtering |
US11732300B2 (en) | 2020-02-05 | 2023-08-22 | 10X Genomics, Inc. | Increasing efficiency of spatial analysis in a biological sample |
US12129516B2 (en) | 2020-02-07 | 2024-10-29 | 10X Genomics, Inc. | Quantitative and automated permeabilization performance evaluation for spatial transcriptomics |
WO2021163611A1 (en) | 2020-02-13 | 2021-08-19 | 10X Genomics, Inc. | Methods for characterizing cells using gene expression and chromatin accessibility |
US11891654B2 (en) | 2020-02-24 | 2024-02-06 | 10X Genomics, Inc. | Methods of making gene expression libraries |
CN115916999A (zh) | 2020-04-22 | 2023-04-04 | 10X基因组学有限公司 | 用于使用靶向rna耗竭进行空间分析的方法 |
US11851700B1 (en) | 2020-05-13 | 2023-12-26 | 10X Genomics, Inc. | Methods, kits, and compositions for processing extracellular molecules |
WO2021236929A1 (en) | 2020-05-22 | 2021-11-25 | 10X Genomics, Inc. | Simultaneous spatio-temporal measurement of gene expression and cellular activity |
WO2021237087A1 (en) | 2020-05-22 | 2021-11-25 | 10X Genomics, Inc. | Spatial analysis to detect sequence variants |
WO2021242834A1 (en) | 2020-05-26 | 2021-12-02 | 10X Genomics, Inc. | Method for resetting an array |
US12031177B1 (en) | 2020-06-04 | 2024-07-09 | 10X Genomics, Inc. | Methods of enhancing spatial resolution of transcripts |
EP4421186A3 (en) | 2020-06-08 | 2024-09-18 | 10X Genomics, Inc. | Methods of determining a surgical margin and methods of use thereof |
EP4165207B1 (en) | 2020-06-10 | 2024-09-25 | 10X Genomics, Inc. | Methods for determining a location of an analyte in a biological sample |
EP4172362B1 (en) | 2020-06-25 | 2024-09-18 | 10X Genomics, Inc. | Spatial analysis of dna methylation |
US11761038B1 (en) | 2020-07-06 | 2023-09-19 | 10X Genomics, Inc. | Methods for identifying a location of an RNA in a biological sample |
US11981960B1 (en) | 2020-07-06 | 2024-05-14 | 10X Genomics, Inc. | Spatial analysis utilizing degradable hydrogels |
US11981958B1 (en) | 2020-08-20 | 2024-05-14 | 10X Genomics, Inc. | Methods for spatial analysis using DNA capture |
EP4215618A4 (en) * | 2020-09-16 | 2024-07-10 | Bgi Shenzhen | METHOD FOR ANALYZING CELLULAR EPIGENOMICS FROM MULTIPLE DIMENSIONS |
US11926822B1 (en) | 2020-09-23 | 2024-03-12 | 10X Genomics, Inc. | Three-dimensional spatial analysis |
US12084715B1 (en) | 2020-11-05 | 2024-09-10 | 10X Genomics, Inc. | Methods and systems for reducing artifactual antisense products |
US11827935B1 (en) | 2020-11-19 | 2023-11-28 | 10X Genomics, Inc. | Methods for spatial analysis using rolling circle amplification and detection probes |
EP4121555A1 (en) | 2020-12-21 | 2023-01-25 | 10X Genomics, Inc. | Methods, compositions, and systems for capturing probes and/or barcodes |
AU2022227563A1 (en) | 2021-02-23 | 2023-08-24 | 10X Genomics, Inc. | Probe-based analysis of nucleic acids and proteins |
EP4347879A1 (en) | 2021-06-03 | 2024-04-10 | 10X Genomics, Inc. | Methods, compositions, kits, and systems for enhancing analyte capture for spatial analysis |
WO2023034489A1 (en) | 2021-09-01 | 2023-03-09 | 10X Genomics, Inc. | Methods, compositions, and kits for blocking a capture probe on a spatial array |
CN113774136A (zh) * | 2021-09-17 | 2021-12-10 | 杭州瀚因生命科技有限公司 | 一种基因组特定区域染色质开放性定量检测方法 |
CN113774052A (zh) * | 2021-09-30 | 2021-12-10 | 首都医科大学附属北京安贞医院 | mtDNA的提取和建库试剂 |
GB202114206D0 (en) | 2021-10-04 | 2021-11-17 | Genome Res Ltd | Novel method |
EP4272764A1 (en) | 2022-05-03 | 2023-11-08 | Scipio Bioscience | Method of complexing biological units with particles |
WO2024076728A1 (en) | 2022-10-06 | 2024-04-11 | Dana-Farber Cancer Institute, Inc. | Cyclic nucleotides and uses thereof |
WO2024086673A2 (en) * | 2022-10-18 | 2024-04-25 | Moonwalk Biosciences, Inc. | Controlled reprogramming of a cell |
WO2024112806A1 (en) * | 2022-11-21 | 2024-05-30 | Moonwalk Biosciences, Inc. | Generation and use of epigenetic maps for drug discovery |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1612931A (zh) * | 2002-01-09 | 2005-05-04 | 米诺斯生物系统有限公司 | 遗传操作方法 |
WO2012106546A2 (en) * | 2011-02-02 | 2012-08-09 | University Of Washington Through Its Center For Commercialization | Massively parallel continguity mapping |
Family Cites Families (62)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5137829A (en) | 1987-10-05 | 1992-08-11 | Washington University | DNA transposon TN5SEQ1 |
US5981179A (en) | 1991-11-14 | 1999-11-09 | Digene Diagnostics, Inc. | Continuous amplification reaction |
US5840865A (en) | 1992-09-14 | 1998-11-24 | Institute Of Molecular Biology And Biotechnology/Forth | Eukaryotic transposable element |
US5604097A (en) | 1994-10-13 | 1997-02-18 | Spectragen, Inc. | Methods for sorting polynucleotides using oligonucleotide tags |
US6458530B1 (en) | 1996-04-04 | 2002-10-01 | Affymetrix Inc. | Selecting tag nucleic acids |
US5965443A (en) | 1996-09-09 | 1999-10-12 | Wisconsin Alumni Research Foundation | System for in vitro transposition |
FI103809B (fi) | 1997-07-14 | 1999-09-30 | Finnzymes Oy | In vitro -menetelmä templaattien tuottamiseksi DNA-sekventointia varten |
US5948902A (en) | 1997-11-20 | 1999-09-07 | South Alabama Medical Science Foundation | Antisense oligonucleotides to human serine/threonine protein phosphatase genes |
AU3196099A (en) | 1998-03-27 | 1999-10-18 | President And Fellows Of Harvard College | Systematic identification of essential genes by (in vitro) transposon mutagenesis |
US6022716A (en) | 1998-04-10 | 2000-02-08 | Genset Sa | High throughput DNA sequencing vector |
US6159736A (en) | 1998-09-23 | 2000-12-12 | Wisconsin Alumni Research Foundation | Method for making insertional mutations using a Tn5 synaptic complex |
US6291243B1 (en) | 1999-04-28 | 2001-09-18 | The Board Of Trustees Of The Leland Stanford Jr. University | P element derived vector and methods for its use |
WO2001030965A2 (en) | 1999-10-28 | 2001-05-03 | The Board Of Trustees Of The Leland Stanford Junior University | Methods of in vivo gene transfer using a sleeping beauty transposon system |
CA2332186A1 (en) | 2001-02-08 | 2002-08-08 | Her Majesty In Right Of Canada As Represented By The Minister Of Agricul Ture And Agri-Food Canada | Replicative in vivo gene targeting |
US7138267B1 (en) | 2001-04-04 | 2006-11-21 | Epicentre Technologies Corporation | Methods and compositions for amplifying DNA clone copy number |
EP1427746A4 (en) * | 2001-07-20 | 2005-09-28 | California Inst Of Techn | SYSTEMS FOR THE EXPRESSION OF PROTEINS AND NUCLEIC ACIDS |
KR100459870B1 (ko) | 2002-02-22 | 2004-12-04 | 한국과학기술원 | 트랜스포존과 Cre/loxP 부위 특이적 재조합 방법을 이용하는 염색체의 특정부위가 제거된 미생물 변이주 제조방법 |
US7527966B2 (en) | 2002-06-26 | 2009-05-05 | Transgenrx, Inc. | Gene regulation in transgenic animals using a transposon-based vector |
US6979713B2 (en) | 2002-11-25 | 2005-12-27 | 3M Innovative Properties Company | Curable compositions and abrasive articles therefrom |
WO2004070042A1 (en) | 2003-02-10 | 2004-08-19 | Max-Delbrück-Centrum Für Molekulare Medizin (Mdc) | Transposon-based targeting system |
GB2403475B (en) | 2003-07-01 | 2008-02-06 | Oxitec Ltd | Stable integrands |
US8071364B2 (en) | 2003-12-24 | 2011-12-06 | Transgenrx, Inc. | Gene therapy using transposon-based vectors |
US20050233340A1 (en) | 2004-04-20 | 2005-10-20 | Barrett Michael T | Methods and compositions for assessing CpG methylation |
US7608434B2 (en) | 2004-08-04 | 2009-10-27 | Wisconsin Alumni Research Foundation | Mutated Tn5 transposase proteins and the use thereof |
EP2392657B1 (en) | 2005-07-05 | 2013-09-25 | The Chemo-Sero-Therapeutic Research Institute | Modified transposon vector and its use |
GB0603251D0 (en) | 2006-02-17 | 2006-03-29 | Isis Innovation | DNA conformation |
JP5320546B2 (ja) | 2006-12-13 | 2013-10-23 | 国立大学法人名古屋大学 | Tol1因子のトランスポザーゼ及びそれを用いたDNA導入システム |
GB0810051D0 (en) | 2008-06-02 | 2008-07-09 | Oxford Biodynamics Ltd | Method of diagnosis |
US9080211B2 (en) | 2008-10-24 | 2015-07-14 | Epicentre Technologies Corporation | Transposon end compositions and methods for modifying nucleic acids |
ES2637843T3 (es) | 2008-10-24 | 2017-10-17 | Epicentre Technologies Corporation | Composiciones de extremo del transposón y métodos para modificar ácidos nucleicos |
CN102292455A (zh) * | 2008-12-02 | 2011-12-21 | 伯乐实验室公司 | 染色质结构检测 |
US8514860B2 (en) * | 2010-02-23 | 2013-08-20 | Broadcom Corporation | Systems and methods for implementing a high throughput mode for a MoCA device |
US20110306042A1 (en) | 2010-06-04 | 2011-12-15 | Bio-Rad Laboratories, Inc. | Determination of chromatin conformation |
US8829171B2 (en) | 2011-02-10 | 2014-09-09 | Illumina, Inc. | Linking sequence reads using paired code tags |
US9074251B2 (en) | 2011-02-10 | 2015-07-07 | Illumina, Inc. | Linking sequence reads using paired code tags |
ES2568910T3 (es) | 2011-01-28 | 2016-05-05 | Illumina, Inc. | Reemplazo de oligonucleótidos para bibliotecas etiquetadas en dos extremos y direccionadas |
US9005935B2 (en) | 2011-05-23 | 2015-04-14 | Agilent Technologies, Inc. | Methods and compositions for DNA fragmentation and tagging by transposases |
US9150916B2 (en) | 2011-06-24 | 2015-10-06 | Beat Christen | Compositions and methods for identifying the essential genome of an organism |
US8927218B2 (en) | 2011-06-27 | 2015-01-06 | Flir Systems, Inc. | Methods and compositions for segregating target nucleic acid from mixed nucleic acid samples |
WO2013020089A2 (en) | 2011-08-04 | 2013-02-07 | Sage Science, Inc. | Systems and methods for processing fluids |
US10689643B2 (en) | 2011-11-22 | 2020-06-23 | Active Motif, Inc. | Targeted transposition for use in epigenetic studies |
US9938524B2 (en) * | 2011-11-22 | 2018-04-10 | Active Motif, Inc. | Multiplex isolation of protein-associated nucleic acids |
NO2694769T3 (zh) | 2012-03-06 | 2018-03-03 | ||
WO2013181265A1 (en) | 2012-05-29 | 2013-12-05 | The Johns Hopkins University | Eukaryotic transposase mutants and transposon end compositions for modifying nucleic acids and methods for production and use in the generation of sequencing libraries |
WO2014047561A1 (en) | 2012-09-21 | 2014-03-27 | The Broad Institute Inc. | Compositions and methods for labeling of agents |
US9683230B2 (en) | 2013-01-09 | 2017-06-20 | Illumina Cambridge Limited | Sample preparation on a solid support |
AU2013382098B2 (en) | 2013-03-13 | 2019-02-07 | Illumina, Inc. | Methods and compositions for nucleic acid sequencing |
US10017807B2 (en) | 2013-03-15 | 2018-07-10 | Verinata Health, Inc. | Generating cell-free DNA libraries directly from blood |
US9328382B2 (en) | 2013-03-15 | 2016-05-03 | Complete Genomics, Inc. | Multiple tagging of individual long DNA fragments |
EP2999784B2 (en) | 2013-05-22 | 2022-11-23 | Active Motif, Inc. | Targeted transposition for use in epigenetic studies |
CN111394426B (zh) * | 2013-05-23 | 2024-05-10 | 斯坦福大学托管董事会 | 用于个人表观基因组学的至天然染色质的转座 |
US20160122753A1 (en) | 2013-06-12 | 2016-05-05 | Tarjei Mikkelsen | High-throughput rna-seq |
US20160208323A1 (en) | 2013-06-21 | 2016-07-21 | The Broad Institute, Inc. | Methods for Shearing and Tagging DNA for Chromatin Immunoprecipitation and Sequencing |
WO2015006700A1 (en) | 2013-07-12 | 2015-01-15 | University Of South Alabama | Minimal piggybac vectors for genome integration |
CN106103713B (zh) | 2014-02-03 | 2021-05-28 | 赛默飞世尔科技波罗的海封闭股份公司 | 用于经控制dna片段化的方法 |
JP6996844B2 (ja) | 2014-02-27 | 2022-02-03 | ジャンプコード ゲノミクス,インク. | 体細胞可動要素の分析のための方法、およびその使用 |
WO2015179706A1 (en) | 2014-05-23 | 2015-11-26 | Fluidigm Corporation | Haploidome determination by digitized transposons |
US10017759B2 (en) | 2014-06-26 | 2018-07-10 | Illumina, Inc. | Library preparation of tagged nucleic acid |
US20180087050A1 (en) | 2015-05-27 | 2018-03-29 | Jianbiao Zheng | Methods of inserting molecular barcodes |
CN108377651A (zh) | 2015-06-24 | 2018-08-07 | 牛津生物动力有限公司 | 染色体互相作用的检测 |
CN108026575B (zh) | 2015-07-17 | 2022-08-19 | 哈佛学院董事及会员团体 | 扩增核酸序列的方法 |
HUE047175T2 (hu) | 2015-08-12 | 2020-04-28 | Cemm Forschungszentrum Fuer Molekulare Medizin Gmbh | Eljárások nukleinsavak tanulmányozására |
-
2014
- 2014-05-20 CN CN202010205546.6A patent/CN111394426B/zh active Active
- 2014-05-20 SG SG11201508985VA patent/SG11201508985VA/en unknown
- 2014-05-20 EP EP23205275.3A patent/EP4321628A3/en active Pending
- 2014-05-20 WO PCT/US2014/038825 patent/WO2014189957A2/en active Application Filing
- 2014-05-20 EP EP20201615.0A patent/EP3828285B1/en active Active
- 2014-05-20 EP EP18190196.8A patent/EP3470530B1/en active Active
- 2014-05-20 AU AU2014268710A patent/AU2014268710B2/en active Active
- 2014-05-20 JP JP2016515024A patent/JP6618894B2/ja active Active
- 2014-05-20 CA CA2909972A patent/CA2909972A1/en active Pending
- 2014-05-20 US US14/784,250 patent/US10059989B2/en active Active
- 2014-05-20 CN CN201480028601.1A patent/CN105339503B/zh active Active
- 2014-05-20 EP EP14800805.5A patent/EP2999792B1/en active Active
-
2016
- 2016-09-02 HK HK16110500.4A patent/HK1222416A1/zh unknown
-
2018
- 2018-07-24 US US16/044,374 patent/US20180327838A1/en not_active Abandoned
- 2018-07-24 US US16/043,874 patent/US10150995B1/en active Active
- 2018-10-15 US US16/160,719 patent/US10337062B2/en active Active
- 2018-10-15 US US16/160,576 patent/US20190040464A1/en not_active Abandoned
-
2019
- 2019-01-17 AU AU2019200289A patent/AU2019200289B2/en active Active
- 2019-05-21 US US16/418,889 patent/US10619207B2/en active Active
- 2019-05-21 US US16/418,796 patent/US10738357B2/en active Active
- 2019-11-13 JP JP2019205184A patent/JP6977014B2/ja active Active
-
2020
- 2020-07-01 US US16/918,924 patent/US10889859B2/en active Active
- 2020-12-07 US US17/114,278 patent/US20210285045A1/en active Pending
-
2021
- 2021-09-10 AU AU2021229232A patent/AU2021229232B2/en active Active
- 2021-11-10 JP JP2021183126A patent/JP7504854B2/ja active Active
-
2022
- 2022-06-06 US US17/833,686 patent/US11597974B2/en active Active
- 2022-06-06 US US17/833,702 patent/US11519032B1/en active Active
-
2023
- 2023-03-07 US US18/179,532 patent/US20230348971A1/en active Pending
-
2024
- 2024-05-01 AU AU2024202865A patent/AU2024202865A1/en active Pending
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1612931A (zh) * | 2002-01-09 | 2005-05-04 | 米诺斯生物系统有限公司 | 遗传操作方法 |
WO2012106546A2 (en) * | 2011-02-02 | 2012-08-09 | University Of Washington Through Its Center For Commercialization | Massively parallel continguity mapping |
Non-Patent Citations (1)
Title |
---|
黄春等.转座子及其相关技术的研究.世界华人消化杂志.2006,(第17期),第1714-1720页. * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP7504854B2 (ja) | 個別的エピゲノミクスのための天然クロマチンへの転移 | |
JP2023153898A (ja) | 核酸の検知 | |
AU2022275409A1 (en) | Systems and methods for identifying and distinguishing genetic samples | |
De Michino et al. | Simulating cell-free chromatin using preclinical models for cancer-specific biomarker discovery |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |