CN116497102A - 用于表征目标多核苷酸的衔接体、方法及其用途 - Google Patents
用于表征目标多核苷酸的衔接体、方法及其用途 Download PDFInfo
- Publication number
- CN116497102A CN116497102A CN202211624612.9A CN202211624612A CN116497102A CN 116497102 A CN116497102 A CN 116497102A CN 202211624612 A CN202211624612 A CN 202211624612A CN 116497102 A CN116497102 A CN 116497102A
- Authority
- CN
- China
- Prior art keywords
- polynucleotide
- helicase
- target
- rna
- dna
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 102000040430 polynucleotide Human genes 0.000 title claims abstract description 212
- 108091033319 polynucleotide Proteins 0.000 title claims abstract description 212
- 239000002157 polynucleotide Substances 0.000 title claims abstract description 212
- 238000000034 method Methods 0.000 title claims abstract description 89
- 239000011148 porous material Substances 0.000 claims abstract description 57
- 230000027455 binding Effects 0.000 claims abstract description 34
- 108090000133 DNA helicases Proteins 0.000 claims abstract description 32
- 102000003844 DNA helicases Human genes 0.000 claims abstract description 32
- 108060004795 Methyltransferase Proteins 0.000 claims description 115
- 230000000903 blocking effect Effects 0.000 claims description 40
- 125000003729 nucleotide group Chemical group 0.000 claims description 28
- 239000002773 nucleotide Substances 0.000 claims description 26
- 108090000623 proteins and genes Proteins 0.000 claims description 16
- 238000005259 measurement Methods 0.000 claims description 12
- 230000004048 modification Effects 0.000 claims description 12
- 238000012986 modification Methods 0.000 claims description 12
- 101000899334 Homo sapiens Helicase POLQ-like Proteins 0.000 claims description 11
- 239000012528 membrane Substances 0.000 claims description 11
- 102000004169 proteins and genes Human genes 0.000 claims description 11
- 239000000126 substance Substances 0.000 claims description 10
- 235000000346 sugar Nutrition 0.000 claims description 8
- 230000002255 enzymatic effect Effects 0.000 claims description 5
- 230000011987 methylation Effects 0.000 claims description 5
- 238000007069 methylation reaction Methods 0.000 claims description 5
- 102100022536 Helicase POLQ-like Human genes 0.000 claims description 4
- 241000187480 Mycobacterium smegmatis Species 0.000 claims description 4
- 241000588653 Neisseria Species 0.000 claims description 4
- 101710203389 Outer membrane porin F Proteins 0.000 claims description 4
- 101710203388 Outer membrane porin G Proteins 0.000 claims description 4
- 230000006378 damage Effects 0.000 claims description 4
- 238000011068 loading method Methods 0.000 claims description 4
- 230000003287 optical effect Effects 0.000 claims description 3
- 230000003647 oxidation Effects 0.000 claims description 3
- 238000007254 oxidation reaction Methods 0.000 claims description 3
- 102000035160 transmembrane proteins Human genes 0.000 claims description 3
- 108091005703 transmembrane proteins Proteins 0.000 claims description 3
- KDXKERNSBIXSRK-YFKPBYRVSA-N L-lysine Chemical compound NCCCC[C@H](N)C(O)=O KDXKERNSBIXSRK-YFKPBYRVSA-N 0.000 claims description 2
- 102000004895 Lipoproteins Human genes 0.000 claims description 2
- 108090001030 Lipoproteins Proteins 0.000 claims description 2
- 101710126949 Lysin Proteins 0.000 claims description 2
- KDXKERNSBIXSRK-UHFFFAOYSA-N Lysine Natural products NCCCCC(N)C(O)=O KDXKERNSBIXSRK-UHFFFAOYSA-N 0.000 claims description 2
- 101100024453 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) mspB gene Proteins 0.000 claims description 2
- 101100458286 Mycolicibacterium smegmatis (strain ATCC 700084 / mc(2)155) mspD gene Proteins 0.000 claims description 2
- 108010013381 Porins Proteins 0.000 claims description 2
- 101150099331 csgG gene Proteins 0.000 claims description 2
- 239000003228 hemolysin Substances 0.000 claims description 2
- 230000003489 leucocidal effect Effects 0.000 claims description 2
- 101150065599 mspC gene Proteins 0.000 claims description 2
- 108010014203 outer membrane phospholipase A Proteins 0.000 claims description 2
- 102000007739 porin activity proteins Human genes 0.000 claims description 2
- 239000007787 solid Substances 0.000 claims description 2
- 238000012163 sequencing technique Methods 0.000 abstract description 20
- 238000003559 RNA-seq method Methods 0.000 abstract description 9
- 238000011161 development Methods 0.000 abstract description 3
- 229920002477 rna polymer Polymers 0.000 description 144
- 108020004414 DNA Proteins 0.000 description 33
- 102000053602 DNA Human genes 0.000 description 33
- 125000002652 ribonucleotide group Chemical group 0.000 description 23
- 108091028664 Ribonucleotide Proteins 0.000 description 19
- 239000002679 microRNA Substances 0.000 description 19
- 239000002336 ribonucleotide Substances 0.000 description 19
- 239000000523 sample Substances 0.000 description 16
- 102000004190 Enzymes Human genes 0.000 description 14
- 108090000790 Enzymes Proteins 0.000 description 14
- FAPWRFPIFSIZLT-UHFFFAOYSA-M Sodium chloride Chemical compound [Na+].[Cl-] FAPWRFPIFSIZLT-UHFFFAOYSA-M 0.000 description 14
- 108091070501 miRNA Proteins 0.000 description 14
- 239000002585 base Substances 0.000 description 12
- 239000000872 buffer Substances 0.000 description 12
- 229920001223 polyethylene glycol Polymers 0.000 description 12
- 239000002202 Polyethylene glycol Substances 0.000 description 11
- -1 alkali metal salt Chemical class 0.000 description 11
- 108020004999 messenger RNA Proteins 0.000 description 11
- 230000008569 process Effects 0.000 description 11
- 229920003192 poly(bis maleimide) Polymers 0.000 description 10
- 108700011259 MicroRNAs Proteins 0.000 description 9
- 125000003636 chemical group Chemical group 0.000 description 9
- 230000006870 function Effects 0.000 description 9
- GYOZYWVXFNDGLU-XLPZGREQSA-N dTMP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 GYOZYWVXFNDGLU-XLPZGREQSA-N 0.000 description 8
- 235000018102 proteins Nutrition 0.000 description 8
- 150000003839 salts Chemical class 0.000 description 8
- XQUPVDVFXZDTLT-UHFFFAOYSA-N 1-[4-[[4-(2,5-dioxopyrrol-1-yl)phenyl]methyl]phenyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C(C=C1)=CC=C1CC1=CC=C(N2C(C=CC2=O)=O)C=C1 XQUPVDVFXZDTLT-UHFFFAOYSA-N 0.000 description 7
- 208000035657 Abasia Diseases 0.000 description 7
- 206010028980 Neoplasm Diseases 0.000 description 7
- 239000004055 small Interfering RNA Substances 0.000 description 7
- 239000011780 sodium chloride Substances 0.000 description 7
- YBJHBAHKTGYVGT-ZKWXMUAHSA-N (+)-Biotin Chemical compound N1C(=O)N[C@@H]2[C@H](CCCCC(=O)O)SC[C@@H]21 YBJHBAHKTGYVGT-ZKWXMUAHSA-N 0.000 description 6
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 6
- DJJCXFVJDGTHFX-UHFFFAOYSA-N Uridinemonophosphate Natural products OC1C(O)C(COP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-UHFFFAOYSA-N 0.000 description 6
- 238000012512 characterization method Methods 0.000 description 6
- 239000003153 chemical reaction reagent Substances 0.000 description 6
- IERHLVCPSMICTF-XVFCMESISA-N cytidine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 IERHLVCPSMICTF-XVFCMESISA-N 0.000 description 6
- IERHLVCPSMICTF-UHFFFAOYSA-N cytidine monophosphate Natural products O=C1N=C(N)C=CN1C1C(O)C(O)C(COP(O)(O)=O)O1 IERHLVCPSMICTF-UHFFFAOYSA-N 0.000 description 6
- RQFCJASXJCIDSX-UUOKFMHZSA-N guanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O RQFCJASXJCIDSX-UUOKFMHZSA-N 0.000 description 6
- 235000013928 guanylic acid Nutrition 0.000 description 6
- DJJCXFVJDGTHFX-XVFCMESISA-N uridine 5'-monophosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 DJJCXFVJDGTHFX-XVFCMESISA-N 0.000 description 6
- WCUXLLCKKVVCTQ-UHFFFAOYSA-M Potassium chloride Chemical compound [Cl-].[K+] WCUXLLCKKVVCTQ-UHFFFAOYSA-M 0.000 description 5
- 230000004888 barrier function Effects 0.000 description 5
- 229960002685 biotin Drugs 0.000 description 5
- 239000011616 biotin Substances 0.000 description 5
- 230000008859 change Effects 0.000 description 5
- 238000006243 chemical reaction Methods 0.000 description 5
- 238000001514 detection method Methods 0.000 description 5
- 229920000642 polymer Polymers 0.000 description 5
- 108090000765 processed proteins & peptides Proteins 0.000 description 5
- 108091032973 (ribonucleotides)n+m Proteins 0.000 description 4
- 102000040650 (ribonucleotides)n+m Human genes 0.000 description 4
- ZKHQWZAMYRWXGA-KQYNXXCUSA-J ATP(4-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)[C@H]1O ZKHQWZAMYRWXGA-KQYNXXCUSA-J 0.000 description 4
- ZKHQWZAMYRWXGA-UHFFFAOYSA-N Adenosine triphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)C(O)C1O ZKHQWZAMYRWXGA-UHFFFAOYSA-N 0.000 description 4
- UDMBCSSLTHHNCD-KQYNXXCUSA-N adenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)[C@H]1O UDMBCSSLTHHNCD-KQYNXXCUSA-N 0.000 description 4
- 239000012472 biological sample Substances 0.000 description 4
- 239000002800 charge carrier Substances 0.000 description 4
- OPTASPLRGRRNAP-UHFFFAOYSA-N cytosine Chemical compound NC=1C=CNC(=O)N=1 OPTASPLRGRRNAP-UHFFFAOYSA-N 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 238000007672 fourth generation sequencing Methods 0.000 description 4
- 239000000499 gel Substances 0.000 description 4
- 230000003993 interaction Effects 0.000 description 4
- 239000000178 monomer Substances 0.000 description 4
- 102000039446 nucleic acids Human genes 0.000 description 4
- 108020004707 nucleic acids Proteins 0.000 description 4
- 150000007523 nucleic acids Chemical class 0.000 description 4
- 229920001184 polypeptide Polymers 0.000 description 4
- 102000004196 processed proteins & peptides Human genes 0.000 description 4
- 239000000047 product Substances 0.000 description 4
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 4
- JKMHFZQWWAIEOD-UHFFFAOYSA-N 2-[4-(2-hydroxyethyl)piperazin-1-yl]ethanesulfonic acid Chemical compound OCC[NH+]1CCN(CCS([O-])(=O)=O)CC1 JKMHFZQWWAIEOD-UHFFFAOYSA-N 0.000 description 3
- 239000004971 Cross linker Substances 0.000 description 3
- 239000007995 HEPES buffer Substances 0.000 description 3
- 108091028043 Nucleic acid sequence Proteins 0.000 description 3
- 108091093037 Peptide nucleic acid Proteins 0.000 description 3
- 108020004459 Small interfering RNA Proteins 0.000 description 3
- ISAKRJDGNUQOIC-UHFFFAOYSA-N Uracil Chemical class O=C1C=CNC(=O)N1 ISAKRJDGNUQOIC-UHFFFAOYSA-N 0.000 description 3
- 150000001345 alkine derivatives Chemical class 0.000 description 3
- 150000001413 amino acids Chemical class 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 3
- 238000000137 annealing Methods 0.000 description 3
- 239000007864 aqueous solution Substances 0.000 description 3
- 230000008901 benefit Effects 0.000 description 3
- 235000020958 biotin Nutrition 0.000 description 3
- 210000004027 cell Anatomy 0.000 description 3
- 230000000295 complement effect Effects 0.000 description 3
- 239000010949 copper Substances 0.000 description 3
- 239000003431 cross linking reagent Substances 0.000 description 3
- MTHSVFCYNBDYFN-UHFFFAOYSA-N diethylene glycol Chemical compound OCCOCCO MTHSVFCYNBDYFN-UHFFFAOYSA-N 0.000 description 3
- 239000000539 dimer Substances 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 238000000338 in vitro Methods 0.000 description 3
- 229910052751 metal Inorganic materials 0.000 description 3
- 239000002184 metal Substances 0.000 description 3
- 239000000203 mixture Substances 0.000 description 3
- VLKZOEOYAKHREP-UHFFFAOYSA-N n-Hexane Chemical compound CCCCCC VLKZOEOYAKHREP-UHFFFAOYSA-N 0.000 description 3
- 238000003752 polymerase chain reaction Methods 0.000 description 3
- 238000002360 preparation method Methods 0.000 description 3
- 238000000746 purification Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- WHEOHCIKAJUSJC-UHFFFAOYSA-N 1-[2-[bis[2-(2,5-dioxopyrrol-1-yl)ethyl]amino]ethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1CCN(CCN1C(C=CC1=O)=O)CCN1C(=O)C=CC1=O WHEOHCIKAJUSJC-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-KQYNXXCUSA-N 5'-adenylphosphoric acid Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XTWYTFMLZFPYCI-KQYNXXCUSA-N 0.000 description 2
- NFEXJLMYXXIWPI-JXOAFFINSA-N 5-Hydroxymethylcytidine Chemical class C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 NFEXJLMYXXIWPI-JXOAFFINSA-N 0.000 description 2
- ZAYHVCMSTBRABG-JXOAFFINSA-N 5-methylcytidine Chemical class O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](CO)O1 ZAYHVCMSTBRABG-JXOAFFINSA-N 0.000 description 2
- KDCGOANMDULRCW-UHFFFAOYSA-N 7H-purine Chemical compound N1=CNC2=NC=NC2=C1 KDCGOANMDULRCW-UHFFFAOYSA-N 0.000 description 2
- XTWYTFMLZFPYCI-UHFFFAOYSA-N Adenosine diphosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O XTWYTFMLZFPYCI-UHFFFAOYSA-N 0.000 description 2
- 108020005544 Antisense RNA Proteins 0.000 description 2
- 235000014698 Brassica juncea var multisecta Nutrition 0.000 description 2
- 235000006008 Brassica napus var napus Nutrition 0.000 description 2
- 240000000385 Brassica napus var. napus Species 0.000 description 2
- 235000006618 Brassica rapa subsp oleifera Nutrition 0.000 description 2
- 235000004977 Brassica sinapistrum Nutrition 0.000 description 2
- ZWIADYZPOWUWEW-XVFCMESISA-N CDP Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 ZWIADYZPOWUWEW-XVFCMESISA-N 0.000 description 2
- 239000008000 CHES buffer Substances 0.000 description 2
- UDMBCSSLTHHNCD-UHFFFAOYSA-N Coenzym Q(11) Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(COP(O)(O)=O)C(O)C1O UDMBCSSLTHHNCD-UHFFFAOYSA-N 0.000 description 2
- RYGMFSIKBFXOCR-UHFFFAOYSA-N Copper Chemical compound [Cu] RYGMFSIKBFXOCR-UHFFFAOYSA-N 0.000 description 2
- IVOMOUWHDPKRLL-KQYNXXCUSA-N Cyclic adenosine monophosphate Chemical compound C([C@H]1O2)OP(O)(=O)O[C@H]1[C@@H](O)[C@@H]2N1C(N=CN=C2N)=C2N=C1 IVOMOUWHDPKRLL-KQYNXXCUSA-N 0.000 description 2
- PCDQPRRSZKQHHS-CCXZUQQUSA-N Cytarabine Triphosphate Chemical compound O=C1N=C(N)C=CN1[C@H]1[C@@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 PCDQPRRSZKQHHS-CCXZUQQUSA-N 0.000 description 2
- 101150077975 DDT gene Proteins 0.000 description 2
- 241000196324 Embryophyta Species 0.000 description 2
- LYCAIKOWRPUZTN-UHFFFAOYSA-N Ethylene glycol Chemical compound OCCO LYCAIKOWRPUZTN-UHFFFAOYSA-N 0.000 description 2
- QGWNDRXFNXRZMB-UUOKFMHZSA-N GDP Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O QGWNDRXFNXRZMB-UUOKFMHZSA-N 0.000 description 2
- 108091093094 Glycol nucleic acid Proteins 0.000 description 2
- XKMLYUALXHKNFT-UUOKFMHZSA-N Guanosine-5'-triphosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)[C@@H](O)[C@H]1O XKMLYUALXHKNFT-UUOKFMHZSA-N 0.000 description 2
- 108020005004 Guide RNA Proteins 0.000 description 2
- OAKJQQAXSVQMHS-UHFFFAOYSA-N Hydrazine Chemical compound NN OAKJQQAXSVQMHS-UHFFFAOYSA-N 0.000 description 2
- PEEHTFAAVSWFBL-UHFFFAOYSA-N Maleimide Chemical compound O=C1NC(=O)C=C1 PEEHTFAAVSWFBL-UHFFFAOYSA-N 0.000 description 2
- 241001465754 Metazoa Species 0.000 description 2
- 244000046052 Phaseolus vulgaris Species 0.000 description 2
- 235000010627 Phaseolus vulgaris Nutrition 0.000 description 2
- 108091007412 Piwi-interacting RNA Proteins 0.000 description 2
- CZPWVGJYEJSRLH-UHFFFAOYSA-N Pyrimidine Chemical compound C1=CN=CN=C1 CZPWVGJYEJSRLH-UHFFFAOYSA-N 0.000 description 2
- 108091093078 Pyrimidine dimer Proteins 0.000 description 2
- RZCIEJXAILMSQK-JXOAFFINSA-N TTP Chemical compound O=C1NC(=O)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 RZCIEJXAILMSQK-JXOAFFINSA-N 0.000 description 2
- 108091046869 Telomeric non-coding RNA Proteins 0.000 description 2
- 108091046915 Threose nucleic acid Proteins 0.000 description 2
- 108020004566 Transfer RNA Proteins 0.000 description 2
- 108091032917 Transfer-messenger RNA Proteins 0.000 description 2
- XCCTYIAWTASOJW-XVFCMESISA-N Uridine-5'-Diphosphate Chemical compound O[C@@H]1[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O[C@H]1N1C(=O)NC(=O)C=C1 XCCTYIAWTASOJW-XVFCMESISA-N 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- LNQVTSROQXJCDD-UHFFFAOYSA-N adenosine monophosphate Natural products C1=NC=2C(N)=NC=NC=2N1C1OC(CO)C(OP(O)(O)=O)C1O LNQVTSROQXJCDD-UHFFFAOYSA-N 0.000 description 2
- 239000012491 analyte Substances 0.000 description 2
- 150000001540 azides Chemical class 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 239000006227 byproduct Substances 0.000 description 2
- AIYUHDOJVYHVIT-UHFFFAOYSA-M caesium chloride Chemical compound [Cl-].[Cs+] AIYUHDOJVYHVIT-UHFFFAOYSA-M 0.000 description 2
- 150000001768 cations Chemical class 0.000 description 2
- 150000003841 chloride salts Chemical class 0.000 description 2
- HVYWMOMLDIMFJA-DPAQBDIFSA-N cholesterol Chemical compound C1C=C2C[C@@H](O)CC[C@]2(C)[C@@H]2[C@@H]1[C@@H]1CC[C@H]([C@H](C)CCCC(C)C)[C@@]1(C)CC2 HVYWMOMLDIMFJA-DPAQBDIFSA-N 0.000 description 2
- 238000004587 chromatography analysis Methods 0.000 description 2
- 239000003184 complementary RNA Substances 0.000 description 2
- 229910052802 copper Inorganic materials 0.000 description 2
- ZOOGRGPOEVQQDX-KHLHZJAASA-N cyclic guanosine monophosphate Chemical compound C([C@H]1O2)O[P@](O)(=O)O[C@@H]1[C@H](O)[C@H]2N1C(N=C(NC2=O)N)=C2N=C1 ZOOGRGPOEVQQDX-KHLHZJAASA-N 0.000 description 2
- 229940104302 cytosine Drugs 0.000 description 2
- DAEAPNUQQAICNR-RRKCRQDMSA-K dADP(3-) Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP([O-])(=O)OP([O-])([O-])=O)O1 DAEAPNUQQAICNR-RRKCRQDMSA-K 0.000 description 2
- UJLXYODCHAELLY-XLPZGREQSA-N dTDP Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C1 UJLXYODCHAELLY-XLPZGREQSA-N 0.000 description 2
- 101150102279 ddc gene Proteins 0.000 description 2
- 230000018109 developmental process Effects 0.000 description 2
- 229960000648 digitoxin Drugs 0.000 description 2
- 238000012172 direct RNA sequencing Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 210000003527 eukaryotic cell Anatomy 0.000 description 2
- 239000012530 fluid Substances 0.000 description 2
- 239000012634 fragment Substances 0.000 description 2
- QGWNDRXFNXRZMB-UHFFFAOYSA-N guanidine diphosphate Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1OC(COP(O)(=O)OP(O)(O)=O)C(O)C1O QGWNDRXFNXRZMB-UHFFFAOYSA-N 0.000 description 2
- UYTPUPDQBNUYGX-UHFFFAOYSA-N guanine Chemical compound O=C1NC(N)=NC2=C1N=CN2 UYTPUPDQBNUYGX-UHFFFAOYSA-N 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- ACCCMOQWYVYDOT-UHFFFAOYSA-N hexane-1,1-diol Chemical group CCCCCC(O)O ACCCMOQWYVYDOT-UHFFFAOYSA-N 0.000 description 2
- 238000009396 hybridization Methods 0.000 description 2
- 238000011534 incubation Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 244000005700 microbiome Species 0.000 description 2
- 125000002467 phosphate group Chemical group [H]OP(=O)(O[H])O[*] 0.000 description 2
- 210000002381 plasma Anatomy 0.000 description 2
- 239000001103 potassium chloride Substances 0.000 description 2
- 235000011164 potassium chloride Nutrition 0.000 description 2
- 239000000276 potassium ferrocyanide Substances 0.000 description 2
- 239000013635 pyrimidine dimer Substances 0.000 description 2
- 238000003757 reverse transcription PCR Methods 0.000 description 2
- 108020004418 ribosomal RNA Proteins 0.000 description 2
- 210000002966 serum Anatomy 0.000 description 2
- 239000000243 solution Substances 0.000 description 2
- 239000002904 solvent Substances 0.000 description 2
- 238000006467 substitution reaction Methods 0.000 description 2
- XOGGUFAVLNCTRS-UHFFFAOYSA-N tetrapotassium;iron(2+);hexacyanide Chemical compound [K+].[K+].[K+].[K+].[Fe+2].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-].N#[C-] XOGGUFAVLNCTRS-UHFFFAOYSA-N 0.000 description 2
- RWQNBRDOKXIBIV-UHFFFAOYSA-N thymine Chemical compound CC1=CNC(=O)NC1=O RWQNBRDOKXIBIV-UHFFFAOYSA-N 0.000 description 2
- 230000005945 translocation Effects 0.000 description 2
- VLSDXINSOMDCBK-BQYQJAHWSA-N (E)-1,1'-azobis(N,N-dimethylformamide) Chemical compound CN(C)C(=O)\N=N\C(=O)N(C)C VLSDXINSOMDCBK-BQYQJAHWSA-N 0.000 description 1
- RVRLFABOQXZUJX-UHFFFAOYSA-N 1-[1-(2,5-dioxopyrrol-1-yl)ethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1C(C)N1C(=O)C=CC1=O RVRLFABOQXZUJX-UHFFFAOYSA-N 0.000 description 1
- SGVWDRVQIYUSRA-UHFFFAOYSA-N 1-[2-[2-(2,5-dioxopyrrol-1-yl)ethyldisulfanyl]ethyl]pyrrole-2,5-dione Chemical compound O=C1C=CC(=O)N1CCSSCCN1C(=O)C=CC1=O SGVWDRVQIYUSRA-UHFFFAOYSA-N 0.000 description 1
- BMQZYMYBQZGEEY-UHFFFAOYSA-M 1-ethyl-3-methylimidazolium chloride Chemical compound [Cl-].CCN1C=C[N+](C)=C1 BMQZYMYBQZGEEY-UHFFFAOYSA-M 0.000 description 1
- HWPZZUQOWRWFDB-UHFFFAOYSA-N 1-methylcytosine Chemical compound CN1C=CC(N)=NC1=O HWPZZUQOWRWFDB-UHFFFAOYSA-N 0.000 description 1
- KHWCHTKSEGGWEX-RRKCRQDMSA-N 2'-deoxyadenosine 5'-monophosphate Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 KHWCHTKSEGGWEX-RRKCRQDMSA-N 0.000 description 1
- NCMVOABPESMRCP-SHYZEUOFSA-N 2'-deoxycytosine 5'-monophosphate Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP(O)(O)=O)[C@@H](O)C1 NCMVOABPESMRCP-SHYZEUOFSA-N 0.000 description 1
- LTFMZDNNPPEQNG-KVQBGUIXSA-N 2'-deoxyguanosine 5'-monophosphate Chemical compound C1=2NC(N)=NC(=O)C=2N=CN1[C@H]1C[C@H](O)[C@@H](COP(O)(O)=O)O1 LTFMZDNNPPEQNG-KVQBGUIXSA-N 0.000 description 1
- UFBJCMHMOXMLKC-UHFFFAOYSA-N 2,4-dinitrophenol Chemical compound OC1=CC=C([N+]([O-])=O)C=C1[N+]([O-])=O UFBJCMHMOXMLKC-UHFFFAOYSA-N 0.000 description 1
- 125000001917 2,4-dinitrophenyl group Chemical group [H]C1=C([H])C(=C([H])C(=C1*)[N+]([O-])=O)[N+]([O-])=O 0.000 description 1
- QRZUPJILJVGUFF-UHFFFAOYSA-N 2,8-dibenzylcyclooctan-1-one Chemical compound C1CCCCC(CC=2C=CC=CC=2)C(=O)C1CC1=CC=CC=C1 QRZUPJILJVGUFF-UHFFFAOYSA-N 0.000 description 1
- KXSKAZFMTGADIV-UHFFFAOYSA-N 2-[3-(2-hydroxyethoxy)propoxy]ethanol Chemical compound OCCOCCCOCCO KXSKAZFMTGADIV-UHFFFAOYSA-N 0.000 description 1
- QKNYBSVHEMOAJP-UHFFFAOYSA-N 2-amino-2-(hydroxymethyl)propane-1,3-diol;hydron;chloride Chemical compound Cl.OCC(N)(CO)CO QKNYBSVHEMOAJP-UHFFFAOYSA-N 0.000 description 1
- MWBWWFOAEOYUST-UHFFFAOYSA-N 2-aminopurine Chemical compound NC1=NC=C2N=CNC2=N1 MWBWWFOAEOYUST-UHFFFAOYSA-N 0.000 description 1
- 150000005019 2-aminopurines Chemical class 0.000 description 1
- MPNXSZJPSVBLHP-UHFFFAOYSA-N 2-chloro-n-phenylpyridine-3-carboxamide Chemical compound ClC1=NC=CC=C1C(=O)NC1=CC=CC=C1 MPNXSZJPSVBLHP-UHFFFAOYSA-N 0.000 description 1
- HCGYMSSYSAKGPK-UHFFFAOYSA-N 2-nitro-1h-indole Chemical class C1=CC=C2NC([N+](=O)[O-])=CC2=C1 HCGYMSSYSAKGPK-UHFFFAOYSA-N 0.000 description 1
- HKVRRPIGVZKBQT-UHFFFAOYSA-N 3,3-diphenylcyclooctyne Chemical group C1CCCCC#CC1(C=1C=CC=CC=1)C1=CC=CC=C1 HKVRRPIGVZKBQT-UHFFFAOYSA-N 0.000 description 1
- ZAYHVCMSTBRABG-UHFFFAOYSA-N 5-Methylcytidine Natural products O=C1N=C(N)C(C)=CN1C1C(O)C(O)C(CO)O1 ZAYHVCMSTBRABG-UHFFFAOYSA-N 0.000 description 1
- WOVKYSAHUYNSMH-RRKCRQDMSA-N 5-bromodeoxyuridine Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-RRKCRQDMSA-N 0.000 description 1
- NJQONZSFUKNYOY-JXOAFFINSA-N 5-methylcytidine 5'-monophosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 NJQONZSFUKNYOY-JXOAFFINSA-N 0.000 description 1
- OZFPSOBLQZPIAV-UHFFFAOYSA-N 5-nitro-1h-indole Chemical class [O-][N+](=O)C1=CC=C2NC=CC2=C1 OZFPSOBLQZPIAV-UHFFFAOYSA-N 0.000 description 1
- MSSXOMSJDRHRMC-UHFFFAOYSA-N 9H-purine-2,6-diamine Chemical compound NC1=NC(N)=C2NC=NC2=N1 MSSXOMSJDRHRMC-UHFFFAOYSA-N 0.000 description 1
- 229930024421 Adenine Natural products 0.000 description 1
- GFFGJBXGBJISGV-UHFFFAOYSA-N Adenine Chemical compound NC1=NC=NC2=C1N=CN2 GFFGJBXGBJISGV-UHFFFAOYSA-N 0.000 description 1
- 235000007319 Avena orientalis Nutrition 0.000 description 1
- 244000075850 Avena orientalis Species 0.000 description 1
- WOVKYSAHUYNSMH-UHFFFAOYSA-N BROMODEOXYURIDINE Natural products C1C(O)C(CO)OC1N1C(=O)NC(=O)C(Br)=C1 WOVKYSAHUYNSMH-UHFFFAOYSA-N 0.000 description 1
- 241000894006 Bacteria Species 0.000 description 1
- 241000283690 Bos taurus Species 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-M Butyrate Chemical compound CCCC([O-])=O FERIUCNNQQJTOY-UHFFFAOYSA-M 0.000 description 1
- FERIUCNNQQJTOY-UHFFFAOYSA-N Butyric acid Natural products CCCC(O)=O FERIUCNNQQJTOY-UHFFFAOYSA-N 0.000 description 1
- 241000282472 Canis lupus familiaris Species 0.000 description 1
- 102000014914 Carrier Proteins Human genes 0.000 description 1
- 229920000742 Cotton Polymers 0.000 description 1
- HMFHBZSHGGEWLO-SOOFDHNKSA-N D-ribofuranose Chemical compound OC[C@H]1OC(O)[C@H](O)[C@@H]1O HMFHBZSHGGEWLO-SOOFDHNKSA-N 0.000 description 1
- 230000004568 DNA-binding Effects 0.000 description 1
- WDJUZGPOPHTGOT-OAXVISGBSA-N Digitoxin Natural products O([C@H]1[C@@H](C)O[C@@H](O[C@@H]2C[C@@H]3[C@@](C)([C@@H]4[C@H]([C@]5(O)[C@@](C)([C@H](C6=CC(=O)OC6)CC5)CC4)CC3)CC2)C[C@H]1O)[C@H]1O[C@@H](C)[C@H](O[C@H]2O[C@@H](C)[C@@H](O)[C@@H](O)C2)[C@@H](O)C1 WDJUZGPOPHTGOT-OAXVISGBSA-N 0.000 description 1
- 208000035240 Disease Resistance Diseases 0.000 description 1
- 241000283086 Equidae Species 0.000 description 1
- OTMSDBZUPAUEDD-UHFFFAOYSA-N Ethane Chemical compound CC OTMSDBZUPAUEDD-UHFFFAOYSA-N 0.000 description 1
- 241000282326 Felis catus Species 0.000 description 1
- 241000233866 Fungi Species 0.000 description 1
- 244000068988 Glycine max Species 0.000 description 1
- 235000010469 Glycine max Nutrition 0.000 description 1
- 244000299507 Gossypium hirsutum Species 0.000 description 1
- 241000282412 Homo Species 0.000 description 1
- 101000876511 Homo sapiens General transcription and DNA repair factor IIH helicase subunit XPD Proteins 0.000 description 1
- 101000693243 Homo sapiens Paternally-expressed gene 3 protein Proteins 0.000 description 1
- 101001094545 Homo sapiens Retrotransposon-like protein 1 Proteins 0.000 description 1
- 240000005979 Hordeum vulgare Species 0.000 description 1
- 235000007340 Hordeum vulgare Nutrition 0.000 description 1
- 240000004322 Lens culinaris Species 0.000 description 1
- 235000014647 Lens culinaris subsp culinaris Nutrition 0.000 description 1
- 235000007688 Lycopersicon esculentum Nutrition 0.000 description 1
- 235000011430 Malus pumila Nutrition 0.000 description 1
- 244000070406 Malus silvestris Species 0.000 description 1
- 235000015103 Malus silvestris Nutrition 0.000 description 1
- 241000124008 Mammalia Species 0.000 description 1
- 240000005561 Musa balbisiana Species 0.000 description 1
- 235000018290 Musa x paradisiaca Nutrition 0.000 description 1
- OKIZCWYLBDKLSU-UHFFFAOYSA-M N,N,N-Trimethylmethanaminium chloride Chemical compound [Cl-].C[N+](C)(C)C OKIZCWYLBDKLSU-UHFFFAOYSA-M 0.000 description 1
- 206010061309 Neoplasm progression Diseases 0.000 description 1
- 244000061176 Nicotiana tabacum Species 0.000 description 1
- 235000002637 Nicotiana tabacum Nutrition 0.000 description 1
- 108091034117 Oligonucleotide Proteins 0.000 description 1
- 240000007594 Oryza sativa Species 0.000 description 1
- 235000007164 Oryza sativa Nutrition 0.000 description 1
- 229910019142 PO4 Inorganic materials 0.000 description 1
- 102100025757 Paternally-expressed gene 3 protein Human genes 0.000 description 1
- 241001494479 Pecora Species 0.000 description 1
- YGYAWVDWMABLBF-UHFFFAOYSA-N Phosgene Chemical compound ClC(Cl)=O YGYAWVDWMABLBF-UHFFFAOYSA-N 0.000 description 1
- XBDQKXXYIPTUBI-UHFFFAOYSA-M Propionate Chemical compound CCC([O-])=O XBDQKXXYIPTUBI-UHFFFAOYSA-M 0.000 description 1
- 238000010357 RNA editing Methods 0.000 description 1
- 238000010802 RNA extraction kit Methods 0.000 description 1
- 230000026279 RNA modification Effects 0.000 description 1
- 102100035123 Retrotransposon-like protein 1 Human genes 0.000 description 1
- PYMYPHUHKUWMLA-LMVFSUKVSA-N Ribose Natural products OC[C@@H](O)[C@@H](O)[C@@H](O)C=O PYMYPHUHKUWMLA-LMVFSUKVSA-N 0.000 description 1
- 240000000111 Saccharum officinarum Species 0.000 description 1
- 235000007201 Saccharum officinarum Nutrition 0.000 description 1
- 108010051611 Signal Recognition Particle Proteins 0.000 description 1
- 102000013598 Signal recognition particle Human genes 0.000 description 1
- 108091092920 SmY RNA Proteins 0.000 description 1
- 108020004688 Small Nuclear RNA Proteins 0.000 description 1
- 102000039471 Small Nuclear RNA Human genes 0.000 description 1
- 241001237710 Smyrna Species 0.000 description 1
- 240000003768 Solanum lycopersicum Species 0.000 description 1
- 244000061456 Solanum tuberosum Species 0.000 description 1
- 235000002595 Solanum tuberosum Nutrition 0.000 description 1
- 108010090804 Streptavidin Proteins 0.000 description 1
- 208000003028 Stuttering Diseases 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 235000009470 Theobroma cacao Nutrition 0.000 description 1
- 244000299461 Theobroma cacao Species 0.000 description 1
- 108091036066 Three prime untranslated region Proteins 0.000 description 1
- 101710183280 Topoisomerase Proteins 0.000 description 1
- 235000021307 Triticum Nutrition 0.000 description 1
- 244000098338 Triticum aestivum Species 0.000 description 1
- 108020000999 Viral RNA Proteins 0.000 description 1
- 235000009754 Vitis X bourquina Nutrition 0.000 description 1
- 235000012333 Vitis X labruscana Nutrition 0.000 description 1
- 240000006365 Vitis vinifera Species 0.000 description 1
- 235000014787 Vitis vinifera Nutrition 0.000 description 1
- 108091029474 Y RNA Proteins 0.000 description 1
- 240000008042 Zea mays Species 0.000 description 1
- 235000005824 Zea mays ssp. parviglumis Nutrition 0.000 description 1
- 235000002017 Zea mays subsp mays Nutrition 0.000 description 1
- KHIXTHDBCAQXRC-JXOAFFINSA-N [(2r,3s,4r,5r)-5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 KHIXTHDBCAQXRC-JXOAFFINSA-N 0.000 description 1
- KPUOHXMVCZBWQC-JXOAFFINSA-N [(2r,3s,4r,5r)-5-[4-amino-5-(hydroxymethyl)-2-oxopyrimidin-1-yl]-3,4-dihydroxyoxolan-2-yl]methyl dihydrogen phosphate Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(O)=O)O1 KPUOHXMVCZBWQC-JXOAFFINSA-N 0.000 description 1
- JVCCCMWZAFGSPD-JXOAFFINSA-N [(2r,3s,4r,5r)-5-[4-amino-5-(hydroxymethyl)-2-oxopyrimidin-1-yl]-3,4-dihydroxyoxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(O)=O)O1 JVCCCMWZAFGSPD-JXOAFFINSA-N 0.000 description 1
- BZDVTEPMYMHZCR-JGVFFNPUSA-N [(2s,5r)-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methyl phosphono hydrogen phosphate Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](COP(O)(=O)OP(O)(O)=O)CC1 BZDVTEPMYMHZCR-JGVFFNPUSA-N 0.000 description 1
- JLCPHMBAVCMARE-UHFFFAOYSA-N [3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[3-[[3-[[3-[[3-[[3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-[[5-(2-amino-6-oxo-1H-purin-9-yl)-3-hydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxyoxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(5-methyl-2,4-dioxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(6-aminopurin-9-yl)oxolan-2-yl]methoxy-hydroxyphosphoryl]oxy-5-(4-amino-2-oxopyrimidin-1-yl)oxolan-2-yl]methyl [5-(6-aminopurin-9-yl)-2-(hydroxymethyl)oxolan-3-yl] hydrogen phosphate Polymers Cc1cn(C2CC(OP(O)(=O)OCC3OC(CC3OP(O)(=O)OCC3OC(CC3O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c3nc(N)[nH]c4=O)C(COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3COP(O)(=O)OC3CC(OC3CO)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3ccc(N)nc3=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cc(C)c(=O)[nH]c3=O)n3cc(C)c(=O)[nH]c3=O)n3ccc(N)nc3=O)n3cc(C)c(=O)[nH]c3=O)n3cnc4c3nc(N)[nH]c4=O)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)n3cnc4c(N)ncnc34)O2)c(=O)[nH]c1=O JLCPHMBAVCMARE-UHFFFAOYSA-N 0.000 description 1
- YIJVOACVHQZMKI-JXOAFFINSA-N [[(2r,3s,4r,5r)-5-(4-amino-5-methyl-2-oxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound O=C1N=C(N)C(C)=CN1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 YIJVOACVHQZMKI-JXOAFFINSA-N 0.000 description 1
- NAOOSVVUTFPWHI-JXOAFFINSA-N [[(2r,3s,4r,5r)-5-[4-amino-5-(hydroxymethyl)-2-oxopyrimidin-1-yl]-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound C1=C(CO)C(N)=NC(=O)N1[C@H]1[C@H](O)[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 NAOOSVVUTFPWHI-JXOAFFINSA-N 0.000 description 1
- PGAVKCOVUIYSFO-UHFFFAOYSA-N [[5-(2,4-dioxopyrimidin-1-yl)-3,4-dihydroxyoxolan-2-yl]methoxy-hydroxyphosphoryl] phosphono hydrogen phosphate Chemical compound OC1C(O)C(COP(O)(=O)OP(O)(=O)OP(O)(O)=O)OC1N1C(=O)NC(=O)C=C1 PGAVKCOVUIYSFO-UHFFFAOYSA-N 0.000 description 1
- 230000002159 abnormal effect Effects 0.000 description 1
- ASJWEHCPLGMOJE-LJMGSBPFSA-N ac1l3rvh Chemical class N1C(=O)NC(=O)[C@@]2(C)[C@@]3(C)C(=O)NC(=O)N[C@H]3[C@H]21 ASJWEHCPLGMOJE-LJMGSBPFSA-N 0.000 description 1
- 230000021736 acetylation Effects 0.000 description 1
- 238000006640 acetylation reaction Methods 0.000 description 1
- 239000002253 acid Substances 0.000 description 1
- 125000000641 acridinyl group Chemical class C1(=CC=CC2=NC3=CC=CC=C3C=C12)* 0.000 description 1
- 229960000643 adenine Drugs 0.000 description 1
- 229910052783 alkali metal Inorganic materials 0.000 description 1
- 229910001514 alkali metal chloride Inorganic materials 0.000 description 1
- HMFHBZSHGGEWLO-UHFFFAOYSA-N alpha-D-Furanose-Ribose Natural products OCC1OC(O)C(O)C1O HMFHBZSHGGEWLO-UHFFFAOYSA-N 0.000 description 1
- 235000001014 amino acid Nutrition 0.000 description 1
- 210000004381 amniotic fluid Anatomy 0.000 description 1
- 230000003321 amplification Effects 0.000 description 1
- 239000000427 antigen Substances 0.000 description 1
- 102000036639 antigens Human genes 0.000 description 1
- 108091007433 antigens Proteins 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- QVGXLLKOCUKJST-UHFFFAOYSA-N atomic oxygen Chemical compound [O] QVGXLLKOCUKJST-UHFFFAOYSA-N 0.000 description 1
- 150000001541 aziridines Chemical class 0.000 description 1
- 108091008324 binding proteins Proteins 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 210000004369 blood Anatomy 0.000 description 1
- 239000008280 blood Substances 0.000 description 1
- 210000001124 body fluid Anatomy 0.000 description 1
- 239000010839 body fluid Substances 0.000 description 1
- 229950004398 broxuridine Drugs 0.000 description 1
- 239000007853 buffer solution Substances 0.000 description 1
- 239000001273 butane Substances 0.000 description 1
- 210000004899 c-terminal region Anatomy 0.000 description 1
- 201000011510 cancer Diseases 0.000 description 1
- 230000015556 catabolic process Effects 0.000 description 1
- 230000024245 cell differentiation Effects 0.000 description 1
- 238000005119 centrifugation Methods 0.000 description 1
- 235000013339 cereals Nutrition 0.000 description 1
- 238000010382 chemical cross-linking Methods 0.000 description 1
- 235000012000 cholesterol Nutrition 0.000 description 1
- 229940107161 cholesterol Drugs 0.000 description 1
- 230000002759 chromosomal effect Effects 0.000 description 1
- 239000002299 complementary DNA Substances 0.000 description 1
- 238000001816 cooling Methods 0.000 description 1
- 235000005822 corn Nutrition 0.000 description 1
- 238000004132 cross linking Methods 0.000 description 1
- 238000002425 crystallisation Methods 0.000 description 1
- 230000008025 crystallization Effects 0.000 description 1
- 208000030381 cutaneous melanoma Diseases 0.000 description 1
- XUJNEKJLAYXESH-UHFFFAOYSA-N cysteine Natural products SCC(N)C(O)=O XUJNEKJLAYXESH-UHFFFAOYSA-N 0.000 description 1
- 235000018417 cysteine Nutrition 0.000 description 1
- SUYVUBYJARFZHO-RRKCRQDMSA-N dATP Chemical compound C1=NC=2C(N)=NC=NC=2N1[C@H]1C[C@H](O)[C@@H](COP(O)(=O)OP(O)(=O)OP(O)(O)=O)O1 SUYVUBYJARFZHO-RRKCRQDMSA-N 0.000 description 1
- FTDHDKPUHBLBTL-SHYZEUOFSA-K dCDP(3-) Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](COP([O-])(=O)OP([O-])([O-])=O)[C@@H](O)C1 FTDHDKPUHBLBTL-SHYZEUOFSA-K 0.000 description 1
- RGWHQCVHVJXOKC-SHYZEUOFSA-N dCTP Chemical compound O=C1N=C(N)C=CN1[C@@H]1O[C@H](CO[P@](O)(=O)O[P@](O)(=O)OP(O)(O)=O)[C@@H](O)C1 RGWHQCVHVJXOKC-SHYZEUOFSA-N 0.000 description 1
- QHWZTVCCBMIIKE-SHYZEUOFSA-N dUDP Chemical compound O1[C@H](COP(O)(=O)OP(O)(O)=O)[C@@H](O)C[C@@H]1N1C(=O)NC(=O)C=C1 QHWZTVCCBMIIKE-SHYZEUOFSA-N 0.000 description 1
- NHFQNAGPXIVKND-UHFFFAOYSA-N dbco-maleimide Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCNC(=O)CCN1C(=O)C=CC1=O NHFQNAGPXIVKND-UHFFFAOYSA-N 0.000 description 1
- KTIOBJVNCOFWCL-UHFFFAOYSA-N dbco-peg4-amine Chemical compound NCCOCCOCCOCCOCCC(=O)NCCC(=O)N1CC2=CC=CC=C2C#CC2=CC=CC=C12 KTIOBJVNCOFWCL-UHFFFAOYSA-N 0.000 description 1
- RRCXYKNJTKJNTD-UHFFFAOYSA-N dbco-peg4-nhs ester Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCC(=O)NCCOCCOCCOCCOCCC(=O)ON1C(=O)CCC1=O RRCXYKNJTKJNTD-UHFFFAOYSA-N 0.000 description 1
- ZJVGOGQIAYMKAS-MZOCQUDTSA-N dbco-s-s-peg3-biotin Chemical compound C1C2=CC=CC=C2C#CC2=CC=CC=C2N1C(=O)CCC(=O)NCCSSCCC(=O)NCCOCCOCCOCCNC(=O)CCCC[C@H]1[C@H]2NC(=O)N[C@H]2CS1 ZJVGOGQIAYMKAS-MZOCQUDTSA-N 0.000 description 1
- DTPCFIHYWYONMD-UHFFFAOYSA-N decaethylene glycol Chemical compound OCCOCCOCCOCCOCCOCCOCCOCCOCCOCCO DTPCFIHYWYONMD-UHFFFAOYSA-N 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 238000006731 degradation reaction Methods 0.000 description 1
- KHWCHTKSEGGWEX-UHFFFAOYSA-N deoxyadenylic acid Natural products C1=NC=2C(N)=NC=NC=2N1C1CC(O)C(COP(O)(O)=O)O1 KHWCHTKSEGGWEX-UHFFFAOYSA-N 0.000 description 1
- LTFMZDNNPPEQNG-UHFFFAOYSA-N deoxyguanylic acid Natural products C1=2NC(N)=NC(=O)C=2N=CN1C1CC(O)C(COP(O)(O)=O)O1 LTFMZDNNPPEQNG-UHFFFAOYSA-N 0.000 description 1
- 230000003831 deregulation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000003745 diagnosis Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- DIXBSCZRIZDQGC-UHFFFAOYSA-N diaziridine Chemical class C1NN1 DIXBSCZRIZDQGC-UHFFFAOYSA-N 0.000 description 1
- WDJUZGPOPHTGOT-XUDUSOBPSA-N digitoxin Chemical compound C1[C@H](O)[C@H](O)[C@@H](C)O[C@H]1O[C@@H]1[C@@H](C)O[C@@H](O[C@@H]2[C@H](O[C@@H](O[C@@H]3C[C@@H]4[C@]([C@@H]5[C@H]([C@]6(CC[C@@H]([C@@]6(C)CC5)C=5COC(=O)C=5)O)CC4)(C)CC3)C[C@@H]2O)C)C[C@@H]1O WDJUZGPOPHTGOT-XUDUSOBPSA-N 0.000 description 1
- 239000001177 diphosphate Substances 0.000 description 1
- XPPKVPWEQAFLFU-UHFFFAOYSA-J diphosphate(4-) Chemical compound [O-]P([O-])(=O)OP([O-])([O-])=O XPPKVPWEQAFLFU-UHFFFAOYSA-J 0.000 description 1
- 235000011180 diphosphates Nutrition 0.000 description 1
- 238000004821 distillation Methods 0.000 description 1
- 150000002019 disulfides Chemical class 0.000 description 1
- AFOSIXZFDONLBT-UHFFFAOYSA-N divinyl sulfone Chemical class C=CS(=O)(=O)C=C AFOSIXZFDONLBT-UHFFFAOYSA-N 0.000 description 1
- 239000003651 drinking water Substances 0.000 description 1
- 235000020188 drinking water Nutrition 0.000 description 1
- 235000013399 edible fruits Nutrition 0.000 description 1
- 238000001962 electrophoresis Methods 0.000 description 1
- 238000010828 elution Methods 0.000 description 1
- 239000012149 elution buffer Substances 0.000 description 1
- 230000013020 embryo development Effects 0.000 description 1
- 210000003743 erythrocyte Anatomy 0.000 description 1
- 150000002148 esters Chemical class 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000004927 fusion Effects 0.000 description 1
- PCHJSUWPFVWCPO-UHFFFAOYSA-N gold Chemical compound [Au] PCHJSUWPFVWCPO-UHFFFAOYSA-N 0.000 description 1
- 239000010931 gold Substances 0.000 description 1
- 229910052737 gold Inorganic materials 0.000 description 1
- 150000004820 halides Chemical class 0.000 description 1
- 125000005179 haloacetyl group Chemical group 0.000 description 1
- 229910052736 halogen Inorganic materials 0.000 description 1
- 208000019622 heart disease Diseases 0.000 description 1
- 101150028858 hel308 gene Proteins 0.000 description 1
- 125000000623 heterocyclic group Chemical group 0.000 description 1
- 229930195733 hydrocarbon Natural products 0.000 description 1
- 150000002430 hydrocarbons Chemical class 0.000 description 1
- WGCNASOHLSPBMP-UHFFFAOYSA-N hydroxyacetaldehyde Natural products OCC=O WGCNASOHLSPBMP-UHFFFAOYSA-N 0.000 description 1
- 230000001771 impaired effect Effects 0.000 description 1
- PGLTVOMIXTUURA-UHFFFAOYSA-N iodoacetamide Chemical compound NC(=O)CI PGLTVOMIXTUURA-UHFFFAOYSA-N 0.000 description 1
- 239000002608 ionic liquid Substances 0.000 description 1
- 238000002955 isolation Methods 0.000 description 1
- 150000002540 isothiocyanates Chemical class 0.000 description 1
- 238000009533 lab test Methods 0.000 description 1
- 235000021374 legumes Nutrition 0.000 description 1
- 239000003446 ligand Substances 0.000 description 1
- 230000004298 light response Effects 0.000 description 1
- 239000007788 liquid Substances 0.000 description 1
- 210000002751 lymph Anatomy 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000001394 metastastic effect Effects 0.000 description 1
- 206010061289 metastatic neoplasm Diseases 0.000 description 1
- CXKWCBBOMKCUKX-UHFFFAOYSA-M methylene blue Chemical compound [Cl-].C1=CC(N(C)C)=CC2=[S+]C3=CC(N(C)C)=CC=C3N=C21 CXKWCBBOMKCUKX-UHFFFAOYSA-M 0.000 description 1
- 229960000907 methylthioninium chloride Drugs 0.000 description 1
- 238000002156 mixing Methods 0.000 description 1
- 150000004712 monophosphates Chemical class 0.000 description 1
- 230000000877 morphologic effect Effects 0.000 description 1
- 210000003097 mucus Anatomy 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- IJDNQMDRQITEOD-UHFFFAOYSA-N n-butane Chemical compound CCCC IJDNQMDRQITEOD-UHFFFAOYSA-N 0.000 description 1
- OFBQJSOFQDEBGM-UHFFFAOYSA-N n-pentane Natural products CCCCC OFBQJSOFQDEBGM-UHFFFAOYSA-N 0.000 description 1
- 231100000252 nontoxic Toxicity 0.000 description 1
- 230000003000 nontoxic effect Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- WWZKQHOCKIZLMA-UHFFFAOYSA-M octanoate Chemical compound CCCCCCCC([O-])=O WWZKQHOCKIZLMA-UHFFFAOYSA-M 0.000 description 1
- 239000001301 oxygen Substances 0.000 description 1
- 229910052760 oxygen Inorganic materials 0.000 description 1
- NBIIXXVUZAFLBC-UHFFFAOYSA-K phosphate Chemical compound [O-]P([O-])([O-])=O NBIIXXVUZAFLBC-UHFFFAOYSA-K 0.000 description 1
- 239000010452 phosphate Substances 0.000 description 1
- 239000008363 phosphate buffer Substances 0.000 description 1
- 230000004962 physiological condition Effects 0.000 description 1
- 230000001124 posttranscriptional effect Effects 0.000 description 1
- 101150011956 recD gene Proteins 0.000 description 1
- 101150033993 recR gene Proteins 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000006808 response to salt stress Effects 0.000 description 1
- 235000009566 rice Nutrition 0.000 description 1
- 210000003296 saliva Anatomy 0.000 description 1
- 229920006395 saturated elastomer Polymers 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
- 239000013535 sea water Substances 0.000 description 1
- 238000010008 shearing Methods 0.000 description 1
- 201000003708 skin melanoma Diseases 0.000 description 1
- 230000002269 spontaneous effect Effects 0.000 description 1
- 239000007858 starting material Substances 0.000 description 1
- 230000000707 stereoselective effect Effects 0.000 description 1
- KZNICNPSHKQLFF-UHFFFAOYSA-N succinimide Chemical class O=C1CCC(=O)N1 KZNICNPSHKQLFF-UHFFFAOYSA-N 0.000 description 1
- 150000008163 sugars Chemical class 0.000 description 1
- YBBRCQOCSYXUOC-UHFFFAOYSA-N sulfuryl dichloride Chemical compound ClS(Cl)(=O)=O YBBRCQOCSYXUOC-UHFFFAOYSA-N 0.000 description 1
- 230000002194 synthesizing effect Effects 0.000 description 1
- 238000010189 synthetic method Methods 0.000 description 1
- 229920001059 synthetic polymer Polymers 0.000 description 1
- 125000003396 thiol group Chemical group [H]S* 0.000 description 1
- 150000003573 thiols Chemical class 0.000 description 1
- 229940113082 thymine Drugs 0.000 description 1
- 101150015906 traI gene Proteins 0.000 description 1
- 230000002103 transcriptional effect Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
- ZIBGPFATKBEMQZ-UHFFFAOYSA-N triethylene glycol Chemical compound OCCOCCOCCO ZIBGPFATKBEMQZ-UHFFFAOYSA-N 0.000 description 1
- 239000001226 triphosphate Substances 0.000 description 1
- 235000011178 triphosphate Nutrition 0.000 description 1
- UNXRWKVEANCORM-UHFFFAOYSA-N triphosphoric acid Chemical compound OP(O)(=O)OP(O)(=O)OP(O)(O)=O UNXRWKVEANCORM-UHFFFAOYSA-N 0.000 description 1
- 239000000107 tumor biomarker Substances 0.000 description 1
- 230000005751 tumor progression Effects 0.000 description 1
- 229940035893 uracil Drugs 0.000 description 1
- 210000002700 urine Anatomy 0.000 description 1
- 235000013311 vegetables Nutrition 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6869—Methods for sequencing
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Q—MEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
- C12Q1/00—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
- C12Q1/68—Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
- C12Q1/6876—Nucleic acid products used in the analysis of nucleic acids, e.g. primers or probes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y306/00—Hydrolases acting on acid anhydrides (3.6)
- C12Y306/04—Hydrolases acting on acid anhydrides (3.6) acting on acid anhydrides; involved in cellular and subcellular movement (3.6.4)
- C12Y306/04012—DNA helicase (3.6.4.12)
-
- G—PHYSICS
- G01—MEASURING; TESTING
- G01N—INVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
- G01N27/00—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means
- G01N27/26—Investigating or analysing materials by the use of electric, electrochemical, or magnetic means by investigating electrochemical variables; by using electrolysis or electrophoresis
- G01N27/416—Systems
- G01N27/447—Systems using electrophoresis
Landscapes
- Chemical & Material Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Biochemistry (AREA)
- Genetics & Genomics (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- Microbiology (AREA)
- Physics & Mathematics (AREA)
- Immunology (AREA)
- Biotechnology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Biomedical Technology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Electrochemistry (AREA)
- General Physics & Mathematics (AREA)
- Pathology (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
本发明提供了一种用于表征目标多核苷酸的衔接体、方法及其用途。本发明提供了用于表征目标多核苷酸的衔接体,衔接体包含DNA解旋酶的结合区域,结合区域包含修饰的RNA多核苷酸,用于结合DNA解旋酶。本发明还提供了表征目标多核苷酸的方法,所述方法使用所述的衔接体。本发明提供了能够与DNA结合的修饰的RNA,其可以用于纳米孔RNA测序的衔接体制备,使用该衔接体能极大丰富了RNA测序的多样性,并为纳米孔RNA测序的进一步发展提供了很好的基础。
Description
相关申请的交叉引用
本申请要求享有于2021年12月21日提交的名称为“用于表征目标多核苷酸的衔接体、方法及其用途”的中国专利申请202111573545.8的优先权,该申请的全部内容通过引用并入本文中。
技术领域
本发明属于基因测序领域,涉及一种表征多核苷酸中使用的衔接体,本发明还涉及使用所述衔接体表征多核苷酸的方法。
背景技术
纳米孔测序技术具有长读长、直接读取修饰信息和实时数据生产并行分析的特点,在长片段核酸检测变异(包括但不仅限于点突变、插入缺失、倒位易位、基因融合、RNA异常剪切、RNA编辑等多种核酸相关变异)和修饰信息(包括但不仅限于甲基化、乙酰化等)检测方面比二代测序或其他测序平台有更明显优势。该平台支持数据生产和分析并行的特点实现了实时变异/修饰检出和诊断,加上便携式的设计,使其具有广泛的应用前景。
对纳米孔两侧施加电压后,当分析物(例如多核苷酸、多肽)通过纳米孔时造成电流下降,不同结构的分析物所引起的电流阻断程度不同。当分析物在纳米孔的桶(barrel)中暂时停留一段时间时,电流会发生变化。纳米孔检测核苷酸给出已知特征和持续时间的电流变化。
目前需要一种具有广泛的应用范围的快速且廉价的多核苷酸(如DNA或RNA)测序和鉴定技术。现有的技术是缓慢的且昂贵的,这主要由于它们依赖于扩增技术来产生大量的多核苷酸,且需要大量特定的用于信号检测的荧光化学物质。
信使RNA提供了对生物体动态的观察,并且直接RNA测序的益处和应用是巨大的,包括用于健康筛查;例如某些癌症的转移过程和心脏病。直接RNA测序能在调查农作物的抗病性中应用,确定农作物对应激因素,例如干旱、紫外线和盐度的反应,以及在胚胎发育过程的细胞分化和决定中应用。
存在于RNA,特别是500个或更多的核苷酸的RNA的直接测序中的问题是寻找合适的能够控制RNA穿过跨膜孔的移位的分子马达。至今,用于RNA并提供持续移动的分子马达还没有出现。对于表征或测序多核苷酸,需要RNA聚合物的持续移动和读取长片段聚合物的能力。
国际专利申请No.PCT/GB2014/053121(WO 2015/056028)公开了表征目标核糖核酸(RNA)的方法,包括形成互补多核苷酸,然后使用跨膜孔表征所述互补多核苷酸。这种间接RNA表征易于出错并可能导致RNA的甲基化状态的重要信息的丢失。RNA到cDNA的转换过程中其他重要的修饰也可能被隐藏。
国际专利申请WO2016059436A1公开了一种纳米孔RNA表征方法。其使用DNA解旋酶表征RNA,所述DNA解旋酶通过借助非-RNA前导序列的存在本质上“被欺骗地”("tricked")读取所述目标RNA序列。一旦通过所述非-RNA多核苷酸(其可以包含DNA或DNA类似物)引发所述DNA解旋酶的移动,它可以继续沿着所述RNA移动。
显然地,这两种方法都限定了目前的纳米孔RNA测序必须提供包含DNA修饰前导序列的RNA多核苷酸,这极大限制了现有RNA测序衔接体的序列多样性。
发明内容
针对现有技术的不足,本发明的目的在于提供一种新的衔接体,本发明还提供了所述衔接体的制备方法,及其用于纳米孔测序的用途。本发明的衔接体直接使用修饰的RNA结合解旋酶,极大地丰富了RNA测序的多样性,并为纳米孔RNA测序的进一步发展提供了很好的基础。
本发明的目的是通过以下技术方案实现的:
本发明的第一方面提供了一种用于表征目标多核苷酸的衔接体,所述衔接体包含解旋酶的结合区域,所述解旋酶的结合区域包含修饰的RNA多核苷酸,用于结合或装载所述解旋酶。
根据本发明所述的衔接体,其中,
所述解旋酶包括DNA解旋酶;和/或
所述修饰的RNA多核苷酸选自糖环2’-F修饰的RNA;和/或
所述解旋酶的结合区域不包含DNA。
根据本发明所述的衔接体,其中,所述衔接体包含优先地穿入纳米孔的前导序列;
优选地,所述解旋酶的结合区域位于所述前导序列。
根据本发明所述的衔接体,其中,所述目标多核苷酸为目标RNA多核苷酸和/或目标DNA多核苷酸,优选为目标RNA多核苷酸;
所述目标多核苷酸为单链或双链;
优选地,通过共价键将所述衔接体连接到所述目标多核苷酸,所述共价键形成在所述RNA多核苷酸和所述非核苷酸的各自至少一个反应基团之间;和/或
通过化学或酶促连接将所述衔接体连接到所述RNA多核苷酸。根据本发明所述的衔接体,其中,所述DNA解旋酶为:
a)Hel308解旋酶、RecD解旋酶、XPD解旋酶、Dda解旋酶、Tral解旋酶、或TrwC解旋酶;
b)衍生自a)中所述任何解旋酶的解旋酶;或
c)a)和/或b)中所述解旋酶的任意组合。
本发明的第二方面提供了一种表征目标多核苷酸的方法,所述方法使用所述的衔接体。
根据本发明所述的方法,其中所述目标多核苷酸为目标RNA多核苷酸和/或目标DNA多核苷酸,优选为目标RNA多核苷酸;
所述目标多核苷酸为单链或双链;
优选地,所述方法包括:
a)提供(i)多核苷酸构建体和(ii)解旋酶,所述多核苷酸构建体包含所述目标多核苷酸和所述的衔接体;所述解旋酶包括所述的DNA解旋酶;
b)将a)中提供的所述多核苷酸构建体和所述解旋酶与跨膜孔接触,使得所述解旋酶控制所述目标多核苷酸相对于所述跨膜孔的移动;
c)随着所述目标多核苷酸相对于所述跨膜孔移动,获取一个或多个测量值,其中所述测量值代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。
根据本发明所述的方法,其中,所述一个或多个特征选自(i)所述目标多核苷酸的长度,(ii)所述目标多核苷酸的同一性,(iii)所述目标多核苷酸的序列,(iv)所述目标多核苷酸的二级结构和(v)所述目标多核苷酸是否是修饰的。
根据本发明所述的方法,其中所述目标多核苷酸的一个或多个特征可以通过电测量和/或光测量来测量。
根据本发明所述的方法,其中步骤c)包括随着所述目标多核苷酸相对于所述跨膜孔移动,测量流过所述跨膜孔的电流,其中所述电流代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。
根据本发明所述的方法,其中,所述目标RNA多核苷酸额外地或进一步通过甲基化、氧化、损伤、用一个或多个蛋白,或用一个或多个标记物、标签或阻断链进行修饰。
根据本发明所述的方法,其中,所述目标多核苷酸可以使用一个或多个锚耦合到所述膜。
根据本发明所述的方法,其中,所述解旋酶包含修饰,以减小多核苷酸结合域中开口的大小,所述目标多核苷酸可以在至少一个构象状态下穿过所述开口从所述解旋酶上解绑。
根据本发明所述的方法,其中,所述一个或多个解旋酶如前所述。
根据本发明所述的方法,其中,所述方法进一步包含使用一个或多个衍生自解旋酶的分子制动器,所述分子制动器被修饰使得其结合多核苷酸但不发挥解旋酶的功能。
根据本发明所述的方法,其中,所述跨膜孔可以是蛋白孔或固态孔。
根据本发明所述的方法,其中,所述跨膜蛋白质孔是蛋白孔,并衍生自如下任一种或多种:溶血素、杀白细胞素,耻垢分枝杆菌(Mycobacterium smegmatis)孔蛋白A(MspA)、MspB、MspC、MspD、胞溶素(lysenin)、CsgG、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG),外膜磷脂酶A、奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)和WZA。
本发明的第三方面还提供了一种目标多核苷酸相对于跨膜孔移动的方法,所述移动被解旋酶控制,所述方法包括:
a)提供(i)目标RNA多核苷酸或目标DNA多核苷酸,和(ii)解旋酶,所述目标RNA多核苷酸或目标DNA多核苷酸被修饰以包含用于结合或装载所述解旋酶的修饰的RNA多核苷酸区域充当DNA解旋酶的结合区域;
其中,所述修饰的RNA多核苷酸包含2’-F修饰的RNA;
所述解旋酶包括所述的DNA解旋酶;
b)将a)中提供的所述目标RNA多核苷酸或目标DNA多核苷酸、和所述解旋酶与跨膜孔接触,使得所述解旋酶控制所述RNA多核苷酸相对于所述跨膜孔的移动。
本发明的第四方面提供了一种复合物,所述复合物包含所述的衔接体和解旋酶;
所述解旋酶包括所述的DNA解旋酶;
优选地,所述DNA解旋酶选自:
a)Hel308解旋酶、RecD解旋酶、XPD解旋酶、Dda解旋酶、Tral解旋酶、或TrwC解旋酶;
b)衍生自a)中所述任何解旋酶的解旋酶;或
c)a)和/或b)中所述解旋酶的任意组合。
本发明的第五方面提供了一种用于表征目标多核苷酸的试剂盒,所述试剂盒包含所述的衔接体和所述解旋酶或所述的复合物;
所述目标多核苷酸为目标RNA多核苷酸或目标DNA多核苷酸。
本发明的第六方面提供了一种分离的多核苷酸,所述多核苷酸包含RNA多核苷酸或DNA多核苷酸,和修饰的RNA多核苷酸区域,所述修饰的RNA多核苷酸和/或非核苷酸区域用于结合解旋酶;
其中,所述修饰的RNA多核苷酸包含2’-F修饰的RNA;
所述解旋酶包括所述的DNA解旋酶。
与现有技术相比,本发明的技术方案具备以下优点:
本发明提供了能够与DNA解旋酶结合的经修饰的RNA,与相关技术中的RNA相比,本申请的经修饰的RNA更不容易降解,其可以用于纳米孔多核苷酸包括RNA和DNA测序的衔接体制备,使用该衔接体极大丰富了RNA测序的多样性,并为纳米孔RNA测序的进一步发展提供了很好的基础。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例中所需要使用的附图作简单地介绍,显而易见地,下面所描述的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出为DNA解旋酶T4 Dda与相同长度的ssDNA以及2’-F-RNA结合情况;
图2示出为DNA解旋酶Hel308与相同长度的ssDNA以及2’-F-RNA结合情况;
图3示出为DNA解旋酶Hel308与Y型衔接体结合后形成复合物的电泳检测图;
图4示出为DNA解旋酶Hel308与Y型衔接体结合后形成复合物的纯化后的电泳图;
图5示出为复合物可以用于纳米孔测序的信号图。
具体实施方式
应理解,公开的产品和方法的不同应用可以根据本领域的具体需求而调整。可以理解本文中使用的术语仅是为了描述本发明的具体实施方式的目的,而不意为对本发明的限制。
另外,除非本文另有明确规定,否则本说明书和随附的权利要求中所使用的单数形式的“一”、“一个”和“所述”包括复数指代。因此,例如,涉及“多核苷酸”时包括两个或多核苷酸,涉及“多核苷酸结合蛋白质包括两个或多个这样的蛋白,涉及“解旋酶”时包括两个或多个解旋酶,涉及“单体”指的是两个或多个单体,涉及“孔”时包括两个或多个孔,等。
本文所引用的所有公开物、专利和专利申请,无论在前文或在后文,均以引用的方式全文引入。
衔接体
本发明首先提供了一种用于表征目标多核苷酸的衔接体,衔接体包含DNA解旋酶的结合区域,结合区域包含修饰的RNA多核苷酸,用于结合DNA解旋酶。
在本发明的一个实施方案中,解旋酶包括DNA解旋酶。上述解旋酶可以是多聚或寡聚解旋酶。可以理解的是,解旋酶可能需要形成多聚体或寡聚体诸如二聚体以起作用。在这样的施例中,两个或更多个部分不能在不同的单体上。解旋酶优选地是单聚的。可以理解的是,解旋酶优选地不需要形成多聚体或寡聚体诸如二聚体即可起作用。例如,Hel308、RecD、TraI和XPD解旋酶都是单聚解旋酶。
单聚解旋酶可以包含附接在一起的若干结构域。例如,TraI解旋酶和TraI亚组解旋酶可以含有两个RecD解旋酶结构域、释放酶结构域和C末端结构域。这些结构域通常形成能够起作用而不会形成寡聚体的单聚解旋酶。
在本发明的一个实施方案中,修饰的RNA多核苷酸选自糖环2’-F修饰的RNA。
在本发明的一个实施方案中,旋酶的结合区域包含非脱氧核糖核酸。
在本发明的一个实施方案中,衔接体包含优先地穿入纳米孔的前导序列;
在具体的实施方案中,DNA解旋酶的结合区域位于前导序列。
本发明的衔接体更适用于目标RNA多核苷酸的表征。在具体的实施方案中,可以通过共价键将所述衔接体连接到所述目标RNA多核苷酸,所述共价键形成在所述RNA多核苷酸和所述衔接体的各自至少一个反应基团之间;和/或通过化学或酶促连接将所述衔接体连接到所述RNA多核苷酸。
优选地通过将本发明的衔接体连接到RNA来修饰所述目标RNA多核苷酸。所述本发明的衔接体有助于本发明的表征方法。所述本发明的衔接体被设计为优先地穿入所述孔,并因此促进多核苷酸穿过孔的移动。所述本发明的衔接体也可以用于将所述目标RNA多核苷酸连接到如下所述的一个或多个锚。所述本发明的衔接体可连接到所述目标RNA多核苷酸。
本发明的衔接体通常包含聚合物区域。所述聚合物区域优选带负电荷。所述聚合物优选为多核苷酸,例如DNA,修饰的多核苷酸(例如无碱基DNA),PNA,LNA,聚乙二醇(PEG)或多肽。
本发明的衔接体优选包含一个或多个阻断链。
阻断链
一个或多个阻断链包括在目标多核苷酸中。一个或多个阻断链包括在目标RNA多核苷酸和/或目标DNA多核苷酸中。一个或多个阻断链优选是目标多核苷酸的一部分,例如它/它们中断多核苷酸序列。一个或多个阻断链优选不为一个或多个嵌段分子的一部分,该嵌段分子如与目标多核苷酸杂交的减速带。
在目标多核苷酸中具有任意数量的阻断链,如1个,2个,3个,4个,5个,6个,7个,8个,9个,10个或更多个阻断链。优选在目标多核苷酸中具有2个,4个或6个阻断链。目标多核苷酸的不同区域中可具有阻断链,例如前导序列中的阻断链和发卡环中的阻断链。
一个或多个阻断链各提供了能量障碍,一个或多个解旋酶甚至在活动模式也不能克服该能量障碍。一个或多个阻断链可通过减少解旋酶的牵拉(例如通过除去目标多核苷酸中的核苷酸的碱基)或物理性地阻断一个或多个解旋酶的移动(例如利用庞大的化学基团)来停滞一个或多个解旋酶。
一个或多个阻断链可包括停滞一个或多个解旋酶的任意分子或任意分子的组合。所述一个或多个阻断链可以包括阻止所述一个或多个解旋酶沿目标多核苷酸移动的任意分子或任意分子的组合。其直接地确定在缺少跨膜孔和施加的电势的条件下,一个或多个解旋酶是否停留在一个或多个阻断链处。例如,实施例中所示进行测试,例如解旋酶穿过阻断链且置换DNA的互补链的能力可以通过PAGE进行测量。
一个或多个阻断链通常包括直链分子如聚合物。所述一个或多个阻断链通常具有与目标多核苷酸不同的结构。例如,如果所述目标多核苷酸是DNA,一个或多个阻断链通常不是脱氧核糖核酸。特别是,如果目标多核苷酸是脱氧核糖核酸(DNA)或核糖核酸(RNA),所述一个或多个阻断链优选包括肽核酸(PNA),甘油核酸(GNA),苏糖核酸(TNA),锁核酸(LNA)或具有核苷酸侧链的合成聚合物。
一个或多个阻断链优选包括一个或多个硝基吲哚,例如一个或多个5-硝基吲哚,一个或多个肌苷,一个或多个吖啶,一个或多个2-氨基嘌呤,一个或多个2-6-二氨基嘌呤,一个或多个5-溴-脱氧尿嘧啶,一个或多个反向胸苷(反向dTs),一个或多个反向脱氧胸苷(ddTs),一个或多个二脱氧胞苷(ddCs),一个或多个5-甲基胞苷,一个或多个5-羟甲基胞苷,一个或多个2’烷氧基修饰的核糖核苷酸(优选2’甲氧基修饰的核糖核苷酸),一个或多个异脱氧胞苷(异-dCs),一个或多个异脱氧鸟苷(异dGs),一个或多个iSpC3基团(即缺少糖和碱基的核苷酸),一个或多个光裂解(PC)基团,一个或多个己二醇基团,一个或多个阻断链9(iSp9)基团,一个或多个阻断链18(iSp18)基团,聚合物或一个或多个硫醇连接。所述一个或多个阻断链可包括这些基团的任意组合。许多这些基团可以购自(Integrated DNA)。
一个或多个阻断链可包含任何数量的这些基团。例如,对于2-氨基嘌呤,2-6-二氨基嘌呤,5-溴脱氧尿苷,反向dTs,ddTs,ddCs,5-甲基胞苷,5-羟甲基胞苷,2’烷氧基修饰的核糖核苷酸(优选2’甲氧基修饰的核糖核苷酸),异dCs,异dGs,iSpC3基团,PC基团,己二醇基团和硫醇连接,一个或多个阻断链优选包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多。一个或多个阻断链优选包含2个、3个、4个、5个、6个、7个、8个或更多iSp9基团。一个或多个阻断链优选包含2个、3个、4个、5个或6个或更多iSp18基团。最优选的阻断链基团是4个iSp18基团。
聚合物优选为多肽或聚乙二醇(PEG)。所述多肽优选地包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个氨基酸。所述PEG优选包含2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多单体单元。
一个或多个阻断链优选包括一个或多个无碱基核苷酸(即缺乏核碱基的核苷酸),例如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个无碱基的核苷酸。核碱基可以被无碱基核苷酸中的-H(idSp)或-OH置换。无碱基的阻断链可以通过从一个或多个相邻的核苷酸中除去核碱基而被插入到目标多核苷酸中。
一个或多个阻断链优选包含一个或多个物理上导致一个或多个解旋酶停滞的化学基团。所述一个或多个化学基团优选为一个或多个侧挂的化学基团。所述一个或多个化学基团可以连接到目标多核苷酸中的一个或更多个核碱基。所述一个或多个化学基团可以连接到目标多核苷酸的骨架。可存在任何数量,如2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个或更多个这些化学基团。合适的基团包括但不限于,荧光团,链霉亲和素和/或生物素,胆固醇,亚甲基蓝,二硝基苯酚(DNPs),洋地黄毒苷和/或抗洋地黄毒苷和二苯基环辛炔基团。
目标多核苷酸中的不同阻断链可以包含不同停滞分子。例如,一个阻断链可以包括如上讨论的一个线性分子,另一个阻断链可以包括一个或多个物理上导致一个或多个解旋酶停滞的化学基团。阻断链可包括如上讨论的任何线性分子和一个或多个物理上导致一个或多个解旋酶停滞的化学基团,例如一个或多个无碱基和荧光团。
表征目标多核苷酸的方法
本发明的方法解决的问题是如何表征目标多核苷酸。
表征目标多核苷酸的方法,包括:
a)提供(i)多核苷酸构建体和(ii)解旋酶,所述多核苷酸构建体包含所述目标多核苷酸和如权利要求1至4中任一项所述的衔接体;所述解旋酶包括DNA解旋酶;
b)将a)中提供的所述多核苷酸构建体和所述解旋酶与跨膜孔接触,使得所述解旋酶控制所述目标多核苷酸相对于所述跨膜孔的移动;
c)随着所述目标多核苷酸相对于所述跨膜孔移动,获取一个或多个测量值,其中所述测量值代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。
上述方法中使用到本发明的衔接体,所述衔接体结合DNA解旋酶并与目标多核苷酸连接,从而使所述目标多核苷酸被运送到跨膜孔,并且用所述孔表征所述目标多核苷酸。本发明提供了通过在DNA解旋酶的控制下,随着目标多核苷酸相对于所述跨膜孔移动,获取一个或多个测量值来表征目标核糖核酸(RNA和/或DNA)多核苷酸的方法。
示例性,目标多核苷酸包括目标RNA多核苷酸和目标DNA多核苷酸。
由于跨膜孔能够检测目标多核苷酸的单个分子,从而不需要放大(扩增)所述目标多核苷酸。所述方法通常不包括聚合酶链反应(PCR)或反转录PCR(RT-PCR)。这极大地减少了表征目标多核苷酸需要的工作量。这也避免了由PCR引起的任何偏差和人为假象。
本发明的方法可涉及确定或测量RNA多核苷酸或DNA多核苷酸的一个或多个特征。所述方法可包括确定或测量所述RNA多核苷酸或DNA多核苷酸的一个、两个、三个、四个或五个或更多个特征。
示例性的,所述一个或多个特征优选地选自(i)所述RNA多核苷酸的长度,(ii)所述RNA多核苷酸的同一性,(iii)所述RNA多核苷酸的序列,(iv)所述RNA多核苷酸的二级结构和(v)所述RNA多核苷酸是否是修饰的。根据本发明可以测量(i)至(v)的任何组合,例如{i},{ii},{iii},{iv},{v},{i,ii},{i,iii},{i,iv},{i,v},{ii,iii},{ii,iv},{ii,v},{iii,iv},{iii,v},{iv,v},{i,ii,iii},{i,ii,iv},{i,ii,v},{i,iii,iv},{i,iii,v},{i,iv,v},{ii,iii,iv},{ii,iii,v},{ii,iv,v},{iii,iv,v},{i,ii,iii,iv},{i,ii,iii,v},{i,ii,iv,v},{i,iii,iv,v},{ii,iii,iv,v}或{i,ii,iii,iv,v}。可以测量(i)至(v)的不同组合,包括以上列举的任何组合。本发明的方法优选地包含估计所述RNA多核苷酸的序列或对所述RNA多核苷酸测序。
对于(i),目标RNA多核苷酸的长度例如可以通过确定所述目标RNA多核苷酸和所述孔之间的相互作用的次数,或所述目标RNA多核苷酸和所述孔之间的相互作用的持续时间来测定。
对于(ii),目标RNA多核苷酸的同一性可以通过多种方式测定。所述目标RNA多核苷酸的同一性可联合所述目标RNA多核苷酸的序列测定来测定或不联合所述目标RNA多核苷酸的序列测定来测定。前者是直接的;对所述多核苷酸进行测序,并由此鉴定目标RNA多核苷酸的同一性。后者可以以几种方式来完成。例如,可以测定所述目标RNA多核苷酸中特定模序的存在(而无需测定所述RNA多核苷酸的其余序列)。或者,所述方法中测定的特定的电和/或光信号的测量值可鉴定来自特定来源的RNA多核苷酸。
对于(iii),所述目标RNA多核苷酸的序列可以如前所述确定。合适的测序方法,特别是那些使用电测量值的方法,在Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7,Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72,和国际申请WO2000/28312中描述。
对于(iv),所述二级结构可以多种方法测量。例如,如果所述方法包括电测量,所述二级结构可以利用穿过孔的停留时间的变化或电流变化来测量。这使得单链和双链RNA多核苷酸的区域被区别。
对于(v),可以测定任何修饰的存在或不存在。所述方法优选地包括确定所述多核苷酸是否通过甲基化、氧化、损伤、用一个或多个蛋白,或用一个或多个标记物、标签或阻断链进行了修饰。特异性修饰将导致与孔的特异性相互作用,这可以使用下面描述的方法来测定。例如,可以基于孔与每个核苷酸的相互作用过程中穿过孔的电流,区别胞嘧啶与甲基胞嘧啶。本发明的方法可用于RNA和DNA之间的区别,甚至在单一样品中:作为平均振幅和范围的函数,甚至RNA和DNA序列相同时,RNA和DNA可被相互区别。
所述方法可使用任何适于研究膜/孔系统的设备来实施,其中在所述膜/孔系统中,孔存在于膜中。可使用任何适于跨膜孔传感的设备来实施所述方法。例如,所述设备包括一个室,所述室包括水溶液和将该室分割为两部分的屏障(barrier)。所述屏障通常具有缝隙,其中在缝隙中形成包括孔的膜。或者该屏障形成其中存在孔的膜。
该方法可以使用在国际申请No.PCT/GB08/000562(WO 2008/102120)中描述的设备实施。
该方法可以包括随着所述RNA多核苷酸相对于所述孔移动,测量通过所述孔的电流。因此该装置也可以包括能够跨膜和孔施加电势并测量电流信号的电路。该方法可以使用膜片钳或电压钳实施。所述方法优选包含使用电压钳。
本发明的方法可包括随着所述RNA多核苷酸相对于所述孔移动来测量流过所述孔的电流。随着所述多核苷酸相对于所述孔移动流经所述孔的电流被用于确定所述目标RNA多核苷酸的序列。这是链测序。用于测量通过跨膜蛋白质孔的离子电流的合适的条件是本领域已知的,并且在实施例中公开。所述方法通过跨膜和孔施加的电压进行实施。使用的电压通常为+5V到-5V,例如从+4V到-4V,+3V到-3V或+2V到-2V。通常使用的电压通常为-600mV到+600mV,或-400mV到+400mV。使用的电压优选地在具有以下下限和上限的范围内,所述下限选自在-400mV,-300mV,-200mV,-150mV,-100mV,-50mV,-20mV和0mV,所述上限独立地选自+10mV,+20mV,+50mV,+100mV,+150mV,+200mV,+300mV和+400mV。所用的电压更优选在100mV到240mV的范围内并最优选在120mV到220mV的范围内。可通过对孔施加提高的电势来提高对不同核糖核苷酸的分辨力。
该方法通常在任何载荷子,如金属盐,例如碱金属盐,卤盐,例如氯盐,如碱金属氯盐的存在下实施。载荷子可包括离子型液体或有机盐,例如四甲基氯化铵,三甲苯基氯化铵,苯基三甲基氯化苯,或1-乙基-3-甲基咪唑鎓氯化物。在上面讨论的示例性设备中,所述盐存在于所述室中的水溶液中。通常使用氯化钾(KCl),氯化钠(NaCl)或氯化铯(CsCl)或亚铁氰化钾和铁氰化钾的混合物。优选氯化钾,氯化钠和亚铁氰化钾和铁氰化钾的混合物。所述载荷子可以非对称地穿过所述膜。例如,在所述膜的各侧上载荷子的类型和/或浓度可能不同。
盐浓度可为饱和的。盐浓度可以是3M或更低,通常为0.1M至2.5M,0.3M至1.9M,0.5M至1.8M,0.7M至1.7M,0.9M至1.6M或1M至1.4M。优选盐浓度为150mM到1M。所述方法优选使用至少为0.3M,例如至少为0.4M,至少为0.5M,至少为0.6M,至少为0.8M,至少为1.0M,至少为1.5M,至少为2.0M,至少为2.5M,或者至少为3.0M的盐浓度进行实施。高盐浓度提供了高信噪比,并使得在正常电流波动的背景下,代表核糖核苷酸存在的电流能被识别。
所述方法通常在缓冲剂存在下实施。在上面讨论的示例性设备中,缓冲剂在所述室中的水溶液中存在。本发明的方法可使用任何缓冲剂。通常地,缓冲剂是磷酸盐缓冲液。其他合适的缓冲剂为HEPES和Tris-HCl缓冲剂。该方法通常在pH值为4.0至12.0,4.5至10.0,5.0至9.0,5.5至8.8,6.0至8.7,7.0至8.8,或7.5至8.5下实施。所使用的pH优选约为7.5。
所述方法可在0℃至100℃,15℃至95℃,16℃至90℃,17℃至85℃,18℃至80℃,19℃至70℃,或20℃至60℃下实施。所述方法通常在室温下进行。该方法可选地在支持酶功能的温度下,例如约37℃实施。
所述方法可在游离核苷酸或游离核苷酸类似物和/或有利于发挥解旋酶或构建体的功能的酶辅因子的存在下实施。所述方法也可在游离核苷酸或游离核苷酸类似物不存在和酶辅因子不存在下实施。所述游离核苷酸可以是任何单个核苷酸的一种或多种。所述游离核苷酸包括,但不限于,单磷酸腺苷(AMP),二磷酸腺苷(ADP),三磷酸腺苷(ATP),单磷酸鸟苷(GMP),二磷酸鸟苷(GDP),三磷酸鸟苷(GTP),单磷酸胸苷(TMP),二磷酸胸苷(TDP),三磷酸胸苷(TTP),单磷酸尿苷(UMP),二磷酸尿苷(UDP),三磷酸尿苷(UTP),单磷酸胞苷(CMP),二磷酸胞苷(CDP),三磷酸胞苷(CTP),单磷酸环腺苷(cAMP),单磷酸环鸟苷(cGMP),单磷酸脱氧腺苷(dAMP),二磷酸脱氧腺苷(dADP),三磷酸脱氧腺苷(dATP),单磷酸脱氧鸟苷(dGMP),二磷酸脱氧鸟苷(dGDP),三磷酸脱氧鸟苷(dGTP),单磷酸脱氧胸苷(dTMP),二磷酸脱氧胸苷(dTDP),三磷酸脱氧胸苷(dTTP),单磷酸脱氧尿苷(dUMP),二磷酸脱氧尿苷(dUDP),三磷酸脱氧尿苷(dUTP),单磷酸脱氧胞苷(dCMP),二磷酸脱氧胞苷(dCDP)和三磷酸脱氧胞苷(dCTP)。所述游离核苷酸优选选自AMP,TMP,GMP,CMP,UMP,dAMP,dTMP,dGMP或dCMP。所述游离核苷酸优选腺苷三磷酸(ATP)。所述酶辅因子是使解旋酶或构建体发挥功能的因子。所述酶辅因子优选是二价金属阳离子。所述二价金属阳离子优选为Mg2+,Mn2+,Ca2+或Co2+。所述酶辅因子最优选为Mg2+。
目标RNA多核苷酸
RNA是包含两个或多个核糖核苷酸的大分子。所述目标RNA多核苷酸可以是真核或原核RNA。所述目标RNA多核苷酸可以包含任何核糖核苷酸的任何组合。所述核糖核苷酸可以是天然存在的或人造的。所述目标RNA多核苷酸中的一个或多个核糖核苷酸可被氧化或甲基化。所述目标RNA中的一个或多个核糖核苷酸可被损伤。例如,所述目标RNA可以包含嘧啶二聚体,例如尿嘧啶二聚体。此类二聚体通常与紫外线导致的损伤相关,并是皮肤黑色素瘤的首要原因。所述目标RNA多核苷酸中的一个或多个核糖核苷酸可被修饰,例如用标记物或标签修饰。合适的标记物如下所述。所述目标RNA可包含一个或多个阻断链。
核糖核苷酸含有碱基、核糖和至少一个磷酸基团。所述碱基通常为杂环的。碱基包括但不限于:嘌呤和嘧啶,更具体地,腺嘌呤、鸟嘌呤、胸腺嘧啶、尿嘧啶和胞嘧啶。所述核苷酸通常含有单磷酸,二磷酸或三磷酸。磷酸可被连接在核苷酸的5’或3’侧。
核糖核苷酸包括但不限于,单磷酸腺苷(AMP),单磷酸鸟苷(GMP),单磷酸胸苷(TMP),单磷酸尿苷(UMP),单磷酸胞苷(CMP),单磷酸5-甲基胞苷,二磷酸5-甲基胞苷,三磷酸5-甲基胞苷,单磷酸5-羟甲基胞苷,二磷酸5-羟甲基胞苷和三磷酸5-羟甲基胞苷。所述核苷酸优选选自AMP,TMP,GMP,CMP和UMP。
核糖核苷酸可以是脱碱基的(即缺少碱基)。核糖核苷酸也可缺少碱基和糖(即C3阻断链)。
所述目标RNA多核苷酸的核糖核苷酸可以任何方式彼此连接。如在核酸中一样,所述核糖核苷酸通常通过它们的糖和磷酸基团连接。如嘧啶二聚体中一样,所述核糖核苷酸可通过它们的碱基连接。
RNA是非常多样的分子。所述目标RNA多核苷酸可以是任何天然产生的或合成的核糖核苷酸分子,例如,RNA,信使RNA(mRNA),核糖体RNA(rRNA),核不均一RNA(hnRNA),转移RNA(tRNA),转移信使RNA(tmRNA),微小RNA(miRNA),小核RNA(snRNA),小核仁RNA(snoRNA),信号识别颗粒(SRP RNA),SmY RNA,小卡侯氏体(Small Cajal body-speicifc)RNA(scaRNA),向导RNA(gRNA),剪接前导RNA(SL RNA),反义RNA(asRNA),长非编码RNA(lncRNA),Piwi-相互作用(Piwi-interacting)RNA(piRNA),小分子干扰RNA(siRNA),反式作用siRNA(tasiRNA),重复联系siRNA(rasiRNA),Y RNA,病毒性RNA或染色体的RNA,在适当情况下所有的RNA可以是单链的,双链的或三链的。
所述目标RNA多核苷酸优选是信使RNA(mRNA)。所述目标mRNA可以是交替剪接变体(alternate splice variant)。mRNA和/或交替mRNA剪接变体的变异量(或等级)可能与疾病或健康状况有关。
或者所述目标RNA多核苷酸是微小RNA(或miRNA)。很难在低浓度下检测到的一组RNAs是微小核糖核酸(micro-RNA或miRNAs)。miRNAs是高度稳定的RNA寡聚体,其能转录后调节蛋白质产物。它们通过两个机理中的一个起作用。在植物中,miRNAs已被证明主要通过引导信使RNA的分裂来起作用,然而在动物中,通过miRNAs的基因调控通常包括miRNAs到信使RNAs的3’UTRs的杂交,这阻碍了翻译(Lee et al.,Cell75,843-54(1993);Wightman等,Cell 75,855-62(1993);和Esquela-Kerscher等,Cancer 6,259-69(2006))。miRNAs经常以有缺陷的互补与它们的目标结合。它们已被预测能与多达200个或更多的基因目标分别结合,并调节全人类超过三分之一的基因(Lewis等,Cell 120,15-20(2005))。
用于本发明的合适的miRNAs是本领域已知的。例如,在公众可获得的数据库上存储的合适的miRNAs(Jiang Q.,Wang Y.,Hao Y.,Juan L.,Teng M.,Zhang X.,Li M.,WangG.,Liu Y.,(2009)miR2Disease:a manually curated database for microRNAderegulation in human disease.Nucleics Acides Res.)。已知在肿瘤中某些microRNAs的表达水平会改变,产生了不同肿瘤类型特征模式的microRNA表达(Rosenfeld,N.等,Nature Biotechnology 26,462-9(2008))。另外,已知miRNA表达谱能够比信使RNA表达谱更精确地揭示肿瘤发展的阶段(Lu等,Nature 435,834-8(2005)和Barshack等,TheInternational Journal of Biochemistry&Cell Biology 42,1355-62(2010))。这些发现,结合miRNAs的高稳定性,和在血清和血浆中检测循环的miRNAs的能力(Wang等,Bio化学and Biophysical Research Communications394,184-8(2010);Gilad等,PloS One 3,e3148(2008);和Keller等,Nature Methods 8,841-3(2011)),引起了将microRNAs作为癌症生物标记物的潜在应用的大量兴趣。为了有效地治疗,癌症需要被精确地分类并不同地治疗,但是由于许多不同类型的癌症共享形态学特征这一事实,作为分类的方法的肿瘤形态评估的功效被削弱了。miRNAs提供了潜在地更可靠并低创伤性的解决方案。
mRNAs和miRNAs对诊断或预测疾病或身体状况的用途更详细地讨论如下。
可研究任何数量的RNA。例如,本发明的方法可关注于确定3,4,5,6,7,8,9,10,20,30,50,100或更多个RNA分子的存在,缺失或一个或多个特征。
所述多核苷酸可以是天然存在的或人工合成的。例如,所述方法可用于核实两个或多个人工制造的寡核苷酸的序列。所述方法通常在体外实施。
所述目标RNA多核苷酸可以是任意长度。例如,所述RNA多核苷酸可以是至少10、至少50、至少100、至少150、至少200、至少250、至少300、至少400或至少500个核糖核苷酸长度。所述目标RNA可以是1000或更多个核糖核苷酸,5000或更多个核苷酸或在100000或更多核糖核苷酸长度。全部或只有部分的所述目标RNA可以使用这种方法表征。要被测序的RNA部分优选包含全部目标分子,但可以例如比全部分子少,例如,4个碱基到1kb,例如,4到100个碱基。
所述目标RNA多核苷酸通常存在于或来源于任何合适样本中。本发明通常在已知含有或怀疑含有所述目标RNA多核苷酸的样品中实施。替代地,可对样品实施本发明,以确认在样品中的存在是已知的或期望的一个或多个目标RNAs身份。
所述样品可以是生物样品。本发明可以针对从任何生物体或微生物中获得或提取的样品在体外实施。所述生物体或微生物通常是古细菌的(archaeal),原核的或真核的,并且通常属于以下五界中的一个:植物界,动物界,真菌,原核生物和原生生物。所述目标RNA多核苷酸可来源于真核细胞或可来源于使用真核细胞的转录机制的病毒。本发明可以针对从任何病毒中获得或提取的样品在体外实施。
所述样品优选是液体样品。样品通常包括病人的体液。所述样品可以是尿液,淋巴液,唾液,粘液或羊水,但优选血液,血浆或血清。通常,所述样品来源于人,但替代地可以是来自其他哺乳动物,如自商业上养殖的动物如马,牛,羊或猪或替代地可以是宠物如猫或狗。或者,来源于植物的样品通常从商业作物,如谷类,豆类,水果或蔬菜,例如小麦,大麦,燕麦,菜籽油(canola),玉米,大豆,水稻,香蕉,苹果,番茄,土豆,葡萄,烟草,菜豆(beans),小扁豆,甘蔗,可可或棉花。
所述样品可以是非生物样品。所述非生物样品优选为流体样品。非生物样品的实例包括手术液,水如饮用水、海水或河水,以及用于实验室试验的试剂。
所述样品通常是在被分析前处理,例如通过离心,或通过膜过滤掉不需要的分子或细胞,例如红细胞。所述样品可在采集后立即测量。样品也可通常在分析前被存储,优选低于-70℃存储。所述目标RNA多核苷酸在用于本发明的方法之前通常从所述样品中提取。RNA提取试剂盒是可从例如,New England和商业获得的。
连接
所述衔接体连接到所述目标RNA多核苷酸,以形成修饰的RNA多核苷酸。
在具体的实施方案中,通过共价键将所述衔接体连接到所述目标RNA多核苷酸,所述共价键形成在所述RNA多核苷酸和所述衔接体的各自至少一个反应基团之间;和/或
通过化学或酶促连接将所述衔接体连接到所述RNA多核苷酸。
所述目标RNA多核苷酸可化学地连接到所述衔接体,例如通过共价键。所述目标RNA多核苷酸可通过化学或酶结合连接到所述衔接体。所述目标RNA多核苷酸可通过杂交和/或合成方法连接到所述衔接体。可使用拓扑异构酶将所述RNA多核苷酸连接到所述衔接体。所述RNA多核苷酸可在不止一个,例如两个或三个位点连接到所述衔接体。连接方法可包括一个,两个,三个,四个,五个或更多不同的连接方法。根据本发明可使用任何以下描述的连接方法的组合。
所述RNA多核苷酸和所述衔接体可分别制备然后再连接到一起。这两个组分可以以任何构造连接。例如,它们可以通过它们的末端(即5'或3')连接。合适的构造包括,但不限于,RNA多核苷酸的5'末端连接到衔接体的3'末端和反之亦然。或者,这两组分可通过它们序列内部的核苷酸连接。
所述RNA多核苷酸可使用一个或多个化学交联剂或一个或多个肽连接体连接到所述衔接体。合适的化学交联剂是本领域众所周知的。合适的化学交联剂包括但不限于,包括以下功能性基团的化学交联剂:马来酰亚胺,活性酯,琥珀酰亚胺,叠氮化物,炔烃(例如二苯并环辛醇(DIBO或DBCO),二氟脂环烃和线性炔烃),磷化氢(例如用在无痕和非无痕施陶丁格连接中的磷化氢),卤代乙酰(例如碘乙酰胺),光气型试剂,磺酰氯试剂,异硫氰酸酯,酰基卤类,肼,二硫化物,乙烯砜类,氮杂环丙烷和光敏试剂(例如芳香叠氮化物,双氮杂环丙烷)。
所述RNA多核苷酸和所述衔接体之间的反应可为自发的,例如半胱氨酸/马来酰亚胺,或可能需要外部试剂,例如用于连接叠氮化物和线性炔烃的Cu(I)。
优选的交联剂包括2,5-二氧代吡咯烷-1-基3-(吡啶-2-基二硫烷基)丙酸酯、2,5-二氧代吡咯烷-1-基4-(吡啶-2-基二硫烷基)丁酸酯和2,5-二氧代吡咯烷-1-基8-(吡啶-2-基二硫烷基)辛酸酯、二马来酰亚胺PEG 1k、二马来酰亚胺PEG 3.4k、二马来酰亚胺PEG 5k、二马来酰亚胺PEG 10k、双(马来酰亚胺基)乙烷(BMOE)、双马来酰亚胺己烷(BMH)、1,4-双马来酰亚胺丁烷(BMB)、1,4-双马来酰亚胺基-2,3-二羟基丁烷(BMDB)、BM[PEO]2(1,8-双马来酰亚胺二乙二醇)、BM[PEO]3(1,11-双马来酰亚胺三乙二醇)、三[2-马来酰亚氨基乙基]胺(TMEA)、DTME二硫代二马来酰亚胺乙烷、双马来酰亚胺PEG3、双马来酰亚胺PEG11、DBCO-马来酰亚胺、DBCO-PEG4-马来酰亚胺、DBCO-PEG4-NH2、DBCO-PEG4-NHS、DBCO-NHS、DBCO-PEG-DBCO 2.8kDa、DBCO-PEG-DBCO 4.0kDa、DBCO-15原子-DBCO、DBCO-26原子-DBCO、DBCO-35原子-DBCO、DBCO-PEG4-S-S-PEG3-生物素、DBCO-S-S-PEG3-生物素和DBCO-S-S-PEG11-生物素。最优选的交联剂是3-(2-吡啶基二硫代)丙酸琥珀酰亚胺酯(SPDP)和马来酰亚胺-PEG(2kDa)-马来酰亚胺(α,ω-双马来酰亚胺基聚乙二醇)。
所述连接体可被标记。合适的标签包括但不限于,荧光分子(例如Cy3或555),放射性同位素,如125I,35S,酶,抗体,抗原,多核苷酸和配体例如生物素。这种标签使得可确定连接体的量。所述标签也可是能断裂的纯化标签,例如生物素,或鉴定方法中出现的具体序列。
通过保持连接体的溶度大量过剩于RNA多核苷酸和/或所述衔接体可防止RNA多核苷酸或所述衔接体自身的交联。或者,在其中使用两个连接体的情况下,可使用“锁和钥匙”的设置。各连接体仅一个末端可一起反应以形成更长的连接体,所述各连接体的另一端与构建体(即RNA多核苷酸或所述衔接体)的不同部分反应。
点击化学
所述目标RNA多核苷酸可共价地连接到所述衔接体。所述衔接体可能包含或可能不包含预先结合的DNA解旋酶。在优选实施例中,可使用游离铜点击化学或铜催化的点击化学来制得所述RNA多核苷酸和所述衔接体间的共价键。由于点击化学令人满意的性质和其对于在多种构建块(building blocks)之间生成共价连接的范围,使得在这些应用中使用点击化学。例如,它是快速的,清洁的并且无毒的,只产生无害的副产物。点击化学是由Kolb等在2001首次介绍的术语,为描述更广泛的一系列强大,有选择性的和模块化的构建块,所述构建块可靠地用于小规模和大规模应用(Kolb HC,Finn,MG,Sharpless KB,点击chemistry:diverse chemical function from a few good reactions,Angew.Chem.Int.Ed.40(2001)2004–2021)。他们定义了如下一系列严格标准用于点击化学:“反应必须是模块化的,宽的范围,给出非常高的产量,只产生无害的可通过非色谱法去除的副产物,并且是立体定向的(但不必然是对映选择性)。所要求的方法特征包括简单的反应条件(理想地所述方法应对氧气和水不敏感),容易获得的起始物质和试剂,无溶剂或溶剂的使用,所述溶剂是温和的(例如水)或容易去除的,和简单的产物分离。纯化如果需要必须是通过非色谱法,例如结晶或蒸馏,并且所述产物在生理状态下必须是稳定的”。
下列实施例说明本发明。
实施例1:2’-F-RNA能与DNA解旋酶结合
将带有Cy3标记的2’-F取代修饰的RNA(具体RNA序列为:5’-GCCAGAAACG-3’,序列长度:大于6nt即可,序列没有偏好性)以及相同长度和碱基序列的带Cy3标记的DNA(100nM)与20或30倍物质的量的DNA解旋酶。
T4 Dda-M1G/E94C/C109A/C136A/A360C(3μM)和DNA解旋酶Hel308在缓冲液(20mMHEPES(pH 7.0);50mM NaCl;0.5mM TMAD)中混合并室温孵育60分钟。然后用TBE(天然的)PAGE凝胶分析其结合效率,TBE(天然的)PAGE为4-20%凝胶,160V下运行40分钟,然后用SYBR金染料对核酸进行染色。
结果分别如图1和图2所示,从图中可以看出,DNA解旋酶T4 Dda-M1G/E94C/C109A/C136A/A360C和DNA解旋酶Hel308均能与2’-F-RNA良好的结合,并且结合效果不逊于该酶与DNA的结合。因此,2’-F-RNA序列可以用于纳米孔RNA测序的衔接体制备。
DNA解旋酶T4 Dda-M1G/E94C/C109A/C136A/A360C的氨基酸序列如下SEQ ID NO.1所示:
GTFDDLTEGQKNAFNIVMKAIKEKKHHVTINGPAGTGKTTLTKFIIEALISTGETGIILAAPTHAAKKILSKLSGKEASTIHSILKINPVTYECNVLFEQKEVPDLAKARVLICDEVSMYDRKLFKILLSTIPPWATIIGIGDNKQIRPVDPGENTAYISPFFTHKDFYQCELTEVKRSNAPIIDVATDVRNGKWIYDKVVDGHGVRGFTGDTALRDFMVNYFSIVKSLDDLFENRVMAFTNKSVDKLNSIIRKKIFETDKDFIVGEIIVMQEPLFKTYKIDGKPVSEIIFNNGQLVRIIEAEYTSTFVKARGVPGEYLIRHWDLTVETYGDDEYYREKIKIISSDEELYKFNLFLGKTCETYKNWNKGGKAPWSDFWDAKSQFSKVKALPASTFHKAQGMSVDRAFIYTPCIHYADVELAQQLLYVGVTRGRYDVFYV*
DNA解旋酶Hel308的氨基酸序列如SEQ ID NO.2所示:
MKIESLDLPDEVKQFYLDSGILELYPPQAEAVEKGLLEGRNLLAAIPTASGKTLLAELAMLKSILNGGKALYIVPLRALASEKFKRFREFSKLGIRVGISTGDYDLRDEGLGVNDIIVATSEKTDSLLRNETVWMQEISVVVADEVHLIDSPDRGPTLEITLAKLRKMNPSCQILALSATIGNADELAAWLEAGLVLSEWRPTELREGVFFNGTFYCKDREKSIEQSTKDEAVNLVLDTLREDGQCLVFENSRKNCMAFAKKASSAVKKILSAEDKEALAEIADEVLENSETDTSAALAACIRSGTAFHHAGLTTPLRELVEDGFRAGKIKLISSTPTLAAGLNLPARRVVIRSYRRYSSEDGMQPIPVIEYKQMAGRAGRPRLDPYGEAVLVAKSYEEFVFLFRNYIEADAEDIWSKLGTENALRTHVLSTISNGFARTKEELMEFLEATFFAFQYSNFGLSTVVDECLNFLRQEEMLEKTDTLISTSFGKLVSKLYIDPLSAARIVKGLKEAKILTELTLLHLVCSTPDMRLLYMRNQDYQDINDYVIAHADEFVRVPSPFNYTEYEWFLGEVKTSLLLVDWIHEKSENEICLKFGIGEGDIHAIADIAEWLMHVTAQLARLLELKGAKEAAELEKRIHYGASPELMDLLDIRGIGRMRARKLYESGFRSSAELAGADPVKVAALLGPKIADRIFKQIGRREVLPEIAEPTLPEKSPSSGQKTINDY*
实施例2:含2’-F-RNA前导链的测序接头复合物的孵育和制备合成如下序列:
RNA-Y1:
5'-P-CAGTCGTCCTGGCTTACTCGTCA/iSp18//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU//i2FU/GCTGAAGATGGCAAACTGAGGCG/iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSpC3//iSp C3//iSpC3//iSpC3/-3'
RNA-YB:
5'-
/i2OMeC//i2OMeC//i2OMeA//i2OMeG//i2OMeC//i2OMeC//i2OMeA//i2OMeC//i2OMeG//i2OMeA//i2OMeC//i2OMeC//i2OMeU//i2OMeG//i2OMeA//iXNA_T//iXNA_G//iXNA_A//iXNA_C//iXNA_G/AGTAAGCCAGGACGACTGGC-3'
RNA-Y2:5'-CGCCTCAGTTTGCCATCTTCAGC-3'
分别合成RNA-Y1;RNA-YB以及RNA-Y2链将这三条链分别以1:1.1:1.1在退火缓冲液中进行退火处理形成Y型接头,退火处理具体为从95℃缓慢降温到25℃,降温幅度不超过0.1℃/s。退火缓冲液包括160mM HEPES 7.0,200mM NaCl。
需要注意的是:糖环2’-F修饰,是一种较为常见的技术,在本申请实施例中2’-F修饰的碱基都是U,不需要过多考虑形成二级结构的问题,15个U的长度根据具体酶所占空间的大小确定,经验证,可以至少结合1个酶,且不是2个酶。
在本申请实施例中,i2OMe代表的是糖环修饰的一种,即2’-甲氧基修饰。
在本申请实施例中,iXNA,是一种LNA,与Y1中的iSp18一起用于联合阻滞酶。
取500nM Y型接头、15倍物质的量的DNA解旋酶Hel308(其移动方向是3’到5’端)混合并室温孵育30分钟,然后加入1500倍物质的量的M-P-M并且室温孵育1h;制备得到测序接头复合物,用TBE PAGE凝胶160V下运行40分钟进行分析,并且用SYBR金染料进行染色,其孵育结合效果如图3所示。图3结果显示,形成了测序接头复合物。
之后将测序接头复合物加入DNAPac PA200柱,用洗脱缓冲液进行纯化,以将没有结合到测序接头复合物上的酶从柱子上洗脱掉。然后用10倍柱体积的缓冲液A和缓冲液B的混合物对测序接头复合物进行洗脱。然后汇集主洗脱峰,测量其浓度,获得RNA测序接头并用TBE PAGE凝胶160V下运行40分钟。其中,缓冲液A:20mMNa-CHES,250mM NaCl,4%(W/V)甘油,pH 8.6;缓冲液B:20mM Na-CHES,1MNaCl,4%(W/V)甘油,pH 8.6,最终结果如图4所示。
实施例3:2’-F-RNA前导链的测序接头复合物的上机测试
用牛津纳米孔科技公司的RNA直接建库试剂盒SQK-RNA002,其中将RMX组分替换成实施例2中所制备的纯化后的含有2’-F-RNA前导链的测序接头复合物,最终在ONT的MinION平台上进行测试收集信号如图5所示。结果表明,实施例2的接头或接头复合物可以用于纳米孔测序。
另外,本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。另外,本文中字符“/”,一般表示前后关联对象是一种“或”的关系。
应理解,在本发明实施例中,“与A相应的B”表示B与A相关联,根据A可以确定B。但还应理解,根据A确定B并不意味着仅仅根据A确定B,还可以根据A和/或其它信息确定B。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
Claims (19)
1.一种用于表征目标多核苷酸的衔接体,包含解旋酶的结合区域,所述结合区域包含修饰的RNA多核苷酸,用于结合或装载所述解旋酶。
2.根据权利要求1所述的衔接体,其特征在于,
所述解旋酶包括DNA解旋酶;和/或
所述修饰的RNA多核苷酸选自糖环2’-F修饰的RNA;和/或
所述解旋酶的结合区域不包含DNA。
3.根据权利要求1或2所述的衔接体,其特征在于,所述衔接体包含优先地穿入纳米孔的前导序列;
优选地,所述解旋酶的结合区域位于所述前导序列。
4.根据权利要求1或2所述的衔接体,其特征在于,所述目标多核苷酸为目标RNA多核苷酸和/或目标DNA多核苷酸;
所述目标多核苷酸为单链或双链;
优选地,通过共价键将所述衔接体连接到所述目标多核苷酸,所述共价键形成在所述RNA多核苷酸和所述非核苷酸的各自至少一个反应基团之间;和/或
通过化学或酶促连接将所述衔接体连接到所述目标多核苷酸。
5.一种表征目标多核苷酸的方法,所述方法使用如权利要求1至4中任一项所述的衔接体。
6.根据权利要求5所述的方法,其特征在于,所述方法包括:
a)提供(i)多核苷酸构建体和(ii)解旋酶,所述多核苷酸构建体包含所述目标多核苷酸和如权利要求1至4中任一项所述的衔接体;所述解旋酶包括DNA解旋酶;
b)将a)中提供的所述多核苷酸构建体和所述解旋酶与跨膜孔接触,使得所述解旋酶控制所述目标多核苷酸相对于所述跨膜孔的移动;
c)随着所述目标多核苷酸相对于所述跨膜孔移动,获取一个或多个测量值,其中所述测量值代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。
7.根据权利要求6所述的方法,其特征在于,所述一个或多个特征选自(i)所述目标多核苷酸的长度,(ii)所述目标多核苷酸的同一性,(iii)所述目标多核苷酸的序列,(iv)所述目标多核苷酸的二级结构和(v)所述目标多核苷酸是否是修饰的。
8.根据权利要求6或7所述的方法,其特征在于,所述目标多核苷酸的一个或多个特征可以通过电测量和/或光测量来测量。
9.根据权利要求6或7所述的方法,其特征在于,步骤c)包括随着所述目标多核苷酸相对于所述跨膜孔移动,测量流过所述跨膜孔的电流,其中所述电流代表所述目标多核苷酸的一个或多个特征,并由此表征所述目标多核苷酸。
10.根据权利要求6或7所述的方法,其特征在于,所述目标多核苷酸额外地或进一步通过甲基化、氧化、损伤、用一个或多个蛋白,或用一个或多个标记物、标签或阻断链进行修饰。
11.根据权利要求6或7所述的方法,其特征在于,所述目标多核苷酸可以使用一个或多个锚耦合到所述膜。
12.根据权利要求6或7所述的方法,其特征在于,所述解旋酶包含修饰,以减小多核苷酸结合域中开口的大小,所述目标多核苷酸可以在至少一个构象状态下穿过所述开口从所述解旋酶上解绑。
13.根据权利要求6或7所述的方法,其特征在于,所述解旋酶为:
a)Hel308解旋酶、RecD解旋酶、XPD解旋酶、Dda解旋酶、Tral解旋酶、TrwC解旋酶;
b)衍生自a)中所述任何解旋酶的解旋酶;或
c)a)和/或b)中所述解旋酶的任意组合。
14.根据权利要求6或7所述的方法,其特征在于,所述跨膜孔是蛋白孔或固态孔。
15.根据权利要求8至14中任一项所述的方法,其特征在于,所述跨膜蛋白质孔是蛋白孔,并衍生自如下任一种或多种:溶血素、杀白细胞素,耻垢分枝杆菌(Mycobacteriumsmegmatis)孔蛋白A(MspA)、MspB、MspC、MspD、胞溶素(lysenin)、CsgG、外膜孔蛋白F(OmpF)、外膜孔蛋白G(OmpG),外膜磷脂酶A、奈瑟球菌属(Neisseria)自转运脂蛋白(NalP)和WZA。
16.一种目标多核苷酸相对于跨膜孔移动的方法,所述移动被解旋酶控制,所述方法包括:
a)提供(i)目标RNA多核苷酸或目标DNA多核苷酸,和(ii)解旋酶,所述目标RNA多核苷酸或目标DNA多核苷酸被修饰以包含用于结合或装载所述解旋酶的修饰的RNA多核苷酸区域充当DNA解旋酶的结合区域;
其中,所述修饰的RNA多核苷酸包含2’-F修饰的RNA;
b)将a)中提供的所述目标RNA多核苷酸或目标DNA多核苷酸、和所述解旋酶与跨膜孔接触,使得所述解旋酶控制所述RNA多核苷酸相对于所述跨膜孔的移动。
17.一种复合物,所述复合物包含权利要求1至4中任一项所述的衔接体和解旋酶;
所述解旋酶包括所述的DNA解旋酶;
优选地,所述DNA解旋酶选自:
a)Hel308解旋酶、RecD解旋酶、XPD解旋酶、Dda解旋酶、Tral解旋酶、或TrwC解旋酶;
b)衍生自a)中所述任何解旋酶的解旋酶;或
c)a)和/或b)中所述解旋酶的任意组合。
18.一种用于表征目标多核苷酸的试剂盒,所述试剂盒包含权利要求1至4中任一项所述的衔接体和所述解旋酶或权利要求18所述的复合物;
所述目标多核苷酸为目标RNA多核苷酸或目标DNA多核苷酸。
19.一种分离的多核苷酸,所述多核苷酸包含RNA多核苷酸或DNA多核苷酸,和修饰的RNA多核苷酸区域,所述修饰的RNA多核苷酸区域用于结合解旋酶;
其中,所述修饰的RNA多核苷酸包含2’-F修饰的RNA;
所述解旋酶包括DNA解旋酶。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111573545 | 2021-12-21 | ||
CN2021115735458 | 2021-12-21 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116497102A true CN116497102A (zh) | 2023-07-28 |
Family
ID=86901306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211624612.9A Pending CN116497102A (zh) | 2021-12-21 | 2022-12-16 | 用于表征目标多核苷酸的衔接体、方法及其用途 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN116497102A (zh) |
WO (1) | WO2023116575A1 (zh) |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5200302B2 (ja) * | 2005-01-05 | 2013-06-05 | バイオヘリツクス・コーポレイシヨン | ヘリカーゼを使用するrnaターゲットの同定 |
CN105255881A (zh) * | 2009-07-31 | 2016-01-20 | 埃泽瑞斯公司 | 用于蛋白质表达的具有未修饰和修饰核苷酸的组合的rna |
WO2016053891A1 (en) * | 2014-09-29 | 2016-04-07 | The Regents Of The University Of California | Nanopore sequencing of polynucleotides with multiple passes |
US10443093B2 (en) * | 2014-10-14 | 2019-10-15 | Ms² Array Llc | Fluorous oligonucleotide microarray |
KR102457147B1 (ko) * | 2014-10-17 | 2022-10-19 | 옥스포드 나노포어 테크놀로지즈 피엘씨 | 나노 세공 rna 특징 규명을 위한 방법 |
WO2019226822A1 (en) * | 2018-05-23 | 2019-11-28 | The Regents Of The University Of California | Methods of analyzing capped ribonucleic acids |
WO2021036995A1 (en) * | 2019-08-23 | 2021-03-04 | Nanjing University | Direct microrna sequencing using enzyme assisted sequencing |
-
2022
- 2022-12-16 WO PCT/CN2022/139679 patent/WO2023116575A1/zh unknown
- 2022-12-16 CN CN202211624612.9A patent/CN116497102A/zh active Pending
Also Published As
Publication number | Publication date |
---|---|
WO2023116575A1 (zh) | 2023-06-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11021747B2 (en) | Method for nanopore RNA characterisation | |
EP3548636B1 (en) | Methods and systems for characterizing analytes using nanopores | |
Fuller et al. | Real-time single-molecule electronic DNA sequencing by synthesis using polymer-tagged nucleotides on a nanopore array | |
US9938573B2 (en) | Methods and kits for nucleic acid sequencing | |
EP2815235B1 (en) | Aptamer method | |
EP2895618B1 (en) | Sample preparation method | |
EP3892627A1 (en) | Transmembrane pore consisting of two csgg pores | |
EP3259281B1 (en) | Hetero-pores | |
EP2952587A1 (en) | High throughput nucleic acid sequencing by expansion | |
KR20170068540A (ko) | 방법 | |
KR20140048142A (ko) | 커플링 방법 | |
US20210017580A1 (en) | Small rna detection method based on small rna primed xenosensor module amplification | |
CN114854826A (zh) | 序列、包含序列的接头及其用途 | |
US20240076719A9 (en) | Method | |
CN114262735A (zh) | 用于表征多核苷酸的衔接体及其用途 | |
CN115698331A (zh) | 使用检测器选择性地表征多核苷酸的方法 | |
CN116497102A (zh) | 用于表征目标多核苷酸的衔接体、方法及其用途 | |
CN112204154A (zh) | Dna-孔隙-聚合酶复合物的酶促富集 | |
Cho | Development of Single Molecule Electronic SNP Assays using Polymer Tagged Nucleotides and Nanopore Detection |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |