DE112005002331T5 - Method, system and apparatus for compiling and using biological knowledge - Google Patents
Method, system and apparatus for compiling and using biological knowledge Download PDFInfo
- Publication number
- DE112005002331T5 DE112005002331T5 DE112005002331T DE112005002331T DE112005002331T5 DE 112005002331 T5 DE112005002331 T5 DE 112005002331T5 DE 112005002331 T DE112005002331 T DE 112005002331T DE 112005002331 T DE112005002331 T DE 112005002331T DE 112005002331 T5 DE112005002331 T5 DE 112005002331T5
- Authority
- DE
- Germany
- Prior art keywords
- assertions
- biological
- nodes
- new
- knowledge
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 0 CC=*CCC=CCN Chemical compound CC=*CCC=CCN 0.000 description 1
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
Landscapes
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Theoretical Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
Verfahren,
um neues biologisches Wissen zu generieren, das die folgenden Schritte
umfasst:
(a) die Bereitstellung einer Datenbank biologischer
Assertionen, die eine Vielzahl von Knoten umfasst, die biologische Elemente
repräsentieren,
und Deskriptoren, die die Elemente oder Beziehungen zwischen den
Knoten charakterisieren;
(b) das Gewinnen einer Teilmenge von
Assertionen aus der Datenbank, die eine Reihe von biologischen Kriterien
erfüllen,
die ein Nutzer so spezifiziert hat, dass sie ein ausgewähltes biologisches
System definieren;
(c) die Kompilierung der erfassten Daten,
um eine Einheit zu erzeugen, die eine biologische Wissensbank von
Assertionen bildet, die potenziell relevant für das genannte ausgesuchte
biologische System ist; und
(d) die Transformierung der genannten
Einheit, um neues biologisches Wissen über das genannte biologische
System zu generieren.Method for generating new biological knowledge comprising the following steps:
(a) providing a database of biological assertions comprising a plurality of nodes representing biological elements and descriptors characterizing the elements or relationships between the nodes;
(b) obtaining from the database a subset of assertions that satisfy a set of biological criteria that a user has specified to define a selected biological system;
(c) compiling the acquired data to produce a unit that constitutes a biological knowledge bank of assertions that is potentially relevant to said selected biological system; and
(d) transforming said entity to generate new biological knowledge about said biological system.
Description
Verwandte Anmeldungenrelative Registrations
Diese Anmeldung erhebt Anspruch auf die Nutzung der provisorischen Anmeldung Nr. 60/535,352 mit dem Titel „Verfahren, System und Vorrichtung zur Zusammenstellung und Nutzung von biologischem Wissen", beantragt am 9. Januar 2004, deren Offenlegung hierin durch Bezugnahme eingefügt ist.These Registration entitles you to use the provisional application No. 60 / 535,352 entitled "Process, System and device for the compilation and use of biological Knowledge ", requested on January 9, 2004, the disclosure of which is incorporated herein by reference.
Technisches Gebiettechnical area
Die Erfindung betrifft Verfahren, Systeme und Vorrichtungen, um neues biologisches Wissen zu ermitteln, insbesondere Verfahren, Systeme und Vorrichtungen, um eine biologischen Wissensbank zusammenzustellen, Verfahren, Systeme und Vorrichtungen, um Teilmengen aus biowissenschaftlichen Daten und Informationen zu bilden und in biologische Modelle zu transformieren sowie Verfahren, Systeme und Vorrichtungen zur Vereinfachung der elektronischen Verarbeitung von und des Schlussfolgerns aus biologischen Informationen.The The invention relates to methods, systems and devices for new to identify biological knowledge, in particular procedures, systems and devices to assemble a biological knowledge bank, Methods, systems and devices to subsets of life science To form data and information and into biological models too transform as well as methods, systems and devices for simplification the electronic processing of and the reasoning biological information.
Hintergrundbackground
Die in der heutigen Welt erzeugte Menge biologischer Informationen nimmt dramatisch zu. Man schätzt, dass die Menge der Information sich derzeit alle vier bis fünf Jahre verdoppelt. Mit der riesigen Informationsmenge, die verarbeitet und analysiert werden muss, sind traditionelle Verfahren (bzw. Methoden) des Erkennens und Verstehens der Bedeutung dieser Informationen, vor allem im Bereich der Biowissenschaften, überfordert.The takes in the world today generated amount of biological information dramatically too. It is estimated, that the amount of information is currently every four to five years doubled. With the huge amount of information that processes and needs to be analyzed are traditional methods (or methods) recognizing and understanding the meaning of this information, especially in the field of life sciences, overwhelmed.
Um zu einem tatsächlichen Verständnis eines biologischen Systems zu gelangen, muss ein Forscher in den Biowissenschaften Informationen aus vielen Quellen zusammenfügen. Das Begreifen biologischer Systeme wird durch die interdisziplinäre Natur der Biowissenschaften erschwert. Um biologische Systeme verstehen zu können, kann umfassendes Wissen in Genetik, Zellbiologie, Biochemie, Medizin und vielen anderen Fachgebieten erforderlich sein. Um biologische Systeme zu verstehen, kann es nötig sein, viele verschiedene Informationen zu verknüpfen. Biowissenschaftliche Informationen können Material über grundlegende Chemie, Proteine, Zellen, Gewebe und Auswirkungen auf Organismen und Populationen umfassen – die alle miteinander in Wechselbeziehung stehen könnten. Diese Wechselbeziehungen können komplex, kaum verstanden oder verborgen sein.Around to an actual understanding To get to a biological system, a researcher needs in the Life sciences combine information from many sources. The Grasping biological systems is by the interdisciplinary nature biosciences. To understand biological systems to be able to can have extensive knowledge in genetics, cell biology, biochemistry, medicine and many other fields of expertise. To biological It may be necessary to understand systems be to link a lot of different information. bioscience Information can be material about basic Chemistry, proteins, cells, tissues and effects on organisms and populations include - the all could interact with each other. These interactions can complex, barely understood or hidden.
Es wird bereits versucht, elektronische Modelle biologischer Systeme zu erschaffen. Dazu gehören die Zusammenstellung und Organisation enormer Datenmengen und der Aufbau eines Systems, das die Daten dazu verwenden kann, das verhalten eines biologischen Systems zu simulieren. Wegen der Komplexität der Biologie und der schieren Datenmenge kann der Aufbau eines solchen Systems Hunderte von Jahren dauern und mehrere zehn Millionen Dollar kosten. Dazu stehen diejenigen, die in den Biowissenschaften neue Einsichten und neue Erkenntnisse suchen, vor der immer schwierigeren Aufgabe, die richtigen Daten aus den Bergen von Informationen, zusammengetragen aus vollkommen unterschiedlichen Quellen, zu verknüpfen. Unternehmen, die bereit waren, dafür Mittel zu investieren, hatten bisher keinen Erfolg beim Erarbeiten von tatsächlich brauchbaren Modellen, die Forscher wesentlich dabei unterstützen, biowissenschaftliches Wissen zu vergrößern. Deshalb sind die derzeitigen zur Verarbeitung und Analyse von wissen entwickelten Systeme zur Verarbeitung und Aufzeichnung biowissenschaftliche Daten bei weitem nicht optimal und maßgebliche neue Leistungen werden benötigt.It is already trying to electronic models of biological systems to create. This includes the compilation and organization of enormous amounts of data and the Build a system that can use the data to behave like that biological system. Because of the complexity of biology and the sheer volume of data can be the structure of such a system Hundreds of years and cost tens of millions of dollars. These are the ones that provide new insights in the life sciences and seek new knowledge, against the ever more difficult task that correct data from the mountains of information, gathered from completely different sources. Companies that were ready for it Investing funds had so far been unsuccessful in working out of actually usable Models that help researchers significantly improve the bioscience To increase knowledge. Therefore are the current ones developed for the processing and analysis of knowledge Systems for processing and recording life sciences data far from optimal and authoritative new services are needed.
Genauer ausgedrückt, braucht die Branche eine Methode, um die riesigen Mengen von Wissen aus den verschiedenen Bereichen der Biowissenschaften zusammenzustellen, und mit deren Hilfe kenntnisreiche und sinnvolle Modelle zu schaffen, die geprüft und abgefragt werden können, um neue biologische Beziehungen, Pfade, Ursachen und Wirkungen und andere Einsichten effizient und einfach zu erkennen.More accurate expressed The industry needs a method to get the huge amounts of knowledge out different life sciences, and with their help to create knowledgeable and meaningful models, the tested and can be queried around new biological relationships, paths, causes and effects and to see other insights efficiently and easily.
Zusammenfassung der ErfindungSummary the invention
In Übereinstimmung mit der Erfindung wird erkannt, dass die Bereitstellung von Mitteln für den raschen und effektiven Aufbau von Teilwissensbanken und abgeleiteten Wissensbanken ein Schlüssel ist zur Bereitstellung nützlicher und leichter zu bedienenden biologischer Wissensbanken, die biologische Systeme effektiv nachstellen können. Diese spezialisierten Wissensbanken können von einer globalen Wissensbank ausgehend aufgebaut werden, indem zu Beginn eine potenziell relevante Teilmenge von biowissenschaftlich relevanten Daten, die von einem Benutzer spezifizierte Kriterien erfüllen, erfasst wird eine speziell ausgerichtete Wissensbank mit der hier dargelegten Struktur zusammengestellt wird.In accordance With the invention it is recognized that the provision of means for the quick and effectively building part-knowledge banks and derived knowledge bases a key is to provide useful and easier-to-use biological knowledge banks, the biological systems can effectively adjust. These specialized knowledge bases can be from a global knowledge base starting from a potentially relevant one Subset of life science relevant data by a user meet specified criteria, A specially designed knowledge base with the set out here is recorded Structure is assembled.
Diese können in verschiedenen Formaten verfeinert, augmentiert, untersucht und in verschiedenen Formaten dargestellt, durch menschliche Beobachtung und Analyse genutzt werden; dazu können mithilfe einer Vielzahl von Instrumenten Verständnis und Aufdeckung versteckter Interaktionen und Beziehungen in biologischen Systemen erleichtert werden, d. h. neues biologisches Wissen wird geschaffen. Das wiederum erlaubt das Aufstellen neuer Hypothesen über biologische Pfadverläufe, die auf dem neuen biologischen Wissen basieren, und erlaubt dem Nutzer, eine Hypothese zu bestätigen oder zu widerlegen, indem er biologische Experimente mit Biomolekülen, Zellen und Tiermodellen oder einen klinischen Versuch entwirft und durchführt.These can be refined in different formats, augmented, examined and presented in various formats, used by human observation and analysis; this can be facilitated by a variety of tools to understand and detect hidden interactions and relationships in biological systems, ie new biological knowledge is created. This, in turn, allows new hypotheses about biological pathways based on new biological knowledge to be set up and allowed Users to confirm or refute a hypothesis by designing and performing biological experiments with biomolecules, cells and animal models, or a clinical trial.
Die Erfindung bietet also ein neues Paradigma, neue Verfahren, Vorrichtungen und Instrumente, die auf eine globale Wissensbank angewendet werden können. Die Instrumente und Verfahren ermöglichen eine effiziente Durchführung von Erkundungsprojekten in den für die Biowissenschaften relevanten Bereichen. Die Erfindung stellt neue Verfahren und Instrumente bereit, die es erlauben, eine Wissensbank zu konditionieren, um bei einem Projekt oder einer Aufgabe sowohl Fokussierung als auch Flexibilität zu ermöglichen. Die Erfindung erlaubt es auch, jedes biologische Thema zu behandeln, egal wie obskur oder esoterisch es sein mag, vorausgesetzt, es gibt zumindest einige Assertionen in einer globalen Wissensbank, die für dieses Thema relevant sind. Assertionen sind wahre Aussagen, die sich auf ein existierendes Objekt in einem System oder eine wahre Aussage über ein Objekt in diesem System und einen Literalwert oder eine beliebige Kombination daraus beziehen. Jede wahre Aussage in einer Wissensbank oder einer Einheit wird hier als eine Assertion bezeichnet.The Invention thus provides a new paradigm, new methods, devices and instruments applied to a global knowledge base can. The tools and procedures allow efficient implementation of Exploration projects in the for the life sciences relevant areas. The invention provides new procedures and tools that allow a knowledge bank to condition for a project or a task both Focusing as well as flexibility to enable. The invention also makes it possible to treat every biological topic no matter how obscure or esoteric, provided there is at least some assertions in a global knowledge base that for this Topic are relevant. Assertions are true statements that are based on an existing object in a system or a true statement about a Object in this system and a literal value or any one Combine it. Every true statement in a knowledge bank or a unit is referred to herein as an assertion.
Ein Aspekt der vorliegenden Erfindung ist die Erfassung einer Teilmenge von Daten, die notwendig oder hilfreich ist, aus einer globalen Wissensbank oder einer zentralen Datenbank und der Neuaufbau einer spezialisierteren Teilwissensbank, die speziell für den vorliegenden Zweck konzipiert wird. Dazu ist es wichtig, dass die Struktur der globalen Wissensbank so konzipiert wird, dass man eine Teilwissensbank erfassen kann, die die relevanten Beziehungen zwischen den Informationen der Teilwissensbank bewahrt. Die Teilwissensbank, oder was hier der Einfachheit halber als eine Einheit bezeichnet wird, erlaubt eine Selektion und die logische Organisation von scheinbar verschiedenen Daten in ein kohärentes Modell eines beliebigen biologischen Systems, definiert durch irgendeine gewünschte Kombination von Kriterien. Diese Einheiten sind Mikrokosmen der globalen Wissensbank, sie können in dem Gebiet, das sie abdecken, detaillierter und umfassender als die globale Wissensbank sein und einfacher, produktiver und effizienter genutzt werden. Einheiten können zusammengeführt werden, sie können sich gegenseitig augmentieren oder wieder zur globalen Wissensbank hinzugefügt werden. Wie bereits dargestellt, sind die Begriffe Einheit und Wissensbank austauschbar.One Aspect of the present invention is the detection of a subset from data that is necessary or helpful, from a global one Knowledge base or a central database and the rebuilding of a more specialized knowledge bank, specifically for the present Purpose is designed. For this it is important that the structure of the global knowledge bank is designed to be a knowledge bank can capture the relevant relationships between the information the partial knowledge bank. The knowledge bank, or what here for the sake of simplicity, is called a unit a selection and the logical organization of seemingly different ones Data in a coherent Model of any biological system defined by any desired Combination of criteria. These units are microcosms of the global Knowledge base, you can in the area they cover, more detailed and comprehensive than the be a global knowledge bank and easier, more productive and more efficient be used. Units can together they can, they can Augment each other or back to the global knowledge bank added become. As already mentioned, the terms unit and knowledge bank are interchangeable.
Ein wichtiger Aspekt der Erfindung ist, dass sie die Generierung von abgeleiteten Einheiten ermöglicht. Abgeleitete Einheiten sind solche, in denen auf der Basis von logischen Inferenzen aus Assertionen neue Assertionen erzeugt werden. Abgeleitete Einheiten können durch das Ziehen von Schlüssen und andere Algorithmen augmentiert werden. Die Augmentierung wird durch das Hinzufügen neuen Wissens erreicht, das möglicherweise, aber nicht notwendigerweise Teil der ursprünglichen Einheit oder der globalen Wissensbank ist. Die Augmentierung beinhaltet das Ziehen von Schlüssen aus der Einheit und den Abgleich der Einheit mit externen Daten (z. B. Labordaten, klinischen Daten, Literaturdaten usw.), ist aber nicht darauf beschränkt.One important aspect of the invention is that it is the generation of derived units allows. Derived units are those in which based on logical Inferences from assertions are generated new assertions. Derived units can by drawing conclusions and other algorithms are augmented. The augmentation is through The addition achieved new knowledge that may, but not necessarily part of the original entity or the global one Knowledge bank is. Augmentation involves pulling locks unit and alignment of the unit with external data (e.g. Laboratory data, clinical data, literature data, etc.), but is not limited to this.
Die Erfindung stellt Verfahren zum Aufbau einer Wissensbank, Mittel zur deren Erstellung und Instrumente zu derer Verfeinerung bereit. Im Einzelnen bietet die Erfindung Verfahren an, um eine biologische Wissensbank aufzubauen, indem zuerst eine Datenbank biologischer Assertionen oder Mittel wie eine Benutzeroberfläche zum Zugriff auf eine solche Wissensbank bereitgestellt werden, die eine Vielzahl von Knoten umfasst, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren. Eine bevorzugte Wissensbank ist in der parallel anhängigen US-Patentanmeldung mit der Seriennummer 10/644,582 des selben Anmelders dargelegt, deren Offenlegung hierin durch Bezugnahme eingefügt ist. Als nächstes erfasst die Methode eine Teilmenge von Assertionen aus der Wissensbank, die eine Reihe biologischer Kriterien erfüllt, die ein Benutzer spezifiziert hat, um ein ausgewähltes biologisches System zu definieren. Dann werden die erfassten Daten kompiliert, um eine Einheit, d. h. eine biologische Wissensbank von Assertionen, die für das ausgewählte biologische System relevant sein könnten, zu erstellen.The Invention provides methods for building a knowledge base, means for their preparation and instruments for their refinement. In particular, the invention provides methods to provide a biological Building a knowledge base by first creating a database of biological Assertions or means such as a user interface for accessing such a knowledge base provided comprising a plurality of nodes which represent biological elements, and descriptors that describe the elements or relationships between them characterize. A preferred knowledge base is in parallel pending U.S. Patent Application Serial No. 10 / 644,582 of the same assignee the disclosure of which is incorporated herein by reference. Next the method captures a subset of assertions from the knowledge base, which meets a set of biological criteria that a user specifies has to be a selected one to define a biological system. Then the collected data is compiled, by one unit, d. H. a biological knowledge bank of assertions, the for the selected one biological system could be relevant to create.
Die Erfindung stellt Verfahren zur Ermittlung von neuem biologischen Wissen bereit. Die Verfahren beinhalten die Bereitstellung einer Datenbank biologischer Assertionen, die eine Vielzahl von Knoten umfasst, die biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren. Die Verfahren beinhalten auch die Erfassung einer Teilmenge von Assertionen, die eine Reihe von biologischen Kriterien erfüllen, die ein Benutzer spezifiziert hat, um ein ausgewähltes biologisches System zu definieren. Die Verfahren beinhalten darüber hinaus die Kompilierung der erfassten Assertionen, um eine biologische Wissensbank von Assertionen, die für das ausgewählte biologische System relevant sein könnten, zu erstellen, und die biologische Wissensbank danach zu analysieren, um neues biologisches Wissen zu ermitteln. Die Erfindung stellt auch Verfahren zur Generierung von neuem biologischen Wissen bereit, indem eine Datenbank biologischer Assertionen bereitgestellt wird, die eine Vielzahl von Knoten umfasst, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren, und dann eine Vielzahl der biologischen Assertionen zu transformieren, um ein abgeleitetes Wissensnetzwerk zu erzeugen.The invention provides methods for discovering new biological knowledge. The methods include providing a database of biological assertions that includes a plurality of nodes that represent biological elements and descriptors that characterize the elements or relationships between them. The methods also include detecting a subset of assertions that meet a set of biological criteria that a user has specified to define a selected biological system. The methods also include compiling the detected assertions to create a biological knowledge bank of assertions that may be relevant to the selected biological system, and then analyzing the biological knowledge base to discover new biological knowledge. The invention also provides methods for generating new biological knowledge by providing a database of biological assertions comprising a plurality of nodes representing biological elements and descriptors characterizing the elements or relationships between them, and then a To transform a variety of biological assertions to produce a derived knowledge network.
Die Erfindung bietet Verfahren, um eine biologische Wissensbank zu nutzen, darunter auch die Bereitstellung einer Datenbank biologischer Assertionen, die eine Vielzahl von Knoten umfasst, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren, um eine Vielzahl der biologischen Assertionen zu transformieren und so ein abgeleitetes Wissensnetzwerk zu erzeugen und neues biologisches Wissen aus der Einheit zu schöpfen.The Invention provides methods for using a biological knowledge bank including the provision of a database of biological assertions, which includes a plurality of nodes, which biological elements represent, and descriptors that describe the elements or relationships between them characterize a variety of biological assertions to transform and thus create a derived knowledge network and to draw new biological knowledge from the unit.
Die Erfindung stellt Systeme bereit, um eine biologische Wissensbank zusammenzustellen. Die Systeme beinhalten eine Datenbank biologischer Assertionen in elektronischer Form, die eine Vielzahl von Knoten umfasst, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren. Die Systeme beinhalten auch eine Anwendung zur Erfassung einer Teilmenge von Assertionen, die eine Reihe biologischer Kriterien erfüllt, die ein Benutzer spezifiziert hat, um ein ausgewähltes biologisches System zu definieren, aus der Datenbank. Die Systeme beinhalten außerdem noch einen Wissens-Assembler, der für die Kompilierung der erfassten Assertionen konfiguriert ist, um so eine biologische Wissensbank von Assertionen zu erzeugen, die für das ausgewählte biologische System potenziell relevant sind. Die Erfindung stellt auch Systeme bereit, um eine biologische Wissensbank einschließlich einer Datenbank biologischer Assertionen zusammenzustellen, die eine Vielzahl von Knoten haben, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren, sowie eine Anwendung zur Transformation einer Vielzahl von biologischen Assertionen, um ein abgeleitetes Wissensnetz zu erzeugen.The The invention provides systems to a biological knowledge base together. The systems include a database of biological Assertions in electronic form containing a variety of nodes includes which biological elements represent and descriptors, which characterize the elements or relationships between them. The Systems also include an application for acquiring a subset assertions that meet a number of biological criteria that a user has specified to a selected biological system define, from the database. The systems also still include a knowledge assembler for the compilation of the detected assertions is configured to to create such a biological knowledge bank of assertions that for the selected biological System are potentially relevant. The invention also provides systems ready to build a biological knowledge base including a database assemble biological assertions that are a variety of Have nodes that represent biological elements and descriptors, which characterize the elements or relationships between them, and an application for transforming a variety of biological Assertions to create a derived knowledge network.
Die Erfindung stellt Rechner zur Zusammenstellung einer biologischen Wissensbank und zur Ermittlung von neuem biologischen Wissen bereit. Die Rechner umfassen Mittel zum Zugriff auf eine elektronische Datenbank biologischer Assertionen, die eine Vielzahl von Knoten umfasst, welche biologische Elemente repräsentieren, und Deskriptoren, die die Elemente oder Beziehungen zwischen diesen charakterisieren, sowie eine Benutzeroberfläche für spezifische biologische Kriterien, die von diesem Rechner zum Aufbau einer Einheit verwendet werden, die ein ausgewähltes biologisches System darstellt. Die Rechner umfassen außerdem eine Computeranwendung zur Erfassung einer Teilmenge von Assertionen, die vom Benutzer spezifizierte biologische Kriterien erfüllen, aus der Datenbank, und einen Wissens-Assembler, für die Kompilierung der erfassten Assertionen konfiguriert ist, um so eine biologische Wissensbank von Assertionen zu erzeugen, die für das ausgewählte biologische System potenziell relevant sind. Die Erfindung stellt auch einen Herstellungsartikel mit einem computerlesbaren Programmträger bereit, auf dem computerlesbare Instruktionen enthalten sind, um die oben genannten Verfahren und Systeme anzuwenden.The Invention provides computer for compilation of a biological Knowledge bank and to identify new biological knowledge. The computers include means for accessing an electronic database biological assertions that includes a variety of nodes, which represent biological elements, and descriptors that characterize the elements or relationships between them, as well as a user interface for specific biological criteria used by this calculator to build a unit be used, which is a selected one represents biological system. The calculators also include a Computer application for detecting a subset of assertions, meet the user-specified biological criteria the database, and a knowledge assembler, for compiling the captured Assertions is configured to be a biological knowledge base of assertions necessary for the selected biological System are potentially relevant. The invention also provides a Ready for use with a computer readable program support on the computer readable instructions are included to the above apply the methods and systems mentioned.
In verschiedenen Ausgestaltungen beinhaltet die Erfindung methodische Schritte, Anwendungen und Rechner, um aus den erfassten Assertionen Schlüsse zu ziehen, damit logische Inkonsistenzen in der Wissensbank beseitigt werden können; um aus den erfassten Assertionen Schlüsse zu ziehen, damit dadurch neues biologisches Wissen generiert wird; um aus den erfassten Assertionen Schlüsse zu ziehen, um so die Assertionen darin zu augmentieren, indem man der Wissensbank zusätzliche Assertionen aus der Datenbank, die den Auswahlkriterien entsprechen, hinzufügt; oder um die Assertionen darin zu augmentieren, indem man zusätzliche Assertionen aus Datenquellen außerhalb der Datenbank zur Wissensbank hinzufügt.In In various embodiments, the invention includes methodological Steps, applications, and calculators to draw conclusions from the assertions so that logical inconsistencies in the knowledge base are eliminated can; to draw conclusions from the recorded assertions, thereby new biological knowledge is generated; to get out of the detected assertions conclusions in order to augment the assertions in it by the knowledge bank additional Assertions from the database that meet the selection criteria, adds; or to augment the assertions in it by adding additional Assertions from data sources outside adds the database to the knowledge base.
In verschiedenen Ausgestaltungen beinhaltet die Erfindung methodische Schritte, Anwendungen und Rechner, um aus den erfassten Assertionen Schlüsse zu ziehen, um die Assertionen darin zu augmentieren, indem man zusätzliche Assertionen, die in der Einheit neu sind, zur Wissensbank hinzufügt; indem man eine Pfadanalyse für die Wissenseinheit durchführt, um einen oder mehrere Pfade zu erfassen, der sich auf experimentelle oder klinische Daten bezieht; indem man auf die erfassten Assertionen eine homologe Transformation anwendet; indem man mit den erfassten Assertionen eine logische Simulation durchführt oder indem man der Einheit zusätzliche Assertionen aus Datenquellen außerhalb der Datenbank hinzufügt.In In various embodiments, the invention includes methodological Steps, applications, and calculators to draw conclusions from the assertions to augment the assertions in it by adding additional Add assertions that are new in the unit to the knowledge base; by doing to do a path analysis for the knowledge unit performs, to capture one or more paths that are experimental or clinical data relates; by looking at the detected assertions applies a homologous transformation; by entering with the Assertions performs a logical simulation or by giving the unit additional Assertions from data sources outside adds to the database.
In verschiedenen Ausgestaltungen beinhaltet die Erfindung methodische Schritte, Anwendungen und Rechner, um aus den biologischen Assertionen auf neue Assertionen zu schließen; um eine Teilmenge von Assertionen aus der Datenbank zu erfassen, die eine vom Benutzer spezifizierte Reihe von biologischen Kriterien zur Festlegung eines ausgewählten biologischen Systems erfüllt; um mathematische Operationen auf Reihen biologischer Assertionen anzuwenden, um dadurch neue Assertionen zu erzeugen; und um biologische Assertionen zusammenzufassen, um neue Assertionen zu erzeugen.In In various embodiments, the invention includes methodological Steps, applications and calculators to get out of the biological assertions to conclude new assertions; to capture a subset of assertions from the database, the user-specified set of biological criteria to set a selected one biological system met; mathematical operations on series of biological assertions to create new assertions; and biological Assertions to create new assertions.
In verschiedenen Ausgestaltungen sind Knoten Enzyme, Kofaktoren, Enzymsubstrate, Enzyminhibitoren, DNS, RNS, Transkriptionsregulatoren, DNS-Aktivatoren, DNS-Repressoren, Signalmoleküle, Transmembran-Moleküle, Transportmoleküle, Fressmoleküle, Regulationsmoleküle, Hormone, Zytokine, Chemokine, Antikörper, Strukturmoleküle, Metaboliten, Vitamine, Toxine, Nährstoffe, Mineralien, Agonisten, Antagonisten, Liganden, Rezeptoren oder Kombinationen daraus. In anderen Ausgestaltungen sind Knoten Protonen, Gasmoleküle, organische Moleküle, Aminosäuren, Peptide, Proteinbereiche, Proteine, Glykoproteine, Nukleotide, Oligonukleotide, Polysaccharide, Lipide, Glykolipide oder Kombinationen daraus. In weiteren Ausgestaltungen umfassen Knoten Zellen, Gewebe oder Organe oder Moleküle, die als Medikamente infrage kommen.In various embodiments, nodules are enzymes, cofactors, enzyme substrates, enzyme inhibitors, DNA, RNA, transcriptional regulators, DNA activators, DNA repressors, signaling molecules, transmembrane molecules, transport molecules, scavenging molecules, regulatory molecules, hormones, Zy tokines, chemokines, antibodies, structural molecules, metabolites, vitamins, toxins, nutrients, minerals, agonists, antagonists, ligands, receptors or combinations thereof. In other embodiments, nodes are protons, gas molecules, organic molecules, amino acids, peptides, protein regions, proteins, glycoproteins, nucleotides, oligonucleotides, polysaccharides, lipids, glycolipids, or combinations thereof. In further embodiments, nodules include cells, tissues or organs or molecules that may be considered drugs.
In verschiedenen Ausgestaltungen können die durch die Knoten und Assertionen repräsentierten biologischen Informationen experimentelle Daten, Wissen aus der Fachliteratur, Patientendaten, Daten aus klinischen Versuchen, Compliance-Daten, chemische Daten, medizinische Daten oder hypothetische Daten umfassen. In anderen Ausgestaltungen können die biologischen Informationen wahre Aussagen über ein Molekül, eine biologische Struktur, einen physiologischen Zustand, eine Eigenschaft, einen Phänotyp oder einen biologischen Prozess repräsentieren.In different configurations can the biological information represented by the nodes and assertions experimental data, knowledge from the specialist literature, patient data, data from clinical trials, compliance data, chemical data, medical Include data or hypothetical data. In other embodiments, the biological information true statements about a molecule, a biological structure, a physiological state, a property, a phenotype or represent a biological process.
In verschiedenen Ausgestaltungen repräsentieren die biologischen Informationen ein Molekül, eine biologische Struktur, einen physiologischen Zustand, eine Eigenschaft, einen Phänotyp, einen biologischen Prozess, klinische Daten, medizinische Daten, Daten über Krankheiten oder Unverträglichkeiten. In verschiedenen Ausgestaltungen beinhaltet die biologische Information einen Deskriptor für Zustand, Ort, Menge oder Unterstruktur eines Moleküls, biologische Struktur, physiologischen Zustand, Eigenschaft, Phänotyp, biologischen Prozess, klinische Daten, medizinische Daten, Daten über Krankheiten oder Unverträglichkeiten.In different embodiments represent the biological Information a molecule, one biological structure, a physiological state, a property, a phenotype, a biological process, clinical data, medical data, Data about Diseases or intolerances. In various embodiments, the biological information includes a descriptor for Condition, location, amount or substructure of a molecule, biological Structure, physiological state, property, phenotype, biological Process, clinical data, medical data, disease data or Intolerances.
In verschiedenen Ausgestaltungen beinhaltet das durch die Methode erzeugte neue biologische Wissen Vorhersagen über physiologisches Verhalten bei Menschen, z. B. aus der Analyse von an Tieren durchgeführten Experimenten wie Studien über Medikamentenwirksamkeit und/oder Medikamententoxizität oder über die Ermittlung von Biomarkern, die auf die Prognose, Diagnose, Empfänglichkeit für Medikamente, Medikamententoxizität sowie Schwere oder Stadium der Krankheit schließen lassen. In einigen Ausgestaltungen schließt die Methode das Vergleichen verschiedener Einheiten ein, in anderen Datenabbildung und in wiederum anderen die grafische Darstellung aller oder mehrerer Teile der Einheit, um so das Verständnis, die Extrapolation, die Interpolation und das Ziehen von Schlüssen zu erleichtern.In Various embodiments include that generated by the method new biological knowledge predictions about physiological behavior People, for B. from the analysis of experiments carried out on animals like studies about Medication efficacy and / or drug toxicity or on the Identification of biomarkers based on prognosis, diagnosis, susceptibility for medicines, drug toxicity and the severity or stage of the disease. In some embodiments includes the method of comparing different units, in others Data mapping and in turn the graphical representation all or more parts of the unit so as to understand that Extrapolation, interpolation, and drawing conclusions facilitate.
Die vorhergehenden und andere Funktionen und Vorteile der vorliegenden Erfindung sowie die Erfindung an sich werden aus der Beschreibung, den Zeichnungen und Ansprüchen, die noch folgen, besser verständlich.The Previous and other features and advantages of the present Invention and the invention per se will become apparent from the description, the drawings and claims, the follow, better understandable.
Kurze Beschreibung der ZeichnungenShort description the drawings
In allen Ansichten der Zeichnungen beziehen sich gleiche Bezugszeichen durchgehend auf dieselben Teile. Die Zeichnungen sind nicht unbedingt maßstabsgetreu, das Gewicht wurde stattdessen ganz allgemein auf die Darstellung der Grundlagen der Erfindung gelegt. In der folgenden Beschreibung werden verschiedene Ausgestaltungen mit Verweis auf die folgenden Zeichnungen beschrieben, in denen:In In all views of the drawings, like reference numerals refer continuously on the same parts. The drawings are not necessarily scale, Instead, the weight was quite general on the presentation the basics of the invention. In the following description be different configurations with reference to the following Drawings in which:
Beschreibungdescription
Um die gegenwärtige Erfindung umzusetzen, wird eine globale Wissensbank oder zentrale Datenbank so strukturiert, dass sie eine Vielzahl von Knoten und Deskriptoren umfasst, und diese Knoten und Deskriptoren kopiert oder transferiert werden können, ohne dass dabei interne Konsistenz oder biologischer Kontext verloren geht. Knoten sind Elemente biologischer Systeme, sowohl physisch als auch funktionell, und schließen zum Beispiel solche Dinge wie bestimmte Organe, Gewebe, Zellen, Organellen, Zellkompartimente, Membrane, Proteine, DNS, RNS, kleine Moleküle, Medikamente und Metaboliten ein. Die Deskriptoren sind Dateneinträge, welche die Knoten funktionell und/oder strukturell miteinander verbinden (z. B. Kasusrahmen, die „Verben" sind, welche die Wechselbeziehung von Knoten bestimmen) und Dateneinträge, die zusätzliche Informationen mit einem oder beiden Knoten und ihren Wechselbeziehungen in Verbindung bringen (z. B. Aufzeichnen der Spezies oder des Organs, wo das Protein gefunden wird, Bestimmen der Zeitschrift, in der die Daten veröffentlicht wurden, Vermerk von tertiärer struktureller Information über das behandelte Protein, Vermerk, dass das Protein bei Patienten mit Hypertonie erhöht ist, usw.). Die globale Zentralwissensbank kann eine große Menge an Informationen enthalten, und tut das meist auch, die für die vorliegende Aufgabe nicht relevant sind, doch hat sie eine Struktur, die eine Erfassung von potenziell relevanten Assertionen erlaubt, die auf der Anwendung von Benutzer spezifizierten biologischen Kriterien basieren.Around the current one Implementing this invention will become a global knowledge base or central database structured so that they have a variety of nodes and descriptors includes and copies or transfers these nodes and descriptors can be without losing internal consistency or biological context goes. Nodes are elements of biological systems, both physical as well as functional, and for example, include such things like certain organs, tissues, cells, organelles, cell compartments, Membrane, proteins, DNA, RNA, small molecules, drugs and metabolites one. The descriptors are data entries that make the nodes functional and / or structurally connect to each other (eg, case frames that are "verbs" that the Determine correlation of nodes) and data entries that additional Information with one or both nodes and their interrelations (eg recording the species or organ, where the protein is found, determine the journal in which the data is published became note of tertiary structural information about the treated protein, note that the protein in patients increased with hypertension is, etc.). The global central knowledge bank can be a large amount contain information, and do most of the same for the present Task are not relevant, yet it has a structure that has a Capture potentially relevant assertions allowed on the application of user specified biological criteria based.
Knoten können, wobei die aufgeführten Beispiele nicht erschöpfend sind, biologische Moleküle sein, darunter Proteine, kleine Moleküle, Ionen, Gene, ESTs, RNS, DNS, Transkriptionsfaktoren, Metaboliten, Liganden, Transmembran-Proteine, Transportmoleküle, Fressmoleküle, Regulierungsmoleküle, Hormone, Zytokine, Chemokine, Histone, Antikörper, Strukturmoleküle, Metaboliten, Vitamine, Toxine, Nährstoffe, Mineralien, Agonisten, Antagonisten, Liganden oder Rezeptoren. Die Knoten können Arzneimittelsubstanzen, Verbindung, die als Kandidaten für Medikamente angesehen werden, Antisense-Moleküle, RNS, RNS-Interferenz, Haarnadel-RNS, Doppelstrang-RNS oder chemogenetische oder chemoproteomische Untersuchungen sein. Chemisch betrachtet können die Knoten Protonen, Gasmoleküle, kleine organische Moleküle, Aminosäuren, Peptide, Proteindomänen, Proteine, Glykoproteine, Nukleotide, Oligonukleotide, Polysaccharide, Lipide oder Glykolipide sein. In Modellen höherer Ordnung können die Knoten Proteinkomplexe, Protein-Nukleotid-Komplexe wie Ribosomen, Zellkompartimente, Organellen oder Membrane sein. Strukturell betrachtet können sie verschiedene Nanostrukturen wie Filamente, interzellulare Lipid-Doppellagen, Zellmembrane, Lipid Rafts, Zelladhäsionsmoleküle, Gewebeschranken und halbdurchlässige Membrane, Kollagenstrukturen, mineralisierte Strukturen oder Bindegewebe sein. In noch höheren Ordnungen sind die Knoten Zellen, Gewebe, Organe oder andere anatomische Strukturen. So kann ein Modell des Immunsystems zum Beispiel Immunglobuline, Zytokine, verschiedene Leukozyten, Knochenmark, Thymusdrüse, Lymphknoten und Milz einschließen. Bei der Simulierung von klinischen Versuchsreihen können die Knoten zum Beispiel Personen, deren klinische Prognose oder derzeitigen Symptome, Medikamente, Niveaus der Medikamentendosierung und klinische Endpunkte sein. Bei der Simulierung von Epidemiologie können die Knoten zum Beispiel Personen, deren Symptome, physiologische oder gesundheitliche Charakteristika, Umwelteinflüsse, denen sie ausgesetzt sind, Substanzen, die sie einnehmen, sowie Krankheitsdiagnosen sein. Knoten können auch Ionen, physiologische Prozesse, Krankheiten, Krankheitsprozesse, Translokationen, Reaktionen, molekulare Komplexe, Zellkomponenten, Zellen, anatomische Teile, Gewebe, Zelllinien und Proteindomänen sein.Nodes, although not exhaustive, may be biological molecules, including proteins, small molecules, ions, genes, ESTs, RNA, DNA, transcription factors, metabolites, ligands, transmembrane proteins, transport molecules, scavenging molecules, regulatory molecules, hormones, cytokines , Chemokines, histones, antibodies, structural molecules, metabolites, vitamins, toxins, nutrients, minerals, agonists, antagonists, ligands or receptors. The nodules may be drug substances, compounds that are considered candidates for drugs, antisense molecules, RNA, RNA interference, hairpin RNA, double-stranded RNA or chemogenetic or chemoproteomic studies. Chemically, the nodes can be protons, gas molecules, small organic molecules, amino acids, peptides, protein domains, proteins, glycoproteins, nucleotides, oligonucleotides, polysaccharides, lipids or glycolipids. In higher order models, the nodes may be protein complexes, protein-nucleotide complexes such as ribosomes, cell compartments, organelles or membranes. Structurally, they may be various nanostructures such as filaments, intercellular lipid bilayers, cell membranes, lipid rafts, cell adhesion molecules, tissue barriers and semipermeable membranes, collagen structures, mineralized structures or connective tissue. In even higher orders are the nodes Cells, tissues, organs or other anatomical structures. For example, a model of the immune system may include immunoglobulins, cytokines, various leukocytes, bone marrow, thymus, lymph nodes and spleen. For example, in simulating clinical trials, the nodules may be individuals whose clinical prognosis or current symptoms, medications, levels of drug dosage, and clinical endpoints. In simulating epidemiology, for example, the nodes may be individuals, their symptoms, physiological or health characteristics, environmental factors to which they are exposed, substances they are taking, and disease diagnoses. Nodes may also be ions, physiological processes, diseases, disease processes, translocations, reactions, molecular complexes, cell components, cells, anatomical parts, tissues, cell lines, and protein domains.
Deskriptoren können biologische Beziehungen zwischen Knoten darstellen und beinhalten nichtkovalente Bindung, Adhärenz, kovalente Modifikation, multimolekulare Interaktionen (Komplexe), Spaltung einer kovalenten Bindung, Konversion, Transport, Zustandsänderung, Katalyse, Aktivierung, Stimulierung, Agonismus, Antagonismus, Aufwärtsregulierung, Repression, Inhibition, Abwärtsregulierung, Expression, posttranskriptionale Modifikation, posttranslationale Modifikation, Internalisierung, Abbau, Steuerung, Regulierung, Chemoattraktion, Phosphorylation, Azetylierung, Dephosphorylation, Deazetylierung, Transport und Transformation, sind aber nicht auf diese beschränkt.descriptors can represent biological relationships between nodes and include noncovalent ones Bonding, Adherence, covalent modification, multimolecular interactions (complexes), cleavage a covalent bond, conversion, transport, change of state, Catalysis, activation, stimulation, agonism, antagonism, upregulation, Repression, inhibition, down-regulation, Expression, posttranscriptional modification, posttranslational Modification, internalization, degradation, control, regulation, chemoattraction, phosphorylation, Acetylation, dephosphorylation, deacetylation, transport and transformation, but are not limited to these.
Eine bevorzugte Form von Deskriptoren zur Verwendung bei der Erfindung sind zum Beispiel Kasusrahmen, die aus der Darstellungsstruktur erfasst werden, was eine unmittelbare und allgemeine Anwendung der Modelle auf eine Vielzahl von biowissenschaftlichen oder anderen Systemen erlaubt. Kasusrahmen werden im Einzelnen in der anhängigen US-Patentanmeldung mit der Seriennummer 10/644,582 des selben Anmelders beschrieben, deren Offenlegung hierin durch Bezugnahme eingefügt ist. Deskriptoren können quantitative Funktionen wie Differenzialgleichungen umfassen, die mögliche quantitative Beziehungen zwischen Knotenpaaren darstellen, welche genutzt werden können, um das Netzwerkweiter zu verfeinern. Deskriptoren können auch qualitative Eigenschaften umfassen, die entweder nicht gemessen oder analytisch oder quantitativ nur schwer beschrieben werden können, oder aufgrund von ungenügender Kenntnis eines Systems im Allgemeinen oder der Eigenschaft an sich unmöglich beschrieben werden können.A preferred form of descriptors for use in the invention are, for example, case frames that are out of the representation structure what is an immediate and general application of the Models on a variety of life sciences or others Systems allowed. Case frames are described in detail in the pending US patent application described with the serial number 10 / 644,582 of the same applicant, the disclosure of which is incorporated herein by reference. Descriptors can be quantitative Functions such as differential equations include the possible quantitative ones Represent relationships between node pairs that are used can, to further refine the network. Descriptors can also include qualitative properties that are either not measured or difficult to describe analytically or quantitatively, or due to insufficient Knowledge of a system in general or the property itself impossible described can be.
Der Prozess der Sammlung von Wissen kann auf ungleichartige Systeme angewendet werden, und das Ergebnis kann zu einer Sammeleinheit zusammengefasst werden, die ein Modell begründet. Darüber hinaus kann auf eine Wissenseinheit, die auf ungleichartigen Systemen aufgebaut ist, als geschlossenes Modell zugegriffen werden, indem auf die Fragmente des Modells dezentral zugegriffen wird. Ein Modell stellt eine Hypothese dar, die die Arbeitsweise des Systems erklärt, d. h. basierend auf einer Simulation ist es in der Lage, vorausgesagte Daten zu erzeugen, die zu den tatsächlichen Daten passen, die als Eignungskriterien dienen. Die Hypothese kann mittels weiterer Experimente getestet werden, sie kann mit anderen. Modellen oder Netzen kombiniert werden, sie kann verfeinert, verifiziert, reproduziert, modifiziert, perfektioniert, korrigiert oder mit neuen Knoten und neuen Assertionen, die auf manuellen oder computergestützten Analysen neuer Daten beruhen, erweitert und produktiv als biologische Wissensbank genutzt werden Modelle von Teilen eines physiologischen Pfades oder Teilnetzwerks in einem Zellkompartiment, einer Zelle, einem Organismus, einer Population oder Ökologie können zu einem geschlossenen Modell verknüpft werden, indem ein oder mehrere Knoten in einem Modell mit einem oder mehreren Knoten in einem anderen Modell verbunden werden.Of the Process of knowledge gathering can be on dissimilar systems applied, and the result can be summarized into a collection unit which establishes a model. Furthermore may be based on a knowledge unit based on dissimilar systems is to be accessed as a closed model by clicking on the Fragments of the model is accessed decentrally. A model poses a hypothesis explaining the operation of the system, d. H. Based on a simulation, it is able to predict data to produce that to the actual Fit data that serve as eligibility criteria. The hypothesis can be tested by further experiments, they can with others. Models or networks, it can be refined, verified, reproduced, modified, perfected, corrected or with new ones Nodes and new assertions based on manual or computer aided analysis new data is based, expanded and productive as a biological knowledge bank Models of parts of a physiological path or are used Subnetwork in a cell compartment, a cell, an organism, a population or ecology can be linked to a closed model by a or multiple nodes in a model with one or more nodes in connected to another model.
Jede wahre Aussage in einer Wissensbank oder einer Einheit wird hier als eine Assertion bezeichnet. Assertionen sind wahre Aussagen, die sich auf ein existierendes Objekt in einem System beziehen, auf eine wahre Aussage über ein Objekt in diesem System und einen Literalwert oder jede beliebige Kombination daraus. In verschiedenen Ausgestaltungen können Assertionen Wissen wie RNS, proteomisches, metabolitisches oder klinisches Wissen aus Quellen wie medizinischen Fachpublikationen, Patientendaten, Daten aus klinischen Versuchen, Compliance-Daten, chemische Daten, medizinische Daten, hypothetische Daten oder Daten aus biologischen Datenbanken sein.each true statement in a knowledge bank or a unit becomes here referred to as an assertion. Assertions are true statements, that relate to an existing object in a system, to a true statement about an object in this system and a literal value or any one Combination of it. In different embodiments can assertions Knowledge such as RNA, proteomic, metabolic or clinical knowledge Sources such as medical publications, patient data, data from clinical trials, compliance data, chemical data, medical data, hypothetical data or data from biological databases.
Der Aufbau einer Einheit beginnt, sobald ein Individuum durch Eingabe über eine Benutzeroberfläche biologische Kriterien spezifiziert, die so gestaltet sind, dass sie aus der zentralen Wissensbank alle Assertionen abrufen, die für das behandelte Thema als potenziell relevant erachtet werden. Die Beispielklassen von Kriterien, die auf die zentrale Wissensbank angewendet werden, um die unaufbereitete Einheit zu erzeugen, umfassen Zuordnungen, spezielle Netzwerke (z. B. transkriptionelle Steuerung, metabolisch) und biologische Kontexte (z. B. Spezies, Gewebe, Entwicklungsstadium), sind aber nicht auf diese beschränkt. Zusätzliche Beispielklassen von Kriterien beinhalten Assertionen, die auf Beziehungs-Deskriptoren basieren, Assertionen, die auf Textabgleich regulärer Begriffe basieren, Assertionen, die mithilfe von Algorithmen zur Vorwärtsverkettung berechnet wurden, Assertionen, die auf Homologie-Berechnungen basieren, und alle Kombinationen dieser Kriterien, sind aber nicht auf diese beschränkt. Oft werden Schlüsselbegriffe oder Wortwurzeln verwendet, aber auch andere Kriterien sind wertvoll. Man kann z. B. Assertionen wählen, die auf verschiedenen strukturbezogenen Algorithmen beruhen, z. B. kann man Algorithmen zur Vorwärtsverkettung oder Rückwärtsverkettung anwenden (z. B. alle verknüpften Assertionen drei oder mehreren Schritten unterhalb von allen Serinkinasen in Mastzellen erfassen). Verschiedene logische Operationen wie „oder", „und" und „nicht" können auf alle beliebigen Auswahlkriterien angewendet werden, um komplexere Auswahlen zu spezifizieren. Es ist die Unterschiedlichkeit der Kriterienreihen, die ausgearbeitet werden können, und die Tiefe der Assertionen in der globalen Wissensbank, die die Flexibilität ermöglichen, die der Erfindung eigen ist.Building a unit begins as soon as an individual, through input through a user interface, specifies biological criteria designed to retrieve from the central knowledge base all assertions that are considered potentially relevant to the topic being addressed. The example classes of criteria applied to the central knowledge base to produce the raw unit include assignments, specific networks (e.g., transcriptional control, metabolism), and biological contexts (e.g., species, tissues, developmental stage), but are not limited to these. Additional example classes of criteria include assertions based on relationship descriptors, assertions based on regular-word matching, assertions calculated using forward-chaining algorithms, assertions based on homo based on logic calculations, and all combinations of these criteria, but are not limited to them. Often key words or root words are used, but other criteria are valuable. You can z. For example, assertions based on various structural algorithms, e.g. For example, one may use forward chaining or backward chaining algorithms (eg, capture all linked assertions three or more steps below all serine kinases in mast cells). Different logical operations such as "or", "and" and "not" can be applied to any selection criteria to specify more complex selections, it is the diversity of the series of criteria that can be worked out and the depth of the assertions in the global knowledge base that allow the flexibility inherent in the invention.
Assertionen, die in Übereinstimmung mit der Erfindung in der Form der Dateneinträge, die eine Reihe bestimmter Kriterien erfüllen, ausgewählt wurden, werden von der Wissensbank abgerufen und dann in einer Teilwissensbank oder Einheit, die aus einer Teilmenge von Knoten mit Wechselbeziehungen und Deskriptoren, die für das untersuchte System potenziell relevant sind, besteht, wieder zusammengesetzt. Durch diese Teilmengenbildung wird ein neues biologisches Modell erstellt. Dieses Modell umfasst typischerweise weit weniger Assertionen als die globale Wissensbank und dient als Ausgangspunkt auf dem Weg, eine nützlichere Einheit mit kleinerem Fokus zu erstellen. Danach wird es von automatischen Routinen in der Softwareanwendung, die es erstellt hat, und dadurch, dass die Person, die die Anwendung ausführt, Werkzeuge anwendet, transformiert und verfeinert. Es kann durch andere Informationen augmentiert und andere Informationen können darin eingegliedert werden, einschließlich, aber nicht nur Assertionen, die aus der Literatur stammen und von der Person, die die Daten einpflegt, als relevant für das biologische System erachtet werden.assertions, in agreement with the invention in the form of data entries, a number of specific Fulfill criteria, selected are retrieved from the knowledge bank and then in a knowledge bank or unit, which consists of a subset of nodes with interrelationships and descriptors for the examined system is potentially relevant, exists again composed. By this subsets formation becomes a new biological Model created. This model typically includes far less Assertions as the global knowledge base and serves as a starting point on the way, a more useful Create unit with a smaller focus. After that it will be automatic Routines in the software application that created it, and thereby that the person executing the application uses tools transformed and refined. It can be augmented by other information and other information can incorporated therein, including, but not limited to, assertions that come from the literature and from the person giving the data as relevant for the biological system is considered.
Einheiten, die durch die vorliegende Erfindung erstellt wurden, sind für gewöhnlich besser als die globale Wissensbank oder die zentrale Datenbank, aus der sie abgeleitet wurden, da sie die tatsächliche Biologie typischerweise besser voraussagen und beschreiben. Diese Errungenschaft der Erfindung beruht auf der Anwendung von Logik während oder nach der Kompilierung der Rohdatenreihe, um die anfangs abgerufenen Daten zu augmentieren und die resultierende Struktur wie hier angemerkt zu verbessern und zweckmäßiger zu gestalten. Das kann automatisch bei der Erstellung der Einheit erfolgen, zum Beispiel durch Programme, die in Computersoftware eingebettet sind, oder durch die Anwendung von Softwareinstrumenten, welche die Person, die die Anwendung durchführt, auswählt und steuert.Units, which were created by the present invention are usually better as the global knowledge base or the central database, from the They were derived as they typify the actual biology better predict and describe. This achievement of the invention is based on the application of logic during or after compilation the raw data series to augment the initially retrieved data and to improve the resulting structure as noted herein and more convenient to shape. This can be done automatically when creating the unit, for example through programs embedded in computer software or through the use of software instruments the person who performs, selects and controls the application.
Eine Einheit ist in vielerlei Hinsicht mit einer globalen Zentralwissensbank strukturell identisch, sie ist jedoch kleiner und viel stärker auf das betrachtete Thema oder Problem fokussiert, rechnerisch leichter lenkbar und entweder physisch oder virtuell isoliert, damit sie auf ein bestimmtes Projekt zugeschnitten ist, und erleichtert die Einhaltung von Auflagen bei beschränkter Nutzung oder Offenlegungsvorschriften, die möglicherweise durch eine Datenquelle auferlegt sind. Außerdem wird eine Einheit oft die Kennzeichen einer laufenden Arbeit aufweisen, die im Lauf der Anwendung geändert, verbessert, geprüft und korrigiert wird. Eine Einheit kann jederzeit oder bei jedem Schritt in einem berechenbaren Format gespeichert und der globalen Wissensbank wieder hinzugefügt werden.A Unity is in many ways with a global central knowledge bank structurally identical, but it is smaller and much stronger on the considered topic or problem focused, computationally easier steerable and either physically or virtually isolated to them tailored to a particular project, and facilitates the Compliance with conditions of limited use or disclosure requirements, possibly imposed by a data source. Besides, a unit often becomes Have the characteristics of an ongoing work, which in the course of the Application changed, improved, tested and corrected. A unit can be anytime or at anytime Step saved in a predictable format and global Knowledge base added again become.
Die Erstellung einer wertvollen Einheit beinhaltet daher einen Prozess der Teilmengenbildung oder Segmentierung, der auf eine globale Zentralwissensbank angewendet wird, gefolgt von Datentransformationen oder -manipulationen, um die erste erstellte Einheit zu verbessern, zu verfeinern und/oder zu augmentieren, um die Einheit zu vervollständigen und die Einheit an die Analyse anzupassen. Das wird durch die Umsetzung eines Prozesses wie der Anwendung von Logik auf die resultierende Datenbank, um sie mit der tatsächlichen Biologie abzustimmen, erreicht. So können die Kriterien nach allen Proteinen fragen, die in menschlichen Muskelzellen vorkommen, und die zentrale Datenbank schließt vielleicht Muskelzellenproteine mit ein, die bei Mäusen vorkommen und von denen einige nicht in menschlichen Muskelzellen vorkommen, dann werden diese Daten aus einer Einheit, die die Physiologie menschlicher Muskelzellen untersucht, entfernt. Eine Einheit kann durch das Einfügen neuer Knoten und Beziehungs-Deskriptoren, die aus der Wissensbank stammen und auf den weiter oben festgelegten Annahmen basieren (und vieler anderer logischer Annahmen, die möglich sind), augmentiert werden. Eine Einheit kann gefiltert werden, indem man Teilmengen von Daten, die auf anderen biologischen Kriterien basieren, ausschließt. Die Körnung des Systems kann so verfeinert oder vergröbert werden, wie es für die anstehende Analyse angemessen ist (was wesentlich ist für die Fähigkeit, gültige Extrapolationen zwischen Arten oder Generalisierungen innerhalb einer Art machen zu können, da Datenreihen in ihrer Körnigkeit variieren). Eine Einheit kann kompakter und relevanter gemacht werden, indem detailliertes Wissen zu stärker folgernden Assertionen zusammengefasst wird, die für eine Untersuchung mittels Datenanalysealgorithmen oder für den Einsatz von generischen Analyseinstrumenten wie Instrumenten zur Analyse von Häufungen besser geeignet sind.The Creating a valuable unit therefore involves a process of the subset or segmentation that points to a global central knowledge bank applied, followed by data transformations or manipulations, to improve, refine, and / or enhance the first unit created augment to complete the unit and bring unity to the unit To adapt analysis. That's through the implementation of a process like applying logic to the resulting database she with the actual Biology achieved. So can the criteria after all Ask proteins that occur in human muscle cells, and the central database closes perhaps muscle cell proteins found in mice and some of which are not found in human muscle cells, Then, these data are from a unit representing the physiology of human muscle cells examined, removed. A unit can be created by inserting new ones Nodes and relationship descriptors that come from the knowledge base and based on the assumptions set out above (and many other logical assumptions that are possible) are augmented. A unit can be filtered by adding subsets of data, which are based on other biological criteria excludes. The granulation of the system can be refined or coarsened as it is for the upcoming one Analysis is appropriate (which is essential for the ability to make valid extrapolations between To be able to make kinds or generalizations within a kind, since Data series in their granularity vary). A unit can be made more compact and relevant by making detailed knowledge stronger concluding assertions is summarized for an investigation using data analysis algorithms or for the use of generic Analytical tools such as clusters analysis tools are more suitable.
Eine Einheit kann dem Wissenszuwachs folgend regelmäßig aktualisiert werden und die daraus entstehenden Einheiten können gespeichert werden, um die Progression des Wissens auf diesem Gebiet zu zeigen. Eine Einheit kann auf verschiedene Arten augmentiert werden, zum Beispiel kann die Person, die die Daten einpflegt, neue Daten aus einer strukturierten oder unstrukturierten Datenbank oder Daten aus der Fachliteratur hinzufügen. Eine Einheit kann auch wieder in eine zentrale Datenbank zurückgeführt werden, damit neue Assertionen als Rohmaterial für die Erstellung einer anderen Einheit verwendet werden können.A unit can be updated regularly following the increase in knowledge and the resulting units can be stored, to show the progression of knowledge in this field. A unit can be augmented in several ways, for example, the person who enters the data can add new data from a structured or unstructured database or data from the literature. A unit can also be returned to a central database so that new assertions can be used as raw material to create another unit.
Die zugrunde liegende Darstellung des Wissens einer zentralen Wissensbank ist konzipiert, um Wissen detailliert und ohne Verzerrung in Bezug auf die Nutzung des Wissens zu erfassen. Bei einem Netzwerk von solcher Komplexität kann das Schlussfolgern schwierig sein. Deshalb umfassen die Verfahren und Systeme der Erfindung einen flexiblen Rahmen, um das Wissen stufenweise zu bearbeiten und durch die Anwendung genau definierter Regeln und Prozeduren abgeleitete Einheiten zu erstellen. Diese abgeleiteten Einheiten sind so aufgebaut, dass sie aufeinander folgende Durchgänge des Schlussfolgerns in den Einheiten ermöglichen.The underlying presentation of the knowledge of a central knowledge bank is designed to detail knowledge without distortion in relation to grasp the use of knowledge. In a network of such complexity Conclusion can be difficult. Therefore, the methods include and systems of the invention provide a flexible framework for knowledge to process gradually and by the application exactly defined Rules and procedures to create derived units. These derived Units are constructed to be consecutive passages of the Reasoning in the units.
Einheiten können verwendet werden, um ein beliebiges biologisches System nachzubilden, egal wie es definiert ist und so detailliert wie gewünscht, und werden nur durch den Wissensstand in dem betreffenden Fachgebiet, dem Zugang zu Daten und (bei neuen Daten) der Zeit, die benötigt wird, um sie einzupflegen und zu importieren, begrenzt. In einer Ausgestaltung können Einheiten verwendet werden, um Modelle kontinuierlich oder in Abständen zu aktualisieren, sobald neue Daten zur Erfassung verfügbar sind, und um ein Mittel zum besseren Verständnis der Biologie bereitzustellen. In einer anderen Ausgestaltung können Einheiten zur Darstellung biologischer Systeme im Ganzen oder in Teilen in verschiedenen Formaten verwendet werden, damit Menschen sie betrachten und analysieren können.units can used to model any biological system, no matter how it is defined and as detailed as desired, and are only determined by the level of knowledge in the field concerned, access to data and (in the case of new data) the time it takes to manage and import, limited. In one embodiment can Units are used to models continuously or at intervals too update as soon as new data is available for collection, and to provide a means to better understand biology. In another embodiment can Units for the representation of biological systems in whole or in Sharing in different formats can be used to help people they can look at and analyze.
Einheiten können auch verwendet werden, um auf verschiedene Arten Daten über biologische Systeme abzufragen, um aus neuem biologischen Wissen (z. B. Überlagerung verschiedener Einheiten, um Unterschiede zu erkennen) zu schöpfen. In verschiedenen Ausgestaltungen können Einheiten verwendet werden, um: (a) aus der Analyse von Experimenten mit Tieren physiologisches Verhalten bei Menschen vorauszusagen (z. B. Wirksamkeit und Toxizität von Medikamenten); (b) ideale Biomarker zu finden (leicht erkennbare oder leicht quantifizierbare Substanzen in Körperflüssigkeiten, um Voraussagen über das Vorhandensein einer Krankheit, ihre Prognose, ob der Patient auf Medikament X ansprechen wird, Schwere der Krankheit usw. zu machen); oder (c), um zu lernen, wie man Mitglieder einer Population segmentiert, um Ergebnisse zu verbessern und Komplikationen in klinischen Versuchen zu vermeiden.units can Also used in various ways is data on biological systems to learn from new biological knowledge (eg superposition different units to detect differences). In different configurations can Units used to: (a) from the analysis of experiments to predict physiological behavior in humans with animals (eg efficacy and toxicity of medicines); (b) finding ideal biomarkers (easily recognizable or easily quantifiable substances in body fluids to make predictions about Presence of a disease, its prognosis, whether the patient is up Drug X will make severity of illness, etc.); or (c) to learn how to segment members of a population, to improve outcomes and complications in clinical trials to avoid.
Einheiten können außerdem verwendet werden, um die Biologie zu untersuchen, indem man verschiedene Einheiten vergleicht (z. B. Mensch mit Maus, krankes Gewebe mit gesundem, die adipöse Physiologie unter mehreren unterschiedlichen Ernährungsbedingungen). Einheiten können verwendet werden, um die Biologie von Geweben zu verschiedenen Zeitpunkten während der Entwicklung, des Fortschreitens oder der Heilung einer Krankheit zu vergleichen, oder um die Wirkung verschiedener Störungen wie die Wirkungen von Medikamenten oder die Wirkung eines anderen Umwelteinflusses innerhalb eines beliebigen biologischen Systems zu bestimmen. Einheiten können verwendet werden, um Daten abzubilden (um z. B. durch den Import experimenteller Daten die Auswirkung von Störungen auf ein biologisches System auf eine oder mehrere Komponenten des Systems zu zeigen). In weiteren Ausgestaltungen können Einheiten verwendet werden, um logische Simulationen umzusetzen, um Datenreihen zu evaluieren, die in einer globalen zentralen Datenbank zur Zeit der Erstellung der ursprünglichen Einheit nicht enthalten sind (um z. B. eine Hypothese, die auf neuen experimentellen Daten basiert, nochmals zu testen), um Mutmaßungen über Pfadverläufe anzustellen und komplexe und subtile Kausalbeziehungen innerhalb eines biologischen Systems zu erkennen, und um eine Krankheitsursache zu erkennen, toxische biochemische Mechanismen zu verstehen und toxische Reaktionen vorherzusagen.units can Furthermore used to study biology by using different ones Compare units (eg human with mouse, diseased tissue with healthy, obese physiology under several different nutritional conditions). units can used to study the biology of tissues at different times while the development, progression or cure of a disease to compare, or to the effect of various disorders like the effects of medication or the effect of another environmental impact within any biological system. units can used to map data (eg by importing experimental data the impact of errors on a biological System to one or more components of the system). In further embodiments may Units used to implement logical simulations, to evaluate data series stored in a global central database not included at the time of creation of the original unit are (for example, a hypothesis based on new experimental data based, retesting) to make assumptions about pathways and complex and subtle causal relationships within a biological To recognize systems and to recognize a cause of illness, to understand toxic biochemical mechanisms and toxic reactions predict.
Neues Wissen kann ermittelt werden, indem die Einheiten zum Beispiel mit epistemischen Motoren verwendet werden. Epistemische Motoren werden im Einzelnen in der ebenfalls angemeldeten und gehaltenen US-Patentanmeldung mit der Seriennummer 10/717,224 beschrieben, deren Offenlegung hierin durch Verweis eingefügt ist. Epistemische Motoren sind programmierte Computer, die biologische Daten von tatsächlich oder gedanklich durchgeführten Experimenten zur Untersuchung eines biologischen Systems akzeptieren und sie zur Erzeugung eines Netzwerkmodells von Protein-Interaktionen, Gen-Interaktionen und Gen-Protein-Interaktionen verwenden, das mit den Daten und dem vorherigen Wissen über das System übereinstimmt, und dadurch die biologische Wirklichkeit dekonstruieren und überprüfbare Erklärungen (Modelle) der Arbeitsweise natürlicher Systeme vorschlagen. Die Motoren identifizieren neue Wechselbeziehungen zwischen biologischen Strukturen, zum Beispiel zwischen Biomolekülen, welche die Substanz des Lebens darstellen. Diese neuen Beziehungen erklären für sich allein genommen oder gemeinsam das Verhalten des Systems. Sie können zum Beispiel die beobachtete Wirkung einer Störung im System erklären, Faktoren identifizieren, die die Homöostase aufrechterhalten, Wirkungsweise und Nebenwirkungen von Medikamenten erklären, epidemiologische und klinische Daten zweckmäßiger gestalten, Gründe für den Erfolg einer Art offenbaren, embryologische Prozesse entschleiern und die Mechanismen von Krankheiten erkennen. Die Programme enthüllen feine Muster in komplexen Datenreihen, die der menschliche Verstand ohne Hilfe nicht aufspüren kann. Der Output des epistemischen Motors ermöglicht es, das untersuchte System besser zu verstehen, Hypothesen aufzustellen, das untersuchte System in andere Systeme zu integrieren, komplexere und verständlichere Modelle zu bilden und neue Experimente vorzuschlagen, um die Gültigkeit von Hypothesen zu testen.New knowledge can be ascertained by using the units for example with epistemic motors. Epistemic motors are described in detail in co-pending and filed U.S. Patent Application Serial No. 10 / 717,224, the disclosure of which is incorporated herein by reference. Epistemic motors are programmed computers that accept biological data from actual or imagined experiments to study a biological system and use it to generate a network model of protein interactions, gene interactions, and gene-protein interactions, with the data and the previous one Knowledge of the system, thereby deconstructing the biological reality and suggesting verifiable explanations (models) of the operation of natural systems. The motors identify new interactions between biological structures, for example, between biomolecules, which are the substance of life. These new relationships, taken alone or in concert, explain the behavior of the system. For example, they may explain the observed effect of a disorder in the system, identify factors that maintain homeostasis, the mode of action and side effects of Medika explain epidemiological and clinical data more appropriately, reveal the reasons for the success of a species, unveil embryological processes and recognize the mechanisms of diseases. The programs reveal subtle patterns in complex series of data that the human mind can not track without help. The output of the epistemic motor makes it possible to better understand the system under investigation, to hypothesise, to integrate the studied system into other systems, to form more complex and understandable models and to propose new experiments to test the validity of hypotheses.
Die Funktionsweise der hier dargelegten Systeme und Verfahren kann als Software auf einem Computer für allgemeine Zwecke implementiert werden. In manchen Ausgestaltungen kann ein Computerprogramm in einer der höheren Computersprachen wie FORTRAN, PASCAL, C, C++, LISP, JAVA oder BASIC geschrieben werden. Darüber hinaus kann ein Computerprogramm als Script, Makro oder in anderen Funktionsweisen, die in handelsüblicher Software eingebettet sind wie EXCEL oder VISUAL BASIC, geschrieben werden. Zusätzlich könnte Software in einer Assemblersprache, die auf einen Mikroprozessor gerichtet ist, der auf einem Computer speicherresident ist, implementiert werden. Zum Beispiel könnte Software in der Assemblersprache Intel 80×86 implementiert werden, wenn sie so konfiguriert wird, dass sie auf einem IBM-PC oder einem PC-Klon läuft. Software kann in einen Herstellungsartikel eingebettet werden, einschließlich eines Speichermediums oder computerlesbaren Mediums wie einer Diskette, einer Festplatte, einer Bildplatte, eines Tonbands, eines PROM, eines EPROM oder einer CD-ROM, aber nicht nur auf diese beschränkt.The Operation of the systems and methods set forth herein may be considered Software on a computer for general purposes are implemented. In some embodiments can be a computer program in one of the higher computer languages like FORTRAN, PASCAL, C, C ++, LISP, JAVA or BASIC. About that In addition, a computer program can be scripted, macro or in others Functions in commercial software embedded are like EXCEL or VISUAL BASIC, to be written. additionally could Software in assembly language, based on a microprocessor implemented, which is resident on a computer, implemented become. For example, could Software can be implemented in assembly language Intel 80 × 86, though It is configured to work on an IBM PC or a PC clone running. Software can be embedded in an article of manufacture, including one Storage medium or computer-readable medium such as a floppy disk, a hard disk, an optical disk, a tape, a PROM, an EPROM or a CD-ROM, but not limited to these.
Zusammenziehung von Einheitencontraction of units
Die Erfindung erlaubt die Erstellung von Wissenseinheiten mittels Erfassung aus einer globalen Zentraldatenbank und dem nachfolgenden Hinzufügen von neuem Wissen durch Einpflegen von Daten und andere Verfahren. In einem Beispiel wird neues Wissen einer globalen Zentraldatenbank in einem schrittweisen Prozess hinzugefügt, dessen Fokus auf der Anwendung liegt. Zuerst wird der globalen Zentraldatenbank allgemeines Wissen, das in der globalen Zentraldatenbank noch nicht vorhanden ist, hinzugefügt (z. B. zusätzliches Wissen über Krebs). Zweitens wird grundlegendes Wissen im Abfragebereich der beabsichtigten Anwendung (z. B. Prostatakrebs) aus der Fachliteratur gesammelt, dazu gehören unter anderem Lehrbücher, wissenschaftliche Schriften und Rezensionen von Artikeln. Drittens wird der spezielle Fokus des Projekts (z. B. Androgenunabhängigkeit bei Prostatakrebs) genutzt, um noch speziellere Informationsquellen auszuwählen. Dem folgt die Verwendung von experimentellen Daten, um den nächsten Schritt beim Einpflegen von Daten und Sammeln von Wissen zu lenken. Zum Beispiel können experimentelle Daten zeigen, welche Gene und Proteine im fokussierten Bereich beteiligt sind. Durch das Einpflegen von Daten aus der Fachliteratur, die sich auf Gene und Proteine beziehen, kann eine Untereinheit erstellt werden, die sich auf das spezielle Interessengebiet konzentriert.The Invention allows the creation of knowledge units by means of acquisition from a global central database and then adding new knowledge by incorporating data and other procedures. In An example will be new knowledge of a global central database added in a step-by-step process, its focus on the application lies. First, the global central database becomes general knowledge, added to the global central database (eg. additional Know about Cancer). Second, basic knowledge in the query area of the intended use (eg prostate cancer) from the medical literature collected, belong to including textbooks, scientific writings and reviews of articles. thirdly becomes the special focus of the project (eg androgen independence in prostate cancer) used to provide even more specialized information sources select. This is followed by the use of experimental data to the next step to feed in data collection and knowledge gathering. To the Example can experimental data show which genes and proteins are focused Involved in the field. By entering data from the specialist literature, which relate to genes and proteins can be a subunit which focuses on the specific area of interest.
Um abgeleitete Einheiten zu erstellen, können Algorithmen eingesetzt werden. In einigen Ausgestaltungen können Algorithmen als Computerprogramme zum Ausdruck kommen und dazu verwendet werden, abgeleitete Einheiten als Datenobjekte innerhalb eines Programmierungsrahmens zu erstellen Ein Beispielalgorithmus führt eine oder mehrere Transformationen an den bestehenden Einheiten durch, um eine neue Einheit zu generieren. Transformationen können zum Beispiel durch irgendeine der folgenden Techniken erreicht werden: (a) indem man Assertionen aus bestehenden Einheiten auswählt und die ausgewählten Assertionen in eine neue, im Aufbau befindliche Einheit einfügt; (b) indem man Knoten und Assertionen aus bestehenden Einheiten zusammenfasst und die zusammengefassten Knoten und Assertionen in eine Einheit einfügt; (c) indem man mathematische Mengenlehreoperationen auf die Knoten und Assertionen aus bestehenden Einheiten anwendet und die Knoten und Assertionen, welche aus diesen Operationen resultieren, in eine Einheit einfügt; (d) indem man Zusammenstellungsoperationen auf bestehende Einheiten anwendet, um eine Einheit zu erstellen, die für weitere Transformationen verwendet wird, oder (e) indem man eine beliebige Kombination der oben genannten Techniken anwendet.Around To create derived units, algorithms can be used become. In some embodiments, algorithms may be used as computer programs be expressed and used to derived units as data objects within a programming framework An example algorithm leads one or more transformations on the existing units, to generate a new unit. Transformations can be for Example can be achieved by any of the following techniques: (a) by selecting assertions from existing units and the selected ones Insert assertions into a new unit under construction; (B) by combining nodes and assertions from existing units and the combined nodes and assertions into a single entity inserts; (c) by performing mathematical set theory operations on the nodes and assertions from existing units and applies the nodes and assertions resulting from these operations into one Unit inserts; (d) by putting together compilation operations on existing units applies to create a unit for further transformations is used, or (e) by using any combination of applies the above-mentioned techniques.
Die
einfachste Form der Transformation einer Einheit ist die Erstellung
einer Teilmenge der Einheit. So kann zum Beispiel eine Teilmenge
einer Einheit eine Teilmenge der Knoten und Deskriptoren in der
ursprünglichen
Einheit enthalten. Eine Teilmenge ist im Wesentlichen das Ergebnis
einer Anfrage, die Knoten und Assertionen anhand einer Reihe von
Kriterien auswählt.
Diese Kriterien können
verfahrensmäßig definiert
werden, z. B. kann die Auswahl das Resultat eines Algorithmus sein,
der iterativ oder rekursiv Knoten und Deskriptoren, die die Einheit
verkörpern,
erkundet. Wie zum Beispiel in
In manchen Ausgestaltungen kann eine Einheit die Form einer oder mehrerer Datenbanktabellen mit Spalten und Zeilen annehmen. In diesen Ausgestaltungen kann die Transformation oder Teilmengenbildung einer globalen Wissensbank zu einer Einheit zum Beispiel durch die Auswahl von Zeilen erreicht werden, die Assertionen aus einer Datenbanktabelle darstellen, die zu den Auswahlkriterien des Benutzers passen. Es sollte sich verstehen, dass eine Wissensbank oder eine Einheit in Form einer Datenbank nur eine Möglichkeit ist, in der Information in einem Computer dargestellt werden kann. Informationen könnten stattdessen auch als Vektor, als mehrdimensionale Anordnung von Daten, als verknüpfte Datenstruktur oder in Form vieler anderer geeigneter Strukturen oder Ausgestaltungen von Daten dargestellt sein.In In some embodiments, a unit may take the form of one or more Accept database tables with columns and rows. In these embodiments may be the transformation or subsampling of a global knowledge base to reach a unit for example by selecting rows which represent assertions from a database table, the match the user's selection criteria. It should be understood that a knowledge bank or a unit in the form of a database only one way is where information can be represented in a computer. Information could instead, as a vector, as a multidimensional array of Data, as a linked data structure or in the form of many other suitable structures or configurations represented by data.
Ein Aspekt einer Assertion ist eine Zuordnung. Eine Zuordnung stellt die Quelle der Assertion dar, zum Beispiel einen wissenschaftlichen Artikel, eine Zusammenfassung (z. B. Medline oder PubMed), ein Kapitel eines Buches, Tagungsberichte, eine persönliche Mitteilung oder ein internes Memo. Eine Einheit kann durch die Auswahl von Deskriptoren erstellt werden, deren Zuordnung bestimmte Kriterien erfüllen, z. B. Übereinstimmung nach Art der Zuordnungsquelle, Name der Zuordnungsquelle oder Datum der Zuordnungsquelle. Man könnte zum Beispiel alle Assertionen auswählen, deren Zuordnung ein Knoten ist, der einen im Jahr 2001 oder später veröffentlichten Zeitschriftenartikel repräsentiert.One Aspect of an assertion is an assignment. An assignment presents the source of assertion, for example a scientific one Article, a summary (eg Medline or PubMed), a chapter a book, conference proceedings, a personal message or a internal memo. A unit can be selected by selecting descriptors whose assignment meets certain criteria, e.g. B. match By type of attribution source, attribution source name, or date the assignment source. You could For example, select all assertions whose assignment is a node that is, a journal article published in 2001 or later represents.
Ein weiterer Aspekt einer Assertion ist ihr biologischer Kontext. So können Assertionen ausgewählt werden, die mit einem bestimmten biologischen Kontext verknüpft sind.One Another aspect of an assertion is its biological context. So can Assertions selected which are linked to a particular biological context.
Biologischer Kontext bezieht sich beispielsweise auf Spezies, Gewebe, Körperteile, Zelllinien, Tumor, Krankheit, Probe, Virus, Organismus, Entwicklungsstadium oder jede beliebige Kombination daraus. Ein weiterer Aspekt einer Assertion ist ihre Vertrauenswürdigkeit, ein Maß des Vertrauens darauf, dass die Assertion wahrhaft repräsentative, tatsächliche Biologie widerspiegelt und reproduzierbar ist. Assertionen können auch nach ihrer Vertrauenswürdigkeit ausgewählt werden. Dabei wird ein Mindestschwellenwert gesetzt und alle Assertionen, die diesem Schwellenwert entsprechen oder ihn übersteigen, werden ausgewählt.biological Context refers for example to species, tissues, body parts, Cell lines, tumor, disease, sample, virus, organism, stage of development or any combination thereof. Another aspect of a Assertion is their trustworthiness, a measure of Trust that the assertion is truly representative, actual Biology is reflected and reproducible. Assertions can also according to their trustworthiness selected become. It sets a minimum threshold and all assertions that meet or exceed this threshold are selected.
Teilmengen einer Wissensbank können auch mithilfe von Spezifizierungen, die ein komplexes Muster von Assertionen zwischen Knoten definieren, gebildet werden. Alle Reihen von Knoten und Assertionen, die den Kriterien des Musters entsprechen, bilden die Teilmenge. In einer Ausgestaltung kann ein Suchalgorithmus die Datenbank filtern, um eine Liste von biologischen Entitäten, die dem vorher festgelegten Muster entsprechen, zu generieren. Beispielsweise kann eine Struktursuche verwendet werden, um die Teilmenge aller Reaktionen zu generieren, die ein Produkt, das phosphoryliert wird, und einen Molekülkomplex als Katalysator haben. Diese Suche wird alle durch einen Molekularkomplex katalysierten phosphorylierten Reaktionen finden und durch ein einzelnes Protein katalysierte phosphorylierte Reaktionen auslassen.subsets a knowledge bank also by using specifications that form a complex pattern of Assertions between nodes are defined. All rows of nodes and assertions that match the criteria of the pattern the subset. In one embodiment, a search algorithm may be the Filter database to a list of biological entities that according to the predetermined pattern. For example A structure search can be used to get the subset of all Generate reactions that are a product that is phosphorylated, and a molecular complex as a catalyst. This search is all through a molecular complex catalyzed phosphorylated reactions and by a single Protein catalyzed omit phosphorylated reactions.
In
einer weiteren Ausgestaltung können
Teilmengen mithilfe von Algorithmen zur Pfadsuche generiert werden,
dazu gehören
radiale Pfadsuche, Suche nach dem kürzesten Pfad und Suchen aller
Pfade. Radiale Pfadsuche ist hilfreich, um herauszufinden, wie eine
biologische Entität
funktionell oder strukturell mit einer anderen biologischen Entität in Verbindung
steht. Enthält
zum Beispiel irgendeine gegebene Zelle eine mutierte Form von P53,
könnte jemand
daran interessiert sein, ihre Wirkung auf über- und untergeordnete Moleküle des mutierten Genprodukts
aufzuklären.
Ein Algorithmus, um diese Informationen zu finden, kann bei einem
bestimmten Knoten beginnen und alle Knoten finden, die mit diesem
Knoten durch eine vorher festgelegte Anzahl vom Knoten entfernter
Schritte verbunden sind. Falls Richtcharakteristik von Bedeutung
ist (wie z. B. bei Reaktionen), kann der Algorithmus so instruiert
werden, dass er Verknüpfungen
nur in die Richtung folgt, die von den Kriterien für die Pfadsuche
vorgegeben wird. Die radiale Pfadsuche kann in mehreren Schritten
durchgeführt
werden. Eine radiale Pfadsuche in zwei Schritten wird beispielsweise
beinhalten, dass von einem Knoten ausgehend begonnen wird, die unmittelbar
mit ihm verknüpften
Knoten zu suchen und danach die unmittelbar mit diesen Knoten verknüpften Knoten
zu suchen. Dieser Prozess kann auf so viele Schritte wie nötig angewendet
werden. Diese Analyse kann verwendet werden, um die erwarteten Veränderungen
zu bestimmen und vorauszusagen, wenn ein vorhandener Knoten gestört wird.
Diese Analyse kann dem Benutzer gezeigt werden, um zu erläutern, wie
eine Veränderung
sich in der Wissensbank ausbreiten könnte und dadurch ihre tatsächliche
Wirkung auf ein biologisches System festzustellen.
In großen biologischen Netzen gibt es zwischen zwei Entitäten für gewöhnlich mehrere Pfade. Oftmals ist der kürzeste Pfad der nützlichste für eine Analyse. Ein Algorithmus zur Bestimmung des kürzesten Pfads in einem Netzwerk beginnt damit, eine radiale Breitensuche von jedem der beiden Startknoten durchzuführen. Sobald ein gemeinsamer Knoten gefunden ist, wird der Pfad als kürzester Pfad zwischen den Knoten bekannt gegeben. Um die Pfadverläufe zwischen mehreren Knoten zu bestimmen, kann der oben besprochene Algorithmus zum Auffinden des kürzesten Pfades angewendet werden, bis man alle Pfadverläufe zwischen den Knoten gefunden hat. Bei dieser Technik beginnt man von jedem einzelnen Startknoten aus eine radiale Pfadsuche. Dann werden die Pfade aufgezeichnet, denen man in jeder der radialen Suchen gefolgt ist. Das Ergebnis dieses Algorithmus ist die Vereinigung aller Pfade von den Startknoten zu den Zielknoten. Da dieser Ansatz dazu neigt, in Bezug auf die Anzahl von Pfaden und Knoten exponentiell zu wachsen, kann der Algorithmus beschränkt werden, damit er einer vorher festgelegten Anzahl von Schritten folgt. So wird eine Suche in drei Schritten nur all die Pfade generieren, die zwischen den gegebenen Ursprungsknoten bestehen, indem von jedem Knoten aus eine radiale Suche in drei Schritten durchgeführt wird. Das Ergebnis dieses Pfadverlaufsalgorithmus kann zum Beispiel als sortierte Liste von Pfadverläufen angezeigt werden, beginnend mit dem kürzesten oder längsten, oder als integrierter Graph.In huge In biological networks, there are usually two paths between two entities. often is the shortest Path the most useful for an analysis. An algorithm for determining the shortest path in a network begins with a radial breadth search of each of the two start nodes perform. Once a common node is found, the path becomes shortest Path between the nodes announced. To the paths between determine multiple nodes, the algorithm discussed above to find the shortest Paths are applied until all paths between the nodes are found Has. This technique starts from every single start node from a radial pathfinder. Then the paths are recorded, which one has followed in each of the radial searches. The result of this Algorithm is the union of all paths from the start nodes to the destination nodes. Because this approach tends to be in relation to the Number of paths and nodes can grow exponentially, the algorithm limited so that he can take a predetermined number of steps follows. So a three-step search will only generate all the paths that exist between the given source nodes by each one Node is performed from a radial search in three steps. The result of this trail algorithm may be, for example, as sorted list of paths be displayed, starting with the shortest or longest, or as an integrated graph.
Ein
integrierter Graph wird erzeugt, indem im Falle einer radialen Pfadsuche
alle genutzten Pfadverläufe
bis zu einer bestimmten Länge
zusammengefasst werden oder indem die Reihe von Pfaden zusammengefasst
wird, die irgendeinen der Quellknoten mit irgendeinem der Zielknoten
verknüpfen.
Das erreicht man, indem man zwei Pfadverläufe zugleich zusammenfasst,
bis nur ein einzelner Graph entsteht, der alle Knoten und Assertionen
enthält.
Ein Beispiel für
das Zusammenfassen von zwei Pfadverläufen beinhaltet, alle gemeinsamen
Knoten und Assertionen, wie in
Die
Matrixmethode ist eine andere Möglichkeit,
um die Veränderungen
in einem Wissenseinheitsgraphen zu untersuchen. Anhand einer Liste von
Knoten von Interesse (z. B. statistisch signifikante, hoch modulierte
RNS in einem Experiment) werden die Knoten in einer Matrix platziert,
wobei jeder Knoten mit einem Eintrag in einer Spalte und einer Reihe
platziert wird. Dann wird für
jedes Knotenpaar der kürzeste
Pfad generiert (redundante Paarungen werden ignoriert). Dann werden
alle generierten Pfadverläufe
wie oben erklärt
zusammengeführt.
Die Matrixmethode kann auch angewendet werden, indem man nicht nur
einen Pfad für
jede Zelle in der Matrix sucht, sondern indem man mehrere Pfadverläufe generiert.
Das kann auf verschiedene Arten geschehen: (1) man generiert alle
Pfade für
jedes Paar; (2) man generiert die oberen „n" Pfadverläufe beginnend mit dem kürzesten
oder längsten;
(3) man generiert alle oberen „n" Pfadverläufe, die
nicht länger sind
als eine vorher festgelegte Anzahl von Schritten. Die Matrixmethode
ist auch hilfreich, um zu bestimmen, wie eine Reihe biologischer
Entitäten
miteinander in Zusammenhang steht.
Ein abgeleitetes Netzwerk ist nicht auf Operationen beschränkt, die das Anfangsnetzwerkunterteilen, vereinfachen oder zusammenfassen. Die Ableitung kann eine Theorie über das Wissen verkörpern, die es ermöglicht, einen Schluss aus neuen Fakten zu ziehen, die auf anderen Fakten beruhen. Ein Primärbeispiel dafür ist die Theorie, dass biologische Mechanismen erhalten werden und dieser Mechanismus von Gen- und Proteinsequenzen abhängt. Falls also ein Mechanismus einer Spezies bekannt ist, kann geschlossen werden, dass dieser Mechanismus in anderen Spezies existiert, wenn alle beteiligten Gene/Proteine in diesem Mechanismus die gleichen – homologe – Gegenstücke in der zweiten Spezies haben. Diese Technik wird verwendet, um Wissenseinheiten, die sich auf einen einzigen Organismustyp konzentrieren, zu augmentieren. So kann eine Einheit, die auf Humanbiologie ausgerichtet ist, durch Fakten aus der Biologie der Maus vergrößert werden, indem man festlegt, welche Fakten über die Maus die Kriterien für eine Homologie mit dem Menschen erfüllen, und dann in der Einheit die homologen menschlichen Fakten erstellt. Der Grad der Homologie wird durch Homologiepunktwerte bestimmt, die berechnet werden, indem man die Sequenzen der Gene oder Proteine vergleicht. Diese Punktwerte erlauben es, für einen bestimmten Zweck Grenzwerte für die Gemeinsamkeiten festzulegen – in manchen Ausgestaltungen können die Homologiekriterien weit gefasst werden, damit man Fakten, die in Zusammenhang mit anderen Organismen stehen, importieren kann. In anderen Ausgestaltungen können die Grenzwerte eng gefasst werden, damit nur Mechanismen erfasst werden, die auf den ähnlichsten Genen und Proteinen beruhen.A derived network is not limited to operations that subdivide, simplify or summarize the initial network. The derivation can embody a theory of knowledge that allows one to conclude new ones To draw facts based on other facts. A prime example of this is the theory that biological mechanisms are conserved and this mechanism depends on gene and protein sequences. Thus, if one mechanism of one species is known, it can be concluded that this mechanism exists in other species if all the genes / proteins involved in this mechanism have the same - homologous - counterparts in the second species. This technique is used to augment knowledge units that focus on a single type of organism. Thus, an entity focused on human biology can be augmented by facts from the mouse's biology by determining which facts about the mouse fulfill the criteria for homology with humans, and then constructing homologous human facts in the entity , The degree of homology is determined by homology point values, which are calculated by comparing the sequences of the genes or proteins. These scores allow you to set commonality limits for a particular purpose - in some embodiments, the homology criteria can be broad to import facts related to other organisms. In other embodiments, the limits can be narrowed down to cover only mechanisms based on the most similar genes and proteins.
Eineinfaches
Beispiel für
ein abgeleitetes Netzwerk ist ein Netzwerk aus kollabierenden Knoten,
die nicht als eigenständige
Begriffe unterschieden werden müssen.
So unterscheidet die Darstellung den Akt des "Bindens" – ein
Vorgang, bei dem Entitäten
einen Komplex formen – von
einem „Komplex" – dem Ergebnis dieses Vorgangs
des Bindens. Diese Unterscheidung ist in vielen Zusammenhängen irritierend – vor allem,
wenn man ein Netzwerk in einem Graphen darstellt oder Proteine nach
ihren Bindungsbeziehungen in Gruppen einteilt.
Eine
Einheit kann durch einen Zusammenfassungsprozess transformiert werden.
Eine Zusammenfassung beginnt mit dem Prozess der Teilmengenbildung,
wobei Reihen von Knoten, die einer Spezifikation entsprechen, ausgewählt werden.
Jede dieser Reihen kann durch eine neue Reihe von Knoten und Assertionen
ersetzt werden, für
gewöhnlich
ein einfaches Muster wie eine einzelne Assertion zwischen zwei Knoten.
Transformationen der Einheit können durch mathematische Mengenlehreoperationen durchgeführt werden. Zu diesen Operationen gehört zum Beispiel das Bilden der Schnittmenge, der Differenzmenge und der Vereinigungsmenge. Mithilfe von Mengenlehreoperationen kann man Einheiten vergleichen. Alle Mengenlehreoperationen setzen voraus, dass es zwei bestehende Einheiten gibt. Wendet man die Schnittmengenoperation für jede Assertion in einer ersten Einheit an, wird dieselbe Assertion überprüft, um zu erkennen, ob sie nicht in einer zweiten Einheit vorkommt. Taucht die Assertion in einer zweiten Einheit auf, wird sie zur Schnittmengeneinheit hinzugefügt. Knoten, die in irgendeiner Assertion in der Schnittmengeneinheit erwähnt werden, werden ebenfalls aus der ersten Einheit ausgewählt und zur Schnittmengeneinheit hinzugefügt. Wendet man die Differenzoperation für jede Assertion in einer ersten Einheit an, wird dieselbe Assertion überprüft, um zu erkennen, ob sie nicht in einer zweiten Einheit vorkommt. Taucht die Assertion in der zweiten Einheit nicht auf, wird sie zur Differenzeinheit hinzugefügt. Knoten, die in irgendeiner Assertion in der Differenzeinheit erwähnt werden, werden auch aus den ersten oder zweiten Einheiten ausgewählt und zur Differenzeinheit hinzugefügt. Mit einer Vereinigungsmengenoperation wird eine Vereinigungsmengeneinheit erzeugt. Alle Assertionen in einer ersten Einheit werden zur Vereinigungsmengeneinheit hinzugefügt. Denn jede Assertion in einer zweiten Einheit wird nun der Vereinigungsmengeneinheit hinzugefügt, falls sie in der Vereinigungsmengeneinheit nicht existiert. Knoten, die in der Vereinigungsmengeneinheit erwähnt werden, werden aus den ersten oder zweiten Einheiten ebenfalls ausgewählt. Die Vereinigungsmengenoperation ist eine weitere Möglichkeit, um darzulegen, dass zwei oder mehr Einheiten zusammengeführt werden können.Transformations of the unit can be performed by mathematical set theory operations. These operations include, for example, forming the intersection, the difference set, and the union set. You can compare units using set theory operations. All set theory operations assume that there are two existing units. Applying the intersection operation for each assertion in a first unit, the same assertion is checked to see if it does not occur in a second unit. If the assertion occurs in a second unit, it is added to the intersection unit. Nodes mentioned in any assertion in the intersection unit are also selected from the first unit and added to the intersection unit. Applying the difference operation for each assertion in a first unit checks the same assertion to see if it does not occur in a second unit. If the assertion does not appear in the second unit, it is added to the difference unit. Nodes mentioned in any assertion in the difference unit are also selected from the first or second units and added to the difference unit. With a union set operation, a union set unit is created. All assertions in a first unit are added to the union unit of measure. Because every assertion in a second unit is now added to the union unit of measure if it is does not exist in the union unit of measure. Nodes mentioned in the union unit of measure are also selected from the first or second units. The union set operation is another way to demonstrate that two or more units can be merged.
Ein Beispiel für eine Vergleichstechnik in Übereinstimmung mit der Erfindung ist die Messung der Fortentwicklung einer Wissenseinheit über einen bestimmten Zeitraum. Das kann erreicht werden, indem man eine Sequenz von Einheiten nimmt, die im Lauf der Zeit erstellt werden, und den Unterschied zwischen jedem Paar in der Sequenz bestimmt. Außerdem können in Übereinstimmung mit der Erfindung zwei oder mehr Einheiten miteinander verglichen werden. Verwendet man zum Beispiel eine Schnittmenge aus zwei Einheiten, wobei die beiden Einheiten nicht identisch sind, wird die Schnittmenge der Assertionen in den beiden Einheiten bestimmt. Die Schnittmenge enthält die Assertionen, die in beiden Einheiten vorkommen. Verwendet man zum Beispiel die Differenzmenge von zwei Einheiten, wobei die beiden Einheiten nicht identisch sind, wird die Differenzmenge der Assertionen in den beiden Einheiten bestimmt. Die Differenzmenge enthält die Assertionen, die in einer der Einheiten vorkommen, nicht aber in der anderen. Vergleiche zwischen Einheiten können hilfreich sein, um Gemeinsamkeiten und Unterschiede biologischer Systeme zu erklären. So könnte beispielsweise eine Einheit ein normales System repräsentieren und eine andere Einheit ein krankes System. Für einen Wissenschaftler wäre es sehr aufschlussreich, die Gemeinsamkeiten und Unterschiede von zwei Systemen zu bestimmen.One example for a comparison technique in accordance with the invention is the measurement of the evolution of a knowledge unit about a particular Period. This can be achieved by taking a sequence of units takes that are created over time, and the difference between determined for each couple in the sequence. Moreover, in accordance with the invention two or more units are compared. used For example, consider an intersection of two units, with the Both units are not identical, the intersection of the Assertions in the two units determined. The intersection contains the assertions which occur in both units. If one uses for example the Difference quantity of two units, where the two units are not are identical, the difference of the assertions in the two Units determined. The difference set contains the assertions that appear in one of the units, but not in the other. comparisons between units be helpful to similarities and differences biological Explain systems. So could For example, a unit representing a normal system and another unit is a sick system. For a scientist, it would be very enlightening to determine the similarities and differences of two systems.
Instrumente, um aus Einheiten Wissen zu schöpfen Die vorliegende Erfindung kann die Analyse einer Einheit zur Ermittlung von neuem biologischen Wissen beinhalten. Analyse schließt unter anderem eine algorithmische Analyse ein, die von Computern oder Personen durchgeführt werden kann. Algorithmen, die Pfadsuche, homologes Schlussfolgern oder simulationsbasiertes Schlussfolgern beinhalten, können neue Assertionen ableiten, die danach der Einheit zugeführt werden können, um diese zu augmentieren. Einheiten können durch Homologietransformation auch verfeinert und augmentiert werden, unter der Annahme, dass (1) die Physik und die fundamentalen biochemischen Eigenschaften und Wechselbeziehungen von Substanzen unter typischen biologischen Bedingungen konstant bleiben und (2) homologe Strukturen identische oder analoge Funktion haben. Enthält eine globale Wissensbank beispielsweise Daten darüber, dass Komplex C produziert wird, wenn Molekül A mit Molekül B in einer Nervenzelle kollidiert, dann kann angenommen werden, dass A + B = C auch dann gilt, wenn A und B in einer Leberzelle kollidieren. Wenn die Leberzellenassertion der globalen Wissensbank Knoten A und Knoten B enthält, aber nicht den Deskriptor, der besagt, dass sie zusammen den Komplex C bilden, kann diese Information während der Kompilierung einer Lebereinheit in dieses importiert werden. Ganze Kaskaden biologischer Aktivitäten können mithilfe solcher Logik in eine Einheit importiert werden. Ähnlich verhält es sich, wenn eine globale Wissensbank die Information enthält, dass ein Mäuseprotein M sich mit dem Mäuserezeptor R verbindet, um die Reparatur der Nierentubuli zu starten, und humanbiologische Assertionen in der Wissensbank einen Knoten homolog zu Mäuseprotein M und einen weiteren homologen Knoten zu Rezeptor R enthalten, dann können die Wechselwirkung und möglichen nachgeordneten Ereignisse aus der Mauseinheit in eine Einheit importiert werden, die auf ein humanbiologisches System ausgerichtet ist. Darüber hinaus kann eine Einheit mit einer anderen, die mit anderen Kriterien generiert wurde, kombiniert und danach die logischen Inkonsistenzen und Redundanzen entfernt werden, damit ein noch besseres, vollständigeres oder enger fokussiertes biologisches Modell erstellt werden kann.instruments to draw knowledge from units The present invention may include the analysis of a unit for detection of new biological knowledge. Analysis concludes another algorithmic analysis by computers or Persons performed can be. Algorithms, the path search, homologous reasoning or include simulation-based reasoning, may be new Derive assertions, which are then fed to the unit can, to augment them. Units can be transformed by homology also refined and augmented, assuming that (1) physics and fundamental biochemical properties and Interactions of substances under typical biological conditions remain constant and (2) homologous structures have identical or analogous function to have. contains a global knowledge base, for example, data that Complex C is produced when molecule A interacts with molecule B in a nerve cell collides, then it can be assumed that A + B = C even then applies when A and B collide in a liver cell. When the liver cell assertion The global knowledge base includes node A and node B, but not the descriptor, stating that they are together the complex C, this information can be compiled during compilation Liver unit to be imported into this. Whole cascades of biological activities can be imported into a unit using such logic. Similarly, if a global knowledge base contains the information that a mouse protein M with the mouse receptor R connects to start kidney tubule repair and human biological assays in the knowledge bank one node homologous to mouse protein M and another contain homologous nodes to receptor R, then the interaction and potential Subsequent events from the mouse unit are imported into a unit oriented towards a human biological system. Furthermore can one unit with another that was generated with other criteria combined and then the logical inconsistencies and redundancies be removed for an even better, more complete or narrow focused biological model can be created.
Techniken zur grafischen Ausgabetechniques for graphic output
Eine Wissenseinheit kann visuell als ein Graph aus Knoten dargestellt werden, die durch Verknüpfungen, die biologische Beziehungen zwischen und unter Knoten repräsentieren, verbunden sind. Diese Graphen können von einem Wissenschaftler untersucht werden, damit er das biologische System besser versteht und ihm die Ermittlung von neuem biologischen Wissen über Systeme, die mit den Biowissenschaften in Beziehung stehen, erleichtert wird. Die Nutzung von Einheiten, um biologisch relevante Einsichten darüber zu erhalten, wie ein System sich verhält, kann in der Arzneimittelforschung und -entwicklung sowie bei der Entwicklung einer Vielzahl von Therapien äußerst wertvoll sein. Mit den hier beschriebenen Techniken kann man durch die Nutzung von Einheiten, die durch Verfahren und Systeme dieser Erfindung geschaffen wurden, zu biologisch relevanten Einsichten gelangen. Visualisierungstechniken können auch genutzt werden, um Wissen und verwandte Daten darzustellen, um so das Verständnis des Nutzers und das Erkennen von Beziehungen zwischen Entitäten, die als Muster und Häufungen vorkommen können, zu verbessern.A Knowledge unit can be visually represented as a graph of nodes be created by shortcuts, represent the biological relationships between and among nodes, are connected. These graphs can be examined by a scientist so he can study the biological System understands better and him the discovery of new biological Know about Systems related to the life sciences facilitate becomes. The use of units to provide biologically relevant insights about that How a system behaves can be used in drug discovery and development and in the development of a variety of therapies extremely valuable be. With the techniques described here one can by the use of Units provided by methods and systems of this invention were to arrive at biologically relevant insights. visualization techniques can can also be used to represent knowledge and related data, for the sake of understanding of the user and the recognition of relationships between entities that occur as patterns and accumulations can, to improve.
Nachdem man mit irgendeiner der oben genannten Techniken Graphen generiert hat, möchte man vielleicht eine bessere Vorstellung vom biologischen Kontext der Pfadverläufe bekommen. Das kann erreicht werden, indem man bei jedem Knoten im Eingabe-Graphen beginnt und von jedem Knoten aus eine Radialsuche mit n-Schritten durchführt. Dieser Schritt „dehnt" die Knoten und die Größe des Graphen „aus". Durch farbliche Codierung der Knoten, um eine Modulation anzuzeigen (wie durch experimentelle Daten festgelegt) kann man die relevanten Veränderungen erkennen, die funktionell oder strukturell proximal zum relevanten Graphen stehen, oder anders gesagt, zum biologischen Kontext.After having generated graphs using any of the above techniques, you may want to get a better idea of the biological context of the pathways. This can be achieved by starting at each node in the input graph and performing an n-step radial search from each node. This step "stretches" the nodes and the size of the graph. By color coding the nodes to indicate a modulation (as described by experi mental data) one can recognize the relevant changes that are functionally or structurally proximal to the relevant graph, or in other words, to the biological context.
Experimentelle
Daten können
in einer Einheit kartografiert werden, indem Messungen aus Experimenten
an die Assertionen in der Einheit, die die gemessenen Quantitäten darstellen,
angepasst werden. In diesem Kontext bedeutet kartografieren, visuell
wiedererkennbare Indizien wie Farbe auf eine Karte von Pfadverläufen zu
legen, um so kenntlich zu machen, welche Knoten bei einem Prozess
beteiligt sind. Das kann zum Beispiel gemacht werden, indem Knoten,
die Genexpressionsprozesse darstellen, an die durch Mikrobereiche
oder andere Techniken wie RT-PCR gemessenen Niveaus von Boten-RNA
angepasst werden. Knoten, die eine Fülle von Proteinen repräsentieren,
können
an Daten aus proteometrischen Messungen angepasst werden. Knoten,
die eine Fülle
von chemischen Substanzen repräsentieren,
können
an Daten aus metabolomischen Messungen angepasst werden. Einmal
kartografiert können
die Daten verarbeitet werden, um einfachere Qualitätsmerkmale
des Knotens zu erstellen, die den Einsatz von Algorithmen für die Darstellung
oder Analyse vereinfachen. Zum Beispiel können Faltungsveränderungsdaten
basierend auf Benutzer gesteuerten Grenzwerten zusammengefasst werden und
Knoten mit Vermerken zu zusätzlichen
Qualitätsmerkmalen
wie „nach
oben" oder „nach unten" versehen werden,
damit die Anwendung einfacher Algorithmen zur Darstellung oder Analyse
möglich
ist. Faltungsveränderungsdaten
können
auch durch Schattierung gezeigt werden, wie in
Logische Simulation kann in Übereinstimmung mit der Erfindung ebenfalls eingesetzt werden. Als logische Simulation bezeichnet man eine Klasse von Operationen, die auf eine Einheit angewendet werden, in der beobachtete oder hypothetische Änderungen auf einen oder mehrere Knoten in der Einheit gültig werden und in der die Implikationen dieser Veränderungen basierend auf den kausalen Beziehungen, die als Assertionen in der Einheit dargestellt werden, im Netzwerk verbreitet werden. Eine logische Simulation kann entweder vorwärts gerichtet sein, dann werden die Auswirkungen der Änderungen von den Ursprungspunkten der Änderung ausgehend in Richtung nach unten verbreitet und wirken dort, oder sie kann rückwärts gerichtet sein, dann werden die Auswirkungen der Änderungen von den Ursprungspunkten der Änderung ausgehend in Richtung nach oben verbreitet und wirken dort. In jedem Fall ist ein Ergebnis einer logischen Simulation ein neues abgeleitetes Netzwerk, das aus den Konten und Assertionen besteht, die bei der Verbreitung der Ursache oder der Wirkung beteiligt waren. Dieses abgeleitete Netzwerk enthält eine Hypothese über das zu untersuchende System.logical Simulation can be in accordance also be used with the invention. As a logical simulation One refers to a class of operations that are based on one unit be applied in the observed or hypothetical changes become valid on one or more nodes in the unit and in which the Implications of these changes based on the causal relationships that assertions in the Unit to be represented, spread on the network. A logical simulation can either be forward, then become the impact of the changes from the origin points of the change starting in the downward direction and acting there, or she can be directed backwards be, then the effects of the changes from the origin points the change starting in the direction of upward spread and work there. In any case is a result of a logical simulation a new derivative Network, which consists of the accounts and assertions, which at the Dissemination of the cause or effect were involved. This contains derived network a hypothesis about the system to be examined.
Im
Fall einer auf beobachteten Änderungen in
RNS-Expressionsniveaus
basierenden Rückwärtssimulation
zeigt
Das resultierende abgeleitete Netzwerk enthält eine Hypothese über die möglichen Ursachen der beobachteten Daten. Dazu kann es außerdem, abhängig von den Verfahren zur Verbreitung der Kausalität, als Hypothese über die am stärksten mitverantwortlichen und konsistenten möglichen Ursachen der beobachteten Daten werden, d. h. einer Reihe von möglichen Ursachen, die nach objektiven Kriterien angeordnet sind. Diese Technik ist nicht auf RNS-Expressionsdaten beschränkt, sondern kann auf jede Reihe von Veränderungen angewendet werden, die als Darstellungssystem ausgedrückt werden kann, darunter, aber nicht ausschließlich, proteometrische Daten, metabolomische Daten, posttranslationale Modifikationsdaten oder sogar Reaktionszeitdaten.The resulting derived network contains a hypothesis about the potential Causes of the observed data. This can also happen, depending on the procedures for Dissemination of causality, as a hypothesis about the strongest co-responsible and consistent possible causes of observed Data becomes, i. H. a number of possible causes after objective criteria are arranged. This technique is not based on RNA expression data limited, but can be applied to any number of changes which can be expressed as a presentation system, including, but not exclusively, proteometric data, metabolomic data, post-translational Modification data or even reaction time data.
Abgeleitete Netzwerke können als Datenobjekte innerhalb eines Programmierungsrahmens für allgemeine Zwecke wie einer Skriptsprache erstellt werden. Spezielle Operatoren wie die oben beschriebenen Verfahren zur Suche nach Pfadverläufen oder logischen Simulation ermöglichen es, diese Datenobjekte zu speichern, zu laden und auf sie zuzugreifen. Außerdem können die Objekte mithilfe der Standardfunktionen des Programmierungsrahmens bearbeitet werden. Weil sowohl die Eingabe als auch die Ausgabe dieser Operationen die abgeleiteten Netzwerke umfasst, können in größeren Verfahren, in Verfahren, die biologisch signifikante Inferenzen umfassen, und in Verfahren, die Theorien und Techniken für automatische Verarbeitung biologischer Datenreihen und biologischen Wissens umfassen, mehrere Verarbeitungsschritte kombiniert werden. Durch unterschiedliche Kriterien können vielfältige abgeleitete Netzwerke erstellt und danach verglichen, zusammengeführt oder auf andere Weise bearbeitet werden. Eine Vielzahl von Hypothesen, wie sie in diesen Netzwerken enthalten sind, kann evaluiert, verglichen und eingestuft werden.derived Networks can as data objects within a programming framework for general Purposes such as a scripting language. Special operators like the methods described above for searching for paths or logical Enable simulation to store, load, and access these data objects. In addition, the Objects using the standard functions of the programming framework to be edited. Because both the input and the output These operations may include the derived networks in larger procedures, in procedures involving biologically significant inferences, and in Method, the theories and techniques for automatic processing biological series and biological knowledge, several Processing steps are combined. By different Criteria can diverse created derived networks and then compared, merged or be edited in another way. A variety of hypotheses how they are contained in these networks can be evaluated, compared and be classified.
Ein Beispiel für eine Methode, die aus hier genannten Techniken besteht, würde wie folgt aussehen: (1) Laden Sie eine Reihe von Expressionsdaten über Faltungsveränderung in die Einheit; (2) führen Sie eine auf den Faltungsveränderungsdaten basierende logische Rückwärtssimulation durch; (3) untersuchen Sie das resultierende abgeleitete Netzwerk und wählen Sie die am häufigsten betroffenen Knoten – diejenigen, welche die als am wahrscheinlichsten eingestuften möglichen Ursachen der beobachteten Daten sind; (4) kehren Sie für diese Reihe von Knoten zurück zur Ursprungseinheit und führen Sie einen Algorithmus zur Pfadsuche aus, um das abgeleitete Netzwerk zu finden, das der kleinste Graph ist, der die Knoten verbindet; und (5) geben Sie das resultierende abgeleitete Netzwerk als Graph aus. Verfahren wie dieses Beispiel können als Funktionen im Programmierungsrahmen enthalten sein und benannt und erneut verwendet werden.One example for a method that consists of techniques mentioned here would like looks like this: (1) Load a bunch of expression data about convolutional change in the unit; (2) lead you one on the convolutional change data based logical reverse simulation by; (3) examine the resulting derived network and choose The most common affected nodes - those which are the most likely to be classified Causes of the observed data are; (4) return for these Row of knots back to the source unit and lead You can use a pathfinding algorithm to discover the derived network finding that is the smallest graph connecting the nodes; and (5) give the resulting derived network as a graph out. Procedures like this example can be considered functions in the programming framework be included and named and reused.
Eine
Variation des Einheitsübersichtsgraphen
ist es, einen Graphen zu generieren, der Simulationsergebnisse zeigt,
wie in
BEISPIEL 1EXAMPLE 1
Validationsalgorithmus für biologische ModelleValidation algorithm for biological models
Ein
Beispiel für
einen Algorithmus, der zur Validation eines biologischen Modells
durch Vergleich von vorausgesagten mit tatsächlichen Ergebnissen verwendet wird,
wird weiter unten und im Pseudocode in
Die vorausgesagten Ergebnisse können in zwei Stufen bestimmt werden. Zuerst wird eine Rückwärtssimulation, wie sie hier beschrieben ist, an einer Wissensbank durchgeführt, um potenzielle Ursachen der Genexpressionsänderungen zu bestimmen. Die Rückwärtssimulation erzeugt eine Liste von Genen und einen Punktwert für jedes Gen. Der Punktwert für jeden Knoten basiert auf den „Voten", die er während der Rückwärtssimulation erhalten hat. Beim Beginn der Rückwärtssimulation werden Knoten, die die signifikant heraufregulierte Gene repräsentieren, positive Voten zugeordnet, während solche, die signifikant herunterreguliert sind, negative Voten bekommen. Während der Simulation werden Voten gemäß einer Reihe von Regeln, die den in der Wissensbank dargestellten Kausalbeziehungen entsprechen, von Knoten zu Knoten kopiert. Am Ende der Simulation wird der Punktwert für jeden Knoten als ein Satz aus drei Ziffern berechnet: die Summe der positiven Voten, die Summe der negativen Voten und eine Gesamtsumme, die die Summe der positiven und negativen Voten ist. An diesem Punkt kann der Satz von Knoten, die potenzielle Ursachen („die Gründe") darstellen, für den nächsten Schritt verwendet und basierend auf dem Punktwert eines jeden Knotens ausgewählt werden, oder die Reihe potenzieller Ursachen kann manuell bestimmt werden. Auf der zweiten Stufe werden die Voten für alle Knoten auf Null gesetzt und mit der ausgewählten Reihe von Ursachen wird wie hier beschrieben eine Vorwärtssimulation durchgeführt. Mit den Voten wird auf dieselbe Weise verfahren, außer dass sie von Ursachen auf potenzielle Wirkungen ausgebreitet werden. Am Ende der Vorwärtssimulation werden Knoten überprüft, die die Expression von Genen repräsentieren. Solche mit einem positiven Gesamtpunktwert sind diejenigen, von der die Vorwärtssimulation voraussagt, dass sie nach oben reguliert werden, und solche mit einem negativen Gesamtpunktwert sind diejenigen, die laut Voraussage nach unten reguliert werden. Die Ergebnisse der Vorwärtssimulation stellen die Gesamtheit der vorausgesagten Ergebnisse dar.The predicted results can be determined in two stages. First, a backward simulation, as described here, conducted at a knowledge bank to to determine potential causes of gene expression changes. The reverse simulation generates a list of genes and a score for each Gene. The score for each Knot is based on the "votes" he made during the backward simulation had received. At the beginning of the backward simulation become nodes that represent the significantly upregulated genes, assigned positive votes while those who are significantly downregulated get negative votes. During the Simulation will be votes according to a series of rules that correspond to the causal relationships presented in the knowledge base match, copied from node to node. At the end of the simulation will be the score for calculates each node as a set of three digits: the sum the positive votes, the sum of the negative votes and a grand total, which is the sum of positive and negative votes. At this point For example, the set of nodes representing potential causes ("the reasons") may be for the next step used and selected based on the score of each node, or the range of potential causes can be determined manually. On the second level, the votes for all nodes are set to zero and with the selected one A series of causes is carried out as described here, a forward simulation. With the votes are made in the same way, except that they arise from causes potential effects. At the end of the forward simulation Nodes are checked that represent the expression of genes. Those with a positive total score are those of whom the forward simulation predicts that they are up-regulated, and those with a negative total scores are those that predicted down regulated. The results of the forward simulation represent the totality of the predicted results.
Die tatsächlichen Resultate werden in zwei Kategorien eingeteilt, die auf den Genexpressionsdaten basieren. Eine Liste enthält nach oben regulierte Gene und die andere Liste enthält nach unten regulierte Gene. Die in diesen Listen enthaltenen Gene können durch verschiedene statistische Verfahren generiert werden, wobei absolute Größenordnung der Veränderung (z. B. Signalniveau), relative Größenordnung der Veränderung (z. B. Faltungswerte), statistische Signifikanz usw. mit berücksichtigt werden. Die Gene können aber auch manuell ausgewählt werden.The actual Results are divided into two categories based on the gene expression data based. Contains a list up-regulated genes and the other list contains down regulated genes. The genes contained in these lists can by different statistical methods are generated, where absolute Magnitude of the change (eg signal level), relative magnitude of change (eg convolution values), statistical significance etc. become. The genes can but also manually selected become.
Nachdem die vorausgesagten und tatsächlichen Ergebnisse generiert worden sind, werden die Ergebnisse für jedes Gen in den folgenden drei Fällen tabellarisch angeordnet. Im ersten Fall soll das Gen laut Voraussage nach oben reguliert werden. Wenn das Gen sich in der aktuellen Liste der nach oben regulierter Gene befindet, wird der „Zähler für korrekte Voraussagen" erhöht. Wenn das Gen sich aber in der aktuellen Liste der nach unten regulierter Gene befindet, wird der „Zähler für gegenteilige Voraussagen" erhöht. Wenn das Gen sich aber in keiner der Listen für tatsächliche Genexpressionsänderungen befindet, wird der „Zähler für nicht beobachtete Voraussagen" erhöht. Im zweiten Fall soll das Gen laut Voraussage nach unten reguliert werden. Wenn das Gen sich in der Liste der tatsächlich nach oben regulierter Gene befindet, wird der „Zähler für gegenteilige Voraussagen" erhöht. Wenn das Gen sich aber in der Liste der tatsächlich nach unten regulierter Gene befindet, wird der „Zähler für korrekte Voraussagen" erhöht. Wenn das Gen sich aber in keiner der Listen für tatsächliche Genexpressionsänderungen befindet, wird der „Zähler für nicht beobachtete Voraussagen" erhöht. Im dritten Fall existiert keine Voraussage für das Gen und der „Zähler für keine Netto-Veränderung" wird erhöht.After this the predicted and actual Results have been generated, the results for each Gene in the following three cases arranged in tabular form. In the first case, the gene should be predicted be regulated upwards. If the gene is in the current list of the upregulated genes, the "Counter for correct Predictions "increased. If However, the gene is in the current list of down-regulated genes is the counter for opposite Predictions "increased. If however, the gene is not in any of the lists for actual gene expression changes is located, the "counter for not observed predictions "in the second Case, the gene is according to prediction down regulated. If that Gen up in the list of actually up regulated genes, the "counter predictor counter" is increased but the gene is in the list of genes actually down-regulated is located, the "counter for correct Predictions "increased. If however, the gene is not in any of the lists for actual gene expression changes, will the "counter for not observed predictions "in the third Case, there is no prediction for the gene and the "counter for none Net change "is increased.
Für jedes
Gen, das sich in einer der Listen der Gene befindet, die tatsächlich nach
oben oder unten reguliert werden, für das es aber keine Voraussage
gibt, wird der „Zähler für nicht
vorausgesagte Beobachtungen" erhöht. Die
fünf Zähler werden
dann wie folgt ausgegeben: (1) „Zähler für korrekte Voraussagen", (2) „Zähler für gegenteilige
Voraussagen", (3) „Zähler für nicht
beobachtete Voraussagen",
(4) „Zähler für nicht
vorausgesagte Beobachtungen" und (5) „Zähler für keine
Netto-Veränderung". Diese Zähler können zum
Beispiel in einem Histogramm oder eines Tortendiagramms, wie in
BEISPIEL 2EXAMPLE 2
Algorithmus zur Identifizierung von Biomarkernalgorithm for the identification of biomarkers
Ein
Beispiel für
einen Algorithmus zur Identifizierung von Biomarkern in Übereinstimmung
mit der Erfindung wird weiter unten und im Pseudocode in
Der erste Schritt des Biomarker-Algorithmus ist es, ausgehend von einer Liste bekannter sezernierter Proteine eine Pfadverlaufssuche auszuführen. Bei jedem Suchschritt werden Knoten mit dem Mindestabstand zu einem Quellknoten gekennzeichnet, d. h. der Anzahl von Schritten, die sie von einem sezernierten Protein entfernt sind. Der zweite Schritt ist, an der Liste der Proteine in der Einheit eine Iteration vorzunehmen. Für jedes Protein auf der Liste wird wie folgt eine Liste von Maßen berechnet: Berechnung von Richtungskoeffizient und Faltung, Biomarker- und Sekretionspunktwert, Entfernung von einem sezernierten Protein (wurde im ersten Schritt berechnet). Diese Maße werden in eine Zeile in eine Ausgabedatei geschrieben. Faltungsberechnungen beziehen sich auf Daten, die als Faltungsveränderungen gegenüber Steuerungen ausgedrückt werden, und können auf verschiedene Weise berechnet werden, zum Beispiel (1) Krankheit gegenüber Normalzustand; (2) Behandlung mit Medikamenten gegenüber keine Medikamentengabe; (3) Widerstandsfähigkeit gegenüber Suszeptibilität. Der Richtungskoeffizient ist ein Maß für die Veränderungsrate einer Reihe von Datenpunkten. Eine Datenreihe kann zum Beispiel zu verschiedenen Zeitpunkten oder bei unterschiedlichen Dosierungsniveaus gemessen werden. Ein Verfahren, um den Richtungskoeffizienten einer Reihe zu bestimmen, ist die Anwendung einer linearen Regression, die in einer geraden Linie resultiert, die am besten zu der Datenreihe passt.Of the The first step of the biomarker algorithm is to start from one List of known secreted proteins to perform a trail search. at each search step becomes nodes with the minimum distance to one Source node marked, d. H. the number of steps that they are removed from a secreted protein. The second step is to iterate on the list of proteins in the unit. For each Protein on the list is calculated as follows a list of measures: Calculation of directional coefficient and convolution, biomarker and Secretion score, removal of a secreted protein (was calculated in the first step). These dimensions are in one line in an output file written. Convolution calculations relate on data, as folding convolutions across from Controls expressed be, and can be calculated in different ways, for example (1) disease across from Normal state; (2) treatment with drugs versus none Medication; (3) resistance to susceptibility. The direction coefficient is a measure of the rate of change a series of data points. A data series can be, for example at different times or at different dosage levels be measured. A method to calculate the directional coefficient of a Determining series is the application of a linear regression, which results in a straight line best matching the data series fits.
Punktwerte für den Richtungskoeffizienten werden gemessen, indem man die Genexpressionsmessungen für jede Untersuchung, die mit dem Protein korrespondiert, über drei Zelltypen betrachtet. Untersuchungen, die einer Kreuzbindung unterliegen, werden ignoriert. Die restlichen Werte werden mit einem Referenzniveau verglichen, wobei ein Wert von 2 zugewiesen wird, wenn der Richtungskoeffizient dieses überschreitet, ein Wert von 1, wenn er nur die halbe Höhe des Referenzniveaus erreicht, oder 0, falls der Richtungskoeffizient weniger als die halbe Höhe des Referenzniveaus erreicht. Für negative Richtungskoeffizienten werden negative Werte zugewiesen. Über die Zelllinien wird, je nachdem welche benutzt wird, nach drei Mustern gesucht und die Untersuchungspunktwerte werden berechnet. Für ein Dosis abhängiges Muster werden die Werte über die Zelltypen addiert. Für ein Resistenzmuster wird der Wert für die resistente Zelllinie mit 2 multipliziert und davon diescores for the Directional coefficients are measured by taking gene expression measurements for every Assay that corresponds to the protein, about three Considered cell types. Examinations subject to cross-binding, are ignored. The remaining values are with a reference level where a value of 2 is assigned when the direction coefficient this exceeds a value of 1 if it only reaches half the height of the reference level, or 0 if the direction coefficient is less than half the height of the reference level reached. For negative direction coefficients are assigned negative values. About the Cell lines will look like three patterns, depending on which one is used searched and the examination point values are calculated. For a dose dependent Patterns become the values above adds the cell types. For a resistance pattern becomes the value for the resistant cell line multiplied by 2 and of which the
Summe der Werte der beiden sensiblen Zelllinien subtrahiert. Für ein Wirksamkeitsmuster wird der Wert der sensibelsten Zelllinie verdoppelt, der Wert der partiell sensiblen Zelllinie hinzuaddiert und davon der Wert für die resistente Zelllinie subtrahiert. Die Punktwerte aller Untersuchungen werden verglichen, und falls bei einem Paar ein Vorzeichenkonflikt auftritt, wird ein Gesamtpunktzahl von 0 gemeldet, um einen Konflikt anzuzeigen. In allen anderen Fällen wird der höchste oder negativste Punktwert gemeldet. Berechnungen für die Faltungswerte werden auf dieselbe Weise durchgeführt.total subtracted from the values of the two sensitive cell lines. For an efficacy pattern the value of the most sensitive cell line is doubled, the value of partially added to sensitive cell line and of it the value for the resistant Subtracted cell line. The scores of all examinations will be compared and if a sign conflict occurs in a pair, a total score of 0 is reported to indicate a conflict. In all other cases will be the highest or most negative score reported. Calculations for the convolution values are done in the same way.
Für die Bewertung von Biomarkern wird eine Punktzahl von 2 aufgezeichnet, wenn das Protein ein bekannter Biomarker ist, oder eine 1, falls es keiner ist. In gleicher Weise wird für sezernierte Proteine ein Punktwert von 2 aufgezeichnet, wenn es ein (mutmaßlich) sezerniertes Protein ist, ansonsten wird ein Punktwert von 1 aufgezeichnet.For the rating biomarkers will record a score of 2 if that Protein is a known biomarker, or a 1 if it is not. In the same way is for secreted proteins recorded a score of 2 when it a (suspected) secreted protein, otherwise a score of 1 is recorded.
Die Ausgabedatei wird mithilfe eines Algorithmus sortiert, der aus den Werten der Maße einen Gesamtpunktwert berechnet. Im aktuellen Beispiel wird nur der Faltungspunktwert verwendet. Proteine, die die höchsten absoluten Werte haben (d. h. solche, die ganz oben oder ganz unten auf der sortierten Liste stehen), werden für die weitere Evaluation, ob sie gute Kandidaten für Biomarker wären, ausgewählt.The The output file is sorted using an algorithm derived from the Values of measurements calculated a total score. In the current example will only the convolution score is used. Proteins that are the highest absolute Have values (that is, those at the top or bottom of the sorted list), for further evaluation, see if they are good candidates for Biomarkers would be, selected.
Die Hauptkomponenten des Punktwerts des Algorithmus basieren auf Genexpressionsdaten. Für jede Locus-ID gibt es Werte für multiple Untersuchungsreihen, die verarbeitet werden, um Werte über Richtungskoeffizienten und Faltungsveränderung zu liefern. Die Maße für jede Locus-ID werden berechnet, indem die Daten aus den Untersuchungen gebündelt werden, während man nach Zeichen sucht, die sich widersprechen (sich widersprechende Vorzeichen hätten den Punktwert 0 zur Folge). Der Algorithmus kann Dosisdependenz, Sensibilität, Resistenz und Wirksamkeit des Medikaments überprüfen, und das Punktwertmaß berechnet sich für jede dieser Eigenschaften anders. Sucht man zum Beispiel nach einem Resistenzmuster, würde der Richtungskoeffizient positiv bewertet, falls die beiden resistenten Zelllinien gleich wären und die sensible Zelllinie andersartig wäre, wohingegen man für die Dosis-Wirkung-Beziehung nach einer parallelen Veränderung über alle Zelllinien suchen würde. Der oben näher erläuterte Algorithmus liefert eine Liste, die dann nach Spalten sortiert wird, und die Gene, die ganz oben (Faltung) stehen, werden als gute Biomarker eingeschätzt.The major components of the score of the algorithm are based on gene expression data. For each locus ID, there are values for multiple series of tests that are processed to provide values about directional coefficients and convolutional changes. The measures for each locus ID are calculated by bundling the data from the examinations while looking for characters, which contradict themselves (contradictory signs would result in the score 0). The algorithm can check dose dependency, sensitivity, resistance, and efficacy of the drug, and the score scales differently for each of these traits. For example, if one were looking for a resistance pattern, the directional coefficient would be considered positive if the two resistant cell lines were the same and the sensitive cell line were different, whereas the dose-response relationship would look for a parallel change across all cell lines. The algorithm explained above provides a list which is then sorted by columns, and the genes that are at the top (convolution) are considered to be good biomarkers.
Obwohl die Erfindung besonders unter Bezugnahme auf spezielle Ausgestaltungen vorgestellt und beschrieben worden ist, sollte jedoch klar sein, dass von denen, die in dieser Kunst besonders geschickt sind, vielfältige Veränderungen in Form und Detail gemacht werden können, ohne dass dadurch vom Geist und Umfang der Erfindung, wie sie durch die Ansprüche im Anhang dargelegt sind, abgewichen wird. Der Umfang der Erfindung wird deshalb durch die im Anhang dargelegten Ansprüche angezeigt, und es ist beabsichtigt, hier alle Änderungen, die innerhalb von Bedeutung und Umfang der Bedeutungsgleichheit der Ansprüche auftreten, ebenfalls einzuschließen.Even though the invention particularly with reference to specific embodiments However, it should be clear that Of those who are particularly skilled in this art, many changes can be made in shape and detail without being affected by Spirit and scope of the invention as defined by the appended claims deviated from. The scope of the invention is therefore through the claims set out in the Annex displayed, and it is intended that all changes made within Significance and scope of the equivalence of claims occur also include.
ZUSAMMENFASSUNGSUMMARY
Offenbart sind Verfahren, Systeme und Vorrichtungen zum Aufbauen von Zusammenstellungen biologischen Wissens, die eine biologische Wissensbank bilden, und zum Auswählen und Übertragen von Biowissenschaft betreffenden Daten und Informationen in biologische Modelle, um die elektronische Verarbeitung und elektronisches Schlussfolgern auf biologische Informationen zu vereinfachen. Eine Teilmenge von Daten wird von einer umfassenden Wissensbank oder einem Wissensspeicher extrahiert, um eine spezialisiertere untergeordnete Wissensbank oder -einheit zu erzeugen, die speziell für die vorliegenden Zwecke ausgebildet ist. Mittels der Erfindung generierte Zusammenstellungen erlauben die Selektion und rationale Organisation von scheinbar verschiedenen Daten in einem Modell eines beliebig ausgewählten biologischen Systems, das durch beliebig gewünschte biologische Kriterien definiert ist. Aus diesen Zusammenstellungen kann auf einfache Weise geschöpft und mit großer Leistungsfähigkeit und Effizienz logisch geschlussfolgert werden.Disclosed For example, methods, systems and apparatus for building compilations are biological Knowledge that forms a biological knowledge base, and to select and transmit Bioscience data and information in biological Models based on electronic processing and electronic reasoning to simplify biological information. A subset of data is from a comprehensive knowledge bank or knowledge store extracted to a more specialized child knowledge base or unit designed specifically for the present purposes is. Compounds generated by the invention allow the Selection and rational organization of seemingly different Data in a model of any selected biological system, by any desired biological criteria is defined. From these compilations can be scooped in a simple way and with big ones capacity and efficiency are logically inferred.
Claims (101)
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US53535204P | 2004-01-09 | 2004-01-09 | |
US60/535,352 | 2004-01-09 | ||
US10/794,407 | 2004-03-05 | ||
US10/794,407 US20050154535A1 (en) | 2004-01-09 | 2004-03-05 | Method, system and apparatus for assembling and using biological knowledge |
PCT/US2005/000202 WO2005106764A2 (en) | 2004-01-09 | 2005-01-06 | Method, system and apparatus for assembling and using biological knowledge |
Publications (2)
Publication Number | Publication Date |
---|---|
DE112005002331T5 true DE112005002331T5 (en) | 2007-11-08 |
DE112005002331B4 DE112005002331B4 (en) | 2011-07-28 |
Family
ID=34743071
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
DE112005002331T Expired - Fee Related DE112005002331B4 (en) | 2004-01-09 | 2005-01-06 | Method, system and apparatus for compiling and using biological knowledge |
Country Status (5)
Country | Link |
---|---|
US (2) | US20050154535A1 (en) |
CA (1) | CA2583879A1 (en) |
DE (1) | DE112005002331B4 (en) |
GB (2) | GB2456436B (en) |
WO (1) | WO2005106764A2 (en) |
Families Citing this family (41)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050197783A1 (en) * | 2004-03-04 | 2005-09-08 | Kuchinsky Allan J. | Methods and systems for extension, exploration, refinement, and analysis of biological networks |
JP2008518319A (en) * | 2004-10-29 | 2008-05-29 | 独立行政法人産業技術総合研究所 | Method and system for analyzing a network of biological functions |
US20060136188A1 (en) * | 2004-12-22 | 2006-06-22 | Lacey David J | Capturing curation data |
US20060281977A1 (en) * | 2005-06-09 | 2006-12-14 | Michael Soppet | Diagnostic and treatment planning calculator |
US20070162992A1 (en) * | 2006-01-09 | 2007-07-12 | Mcgill University | Metabolomic determination in assisted reproductive technology |
EP1984737A2 (en) * | 2006-01-17 | 2008-10-29 | Cellumen, Inc. | Method for predicting biological systems responses |
WO2007136724A2 (en) | 2006-05-17 | 2007-11-29 | Cellumen, Inc. | Method for automated tissue analysis |
WO2008060483A2 (en) * | 2006-11-10 | 2008-05-22 | Cellumen, Inc. | Protein-protein interaction biosensors and methods of use thereof |
US8068994B2 (en) * | 2007-07-27 | 2011-11-29 | Wayne State University | Method for analyzing biological networks |
CA2700558A1 (en) * | 2007-09-26 | 2009-04-02 | Genstruct, Inc. | Software assisted methods for probing the biochemical basis of biological states |
JP4829381B2 (en) * | 2009-05-18 | 2011-12-07 | 隆敏 柳瀬 | Knowledge base system, logical operation method, program, and recording medium |
US8756182B2 (en) | 2010-06-01 | 2014-06-17 | Selventa, Inc. | Method for quantifying amplitude of a response of a biological network |
JP5336453B2 (en) * | 2010-10-01 | 2013-11-06 | 学校法人沖縄科学技術大学院大学学園 | Network model integration apparatus, network model integration system, network model integration method, and program |
ES2739623T3 (en) | 2011-03-17 | 2020-02-03 | Cernostics Inc | Systems and compositions for diagnosing Barrett's esophagus and methods for using them |
US20130117075A1 (en) * | 2011-11-04 | 2013-05-09 | Richard Brown | Project compliance assessment |
CN105393253A (en) | 2012-12-28 | 2016-03-09 | 赛尔文塔公司 | Quantitative assessment of biological impact using mechanistic network models |
CN105940421B (en) * | 2013-08-12 | 2020-09-01 | 菲利普莫里斯生产公司 | System and method for crowd verification of biological networks |
US9866483B2 (en) | 2015-07-20 | 2018-01-09 | Schweitzer Engineering Laboratories, Inc. | Routing of traffic in network through automatically generated and physically distinct communication paths |
US9900206B2 (en) | 2015-07-20 | 2018-02-20 | Schweitzer Engineering Laboratories, Inc. | Communication device with persistent configuration and verification |
US10659314B2 (en) | 2015-07-20 | 2020-05-19 | Schweitzer Engineering Laboratories, Inc. | Communication host profiles |
US9769060B2 (en) * | 2015-07-20 | 2017-09-19 | Schweitzer Engineering Laboratories, Inc. | Simulating, visualizing, and searching traffic in a software defined network |
US10341311B2 (en) | 2015-07-20 | 2019-07-02 | Schweitzer Engineering Laboratories, Inc. | Communication device for implementing selective encryption in a software defined network |
US9923779B2 (en) | 2015-07-20 | 2018-03-20 | Schweitzer Engineering Laboratories, Inc. | Configuration of a software defined network |
US10863558B2 (en) | 2016-03-30 | 2020-12-08 | Schweitzer Engineering Laboratories, Inc. | Communication device for implementing trusted relationships in a software defined network |
WO2018020495A1 (en) * | 2016-07-27 | 2018-02-01 | Epistema Ltd. | Computerized environment for human expert analysts |
US10785189B2 (en) | 2018-03-01 | 2020-09-22 | Schweitzer Engineering Laboratories, Inc. | Selective port mirroring and in-band transport of network communications for inspection |
US11380420B1 (en) * | 2018-05-07 | 2022-07-05 | X Development Llc | Data structure, compilation service, and graphical user interface for rapid simulation generation |
US11075908B2 (en) | 2019-05-17 | 2021-07-27 | Schweitzer Engineering Laboratories, Inc. | Authentication in a software defined network |
US11562439B2 (en) * | 2019-07-24 | 2023-01-24 | International Business Machines Corporation | Multi-way optimal reconciliation and recommendation |
US10979309B2 (en) | 2019-08-07 | 2021-04-13 | Schweitzer Engineering Laboratories, Inc. | Automated convergence of physical design and configuration of software defined network |
US11228521B2 (en) | 2019-11-04 | 2022-01-18 | Schweitzer Engineering Laboratories, Inc. | Systems and method for detecting failover capability of a network device |
US11165685B2 (en) | 2019-12-20 | 2021-11-02 | Schweitzer Engineering Laboratories, Inc. | Multipoint redundant network device path planning for programmable networks |
US20210202029A1 (en) * | 2019-12-23 | 2021-07-01 | The Board Of Trustees Of The Leland Stanford Junior University | Examination of network effects of immune modulation |
US12131808B2 (en) * | 2020-12-10 | 2024-10-29 | Hewlett Packard Enterprise Development Lp | Massively parallel processing database for sequence and graph data structures applied to rapid-response drug repurposing |
US11481235B2 (en) | 2021-01-11 | 2022-10-25 | Evicore Healthcare MSI, LLC | Database framework model transformation for pathway identification |
US11699014B2 (en) * | 2021-01-29 | 2023-07-11 | Insight Direct Usa, Inc. | System and method for determining paths between locations in a physical system |
US11418432B1 (en) | 2021-04-22 | 2022-08-16 | Schweitzer Engineering Laboratories, Inc. | Automated communication flow discovery and configuration in a software defined network |
US11336564B1 (en) | 2021-09-01 | 2022-05-17 | Schweitzer Engineering Laboratories, Inc. | Detection of active hosts using parallel redundancy protocol in software defined networks |
US11750502B2 (en) | 2021-09-01 | 2023-09-05 | Schweitzer Engineering Laboratories, Inc. | Detection of in-band software defined network controllers using parallel redundancy protocol |
US11848860B2 (en) | 2022-02-24 | 2023-12-19 | Schweitzer Engineering Laboratories, Inc. | Multicast fast failover turnaround overlap handling |
US11838174B2 (en) | 2022-02-24 | 2023-12-05 | Schweitzer Engineering Laboratories, Inc. | Multicast fast failover handling |
Family Cites Families (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5343554A (en) * | 1988-05-20 | 1994-08-30 | John R. Koza | Non-linear genetic process for data encoding and for solving problems using automatically defined functions |
US5742738A (en) * | 1988-05-20 | 1998-04-21 | John R. Koza | Simultaneous evolution of the architecture of a multi-part program to solve a problem using architecture altering operations |
US4935877A (en) * | 1988-05-20 | 1990-06-19 | Koza John R | Non-linear genetic algorithms for solving problems |
US5148513A (en) * | 1988-05-20 | 1992-09-15 | John R. Koza | Non-linear genetic process for use with plural co-evolving populations |
AU7563191A (en) * | 1990-03-28 | 1991-10-21 | John R. Koza | Non-linear genetic algorithms for solving problems by finding a fit composition of functions |
US5390282A (en) * | 1992-06-16 | 1995-02-14 | John R. Koza | Process for problem solving using spontaneously emergent self-replicating and self-improving entities |
WO1996022574A1 (en) * | 1995-01-20 | 1996-07-25 | The Board Of Trustees Of The Leland Stanford Junior University | System and method for simulating operation of biochemical systems |
US5867397A (en) * | 1996-02-20 | 1999-02-02 | John R. Koza | Method and apparatus for automated design of complex structures using genetic programming |
US6775670B2 (en) * | 1998-05-29 | 2004-08-10 | Luc Bessette | Method and apparatus for the management of data files |
US6532453B1 (en) * | 1999-04-12 | 2003-03-11 | John R. Koza | Genetic programming problem solver with automatically defined stores loops and recursions |
US6424959B1 (en) * | 1999-06-17 | 2002-07-23 | John R. Koza | Method and apparatus for automatic synthesis, placement and routing of complex structures |
US6564194B1 (en) * | 1999-09-10 | 2003-05-13 | John R. Koza | Method and apparatus for automatic synthesis controllers |
US6947953B2 (en) * | 1999-11-05 | 2005-09-20 | The Board Of Trustees Of The Leland Stanford Junior University | Internet-linked system for directory protocol based data storage, retrieval and analysis |
JP2001188768A (en) * | 1999-12-28 | 2001-07-10 | Japan Science & Technology Corp | Method for estimating network |
US6665669B2 (en) * | 2000-01-03 | 2003-12-16 | Db Miner Technology Inc. | Methods and system for mining frequent patterns |
AU2001232928A1 (en) * | 2000-01-25 | 2001-08-07 | Cellomics, Inc. | Method and system for automated inference of physico-chemical interaction knowledge via co-occurrence analysis of indexed literature databases |
US20010049674A1 (en) * | 2000-03-30 | 2001-12-06 | Iqbal Talib | Methods and systems for enabling efficient employment recruiting |
US6772160B2 (en) * | 2000-06-08 | 2004-08-03 | Ingenuity Systems, Inc. | Techniques for facilitating information acquisition and storage |
US6741986B2 (en) * | 2000-12-08 | 2004-05-25 | Ingenuity Systems, Inc. | Method and system for performing information extraction and quality control for a knowledgebase |
AU2001278089A1 (en) * | 2000-07-31 | 2002-02-13 | Agilix Corporation | Visualization and manipulation of biomolecular relationships using graph operators |
US20020156756A1 (en) * | 2000-12-06 | 2002-10-24 | Biosentients, Inc. | Intelligent molecular object data structure and method for application in heterogeneous data environments with high data density and dynamic application needs |
US6594587B2 (en) * | 2000-12-20 | 2003-07-15 | Monsanto Technology Llc | Method for analyzing biological elements |
CA2437878A1 (en) * | 2001-02-09 | 2002-08-22 | The Trustees Of Columbia University In The City Of New York | A method for the prediction of molecular interaction networks |
WO2002067181A1 (en) * | 2001-02-20 | 2002-08-29 | Genmetrics, Inc. | Methods for establishing a pathways database and performing pathway searches |
US20020194187A1 (en) * | 2001-05-16 | 2002-12-19 | Mcneil John | Multi-paradigm knowledge-bases |
EP1436611A4 (en) * | 2001-09-26 | 2007-04-11 | Gni Kk | Biological discovery using gene regulatory networks generated from multiple-disruption expression libraries |
US7415359B2 (en) * | 2001-11-02 | 2008-08-19 | Gene Network Sciences, Inc. | Methods and systems for the identification of components of mammalian biochemical networks as targets for therapeutic agents |
WO2003046798A1 (en) * | 2001-11-21 | 2003-06-05 | Paradigm Genetics, Inc. | Methods and systems for analyzing complex biological systems |
US20040229231A1 (en) * | 2002-05-28 | 2004-11-18 | Frudakis Tony N. | Compositions and methods for inferring ancestry |
US20040249620A1 (en) * | 2002-11-20 | 2004-12-09 | Genstruct, Inc. | Epistemic engine |
GB2421732A (en) * | 2003-08-12 | 2006-07-05 | Cognia Corp | An advanced databasing system for chemical molecular and cellular biology |
US20050147947A1 (en) * | 2003-12-29 | 2005-07-07 | Myfamily.Com, Inc. | Genealogical investigation and documentation systems and methods |
-
2004
- 2004-03-05 US US10/794,407 patent/US20050154535A1/en not_active Abandoned
-
2005
- 2005-01-06 GB GB0906251A patent/GB2456436B/en not_active Expired - Fee Related
- 2005-01-06 GB GB0708601A patent/GB2434579B/en not_active Expired - Fee Related
- 2005-01-06 CA CA002583879A patent/CA2583879A1/en not_active Abandoned
- 2005-01-06 WO PCT/US2005/000202 patent/WO2005106764A2/en active Application Filing
- 2005-01-06 DE DE112005002331T patent/DE112005002331B4/en not_active Expired - Fee Related
-
2009
- 2009-03-17 US US12/405,763 patent/US20090313189A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
GB2456436A (en) | 2009-07-22 |
GB0708601D0 (en) | 2007-06-20 |
GB2456436B (en) | 2009-09-09 |
GB2434579B (en) | 2009-08-12 |
US20050154535A1 (en) | 2005-07-14 |
WO2005106764A2 (en) | 2005-11-10 |
WO2005106764A3 (en) | 2006-01-19 |
DE112005002331B4 (en) | 2011-07-28 |
GB0906251D0 (en) | 2009-05-20 |
US20090313189A1 (en) | 2009-12-17 |
GB2434579A (en) | 2007-08-01 |
CA2583879A1 (en) | 2005-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
DE112005002331B4 (en) | Method, system and apparatus for compiling and using biological knowledge | |
Ovaskainen et al. | How to make more out of community data? A conceptual framework and its implementation as models and software | |
US8594941B2 (en) | System, method and apparatus for causal implication analysis in biological networks | |
CN105096225B (en) | The analysis system of aided disease diagnosis and treatment, device and method | |
DE69603020T2 (en) | CONTROL SYSTEM BASED ON SIMULATED VIRTUAL MODELS | |
DE69704438T2 (en) | METHOD, DEVICE AND PROGRAM FOR SYNTHESIS-BASED SIMULATION OF CHEMICALS WITH BIOLOGICAL FUNCTIONS | |
US20070225956A1 (en) | Causal analysis in complex biological systems | |
DE60015074T2 (en) | METHOD AND DEVICE FOR MONITORING THE THERAPY EFFECTIVENESS | |
DE102005020618A1 (en) | Methods and systems for extension, investigation, refinement and analysis of biological networks | |
WO2003021478A2 (en) | Method and system for data evaluation, corresponding computer program product, and corresponding computer-readable storage medium | |
Willemet | Understanding the evolution of mammalian brain structures; the need for a (new) cerebrotype approach | |
US8082109B2 (en) | Computer-aided discovery of biomarker profiles in complex biological systems | |
US20090099784A1 (en) | Software assisted methods for probing the biochemical basis of biological states | |
WO2003012135A2 (en) | Method for the configuration of parallel nucleic acid analysis methods for sequence quantity classification | |
Dan et al. | Non-uniform weighting of local motion inputs underlies dendritic computation in the fly visual system | |
Polavaram et al. | Neuroinformatics | |
Meyer et al. | Predicting population and community dynamics: The type of aggregation matters | |
DE102005028975B4 (en) | A method of determining a biomarker for identifying a specific biological condition of an organism from at least one dataset | |
Xie et al. | DeerKBS: a knowledge-based system for white-tailed deer management | |
DE112006003614T5 (en) | Device and method for evaluating a network-related relevance of a network element, program element and machine-readable data carrier connected to one or more further network elements in a network | |
DE102005030136B4 (en) | Method for the computer-aided simulation of biological RNA interference experiments | |
DE102020212379A1 (en) | Determining comparative patients based on ontologies | |
WO2010060746A2 (en) | Method and device for the automatic analysis of models | |
Doelken et al. | Computational methods for the study of human disease manifestations: the Human Phenotype Ontology | |
Dyhrfjeld-Johnsen et al. | The Cocodat Database: Systematically Organizing and Selecting Quantitative Data on Single Neurons and Microcircuitry |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
OP8 | Request for examination as to paragraph 44 patent law | ||
8125 | Change of the main classification |
Ipc: C12Q 1/00 AFI20070809BHDE |
|
R119 | Application deemed withdrawn, or ip right lapsed, due to non-payment of renewal fee |
Effective date: 20110802 |